Commit from model create scripts

Files changed (6) hide show

config.gin CHANGED Viewed

@@ -31,7 +31,7 @@ MODEL_DIR = 'gs://nb-t5x-us-central2/finetuned/scandi3_3stammer_v2_large'
 OPTIMIZER = @adafactor.Adafactor()
 RANDOM_SEED = 0
 TASK_FEATURE_LENGTHS = {'inputs': 512, 'targets': 512}
-TRAIN_STEPS = 3100000
 USE_CACHED_TASKS = False
 USE_HARDWARE_RNG = False
 VOCABULARY = @seqio.SentencePieceVocabulary()

 OPTIMIZER = @adafactor.Adafactor()
 RANDOM_SEED = 0
 TASK_FEATURE_LENGTHS = {'inputs': 512, 'targets': 512}
+TRAIN_STEPS = 3300000
 USE_CACHED_TASKS = False
 USE_HARDWARE_RNG = False
 VOCABULARY = @seqio.SentencePieceVocabulary()

config.json CHANGED Viewed

@@ -13,6 +13,7 @@
   "initializer_factor": 1.0,
   "is_encoder_decoder": true,
   "layer_norm_epsilon": 1e-06,
   "model_type": "t5",
   "num_decoder_layers": 24,
   "num_heads": 16,
@@ -21,12 +22,6 @@
   "pad_token_id": 0,
   "relative_attention_max_distance": 128,
   "relative_attention_num_buckets": 32,
-  "tie_word_embeddings": false,
-  "tokenizer_class": "T5Tokenizer",
-  "torch_dtype": "float32",
-  "transformers_version": "4.19.2",
-  "use_cache": true,
-  "max_length": 512,
   "task_specific_params": {
     "text-generation": {
       "max_length": 512
@@ -34,6 +29,11 @@
     "translation": {
       "max_length": 512
     }
-   },
   "vocab_size": 250112
 }

   "initializer_factor": 1.0,
   "is_encoder_decoder": true,
   "layer_norm_epsilon": 1e-06,
+  "max_length": 512,
   "model_type": "t5",
   "num_decoder_layers": 24,
   "num_heads": 16,
   "pad_token_id": 0,
   "relative_attention_max_distance": 128,
   "relative_attention_num_buckets": 32,
   "task_specific_params": {
     "text-generation": {
       "max_length": 512
     "translation": {
       "max_length": 512
     }
+  },
+  "tie_word_embeddings": false,
+  "tokenizer_class": "T5Tokenizer",
+  "torch_dtype": "float32",
+  "transformers_version": "4.19.2",
+  "use_cache": true,
   "vocab_size": 250112
 }

flax_model.msgpack CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b129583284511c0fc5cb80f0f3da33a5559625ff1a16ad5734d188906e4c6e58
 size 4918349339

 version https://git-lfs.github.com/spec/v1
+oid sha256:952384b0efdcd4b18b6882eaf7c4b15be2e902d3421059b6bec0f143751837c1
 size 4918349339

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3c0aaa35ba972fbbad7b53de5b5af8ecd8c040f99cd132a49a99cee3c59c4b9
 size 4918507641

 version https://git-lfs.github.com/spec/v1
+oid sha256:f42c4d1b64ee95336f0dc5fb01f822e65666c394ab291c24a7e8c497f47234f2
 size 4918507641

train/events.out.tfevents.1667421611.t1v-n-b052f6bf-w-1.820156.0.v2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:544b309881a8f653e93657c4eb6aa41d856f748d95c8460793389d7b17ed731e
+size 171445

training_eval/translate/events.out.tfevents.1667421612.t1v-n-b052f6bf-w-1.820156.1.v2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:dccf5d96f93ab56d85473d58a9f8e29c8e1f82f7f1a04ad3263aa61ae4c4ee02
+size 138967