Saving weights and logs of step 5000

Files changed (4) hide show

config.json CHANGED Viewed

@@ -21,7 +21,7 @@
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
-  "transformers_version": "4.13.0.dev0",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 50265

   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
+  "transformers_version": "4.14.0.dev0",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 50265

events.out.tfevents.1639565282.t1v-n-4e27a527-w-0.1048792.0.v2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:bc85c616480f85dfbb4573c7f5e287a0efacd1b36a9c381e854194bf17041f2b
+size 227952

flax_model.msgpack CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e02d522d7ecb7b42196b90da857e13a255d9e302e29aced79963d8bb217627b1
 size 498796983

 version https://git-lfs.github.com/spec/v1
+oid sha256:25132b2566e378641f523dbb48814ea6ad648023271faa8dafd35147c247a880
 size 498796983

run_test.sh ADDED Viewed

+./run_mlm_flax.py \
+    --output_dir="./" \
+    --model_type="roberta" \
+    --config_name="./" \
+    --tokenizer_name="./" \
+    --max_seq_length="128" \
+    --weight_decay="0.01" \
+    --train_file="/mnt/disks/flaxdisk/divided_corpus/train-shard-0001-of-0001.json" \
+    --validation_file="/mnt/disks/flaxdisk/divided_corpus/validation-shard-0001-of-0001.json" \
+    --per_device_train_batch_size="128" \
+    --per_device_eval_batch_size="128" \
+    --learning_rate="3e-4" \
+    --warmup_steps="5000" \
+    --overwrite_output_dir \
+    --num_train_epochs="29" \
+    --adam_beta1="0.9" \
+    --adam_beta2="0.98" \
+    --logging_steps="5000" \
+    --save_steps="5000" \
+    --eval_steps="5000" \
+    --push_to_hub