Training in progress, epoch 1, checkpoint

Browse files

Files changed (6) hide show

checkpoint-3743/generation_config.json +2 -1
checkpoint-3743/model.safetensors +1 -1
checkpoint-3743/optimizer.pt +1 -1
checkpoint-3743/rng_state.pth +1 -1
checkpoint-3743/trainer_state.json +23 -23
checkpoint-3743/training_args.bin +2 -2

checkpoint-3743/generation_config.json CHANGED Viewed

@@ -4,8 +4,9 @@
   "early_stopping": true,
   "eos_token_id": 2,
   "forced_eos_token_id": 2,
   "no_repeat_ngram_size": 3,
-  "num_beams": 4,
   "pad_token_id": 1,
   "transformers_version": "4.42.3"
 }

   "early_stopping": true,
   "eos_token_id": 2,
   "forced_eos_token_id": 2,
+  "max_new_tokens": 100,
   "no_repeat_ngram_size": 3,
+  "num_beams": 3,
   "pad_token_id": 1,
   "transformers_version": "4.42.3"
 }

checkpoint-3743/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f6877647d1611e046cb97a30299cc174e9b30d63fc904d7e3d1e5e4796dc11ec
 size 557116312

 version https://git-lfs.github.com/spec/v1
+oid sha256:9b824504b5a81b36d7b259896b5d6b8d4887d1d40457a03a884e8fa64abb7e6d
 size 557116312

checkpoint-3743/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c8863d7844e1277e7d61726c6fa0ba7b4c5a42c1ab7eba2510ae499770b0a3ac
 size 1113991930

 version https://git-lfs.github.com/spec/v1
+oid sha256:71578d1e9ef3bd5cce555d097c5822f4c19c6fb19489369d66e541fac12361a1
 size 1113991930

checkpoint-3743/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a0c827970d78569f0c6b1a29d66fd24126b5102897fcebdd744d42d74e03658e
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:ff10cc3496c08e1106e5e897405ff4505ff584fdbc5ddf9c1ac1e5aa55049cd1
 size 14244

checkpoint-3743/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 23.5,
   "best_model_checkpoint": "/content/drive/MyDrive/Arabart/checkpoint-3743",
   "epoch": 1.0,
   "eval_steps": 500,
@@ -10,62 +10,62 @@
   "log_history": [
     {
       "epoch": 0.1335826876836762,
-      "grad_norm": 5.552127361297607,
       "learning_rate": 3.7102997922232118e-06,
-      "loss": 4.4642,
       "step": 500
     },
     {
       "epoch": 0.2671653753673524,
-      "grad_norm": 4.821825981140137,
       "learning_rate": 7.4205995844464235e-06,
-      "loss": 3.3961,
       "step": 1000
     },
     {
       "epoch": 0.4007480630510286,
-      "grad_norm": 3.9271204471588135,
       "learning_rate": 1.1130899376669635e-05,
-      "loss": 3.1677,
       "step": 1500
     },
     {
       "epoch": 0.5343307507347048,
-      "grad_norm": 4.127840042114258,
       "learning_rate": 1.4841199168892847e-05,
-      "loss": 3.0419,
       "step": 2000
     },
     {
       "epoch": 0.667913438418381,
-      "grad_norm": 4.483984470367432,
       "learning_rate": 1.855149896111606e-05,
-      "loss": 2.9393,
       "step": 2500
     },
     {
       "epoch": 0.8014961261020572,
-      "grad_norm": 3.6583993434906006,
       "learning_rate": 2.226179875333927e-05,
-      "loss": 2.8751,
       "step": 3000
     },
     {
       "epoch": 0.9350788137857333,
-      "grad_norm": 3.321438789367676,
       "learning_rate": 2.5972098545562486e-05,
-      "loss": 2.8393,
       "step": 3500
     },
     {
       "epoch": 1.0,
-      "eval_loss": 2.278761386871338,
-      "eval_rouge1": 23.5,
-      "eval_rouge2": 9.6516,
-      "eval_rougeL": 21.1314,
-      "eval_runtime": 679.7516,
-      "eval_samples_per_second": 6.898,
-      "eval_steps_per_second": 0.69,
       "step": 3743
     }
   ],
@@ -86,7 +86,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 2.146056520753152e+16,
   "train_batch_size": 10,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 25.9968,
   "best_model_checkpoint": "/content/drive/MyDrive/Arabart/checkpoint-3743",
   "epoch": 1.0,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.1335826876836762,
+      "grad_norm": 5.345764636993408,
       "learning_rate": 3.7102997922232118e-06,
+      "loss": 3.9988,
       "step": 500
     },
     {
       "epoch": 0.2671653753673524,
+      "grad_norm": 5.3753743171691895,
       "learning_rate": 7.4205995844464235e-06,
+      "loss": 3.2671,
       "step": 1000
     },
     {
       "epoch": 0.4007480630510286,
+      "grad_norm": 3.7295212745666504,
       "learning_rate": 1.1130899376669635e-05,
+      "loss": 3.1006,
       "step": 1500
     },
     {
       "epoch": 0.5343307507347048,
+      "grad_norm": 4.027897834777832,
       "learning_rate": 1.4841199168892847e-05,
+      "loss": 2.9767,
       "step": 2000
     },
     {
       "epoch": 0.667913438418381,
+      "grad_norm": 3.9697580337524414,
       "learning_rate": 1.855149896111606e-05,
+      "loss": 2.8914,
       "step": 2500
     },
     {
       "epoch": 0.8014961261020572,
+      "grad_norm": 3.5195724964141846,
       "learning_rate": 2.226179875333927e-05,
+      "loss": 2.8273,
       "step": 3000
     },
     {
       "epoch": 0.9350788137857333,
+      "grad_norm": 3.447735071182251,
       "learning_rate": 2.5972098545562486e-05,
+      "loss": 2.7964,
       "step": 3500
     },
     {
       "epoch": 1.0,
+      "eval_loss": 2.2515146732330322,
+      "eval_rouge1": 25.9968,
+      "eval_rouge2": 10.7383,
+      "eval_rougeL": 22.8305,
+      "eval_runtime": 801.3334,
+      "eval_samples_per_second": 5.851,
+      "eval_steps_per_second": 0.585,
       "step": 3743
     }
   ],
       "attributes": {}
     }
   },
+  "total_flos": 2.191707783032832e+16,
   "train_batch_size": 10,
   "trial_name": null,
   "trial_params": null

checkpoint-3743/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b4efc0eb6f570215861f2c4ecdd77e9741b67f1853e2862b338f0bb74126a627
-size 5304

 version https://git-lfs.github.com/spec/v1
+oid sha256:0af844ab23c78977e15af3b0c2d9e2fc6623c1ae2c85b79f47e563f42dc7371b
+size 7032