Training in progress, epoch 4, checkpoint

Files changed (5) hide show

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6b14ca092add6f83afa8592d7cc107f9a67c8e22970174dcecb8c088b5de4169
 size 615849402

 version https://git-lfs.github.com/spec/v1
+oid sha256:61252a82dcc7cc460a7ca8e49e81f8a6269636bd56c3c3d0d458eebf8b37ff44
 size 615849402

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:53b82483abfbf4ffd8c243b766dabbb4812428d1894516eada10c5a9bfc6fd48
 size 307910594

 version https://git-lfs.github.com/spec/v1
+oid sha256:abe65158947a614ad80011b29d3a4888efbbc0963b7a74c0d1f8afaa60390425
 size 307910594

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8ede5b6194a7298561178c49b95e0507051d3deed7c4f79c181647c4a85f692c
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:d1e65b606b54db60587912fdc573f5f38a59d25ab0eb278c25736d481395cdf2
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f47fdf6b0fbbab3a9ea4d27bd0147fa6ed4e838983e0cf3922c7879c115ad6f0
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:d3bb0b6e8dad866c1a4d1aed7e44eadc70d3ea1328d713add8793b99298fb68f
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": 0.7071468234062195,
-  "best_model_checkpoint": "flanT5-description-generation/checkpoint-297",
-  "epoch": 3.0,
   "eval_steps": 500,
-  "global_step": 297,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -46,13 +46,26 @@
       "eval_samples_per_second": 16.011,
       "eval_steps_per_second": 2.032,
       "step": 297
     }
   ],
   "logging_steps": 500,
   "max_steps": 495,
   "num_train_epochs": 5,
   "save_steps": 500,
-  "total_flos": 438887481606144.0,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.42786499857902527,
+  "best_model_checkpoint": "flanT5-description-generation/checkpoint-396",
+  "epoch": 4.0,
   "eval_steps": 500,
+  "global_step": 396,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 16.011,
       "eval_steps_per_second": 2.032,
       "step": 297
+    },
+    {
+      "epoch": 4.0,
+      "eval_gen_len": 5.5786802030456855,
+      "eval_loss": 0.42786499857902527,
+      "eval_rouge1": 6.0645,
+      "eval_rouge2": 5.1995,
+      "eval_rougeL": 5.6723,
+      "eval_rougeLsum": 5.6926,
+      "eval_runtime": 16.8779,
+      "eval_samples_per_second": 11.672,
+      "eval_steps_per_second": 1.481,
+      "step": 396
     }
   ],
   "logging_steps": 500,
   "max_steps": 495,
   "num_train_epochs": 5,
   "save_steps": 500,
+  "total_flos": 585183308808192.0,
   "trial_name": null,
   "trial_params": null
 }