Training in progress, epoch 10, checkpoint

Files changed (5) hide show

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b71be19ad19a3a3e31959473f5c1a45cf3a994d2ac577b67dac440f4b30ca8e0
 size 2371770

 version https://git-lfs.github.com/spec/v1
+oid sha256:095b3a1f6740c3523f4d618eb6e304dac8fadfe4f53deea6f89e7adff3341492
 size 2371770

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6223ce7959af515e2e82943538f39dc15a5eb2a27a686c90c211b2a33f14c087
 size 990409330

 version https://git-lfs.github.com/spec/v1
+oid sha256:e1a76fa844f3a3191566c354079a7f4bc5694f5240c5233e76e250c0f6fce96d
 size 990409330

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a2f7b436e9bacdce8321c129258891cfe5297c358dd018f4af22a5983cb5b0d7
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:443ad106e89f5c225106f610ada6104a4bdb83f20e5790a9a64bb3871f9500ee
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:11944376c27fbea6ee7fff9906b50d8eeade72e136e82c5eaff059c29ff514f8
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:6ff0f9f47b6a148ea17a10b4a36afba9e6cfc279b51fe048a45e8fbccd92f97e
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": 2.0042803287506104,
-  "best_model_checkpoint": "dq158/coqui/checkpoint-8312",
-  "epoch": 9.999398496240602,
   "eval_steps": 500,
-  "global_step": 8312,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -293,13 +293,44 @@
       "eval_steps_per_second": 0.605,
       "eval_translation_length": 55997,
       "step": 8312
     }
   ],
   "logging_steps": 500,
   "max_steps": 16620,
   "num_train_epochs": 20,
   "save_steps": 500,
-  "total_flos": 1.8213176060411904e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 2.0005455017089844,
+  "best_model_checkpoint": "dq158/coqui/checkpoint-9143",
+  "epoch": 10.999097744360903,
   "eval_steps": 500,
+  "global_step": 9143,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.605,
       "eval_translation_length": 55997,
       "step": 8312
+    },
+    {
+      "epoch": 10.23,
+      "learning_rate": 4.552618528938031e-05,
+      "loss": 1.9494,
+      "step": 8500
+    },
+    {
+      "epoch": 10.83,
+      "learning_rate": 4.114594725207993e-05,
+      "loss": 1.9375,
+      "step": 9000
+    },
+    {
+      "epoch": 11.0,
+      "eval_bleu": 1.0,
+      "eval_brevity_penalty": 1.0,
+      "eval_length_ratio": 1.0,
+      "eval_loss": 2.0005455017089844,
+      "eval_precisions": [
+        1.0,
+        1.0,
+        1.0,
+        1.0
+      ],
+      "eval_reference_length": 56078,
+      "eval_runtime": 610.5262,
+      "eval_samples_per_second": 4.842,
+      "eval_steps_per_second": 0.606,
+      "eval_translation_length": 56078,
+      "step": 9143
     }
   ],
   "logging_steps": 500,
   "max_steps": 16620,
   "num_train_epochs": 20,
   "save_steps": 500,
+  "total_flos": 2.0034493666453094e+17,
   "trial_name": null,
   "trial_params": null
 }