Training in progress, step 11000

Files changed (6) hide show

all_results.json CHANGED Viewed

@@ -4,14 +4,14 @@
     "eval_bleu": 0.1323262570770995,
     "eval_loss": 3.1777124404907227,
     "eval_perplexity": 23.991808041831927,
-    "eval_runtime": 12.2078,
     "eval_samples": 1141,
-    "eval_samples_per_second": 93.465,
-    "eval_steps_per_second": 1.474,
     "perplexity": 23.991808041831927,
     "total_flos": 1.270447321217237e+18,
-    "train_loss": 0.5092627385828409,
-    "train_runtime": 3159.8581,
-    "train_samples_per_second": 216.454,
-    "train_steps_per_second": 3.384
 }

     "eval_bleu": 0.1323262570770995,
     "eval_loss": 3.1777124404907227,
     "eval_perplexity": 23.991808041831927,
+    "eval_runtime": 25.5919,
     "eval_samples": 1141,
+    "eval_samples_per_second": 44.584,
+    "eval_steps_per_second": 0.703,
     "perplexity": 23.991808041831927,
     "total_flos": 1.270447321217237e+18,
+    "train_loss": 0.0,
+    "train_runtime": 0.7883,
+    "train_samples_per_second": 867659.215,
+    "train_steps_per_second": 13563.597
 }

eval_results.json CHANGED Viewed

@@ -4,9 +4,9 @@
     "eval_bleu": 0.1323262570770995,
     "eval_loss": 3.1777124404907227,
     "eval_perplexity": 23.991808041831927,
-    "eval_runtime": 12.2078,
     "eval_samples": 1141,
-    "eval_samples_per_second": 93.465,
-    "eval_steps_per_second": 1.474,
     "perplexity": 23.991808041831927
 }

     "eval_bleu": 0.1323262570770995,
     "eval_loss": 3.1777124404907227,
     "eval_perplexity": 23.991808041831927,
+    "eval_runtime": 25.5919,
     "eval_samples": 1141,
+    "eval_samples_per_second": 44.584,
+    "eval_steps_per_second": 0.703,
     "perplexity": 23.991808041831927
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9fc50c439ac6b8bc0c1889959ba5ba8a050fe349df08ee581e7eeef2e7f7a658
 size 1419374664

 version https://git-lfs.github.com/spec/v1
+oid sha256:abe0da93dcf1f16f7de28297ffc4fac8d2e9d36a24b101c6e274cbc013c58b0f
 size 1419374664

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 6.0,
     "total_flos": 1.270447321217237e+18,
-    "train_loss": 0.5092627385828409,
-    "train_runtime": 3159.8581,
-    "train_samples_per_second": 216.454,
-    "train_steps_per_second": 3.384
 }

 {
     "epoch": 6.0,
     "total_flos": 1.270447321217237e+18,
+    "train_loss": 0.0,
+    "train_runtime": 0.7883,
+    "train_samples_per_second": 867659.215,
+    "train_steps_per_second": 13563.597
 }

trainer_state.json CHANGED Viewed

@@ -985,10 +985,10 @@
       "epoch": 6.0,
       "step": 10692,
       "total_flos": 1.270447321217237e+18,
-      "train_loss": 0.5092627385828409,
-      "train_runtime": 3159.8581,
-      "train_samples_per_second": 216.454,
-      "train_steps_per_second": 3.384
     }
   ],
   "logging_steps": 100,

       "epoch": 6.0,
       "step": 10692,
       "total_flos": 1.270447321217237e+18,
+      "train_loss": 0.0,
+      "train_runtime": 0.7883,
+      "train_samples_per_second": 867659.215,
+      "train_steps_per_second": 13563.597
     }
   ],
   "logging_steps": 100,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:59200eb8b86a27533dadf7d6faf0a6fa80382d582aa8060a5ac3329ab756818f
 size 5560

 version https://git-lfs.github.com/spec/v1
+oid sha256:0500a851b586cedd6386f69aa10824a1977591d4bbb5310598cc90b74b59acfc
 size 5560