Training in progress, step 10000

Files changed (6) hide show

all_results.json CHANGED Viewed

@@ -1,16 +1,16 @@
 {
     "epoch": 10.0,
-    "eval_accuracy": 0.3932824917497146,
-    "eval_loss": 3.3091650009155273,
-    "eval_runtime": 184.8493,
     "eval_samples": 18011,
-    "eval_samples_per_second": 97.436,
-    "eval_steps_per_second": 6.091,
-    "perplexity": 27.3622684613255,
-    "total_flos": 7.7681859821568e+17,
-    "train_loss": 3.468291573590681,
-    "train_runtime": 80362.6457,
-    "train_samples": 297299,
-    "train_samples_per_second": 36.995,
-    "train_steps_per_second": 1.156
 }

 {
     "epoch": 10.0,
+    "eval_accuracy": 0.3945585112642079,
+    "eval_loss": 3.3003323078155518,
+    "eval_runtime": 183.9415,
     "eval_samples": 18011,
+    "eval_samples_per_second": 97.917,
+    "eval_steps_per_second": 6.122,
+    "perplexity": 27.1216501596411,
+    "total_flos": 7.75449427968e+17,
+    "train_loss": 3.4540262829556942,
+    "train_runtime": 79697.0382,
+    "train_samples": 296775,
+    "train_samples_per_second": 37.238,
+    "train_steps_per_second": 1.164
 }

eval_results.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
     "epoch": 10.0,
-    "eval_accuracy": 0.3932824917497146,
-    "eval_loss": 3.3091650009155273,
-    "eval_runtime": 184.8493,
     "eval_samples": 18011,
-    "eval_samples_per_second": 97.436,
-    "eval_steps_per_second": 6.091,
-    "perplexity": 27.3622684613255
 }

 {
     "epoch": 10.0,
+    "eval_accuracy": 0.3945585112642079,
+    "eval_loss": 3.3003323078155518,
+    "eval_runtime": 183.9415,
     "eval_samples": 18011,
+    "eval_samples_per_second": 97.917,
+    "eval_steps_per_second": 6.122,
+    "perplexity": 27.1216501596411
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5ba445d5f7bde0bdc1450a61d9dc6d9911dd68570309d06b0e848348c074bba5
 size 503128704

 version https://git-lfs.github.com/spec/v1
+oid sha256:a8cbe6c7ebe3b4d9f3b05c1cba622f285527d797b137af3778eeece3685aee08
 size 503128704

train_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 10.0,
-    "total_flos": 7.7681859821568e+17,
-    "train_loss": 3.468291573590681,
-    "train_runtime": 80362.6457,
-    "train_samples": 297299,
-    "train_samples_per_second": 36.995,
-    "train_steps_per_second": 1.156
 }

 {
     "epoch": 10.0,
+    "total_flos": 7.75449427968e+17,
+    "train_loss": 3.4540262829556942,
+    "train_runtime": 79697.0382,
+    "train_samples": 296775,
+    "train_samples_per_second": 37.238,
+    "train_steps_per_second": 1.164
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8f812bd3f0270a8ded86620a14962545283d1ba25bb404bbc09c145e1c4b17dc
 size 5304

 version https://git-lfs.github.com/spec/v1
+oid sha256:fe4bc3f5331aa4ca13eac4e833f0046ac51a91820c81b312cbdeb531b06a5b1f
 size 5304