🍻 cheers

Files changed (4) hide show

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 2.0,
-    "eval_accuracy": 0.995640736565201,
-    "eval_loss": 0.01245423499494791,
-    "eval_runtime": 226.1285,
-    "eval_samples_per_second": 58.838,
-    "eval_steps_per_second": 7.359,
-    "total_flos": 8.247627438660256e+18,
-    "train_loss": 0.07274016925322493,
-    "train_runtime": 6476.0215,
-    "train_samples_per_second": 16.435,
-    "train_steps_per_second": 1.027
 }

 {
     "epoch": 2.0,
+    "eval_accuracy": 0.991131153701616,
+    "eval_loss": 0.021174494177103043,
+    "eval_runtime": 243.8019,
+    "eval_samples_per_second": 54.573,
+    "eval_steps_per_second": 6.825,
+    "total_flos": 7.422802701202538e+18,
+    "train_loss": 0.06747758854398318,
+    "train_runtime": 4227.9196,
+    "train_samples_per_second": 22.656,
+    "train_steps_per_second": 1.416
 }

test_results.json ADDED Viewed

+{
+    "epoch": 2.0,
+    "eval_accuracy": 0.991131153701616,
+    "eval_loss": 0.021174494177103043,
+    "eval_runtime": 243.8019,
+    "eval_samples_per_second": 54.573,
+    "eval_steps_per_second": 6.825
+}

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 2.0,
-    "total_flos": 8.247627438660256e+18,
-    "train_loss": 0.07274016925322493,
-    "train_runtime": 6476.0215,
-    "train_samples_per_second": 16.435,
-    "train_steps_per_second": 1.027
 }

 {
     "epoch": 2.0,
+    "total_flos": 7.422802701202538e+18,
+    "train_loss": 0.06747758854398318,
+    "train_runtime": 4227.9196,
+    "train_samples_per_second": 22.656,
+    "train_steps_per_second": 1.416
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff