End of training

Files changed (5) hide show

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
-    "epoch": 10.0,
-    "eval_accuracy": 0.9847,
-    "eval_loss": 0.04658365622162819,
-    "eval_runtime": 55.4878,
-    "eval_samples_per_second": 180.22,
-    "eval_steps_per_second": 11.264,
-    "total_flos": 2.2610854171949138e+19,
-    "train_loss": 0.13948478633021222,
-    "train_runtime": 14334.765,
-    "train_samples_per_second": 62.784,
-    "train_steps_per_second": 0.981
 }

 {
+    "epoch": 9.99,
+    "eval_accuracy": 0.9825666666666667,
+    "eval_loss": 0.05175173282623291,
+    "eval_runtime": 100.7502,
+    "eval_samples_per_second": 297.766,
+    "eval_steps_per_second": 18.61,
+    "total_flos": 1.7577285640071414e+19,
+    "train_loss": 0.14659581507222977,
+    "train_runtime": 6024.3375,
+    "train_samples_per_second": 116.195,
+    "train_steps_per_second": 1.814
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 10.0,
-    "eval_accuracy": 0.9847,
-    "eval_loss": 0.04658365622162819,
-    "eval_runtime": 55.4878,
-    "eval_samples_per_second": 180.22,
-    "eval_steps_per_second": 11.264
 }

 {
+    "epoch": 9.99,
+    "eval_accuracy": 0.9825666666666667,
+    "eval_loss": 0.05175173282623291,
+    "eval_runtime": 100.7502,
+    "eval_samples_per_second": 297.766,
+    "eval_steps_per_second": 18.61
 }

runs/Apr20_15-57-25_e71627e8a680/events.out.tfevents.1713635355.e71627e8a680.217.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:aacdb6a96a83d9b7c5227b220485a7d89c512324cc2f99faa52723174bc6c43d
+size 411

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 10.0,
-    "total_flos": 2.2610854171949138e+19,
-    "train_loss": 0.13948478633021222,
-    "train_runtime": 14334.765,
-    "train_samples_per_second": 62.784,
-    "train_steps_per_second": 0.981
 }

 {
+    "epoch": 9.99,
+    "total_flos": 1.7577285640071414e+19,
+    "train_loss": 0.14659581507222977,
+    "train_runtime": 6024.3375,
+    "train_samples_per_second": 116.195,
+    "train_steps_per_second": 1.814
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff