End of training

Files changed (5) hide show

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
-    "epoch": 9.96,
-    "eval_accuracy": 0.8342792281498297,
-    "eval_loss": 0.48094892501831055,
-    "eval_runtime": 7.0271,
-    "eval_samples_per_second": 125.371,
-    "eval_steps_per_second": 15.796,
-    "total_flos": 1.6760839403221402e+18,
-    "train_loss": 0.9043752511342367,
-    "train_runtime": 8036.8099,
-    "train_samples_per_second": 9.858,
-    "train_steps_per_second": 0.175
 }

 {
+    "epoch": 49.8,
+    "eval_accuracy": 0.9761634506242906,
+    "eval_loss": 0.08218241482973099,
+    "eval_runtime": 7.5653,
+    "eval_samples_per_second": 116.453,
+    "eval_steps_per_second": 14.672,
+    "total_flos": 8.379994919518495e+18,
+    "train_loss": 0.43237863398612814,
+    "train_runtime": 6732.481,
+    "train_samples_per_second": 58.842,
+    "train_steps_per_second": 1.047
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 9.96,
-    "eval_accuracy": 0.8342792281498297,
-    "eval_loss": 0.48094892501831055,
-    "eval_runtime": 7.0271,
-    "eval_samples_per_second": 125.371,
-    "eval_steps_per_second": 15.796
 }

 {
+    "epoch": 49.8,
+    "eval_accuracy": 0.9761634506242906,
+    "eval_loss": 0.08218241482973099,
+    "eval_runtime": 7.5653,
+    "eval_samples_per_second": 116.453,
+    "eval_steps_per_second": 14.672
 }

runs/May06_20-15-33_cfa7f4cd76a3/events.out.tfevents.1683410906.cfa7f4cd76a3.950.5 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:e07a49f176ebdfec8639aaa93f6d69adde73e24eeaee73887000b1ee611fd225
+size 411

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 9.96,
-    "total_flos": 1.6760839403221402e+18,
-    "train_loss": 0.9043752511342367,
-    "train_runtime": 8036.8099,
-    "train_samples_per_second": 9.858,
-    "train_steps_per_second": 0.175
 }

 {
+    "epoch": 49.8,
+    "total_flos": 8.379994919518495e+18,
+    "train_loss": 0.43237863398612814,
+    "train_runtime": 6732.481,
+    "train_samples_per_second": 58.842,
+    "train_steps_per_second": 1.047
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff