End of training

Browse files

Files changed (6) hide show

README.md +1 -1
all_results.json +9 -9
eval_results.json +5 -5
runs/Dec03_15-40-48_DESKTOP-SKBE9FB/events.out.tfevents.1733262336.DESKTOP-SKBE9FB.16888.1 +3 -0
train_results.json +4 -4
trainer_state.json +204 -204

README.md CHANGED Viewed

@@ -32,7 +32,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/swinv2-tiny-patch4-window8-256](https://huggingface.co/microsoft/swinv2-tiny-patch4-window8-256) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.8720
 - Accuracy: 0.6522
 ## Model description

 This model is a fine-tuned version of [microsoft/swinv2-tiny-patch4-window8-256](https://huggingface.co/microsoft/swinv2-tiny-patch4-window8-256) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.0453
 - Accuracy: 0.6522
 ## Model description

all_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
     "epoch": 34.29,
-    "eval_accuracy": 0.10869565217391304,
-    "eval_loss": 7.920971870422363,
-    "eval_runtime": 0.9437,
-    "eval_samples_per_second": 48.746,
-    "eval_steps_per_second": 3.179,
-    "train_loss": 5.6989216804504395,
-    "train_runtime": 204.9044,
-    "train_samples_per_second": 41.58,
-    "train_steps_per_second": 0.586
 }

 {
     "epoch": 34.29,
+    "eval_accuracy": 0.6521739130434783,
+    "eval_loss": 1.0453197956085205,
+    "eval_runtime": 1.0171,
+    "eval_samples_per_second": 45.224,
+    "eval_steps_per_second": 2.949,
+    "train_loss": 1.0817648808161417,
+    "train_runtime": 199.6882,
+    "train_samples_per_second": 42.667,
+    "train_steps_per_second": 0.601
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 34.29,
-    "eval_accuracy": 0.10869565217391304,
-    "eval_loss": 7.920971870422363,
-    "eval_runtime": 0.9437,
-    "eval_samples_per_second": 48.746,
-    "eval_steps_per_second": 3.179
 }

 {
     "epoch": 34.29,
+    "eval_accuracy": 0.6521739130434783,
+    "eval_loss": 1.0453197956085205,
+    "eval_runtime": 1.0171,
+    "eval_samples_per_second": 45.224,
+    "eval_steps_per_second": 2.949
 }

runs/Dec03_15-40-48_DESKTOP-SKBE9FB/events.out.tfevents.1733262336.DESKTOP-SKBE9FB.16888.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8c9bd575b7c69292d82700b73b08a86e8a0ac76f9c833e10b67a775f8323cb4d
+size 405

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
     "epoch": 34.29,
-    "train_loss": 5.6989216804504395,
-    "train_runtime": 204.9044,
-    "train_samples_per_second": 41.58,
-    "train_steps_per_second": 0.586
 }

 {
     "epoch": 34.29,
+    "train_loss": 1.0817648808161417,
+    "train_runtime": 199.6882,
+    "train_samples_per_second": 42.667,
+    "train_steps_per_second": 0.601
 }

trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.10869565217391304,
-  "best_model_checkpoint": "swinv2-tiny-patch4-window8-256-DMAE-U2\\checkpoint-3",
   "epoch": 34.285714285714285,
   "eval_steps": 500,
   "global_step": 120,
@@ -10,399 +10,399 @@
   "log_history": [
     {
       "epoch": 0.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 7.920971870422363,
-      "eval_runtime": 0.7378,
-      "eval_samples_per_second": 62.346,
-      "eval_steps_per_second": 4.066,
       "step": 3
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 7.862796306610107,
-      "eval_runtime": 0.7695,
-      "eval_samples_per_second": 59.776,
-      "eval_steps_per_second": 3.898,
       "step": 7
     },
     {
       "epoch": 2.86,
-      "learning_rate": 1.5277777777777777e-05,
-      "loss": 7.9205,
       "step": 10
     },
     {
       "epoch": 2.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 7.793302536010742,
-      "eval_runtime": 0.7777,
-      "eval_samples_per_second": 59.149,
-      "eval_steps_per_second": 3.858,
       "step": 10
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 7.6468305587768555,
-      "eval_runtime": 0.7842,
-      "eval_samples_per_second": 58.659,
-      "eval_steps_per_second": 3.826,
       "step": 14
     },
     {
       "epoch": 4.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 7.514880180358887,
-      "eval_runtime": 0.7707,
-      "eval_samples_per_second": 59.687,
-      "eval_steps_per_second": 3.893,
       "step": 17
     },
     {
       "epoch": 5.71,
-      "learning_rate": 1.388888888888889e-05,
-      "loss": 7.5974,
       "step": 20
     },
     {
       "epoch": 6.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 7.315957069396973,
-      "eval_runtime": 0.8015,
-      "eval_samples_per_second": 57.394,
-      "eval_steps_per_second": 3.743,
       "step": 21
     },
     {
       "epoch": 6.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 7.140155792236328,
-      "eval_runtime": 0.828,
-      "eval_samples_per_second": 55.554,
-      "eval_steps_per_second": 3.623,
       "step": 24
     },
     {
       "epoch": 8.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 6.8985981941223145,
-      "eval_runtime": 0.8013,
-      "eval_samples_per_second": 57.406,
-      "eval_steps_per_second": 3.744,
       "step": 28
     },
     {
       "epoch": 8.57,
-      "learning_rate": 1.25e-05,
-      "loss": 6.9785,
       "step": 30
     },
     {
       "epoch": 8.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 6.716281890869141,
-      "eval_runtime": 0.7645,
-      "eval_samples_per_second": 60.167,
-      "eval_steps_per_second": 3.924,
       "step": 31
     },
     {
       "epoch": 10.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 6.5023088455200195,
-      "eval_runtime": 0.7766,
-      "eval_samples_per_second": 59.23,
-      "eval_steps_per_second": 3.863,
       "step": 35
     },
     {
       "epoch": 10.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 6.348923206329346,
-      "eval_runtime": 0.754,
-      "eval_samples_per_second": 61.006,
-      "eval_steps_per_second": 3.979,
       "step": 38
     },
     {
       "epoch": 11.43,
-      "learning_rate": 1.1111111111111112e-05,
-      "loss": 6.6592,
       "step": 40
     },
     {
       "epoch": 12.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 6.1221923828125,
-      "eval_runtime": 0.7587,
-      "eval_samples_per_second": 60.627,
-      "eval_steps_per_second": 3.954,
       "step": 42
     },
     {
       "epoch": 12.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 5.9531145095825195,
-      "eval_runtime": 0.7465,
-      "eval_samples_per_second": 61.621,
-      "eval_steps_per_second": 4.019,
       "step": 45
     },
     {
       "epoch": 14.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 5.759119510650635,
-      "eval_runtime": 0.7799,
-      "eval_samples_per_second": 58.98,
-      "eval_steps_per_second": 3.847,
       "step": 49
     },
     {
       "epoch": 14.29,
-      "learning_rate": 9.722222222222223e-06,
-      "loss": 5.989,
       "step": 50
     },
     {
       "epoch": 14.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 5.624123573303223,
-      "eval_runtime": 0.7767,
-      "eval_samples_per_second": 59.227,
-      "eval_steps_per_second": 3.863,
       "step": 52
     },
     {
       "epoch": 16.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 5.447250843048096,
-      "eval_runtime": 0.7839,
-      "eval_samples_per_second": 58.681,
-      "eval_steps_per_second": 3.827,
       "step": 56
     },
     {
       "epoch": 16.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 5.323362827301025,
-      "eval_runtime": 0.7866,
-      "eval_samples_per_second": 58.481,
-      "eval_steps_per_second": 3.814,
       "step": 59
     },
     {
       "epoch": 17.14,
-      "learning_rate": 8.333333333333334e-06,
-      "loss": 5.542,
       "step": 60
     },
     {
       "epoch": 18.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 5.169005870819092,
-      "eval_runtime": 0.774,
-      "eval_samples_per_second": 59.431,
-      "eval_steps_per_second": 3.876,
       "step": 63
     },
     {
       "epoch": 18.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 5.060708522796631,
-      "eval_runtime": 0.9383,
-      "eval_samples_per_second": 49.025,
-      "eval_steps_per_second": 3.197,
       "step": 66
     },
     {
       "epoch": 20.0,
-      "learning_rate": 6.944444444444445e-06,
-      "loss": 5.2205,
       "step": 70
     },
     {
       "epoch": 20.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 4.92466402053833,
-      "eval_runtime": 0.9208,
-      "eval_samples_per_second": 49.956,
-      "eval_steps_per_second": 3.258,
       "step": 70
     },
     {
       "epoch": 20.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 4.8281331062316895,
-      "eval_runtime": 0.7691,
-      "eval_samples_per_second": 59.807,
-      "eval_steps_per_second": 3.9,
       "step": 73
     },
     {
       "epoch": 22.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 4.709559440612793,
-      "eval_runtime": 0.7765,
-      "eval_samples_per_second": 59.239,
-      "eval_steps_per_second": 3.863,
       "step": 77
     },
     {
       "epoch": 22.86,
-      "learning_rate": 5.555555555555556e-06,
-      "loss": 4.8962,
       "step": 80
     },
     {
       "epoch": 22.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 4.628277778625488,
-      "eval_runtime": 0.7694,
-      "eval_samples_per_second": 59.784,
-      "eval_steps_per_second": 3.899,
       "step": 80
     },
     {
       "epoch": 24.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 4.529789924621582,
-      "eval_runtime": 0.8219,
-      "eval_samples_per_second": 55.966,
-      "eval_steps_per_second": 3.65,
       "step": 84
     },
     {
       "epoch": 24.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 4.461925506591797,
-      "eval_runtime": 0.7787,
-      "eval_samples_per_second": 59.073,
-      "eval_steps_per_second": 3.853,
       "step": 87
     },
     {
       "epoch": 25.71,
-      "learning_rate": 4.166666666666667e-06,
-      "loss": 4.6327,
       "step": 90
     },
     {
       "epoch": 26.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 4.380962371826172,
-      "eval_runtime": 0.7671,
-      "eval_samples_per_second": 59.967,
-      "eval_steps_per_second": 3.911,
       "step": 91
     },
     {
       "epoch": 26.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 4.327389717102051,
-      "eval_runtime": 0.7592,
-      "eval_samples_per_second": 60.586,
-      "eval_steps_per_second": 3.951,
       "step": 94
     },
     {
       "epoch": 28.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 4.264850616455078,
-      "eval_runtime": 0.7649,
-      "eval_samples_per_second": 60.14,
-      "eval_steps_per_second": 3.922,
       "step": 98
     },
     {
       "epoch": 28.57,
-      "learning_rate": 2.777777777777778e-06,
-      "loss": 4.3789,
       "step": 100
     },
     {
       "epoch": 28.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 4.224890232086182,
-      "eval_runtime": 0.8043,
-      "eval_samples_per_second": 57.191,
-      "eval_steps_per_second": 3.73,
       "step": 101
     },
     {
       "epoch": 30.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 4.180596828460693,
-      "eval_runtime": 0.7966,
-      "eval_samples_per_second": 57.745,
-      "eval_steps_per_second": 3.766,
       "step": 105
     },
     {
       "epoch": 30.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 4.1541218757629395,
-      "eval_runtime": 0.7683,
-      "eval_samples_per_second": 59.871,
-      "eval_steps_per_second": 3.905,
       "step": 108
     },
     {
       "epoch": 31.43,
-      "learning_rate": 1.388888888888889e-06,
-      "loss": 4.3182,
       "step": 110
     },
     {
       "epoch": 32.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 4.127509593963623,
-      "eval_runtime": 0.7577,
-      "eval_samples_per_second": 60.708,
-      "eval_steps_per_second": 3.959,
       "step": 112
     },
     {
       "epoch": 32.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 4.114198207855225,
-      "eval_runtime": 0.7935,
-      "eval_samples_per_second": 57.968,
-      "eval_steps_per_second": 3.781,
       "step": 115
     },
     {
       "epoch": 34.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 4.105391025543213,
-      "eval_runtime": 0.779,
-      "eval_samples_per_second": 59.051,
-      "eval_steps_per_second": 3.851,
       "step": 119
     },
     {
       "epoch": 34.29,
       "learning_rate": 0.0,
-      "loss": 4.254,
       "step": 120
     },
     {
       "epoch": 34.29,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 4.104760646820068,
-      "eval_runtime": 0.7612,
-      "eval_samples_per_second": 60.434,
-      "eval_steps_per_second": 3.941,
       "step": 120
     },
     {
       "epoch": 34.29,
       "step": 120,
       "total_flos": 2.3770905934823424e+17,
-      "train_loss": 5.6989216804504395,
-      "train_runtime": 204.9044,
-      "train_samples_per_second": 41.58,
-      "train_steps_per_second": 0.586
     }
   ],
   "logging_steps": 10,

 {
+  "best_metric": 0.6521739130434783,
+  "best_model_checkpoint": "swinv2-tiny-patch4-window8-256-DMAE-U2\\checkpoint-63",
   "epoch": 34.285714285714285,
   "eval_steps": 500,
   "global_step": 120,
   "log_history": [
     {
       "epoch": 0.86,
+      "eval_accuracy": 0.4782608695652174,
+      "eval_loss": 1.384318470954895,
+      "eval_runtime": 0.7692,
+      "eval_samples_per_second": 59.802,
+      "eval_steps_per_second": 3.9,
       "step": 3
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.3617327213287354,
+      "eval_runtime": 0.7541,
+      "eval_samples_per_second": 61.001,
+      "eval_steps_per_second": 3.978,
       "step": 7
     },
     {
       "epoch": 2.86,
+      "learning_rate": 3.37719298245614e-05,
+      "loss": 1.3721,
       "step": 10
     },
     {
       "epoch": 2.86,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.3210632801055908,
+      "eval_runtime": 0.7782,
+      "eval_samples_per_second": 59.112,
+      "eval_steps_per_second": 3.855,
       "step": 10
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.2598481178283691,
+      "eval_runtime": 0.7401,
+      "eval_samples_per_second": 62.152,
+      "eval_steps_per_second": 4.053,
       "step": 14
     },
     {
       "epoch": 4.86,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.2250741720199585,
+      "eval_runtime": 0.8846,
+      "eval_samples_per_second": 51.999,
+      "eval_steps_per_second": 3.391,
       "step": 17
     },
     {
       "epoch": 5.71,
+      "learning_rate": 3.070175438596491e-05,
+      "loss": 1.25,
       "step": 20
     },
     {
       "epoch": 6.0,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.209437608718872,
+      "eval_runtime": 0.7856,
+      "eval_samples_per_second": 58.558,
+      "eval_steps_per_second": 3.819,
       "step": 21
     },
     {
       "epoch": 6.86,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.2126904726028442,
+      "eval_runtime": 0.7803,
+      "eval_samples_per_second": 58.952,
+      "eval_steps_per_second": 3.845,
       "step": 24
     },
     {
       "epoch": 8.0,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.2118207216262817,
+      "eval_runtime": 0.7538,
+      "eval_samples_per_second": 61.026,
+      "eval_steps_per_second": 3.98,
       "step": 28
     },
     {
       "epoch": 8.57,
+      "learning_rate": 2.763157894736842e-05,
+      "loss": 1.1902,
       "step": 30
     },
     {
       "epoch": 8.86,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.203112006187439,
+      "eval_runtime": 0.776,
+      "eval_samples_per_second": 59.278,
+      "eval_steps_per_second": 3.866,
       "step": 31
     },
     {
       "epoch": 10.0,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.1936233043670654,
+      "eval_runtime": 0.746,
+      "eval_samples_per_second": 61.659,
+      "eval_steps_per_second": 4.021,
       "step": 35
     },
     {
       "epoch": 10.86,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.1829485893249512,
+      "eval_runtime": 0.794,
+      "eval_samples_per_second": 57.938,
+      "eval_steps_per_second": 3.779,
       "step": 38
     },
     {
       "epoch": 11.43,
+      "learning_rate": 2.4561403508771925e-05,
+      "loss": 1.1472,
       "step": 40
     },
     {
       "epoch": 12.0,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.156883955001831,
+      "eval_runtime": 0.744,
+      "eval_samples_per_second": 61.827,
+      "eval_steps_per_second": 4.032,
       "step": 42
     },
     {
       "epoch": 12.86,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.1431748867034912,
+      "eval_runtime": 0.7287,
+      "eval_samples_per_second": 63.129,
+      "eval_steps_per_second": 4.117,
       "step": 45
     },
     {
       "epoch": 14.0,
+      "eval_accuracy": 0.4782608695652174,
+      "eval_loss": 1.1357367038726807,
+      "eval_runtime": 0.7642,
+      "eval_samples_per_second": 60.196,
+      "eval_steps_per_second": 3.926,
       "step": 49
     },
     {
       "epoch": 14.29,
+      "learning_rate": 2.1491228070175438e-05,
+      "loss": 1.1495,
       "step": 50
     },
     {
       "epoch": 14.86,
+      "eval_accuracy": 0.5,
+      "eval_loss": 1.1177672147750854,
+      "eval_runtime": 0.7578,
+      "eval_samples_per_second": 60.705,
+      "eval_steps_per_second": 3.959,
       "step": 52
     },
     {
       "epoch": 16.0,
+      "eval_accuracy": 0.5217391304347826,
+      "eval_loss": 1.0903263092041016,
+      "eval_runtime": 0.77,
+      "eval_samples_per_second": 59.737,
+      "eval_steps_per_second": 3.896,
       "step": 56
     },
     {
       "epoch": 16.86,
+      "eval_accuracy": 0.6304347826086957,
+      "eval_loss": 1.0714055299758911,
+      "eval_runtime": 0.7702,
+      "eval_samples_per_second": 59.726,
+      "eval_steps_per_second": 3.895,
       "step": 59
     },
     {
       "epoch": 17.14,
+      "learning_rate": 1.8421052631578944e-05,
+      "loss": 1.0824,
       "step": 60
     },
     {
       "epoch": 18.0,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 1.0453197956085205,
+      "eval_runtime": 0.7803,
+      "eval_samples_per_second": 58.955,
+      "eval_steps_per_second": 3.845,
       "step": 63
     },
     {
       "epoch": 18.86,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 1.0149754285812378,
+      "eval_runtime": 0.7572,
+      "eval_samples_per_second": 60.752,
+      "eval_steps_per_second": 3.962,
       "step": 66
     },
     {
       "epoch": 20.0,
+      "learning_rate": 1.5350877192982453e-05,
+      "loss": 1.0535,
       "step": 70
     },
     {
       "epoch": 20.0,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 0.9924822449684143,
+      "eval_runtime": 0.7866,
+      "eval_samples_per_second": 58.483,
+      "eval_steps_per_second": 3.814,
       "step": 70
     },
     {
       "epoch": 20.86,
+      "eval_accuracy": 0.6304347826086957,
+      "eval_loss": 0.9778493642807007,
+      "eval_runtime": 0.8042,
+      "eval_samples_per_second": 57.201,
+      "eval_steps_per_second": 3.731,
       "step": 73
     },
     {
       "epoch": 22.0,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 0.9570326805114746,
+      "eval_runtime": 0.7982,
+      "eval_samples_per_second": 57.628,
+      "eval_steps_per_second": 3.758,
       "step": 77
     },
     {
       "epoch": 22.86,
+      "learning_rate": 1.2280701754385963e-05,
+      "loss": 0.994,
       "step": 80
     },
     {
       "epoch": 22.86,
+      "eval_accuracy": 0.6304347826086957,
+      "eval_loss": 0.9441110491752625,
+      "eval_runtime": 0.7429,
+      "eval_samples_per_second": 61.919,
+      "eval_steps_per_second": 4.038,
       "step": 80
     },
     {
       "epoch": 24.0,
+      "eval_accuracy": 0.6304347826086957,
+      "eval_loss": 0.9246149659156799,
+      "eval_runtime": 0.7415,
+      "eval_samples_per_second": 62.033,
+      "eval_steps_per_second": 4.046,
       "step": 84
     },
     {
       "epoch": 24.86,
+      "eval_accuracy": 0.6304347826086957,
+      "eval_loss": 0.9094782471656799,
+      "eval_runtime": 0.755,
+      "eval_samples_per_second": 60.928,
+      "eval_steps_per_second": 3.974,
       "step": 87
     },
     {
       "epoch": 25.71,
+      "learning_rate": 9.210526315789472e-06,
+      "loss": 0.9554,
       "step": 90
     },
     {
       "epoch": 26.0,
+      "eval_accuracy": 0.6304347826086957,
+      "eval_loss": 0.8936623334884644,
+      "eval_runtime": 0.7873,
+      "eval_samples_per_second": 58.43,
+      "eval_steps_per_second": 3.811,
       "step": 91
     },
     {
       "epoch": 26.86,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 0.8924787044525146,
+      "eval_runtime": 0.7504,
+      "eval_samples_per_second": 61.301,
+      "eval_steps_per_second": 3.998,
       "step": 94
     },
     {
       "epoch": 28.0,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 0.8886207938194275,
+      "eval_runtime": 0.748,
+      "eval_samples_per_second": 61.494,
+      "eval_steps_per_second": 4.01,
       "step": 98
     },
     {
       "epoch": 28.57,
+      "learning_rate": 6.140350877192981e-06,
+      "loss": 0.953,
       "step": 100
     },
     {
       "epoch": 28.86,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 0.8804457187652588,
+      "eval_runtime": 0.7633,
+      "eval_samples_per_second": 60.262,
+      "eval_steps_per_second": 3.93,
       "step": 101
     },
     {
       "epoch": 30.0,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 0.8744495511054993,
+      "eval_runtime": 0.76,
+      "eval_samples_per_second": 60.524,
+      "eval_steps_per_second": 3.947,
       "step": 105
     },
     {
       "epoch": 30.86,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 0.875434398651123,
+      "eval_runtime": 0.8019,
+      "eval_samples_per_second": 57.364,
+      "eval_steps_per_second": 3.741,
       "step": 108
     },
     {
       "epoch": 31.43,
+      "learning_rate": 3.0701754385964907e-06,
+      "loss": 0.9092,
       "step": 110
     },
     {
       "epoch": 32.0,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 0.8732549548149109,
+      "eval_runtime": 0.8029,
+      "eval_samples_per_second": 57.294,
+      "eval_steps_per_second": 3.737,
       "step": 112
     },
     {
       "epoch": 32.86,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 0.8725218772888184,
+      "eval_runtime": 0.8099,
+      "eval_samples_per_second": 56.796,
+      "eval_steps_per_second": 3.704,
       "step": 115
     },
     {
       "epoch": 34.0,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 0.8721739649772644,
+      "eval_runtime": 0.7302,
+      "eval_samples_per_second": 62.996,
+      "eval_steps_per_second": 4.108,
       "step": 119
     },
     {
       "epoch": 34.29,
       "learning_rate": 0.0,
+      "loss": 0.9247,
       "step": 120
     },
     {
       "epoch": 34.29,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 0.8720169067382812,
+      "eval_runtime": 0.7717,
+      "eval_samples_per_second": 59.608,
+      "eval_steps_per_second": 3.887,
       "step": 120
     },
     {
       "epoch": 34.29,
       "step": 120,
       "total_flos": 2.3770905934823424e+17,
+      "train_loss": 1.0817648808161417,
+      "train_runtime": 199.6882,
+      "train_samples_per_second": 42.667,
+      "train_steps_per_second": 0.601
     }
   ],
   "logging_steps": 10,