End of training

Browse files

Files changed (7) hide show

README.md +12 -12
all_results.json +5 -5
confusion_matrix_test_fold_4.png +0 -0
confusion_matrix_valid_fold_4.png +0 -0
model.safetensors +1 -1
test_results.json +5 -5
trainer_state.json +217 -217

README.md CHANGED Viewed

@@ -18,8 +18,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [facebook/timesformer-base-finetuned-k400](https://huggingface.co/facebook/timesformer-base-finetuned-k400) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.8547
-- Accuracy: 0.7665
 ## Model description
@@ -51,16 +51,16 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy |
 |:-------------:|:------:|:----:|:---------------:|:--------:|
-| 0.2384        | 0.1001 | 904  | 0.2019          | 0.9639   |
-| 0.0207        | 1.1001 | 1808 | 0.0325          | 0.9900   |
-| 0.0116        | 2.1001 | 2712 | 0.0229          | 0.9963   |
-| 0.0017        | 3.1001 | 3616 | 0.0222          | 0.9950   |
-| 0.0156        | 4.1001 | 4520 | 0.0402          | 0.9900   |
-| 0.0002        | 5.1001 | 5424 | 0.0083          | 0.9975   |
-| 0.0001        | 6.1001 | 6328 | 0.0088          | 0.9975   |
-| 0.0001        | 7.1001 | 7232 | 0.0094          | 0.9975   |
-| 0.0001        | 8.1001 | 8136 | 0.0097          | 0.9975   |
-| 0.0001        | 9.0990 | 9030 | 0.0098          | 0.9975   |
 ### Framework versions

 This model is a fine-tuned version of [facebook/timesformer-base-finetuned-k400](https://huggingface.co/facebook/timesformer-base-finetuned-k400) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.7984
+- Accuracy: 0.7774
 ## Model description
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy |
 |:-------------:|:------:|:----:|:---------------:|:--------:|
+| 0.2704        | 0.1001 | 904  | 0.2209          | 0.9552   |
+| 0.0155        | 1.1001 | 1808 | 0.0417          | 0.9913   |
+| 0.0021        | 2.1001 | 2712 | 0.0268          | 0.9938   |
+| 0.0004        | 3.1001 | 3616 | 0.0116          | 0.9975   |
+| 0.0125        | 4.1001 | 4520 | 0.0085          | 0.9963   |
+| 0.0043        | 5.1001 | 5424 | 0.0280          | 0.9913   |
+| 0.0002        | 6.1001 | 6328 | 0.0100          | 0.9975   |
+| 0.0001        | 7.1001 | 7232 | 0.0030          | 0.9988   |
+| 0.0001        | 8.1001 | 8136 | 0.0023          | 1.0      |
+| 0.0001        | 9.0990 | 9030 | 0.0023          | 1.0      |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 9.099003322259136,
-    "eval_accuracy": 0.7664576802507836,
-    "eval_loss": 0.8547028303146362,
-    "eval_runtime": 304.3291,
-    "eval_samples_per_second": 4.193,
-    "eval_steps_per_second": 0.526
 }

 {
     "epoch": 9.099003322259136,
+    "eval_accuracy": 0.7774294670846394,
+    "eval_loss": 0.7984064817428589,
+    "eval_runtime": 302.1425,
+    "eval_samples_per_second": 4.223,
+    "eval_steps_per_second": 0.53
 }

confusion_matrix_test_fold_4.png ADDED Viewed

confusion_matrix_valid_fold_4.png ADDED Viewed

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b0b19d4679f3e973d69e0d98a227b309b37c1cfc9cc13c05de9e0161d3bb10f3
 size 485250680

 version https://git-lfs.github.com/spec/v1
+oid sha256:67d7a44bf7d4a571e9fd58edc04d4d487ed0e0483490e331ed8db5f61972b7b0
 size 485250680

test_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 9.099003322259136,
-    "eval_accuracy": 0.7664576802507836,
-    "eval_loss": 0.8547028303146362,
-    "eval_runtime": 304.3291,
-    "eval_samples_per_second": 4.193,
-    "eval_steps_per_second": 0.526
 }

 {
     "epoch": 9.099003322259136,
+    "eval_accuracy": 0.7774294670846394,
+    "eval_loss": 0.7984064817428589,
+    "eval_runtime": 302.1425,
+    "eval_samples_per_second": 4.223,
+    "eval_steps_per_second": 0.53
 }

trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.9975093399750934,
-  "best_model_checkpoint": "/media/cse/HDD/Shawon/shawon/10 fold timesformer/Timesformer_default_fold_10_10_epoch_noAug_batch8/checkpoint-5424",
   "epoch": 9.099003322259136,
   "eval_steps": 500,
   "global_step": 9030,
@@ -10,740 +10,740 @@
   "log_history": [
     {
       "epoch": 0.01107419712070875,
-      "grad_norm": 12.339608192443848,
       "learning_rate": 5.537098560354375e-06,
-      "loss": 4.1774,
       "step": 100
     },
     {
       "epoch": 0.0221483942414175,
-      "grad_norm": 14.543400764465332,
       "learning_rate": 1.107419712070875e-05,
-      "loss": 3.8205,
       "step": 200
     },
     {
       "epoch": 0.03322259136212625,
-      "grad_norm": 15.178791046142578,
       "learning_rate": 1.6611295681063124e-05,
-      "loss": 2.9812,
       "step": 300
     },
     {
       "epoch": 0.044296788482835,
-      "grad_norm": 12.90939712524414,
       "learning_rate": 2.21483942414175e-05,
-      "loss": 2.072,
       "step": 400
     },
     {
       "epoch": 0.05537098560354374,
-      "grad_norm": 12.425464630126953,
       "learning_rate": 2.7685492801771873e-05,
-      "loss": 1.265,
       "step": 500
     },
     {
       "epoch": 0.0664451827242525,
-      "grad_norm": 7.096066474914551,
       "learning_rate": 3.322259136212625e-05,
-      "loss": 0.8079,
       "step": 600
     },
     {
       "epoch": 0.07751937984496124,
-      "grad_norm": 9.374312400817871,
       "learning_rate": 3.875968992248062e-05,
-      "loss": 0.4583,
       "step": 700
     },
     {
       "epoch": 0.08859357696567,
-      "grad_norm": 2.866607904434204,
       "learning_rate": 4.4296788482835e-05,
-      "loss": 0.2863,
       "step": 800
     },
     {
       "epoch": 0.09966777408637874,
-      "grad_norm": 9.150209426879883,
       "learning_rate": 4.983388704318937e-05,
-      "loss": 0.2384,
       "step": 900
     },
     {
       "epoch": 0.10011074197120709,
-      "eval_accuracy": 0.9638854296388543,
-      "eval_loss": 0.20189498364925385,
-      "eval_runtime": 306.3851,
-      "eval_samples_per_second": 2.621,
-      "eval_steps_per_second": 0.33,
       "step": 904
     },
     {
       "epoch": 1.0106312292358803,
-      "grad_norm": 0.4338759779930115,
       "learning_rate": 4.940322382182848e-05,
-      "loss": 0.1309,
       "step": 1000
     },
     {
       "epoch": 1.0217054263565892,
-      "grad_norm": 0.7621960639953613,
       "learning_rate": 4.878799064845577e-05,
-      "loss": 0.1036,
       "step": 1100
     },
     {
       "epoch": 1.032779623477298,
-      "grad_norm": 0.665744960308075,
       "learning_rate": 4.8172757475083056e-05,
-      "loss": 0.075,
       "step": 1200
     },
     {
       "epoch": 1.0438538205980066,
-      "grad_norm": 11.760805130004883,
       "learning_rate": 4.755752430171035e-05,
-      "loss": 0.0808,
       "step": 1300
     },
     {
       "epoch": 1.0549280177187155,
-      "grad_norm": 2.482733726501465,
       "learning_rate": 4.694229112833764e-05,
-      "loss": 0.0308,
       "step": 1400
     },
     {
       "epoch": 1.0660022148394241,
-      "grad_norm": 0.05557706952095032,
       "learning_rate": 4.6327057954964936e-05,
-      "loss": 0.0475,
       "step": 1500
     },
     {
       "epoch": 1.0770764119601328,
-      "grad_norm": 0.05685936659574509,
       "learning_rate": 4.571182478159223e-05,
-      "loss": 0.0211,
       "step": 1600
     },
     {
       "epoch": 1.0881506090808417,
-      "grad_norm": 0.07164409011602402,
       "learning_rate": 4.5096591608219516e-05,
-      "loss": 0.0367,
       "step": 1700
     },
     {
       "epoch": 1.0992248062015504,
-      "grad_norm": 0.07703804969787598,
       "learning_rate": 4.448135843484681e-05,
-      "loss": 0.0207,
       "step": 1800
     },
     {
       "epoch": 1.100110741971207,
-      "eval_accuracy": 0.9900373599003736,
-      "eval_loss": 0.03251923993229866,
-      "eval_runtime": 319.7386,
-      "eval_samples_per_second": 2.511,
-      "eval_steps_per_second": 0.316,
       "step": 1808
     },
     {
       "epoch": 2.010188261351052,
-      "grad_norm": 0.049545079469680786,
       "learning_rate": 4.38661252614741e-05,
-      "loss": 0.0066,
       "step": 1900
     },
     {
       "epoch": 2.0212624584717607,
-      "grad_norm": 0.023045338690280914,
       "learning_rate": 4.325089208810139e-05,
-      "loss": 0.0035,
       "step": 2000
     },
     {
       "epoch": 2.0323366555924696,
-      "grad_norm": 0.016869375482201576,
       "learning_rate": 4.263565891472868e-05,
-      "loss": 0.0162,
       "step": 2100
     },
     {
       "epoch": 2.0434108527131785,
-      "grad_norm": 0.029845820739865303,
       "learning_rate": 4.2020425741355975e-05,
-      "loss": 0.0185,
       "step": 2200
     },
     {
       "epoch": 2.054485049833887,
-      "grad_norm": 0.009218129329383373,
       "learning_rate": 4.140519256798327e-05,
-      "loss": 0.0109,
       "step": 2300
     },
     {
       "epoch": 2.065559246954596,
-      "grad_norm": 0.07040040194988251,
       "learning_rate": 4.078995939461056e-05,
-      "loss": 0.0023,
       "step": 2400
     },
     {
       "epoch": 2.0766334440753047,
-      "grad_norm": 0.12176311016082764,
       "learning_rate": 4.0174726221237855e-05,
-      "loss": 0.0258,
       "step": 2500
     },
     {
       "epoch": 2.087707641196013,
-      "grad_norm": 0.01268716063350439,
       "learning_rate": 3.955949304786514e-05,
-      "loss": 0.0098,
       "step": 2600
     },
     {
       "epoch": 2.098781838316722,
-      "grad_norm": 0.03558783233165741,
       "learning_rate": 3.8944259874492434e-05,
-      "loss": 0.0116,
       "step": 2700
     },
     {
       "epoch": 2.100110741971207,
-      "eval_accuracy": 0.9962640099626401,
-      "eval_loss": 0.02290569432079792,
-      "eval_runtime": 324.5071,
-      "eval_samples_per_second": 2.475,
-      "eval_steps_per_second": 0.311,
       "step": 2712
     },
     {
       "epoch": 3.009745293466224,
-      "grad_norm": 0.021466247737407684,
       "learning_rate": 3.832902670111973e-05,
-      "loss": 0.0169,
       "step": 2800
     },
     {
       "epoch": 3.0208194905869323,
-      "grad_norm": 0.014765599742531776,
       "learning_rate": 3.7713793527747014e-05,
-      "loss": 0.0008,
       "step": 2900
     },
     {
       "epoch": 3.0318936877076412,
-      "grad_norm": 0.012668099254369736,
       "learning_rate": 3.7098560354374314e-05,
-      "loss": 0.0021,
       "step": 3000
     },
     {
       "epoch": 3.04296788482835,
-      "grad_norm": 0.007325606886297464,
       "learning_rate": 3.64833271810016e-05,
-      "loss": 0.0043,
       "step": 3100
     },
     {
       "epoch": 3.0540420819490586,
-      "grad_norm": 0.010318818502128124,
       "learning_rate": 3.5868094007628894e-05,
-      "loss": 0.0119,
       "step": 3200
     },
     {
       "epoch": 3.0651162790697675,
-      "grad_norm": 0.00951201282441616,
       "learning_rate": 3.525286083425619e-05,
-      "loss": 0.0006,
       "step": 3300
     },
     {
       "epoch": 3.0761904761904764,
-      "grad_norm": 0.0036382139660418034,
       "learning_rate": 3.463762766088347e-05,
-      "loss": 0.0006,
       "step": 3400
     },
     {
       "epoch": 3.087264673311185,
-      "grad_norm": 0.014880606904625893,
       "learning_rate": 3.4022394487510767e-05,
-      "loss": 0.0112,
       "step": 3500
     },
     {
       "epoch": 3.0983388704318937,
-      "grad_norm": 0.02532036043703556,
       "learning_rate": 3.340716131413806e-05,
-      "loss": 0.0017,
       "step": 3600
     },
     {
       "epoch": 3.100110741971207,
-      "eval_accuracy": 0.9950186799501868,
-      "eval_loss": 0.022232333198189735,
-      "eval_runtime": 321.5404,
-      "eval_samples_per_second": 2.497,
-      "eval_steps_per_second": 0.314,
       "step": 3616
     },
     {
       "epoch": 4.0093023255813955,
-      "grad_norm": 0.006754144560545683,
       "learning_rate": 3.2791928140765346e-05,
-      "loss": 0.0005,
       "step": 3700
     },
     {
       "epoch": 4.020376522702104,
-      "grad_norm": 0.005147715099155903,
       "learning_rate": 3.2176694967392646e-05,
-      "loss": 0.0149,
       "step": 3800
     },
     {
       "epoch": 4.0314507198228124,
-      "grad_norm": 0.007229967508465052,
       "learning_rate": 3.156146179401994e-05,
       "loss": 0.0003,
       "step": 3900
     },
     {
       "epoch": 4.042524916943521,
-      "grad_norm": 0.014596535824239254,
       "learning_rate": 3.0946228620647226e-05,
-      "loss": 0.0004,
       "step": 4000
     },
     {
       "epoch": 4.05359911406423,
-      "grad_norm": 0.0032493751496076584,
       "learning_rate": 3.033099544727452e-05,
       "loss": 0.0003,
       "step": 4100
     },
     {
       "epoch": 4.064673311184939,
-      "grad_norm": 0.004764176905155182,
       "learning_rate": 2.971576227390181e-05,
       "loss": 0.0002,
       "step": 4200
     },
     {
       "epoch": 4.075747508305648,
-      "grad_norm": 0.005187960807234049,
       "learning_rate": 2.91005291005291e-05,
       "loss": 0.0002,
       "step": 4300
     },
     {
       "epoch": 4.086821705426357,
-      "grad_norm": 0.008601618930697441,
       "learning_rate": 2.8485295927156392e-05,
-      "loss": 0.0004,
       "step": 4400
     },
     {
       "epoch": 4.097895902547065,
-      "grad_norm": 0.5019575357437134,
       "learning_rate": 2.787006275378369e-05,
-      "loss": 0.0156,
       "step": 4500
     },
     {
       "epoch": 4.100110741971207,
-      "eval_accuracy": 0.9900373599003736,
-      "eval_loss": 0.04016907513141632,
-      "eval_runtime": 316.7446,
-      "eval_samples_per_second": 2.535,
-      "eval_steps_per_second": 0.319,
       "step": 4520
     },
     {
       "epoch": 5.008859357696567,
-      "grad_norm": 0.09171910583972931,
       "learning_rate": 2.725482958041098e-05,
-      "loss": 0.0379,
       "step": 4600
     },
     {
       "epoch": 5.019933554817276,
-      "grad_norm": 0.012514377012848854,
       "learning_rate": 2.6639596407038268e-05,
-      "loss": 0.0049,
       "step": 4700
     },
     {
       "epoch": 5.0310077519379846,
-      "grad_norm": 0.009760179556906223,
       "learning_rate": 2.602436323366556e-05,
-      "loss": 0.0008,
       "step": 4800
     },
     {
       "epoch": 5.0420819490586934,
-      "grad_norm": 0.00494693499058485,
       "learning_rate": 2.540913006029285e-05,
-      "loss": 0.0094,
       "step": 4900
     },
     {
       "epoch": 5.053156146179402,
-      "grad_norm": 0.003839722601696849,
       "learning_rate": 2.479389688692014e-05,
-      "loss": 0.0003,
       "step": 5000
     },
     {
       "epoch": 5.06423034330011,
-      "grad_norm": 0.004592357203364372,
       "learning_rate": 2.4178663713547438e-05,
-      "loss": 0.0002,
       "step": 5100
     },
     {
       "epoch": 5.075304540420819,
-      "grad_norm": 0.00357171637006104,
       "learning_rate": 2.3563430540174727e-05,
-      "loss": 0.0003,
       "step": 5200
     },
     {
       "epoch": 5.086378737541528,
-      "grad_norm": 0.004462802782654762,
       "learning_rate": 2.2948197366802017e-05,
-      "loss": 0.0002,
       "step": 5300
     },
     {
       "epoch": 5.097452934662237,
-      "grad_norm": 0.002604804467409849,
       "learning_rate": 2.233296419342931e-05,
-      "loss": 0.0002,
       "step": 5400
     },
     {
       "epoch": 5.100110741971207,
-      "eval_accuracy": 0.9975093399750934,
-      "eval_loss": 0.008347271010279655,
-      "eval_runtime": 311.1635,
-      "eval_samples_per_second": 2.581,
-      "eval_steps_per_second": 0.325,
       "step": 5424
     },
     {
       "epoch": 6.008416389811739,
-      "grad_norm": 0.0028000217862427235,
       "learning_rate": 2.1717731020056604e-05,
-      "loss": 0.0002,
       "step": 5500
     },
     {
       "epoch": 6.019490586932448,
-      "grad_norm": 0.0019141006050631404,
       "learning_rate": 2.1102497846683894e-05,
-      "loss": 0.0001,
       "step": 5600
     },
     {
       "epoch": 6.030564784053156,
-      "grad_norm": 0.0038908650167286396,
       "learning_rate": 2.0487264673311183e-05,
-      "loss": 0.0001,
       "step": 5700
     },
     {
       "epoch": 6.041638981173865,
-      "grad_norm": 0.0013375241542235017,
       "learning_rate": 1.987203149993848e-05,
-      "loss": 0.0001,
       "step": 5800
     },
     {
       "epoch": 6.052713178294574,
-      "grad_norm": 0.0016891614068299532,
       "learning_rate": 1.925679832656577e-05,
-      "loss": 0.0001,
       "step": 5900
     },
     {
       "epoch": 6.0637873754152825,
-      "grad_norm": 0.0015141346957534552,
       "learning_rate": 1.864156515319306e-05,
-      "loss": 0.0001,
       "step": 6000
     },
     {
       "epoch": 6.074861572535991,
-      "grad_norm": 0.0012503410689532757,
       "learning_rate": 1.8026331979820353e-05,
-      "loss": 0.0001,
       "step": 6100
     },
     {
       "epoch": 6.0859357696567,
-      "grad_norm": 0.0019348779460415244,
       "learning_rate": 1.7411098806447646e-05,
-      "loss": 0.0001,
       "step": 6200
     },
     {
       "epoch": 6.097009966777408,
-      "grad_norm": 0.001840105396695435,
       "learning_rate": 1.6795865633074936e-05,
-      "loss": 0.0001,
       "step": 6300
     },
     {
       "epoch": 6.100110741971207,
       "eval_accuracy": 0.9975093399750934,
-      "eval_loss": 0.008798662573099136,
-      "eval_runtime": 315.9616,
-      "eval_samples_per_second": 2.541,
-      "eval_steps_per_second": 0.32,
       "step": 6328
     },
     {
       "epoch": 7.00797342192691,
-      "grad_norm": 0.0018666000105440617,
       "learning_rate": 1.6180632459702226e-05,
-      "loss": 0.0001,
       "step": 6400
     },
     {
       "epoch": 7.019047619047619,
-      "grad_norm": 0.0011329470435157418,
       "learning_rate": 1.556539928632952e-05,
-      "loss": 0.0001,
       "step": 6500
     },
     {
       "epoch": 7.030121816168328,
-      "grad_norm": 0.0014819415519014,
       "learning_rate": 1.4950166112956812e-05,
-      "loss": 0.0001,
       "step": 6600
     },
     {
       "epoch": 7.041196013289037,
-      "grad_norm": 0.0013377605937421322,
       "learning_rate": 1.4334932939584104e-05,
-      "loss": 0.0001,
       "step": 6700
     },
     {
       "epoch": 7.052270210409746,
-      "grad_norm": 0.0014949695905670524,
       "learning_rate": 1.3719699766211393e-05,
-      "loss": 0.0001,
       "step": 6800
     },
     {
       "epoch": 7.063344407530454,
-      "grad_norm": 0.0020517068915069103,
       "learning_rate": 1.3104466592838688e-05,
-      "loss": 0.0001,
       "step": 6900
     },
     {
       "epoch": 7.074418604651163,
-      "grad_norm": 0.0016913407016545534,
       "learning_rate": 1.2489233419465978e-05,
-      "loss": 0.0001,
       "step": 7000
     },
     {
       "epoch": 7.0854928017718715,
-      "grad_norm": 0.0019159069051966071,
       "learning_rate": 1.187400024609327e-05,
-      "loss": 0.0001,
       "step": 7100
     },
     {
       "epoch": 7.09656699889258,
-      "grad_norm": 0.0017233892576768994,
       "learning_rate": 1.1258767072720563e-05,
       "loss": 0.0001,
       "step": 7200
     },
     {
       "epoch": 7.100110741971207,
-      "eval_accuracy": 0.9975093399750934,
-      "eval_loss": 0.009401123970746994,
-      "eval_runtime": 205.4199,
-      "eval_samples_per_second": 3.909,
-      "eval_steps_per_second": 0.492,
       "step": 7232
     },
     {
       "epoch": 8.007530454042081,
-      "grad_norm": 0.0016070300480350852,
       "learning_rate": 1.0643533899347853e-05,
       "loss": 0.0001,
       "step": 7300
     },
     {
       "epoch": 8.018604651162791,
-      "grad_norm": 0.0009037270210683346,
       "learning_rate": 1.0028300725975146e-05,
       "loss": 0.0001,
       "step": 7400
     },
     {
       "epoch": 8.029678848283499,
-      "grad_norm": 0.0009796767262741923,
       "learning_rate": 9.413067552602436e-06,
       "loss": 0.0001,
       "step": 7500
     },
     {
       "epoch": 8.040753045404209,
-      "grad_norm": 0.009153931401669979,
       "learning_rate": 8.797834379229729e-06,
       "loss": 0.0001,
       "step": 7600
     },
     {
       "epoch": 8.051827242524917,
-      "grad_norm": 0.0009286152780987322,
       "learning_rate": 8.18260120585702e-06,
       "loss": 0.0001,
       "step": 7700
     },
     {
       "epoch": 8.062901439645625,
-      "grad_norm": 0.0012453129747882485,
       "learning_rate": 7.567368032484312e-06,
       "loss": 0.0001,
       "step": 7800
     },
     {
       "epoch": 8.073975636766335,
-      "grad_norm": 0.000763101561460644,
       "learning_rate": 6.952134859111603e-06,
       "loss": 0.0001,
       "step": 7900
     },
     {
       "epoch": 8.085049833887043,
-      "grad_norm": 0.0010468490654602647,
       "learning_rate": 6.336901685738895e-06,
       "loss": 0.0001,
       "step": 8000
     },
     {
       "epoch": 8.096124031007752,
-      "grad_norm": 0.0007441536872647703,
       "learning_rate": 5.7216685123661875e-06,
       "loss": 0.0001,
       "step": 8100
     },
     {
       "epoch": 8.100110741971207,
-      "eval_accuracy": 0.9975093399750934,
-      "eval_loss": 0.009709909558296204,
-      "eval_runtime": 213.0126,
-      "eval_samples_per_second": 3.77,
-      "eval_steps_per_second": 0.474,
       "step": 8136
     },
     {
       "epoch": 9.007087486157253,
-      "grad_norm": 0.0011277415324002504,
       "learning_rate": 5.106435338993479e-06,
       "loss": 0.0001,
       "step": 8200
     },
     {
       "epoch": 9.018161683277963,
-      "grad_norm": 0.0012697929050773382,
       "learning_rate": 4.4912021656207705e-06,
       "loss": 0.0001,
       "step": 8300
     },
     {
       "epoch": 9.029235880398671,
-      "grad_norm": 0.0028499774634838104,
       "learning_rate": 3.875968992248062e-06,
       "loss": 0.0001,
       "step": 8400
     },
     {
       "epoch": 9.04031007751938,
-      "grad_norm": 0.0017348791006952524,
       "learning_rate": 3.260735818875354e-06,
       "loss": 0.0001,
       "step": 8500
     },
     {
       "epoch": 9.051384274640089,
-      "grad_norm": 0.0006883046007715166,
       "learning_rate": 2.6455026455026455e-06,
       "loss": 0.0001,
       "step": 8600
     },
     {
       "epoch": 9.062458471760797,
-      "grad_norm": 0.00142951391171664,
       "learning_rate": 2.0302694721299375e-06,
       "loss": 0.0001,
       "step": 8700
     },
     {
       "epoch": 9.073532668881507,
-      "grad_norm": 0.000702825200278312,
       "learning_rate": 1.415036298757229e-06,
       "loss": 0.0001,
       "step": 8800
     },
     {
       "epoch": 9.084606866002215,
-      "grad_norm": 0.0009480651351623237,
       "learning_rate": 7.998031253845208e-07,
       "loss": 0.0001,
       "step": 8900
     },
     {
       "epoch": 9.095681063122923,
-      "grad_norm": 0.0010264083975926042,
       "learning_rate": 1.8456995201181249e-07,
       "loss": 0.0001,
       "step": 9000
     },
     {
       "epoch": 9.099003322259136,
-      "eval_accuracy": 0.9975093399750934,
-      "eval_loss": 0.009837848134338856,
-      "eval_runtime": 215.3394,
-      "eval_samples_per_second": 3.729,
-      "eval_steps_per_second": 0.469,
       "step": 9030
     },
     {
       "epoch": 9.099003322259136,
       "step": 9030,
       "total_flos": 6.328460909097596e+19,
-      "train_loss": 0.18714786747627524,
-      "train_runtime": 33340.824,
-      "train_samples_per_second": 2.167,
-      "train_steps_per_second": 0.271
     },
     {
       "epoch": 9.099003322259136,
-      "eval_accuracy": 0.7664576802507836,
-      "eval_loss": 0.8547028303146362,
-      "eval_runtime": 304.3291,
-      "eval_samples_per_second": 4.193,
-      "eval_steps_per_second": 0.526,
       "step": 9030
     }
   ],

 {
+  "best_metric": 1.0,
+  "best_model_checkpoint": "/media/cse/HDD/Shawon/shawon/10 fold timesformer/Timesformer_default_fold_10_10_epoch_noAug_batch8/checkpoint-8136",
   "epoch": 9.099003322259136,
   "eval_steps": 500,
   "global_step": 9030,
   "log_history": [
     {
       "epoch": 0.01107419712070875,
+      "grad_norm": 12.285748481750488,
       "learning_rate": 5.537098560354375e-06,
+      "loss": 4.1825,
       "step": 100
     },
     {
       "epoch": 0.0221483942414175,
+      "grad_norm": 13.900195121765137,
       "learning_rate": 1.107419712070875e-05,
+      "loss": 3.8327,
       "step": 200
     },
     {
       "epoch": 0.03322259136212625,
+      "grad_norm": 16.053707122802734,
       "learning_rate": 1.6611295681063124e-05,
+      "loss": 3.0094,
       "step": 300
     },
     {
       "epoch": 0.044296788482835,
+      "grad_norm": 14.44247817993164,
       "learning_rate": 2.21483942414175e-05,
+      "loss": 2.0742,
       "step": 400
     },
     {
       "epoch": 0.05537098560354374,
+      "grad_norm": 11.22198486328125,
       "learning_rate": 2.7685492801771873e-05,
+      "loss": 1.3003,
       "step": 500
     },
     {
       "epoch": 0.0664451827242525,
+      "grad_norm": 8.951163291931152,
       "learning_rate": 3.322259136212625e-05,
+      "loss": 0.7913,
       "step": 600
     },
     {
       "epoch": 0.07751937984496124,
+      "grad_norm": 6.106560707092285,
       "learning_rate": 3.875968992248062e-05,
+      "loss": 0.4525,
       "step": 700
     },
     {
       "epoch": 0.08859357696567,
+      "grad_norm": 3.4112484455108643,
       "learning_rate": 4.4296788482835e-05,
+      "loss": 0.2954,
       "step": 800
     },
     {
       "epoch": 0.09966777408637874,
+      "grad_norm": 5.202641487121582,
       "learning_rate": 4.983388704318937e-05,
+      "loss": 0.2704,
       "step": 900
     },
     {
       "epoch": 0.10011074197120709,
+      "eval_accuracy": 0.9551681195516812,
+      "eval_loss": 0.22091799974441528,
+      "eval_runtime": 204.9768,
+      "eval_samples_per_second": 3.918,
+      "eval_steps_per_second": 0.493,
       "step": 904
     },
     {
       "epoch": 1.0106312292358803,
+      "grad_norm": 2.3844780921936035,
       "learning_rate": 4.940322382182848e-05,
+      "loss": 0.1136,
       "step": 1000
     },
     {
       "epoch": 1.0217054263565892,
+      "grad_norm": 0.3309445083141327,
       "learning_rate": 4.878799064845577e-05,
+      "loss": 0.1143,
       "step": 1100
     },
     {
       "epoch": 1.032779623477298,
+      "grad_norm": 1.7956221103668213,
       "learning_rate": 4.8172757475083056e-05,
+      "loss": 0.0711,
       "step": 1200
     },
     {
       "epoch": 1.0438538205980066,
+      "grad_norm": 4.114385604858398,
       "learning_rate": 4.755752430171035e-05,
+      "loss": 0.0928,
       "step": 1300
     },
     {
       "epoch": 1.0549280177187155,
+      "grad_norm": 13.343818664550781,
       "learning_rate": 4.694229112833764e-05,
+      "loss": 0.072,
       "step": 1400
     },
     {
       "epoch": 1.0660022148394241,
+      "grad_norm": 0.0704650729894638,
       "learning_rate": 4.6327057954964936e-05,
+      "loss": 0.0522,
       "step": 1500
     },
     {
       "epoch": 1.0770764119601328,
+      "grad_norm": 0.06872345507144928,
       "learning_rate": 4.571182478159223e-05,
+      "loss": 0.0108,
       "step": 1600
     },
     {
       "epoch": 1.0881506090808417,
+      "grad_norm": 0.07814284414052963,
       "learning_rate": 4.5096591608219516e-05,
+      "loss": 0.0261,
       "step": 1700
     },
     {
       "epoch": 1.0992248062015504,
+      "grad_norm": 0.09340647608041763,
       "learning_rate": 4.448135843484681e-05,
+      "loss": 0.0155,
       "step": 1800
     },
     {
       "epoch": 1.100110741971207,
+      "eval_accuracy": 0.9912826899128269,
+      "eval_loss": 0.041718773543834686,
+      "eval_runtime": 205.7202,
+      "eval_samples_per_second": 3.903,
+      "eval_steps_per_second": 0.491,
       "step": 1808
     },
     {
       "epoch": 2.010188261351052,
+      "grad_norm": 0.061494044959545135,
       "learning_rate": 4.38661252614741e-05,
+      "loss": 0.0069,
       "step": 1900
     },
     {
       "epoch": 2.0212624584717607,
+      "grad_norm": 0.024138756096363068,
       "learning_rate": 4.325089208810139e-05,
+      "loss": 0.0161,
       "step": 2000
     },
     {
       "epoch": 2.0323366555924696,
+      "grad_norm": 0.17499598860740662,
       "learning_rate": 4.263565891472868e-05,
+      "loss": 0.0145,
       "step": 2100
     },
     {
       "epoch": 2.0434108527131785,
+      "grad_norm": 10.606599807739258,
       "learning_rate": 4.2020425741355975e-05,
+      "loss": 0.0575,
       "step": 2200
     },
     {
       "epoch": 2.054485049833887,
+      "grad_norm": 0.1084849014878273,
       "learning_rate": 4.140519256798327e-05,
+      "loss": 0.0037,
       "step": 2300
     },
     {
       "epoch": 2.065559246954596,
+      "grad_norm": 0.06579738110303879,
       "learning_rate": 4.078995939461056e-05,
+      "loss": 0.0033,
       "step": 2400
     },
     {
       "epoch": 2.0766334440753047,
+      "grad_norm": 0.0159724373370409,
       "learning_rate": 4.0174726221237855e-05,
+      "loss": 0.0038,
       "step": 2500
     },
     {
       "epoch": 2.087707641196013,
+      "grad_norm": 0.032099511474370956,
       "learning_rate": 3.955949304786514e-05,
+      "loss": 0.0106,
       "step": 2600
     },
     {
       "epoch": 2.098781838316722,
+      "grad_norm": 0.18046538531780243,
       "learning_rate": 3.8944259874492434e-05,
+      "loss": 0.0021,
       "step": 2700
     },
     {
       "epoch": 2.100110741971207,
+      "eval_accuracy": 0.9937733499377335,
+      "eval_loss": 0.026835119351744652,
+      "eval_runtime": 217.9844,
+      "eval_samples_per_second": 3.684,
+      "eval_steps_per_second": 0.463,
       "step": 2712
     },
     {
       "epoch": 3.009745293466224,
+      "grad_norm": 0.01824910193681717,
       "learning_rate": 3.832902670111973e-05,
+      "loss": 0.013,
       "step": 2800
     },
     {
       "epoch": 3.0208194905869323,
+      "grad_norm": 0.05538594350218773,
       "learning_rate": 3.7713793527747014e-05,
+      "loss": 0.0087,
       "step": 2900
     },
     {
       "epoch": 3.0318936877076412,
+      "grad_norm": 0.018902570009231567,
       "learning_rate": 3.7098560354374314e-05,
+      "loss": 0.0478,
       "step": 3000
     },
     {
       "epoch": 3.04296788482835,
+      "grad_norm": 0.06631331145763397,
       "learning_rate": 3.64833271810016e-05,
+      "loss": 0.0109,
       "step": 3100
     },
     {
       "epoch": 3.0540420819490586,
+      "grad_norm": 0.017673442140221596,
       "learning_rate": 3.5868094007628894e-05,
+      "loss": 0.0175,
       "step": 3200
     },
     {
       "epoch": 3.0651162790697675,
+      "grad_norm": 0.007972619496285915,
       "learning_rate": 3.525286083425619e-05,
+      "loss": 0.0009,
       "step": 3300
     },
     {
       "epoch": 3.0761904761904764,
+      "grad_norm": 0.005024532321840525,
       "learning_rate": 3.463762766088347e-05,
+      "loss": 0.0089,
       "step": 3400
     },
     {
       "epoch": 3.087264673311185,
+      "grad_norm": 0.008405894972383976,
       "learning_rate": 3.4022394487510767e-05,
+      "loss": 0.0005,
       "step": 3500
     },
     {
       "epoch": 3.0983388704318937,
+      "grad_norm": 0.004133996553719044,
       "learning_rate": 3.340716131413806e-05,
+      "loss": 0.0004,
       "step": 3600
     },
     {
       "epoch": 3.100110741971207,
+      "eval_accuracy": 0.9975093399750934,
+      "eval_loss": 0.011567194014787674,
+      "eval_runtime": 211.0278,
+      "eval_samples_per_second": 3.805,
+      "eval_steps_per_second": 0.479,
       "step": 3616
     },
     {
       "epoch": 4.0093023255813955,
+      "grad_norm": 0.01580865867435932,
       "learning_rate": 3.2791928140765346e-05,
+      "loss": 0.0153,
       "step": 3700
     },
     {
       "epoch": 4.020376522702104,
+      "grad_norm": 0.003808818757534027,
       "learning_rate": 3.2176694967392646e-05,
+      "loss": 0.0004,
       "step": 3800
     },
     {
       "epoch": 4.0314507198228124,
+      "grad_norm": 0.006102267187088728,
       "learning_rate": 3.156146179401994e-05,
       "loss": 0.0003,
       "step": 3900
     },
     {
       "epoch": 4.042524916943521,
+      "grad_norm": 0.005705439019948244,
       "learning_rate": 3.0946228620647226e-05,
+      "loss": 0.0002,
       "step": 4000
     },
     {
       "epoch": 4.05359911406423,
+      "grad_norm": 0.0029700251761823893,
       "learning_rate": 3.033099544727452e-05,
       "loss": 0.0003,
       "step": 4100
     },
     {
       "epoch": 4.064673311184939,
+      "grad_norm": 0.0034872761461883783,
       "learning_rate": 2.971576227390181e-05,
       "loss": 0.0002,
       "step": 4200
     },
     {
       "epoch": 4.075747508305648,
+      "grad_norm": 0.00403960794210434,
       "learning_rate": 2.91005291005291e-05,
       "loss": 0.0002,
       "step": 4300
     },
     {
       "epoch": 4.086821705426357,
+      "grad_norm": 0.0029434591997414827,
       "learning_rate": 2.8485295927156392e-05,
+      "loss": 0.0028,
       "step": 4400
     },
     {
       "epoch": 4.097895902547065,
+      "grad_norm": 0.003810062538832426,
       "learning_rate": 2.787006275378369e-05,
+      "loss": 0.0125,
       "step": 4500
     },
     {
       "epoch": 4.100110741971207,
+      "eval_accuracy": 0.9962640099626401,
+      "eval_loss": 0.008478819392621517,
+      "eval_runtime": 207.8373,
+      "eval_samples_per_second": 3.864,
+      "eval_steps_per_second": 0.486,
       "step": 4520
     },
     {
       "epoch": 5.008859357696567,
+      "grad_norm": 0.004100952763110399,
       "learning_rate": 2.725482958041098e-05,
+      "loss": 0.0002,
       "step": 4600
     },
     {
       "epoch": 5.019933554817276,
+      "grad_norm": 0.006221433635801077,
       "learning_rate": 2.6639596407038268e-05,
+      "loss": 0.0002,
       "step": 4700
     },
     {
       "epoch": 5.0310077519379846,
+      "grad_norm": 0.0044784145429730415,
       "learning_rate": 2.602436323366556e-05,
+      "loss": 0.0002,
       "step": 4800
     },
     {
       "epoch": 5.0420819490586934,
+      "grad_norm": 0.0028812645468860865,
       "learning_rate": 2.540913006029285e-05,
+      "loss": 0.0002,
       "step": 4900
     },
     {
       "epoch": 5.053156146179402,
+      "grad_norm": 0.0024458877742290497,
       "learning_rate": 2.479389688692014e-05,
+      "loss": 0.0002,
       "step": 5000
     },
     {
       "epoch": 5.06423034330011,
+      "grad_norm": 0.00314136128872633,
       "learning_rate": 2.4178663713547438e-05,
+      "loss": 0.0001,
       "step": 5100
     },
     {
       "epoch": 5.075304540420819,
+      "grad_norm": 0.0019707216415554285,
       "learning_rate": 2.3563430540174727e-05,
+      "loss": 0.0001,
       "step": 5200
     },
     {
       "epoch": 5.086378737541528,
+      "grad_norm": 0.0017920031677931547,
       "learning_rate": 2.2948197366802017e-05,
+      "loss": 0.0001,
       "step": 5300
     },
     {
       "epoch": 5.097452934662237,
+      "grad_norm": 0.008118866011500359,
       "learning_rate": 2.233296419342931e-05,
+      "loss": 0.0043,
       "step": 5400
     },
     {
       "epoch": 5.100110741971207,
+      "eval_accuracy": 0.9912826899128269,
+      "eval_loss": 0.027965275570750237,
+      "eval_runtime": 213.2679,
+      "eval_samples_per_second": 3.765,
+      "eval_steps_per_second": 0.474,
       "step": 5424
     },
     {
       "epoch": 6.008416389811739,
+      "grad_norm": 0.01948702521622181,
       "learning_rate": 2.1717731020056604e-05,
+      "loss": 0.0021,
       "step": 5500
     },
     {
       "epoch": 6.019490586932448,
+      "grad_norm": 0.005027715116739273,
       "learning_rate": 2.1102497846683894e-05,
+      "loss": 0.0018,
       "step": 5600
     },
     {
       "epoch": 6.030564784053156,
+      "grad_norm": 0.8039076924324036,
       "learning_rate": 2.0487264673311183e-05,
+      "loss": 0.0125,
       "step": 5700
     },
     {
       "epoch": 6.041638981173865,
+      "grad_norm": 0.007823876105248928,
       "learning_rate": 1.987203149993848e-05,
+      "loss": 0.0164,
       "step": 5800
     },
     {
       "epoch": 6.052713178294574,
+      "grad_norm": 0.020579500123858452,
       "learning_rate": 1.925679832656577e-05,
+      "loss": 0.0059,
       "step": 5900
     },
     {
       "epoch": 6.0637873754152825,
+      "grad_norm": 0.003875893075019121,
       "learning_rate": 1.864156515319306e-05,
+      "loss": 0.0004,
       "step": 6000
     },
     {
       "epoch": 6.074861572535991,
+      "grad_norm": 0.009862402454018593,
       "learning_rate": 1.8026331979820353e-05,
+      "loss": 0.0058,
       "step": 6100
     },
     {
       "epoch": 6.0859357696567,
+      "grad_norm": 0.005517066456377506,
       "learning_rate": 1.7411098806447646e-05,
+      "loss": 0.0004,
       "step": 6200
     },
     {
       "epoch": 6.097009966777408,
+      "grad_norm": 0.007121366914361715,
       "learning_rate": 1.6795865633074936e-05,
+      "loss": 0.0002,
       "step": 6300
     },
     {
       "epoch": 6.100110741971207,
       "eval_accuracy": 0.9975093399750934,
+      "eval_loss": 0.009998604655265808,
+      "eval_runtime": 204.2684,
+      "eval_samples_per_second": 3.931,
+      "eval_steps_per_second": 0.494,
       "step": 6328
     },
     {
       "epoch": 7.00797342192691,
+      "grad_norm": 0.005023865960538387,
       "learning_rate": 1.6180632459702226e-05,
+      "loss": 0.0002,
       "step": 6400
     },
     {
       "epoch": 7.019047619047619,
+      "grad_norm": 0.001879742369055748,
       "learning_rate": 1.556539928632952e-05,
+      "loss": 0.0002,
       "step": 6500
     },
     {
       "epoch": 7.030121816168328,
+      "grad_norm": 0.003781010629609227,
       "learning_rate": 1.4950166112956812e-05,
+      "loss": 0.005,
       "step": 6600
     },
     {
       "epoch": 7.041196013289037,
+      "grad_norm": 0.025241386145353317,
       "learning_rate": 1.4334932939584104e-05,
+      "loss": 0.0005,
       "step": 6700
     },
     {
       "epoch": 7.052270210409746,
+      "grad_norm": 0.0018404372967779636,
       "learning_rate": 1.3719699766211393e-05,
+      "loss": 0.0002,
       "step": 6800
     },
     {
       "epoch": 7.063344407530454,
+      "grad_norm": 0.004017640370875597,
       "learning_rate": 1.3104466592838688e-05,
+      "loss": 0.0005,
       "step": 6900
     },
     {
       "epoch": 7.074418604651163,
+      "grad_norm": 0.0032308073714375496,
       "learning_rate": 1.2489233419465978e-05,
+      "loss": 0.0004,
       "step": 7000
     },
     {
       "epoch": 7.0854928017718715,
+      "grad_norm": 0.0011970199411734939,
       "learning_rate": 1.187400024609327e-05,
+      "loss": 0.0002,
       "step": 7100
     },
     {
       "epoch": 7.09656699889258,
+      "grad_norm": 0.0023619933053851128,
       "learning_rate": 1.1258767072720563e-05,
       "loss": 0.0001,
       "step": 7200
     },
     {
       "epoch": 7.100110741971207,
+      "eval_accuracy": 0.9987546699875467,
+      "eval_loss": 0.0030333329923450947,
+      "eval_runtime": 201.1888,
+      "eval_samples_per_second": 3.991,
+      "eval_steps_per_second": 0.502,
       "step": 7232
     },
     {
       "epoch": 8.007530454042081,
+      "grad_norm": 0.0018289505969733,
       "learning_rate": 1.0643533899347853e-05,
       "loss": 0.0001,
       "step": 7300
     },
     {
       "epoch": 8.018604651162791,
+      "grad_norm": 0.01480843871831894,
       "learning_rate": 1.0028300725975146e-05,
       "loss": 0.0001,
       "step": 7400
     },
     {
       "epoch": 8.029678848283499,
+      "grad_norm": 0.0018123927293345332,
       "learning_rate": 9.413067552602436e-06,
       "loss": 0.0001,
       "step": 7500
     },
     {
       "epoch": 8.040753045404209,
+      "grad_norm": 0.0014256143476814032,
       "learning_rate": 8.797834379229729e-06,
       "loss": 0.0001,
       "step": 7600
     },
     {
       "epoch": 8.051827242524917,
+      "grad_norm": 0.0011715757427737117,
       "learning_rate": 8.18260120585702e-06,
       "loss": 0.0001,
       "step": 7700
     },
     {
       "epoch": 8.062901439645625,
+      "grad_norm": 0.002099097240716219,
       "learning_rate": 7.567368032484312e-06,
       "loss": 0.0001,
       "step": 7800
     },
     {
       "epoch": 8.073975636766335,
+      "grad_norm": 0.000933408213313669,
       "learning_rate": 6.952134859111603e-06,
       "loss": 0.0001,
       "step": 7900
     },
     {
       "epoch": 8.085049833887043,
+      "grad_norm": 0.0009701464441604912,
       "learning_rate": 6.336901685738895e-06,
       "loss": 0.0001,
       "step": 8000
     },
     {
       "epoch": 8.096124031007752,
+      "grad_norm": 0.001506564673036337,
       "learning_rate": 5.7216685123661875e-06,
       "loss": 0.0001,
       "step": 8100
     },
     {
       "epoch": 8.100110741971207,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.002309577539563179,
+      "eval_runtime": 208.0157,
+      "eval_samples_per_second": 3.86,
+      "eval_steps_per_second": 0.486,
       "step": 8136
     },
     {
       "epoch": 9.007087486157253,
+      "grad_norm": 0.0019045774824917316,
       "learning_rate": 5.106435338993479e-06,
       "loss": 0.0001,
       "step": 8200
     },
     {
       "epoch": 9.018161683277963,
+      "grad_norm": 0.0013489355333149433,
       "learning_rate": 4.4912021656207705e-06,
       "loss": 0.0001,
       "step": 8300
     },
     {
       "epoch": 9.029235880398671,
+      "grad_norm": 0.0015209962148219347,
       "learning_rate": 3.875968992248062e-06,
       "loss": 0.0001,
       "step": 8400
     },
     {
       "epoch": 9.04031007751938,
+      "grad_norm": 0.0016524152597412467,
       "learning_rate": 3.260735818875354e-06,
       "loss": 0.0001,
       "step": 8500
     },
     {
       "epoch": 9.051384274640089,
+      "grad_norm": 0.0015727116260677576,
       "learning_rate": 2.6455026455026455e-06,
       "loss": 0.0001,
       "step": 8600
     },
     {
       "epoch": 9.062458471760797,
+      "grad_norm": 0.002659299410879612,
       "learning_rate": 2.0302694721299375e-06,
       "loss": 0.0001,
       "step": 8700
     },
     {
       "epoch": 9.073532668881507,
+      "grad_norm": 0.00093603425193578,
       "learning_rate": 1.415036298757229e-06,
       "loss": 0.0001,
       "step": 8800
     },
     {
       "epoch": 9.084606866002215,
+      "grad_norm": 0.001421812572516501,
       "learning_rate": 7.998031253845208e-07,
       "loss": 0.0001,
       "step": 8900
     },
     {
       "epoch": 9.095681063122923,
+      "grad_norm": 0.001551046734675765,
       "learning_rate": 1.8456995201181249e-07,
       "loss": 0.0001,
       "step": 9000
     },
     {
       "epoch": 9.099003322259136,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.002318102866411209,
+      "eval_runtime": 200.8195,
+      "eval_samples_per_second": 3.999,
+      "eval_steps_per_second": 0.503,
       "step": 9030
     },
     {
       "epoch": 9.099003322259136,
       "step": 9030,
       "total_flos": 6.328460909097596e+19,
+      "train_loss": 0.18933373247551735,
+      "train_runtime": 25561.7958,
+      "train_samples_per_second": 2.826,
+      "train_steps_per_second": 0.353
     },
     {
       "epoch": 9.099003322259136,
+      "eval_accuracy": 0.7774294670846394,
+      "eval_loss": 0.7984064817428589,
+      "eval_runtime": 302.1425,
+      "eval_samples_per_second": 4.223,
+      "eval_steps_per_second": 0.53,
       "step": 9030
     }
   ],