End of training

Browse files

Files changed (7) hide show

README.md +12 -12
all_results.json +5 -5
confusion_matrix_test_fold_3.png +0 -0
confusion_matrix_valid_fold_3.png +0 -0
model.safetensors +1 -1
test_results.json +5 -5
trainer_state.json +200 -200

README.md CHANGED Viewed

@@ -18,8 +18,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [facebook/timesformer-base-finetuned-k400](https://huggingface.co/facebook/timesformer-base-finetuned-k400) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.7324
-- Accuracy: 0.7868
 ## Model description
@@ -51,16 +51,16 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy |
 |:-------------:|:------:|:----:|:---------------:|:--------:|
-| 0.2094        | 0.1001 | 904  | 0.1862          | 0.9676   |
-| 0.0148        | 1.1001 | 1808 | 0.0287          | 0.9913   |
-| 0.013         | 2.1001 | 2712 | 0.0247          | 0.9963   |
-| 0.0092        | 3.1001 | 3616 | 0.0133          | 0.9988   |
-| 0.0003        | 4.1001 | 4520 | 0.0111          | 0.9988   |
-| 0.0002        | 5.1001 | 5424 | 0.0138          | 0.9988   |
-| 0.0001        | 6.1001 | 6328 | 0.0142          | 0.9988   |
-| 0.0001        | 7.1001 | 7232 | 0.0143          | 0.9988   |
-| 0.0001        | 8.1001 | 8136 | 0.0144          | 0.9988   |
-| 0.0001        | 9.0990 | 9030 | 0.0144          | 0.9988   |
 ### Framework versions

 This model is a fine-tuned version of [facebook/timesformer-base-finetuned-k400](https://huggingface.co/facebook/timesformer-base-finetuned-k400) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.8547
+- Accuracy: 0.7665
 ## Model description
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy |
 |:-------------:|:------:|:----:|:---------------:|:--------:|
+| 0.2384        | 0.1001 | 904  | 0.2019          | 0.9639   |
+| 0.0207        | 1.1001 | 1808 | 0.0325          | 0.9900   |
+| 0.0116        | 2.1001 | 2712 | 0.0229          | 0.9963   |
+| 0.0017        | 3.1001 | 3616 | 0.0222          | 0.9950   |
+| 0.0156        | 4.1001 | 4520 | 0.0402          | 0.9900   |
+| 0.0002        | 5.1001 | 5424 | 0.0083          | 0.9975   |
+| 0.0001        | 6.1001 | 6328 | 0.0088          | 0.9975   |
+| 0.0001        | 7.1001 | 7232 | 0.0094          | 0.9975   |
+| 0.0001        | 8.1001 | 8136 | 0.0097          | 0.9975   |
+| 0.0001        | 9.0990 | 9030 | 0.0098          | 0.9975   |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 9.099003322259136,
-    "eval_accuracy": 0.786833855799373,
-    "eval_loss": 0.7324321866035461,
-    "eval_runtime": 466.9382,
-    "eval_samples_per_second": 2.733,
-    "eval_steps_per_second": 0.343
 }

 {
     "epoch": 9.099003322259136,
+    "eval_accuracy": 0.7664576802507836,
+    "eval_loss": 0.8547028303146362,
+    "eval_runtime": 304.3291,
+    "eval_samples_per_second": 4.193,
+    "eval_steps_per_second": 0.526
 }

confusion_matrix_test_fold_3.png ADDED Viewed

confusion_matrix_valid_fold_3.png ADDED Viewed

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bb470187a83ffe3c3b39648b83f147be196b17920fb192e45ea4169441d33ebe
 size 485250680

 version https://git-lfs.github.com/spec/v1
+oid sha256:a92405eb1a2048bc73411fe4a8f83de063bcb7ea17e092cef106be338573e70d
 size 485250680

test_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 9.099003322259136,
-    "eval_accuracy": 0.786833855799373,
-    "eval_loss": 0.7324321866035461,
-    "eval_runtime": 466.9382,
-    "eval_samples_per_second": 2.733,
-    "eval_steps_per_second": 0.343
 }

 {
     "epoch": 9.099003322259136,
+    "eval_accuracy": 0.7664576802507836,
+    "eval_loss": 0.8547028303146362,
+    "eval_runtime": 304.3291,
+    "eval_samples_per_second": 4.193,
+    "eval_steps_per_second": 0.526
 }

trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.9987546699875467,
-  "best_model_checkpoint": "/media/cse/HDD/Shawon/shawon/10 fold timesformer/Timesformer_default_fold_10_10_epoch_noAug_batch8/checkpoint-3616",
   "epoch": 9.099003322259136,
   "eval_steps": 500,
   "global_step": 9030,
@@ -10,740 +10,740 @@
   "log_history": [
     {
       "epoch": 0.01107419712070875,
-      "grad_norm": 12.277300834655762,
       "learning_rate": 5.537098560354375e-06,
-      "loss": 4.1981,
       "step": 100
     },
     {
       "epoch": 0.0221483942414175,
-      "grad_norm": 13.852692604064941,
       "learning_rate": 1.107419712070875e-05,
-      "loss": 3.8197,
       "step": 200
     },
     {
       "epoch": 0.03322259136212625,
-      "grad_norm": 16.045228958129883,
       "learning_rate": 1.6611295681063124e-05,
-      "loss": 2.9761,
       "step": 300
     },
     {
       "epoch": 0.044296788482835,
-      "grad_norm": 12.293411254882812,
       "learning_rate": 2.21483942414175e-05,
-      "loss": 2.068,
       "step": 400
     },
     {
       "epoch": 0.05537098560354374,
-      "grad_norm": 13.963603019714355,
       "learning_rate": 2.7685492801771873e-05,
-      "loss": 1.2657,
       "step": 500
     },
     {
       "epoch": 0.0664451827242525,
-      "grad_norm": 9.983071327209473,
       "learning_rate": 3.322259136212625e-05,
-      "loss": 0.8121,
       "step": 600
     },
     {
       "epoch": 0.07751937984496124,
-      "grad_norm": 9.858047485351562,
       "learning_rate": 3.875968992248062e-05,
-      "loss": 0.4991,
       "step": 700
     },
     {
       "epoch": 0.08859357696567,
-      "grad_norm": 4.425586223602295,
       "learning_rate": 4.4296788482835e-05,
-      "loss": 0.2899,
       "step": 800
     },
     {
       "epoch": 0.09966777408637874,
-      "grad_norm": 9.35398006439209,
       "learning_rate": 4.983388704318937e-05,
-      "loss": 0.2094,
       "step": 900
     },
     {
       "epoch": 0.10011074197120709,
-      "eval_accuracy": 0.9676214196762142,
-      "eval_loss": 0.1862427294254303,
-      "eval_runtime": 254.6757,
-      "eval_samples_per_second": 3.153,
-      "eval_steps_per_second": 0.397,
       "step": 904
     },
     {
       "epoch": 1.0106312292358803,
-      "grad_norm": 4.818030834197998,
       "learning_rate": 4.940322382182848e-05,
-      "loss": 0.1397,
       "step": 1000
     },
     {
       "epoch": 1.0217054263565892,
-      "grad_norm": 0.25109994411468506,
       "learning_rate": 4.878799064845577e-05,
-      "loss": 0.0963,
       "step": 1100
     },
     {
       "epoch": 1.032779623477298,
-      "grad_norm": 1.5516589879989624,
       "learning_rate": 4.8172757475083056e-05,
-      "loss": 0.0711,
       "step": 1200
     },
     {
       "epoch": 1.0438538205980066,
-      "grad_norm": 6.34712553024292,
       "learning_rate": 4.755752430171035e-05,
-      "loss": 0.0844,
       "step": 1300
     },
     {
       "epoch": 1.0549280177187155,
-      "grad_norm": 0.4094001352787018,
       "learning_rate": 4.694229112833764e-05,
-      "loss": 0.0452,
       "step": 1400
     },
     {
       "epoch": 1.0660022148394241,
-      "grad_norm": 0.5541088581085205,
       "learning_rate": 4.6327057954964936e-05,
-      "loss": 0.0554,
       "step": 1500
     },
     {
       "epoch": 1.0770764119601328,
-      "grad_norm": 0.06750523298978806,
       "learning_rate": 4.571182478159223e-05,
-      "loss": 0.027,
       "step": 1600
     },
     {
       "epoch": 1.0881506090808417,
-      "grad_norm": 0.0328923799097538,
       "learning_rate": 4.5096591608219516e-05,
-      "loss": 0.0283,
       "step": 1700
     },
     {
       "epoch": 1.0992248062015504,
-      "grad_norm": 0.020282607525587082,
       "learning_rate": 4.448135843484681e-05,
-      "loss": 0.0148,
       "step": 1800
     },
     {
       "epoch": 1.100110741971207,
-      "eval_accuracy": 0.9912826899128269,
-      "eval_loss": 0.02874130941927433,
-      "eval_runtime": 268.3856,
-      "eval_samples_per_second": 2.992,
-      "eval_steps_per_second": 0.376,
       "step": 1808
     },
     {
       "epoch": 2.010188261351052,
-      "grad_norm": 0.013696623966097832,
       "learning_rate": 4.38661252614741e-05,
-      "loss": 0.0125,
       "step": 1900
     },
     {
       "epoch": 2.0212624584717607,
-      "grad_norm": 0.02626732923090458,
       "learning_rate": 4.325089208810139e-05,
-      "loss": 0.0016,
       "step": 2000
     },
     {
       "epoch": 2.0323366555924696,
-      "grad_norm": 0.021943334490060806,
       "learning_rate": 4.263565891472868e-05,
-      "loss": 0.0028,
       "step": 2100
     },
     {
       "epoch": 2.0434108527131785,
-      "grad_norm": 0.8382033109664917,
       "learning_rate": 4.2020425741355975e-05,
-      "loss": 0.0286,
       "step": 2200
     },
     {
       "epoch": 2.054485049833887,
-      "grad_norm": 0.06917964667081833,
       "learning_rate": 4.140519256798327e-05,
-      "loss": 0.0148,
       "step": 2300
     },
     {
       "epoch": 2.065559246954596,
-      "grad_norm": 0.0369587242603302,
       "learning_rate": 4.078995939461056e-05,
-      "loss": 0.0137,
       "step": 2400
     },
     {
       "epoch": 2.0766334440753047,
-      "grad_norm": 0.009241752326488495,
       "learning_rate": 4.0174726221237855e-05,
-      "loss": 0.0111,
       "step": 2500
     },
     {
       "epoch": 2.087707641196013,
-      "grad_norm": 0.023627281188964844,
       "learning_rate": 3.955949304786514e-05,
-      "loss": 0.0074,
       "step": 2600
     },
     {
       "epoch": 2.098781838316722,
-      "grad_norm": 0.014712699688971043,
       "learning_rate": 3.8944259874492434e-05,
-      "loss": 0.013,
       "step": 2700
     },
     {
       "epoch": 2.100110741971207,
       "eval_accuracy": 0.9962640099626401,
-      "eval_loss": 0.0246839988976717,
-      "eval_runtime": 282.3356,
-      "eval_samples_per_second": 2.844,
-      "eval_steps_per_second": 0.358,
       "step": 2712
     },
     {
       "epoch": 3.009745293466224,
-      "grad_norm": 0.016267647966742516,
       "learning_rate": 3.832902670111973e-05,
-      "loss": 0.0011,
       "step": 2800
     },
     {
       "epoch": 3.0208194905869323,
-      "grad_norm": 0.017402295023202896,
       "learning_rate": 3.7713793527747014e-05,
-      "loss": 0.0056,
       "step": 2900
     },
     {
       "epoch": 3.0318936877076412,
-      "grad_norm": 0.011280537582933903,
       "learning_rate": 3.7098560354374314e-05,
-      "loss": 0.0326,
       "step": 3000
     },
     {
       "epoch": 3.04296788482835,
-      "grad_norm": 0.021694917231798172,
       "learning_rate": 3.64833271810016e-05,
-      "loss": 0.0096,
       "step": 3100
     },
     {
       "epoch": 3.0540420819490586,
-      "grad_norm": 0.038911569863557816,
       "learning_rate": 3.5868094007628894e-05,
-      "loss": 0.0182,
       "step": 3200
     },
     {
       "epoch": 3.0651162790697675,
-      "grad_norm": 0.008056244812905788,
       "learning_rate": 3.525286083425619e-05,
-      "loss": 0.0062,
       "step": 3300
     },
     {
       "epoch": 3.0761904761904764,
-      "grad_norm": 0.05477767437696457,
       "learning_rate": 3.463762766088347e-05,
-      "loss": 0.0108,
       "step": 3400
     },
     {
       "epoch": 3.087264673311185,
-      "grad_norm": 0.025373445823788643,
       "learning_rate": 3.4022394487510767e-05,
-      "loss": 0.0092,
       "step": 3500
     },
     {
       "epoch": 3.0983388704318937,
-      "grad_norm": 0.005799598526209593,
       "learning_rate": 3.340716131413806e-05,
-      "loss": 0.0092,
       "step": 3600
     },
     {
       "epoch": 3.100110741971207,
-      "eval_accuracy": 0.9987546699875467,
-      "eval_loss": 0.013343892991542816,
-      "eval_runtime": 190.8463,
-      "eval_samples_per_second": 4.208,
-      "eval_steps_per_second": 0.529,
       "step": 3616
     },
     {
       "epoch": 4.0093023255813955,
-      "grad_norm": 0.004197492729872465,
       "learning_rate": 3.2791928140765346e-05,
       "loss": 0.0005,
       "step": 3700
     },
     {
       "epoch": 4.020376522702104,
-      "grad_norm": 0.004163427744060755,
       "learning_rate": 3.2176694967392646e-05,
-      "loss": 0.0003,
       "step": 3800
     },
     {
       "epoch": 4.0314507198228124,
-      "grad_norm": 0.006535384338349104,
       "learning_rate": 3.156146179401994e-05,
       "loss": 0.0003,
       "step": 3900
     },
     {
       "epoch": 4.042524916943521,
-      "grad_norm": 0.0030044761952012777,
       "learning_rate": 3.0946228620647226e-05,
-      "loss": 0.0003,
       "step": 4000
     },
     {
       "epoch": 4.05359911406423,
-      "grad_norm": 0.0030457417014986277,
       "learning_rate": 3.033099544727452e-05,
-      "loss": 0.0002,
       "step": 4100
     },
     {
       "epoch": 4.064673311184939,
-      "grad_norm": 0.00839043315500021,
       "learning_rate": 2.971576227390181e-05,
-      "loss": 0.011,
       "step": 4200
     },
     {
       "epoch": 4.075747508305648,
-      "grad_norm": 0.0101741598919034,
       "learning_rate": 2.91005291005291e-05,
-      "loss": 0.0045,
       "step": 4300
     },
     {
       "epoch": 4.086821705426357,
-      "grad_norm": 0.0031424041371792555,
       "learning_rate": 2.8485295927156392e-05,
-      "loss": 0.0006,
       "step": 4400
     },
     {
       "epoch": 4.097895902547065,
-      "grad_norm": 0.0021799150854349136,
       "learning_rate": 2.787006275378369e-05,
-      "loss": 0.0003,
       "step": 4500
     },
     {
       "epoch": 4.100110741971207,
-      "eval_accuracy": 0.9987546699875467,
-      "eval_loss": 0.01112725306302309,
-      "eval_runtime": 187.0791,
-      "eval_samples_per_second": 4.292,
-      "eval_steps_per_second": 0.54,
       "step": 4520
     },
     {
       "epoch": 5.008859357696567,
-      "grad_norm": 0.0032888855785131454,
       "learning_rate": 2.725482958041098e-05,
-      "loss": 0.0002,
       "step": 4600
     },
     {
       "epoch": 5.019933554817276,
-      "grad_norm": 0.0020696651190519333,
       "learning_rate": 2.6639596407038268e-05,
-      "loss": 0.0002,
       "step": 4700
     },
     {
       "epoch": 5.0310077519379846,
-      "grad_norm": 0.008721988648176193,
       "learning_rate": 2.602436323366556e-05,
-      "loss": 0.0141,
       "step": 4800
     },
     {
       "epoch": 5.0420819490586934,
-      "grad_norm": 0.004613637924194336,
       "learning_rate": 2.540913006029285e-05,
-      "loss": 0.0008,
       "step": 4900
     },
     {
       "epoch": 5.053156146179402,
-      "grad_norm": 0.013342674821615219,
       "learning_rate": 2.479389688692014e-05,
-      "loss": 0.0052,
       "step": 5000
     },
     {
       "epoch": 5.06423034330011,
-      "grad_norm": 0.008498313836753368,
       "learning_rate": 2.4178663713547438e-05,
-      "loss": 0.0003,
       "step": 5100
     },
     {
       "epoch": 5.075304540420819,
-      "grad_norm": 0.004820178262889385,
       "learning_rate": 2.3563430540174727e-05,
-      "loss": 0.0002,
       "step": 5200
     },
     {
       "epoch": 5.086378737541528,
-      "grad_norm": 0.0017530409386381507,
       "learning_rate": 2.2948197366802017e-05,
       "loss": 0.0002,
       "step": 5300
     },
     {
       "epoch": 5.097452934662237,
-      "grad_norm": 0.0029693867545574903,
       "learning_rate": 2.233296419342931e-05,
       "loss": 0.0002,
       "step": 5400
     },
     {
       "epoch": 5.100110741971207,
-      "eval_accuracy": 0.9987546699875467,
-      "eval_loss": 0.01381352636963129,
-      "eval_runtime": 190.9557,
-      "eval_samples_per_second": 4.205,
-      "eval_steps_per_second": 0.529,
       "step": 5424
     },
     {
       "epoch": 6.008416389811739,
-      "grad_norm": 0.0020572063513100147,
       "learning_rate": 2.1717731020056604e-05,
       "loss": 0.0002,
       "step": 5500
     },
     {
       "epoch": 6.019490586932448,
-      "grad_norm": 0.0013224915601313114,
       "learning_rate": 2.1102497846683894e-05,
       "loss": 0.0001,
       "step": 5600
     },
     {
       "epoch": 6.030564784053156,
-      "grad_norm": 0.0022878097370266914,
       "learning_rate": 2.0487264673311183e-05,
       "loss": 0.0001,
       "step": 5700
     },
     {
       "epoch": 6.041638981173865,
-      "grad_norm": 0.001476996229030192,
       "learning_rate": 1.987203149993848e-05,
       "loss": 0.0001,
       "step": 5800
     },
     {
       "epoch": 6.052713178294574,
-      "grad_norm": 0.001298259710893035,
       "learning_rate": 1.925679832656577e-05,
       "loss": 0.0001,
       "step": 5900
     },
     {
       "epoch": 6.0637873754152825,
-      "grad_norm": 0.0013261692365631461,
       "learning_rate": 1.864156515319306e-05,
       "loss": 0.0001,
       "step": 6000
     },
     {
       "epoch": 6.074861572535991,
-      "grad_norm": 0.001477518817409873,
       "learning_rate": 1.8026331979820353e-05,
       "loss": 0.0001,
       "step": 6100
     },
     {
       "epoch": 6.0859357696567,
-      "grad_norm": 0.00216505816206336,
       "learning_rate": 1.7411098806447646e-05,
       "loss": 0.0001,
       "step": 6200
     },
     {
       "epoch": 6.097009966777408,
-      "grad_norm": 0.0018889505881816149,
       "learning_rate": 1.6795865633074936e-05,
       "loss": 0.0001,
       "step": 6300
     },
     {
       "epoch": 6.100110741971207,
-      "eval_accuracy": 0.9987546699875467,
-      "eval_loss": 0.014198515564203262,
-      "eval_runtime": 183.8325,
-      "eval_samples_per_second": 4.368,
-      "eval_steps_per_second": 0.549,
       "step": 6328
     },
     {
       "epoch": 7.00797342192691,
-      "grad_norm": 0.0011213194811716676,
       "learning_rate": 1.6180632459702226e-05,
       "loss": 0.0001,
       "step": 6400
     },
     {
       "epoch": 7.019047619047619,
-      "grad_norm": 0.0013905749656260014,
       "learning_rate": 1.556539928632952e-05,
       "loss": 0.0001,
       "step": 6500
     },
     {
       "epoch": 7.030121816168328,
-      "grad_norm": 0.0012657454935833812,
       "learning_rate": 1.4950166112956812e-05,
       "loss": 0.0001,
       "step": 6600
     },
     {
       "epoch": 7.041196013289037,
-      "grad_norm": 0.0014162349980324507,
       "learning_rate": 1.4334932939584104e-05,
       "loss": 0.0001,
       "step": 6700
     },
     {
       "epoch": 7.052270210409746,
-      "grad_norm": 0.0011958391405642033,
       "learning_rate": 1.3719699766211393e-05,
       "loss": 0.0001,
       "step": 6800
     },
     {
       "epoch": 7.063344407530454,
-      "grad_norm": 0.0014284063363447785,
       "learning_rate": 1.3104466592838688e-05,
       "loss": 0.0001,
       "step": 6900
     },
     {
       "epoch": 7.074418604651163,
-      "grad_norm": 0.003346965415403247,
       "learning_rate": 1.2489233419465978e-05,
       "loss": 0.0001,
       "step": 7000
     },
     {
       "epoch": 7.0854928017718715,
-      "grad_norm": 0.0008867617580108345,
       "learning_rate": 1.187400024609327e-05,
       "loss": 0.0001,
       "step": 7100
     },
     {
       "epoch": 7.09656699889258,
-      "grad_norm": 0.0012929540826007724,
       "learning_rate": 1.1258767072720563e-05,
       "loss": 0.0001,
       "step": 7200
     },
     {
       "epoch": 7.100110741971207,
-      "eval_accuracy": 0.9987546699875467,
-      "eval_loss": 0.014337223954498768,
-      "eval_runtime": 191.8755,
-      "eval_samples_per_second": 4.185,
-      "eval_steps_per_second": 0.526,
       "step": 7232
     },
     {
       "epoch": 8.007530454042081,
-      "grad_norm": 0.0015993459383025765,
       "learning_rate": 1.0643533899347853e-05,
       "loss": 0.0001,
       "step": 7300
     },
     {
       "epoch": 8.018604651162791,
-      "grad_norm": 0.0008497968083247542,
       "learning_rate": 1.0028300725975146e-05,
       "loss": 0.0001,
       "step": 7400
     },
     {
       "epoch": 8.029678848283499,
-      "grad_norm": 0.0010410414543002844,
       "learning_rate": 9.413067552602436e-06,
       "loss": 0.0001,
       "step": 7500
     },
     {
       "epoch": 8.040753045404209,
-      "grad_norm": 0.0010427006054669619,
       "learning_rate": 8.797834379229729e-06,
       "loss": 0.0001,
       "step": 7600
     },
     {
       "epoch": 8.051827242524917,
-      "grad_norm": 0.0008805838297121227,
       "learning_rate": 8.18260120585702e-06,
       "loss": 0.0001,
       "step": 7700
     },
     {
       "epoch": 8.062901439645625,
-      "grad_norm": 0.0008669462986290455,
       "learning_rate": 7.567368032484312e-06,
       "loss": 0.0001,
       "step": 7800
     },
     {
       "epoch": 8.073975636766335,
-      "grad_norm": 0.0008293281425721943,
       "learning_rate": 6.952134859111603e-06,
       "loss": 0.0001,
       "step": 7900
     },
     {
       "epoch": 8.085049833887043,
-      "grad_norm": 0.0006111183320172131,
       "learning_rate": 6.336901685738895e-06,
       "loss": 0.0001,
       "step": 8000
     },
     {
       "epoch": 8.096124031007752,
-      "grad_norm": 0.000657613156363368,
       "learning_rate": 5.7216685123661875e-06,
       "loss": 0.0001,
       "step": 8100
     },
     {
       "epoch": 8.100110741971207,
-      "eval_accuracy": 0.9987546699875467,
-      "eval_loss": 0.014379492029547691,
-      "eval_runtime": 202.2981,
-      "eval_samples_per_second": 3.969,
-      "eval_steps_per_second": 0.499,
       "step": 8136
     },
     {
       "epoch": 9.007087486157253,
-      "grad_norm": 0.0013073045993223786,
       "learning_rate": 5.106435338993479e-06,
       "loss": 0.0001,
       "step": 8200
     },
     {
       "epoch": 9.018161683277963,
-      "grad_norm": 0.0009112409316003323,
       "learning_rate": 4.4912021656207705e-06,
       "loss": 0.0001,
       "step": 8300
     },
     {
       "epoch": 9.029235880398671,
-      "grad_norm": 0.0008883228874765337,
       "learning_rate": 3.875968992248062e-06,
       "loss": 0.0001,
       "step": 8400
     },
     {
       "epoch": 9.04031007751938,
-      "grad_norm": 0.0008643298642709851,
       "learning_rate": 3.260735818875354e-06,
       "loss": 0.0001,
       "step": 8500
     },
     {
       "epoch": 9.051384274640089,
-      "grad_norm": 0.0008729179389774799,
       "learning_rate": 2.6455026455026455e-06,
       "loss": 0.0001,
       "step": 8600
     },
     {
       "epoch": 9.062458471760797,
-      "grad_norm": 0.0009373608627356589,
       "learning_rate": 2.0302694721299375e-06,
       "loss": 0.0001,
       "step": 8700
     },
     {
       "epoch": 9.073532668881507,
-      "grad_norm": 0.000793347368016839,
       "learning_rate": 1.415036298757229e-06,
       "loss": 0.0001,
       "step": 8800
     },
     {
       "epoch": 9.084606866002215,
-      "grad_norm": 0.0008423990220762789,
       "learning_rate": 7.998031253845208e-07,
       "loss": 0.0001,
       "step": 8900
     },
     {
       "epoch": 9.095681063122923,
-      "grad_norm": 0.000606866495218128,
       "learning_rate": 1.8456995201181249e-07,
       "loss": 0.0001,
       "step": 9000
     },
     {
       "epoch": 9.099003322259136,
-      "eval_accuracy": 0.9987546699875467,
-      "eval_loss": 0.014405355788767338,
-      "eval_runtime": 197.2284,
-      "eval_samples_per_second": 4.071,
-      "eval_steps_per_second": 0.512,
       "step": 9030
     },
     {
       "epoch": 9.099003322259136,
       "step": 9030,
       "total_flos": 6.328460909097596e+19,
-      "train_loss": 0.18771534425460198,
-      "train_runtime": 26926.0352,
-      "train_samples_per_second": 2.683,
-      "train_steps_per_second": 0.335
     },
     {
       "epoch": 9.099003322259136,
-      "eval_accuracy": 0.786833855799373,
-      "eval_loss": 0.7324321866035461,
-      "eval_runtime": 466.9382,
-      "eval_samples_per_second": 2.733,
-      "eval_steps_per_second": 0.343,
       "step": 9030
     }
   ],

 {
+  "best_metric": 0.9975093399750934,
+  "best_model_checkpoint": "/media/cse/HDD/Shawon/shawon/10 fold timesformer/Timesformer_default_fold_10_10_epoch_noAug_batch8/checkpoint-5424",
   "epoch": 9.099003322259136,
   "eval_steps": 500,
   "global_step": 9030,
   "log_history": [
     {
       "epoch": 0.01107419712070875,
+      "grad_norm": 12.339608192443848,
       "learning_rate": 5.537098560354375e-06,
+      "loss": 4.1774,
       "step": 100
     },
     {
       "epoch": 0.0221483942414175,
+      "grad_norm": 14.543400764465332,
       "learning_rate": 1.107419712070875e-05,
+      "loss": 3.8205,
       "step": 200
     },
     {
       "epoch": 0.03322259136212625,
+      "grad_norm": 15.178791046142578,
       "learning_rate": 1.6611295681063124e-05,
+      "loss": 2.9812,
       "step": 300
     },
     {
       "epoch": 0.044296788482835,
+      "grad_norm": 12.90939712524414,
       "learning_rate": 2.21483942414175e-05,
+      "loss": 2.072,
       "step": 400
     },
     {
       "epoch": 0.05537098560354374,
+      "grad_norm": 12.425464630126953,
       "learning_rate": 2.7685492801771873e-05,
+      "loss": 1.265,
       "step": 500
     },
     {
       "epoch": 0.0664451827242525,
+      "grad_norm": 7.096066474914551,
       "learning_rate": 3.322259136212625e-05,
+      "loss": 0.8079,
       "step": 600
     },
     {
       "epoch": 0.07751937984496124,
+      "grad_norm": 9.374312400817871,
       "learning_rate": 3.875968992248062e-05,
+      "loss": 0.4583,
       "step": 700
     },
     {
       "epoch": 0.08859357696567,
+      "grad_norm": 2.866607904434204,
       "learning_rate": 4.4296788482835e-05,
+      "loss": 0.2863,
       "step": 800
     },
     {
       "epoch": 0.09966777408637874,
+      "grad_norm": 9.150209426879883,
       "learning_rate": 4.983388704318937e-05,
+      "loss": 0.2384,
       "step": 900
     },
     {
       "epoch": 0.10011074197120709,
+      "eval_accuracy": 0.9638854296388543,
+      "eval_loss": 0.20189498364925385,
+      "eval_runtime": 306.3851,
+      "eval_samples_per_second": 2.621,
+      "eval_steps_per_second": 0.33,
       "step": 904
     },
     {
       "epoch": 1.0106312292358803,
+      "grad_norm": 0.4338759779930115,
       "learning_rate": 4.940322382182848e-05,
+      "loss": 0.1309,
       "step": 1000
     },
     {
       "epoch": 1.0217054263565892,
+      "grad_norm": 0.7621960639953613,
       "learning_rate": 4.878799064845577e-05,
+      "loss": 0.1036,
       "step": 1100
     },
     {
       "epoch": 1.032779623477298,
+      "grad_norm": 0.665744960308075,
       "learning_rate": 4.8172757475083056e-05,
+      "loss": 0.075,
       "step": 1200
     },
     {
       "epoch": 1.0438538205980066,
+      "grad_norm": 11.760805130004883,
       "learning_rate": 4.755752430171035e-05,
+      "loss": 0.0808,
       "step": 1300
     },
     {
       "epoch": 1.0549280177187155,
+      "grad_norm": 2.482733726501465,
       "learning_rate": 4.694229112833764e-05,
+      "loss": 0.0308,
       "step": 1400
     },
     {
       "epoch": 1.0660022148394241,
+      "grad_norm": 0.05557706952095032,
       "learning_rate": 4.6327057954964936e-05,
+      "loss": 0.0475,
       "step": 1500
     },
     {
       "epoch": 1.0770764119601328,
+      "grad_norm": 0.05685936659574509,
       "learning_rate": 4.571182478159223e-05,
+      "loss": 0.0211,
       "step": 1600
     },
     {
       "epoch": 1.0881506090808417,
+      "grad_norm": 0.07164409011602402,
       "learning_rate": 4.5096591608219516e-05,
+      "loss": 0.0367,
       "step": 1700
     },
     {
       "epoch": 1.0992248062015504,
+      "grad_norm": 0.07703804969787598,
       "learning_rate": 4.448135843484681e-05,
+      "loss": 0.0207,
       "step": 1800
     },
     {
       "epoch": 1.100110741971207,
+      "eval_accuracy": 0.9900373599003736,
+      "eval_loss": 0.03251923993229866,
+      "eval_runtime": 319.7386,
+      "eval_samples_per_second": 2.511,
+      "eval_steps_per_second": 0.316,
       "step": 1808
     },
     {
       "epoch": 2.010188261351052,
+      "grad_norm": 0.049545079469680786,
       "learning_rate": 4.38661252614741e-05,
+      "loss": 0.0066,
       "step": 1900
     },
     {
       "epoch": 2.0212624584717607,
+      "grad_norm": 0.023045338690280914,
       "learning_rate": 4.325089208810139e-05,
+      "loss": 0.0035,
       "step": 2000
     },
     {
       "epoch": 2.0323366555924696,
+      "grad_norm": 0.016869375482201576,
       "learning_rate": 4.263565891472868e-05,
+      "loss": 0.0162,
       "step": 2100
     },
     {
       "epoch": 2.0434108527131785,
+      "grad_norm": 0.029845820739865303,
       "learning_rate": 4.2020425741355975e-05,
+      "loss": 0.0185,
       "step": 2200
     },
     {
       "epoch": 2.054485049833887,
+      "grad_norm": 0.009218129329383373,
       "learning_rate": 4.140519256798327e-05,
+      "loss": 0.0109,
       "step": 2300
     },
     {
       "epoch": 2.065559246954596,
+      "grad_norm": 0.07040040194988251,
       "learning_rate": 4.078995939461056e-05,
+      "loss": 0.0023,
       "step": 2400
     },
     {
       "epoch": 2.0766334440753047,
+      "grad_norm": 0.12176311016082764,
       "learning_rate": 4.0174726221237855e-05,
+      "loss": 0.0258,
       "step": 2500
     },
     {
       "epoch": 2.087707641196013,
+      "grad_norm": 0.01268716063350439,
       "learning_rate": 3.955949304786514e-05,
+      "loss": 0.0098,
       "step": 2600
     },
     {
       "epoch": 2.098781838316722,
+      "grad_norm": 0.03558783233165741,
       "learning_rate": 3.8944259874492434e-05,
+      "loss": 0.0116,
       "step": 2700
     },
     {
       "epoch": 2.100110741971207,
       "eval_accuracy": 0.9962640099626401,
+      "eval_loss": 0.02290569432079792,
+      "eval_runtime": 324.5071,
+      "eval_samples_per_second": 2.475,
+      "eval_steps_per_second": 0.311,
       "step": 2712
     },
     {
       "epoch": 3.009745293466224,
+      "grad_norm": 0.021466247737407684,
       "learning_rate": 3.832902670111973e-05,
+      "loss": 0.0169,
       "step": 2800
     },
     {
       "epoch": 3.0208194905869323,
+      "grad_norm": 0.014765599742531776,
       "learning_rate": 3.7713793527747014e-05,
+      "loss": 0.0008,
       "step": 2900
     },
     {
       "epoch": 3.0318936877076412,
+      "grad_norm": 0.012668099254369736,
       "learning_rate": 3.7098560354374314e-05,
+      "loss": 0.0021,
       "step": 3000
     },
     {
       "epoch": 3.04296788482835,
+      "grad_norm": 0.007325606886297464,
       "learning_rate": 3.64833271810016e-05,
+      "loss": 0.0043,
       "step": 3100
     },
     {
       "epoch": 3.0540420819490586,
+      "grad_norm": 0.010318818502128124,
       "learning_rate": 3.5868094007628894e-05,
+      "loss": 0.0119,
       "step": 3200
     },
     {
       "epoch": 3.0651162790697675,
+      "grad_norm": 0.00951201282441616,
       "learning_rate": 3.525286083425619e-05,
+      "loss": 0.0006,
       "step": 3300
     },
     {
       "epoch": 3.0761904761904764,
+      "grad_norm": 0.0036382139660418034,
       "learning_rate": 3.463762766088347e-05,
+      "loss": 0.0006,
       "step": 3400
     },
     {
       "epoch": 3.087264673311185,
+      "grad_norm": 0.014880606904625893,
       "learning_rate": 3.4022394487510767e-05,
+      "loss": 0.0112,
       "step": 3500
     },
     {
       "epoch": 3.0983388704318937,
+      "grad_norm": 0.02532036043703556,
       "learning_rate": 3.340716131413806e-05,
+      "loss": 0.0017,
       "step": 3600
     },
     {
       "epoch": 3.100110741971207,
+      "eval_accuracy": 0.9950186799501868,
+      "eval_loss": 0.022232333198189735,
+      "eval_runtime": 321.5404,
+      "eval_samples_per_second": 2.497,
+      "eval_steps_per_second": 0.314,
       "step": 3616
     },
     {
       "epoch": 4.0093023255813955,
+      "grad_norm": 0.006754144560545683,
       "learning_rate": 3.2791928140765346e-05,
       "loss": 0.0005,
       "step": 3700
     },
     {
       "epoch": 4.020376522702104,
+      "grad_norm": 0.005147715099155903,
       "learning_rate": 3.2176694967392646e-05,
+      "loss": 0.0149,
       "step": 3800
     },
     {
       "epoch": 4.0314507198228124,
+      "grad_norm": 0.007229967508465052,
       "learning_rate": 3.156146179401994e-05,
       "loss": 0.0003,
       "step": 3900
     },
     {
       "epoch": 4.042524916943521,
+      "grad_norm": 0.014596535824239254,
       "learning_rate": 3.0946228620647226e-05,
+      "loss": 0.0004,
       "step": 4000
     },
     {
       "epoch": 4.05359911406423,
+      "grad_norm": 0.0032493751496076584,
       "learning_rate": 3.033099544727452e-05,
+      "loss": 0.0003,
       "step": 4100
     },
     {
       "epoch": 4.064673311184939,
+      "grad_norm": 0.004764176905155182,
       "learning_rate": 2.971576227390181e-05,
+      "loss": 0.0002,
       "step": 4200
     },
     {
       "epoch": 4.075747508305648,
+      "grad_norm": 0.005187960807234049,
       "learning_rate": 2.91005291005291e-05,
+      "loss": 0.0002,
       "step": 4300
     },
     {
       "epoch": 4.086821705426357,
+      "grad_norm": 0.008601618930697441,
       "learning_rate": 2.8485295927156392e-05,
+      "loss": 0.0004,
       "step": 4400
     },
     {
       "epoch": 4.097895902547065,
+      "grad_norm": 0.5019575357437134,
       "learning_rate": 2.787006275378369e-05,
+      "loss": 0.0156,
       "step": 4500
     },
     {
       "epoch": 4.100110741971207,
+      "eval_accuracy": 0.9900373599003736,
+      "eval_loss": 0.04016907513141632,
+      "eval_runtime": 316.7446,
+      "eval_samples_per_second": 2.535,
+      "eval_steps_per_second": 0.319,
       "step": 4520
     },
     {
       "epoch": 5.008859357696567,
+      "grad_norm": 0.09171910583972931,
       "learning_rate": 2.725482958041098e-05,
+      "loss": 0.0379,
       "step": 4600
     },
     {
       "epoch": 5.019933554817276,
+      "grad_norm": 0.012514377012848854,
       "learning_rate": 2.6639596407038268e-05,
+      "loss": 0.0049,
       "step": 4700
     },
     {
       "epoch": 5.0310077519379846,
+      "grad_norm": 0.009760179556906223,
       "learning_rate": 2.602436323366556e-05,
+      "loss": 0.0008,
       "step": 4800
     },
     {
       "epoch": 5.0420819490586934,
+      "grad_norm": 0.00494693499058485,
       "learning_rate": 2.540913006029285e-05,
+      "loss": 0.0094,
       "step": 4900
     },
     {
       "epoch": 5.053156146179402,
+      "grad_norm": 0.003839722601696849,
       "learning_rate": 2.479389688692014e-05,
+      "loss": 0.0003,
       "step": 5000
     },
     {
       "epoch": 5.06423034330011,
+      "grad_norm": 0.004592357203364372,
       "learning_rate": 2.4178663713547438e-05,
+      "loss": 0.0002,
       "step": 5100
     },
     {
       "epoch": 5.075304540420819,
+      "grad_norm": 0.00357171637006104,
       "learning_rate": 2.3563430540174727e-05,
+      "loss": 0.0003,
       "step": 5200
     },
     {
       "epoch": 5.086378737541528,
+      "grad_norm": 0.004462802782654762,
       "learning_rate": 2.2948197366802017e-05,
       "loss": 0.0002,
       "step": 5300
     },
     {
       "epoch": 5.097452934662237,
+      "grad_norm": 0.002604804467409849,
       "learning_rate": 2.233296419342931e-05,
       "loss": 0.0002,
       "step": 5400
     },
     {
       "epoch": 5.100110741971207,
+      "eval_accuracy": 0.9975093399750934,
+      "eval_loss": 0.008347271010279655,
+      "eval_runtime": 311.1635,
+      "eval_samples_per_second": 2.581,
+      "eval_steps_per_second": 0.325,
       "step": 5424
     },
     {
       "epoch": 6.008416389811739,
+      "grad_norm": 0.0028000217862427235,
       "learning_rate": 2.1717731020056604e-05,
       "loss": 0.0002,
       "step": 5500
     },
     {
       "epoch": 6.019490586932448,
+      "grad_norm": 0.0019141006050631404,
       "learning_rate": 2.1102497846683894e-05,
       "loss": 0.0001,
       "step": 5600
     },
     {
       "epoch": 6.030564784053156,
+      "grad_norm": 0.0038908650167286396,
       "learning_rate": 2.0487264673311183e-05,
       "loss": 0.0001,
       "step": 5700
     },
     {
       "epoch": 6.041638981173865,
+      "grad_norm": 0.0013375241542235017,
       "learning_rate": 1.987203149993848e-05,
       "loss": 0.0001,
       "step": 5800
     },
     {
       "epoch": 6.052713178294574,
+      "grad_norm": 0.0016891614068299532,
       "learning_rate": 1.925679832656577e-05,
       "loss": 0.0001,
       "step": 5900
     },
     {
       "epoch": 6.0637873754152825,
+      "grad_norm": 0.0015141346957534552,
       "learning_rate": 1.864156515319306e-05,
       "loss": 0.0001,
       "step": 6000
     },
     {
       "epoch": 6.074861572535991,
+      "grad_norm": 0.0012503410689532757,
       "learning_rate": 1.8026331979820353e-05,
       "loss": 0.0001,
       "step": 6100
     },
     {
       "epoch": 6.0859357696567,
+      "grad_norm": 0.0019348779460415244,
       "learning_rate": 1.7411098806447646e-05,
       "loss": 0.0001,
       "step": 6200
     },
     {
       "epoch": 6.097009966777408,
+      "grad_norm": 0.001840105396695435,
       "learning_rate": 1.6795865633074936e-05,
       "loss": 0.0001,
       "step": 6300
     },
     {
       "epoch": 6.100110741971207,
+      "eval_accuracy": 0.9975093399750934,
+      "eval_loss": 0.008798662573099136,
+      "eval_runtime": 315.9616,
+      "eval_samples_per_second": 2.541,
+      "eval_steps_per_second": 0.32,
       "step": 6328
     },
     {
       "epoch": 7.00797342192691,
+      "grad_norm": 0.0018666000105440617,
       "learning_rate": 1.6180632459702226e-05,
       "loss": 0.0001,
       "step": 6400
     },
     {
       "epoch": 7.019047619047619,
+      "grad_norm": 0.0011329470435157418,
       "learning_rate": 1.556539928632952e-05,
       "loss": 0.0001,
       "step": 6500
     },
     {
       "epoch": 7.030121816168328,
+      "grad_norm": 0.0014819415519014,
       "learning_rate": 1.4950166112956812e-05,
       "loss": 0.0001,
       "step": 6600
     },
     {
       "epoch": 7.041196013289037,
+      "grad_norm": 0.0013377605937421322,
       "learning_rate": 1.4334932939584104e-05,
       "loss": 0.0001,
       "step": 6700
     },
     {
       "epoch": 7.052270210409746,
+      "grad_norm": 0.0014949695905670524,
       "learning_rate": 1.3719699766211393e-05,
       "loss": 0.0001,
       "step": 6800
     },
     {
       "epoch": 7.063344407530454,
+      "grad_norm": 0.0020517068915069103,
       "learning_rate": 1.3104466592838688e-05,
       "loss": 0.0001,
       "step": 6900
     },
     {
       "epoch": 7.074418604651163,
+      "grad_norm": 0.0016913407016545534,
       "learning_rate": 1.2489233419465978e-05,
       "loss": 0.0001,
       "step": 7000
     },
     {
       "epoch": 7.0854928017718715,
+      "grad_norm": 0.0019159069051966071,
       "learning_rate": 1.187400024609327e-05,
       "loss": 0.0001,
       "step": 7100
     },
     {
       "epoch": 7.09656699889258,
+      "grad_norm": 0.0017233892576768994,
       "learning_rate": 1.1258767072720563e-05,
       "loss": 0.0001,
       "step": 7200
     },
     {
       "epoch": 7.100110741971207,
+      "eval_accuracy": 0.9975093399750934,
+      "eval_loss": 0.009401123970746994,
+      "eval_runtime": 205.4199,
+      "eval_samples_per_second": 3.909,
+      "eval_steps_per_second": 0.492,
       "step": 7232
     },
     {
       "epoch": 8.007530454042081,
+      "grad_norm": 0.0016070300480350852,
       "learning_rate": 1.0643533899347853e-05,
       "loss": 0.0001,
       "step": 7300
     },
     {
       "epoch": 8.018604651162791,
+      "grad_norm": 0.0009037270210683346,
       "learning_rate": 1.0028300725975146e-05,
       "loss": 0.0001,
       "step": 7400
     },
     {
       "epoch": 8.029678848283499,
+      "grad_norm": 0.0009796767262741923,
       "learning_rate": 9.413067552602436e-06,
       "loss": 0.0001,
       "step": 7500
     },
     {
       "epoch": 8.040753045404209,
+      "grad_norm": 0.009153931401669979,
       "learning_rate": 8.797834379229729e-06,
       "loss": 0.0001,
       "step": 7600
     },
     {
       "epoch": 8.051827242524917,
+      "grad_norm": 0.0009286152780987322,
       "learning_rate": 8.18260120585702e-06,
       "loss": 0.0001,
       "step": 7700
     },
     {
       "epoch": 8.062901439645625,
+      "grad_norm": 0.0012453129747882485,
       "learning_rate": 7.567368032484312e-06,
       "loss": 0.0001,
       "step": 7800
     },
     {
       "epoch": 8.073975636766335,
+      "grad_norm": 0.000763101561460644,
       "learning_rate": 6.952134859111603e-06,
       "loss": 0.0001,
       "step": 7900
     },
     {
       "epoch": 8.085049833887043,
+      "grad_norm": 0.0010468490654602647,
       "learning_rate": 6.336901685738895e-06,
       "loss": 0.0001,
       "step": 8000
     },
     {
       "epoch": 8.096124031007752,
+      "grad_norm": 0.0007441536872647703,
       "learning_rate": 5.7216685123661875e-06,
       "loss": 0.0001,
       "step": 8100
     },
     {
       "epoch": 8.100110741971207,
+      "eval_accuracy": 0.9975093399750934,
+      "eval_loss": 0.009709909558296204,
+      "eval_runtime": 213.0126,
+      "eval_samples_per_second": 3.77,
+      "eval_steps_per_second": 0.474,
       "step": 8136
     },
     {
       "epoch": 9.007087486157253,
+      "grad_norm": 0.0011277415324002504,
       "learning_rate": 5.106435338993479e-06,
       "loss": 0.0001,
       "step": 8200
     },
     {
       "epoch": 9.018161683277963,
+      "grad_norm": 0.0012697929050773382,
       "learning_rate": 4.4912021656207705e-06,
       "loss": 0.0001,
       "step": 8300
     },
     {
       "epoch": 9.029235880398671,
+      "grad_norm": 0.0028499774634838104,
       "learning_rate": 3.875968992248062e-06,
       "loss": 0.0001,
       "step": 8400
     },
     {
       "epoch": 9.04031007751938,
+      "grad_norm": 0.0017348791006952524,
       "learning_rate": 3.260735818875354e-06,
       "loss": 0.0001,
       "step": 8500
     },
     {
       "epoch": 9.051384274640089,
+      "grad_norm": 0.0006883046007715166,
       "learning_rate": 2.6455026455026455e-06,
       "loss": 0.0001,
       "step": 8600
     },
     {
       "epoch": 9.062458471760797,
+      "grad_norm": 0.00142951391171664,
       "learning_rate": 2.0302694721299375e-06,
       "loss": 0.0001,
       "step": 8700
     },
     {
       "epoch": 9.073532668881507,
+      "grad_norm": 0.000702825200278312,
       "learning_rate": 1.415036298757229e-06,
       "loss": 0.0001,
       "step": 8800
     },
     {
       "epoch": 9.084606866002215,
+      "grad_norm": 0.0009480651351623237,
       "learning_rate": 7.998031253845208e-07,
       "loss": 0.0001,
       "step": 8900
     },
     {
       "epoch": 9.095681063122923,
+      "grad_norm": 0.0010264083975926042,
       "learning_rate": 1.8456995201181249e-07,
       "loss": 0.0001,
       "step": 9000
     },
     {
       "epoch": 9.099003322259136,
+      "eval_accuracy": 0.9975093399750934,
+      "eval_loss": 0.009837848134338856,
+      "eval_runtime": 215.3394,
+      "eval_samples_per_second": 3.729,
+      "eval_steps_per_second": 0.469,
       "step": 9030
     },
     {
       "epoch": 9.099003322259136,
       "step": 9030,
       "total_flos": 6.328460909097596e+19,
+      "train_loss": 0.18714786747627524,
+      "train_runtime": 33340.824,
+      "train_samples_per_second": 2.167,
+      "train_steps_per_second": 0.271
     },
     {
       "epoch": 9.099003322259136,
+      "eval_accuracy": 0.7664576802507836,
+      "eval_loss": 0.8547028303146362,
+      "eval_runtime": 304.3291,
+      "eval_samples_per_second": 4.193,
+      "eval_steps_per_second": 0.526,
       "step": 9030
     }
   ],