End of training

Browse files

Files changed (7) hide show

README.md +2 -2
all_results.json +8 -0
confusion_matrix_kfold_fold_5.png +0 -0
confusion_matrix_test_fold_5.png +0 -0
confusion_matrix_trainfold_fold_5.png +0 -0
test_results.json +8 -0
trainer_state.json +771 -0

README.md CHANGED Viewed

@@ -18,8 +18,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [MCG-NJU/videomae-base](https://huggingface.co/MCG-NJU/videomae-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0526
-- Accuracy: 0.9875
 ## Model description

 This model is a fine-tuned version of [MCG-NJU/videomae-base](https://huggingface.co/MCG-NJU/videomae-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.3845
+- Accuracy: 0.9287
 ## Model description

all_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 9.099501661129569,
+    "eval_accuracy": 0.9286833855799373,
+    "eval_loss": 0.38447505235671997,
+    "eval_runtime": 537.4022,
+    "eval_samples_per_second": 2.374,
+    "eval_steps_per_second": 1.187
+}

confusion_matrix_kfold_fold_5.png ADDED Viewed

confusion_matrix_test_fold_5.png ADDED Viewed

confusion_matrix_trainfold_fold_5.png ADDED Viewed

test_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 9.099501661129569,
+    "eval_accuracy": 0.9286833855799373,
+    "eval_loss": 0.38447505235671997,
+    "eval_runtime": 537.4022,
+    "eval_samples_per_second": 2.374,
+    "eval_steps_per_second": 1.187
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,771 @@

+{
+  "best_metric": 0.9925280199252802,
+  "best_model_checkpoint": "/media/cse/HDD/Shawon/shawon/10 fold timesformer/VideoMAE_default_fold__4__10_epoch_Aug_batch_1_4_BdSLW60/checkpoint-8131",
+  "epoch": 9.099501661129569,
+  "eval_steps": 500,
+  "global_step": 9030,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.01107419712070875,
+      "grad_norm": 35.217525482177734,
+      "learning_rate": 5.537098560354375e-06,
+      "loss": 16.5715,
+      "step": 100
+    },
+    {
+      "epoch": 0.0221483942414175,
+      "grad_norm": 31.530065536499023,
+      "learning_rate": 1.107419712070875e-05,
+      "loss": 16.4548,
+      "step": 200
+    },
+    {
+      "epoch": 0.03322259136212625,
+      "grad_norm": 32.5143928527832,
+      "learning_rate": 1.6611295681063124e-05,
+      "loss": 16.3944,
+      "step": 300
+    },
+    {
+      "epoch": 0.044296788482835,
+      "grad_norm": 27.03118896484375,
+      "learning_rate": 2.21483942414175e-05,
+      "loss": 16.2123,
+      "step": 400
+    },
+    {
+      "epoch": 0.05537098560354374,
+      "grad_norm": 34.12999725341797,
+      "learning_rate": 2.7685492801771873e-05,
+      "loss": 15.2606,
+      "step": 500
+    },
+    {
+      "epoch": 0.0664451827242525,
+      "grad_norm": 42.32147216796875,
+      "learning_rate": 3.322259136212625e-05,
+      "loss": 13.53,
+      "step": 600
+    },
+    {
+      "epoch": 0.07751937984496124,
+      "grad_norm": 44.13176727294922,
+      "learning_rate": 3.875968992248062e-05,
+      "loss": 11.9277,
+      "step": 700
+    },
+    {
+      "epoch": 0.08859357696567,
+      "grad_norm": 45.3419189453125,
+      "learning_rate": 4.4296788482835e-05,
+      "loss": 9.4988,
+      "step": 800
+    },
+    {
+      "epoch": 0.09966777408637874,
+      "grad_norm": 55.63376235961914,
+      "learning_rate": 4.983388704318937e-05,
+      "loss": 7.1534,
+      "step": 900
+    },
+    {
+      "epoch": 0.1,
+      "eval_accuracy": 0.5990037359900373,
+      "eval_loss": 1.634743094444275,
+      "eval_runtime": 254.712,
+      "eval_samples_per_second": 3.153,
+      "eval_steps_per_second": 1.578,
+      "step": 903
+    },
+    {
+      "epoch": 1.010686600221484,
+      "grad_norm": 37.874595642089844,
+      "learning_rate": 4.940322382182848e-05,
+      "loss": 5.7449,
+      "step": 1000
+    },
+    {
+      "epoch": 1.0217607973421927,
+      "grad_norm": 30.460966110229492,
+      "learning_rate": 4.878799064845577e-05,
+      "loss": 4.1019,
+      "step": 1100
+    },
+    {
+      "epoch": 1.0328349944629014,
+      "grad_norm": 44.03368377685547,
+      "learning_rate": 4.8172757475083056e-05,
+      "loss": 3.1676,
+      "step": 1200
+    },
+    {
+      "epoch": 1.0439091915836103,
+      "grad_norm": 44.42673873901367,
+      "learning_rate": 4.755752430171035e-05,
+      "loss": 2.8025,
+      "step": 1300
+    },
+    {
+      "epoch": 1.054983388704319,
+      "grad_norm": 72.93189239501953,
+      "learning_rate": 4.694229112833764e-05,
+      "loss": 2.4045,
+      "step": 1400
+    },
+    {
+      "epoch": 1.0660575858250276,
+      "grad_norm": 64.83969116210938,
+      "learning_rate": 4.6327057954964936e-05,
+      "loss": 1.8242,
+      "step": 1500
+    },
+    {
+      "epoch": 1.0771317829457365,
+      "grad_norm": 10.798648834228516,
+      "learning_rate": 4.571182478159223e-05,
+      "loss": 1.5073,
+      "step": 1600
+    },
+    {
+      "epoch": 1.0882059800664452,
+      "grad_norm": 68.70486450195312,
+      "learning_rate": 4.5096591608219516e-05,
+      "loss": 1.2643,
+      "step": 1700
+    },
+    {
+      "epoch": 1.0992801771871539,
+      "grad_norm": 39.017173767089844,
+      "learning_rate": 4.448135843484681e-05,
+      "loss": 1.2018,
+      "step": 1800
+    },
+    {
+      "epoch": 1.1000553709856036,
+      "eval_accuracy": 0.9028642590286425,
+      "eval_loss": 0.33687880635261536,
+      "eval_runtime": 246.5833,
+      "eval_samples_per_second": 3.257,
+      "eval_steps_per_second": 1.63,
+      "step": 1807
+    },
+    {
+      "epoch": 2.010299003322259,
+      "grad_norm": 2.68186354637146,
+      "learning_rate": 4.38661252614741e-05,
+      "loss": 0.9702,
+      "step": 1900
+    },
+    {
+      "epoch": 2.021373200442968,
+      "grad_norm": 0.49348923563957214,
+      "learning_rate": 4.325089208810139e-05,
+      "loss": 0.6578,
+      "step": 2000
+    },
+    {
+      "epoch": 2.0324473975636765,
+      "grad_norm": 25.38459014892578,
+      "learning_rate": 4.263565891472868e-05,
+      "loss": 0.8361,
+      "step": 2100
+    },
+    {
+      "epoch": 2.0435215946843854,
+      "grad_norm": 25.555809020996094,
+      "learning_rate": 4.2020425741355975e-05,
+      "loss": 0.6547,
+      "step": 2200
+    },
+    {
+      "epoch": 2.0545957918050943,
+      "grad_norm": 1.4637202024459839,
+      "learning_rate": 4.140519256798327e-05,
+      "loss": 0.623,
+      "step": 2300
+    },
+    {
+      "epoch": 2.065669988925803,
+      "grad_norm": 0.4001486003398895,
+      "learning_rate": 4.078995939461056e-05,
+      "loss": 0.524,
+      "step": 2400
+    },
+    {
+      "epoch": 2.0767441860465117,
+      "grad_norm": 10.103757858276367,
+      "learning_rate": 4.0174726221237855e-05,
+      "loss": 0.4509,
+      "step": 2500
+    },
+    {
+      "epoch": 2.0878183831672206,
+      "grad_norm": 33.20508575439453,
+      "learning_rate": 3.955949304786514e-05,
+      "loss": 0.5262,
+      "step": 2600
+    },
+    {
+      "epoch": 2.098892580287929,
+      "grad_norm": 6.72857666015625,
+      "learning_rate": 3.8944259874492434e-05,
+      "loss": 0.3895,
+      "step": 2700
+    },
+    {
+      "epoch": 2.1,
+      "eval_accuracy": 0.958904109589041,
+      "eval_loss": 0.15578480064868927,
+      "eval_runtime": 244.3662,
+      "eval_samples_per_second": 3.286,
+      "eval_steps_per_second": 1.645,
+      "step": 2710
+    },
+    {
+      "epoch": 3.009911406423034,
+      "grad_norm": 0.40964722633361816,
+      "learning_rate": 3.832902670111973e-05,
+      "loss": 0.2033,
+      "step": 2800
+    },
+    {
+      "epoch": 3.020985603543743,
+      "grad_norm": 0.33143919706344604,
+      "learning_rate": 3.7713793527747014e-05,
+      "loss": 0.2356,
+      "step": 2900
+    },
+    {
+      "epoch": 3.032059800664452,
+      "grad_norm": 1.2071921825408936,
+      "learning_rate": 3.7098560354374314e-05,
+      "loss": 0.3155,
+      "step": 3000
+    },
+    {
+      "epoch": 3.0431339977851604,
+      "grad_norm": 0.3948413133621216,
+      "learning_rate": 3.64833271810016e-05,
+      "loss": 0.168,
+      "step": 3100
+    },
+    {
+      "epoch": 3.0542081949058693,
+      "grad_norm": 0.20336775481700897,
+      "learning_rate": 3.5868094007628894e-05,
+      "loss": 0.2734,
+      "step": 3200
+    },
+    {
+      "epoch": 3.065282392026578,
+      "grad_norm": 9.776823997497559,
+      "learning_rate": 3.525286083425619e-05,
+      "loss": 0.2658,
+      "step": 3300
+    },
+    {
+      "epoch": 3.076356589147287,
+      "grad_norm": 9.96722412109375,
+      "learning_rate": 3.463762766088347e-05,
+      "loss": 0.2547,
+      "step": 3400
+    },
+    {
+      "epoch": 3.0874307862679955,
+      "grad_norm": 0.9340003132820129,
+      "learning_rate": 3.4022394487510767e-05,
+      "loss": 0.1343,
+      "step": 3500
+    },
+    {
+      "epoch": 3.0985049833887044,
+      "grad_norm": 0.0304119773209095,
+      "learning_rate": 3.340716131413806e-05,
+      "loss": 0.1654,
+      "step": 3600
+    },
+    {
+      "epoch": 3.1000553709856034,
+      "eval_accuracy": 0.9788293897882939,
+      "eval_loss": 0.09220333397388458,
+      "eval_runtime": 247.2233,
+      "eval_samples_per_second": 3.248,
+      "eval_steps_per_second": 1.626,
+      "step": 3614
+    },
+    {
+      "epoch": 4.0095238095238095,
+      "grad_norm": 0.05322951823472977,
+      "learning_rate": 3.2791928140765346e-05,
+      "loss": 0.0955,
+      "step": 3700
+    },
+    {
+      "epoch": 4.020598006644518,
+      "grad_norm": 0.14431843161582947,
+      "learning_rate": 3.2176694967392646e-05,
+      "loss": 0.181,
+      "step": 3800
+    },
+    {
+      "epoch": 4.031672203765227,
+      "grad_norm": 0.14612068235874176,
+      "learning_rate": 3.156146179401994e-05,
+      "loss": 0.2801,
+      "step": 3900
+    },
+    {
+      "epoch": 4.042746400885936,
+      "grad_norm": 0.030130434781312943,
+      "learning_rate": 3.0946228620647226e-05,
+      "loss": 0.11,
+      "step": 4000
+    },
+    {
+      "epoch": 4.053820598006644,
+      "grad_norm": 84.40876770019531,
+      "learning_rate": 3.033099544727452e-05,
+      "loss": 0.1632,
+      "step": 4100
+    },
+    {
+      "epoch": 4.064894795127353,
+      "grad_norm": 247.53504943847656,
+      "learning_rate": 2.971576227390181e-05,
+      "loss": 0.1784,
+      "step": 4200
+    },
+    {
+      "epoch": 4.075968992248062,
+      "grad_norm": 0.022293824702501297,
+      "learning_rate": 2.91005291005291e-05,
+      "loss": 0.1768,
+      "step": 4300
+    },
+    {
+      "epoch": 4.087043189368771,
+      "grad_norm": 0.04350820183753967,
+      "learning_rate": 2.8485295927156392e-05,
+      "loss": 0.2005,
+      "step": 4400
+    },
+    {
+      "epoch": 4.09811738648948,
+      "grad_norm": 0.03336182236671448,
+      "learning_rate": 2.787006275378369e-05,
+      "loss": 0.0988,
+      "step": 4500
+    },
+    {
+      "epoch": 4.1,
+      "eval_accuracy": 0.9813200498132005,
+      "eval_loss": 0.07138894498348236,
+      "eval_runtime": 242.9311,
+      "eval_samples_per_second": 3.305,
+      "eval_steps_per_second": 1.655,
+      "step": 4517
+    },
+    {
+      "epoch": 5.009136212624584,
+      "grad_norm": 0.015874436125159264,
+      "learning_rate": 2.725482958041098e-05,
+      "loss": 0.066,
+      "step": 4600
+    },
+    {
+      "epoch": 5.020210409745293,
+      "grad_norm": 0.04679744318127632,
+      "learning_rate": 2.6639596407038268e-05,
+      "loss": 0.1048,
+      "step": 4700
+    },
+    {
+      "epoch": 5.031284606866002,
+      "grad_norm": 46.831634521484375,
+      "learning_rate": 2.602436323366556e-05,
+      "loss": 0.1694,
+      "step": 4800
+    },
+    {
+      "epoch": 5.042358803986711,
+      "grad_norm": 0.02305000275373459,
+      "learning_rate": 2.540913006029285e-05,
+      "loss": 0.0276,
+      "step": 4900
+    },
+    {
+      "epoch": 5.05343300110742,
+      "grad_norm": 0.024845095351338387,
+      "learning_rate": 2.479389688692014e-05,
+      "loss": 0.0752,
+      "step": 5000
+    },
+    {
+      "epoch": 5.064507198228129,
+      "grad_norm": 0.07386521995067596,
+      "learning_rate": 2.4178663713547438e-05,
+      "loss": 0.1106,
+      "step": 5100
+    },
+    {
+      "epoch": 5.075581395348837,
+      "grad_norm": 0.011052440851926804,
+      "learning_rate": 2.3563430540174727e-05,
+      "loss": 0.1798,
+      "step": 5200
+    },
+    {
+      "epoch": 5.086655592469546,
+      "grad_norm": 0.03108247183263302,
+      "learning_rate": 2.2948197366802017e-05,
+      "loss": 0.0989,
+      "step": 5300
+    },
+    {
+      "epoch": 5.097729789590255,
+      "grad_norm": 0.026010781526565552,
+      "learning_rate": 2.233296419342931e-05,
+      "loss": 0.1344,
+      "step": 5400
+    },
+    {
+      "epoch": 5.100055370985603,
+      "eval_accuracy": 0.9900373599003736,
+      "eval_loss": 0.05479121580719948,
+      "eval_runtime": 245.2178,
+      "eval_samples_per_second": 3.275,
+      "eval_steps_per_second": 1.639,
+      "step": 5421
+    },
+    {
+      "epoch": 6.00874861572536,
+      "grad_norm": 0.017900297418236732,
+      "learning_rate": 2.1717731020056604e-05,
+      "loss": 0.056,
+      "step": 5500
+    },
+    {
+      "epoch": 6.019822812846068,
+      "grad_norm": 0.014143782667815685,
+      "learning_rate": 2.1102497846683894e-05,
+      "loss": 0.0514,
+      "step": 5600
+    },
+    {
+      "epoch": 6.030897009966777,
+      "grad_norm": 1.0569688081741333,
+      "learning_rate": 2.0487264673311183e-05,
+      "loss": 0.0268,
+      "step": 5700
+    },
+    {
+      "epoch": 6.041971207087486,
+      "grad_norm": 0.01698586530983448,
+      "learning_rate": 1.987203149993848e-05,
+      "loss": 0.1061,
+      "step": 5800
+    },
+    {
+      "epoch": 6.053045404208195,
+      "grad_norm": 0.00996414851397276,
+      "learning_rate": 1.925679832656577e-05,
+      "loss": 0.011,
+      "step": 5900
+    },
+    {
+      "epoch": 6.064119601328904,
+      "grad_norm": 0.038351599127054214,
+      "learning_rate": 1.864156515319306e-05,
+      "loss": 0.0827,
+      "step": 6000
+    },
+    {
+      "epoch": 6.075193798449613,
+      "grad_norm": 0.08223330229520798,
+      "learning_rate": 1.8026331979820353e-05,
+      "loss": 0.0402,
+      "step": 6100
+    },
+    {
+      "epoch": 6.086267995570321,
+      "grad_norm": 0.011590097099542618,
+      "learning_rate": 1.7411098806447646e-05,
+      "loss": 0.0894,
+      "step": 6200
+    },
+    {
+      "epoch": 6.09734219269103,
+      "grad_norm": 0.01950395107269287,
+      "learning_rate": 1.6795865633074936e-05,
+      "loss": 0.1058,
+      "step": 6300
+    },
+    {
+      "epoch": 6.1,
+      "eval_accuracy": 0.987546699875467,
+      "eval_loss": 0.055294327437877655,
+      "eval_runtime": 242.6622,
+      "eval_samples_per_second": 3.309,
+      "eval_steps_per_second": 1.657,
+      "step": 6324
+    },
+    {
+      "epoch": 7.008361018826135,
+      "grad_norm": 0.0069948905147612095,
+      "learning_rate": 1.6180632459702226e-05,
+      "loss": 0.0577,
+      "step": 6400
+    },
+    {
+      "epoch": 7.019435215946844,
+      "grad_norm": 1.0322211980819702,
+      "learning_rate": 1.556539928632952e-05,
+      "loss": 0.0197,
+      "step": 6500
+    },
+    {
+      "epoch": 7.030509413067553,
+      "grad_norm": 0.008567863143980503,
+      "learning_rate": 1.4950166112956812e-05,
+      "loss": 0.1023,
+      "step": 6600
+    },
+    {
+      "epoch": 7.041583610188261,
+      "grad_norm": 0.026618080213665962,
+      "learning_rate": 1.4334932939584104e-05,
+      "loss": 0.0176,
+      "step": 6700
+    },
+    {
+      "epoch": 7.05265780730897,
+      "grad_norm": 0.12838630378246307,
+      "learning_rate": 1.3719699766211393e-05,
+      "loss": 0.0046,
+      "step": 6800
+    },
+    {
+      "epoch": 7.063732004429679,
+      "grad_norm": 0.0924014300107956,
+      "learning_rate": 1.3104466592838688e-05,
+      "loss": 0.0248,
+      "step": 6900
+    },
+    {
+      "epoch": 7.074806201550388,
+      "grad_norm": 0.005219871178269386,
+      "learning_rate": 1.2489233419465978e-05,
+      "loss": 0.0611,
+      "step": 7000
+    },
+    {
+      "epoch": 7.0858803986710965,
+      "grad_norm": 0.013417864218354225,
+      "learning_rate": 1.187400024609327e-05,
+      "loss": 0.0089,
+      "step": 7100
+    },
+    {
+      "epoch": 7.096954595791805,
+      "grad_norm": 0.005858865100890398,
+      "learning_rate": 1.1258767072720563e-05,
+      "loss": 0.0246,
+      "step": 7200
+    },
+    {
+      "epoch": 7.100055370985603,
+      "eval_accuracy": 0.9912826899128269,
+      "eval_loss": 0.0487552247941494,
+      "eval_runtime": 351.5655,
+      "eval_samples_per_second": 2.284,
+      "eval_steps_per_second": 1.143,
+      "step": 7228
+    },
+    {
+      "epoch": 8.007973421926911,
+      "grad_norm": 0.0037075302097946405,
+      "learning_rate": 1.0643533899347853e-05,
+      "loss": 0.0388,
+      "step": 7300
+    },
+    {
+      "epoch": 8.019047619047619,
+      "grad_norm": 0.004365282598882914,
+      "learning_rate": 1.0028300725975146e-05,
+      "loss": 0.0097,
+      "step": 7400
+    },
+    {
+      "epoch": 8.030121816168327,
+      "grad_norm": 0.006515075918287039,
+      "learning_rate": 9.413067552602436e-06,
+      "loss": 0.0278,
+      "step": 7500
+    },
+    {
+      "epoch": 8.041196013289037,
+      "grad_norm": 0.004097383469343185,
+      "learning_rate": 8.797834379229729e-06,
+      "loss": 0.0281,
+      "step": 7600
+    },
+    {
+      "epoch": 8.052270210409745,
+      "grad_norm": 0.031094931066036224,
+      "learning_rate": 8.18260120585702e-06,
+      "loss": 0.0221,
+      "step": 7700
+    },
+    {
+      "epoch": 8.063344407530455,
+      "grad_norm": 0.005156899336725473,
+      "learning_rate": 7.567368032484312e-06,
+      "loss": 0.0014,
+      "step": 7800
+    },
+    {
+      "epoch": 8.074418604651163,
+      "grad_norm": 0.007017307449132204,
+      "learning_rate": 6.952134859111603e-06,
+      "loss": 0.0049,
+      "step": 7900
+    },
+    {
+      "epoch": 8.085492801771872,
+      "grad_norm": 0.023146001622080803,
+      "learning_rate": 6.336901685738895e-06,
+      "loss": 0.029,
+      "step": 8000
+    },
+    {
+      "epoch": 8.09656699889258,
+      "grad_norm": 0.007268809247761965,
+      "learning_rate": 5.7216685123661875e-06,
+      "loss": 0.0006,
+      "step": 8100
+    },
+    {
+      "epoch": 8.1,
+      "eval_accuracy": 0.9925280199252802,
+      "eval_loss": 0.03840411454439163,
+      "eval_runtime": 359.8229,
+      "eval_samples_per_second": 2.232,
+      "eval_steps_per_second": 1.117,
+      "step": 8131
+    },
+    {
+      "epoch": 9.007585825027686,
+      "grad_norm": 2.1333770751953125,
+      "learning_rate": 5.106435338993479e-06,
+      "loss": 0.0007,
+      "step": 8200
+    },
+    {
+      "epoch": 9.018660022148394,
+      "grad_norm": 0.0032328683882951736,
+      "learning_rate": 4.4912021656207705e-06,
+      "loss": 0.0127,
+      "step": 8300
+    },
+    {
+      "epoch": 9.029734219269104,
+      "grad_norm": 0.12912631034851074,
+      "learning_rate": 3.875968992248062e-06,
+      "loss": 0.0084,
+      "step": 8400
+    },
+    {
+      "epoch": 9.040808416389812,
+      "grad_norm": 0.004084580112248659,
+      "learning_rate": 3.260735818875354e-06,
+      "loss": 0.0005,
+      "step": 8500
+    },
+    {
+      "epoch": 9.05188261351052,
+      "grad_norm": 0.0032446524128317833,
+      "learning_rate": 2.6455026455026455e-06,
+      "loss": 0.025,
+      "step": 8600
+    },
+    {
+      "epoch": 9.06295681063123,
+      "grad_norm": 0.010469436645507812,
+      "learning_rate": 2.0302694721299375e-06,
+      "loss": 0.0007,
+      "step": 8700
+    },
+    {
+      "epoch": 9.074031007751937,
+      "grad_norm": 0.004183362703770399,
+      "learning_rate": 1.415036298757229e-06,
+      "loss": 0.0005,
+      "step": 8800
+    },
+    {
+      "epoch": 9.085105204872647,
+      "grad_norm": 0.003930332604795694,
+      "learning_rate": 7.998031253845208e-07,
+      "loss": 0.0005,
+      "step": 8900
+    },
+    {
+      "epoch": 9.096179401993355,
+      "grad_norm": 0.004005803726613522,
+      "learning_rate": 1.8456995201181249e-07,
+      "loss": 0.0005,
+      "step": 9000
+    },
+    {
+      "epoch": 9.099501661129569,
+      "eval_accuracy": 0.987546699875467,
+      "eval_loss": 0.052565645426511765,
+      "eval_runtime": 362.3648,
+      "eval_samples_per_second": 2.216,
+      "eval_steps_per_second": 1.109,
+      "step": 9030
+    },
+    {
+      "epoch": 9.099501661129569,
+      "step": 9030,
+      "total_flos": 9.006226676074414e+19,
+      "train_loss": 1.7522039692807667,
+      "train_runtime": 33181.045,
+      "train_samples_per_second": 2.177,
+      "train_steps_per_second": 0.272
+    },
+    {
+      "epoch": 9.099501661129569,
+      "eval_accuracy": 0.9286833855799373,
+      "eval_loss": 0.38447505235671997,
+      "eval_runtime": 537.4022,
+      "eval_samples_per_second": 2.374,
+      "eval_steps_per_second": 1.187,
+      "step": 9030
+    }
+  ],
+  "logging_steps": 100,
+  "max_steps": 9030,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 9223372036854775807,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 9.006226676074414e+19,
+  "train_batch_size": 2,
+  "trial_name": null,
+  "trial_params": null
+}