End of training

Browse files

Files changed (7) hide show

README.md +2 -2
all_results.json +8 -0
confusion_matrix_kfold_fold_9.png +0 -0
confusion_matrix_test_fold_9.png +0 -0
confusion_matrix_trainfold_fold_9.png +0 -0
test_results.json +8 -0
trainer_state.json +771 -0

README.md CHANGED Viewed

@@ -18,8 +18,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [MCG-NJU/videomae-base](https://huggingface.co/MCG-NJU/videomae-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0218
-- Accuracy: 0.9950
 ## Model description

 This model is a fine-tuned version of [MCG-NJU/videomae-base](https://huggingface.co/MCG-NJU/videomae-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.5166
+- Accuracy: 0.8934
 ## Model description

all_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 9.099501661129569,
+    "eval_accuracy": 0.8934169278996865,
+    "eval_loss": 0.5165748596191406,
+    "eval_runtime": 353.997,
+    "eval_samples_per_second": 3.605,
+    "eval_steps_per_second": 1.802
+}

confusion_matrix_kfold_fold_9.png ADDED Viewed

confusion_matrix_test_fold_9.png ADDED Viewed

confusion_matrix_trainfold_fold_9.png ADDED Viewed

test_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 9.099501661129569,
+    "eval_accuracy": 0.8934169278996865,
+    "eval_loss": 0.5165748596191406,
+    "eval_runtime": 353.997,
+    "eval_samples_per_second": 3.605,
+    "eval_steps_per_second": 1.802
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,771 @@

+{
+  "best_metric": 0.9950186799501868,
+  "best_model_checkpoint": "/media/cse/HDD/Shawon/shawon/10 fold timesformer/VideoMAE_default_fold__8__10_epoch_Aug_batch_1_4_BdSLW60/checkpoint-9030",
+  "epoch": 9.099501661129569,
+  "eval_steps": 500,
+  "global_step": 9030,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.01107419712070875,
+      "grad_norm": 32.334835052490234,
+      "learning_rate": 5.537098560354375e-06,
+      "loss": 16.5679,
+      "step": 100
+    },
+    {
+      "epoch": 0.0221483942414175,
+      "grad_norm": 32.082523345947266,
+      "learning_rate": 1.107419712070875e-05,
+      "loss": 16.4682,
+      "step": 200
+    },
+    {
+      "epoch": 0.03322259136212625,
+      "grad_norm": 29.525415420532227,
+      "learning_rate": 1.6611295681063124e-05,
+      "loss": 16.414,
+      "step": 300
+    },
+    {
+      "epoch": 0.044296788482835,
+      "grad_norm": 27.141206741333008,
+      "learning_rate": 2.21483942414175e-05,
+      "loss": 16.2142,
+      "step": 400
+    },
+    {
+      "epoch": 0.05537098560354374,
+      "grad_norm": 33.727516174316406,
+      "learning_rate": 2.7685492801771873e-05,
+      "loss": 14.8236,
+      "step": 500
+    },
+    {
+      "epoch": 0.0664451827242525,
+      "grad_norm": 48.193450927734375,
+      "learning_rate": 3.322259136212625e-05,
+      "loss": 12.3716,
+      "step": 600
+    },
+    {
+      "epoch": 0.07751937984496124,
+      "grad_norm": 44.83864974975586,
+      "learning_rate": 3.875968992248062e-05,
+      "loss": 10.2729,
+      "step": 700
+    },
+    {
+      "epoch": 0.08859357696567,
+      "grad_norm": 50.79475021362305,
+      "learning_rate": 4.4296788482835e-05,
+      "loss": 8.5405,
+      "step": 800
+    },
+    {
+      "epoch": 0.09966777408637874,
+      "grad_norm": 42.04021072387695,
+      "learning_rate": 4.983388704318937e-05,
+      "loss": 6.2832,
+      "step": 900
+    },
+    {
+      "epoch": 0.1,
+      "eval_accuracy": 0.663760896637609,
+      "eval_loss": 1.3872833251953125,
+      "eval_runtime": 243.25,
+      "eval_samples_per_second": 3.301,
+      "eval_steps_per_second": 1.653,
+      "step": 903
+    },
+    {
+      "epoch": 1.010686600221484,
+      "grad_norm": 41.05415344238281,
+      "learning_rate": 4.940322382182848e-05,
+      "loss": 5.3027,
+      "step": 1000
+    },
+    {
+      "epoch": 1.0217607973421927,
+      "grad_norm": 43.8326416015625,
+      "learning_rate": 4.878799064845577e-05,
+      "loss": 3.7644,
+      "step": 1100
+    },
+    {
+      "epoch": 1.0328349944629014,
+      "grad_norm": 58.01288604736328,
+      "learning_rate": 4.8172757475083056e-05,
+      "loss": 3.042,
+      "step": 1200
+    },
+    {
+      "epoch": 1.0439091915836103,
+      "grad_norm": 70.05992126464844,
+      "learning_rate": 4.755752430171035e-05,
+      "loss": 2.6035,
+      "step": 1300
+    },
+    {
+      "epoch": 1.054983388704319,
+      "grad_norm": 77.99320983886719,
+      "learning_rate": 4.694229112833764e-05,
+      "loss": 2.1544,
+      "step": 1400
+    },
+    {
+      "epoch": 1.0660575858250276,
+      "grad_norm": 82.49065399169922,
+      "learning_rate": 4.6327057954964936e-05,
+      "loss": 1.8055,
+      "step": 1500
+    },
+    {
+      "epoch": 1.0771317829457365,
+      "grad_norm": 7.742678165435791,
+      "learning_rate": 4.571182478159223e-05,
+      "loss": 1.5851,
+      "step": 1600
+    },
+    {
+      "epoch": 1.0882059800664452,
+      "grad_norm": 31.726713180541992,
+      "learning_rate": 4.5096591608219516e-05,
+      "loss": 1.2787,
+      "step": 1700
+    },
+    {
+      "epoch": 1.0992801771871539,
+      "grad_norm": 19.243579864501953,
+      "learning_rate": 4.448135843484681e-05,
+      "loss": 1.3796,
+      "step": 1800
+    },
+    {
+      "epoch": 1.1000553709856036,
+      "eval_accuracy": 0.9215442092154421,
+      "eval_loss": 0.31225696206092834,
+      "eval_runtime": 241.7159,
+      "eval_samples_per_second": 3.322,
+      "eval_steps_per_second": 1.663,
+      "step": 1807
+    },
+    {
+      "epoch": 2.010299003322259,
+      "grad_norm": 20.470407485961914,
+      "learning_rate": 4.38661252614741e-05,
+      "loss": 0.8224,
+      "step": 1900
+    },
+    {
+      "epoch": 2.021373200442968,
+      "grad_norm": 6.891818523406982,
+      "learning_rate": 4.325089208810139e-05,
+      "loss": 0.8476,
+      "step": 2000
+    },
+    {
+      "epoch": 2.0324473975636765,
+      "grad_norm": 62.1899528503418,
+      "learning_rate": 4.263565891472868e-05,
+      "loss": 0.88,
+      "step": 2100
+    },
+    {
+      "epoch": 2.0435215946843854,
+      "grad_norm": 31.87169647216797,
+      "learning_rate": 4.2020425741355975e-05,
+      "loss": 0.6384,
+      "step": 2200
+    },
+    {
+      "epoch": 2.0545957918050943,
+      "grad_norm": 5.144892692565918,
+      "learning_rate": 4.140519256798327e-05,
+      "loss": 0.6451,
+      "step": 2300
+    },
+    {
+      "epoch": 2.065669988925803,
+      "grad_norm": 61.46706008911133,
+      "learning_rate": 4.078995939461056e-05,
+      "loss": 0.4655,
+      "step": 2400
+    },
+    {
+      "epoch": 2.0767441860465117,
+      "grad_norm": 2.7628982067108154,
+      "learning_rate": 4.0174726221237855e-05,
+      "loss": 0.5972,
+      "step": 2500
+    },
+    {
+      "epoch": 2.0878183831672206,
+      "grad_norm": 16.27060317993164,
+      "learning_rate": 3.955949304786514e-05,
+      "loss": 0.5972,
+      "step": 2600
+    },
+    {
+      "epoch": 2.098892580287929,
+      "grad_norm": 7.138740062713623,
+      "learning_rate": 3.8944259874492434e-05,
+      "loss": 0.311,
+      "step": 2700
+    },
+    {
+      "epoch": 2.1,
+      "eval_accuracy": 0.9526774595267746,
+      "eval_loss": 0.16346044838428497,
+      "eval_runtime": 243.2026,
+      "eval_samples_per_second": 3.302,
+      "eval_steps_per_second": 1.653,
+      "step": 2710
+    },
+    {
+      "epoch": 3.009911406423034,
+      "grad_norm": 32.57714080810547,
+      "learning_rate": 3.832902670111973e-05,
+      "loss": 0.2697,
+      "step": 2800
+    },
+    {
+      "epoch": 3.020985603543743,
+      "grad_norm": 2.181366443634033,
+      "learning_rate": 3.7713793527747014e-05,
+      "loss": 0.3771,
+      "step": 2900
+    },
+    {
+      "epoch": 3.032059800664452,
+      "grad_norm": 0.17715582251548767,
+      "learning_rate": 3.7098560354374314e-05,
+      "loss": 0.364,
+      "step": 3000
+    },
+    {
+      "epoch": 3.0431339977851604,
+      "grad_norm": 74.82624053955078,
+      "learning_rate": 3.64833271810016e-05,
+      "loss": 0.2841,
+      "step": 3100
+    },
+    {
+      "epoch": 3.0542081949058693,
+      "grad_norm": 0.15879639983177185,
+      "learning_rate": 3.5868094007628894e-05,
+      "loss": 0.3189,
+      "step": 3200
+    },
+    {
+      "epoch": 3.065282392026578,
+      "grad_norm": 0.40148216485977173,
+      "learning_rate": 3.525286083425619e-05,
+      "loss": 0.2459,
+      "step": 3300
+    },
+    {
+      "epoch": 3.076356589147287,
+      "grad_norm": 4.050868034362793,
+      "learning_rate": 3.463762766088347e-05,
+      "loss": 0.2754,
+      "step": 3400
+    },
+    {
+      "epoch": 3.0874307862679955,
+      "grad_norm": 0.07379398494958878,
+      "learning_rate": 3.4022394487510767e-05,
+      "loss": 0.0931,
+      "step": 3500
+    },
+    {
+      "epoch": 3.0985049833887044,
+      "grad_norm": 1.5800195932388306,
+      "learning_rate": 3.340716131413806e-05,
+      "loss": 0.1077,
+      "step": 3600
+    },
+    {
+      "epoch": 3.1000553709856034,
+      "eval_accuracy": 0.9738480697384807,
+      "eval_loss": 0.10133728384971619,
+      "eval_runtime": 240.4329,
+      "eval_samples_per_second": 3.34,
+      "eval_steps_per_second": 1.672,
+      "step": 3614
+    },
+    {
+      "epoch": 4.0095238095238095,
+      "grad_norm": 0.2016027569770813,
+      "learning_rate": 3.2791928140765346e-05,
+      "loss": 0.0955,
+      "step": 3700
+    },
+    {
+      "epoch": 4.020598006644518,
+      "grad_norm": 0.13384506106376648,
+      "learning_rate": 3.2176694967392646e-05,
+      "loss": 0.2288,
+      "step": 3800
+    },
+    {
+      "epoch": 4.031672203765227,
+      "grad_norm": 0.3776722848415375,
+      "learning_rate": 3.156146179401994e-05,
+      "loss": 0.1254,
+      "step": 3900
+    },
+    {
+      "epoch": 4.042746400885936,
+      "grad_norm": 0.28055495023727417,
+      "learning_rate": 3.0946228620647226e-05,
+      "loss": 0.1256,
+      "step": 4000
+    },
+    {
+      "epoch": 4.053820598006644,
+      "grad_norm": 0.07850215584039688,
+      "learning_rate": 3.033099544727452e-05,
+      "loss": 0.0795,
+      "step": 4100
+    },
+    {
+      "epoch": 4.064894795127353,
+      "grad_norm": 170.31246948242188,
+      "learning_rate": 2.971576227390181e-05,
+      "loss": 0.0509,
+      "step": 4200
+    },
+    {
+      "epoch": 4.075968992248062,
+      "grad_norm": 1.1608444452285767,
+      "learning_rate": 2.91005291005291e-05,
+      "loss": 0.1694,
+      "step": 4300
+    },
+    {
+      "epoch": 4.087043189368771,
+      "grad_norm": 0.06297096610069275,
+      "learning_rate": 2.8485295927156392e-05,
+      "loss": 0.1654,
+      "step": 4400
+    },
+    {
+      "epoch": 4.09811738648948,
+      "grad_norm": 0.1834813803434372,
+      "learning_rate": 2.787006275378369e-05,
+      "loss": 0.125,
+      "step": 4500
+    },
+    {
+      "epoch": 4.1,
+      "eval_accuracy": 0.9676214196762142,
+      "eval_loss": 0.15175354480743408,
+      "eval_runtime": 241.1728,
+      "eval_samples_per_second": 3.33,
+      "eval_steps_per_second": 1.667,
+      "step": 4517
+    },
+    {
+      "epoch": 5.009136212624584,
+      "grad_norm": 1.12752103805542,
+      "learning_rate": 2.725482958041098e-05,
+      "loss": 0.1936,
+      "step": 4600
+    },
+    {
+      "epoch": 5.020210409745293,
+      "grad_norm": 0.0848553478717804,
+      "learning_rate": 2.6639596407038268e-05,
+      "loss": 0.034,
+      "step": 4700
+    },
+    {
+      "epoch": 5.031284606866002,
+      "grad_norm": 0.013141270726919174,
+      "learning_rate": 2.602436323366556e-05,
+      "loss": 0.0777,
+      "step": 4800
+    },
+    {
+      "epoch": 5.042358803986711,
+      "grad_norm": 0.02095056138932705,
+      "learning_rate": 2.540913006029285e-05,
+      "loss": 0.081,
+      "step": 4900
+    },
+    {
+      "epoch": 5.05343300110742,
+      "grad_norm": 17.830732345581055,
+      "learning_rate": 2.479389688692014e-05,
+      "loss": 0.0778,
+      "step": 5000
+    },
+    {
+      "epoch": 5.064507198228129,
+      "grad_norm": 0.08031286299228668,
+      "learning_rate": 2.4178663713547438e-05,
+      "loss": 0.0259,
+      "step": 5100
+    },
+    {
+      "epoch": 5.075581395348837,
+      "grad_norm": 0.30868440866470337,
+      "learning_rate": 2.3563430540174727e-05,
+      "loss": 0.123,
+      "step": 5200
+    },
+    {
+      "epoch": 5.086655592469546,
+      "grad_norm": 0.023195987567305565,
+      "learning_rate": 2.2948197366802017e-05,
+      "loss": 0.0355,
+      "step": 5300
+    },
+    {
+      "epoch": 5.097729789590255,
+      "grad_norm": 0.010711547918617725,
+      "learning_rate": 2.233296419342931e-05,
+      "loss": 0.1031,
+      "step": 5400
+    },
+    {
+      "epoch": 5.100055370985603,
+      "eval_accuracy": 0.9863013698630136,
+      "eval_loss": 0.046052780002355576,
+      "eval_runtime": 239.3825,
+      "eval_samples_per_second": 3.354,
+      "eval_steps_per_second": 1.679,
+      "step": 5421
+    },
+    {
+      "epoch": 6.00874861572536,
+      "grad_norm": 0.013949241489171982,
+      "learning_rate": 2.1717731020056604e-05,
+      "loss": 0.0928,
+      "step": 5500
+    },
+    {
+      "epoch": 6.019822812846068,
+      "grad_norm": 3.2788469791412354,
+      "learning_rate": 2.1102497846683894e-05,
+      "loss": 0.1632,
+      "step": 5600
+    },
+    {
+      "epoch": 6.030897009966777,
+      "grad_norm": 0.0950816348195076,
+      "learning_rate": 2.0487264673311183e-05,
+      "loss": 0.0995,
+      "step": 5700
+    },
+    {
+      "epoch": 6.041971207087486,
+      "grad_norm": 0.009910553693771362,
+      "learning_rate": 1.987203149993848e-05,
+      "loss": 0.1005,
+      "step": 5800
+    },
+    {
+      "epoch": 6.053045404208195,
+      "grad_norm": 0.14191927015781403,
+      "learning_rate": 1.925679832656577e-05,
+      "loss": 0.0874,
+      "step": 5900
+    },
+    {
+      "epoch": 6.064119601328904,
+      "grad_norm": 0.010242072865366936,
+      "learning_rate": 1.864156515319306e-05,
+      "loss": 0.0226,
+      "step": 6000
+    },
+    {
+      "epoch": 6.075193798449613,
+      "grad_norm": 0.02359813079237938,
+      "learning_rate": 1.8026331979820353e-05,
+      "loss": 0.0881,
+      "step": 6100
+    },
+    {
+      "epoch": 6.086267995570321,
+      "grad_norm": 0.014143938198685646,
+      "learning_rate": 1.7411098806447646e-05,
+      "loss": 0.0015,
+      "step": 6200
+    },
+    {
+      "epoch": 6.09734219269103,
+      "grad_norm": 0.007690469268709421,
+      "learning_rate": 1.6795865633074936e-05,
+      "loss": 0.0235,
+      "step": 6300
+    },
+    {
+      "epoch": 6.1,
+      "eval_accuracy": 0.9850560398505604,
+      "eval_loss": 0.07657956331968307,
+      "eval_runtime": 232.0013,
+      "eval_samples_per_second": 3.461,
+      "eval_steps_per_second": 1.733,
+      "step": 6324
+    },
+    {
+      "epoch": 7.008361018826135,
+      "grad_norm": 0.029869280755519867,
+      "learning_rate": 1.6180632459702226e-05,
+      "loss": 0.0093,
+      "step": 6400
+    },
+    {
+      "epoch": 7.019435215946844,
+      "grad_norm": 0.12701760232448578,
+      "learning_rate": 1.556539928632952e-05,
+      "loss": 0.0858,
+      "step": 6500
+    },
+    {
+      "epoch": 7.030509413067553,
+      "grad_norm": 0.00914853997528553,
+      "learning_rate": 1.4950166112956812e-05,
+      "loss": 0.0149,
+      "step": 6600
+    },
+    {
+      "epoch": 7.041583610188261,
+      "grad_norm": 0.006422719918191433,
+      "learning_rate": 1.4334932939584104e-05,
+      "loss": 0.0553,
+      "step": 6700
+    },
+    {
+      "epoch": 7.05265780730897,
+      "grad_norm": 0.006200818344950676,
+      "learning_rate": 1.3719699766211393e-05,
+      "loss": 0.0015,
+      "step": 6800
+    },
+    {
+      "epoch": 7.063732004429679,
+      "grad_norm": 0.006208031438291073,
+      "learning_rate": 1.3104466592838688e-05,
+      "loss": 0.0662,
+      "step": 6900
+    },
+    {
+      "epoch": 7.074806201550388,
+      "grad_norm": 0.07536833733320236,
+      "learning_rate": 1.2489233419465978e-05,
+      "loss": 0.0497,
+      "step": 7000
+    },
+    {
+      "epoch": 7.0858803986710965,
+      "grad_norm": 0.005990630015730858,
+      "learning_rate": 1.187400024609327e-05,
+      "loss": 0.02,
+      "step": 7100
+    },
+    {
+      "epoch": 7.096954595791805,
+      "grad_norm": 0.005243655759841204,
+      "learning_rate": 1.1258767072720563e-05,
+      "loss": 0.025,
+      "step": 7200
+    },
+    {
+      "epoch": 7.100055370985603,
+      "eval_accuracy": 0.9937733499377335,
+      "eval_loss": 0.030318038538098335,
+      "eval_runtime": 234.3879,
+      "eval_samples_per_second": 3.426,
+      "eval_steps_per_second": 1.715,
+      "step": 7228
+    },
+    {
+      "epoch": 8.007973421926911,
+      "grad_norm": 0.0038999952375888824,
+      "learning_rate": 1.0643533899347853e-05,
+      "loss": 0.0314,
+      "step": 7300
+    },
+    {
+      "epoch": 8.019047619047619,
+      "grad_norm": 0.010756886564195156,
+      "learning_rate": 1.0028300725975146e-05,
+      "loss": 0.003,
+      "step": 7400
+    },
+    {
+      "epoch": 8.030121816168327,
+      "grad_norm": 0.022609569132328033,
+      "learning_rate": 9.413067552602436e-06,
+      "loss": 0.0127,
+      "step": 7500
+    },
+    {
+      "epoch": 8.041196013289037,
+      "grad_norm": 0.006152728106826544,
+      "learning_rate": 8.797834379229729e-06,
+      "loss": 0.0078,
+      "step": 7600
+    },
+    {
+      "epoch": 8.052270210409745,
+      "grad_norm": 0.026683639734983444,
+      "learning_rate": 8.18260120585702e-06,
+      "loss": 0.0365,
+      "step": 7700
+    },
+    {
+      "epoch": 8.063344407530455,
+      "grad_norm": 0.0047752223908901215,
+      "learning_rate": 7.567368032484312e-06,
+      "loss": 0.0482,
+      "step": 7800
+    },
+    {
+      "epoch": 8.074418604651163,
+      "grad_norm": 0.00478146830573678,
+      "learning_rate": 6.952134859111603e-06,
+      "loss": 0.0013,
+      "step": 7900
+    },
+    {
+      "epoch": 8.085492801771872,
+      "grad_norm": 0.004836659412831068,
+      "learning_rate": 6.336901685738895e-06,
+      "loss": 0.0005,
+      "step": 8000
+    },
+    {
+      "epoch": 8.09656699889258,
+      "grad_norm": 304.2967224121094,
+      "learning_rate": 5.7216685123661875e-06,
+      "loss": 0.0611,
+      "step": 8100
+    },
+    {
+      "epoch": 8.1,
+      "eval_accuracy": 0.9925280199252802,
+      "eval_loss": 0.03501025214791298,
+      "eval_runtime": 230.6453,
+      "eval_samples_per_second": 3.482,
+      "eval_steps_per_second": 1.743,
+      "step": 8131
+    },
+    {
+      "epoch": 9.007585825027686,
+      "grad_norm": 0.019594158977270126,
+      "learning_rate": 5.106435338993479e-06,
+      "loss": 0.0018,
+      "step": 8200
+    },
+    {
+      "epoch": 9.018660022148394,
+      "grad_norm": 0.004379997495561838,
+      "learning_rate": 4.4912021656207705e-06,
+      "loss": 0.0278,
+      "step": 8300
+    },
+    {
+      "epoch": 9.029734219269104,
+      "grad_norm": 0.004317181650549173,
+      "learning_rate": 3.875968992248062e-06,
+      "loss": 0.0005,
+      "step": 8400
+    },
+    {
+      "epoch": 9.040808416389812,
+      "grad_norm": 0.003784640459343791,
+      "learning_rate": 3.260735818875354e-06,
+      "loss": 0.021,
+      "step": 8500
+    },
+    {
+      "epoch": 9.05188261351052,
+      "grad_norm": 0.004987145774066448,
+      "learning_rate": 2.6455026455026455e-06,
+      "loss": 0.0006,
+      "step": 8600
+    },
+    {
+      "epoch": 9.06295681063123,
+      "grad_norm": 0.018100284039974213,
+      "learning_rate": 2.0302694721299375e-06,
+      "loss": 0.0005,
+      "step": 8700
+    },
+    {
+      "epoch": 9.074031007751937,
+      "grad_norm": 0.006015971302986145,
+      "learning_rate": 1.415036298757229e-06,
+      "loss": 0.0005,
+      "step": 8800
+    },
+    {
+      "epoch": 9.085105204872647,
+      "grad_norm": 0.01569472998380661,
+      "learning_rate": 7.998031253845208e-07,
+      "loss": 0.0908,
+      "step": 8900
+    },
+    {
+      "epoch": 9.096179401993355,
+      "grad_norm": 0.0031440581660717726,
+      "learning_rate": 1.8456995201181249e-07,
+      "loss": 0.0071,
+      "step": 9000
+    },
+    {
+      "epoch": 9.099501661129569,
+      "eval_accuracy": 0.9950186799501868,
+      "eval_loss": 0.021772464737296104,
+      "eval_runtime": 237.3089,
+      "eval_samples_per_second": 3.384,
+      "eval_steps_per_second": 1.694,
+      "step": 9030
+    },
+    {
+      "epoch": 9.099501661129569,
+      "step": 9030,
+      "total_flos": 9.006226676074414e+19,
+      "train_loss": 1.6864825968290262,
+      "train_runtime": 29784.8769,
+      "train_samples_per_second": 2.425,
+      "train_steps_per_second": 0.303
+    },
+    {
+      "epoch": 9.099501661129569,
+      "eval_accuracy": 0.8934169278996865,
+      "eval_loss": 0.5165748596191406,
+      "eval_runtime": 353.997,
+      "eval_samples_per_second": 3.605,
+      "eval_steps_per_second": 1.802,
+      "step": 9030
+    }
+  ],
+  "logging_steps": 100,
+  "max_steps": 9030,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 9223372036854775807,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 9.006226676074414e+19,
+  "train_batch_size": 2,
+  "trial_name": null,
+  "trial_params": null
+}