barten
/

vit-base-patch16-224-brand

@@ -1,8 +1,8 @@
 {
-    "epoch": 14.89,
-    "total_flos": 7.877470546062803e+18,
-    "train_loss": 0.5140632056590146,
-    "train_runtime": 3982.2883,
-    "train_samples_per_second": 25.704,
-    "train_steps_per_second": 0.399
 }

 {
+    "epoch": 14.96,
+    "total_flos": 6.546875329145733e+18,
+    "train_loss": 0.44751356618874,
+    "train_runtime": 3414.1758,
+    "train_samples_per_second": 24.814,
+    "train_steps_per_second": 0.387
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 14.89,
-    "total_flos": 7.877470546062803e+18,
-    "train_loss": 0.5140632056590146,
-    "train_runtime": 3982.2883,
-    "train_samples_per_second": 25.704,
-    "train_steps_per_second": 0.399
 }

 {
+    "epoch": 14.96,
+    "total_flos": 6.546875329145733e+18,
+    "train_loss": 0.44751356618874,
+    "train_runtime": 3414.1758,
+    "train_samples_per_second": 24.814,
+    "train_steps_per_second": 0.387
 }

trainer_state.json CHANGED Viewed

@@ -1,1117 +1,955 @@
 {
-  "best_metric": 0.8398058252427184,
-  "best_model_checkpoint": "vit-base-patch16-224-brand/checkpoint-1590",
-  "epoch": 14.894613583138174,
   "eval_steps": 500,
-  "global_step": 1590,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.09,
-      "learning_rate": 3.1446540880503146e-06,
-      "loss": 2.3942,
       "step": 10
     },
     {
-      "epoch": 0.19,
-      "learning_rate": 6.289308176100629e-06,
-      "loss": 2.3923,
       "step": 20
     },
     {
-      "epoch": 0.28,
-      "learning_rate": 9.433962264150944e-06,
-      "loss": 2.3106,
       "step": 30
     },
     {
-      "epoch": 0.37,
-      "learning_rate": 1.2578616352201259e-05,
-      "loss": 2.2216,
       "step": 40
     },
     {
-      "epoch": 0.47,
-      "learning_rate": 1.572327044025157e-05,
-      "loss": 2.0774,
       "step": 50
     },
     {
-      "epoch": 0.56,
-      "learning_rate": 1.8867924528301888e-05,
-      "loss": 2.0392,
       "step": 60
     },
     {
-      "epoch": 0.66,
-      "learning_rate": 2.2012578616352204e-05,
-      "loss": 1.8905,
       "step": 70
     },
     {
-      "epoch": 0.75,
-      "learning_rate": 2.5157232704402517e-05,
-      "loss": 1.8387,
       "step": 80
     },
     {
-      "epoch": 0.84,
-      "learning_rate": 2.830188679245283e-05,
-      "loss": 1.7255,
-      "step": 90
     },
     {
-      "epoch": 0.94,
-      "learning_rate": 3.144654088050314e-05,
-      "loss": 1.6631,
-      "step": 100
     },
     {
-      "epoch": 0.99,
-      "eval_accuracy": 0.5494263018534863,
-      "eval_loss": 1.4344048500061035,
-      "eval_runtime": 29.697,
-      "eval_samples_per_second": 76.304,
-      "eval_steps_per_second": 4.782,
-      "step": 106
     },
     {
-      "epoch": 1.03,
-      "learning_rate": 3.4591194968553456e-05,
-      "loss": 1.5273,
       "step": 110
     },
     {
-      "epoch": 1.12,
-      "learning_rate": 3.7735849056603776e-05,
-      "loss": 1.4406,
       "step": 120
     },
     {
-      "epoch": 1.22,
-      "learning_rate": 4.088050314465409e-05,
-      "loss": 1.4031,
       "step": 130
     },
     {
-      "epoch": 1.31,
-      "learning_rate": 4.402515723270441e-05,
-      "loss": 1.2573,
       "step": 140
     },
     {
-      "epoch": 1.41,
-      "learning_rate": 4.716981132075472e-05,
-      "loss": 1.2428,
       "step": 150
     },
     {
-      "epoch": 1.5,
-      "learning_rate": 4.9965059399021665e-05,
-      "loss": 1.1119,
       "step": 160
     },
     {
-      "epoch": 1.59,
-      "learning_rate": 4.9615653389238295e-05,
-      "loss": 1.2198,
       "step": 170
     },
     {
-      "epoch": 1.69,
-      "learning_rate": 4.9266247379454926e-05,
-      "loss": 1.0555,
       "step": 180
     },
     {
-      "epoch": 1.78,
-      "learning_rate": 4.891684136967156e-05,
-      "loss": 1.0781,
       "step": 190
     },
     {
-      "epoch": 1.87,
-      "learning_rate": 4.856743535988819e-05,
-      "loss": 1.0989,
       "step": 200
     },
     {
-      "epoch": 1.97,
-      "learning_rate": 4.8218029350104823e-05,
-      "loss": 1.069,
       "step": 210
     },
     {
-      "epoch": 2.0,
-      "eval_accuracy": 0.7281553398058253,
-      "eval_loss": 0.8916863799095154,
-      "eval_runtime": 29.9218,
-      "eval_samples_per_second": 75.731,
-      "eval_steps_per_second": 4.746,
-      "step": 213
-    },
-    {
-      "epoch": 2.06,
-      "learning_rate": 4.7868623340321454e-05,
-      "loss": 0.9655,
       "step": 220
     },
     {
-      "epoch": 2.15,
-      "learning_rate": 4.7519217330538084e-05,
-      "loss": 0.8571,
       "step": 230
     },
     {
-      "epoch": 2.25,
-      "learning_rate": 4.716981132075472e-05,
-      "loss": 0.8375,
       "step": 240
     },
     {
-      "epoch": 2.34,
-      "learning_rate": 4.682040531097135e-05,
-      "loss": 0.8631,
       "step": 250
     },
     {
-      "epoch": 2.44,
-      "learning_rate": 4.647099930118798e-05,
-      "loss": 0.8991,
       "step": 260
     },
     {
-      "epoch": 2.53,
-      "learning_rate": 4.612159329140461e-05,
-      "loss": 0.9349,
       "step": 270
     },
     {
-      "epoch": 2.62,
-      "learning_rate": 4.577218728162125e-05,
-      "loss": 0.8766,
       "step": 280
     },
     {
-      "epoch": 2.72,
-      "learning_rate": 4.542278127183788e-05,
-      "loss": 0.8294,
       "step": 290
     },
     {
-      "epoch": 2.81,
-      "learning_rate": 4.5073375262054504e-05,
-      "loss": 0.8507,
       "step": 300
     },
     {
-      "epoch": 2.9,
-      "learning_rate": 4.472396925227114e-05,
-      "loss": 0.7529,
       "step": 310
     },
     {
-      "epoch": 3.0,
-      "learning_rate": 4.437456324248777e-05,
-      "loss": 0.801,
       "step": 320
     },
     {
-      "epoch": 3.0,
-      "eval_accuracy": 0.7533097969991174,
-      "eval_loss": 0.7611907720565796,
-      "eval_runtime": 29.9179,
-      "eval_samples_per_second": 75.741,
-      "eval_steps_per_second": 4.746,
-      "step": 320
-    },
-    {
-      "epoch": 3.09,
-      "learning_rate": 4.402515723270441e-05,
-      "loss": 0.7598,
       "step": 330
     },
     {
-      "epoch": 3.19,
-      "learning_rate": 4.367575122292103e-05,
-      "loss": 0.6375,
       "step": 340
     },
     {
-      "epoch": 3.28,
-      "learning_rate": 4.332634521313767e-05,
-      "loss": 0.6634,
       "step": 350
     },
     {
-      "epoch": 3.37,
-      "learning_rate": 4.29769392033543e-05,
-      "loss": 0.6474,
       "step": 360
     },
     {
-      "epoch": 3.47,
-      "learning_rate": 4.262753319357093e-05,
-      "loss": 0.6328,
       "step": 370
     },
     {
-      "epoch": 3.56,
-      "learning_rate": 4.227812718378756e-05,
-      "loss": 0.6945,
       "step": 380
     },
     {
-      "epoch": 3.65,
-      "learning_rate": 4.192872117400419e-05,
-      "loss": 0.6194,
       "step": 390
     },
     {
-      "epoch": 3.75,
-      "learning_rate": 4.157931516422083e-05,
-      "loss": 0.6398,
       "step": 400
     },
     {
-      "epoch": 3.84,
-      "learning_rate": 4.122990915443746e-05,
-      "loss": 0.6756,
       "step": 410
     },
     {
-      "epoch": 3.93,
-      "learning_rate": 4.088050314465409e-05,
-      "loss": 0.6075,
       "step": 420
     },
     {
-      "epoch": 4.0,
-      "eval_accuracy": 0.792144748455428,
-      "eval_loss": 0.6522440314292908,
-      "eval_runtime": 29.5461,
-      "eval_samples_per_second": 76.694,
-      "eval_steps_per_second": 4.806,
-      "step": 427
-    },
-    {
-      "epoch": 4.03,
-      "learning_rate": 4.053109713487072e-05,
-      "loss": 0.5489,
       "step": 430
     },
     {
-      "epoch": 4.12,
-      "learning_rate": 4.018169112508735e-05,
-      "loss": 0.5316,
       "step": 440
     },
     {
-      "epoch": 4.22,
-      "learning_rate": 3.983228511530399e-05,
-      "loss": 0.523,
       "step": 450
     },
     {
-      "epoch": 4.31,
-      "learning_rate": 3.948287910552062e-05,
-      "loss": 0.5247,
       "step": 460
     },
     {
-      "epoch": 4.4,
-      "learning_rate": 3.913347309573725e-05,
-      "loss": 0.5356,
       "step": 470
     },
     {
-      "epoch": 4.5,
-      "learning_rate": 3.878406708595388e-05,
-      "loss": 0.5128,
       "step": 480
     },
     {
-      "epoch": 4.59,
-      "learning_rate": 3.8434661076170515e-05,
-      "loss": 0.5752,
       "step": 490
     },
     {
-      "epoch": 4.68,
-      "learning_rate": 3.8085255066387145e-05,
-      "loss": 0.5445,
       "step": 500
     },
     {
-      "epoch": 4.78,
-      "learning_rate": 3.7735849056603776e-05,
-      "loss": 0.5064,
       "step": 510
     },
     {
-      "epoch": 4.87,
-      "learning_rate": 3.7386443046820406e-05,
-      "loss": 0.508,
       "step": 520
     },
     {
-      "epoch": 4.96,
-      "learning_rate": 3.7037037037037037e-05,
-      "loss": 0.5046,
-      "step": 530
     },
     {
-      "epoch": 4.99,
-      "eval_accuracy": 0.8005295675198588,
-      "eval_loss": 0.6084854006767273,
-      "eval_runtime": 29.8921,
-      "eval_samples_per_second": 75.806,
-      "eval_steps_per_second": 4.75,
-      "step": 533
     },
     {
-      "epoch": 5.06,
-      "learning_rate": 3.6687631027253674e-05,
-      "loss": 0.4403,
       "step": 540
     },
     {
-      "epoch": 5.15,
-      "learning_rate": 3.6338225017470304e-05,
-      "loss": 0.3919,
       "step": 550
     },
     {
-      "epoch": 5.25,
-      "learning_rate": 3.5988819007686934e-05,
-      "loss": 0.4224,
       "step": 560
     },
     {
-      "epoch": 5.34,
-      "learning_rate": 3.5639412997903565e-05,
-      "loss": 0.4708,
       "step": 570
     },
     {
-      "epoch": 5.43,
-      "learning_rate": 3.52900069881202e-05,
-      "loss": 0.4206,
       "step": 580
     },
     {
-      "epoch": 5.53,
-      "learning_rate": 3.494060097833683e-05,
-      "loss": 0.4416,
       "step": 590
     },
     {
-      "epoch": 5.62,
-      "learning_rate": 3.4591194968553456e-05,
-      "loss": 0.4478,
       "step": 600
     },
     {
-      "epoch": 5.71,
-      "learning_rate": 3.424178895877009e-05,
-      "loss": 0.4403,
       "step": 610
     },
     {
-      "epoch": 5.81,
-      "learning_rate": 3.3892382948986724e-05,
-      "loss": 0.4428,
-      "step": 620
     },
     {
-      "epoch": 5.9,
-      "learning_rate": 3.354297693920336e-05,
-      "loss": 0.3941,
-      "step": 630
     },
     {
-      "epoch": 6.0,
-      "learning_rate": 3.3193570929419984e-05,
-      "loss": 0.4018,
-      "step": 640
     },
     {
-      "epoch": 6.0,
-      "eval_accuracy": 0.8022947925860547,
-      "eval_loss": 0.6132453680038452,
-      "eval_runtime": 30.1158,
-      "eval_samples_per_second": 75.243,
-      "eval_steps_per_second": 4.715,
       "step": 640
     },
     {
-      "epoch": 6.09,
-      "learning_rate": 3.284416491963662e-05,
-      "loss": 0.3719,
       "step": 650
     },
     {
-      "epoch": 6.18,
-      "learning_rate": 3.249475890985325e-05,
-      "loss": 0.3549,
       "step": 660
     },
     {
-      "epoch": 6.28,
-      "learning_rate": 3.214535290006988e-05,
-      "loss": 0.3866,
       "step": 670
     },
     {
-      "epoch": 6.37,
-      "learning_rate": 3.179594689028651e-05,
-      "loss": 0.4172,
       "step": 680
     },
     {
-      "epoch": 6.46,
-      "learning_rate": 3.144654088050314e-05,
-      "loss": 0.3798,
       "step": 690
     },
     {
-      "epoch": 6.56,
-      "learning_rate": 3.109713487071978e-05,
-      "loss": 0.3288,
       "step": 700
     },
     {
-      "epoch": 6.65,
-      "learning_rate": 3.074772886093641e-05,
-      "loss": 0.3829,
       "step": 710
     },
     {
-      "epoch": 6.74,
-      "learning_rate": 3.0398322851153044e-05,
-      "loss": 0.3771,
       "step": 720
     },
     {
-      "epoch": 6.84,
-      "learning_rate": 3.004891684136967e-05,
-      "loss": 0.3637,
       "step": 730
     },
     {
-      "epoch": 6.93,
-      "learning_rate": 2.9699510831586302e-05,
-      "loss": 0.3641,
       "step": 740
     },
     {
-      "epoch": 7.0,
-      "eval_accuracy": 0.8292144748455428,
-      "eval_loss": 0.5509597659111023,
-      "eval_runtime": 29.6593,
-      "eval_samples_per_second": 76.401,
-      "eval_steps_per_second": 4.788,
-      "step": 747
-    },
-    {
-      "epoch": 7.03,
-      "learning_rate": 2.935010482180294e-05,
-      "loss": 0.373,
       "step": 750
     },
     {
-      "epoch": 7.12,
-      "learning_rate": 2.9000698812019566e-05,
-      "loss": 0.3128,
       "step": 760
     },
     {
-      "epoch": 7.21,
-      "learning_rate": 2.8651292802236203e-05,
-      "loss": 0.3177,
       "step": 770
     },
     {
-      "epoch": 7.31,
-      "learning_rate": 2.830188679245283e-05,
-      "loss": 0.2853,
       "step": 780
     },
     {
-      "epoch": 7.4,
-      "learning_rate": 2.7952480782669467e-05,
-      "loss": 0.2969,
       "step": 790
     },
     {
-      "epoch": 7.49,
-      "learning_rate": 2.7603074772886094e-05,
-      "loss": 0.2786,
       "step": 800
     },
     {
-      "epoch": 7.59,
-      "learning_rate": 2.7253668763102725e-05,
-      "loss": 0.2653,
       "step": 810
     },
     {
-      "epoch": 7.68,
-      "learning_rate": 2.690426275331936e-05,
-      "loss": 0.2388,
       "step": 820
     },
     {
-      "epoch": 7.78,
-      "learning_rate": 2.655485674353599e-05,
-      "loss": 0.2941,
       "step": 830
     },
     {
-      "epoch": 7.87,
-      "learning_rate": 2.6205450733752623e-05,
-      "loss": 0.3248,
       "step": 840
     },
     {
-      "epoch": 7.96,
-      "learning_rate": 2.5856044723969253e-05,
-      "loss": 0.4003,
       "step": 850
     },
     {
-      "epoch": 8.0,
-      "eval_accuracy": 0.824801412180053,
-      "eval_loss": 0.530396580696106,
-      "eval_runtime": 29.7498,
-      "eval_samples_per_second": 76.169,
-      "eval_steps_per_second": 4.773,
-      "step": 854
-    },
-    {
-      "epoch": 8.06,
-      "learning_rate": 2.5506638714185887e-05,
-      "loss": 0.2842,
       "step": 860
     },
     {
-      "epoch": 8.15,
-      "learning_rate": 2.5157232704402517e-05,
-      "loss": 0.2404,
       "step": 870
     },
     {
-      "epoch": 8.24,
-      "learning_rate": 2.4807826694619148e-05,
-      "loss": 0.2525,
       "step": 880
     },
     {
-      "epoch": 8.34,
-      "learning_rate": 2.445842068483578e-05,
-      "loss": 0.2415,
       "step": 890
     },
     {
-      "epoch": 8.43,
-      "learning_rate": 2.4109014675052412e-05,
-      "loss": 0.222,
       "step": 900
     },
     {
-      "epoch": 8.52,
-      "learning_rate": 2.3759608665269042e-05,
-      "loss": 0.2461,
       "step": 910
     },
     {
-      "epoch": 8.62,
-      "learning_rate": 2.3410202655485676e-05,
-      "loss": 0.2533,
       "step": 920
     },
     {
-      "epoch": 8.71,
-      "learning_rate": 2.3060796645702306e-05,
-      "loss": 0.267,
       "step": 930
     },
     {
-      "epoch": 8.81,
-      "learning_rate": 2.271139063591894e-05,
-      "loss": 0.2572,
       "step": 940
     },
     {
-      "epoch": 8.9,
-      "learning_rate": 2.236198462613557e-05,
-      "loss": 0.2263,
       "step": 950
     },
     {
-      "epoch": 8.99,
-      "learning_rate": 2.2012578616352204e-05,
-      "loss": 0.3142,
       "step": 960
     },
     {
-      "epoch": 8.99,
-      "eval_accuracy": 0.8349514563106796,
-      "eval_loss": 0.5270902514457703,
-      "eval_runtime": 30.327,
-      "eval_samples_per_second": 74.719,
-      "eval_steps_per_second": 4.682,
-      "step": 960
     },
     {
-      "epoch": 9.09,
-      "learning_rate": 2.1663172606568835e-05,
-      "loss": 0.2163,
       "step": 970
     },
     {
-      "epoch": 9.18,
-      "learning_rate": 2.1313766596785465e-05,
-      "loss": 0.21,
       "step": 980
     },
     {
-      "epoch": 9.27,
-      "learning_rate": 2.0964360587002095e-05,
-      "loss": 0.2354,
       "step": 990
     },
     {
-      "epoch": 9.37,
-      "learning_rate": 2.061495457721873e-05,
-      "loss": 0.2394,
       "step": 1000
     },
     {
-      "epoch": 9.46,
-      "learning_rate": 2.026554856743536e-05,
-      "loss": 0.2225,
       "step": 1010
     },
     {
-      "epoch": 9.56,
-      "learning_rate": 1.9916142557651993e-05,
-      "loss": 0.2392,
       "step": 1020
     },
     {
-      "epoch": 9.65,
-      "learning_rate": 1.9566736547868624e-05,
-      "loss": 0.2237,
       "step": 1030
     },
     {
-      "epoch": 9.74,
-      "learning_rate": 1.9217330538085258e-05,
-      "loss": 0.251,
       "step": 1040
     },
     {
-      "epoch": 9.84,
-      "learning_rate": 1.8867924528301888e-05,
-      "loss": 0.2033,
       "step": 1050
     },
     {
-      "epoch": 9.93,
-      "learning_rate": 1.8518518518518518e-05,
-      "loss": 0.2266,
-      "step": 1060
     },
     {
-      "epoch": 10.0,
-      "eval_accuracy": 0.8362753751103266,
-      "eval_loss": 0.5450473427772522,
-      "eval_runtime": 29.6596,
-      "eval_samples_per_second": 76.4,
-      "eval_steps_per_second": 4.788,
-      "step": 1067
     },
     {
-      "epoch": 10.02,
-      "learning_rate": 1.8169112508735152e-05,
-      "loss": 0.211,
       "step": 1070
     },
     {
-      "epoch": 10.12,
-      "learning_rate": 1.7819706498951782e-05,
-      "loss": 0.2449,
       "step": 1080
     },
     {
-      "epoch": 10.21,
-      "learning_rate": 1.7470300489168416e-05,
-      "loss": 0.1846,
       "step": 1090
     },
     {
-      "epoch": 10.3,
-      "learning_rate": 1.7120894479385047e-05,
-      "loss": 0.1763,
       "step": 1100
     },
     {
-      "epoch": 10.4,
-      "learning_rate": 1.677148846960168e-05,
-      "loss": 0.2067,
       "step": 1110
     },
     {
-      "epoch": 10.49,
-      "learning_rate": 1.642208245981831e-05,
-      "loss": 0.188,
       "step": 1120
     },
     {
-      "epoch": 10.59,
-      "learning_rate": 1.607267645003494e-05,
-      "loss": 0.2359,
       "step": 1130
     },
     {
-      "epoch": 10.68,
-      "learning_rate": 1.572327044025157e-05,
-      "loss": 0.187,
       "step": 1140
     },
     {
-      "epoch": 10.77,
-      "learning_rate": 1.5373864430468205e-05,
-      "loss": 0.2369,
       "step": 1150
     },
     {
-      "epoch": 10.87,
-      "learning_rate": 1.5024458420684836e-05,
-      "loss": 0.1856,
       "step": 1160
     },
     {
-      "epoch": 10.96,
-      "learning_rate": 1.467505241090147e-05,
-      "loss": 0.1572,
       "step": 1170
     },
     {
-      "epoch": 11.0,
-      "eval_accuracy": 0.8323036187113857,
-      "eval_loss": 0.5316830277442932,
-      "eval_runtime": 29.5637,
-      "eval_samples_per_second": 76.648,
-      "eval_steps_per_second": 4.803,
-      "step": 1174
-    },
-    {
-      "epoch": 11.05,
-      "learning_rate": 1.4325646401118102e-05,
-      "loss": 0.1944,
       "step": 1180
     },
     {
-      "epoch": 11.15,
-      "learning_rate": 1.3976240391334734e-05,
-      "loss": 0.1841,
       "step": 1190
     },
     {
-      "epoch": 11.24,
-      "learning_rate": 1.3626834381551362e-05,
-      "loss": 0.1675,
       "step": 1200
     },
     {
-      "epoch": 11.33,
-      "learning_rate": 1.3277428371767994e-05,
-      "loss": 0.1881,
       "step": 1210
     },
     {
-      "epoch": 11.43,
-      "learning_rate": 1.2928022361984627e-05,
-      "loss": 0.2145,
       "step": 1220
     },
     {
-      "epoch": 11.52,
-      "learning_rate": 1.2578616352201259e-05,
-      "loss": 0.1618,
       "step": 1230
     },
     {
-      "epoch": 11.62,
-      "learning_rate": 1.222921034241789e-05,
-      "loss": 0.189,
       "step": 1240
     },
     {
-      "epoch": 11.71,
-      "learning_rate": 1.1879804332634521e-05,
-      "loss": 0.1915,
       "step": 1250
     },
     {
-      "epoch": 11.8,
-      "learning_rate": 1.1530398322851153e-05,
-      "loss": 0.1697,
       "step": 1260
     },
     {
-      "epoch": 11.9,
-      "learning_rate": 1.1180992313067785e-05,
-      "loss": 0.1793,
       "step": 1270
     },
     {
-      "epoch": 11.99,
-      "learning_rate": 1.0831586303284417e-05,
-      "loss": 0.1891,
       "step": 1280
     },
     {
-      "epoch": 12.0,
-      "eval_accuracy": 0.8362753751103266,
-      "eval_loss": 0.5269371867179871,
-      "eval_runtime": 29.7573,
-      "eval_samples_per_second": 76.149,
-      "eval_steps_per_second": 4.772,
-      "step": 1281
-    },
-    {
-      "epoch": 12.08,
-      "learning_rate": 1.0482180293501048e-05,
-      "loss": 0.1265,
       "step": 1290
     },
     {
-      "epoch": 12.18,
-      "learning_rate": 1.013277428371768e-05,
-      "loss": 0.1668,
       "step": 1300
     },
     {
-      "epoch": 12.27,
-      "learning_rate": 9.783368273934312e-06,
-      "loss": 0.179,
       "step": 1310
     },
     {
-      "epoch": 12.37,
-      "learning_rate": 9.433962264150944e-06,
-      "loss": 0.176,
       "step": 1320
     },
     {
-      "epoch": 12.46,
-      "learning_rate": 9.084556254367576e-06,
-      "loss": 0.1698,
-      "step": 1330
-    },
-    {
-      "epoch": 12.55,
-      "learning_rate": 8.735150244584208e-06,
-      "loss": 0.1563,
-      "step": 1340
-    },
-    {
-      "epoch": 12.65,
-      "learning_rate": 8.38574423480084e-06,
-      "loss": 0.1583,
-      "step": 1350
-    },
-    {
-      "epoch": 12.74,
-      "learning_rate": 8.03633822501747e-06,
-      "loss": 0.1185,
-      "step": 1360
-    },
-    {
-      "epoch": 12.83,
-      "learning_rate": 7.686932215234103e-06,
-      "loss": 0.1229,
-      "step": 1370
-    },
-    {
-      "epoch": 12.93,
-      "learning_rate": 7.337526205450735e-06,
-      "loss": 0.1551,
-      "step": 1380
-    },
-    {
-      "epoch": 12.99,
-      "eval_accuracy": 0.8375992939099736,
-      "eval_loss": 0.5339873433113098,
-      "eval_runtime": 29.8516,
-      "eval_samples_per_second": 75.909,
-      "eval_steps_per_second": 4.757,
-      "step": 1387
-    },
-    {
-      "epoch": 13.02,
-      "learning_rate": 6.988120195667367e-06,
-      "loss": 0.1566,
-      "step": 1390
-    },
-    {
-      "epoch": 13.11,
-      "learning_rate": 6.638714185883997e-06,
-      "loss": 0.1394,
-      "step": 1400
-    },
-    {
-      "epoch": 13.21,
-      "learning_rate": 6.289308176100629e-06,
-      "loss": 0.1642,
-      "step": 1410
-    },
-    {
-      "epoch": 13.3,
-      "learning_rate": 5.9399021663172605e-06,
-      "loss": 0.1334,
-      "step": 1420
-    },
-    {
-      "epoch": 13.4,
-      "learning_rate": 5.590496156533893e-06,
-      "loss": 0.157,
-      "step": 1430
-    },
-    {
-      "epoch": 13.49,
-      "learning_rate": 5.241090146750524e-06,
-      "loss": 0.1658,
-      "step": 1440
-    },
-    {
-      "epoch": 13.58,
-      "learning_rate": 4.891684136967156e-06,
-      "loss": 0.1692,
-      "step": 1450
-    },
-    {
-      "epoch": 13.68,
-      "learning_rate": 4.542278127183788e-06,
-      "loss": 0.1393,
-      "step": 1460
-    },
-    {
-      "epoch": 13.77,
-      "learning_rate": 4.19287211740042e-06,
-      "loss": 0.1492,
-      "step": 1470
-    },
-    {
-      "epoch": 13.86,
-      "learning_rate": 3.843466107617051e-06,
-      "loss": 0.1503,
-      "step": 1480
-    },
-    {
-      "epoch": 13.96,
-      "learning_rate": 3.4940600978336834e-06,
-      "loss": 0.1548,
-      "step": 1490
-    },
-    {
-      "epoch": 14.0,
-      "eval_accuracy": 0.8367166813768756,
-      "eval_loss": 0.5312865376472473,
-      "eval_runtime": 29.7732,
-      "eval_samples_per_second": 76.109,
-      "eval_steps_per_second": 4.769,
-      "step": 1494
-    },
-    {
-      "epoch": 14.05,
-      "learning_rate": 3.1446540880503146e-06,
-      "loss": 0.1186,
-      "step": 1500
-    },
-    {
-      "epoch": 14.15,
-      "learning_rate": 2.7952480782669463e-06,
-      "loss": 0.1213,
-      "step": 1510
-    },
-    {
-      "epoch": 14.24,
-      "learning_rate": 2.445842068483578e-06,
-      "loss": 0.1601,
-      "step": 1520
-    },
-    {
-      "epoch": 14.33,
-      "learning_rate": 2.09643605870021e-06,
-      "loss": 0.1916,
-      "step": 1530
-    },
-    {
-      "epoch": 14.43,
-      "learning_rate": 1.7470300489168417e-06,
-      "loss": 0.1243,
-      "step": 1540
-    },
-    {
-      "epoch": 14.52,
-      "learning_rate": 1.3976240391334732e-06,
-      "loss": 0.1323,
-      "step": 1550
-    },
-    {
-      "epoch": 14.61,
-      "learning_rate": 1.048218029350105e-06,
-      "loss": 0.1535,
-      "step": 1560
-    },
-    {
-      "epoch": 14.71,
-      "learning_rate": 6.988120195667366e-07,
-      "loss": 0.1385,
-      "step": 1570
-    },
-    {
-      "epoch": 14.8,
-      "learning_rate": 3.494060097833683e-07,
-      "loss": 0.1466,
-      "step": 1580
     },
     {
-      "epoch": 14.89,
-      "learning_rate": 0.0,
-      "loss": 0.1781,
-      "step": 1590
-    },
-    {
-      "epoch": 14.89,
-      "eval_accuracy": 0.8398058252427184,
-      "eval_loss": 0.5298482775688171,
-      "eval_runtime": 29.7814,
-      "eval_samples_per_second": 76.088,
-      "eval_steps_per_second": 4.768,
-      "step": 1590
-    },
-    {
-      "epoch": 14.89,
-      "step": 1590,
-      "total_flos": 7.877470546062803e+18,
-      "train_loss": 0.5140632056590146,
-      "train_runtime": 3982.2883,
-      "train_samples_per_second": 25.704,
-      "train_steps_per_second": 0.399
     }
   ],
   "logging_steps": 10,
-  "max_steps": 1590,
   "num_train_epochs": 15,
   "save_steps": 500,
-  "total_flos": 7.877470546062803e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.8528925619834711,
+  "best_model_checkpoint": "vit-base-patch16-224-brand/checkpoint-970",
+  "epoch": 14.957507082152974,
   "eval_steps": 500,
+  "global_step": 1320,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.11,
+      "learning_rate": 3.7878787878787882e-06,
+      "loss": 2.2055,
       "step": 10
     },
     {
+      "epoch": 0.23,
+      "learning_rate": 7.5757575757575764e-06,
+      "loss": 2.162,
       "step": 20
     },
     {
+      "epoch": 0.34,
+      "learning_rate": 1.1363636363636365e-05,
+      "loss": 2.0983,
       "step": 30
     },
     {
+      "epoch": 0.45,
+      "learning_rate": 1.5151515151515153e-05,
+      "loss": 2.0166,
       "step": 40
     },
     {
+      "epoch": 0.57,
+      "learning_rate": 1.893939393939394e-05,
+      "loss": 1.9044,
       "step": 50
     },
     {
+      "epoch": 0.68,
+      "learning_rate": 2.272727272727273e-05,
+      "loss": 1.7381,
       "step": 60
     },
     {
+      "epoch": 0.79,
+      "learning_rate": 2.6515151515151516e-05,
+      "loss": 1.6089,
       "step": 70
     },
     {
+      "epoch": 0.91,
+      "learning_rate": 3.0303030303030306e-05,
+      "loss": 1.4669,
       "step": 80
     },
     {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5611570247933885,
+      "eval_loss": 1.3067070245742798,
+      "eval_runtime": 16.7756,
+      "eval_samples_per_second": 72.129,
+      "eval_steps_per_second": 4.53,
+      "step": 88
     },
     {
+      "epoch": 1.02,
+      "learning_rate": 3.409090909090909e-05,
+      "loss": 1.4484,
+      "step": 90
     },
     {
+      "epoch": 1.13,
+      "learning_rate": 3.787878787878788e-05,
+      "loss": 1.2513,
+      "step": 100
     },
     {
+      "epoch": 1.25,
+      "learning_rate": 4.166666666666667e-05,
+      "loss": 1.1741,
       "step": 110
     },
     {
+      "epoch": 1.36,
+      "learning_rate": 4.545454545454546e-05,
+      "loss": 1.0883,
       "step": 120
     },
     {
+      "epoch": 1.47,
+      "learning_rate": 4.9242424242424245e-05,
+      "loss": 1.0522,
       "step": 130
     },
     {
+      "epoch": 1.59,
+      "learning_rate": 4.966329966329967e-05,
+      "loss": 1.0214,
       "step": 140
     },
     {
+      "epoch": 1.7,
+      "learning_rate": 4.9242424242424245e-05,
+      "loss": 0.9231,
       "step": 150
     },
     {
+      "epoch": 1.81,
+      "learning_rate": 4.882154882154882e-05,
+      "loss": 0.8961,
       "step": 160
     },
     {
+      "epoch": 1.93,
+      "learning_rate": 4.84006734006734e-05,
+      "loss": 0.8898,
       "step": 170
     },
     {
+      "epoch": 1.99,
+      "eval_accuracy": 0.7140495867768595,
+      "eval_loss": 0.8380156755447388,
+      "eval_runtime": 16.8759,
+      "eval_samples_per_second": 71.7,
+      "eval_steps_per_second": 4.503,
+      "step": 176
+    },
+    {
+      "epoch": 2.04,
+      "learning_rate": 4.797979797979798e-05,
+      "loss": 0.8856,
       "step": 180
     },
     {
+      "epoch": 2.15,
+      "learning_rate": 4.755892255892256e-05,
+      "loss": 0.7916,
       "step": 190
     },
     {
+      "epoch": 2.27,
+      "learning_rate": 4.713804713804714e-05,
+      "loss": 0.7614,
       "step": 200
     },
     {
+      "epoch": 2.38,
+      "learning_rate": 4.671717171717172e-05,
+      "loss": 0.7696,
       "step": 210
     },
     {
+      "epoch": 2.49,
+      "learning_rate": 4.62962962962963e-05,
+      "loss": 0.7874,
       "step": 220
     },
     {
+      "epoch": 2.61,
+      "learning_rate": 4.5875420875420876e-05,
+      "loss": 0.7126,
       "step": 230
     },
     {
+      "epoch": 2.72,
+      "learning_rate": 4.545454545454546e-05,
+      "loss": 0.7119,
       "step": 240
     },
     {
+      "epoch": 2.83,
+      "learning_rate": 4.5033670033670034e-05,
+      "loss": 0.7095,
       "step": 250
     },
     {
+      "epoch": 2.95,
+      "learning_rate": 4.4612794612794616e-05,
+      "loss": 0.7243,
       "step": 260
     },
     {
+      "epoch": 2.99,
+      "eval_accuracy": 0.7694214876033058,
+      "eval_loss": 0.6559494137763977,
+      "eval_runtime": 16.9139,
+      "eval_samples_per_second": 71.539,
+      "eval_steps_per_second": 4.493,
+      "step": 264
+    },
+    {
+      "epoch": 3.06,
+      "learning_rate": 4.41919191919192e-05,
+      "loss": 0.7109,
       "step": 270
     },
     {
+      "epoch": 3.17,
+      "learning_rate": 4.3771043771043774e-05,
+      "loss": 0.5651,
       "step": 280
     },
     {
+      "epoch": 3.29,
+      "learning_rate": 4.335016835016835e-05,
+      "loss": 0.5838,
       "step": 290
     },
     {
+      "epoch": 3.4,
+      "learning_rate": 4.292929292929293e-05,
+      "loss": 0.5879,
       "step": 300
     },
     {
+      "epoch": 3.51,
+      "learning_rate": 4.250841750841751e-05,
+      "loss": 0.5541,
       "step": 310
     },
     {
+      "epoch": 3.63,
+      "learning_rate": 4.208754208754209e-05,
+      "loss": 0.5522,
       "step": 320
     },
     {
+      "epoch": 3.74,
+      "learning_rate": 4.166666666666667e-05,
+      "loss": 0.5105,
       "step": 330
     },
     {
+      "epoch": 3.85,
+      "learning_rate": 4.124579124579125e-05,
+      "loss": 0.5289,
       "step": 340
     },
     {
+      "epoch": 3.97,
+      "learning_rate": 4.082491582491583e-05,
+      "loss": 0.5158,
       "step": 350
     },
     {
+      "epoch": 4.0,
+      "eval_accuracy": 0.7950413223140496,
+      "eval_loss": 0.5982227921485901,
+      "eval_runtime": 16.8053,
+      "eval_samples_per_second": 72.001,
+      "eval_steps_per_second": 4.522,
+      "step": 353
+    },
+    {
+      "epoch": 4.08,
+      "learning_rate": 4.0404040404040405e-05,
+      "loss": 0.4296,
       "step": 360
     },
     {
+      "epoch": 4.19,
+      "learning_rate": 3.998316498316498e-05,
+      "loss": 0.4105,
       "step": 370
     },
     {
+      "epoch": 4.31,
+      "learning_rate": 3.956228956228956e-05,
+      "loss": 0.4658,
       "step": 380
     },
     {
+      "epoch": 4.42,
+      "learning_rate": 3.9141414141414145e-05,
+      "loss": 0.4464,
       "step": 390
     },
     {
+      "epoch": 4.53,
+      "learning_rate": 3.872053872053872e-05,
+      "loss": 0.431,
       "step": 400
     },
     {
+      "epoch": 4.65,
+      "learning_rate": 3.82996632996633e-05,
+      "loss": 0.4499,
       "step": 410
     },
     {
+      "epoch": 4.76,
+      "learning_rate": 3.787878787878788e-05,
+      "loss": 0.4568,
       "step": 420
     },
     {
+      "epoch": 4.87,
+      "learning_rate": 3.745791245791246e-05,
+      "loss": 0.4397,
       "step": 430
     },
     {
+      "epoch": 4.99,
+      "learning_rate": 3.7037037037037037e-05,
+      "loss": 0.4605,
       "step": 440
     },
     {
+      "epoch": 5.0,
+      "eval_accuracy": 0.8082644628099174,
+      "eval_loss": 0.5856056809425354,
+      "eval_runtime": 16.7221,
+      "eval_samples_per_second": 72.359,
+      "eval_steps_per_second": 4.545,
+      "step": 441
+    },
+    {
+      "epoch": 5.1,
+      "learning_rate": 3.661616161616162e-05,
+      "loss": 0.3757,
       "step": 450
     },
     {
+      "epoch": 5.21,
+      "learning_rate": 3.61952861952862e-05,
+      "loss": 0.369,
       "step": 460
     },
     {
+      "epoch": 5.33,
+      "learning_rate": 3.577441077441078e-05,
+      "loss": 0.3952,
       "step": 470
     },
     {
+      "epoch": 5.44,
+      "learning_rate": 3.535353535353535e-05,
+      "loss": 0.3841,
       "step": 480
     },
     {
+      "epoch": 5.55,
+      "learning_rate": 3.4932659932659934e-05,
+      "loss": 0.3707,
       "step": 490
     },
     {
+      "epoch": 5.67,
+      "learning_rate": 3.451178451178451e-05,
+      "loss": 0.3874,
       "step": 500
     },
     {
+      "epoch": 5.78,
+      "learning_rate": 3.409090909090909e-05,
+      "loss": 0.347,
       "step": 510
     },
     {
+      "epoch": 5.89,
+      "learning_rate": 3.3670033670033675e-05,
+      "loss": 0.332,
       "step": 520
     },
     {
+      "epoch": 5.99,
+      "eval_accuracy": 0.8355371900826446,
+      "eval_loss": 0.5138491988182068,
+      "eval_runtime": 16.6373,
+      "eval_samples_per_second": 72.728,
+      "eval_steps_per_second": 4.568,
+      "step": 529
     },
     {
+      "epoch": 6.01,
+      "learning_rate": 3.324915824915825e-05,
+      "loss": 0.3767,
+      "step": 530
     },
     {
+      "epoch": 6.12,
+      "learning_rate": 3.282828282828283e-05,
+      "loss": 0.2646,
       "step": 540
     },
     {
+      "epoch": 6.23,
+      "learning_rate": 3.240740740740741e-05,
+      "loss": 0.3142,
       "step": 550
     },
     {
+      "epoch": 6.35,
+      "learning_rate": 3.198653198653199e-05,
+      "loss": 0.3171,
       "step": 560
     },
     {
+      "epoch": 6.46,
+      "learning_rate": 3.1565656565656566e-05,
+      "loss": 0.3318,
       "step": 570
     },
     {
+      "epoch": 6.57,
+      "learning_rate": 3.114478114478115e-05,
+      "loss": 0.309,
       "step": 580
     },
     {
+      "epoch": 6.69,
+      "learning_rate": 3.072390572390573e-05,
+      "loss": 0.2928,
       "step": 590
     },
     {
+      "epoch": 6.8,
+      "learning_rate": 3.0303030303030306e-05,
+      "loss": 0.3622,
       "step": 600
     },
     {
+      "epoch": 6.91,
+      "learning_rate": 2.9882154882154885e-05,
+      "loss": 0.3375,
       "step": 610
     },
     {
+      "epoch": 6.99,
+      "eval_accuracy": 0.8264462809917356,
+      "eval_loss": 0.5094661116600037,
+      "eval_runtime": 16.7644,
+      "eval_samples_per_second": 72.177,
+      "eval_steps_per_second": 4.533,
+      "step": 617
     },
     {
+      "epoch": 7.03,
+      "learning_rate": 2.946127946127946e-05,
+      "loss": 0.2897,
+      "step": 620
     },
     {
+      "epoch": 7.14,
+      "learning_rate": 2.904040404040404e-05,
+      "loss": 0.2764,
+      "step": 630
     },
     {
+      "epoch": 7.25,
+      "learning_rate": 2.8619528619528618e-05,
+      "loss": 0.2627,
       "step": 640
     },
     {
+      "epoch": 7.37,
+      "learning_rate": 2.8198653198653204e-05,
+      "loss": 0.2899,
       "step": 650
     },
     {
+      "epoch": 7.48,
+      "learning_rate": 2.777777777777778e-05,
+      "loss": 0.2316,
       "step": 660
     },
     {
+      "epoch": 7.59,
+      "learning_rate": 2.7356902356902358e-05,
+      "loss": 0.2729,
       "step": 670
     },
     {
+      "epoch": 7.71,
+      "learning_rate": 2.6936026936026937e-05,
+      "loss": 0.2598,
       "step": 680
     },
     {
+      "epoch": 7.82,
+      "learning_rate": 2.6515151515151516e-05,
+      "loss": 0.2331,
       "step": 690
     },
     {
+      "epoch": 7.93,
+      "learning_rate": 2.6094276094276095e-05,
+      "loss": 0.2188,
       "step": 700
     },
     {
+      "epoch": 8.0,
+      "eval_accuracy": 0.8322314049586776,
+      "eval_loss": 0.5088740587234497,
+      "eval_runtime": 16.6796,
+      "eval_samples_per_second": 72.544,
+      "eval_steps_per_second": 4.556,
+      "step": 706
+    },
+    {
+      "epoch": 8.05,
+      "learning_rate": 2.5673400673400677e-05,
+      "loss": 0.2445,
       "step": 710
     },
     {
+      "epoch": 8.16,
+      "learning_rate": 2.5252525252525256e-05,
+      "loss": 0.2144,
       "step": 720
     },
     {
+      "epoch": 8.27,
+      "learning_rate": 2.4831649831649835e-05,
+      "loss": 0.1956,
       "step": 730
     },
     {
+      "epoch": 8.39,
+      "learning_rate": 2.441077441077441e-05,
+      "loss": 0.2103,
       "step": 740
     },
     {
+      "epoch": 8.5,
+      "learning_rate": 2.398989898989899e-05,
+      "loss": 0.2539,
       "step": 750
     },
     {
+      "epoch": 8.61,
+      "learning_rate": 2.356902356902357e-05,
+      "loss": 0.2078,
       "step": 760
     },
     {
+      "epoch": 8.73,
+      "learning_rate": 2.314814814814815e-05,
+      "loss": 0.2112,
       "step": 770
     },
     {
+      "epoch": 8.84,
+      "learning_rate": 2.272727272727273e-05,
+      "loss": 0.2418,
       "step": 780
     },
     {
+      "epoch": 8.95,
+      "learning_rate": 2.2306397306397308e-05,
+      "loss": 0.2112,
       "step": 790
     },
     {
+      "epoch": 9.0,
+      "eval_accuracy": 0.8380165289256198,
+      "eval_loss": 0.5125700235366821,
+      "eval_runtime": 16.6395,
+      "eval_samples_per_second": 72.718,
+      "eval_steps_per_second": 4.567,
+      "step": 794
+    },
+    {
+      "epoch": 9.07,
+      "learning_rate": 2.1885521885521887e-05,
+      "loss": 0.207,
       "step": 800
     },
     {
+      "epoch": 9.18,
+      "learning_rate": 2.1464646464646466e-05,
+      "loss": 0.1844,
       "step": 810
     },
     {
+      "epoch": 9.29,
+      "learning_rate": 2.1043771043771045e-05,
+      "loss": 0.1742,
       "step": 820
     },
     {
+      "epoch": 9.41,
+      "learning_rate": 2.0622895622895624e-05,
+      "loss": 0.178,
       "step": 830
     },
     {
+      "epoch": 9.52,
+      "learning_rate": 2.0202020202020203e-05,
+      "loss": 0.1957,
       "step": 840
     },
     {
+      "epoch": 9.63,
+      "learning_rate": 1.978114478114478e-05,
+      "loss": 0.1833,
       "step": 850
     },
     {
+      "epoch": 9.75,
+      "learning_rate": 1.936026936026936e-05,
+      "loss": 0.1955,
       "step": 860
     },
     {
+      "epoch": 9.86,
+      "learning_rate": 1.893939393939394e-05,
+      "loss": 0.2161,
       "step": 870
     },
     {
+      "epoch": 9.97,
+      "learning_rate": 1.8518518518518518e-05,
+      "loss": 0.1895,
       "step": 880
     },
     {
+      "epoch": 9.99,
+      "eval_accuracy": 0.8363636363636363,
+      "eval_loss": 0.5057435631752014,
+      "eval_runtime": 16.6718,
+      "eval_samples_per_second": 72.578,
+      "eval_steps_per_second": 4.559,
+      "step": 882
+    },
+    {
+      "epoch": 10.08,
+      "learning_rate": 1.80976430976431e-05,
+      "loss": 0.1848,
       "step": 890
     },
     {
+      "epoch": 10.2,
+      "learning_rate": 1.7676767676767676e-05,
+      "loss": 0.1328,
       "step": 900
     },
     {
+      "epoch": 10.31,
+      "learning_rate": 1.7255892255892255e-05,
+      "loss": 0.1383,
       "step": 910
     },
     {
+      "epoch": 10.42,
+      "learning_rate": 1.6835016835016837e-05,
+      "loss": 0.1773,
       "step": 920
     },
     {
+      "epoch": 10.54,
+      "learning_rate": 1.6414141414141416e-05,
+      "loss": 0.1363,
       "step": 930
     },
     {
+      "epoch": 10.65,
+      "learning_rate": 1.5993265993265995e-05,
+      "loss": 0.1516,
       "step": 940
     },
     {
+      "epoch": 10.76,
+      "learning_rate": 1.5572390572390574e-05,
+      "loss": 0.1917,
       "step": 950
     },
     {
+      "epoch": 10.88,
+      "learning_rate": 1.5151515151515153e-05,
+      "loss": 0.1928,
       "step": 960
     },
     {
+      "epoch": 10.99,
+      "learning_rate": 1.473063973063973e-05,
+      "loss": 0.1593,
+      "step": 970
     },
     {
+      "epoch": 10.99,
+      "eval_accuracy": 0.8528925619834711,
+      "eval_loss": 0.4851677417755127,
+      "eval_runtime": 16.8845,
+      "eval_samples_per_second": 71.664,
+      "eval_steps_per_second": 4.501,
       "step": 970
     },
     {
+      "epoch": 11.1,
+      "learning_rate": 1.4309764309764309e-05,
+      "loss": 0.1578,
       "step": 980
     },
     {
+      "epoch": 11.22,
+      "learning_rate": 1.388888888888889e-05,
+      "loss": 0.1757,
       "step": 990
     },
     {
+      "epoch": 11.33,
+      "learning_rate": 1.3468013468013468e-05,
+      "loss": 0.125,
       "step": 1000
     },
     {
+      "epoch": 11.44,
+      "learning_rate": 1.3047138047138047e-05,
+      "loss": 0.1566,
       "step": 1010
     },
     {
+      "epoch": 11.56,
+      "learning_rate": 1.2626262626262628e-05,
+      "loss": 0.1841,
       "step": 1020
     },
     {
+      "epoch": 11.67,
+      "learning_rate": 1.2205387205387205e-05,
+      "loss": 0.1832,
       "step": 1030
     },
     {
+      "epoch": 11.78,
+      "learning_rate": 1.1784511784511786e-05,
+      "loss": 0.1604,
       "step": 1040
     },
     {
+      "epoch": 11.9,
+      "learning_rate": 1.1363636363636365e-05,
+      "loss": 0.1463,
       "step": 1050
     },
     {
+      "epoch": 12.0,
+      "eval_accuracy": 0.8429752066115702,
+      "eval_loss": 0.49344199895858765,
+      "eval_runtime": 16.7817,
+      "eval_samples_per_second": 72.102,
+      "eval_steps_per_second": 4.529,
+      "step": 1059
     },
     {
+      "epoch": 12.01,
+      "learning_rate": 1.0942760942760944e-05,
+      "loss": 0.133,
+      "step": 1060
     },
     {
+      "epoch": 12.12,
+      "learning_rate": 1.0521885521885522e-05,
+      "loss": 0.1293,
       "step": 1070
     },
     {
+      "epoch": 12.24,
+      "learning_rate": 1.0101010101010101e-05,
+      "loss": 0.1232,
       "step": 1080
     },
     {
+      "epoch": 12.35,
+      "learning_rate": 9.68013468013468e-06,
+      "loss": 0.1415,
       "step": 1090
     },
     {
+      "epoch": 12.46,
+      "learning_rate": 9.259259259259259e-06,
+      "loss": 0.1425,
       "step": 1100
     },
     {
+      "epoch": 12.58,
+      "learning_rate": 8.838383838383838e-06,
+      "loss": 0.1062,
       "step": 1110
     },
     {
+      "epoch": 12.69,
+      "learning_rate": 8.417508417508419e-06,
+      "loss": 0.1193,
       "step": 1120
     },
     {
+      "epoch": 12.8,
+      "learning_rate": 7.996632996632998e-06,
+      "loss": 0.1539,
       "step": 1130
     },
     {
+      "epoch": 12.92,
+      "learning_rate": 7.5757575757575764e-06,
+      "loss": 0.1565,
       "step": 1140
     },
     {
+      "epoch": 13.0,
+      "eval_accuracy": 0.8495867768595041,
+      "eval_loss": 0.47939661145210266,
+      "eval_runtime": 16.5708,
+      "eval_samples_per_second": 73.02,
+      "eval_steps_per_second": 4.586,
+      "step": 1147
+    },
+    {
+      "epoch": 13.03,
+      "learning_rate": 7.1548821548821545e-06,
+      "loss": 0.1193,
       "step": 1150
     },
     {
+      "epoch": 13.14,
+      "learning_rate": 6.734006734006734e-06,
+      "loss": 0.1287,
       "step": 1160
     },
     {
+      "epoch": 13.26,
+      "learning_rate": 6.313131313131314e-06,
+      "loss": 0.1186,
       "step": 1170
     },
     {
+      "epoch": 13.37,
+      "learning_rate": 5.892255892255893e-06,
+      "loss": 0.1562,
       "step": 1180
     },
     {
+      "epoch": 13.48,
+      "learning_rate": 5.471380471380472e-06,
+      "loss": 0.1297,
       "step": 1190
     },
     {
+      "epoch": 13.6,
+      "learning_rate": 5.050505050505051e-06,
+      "loss": 0.158,
       "step": 1200
     },
     {
+      "epoch": 13.71,
+      "learning_rate": 4.6296296296296296e-06,
+      "loss": 0.1188,
       "step": 1210
     },
     {
+      "epoch": 13.82,
+      "learning_rate": 4.208754208754209e-06,
+      "loss": 0.1237,
       "step": 1220
     },
     {
+      "epoch": 13.94,
+      "learning_rate": 3.7878787878787882e-06,
+      "loss": 0.1236,
       "step": 1230
     },
     {
+      "epoch": 13.99,
+      "eval_accuracy": 0.8462809917355372,
+      "eval_loss": 0.48630189895629883,
+      "eval_runtime": 16.6832,
+      "eval_samples_per_second": 72.528,
+      "eval_steps_per_second": 4.555,
+      "step": 1235
+    },
+    {
+      "epoch": 14.05,
+      "learning_rate": 3.367003367003367e-06,
+      "loss": 0.103,
       "step": 1240
     },
     {
+      "epoch": 14.16,
+      "learning_rate": 2.9461279461279464e-06,
+      "loss": 0.1352,
       "step": 1250
     },
     {
+      "epoch": 14.28,
+      "learning_rate": 2.5252525252525253e-06,
+      "loss": 0.1372,
       "step": 1260
     },
     {
+      "epoch": 14.39,
+      "learning_rate": 2.1043771043771047e-06,
+      "loss": 0.1215,
       "step": 1270
     },
     {
+      "epoch": 14.5,
+      "learning_rate": 1.6835016835016836e-06,
+      "loss": 0.1334,
       "step": 1280
     },
     {
+      "epoch": 14.62,
+      "learning_rate": 1.2626262626262627e-06,
+      "loss": 0.1326,
       "step": 1290
     },
     {
+      "epoch": 14.73,
+      "learning_rate": 8.417508417508418e-07,
+      "loss": 0.0859,
       "step": 1300
     },
     {
+      "epoch": 14.84,
+      "learning_rate": 4.208754208754209e-07,
+      "loss": 0.1313,
       "step": 1310
     },
     {
+      "epoch": 14.96,
+      "learning_rate": 0.0,
+      "loss": 0.1407,
       "step": 1320
     },
     {
+      "epoch": 14.96,
+      "eval_accuracy": 0.8495867768595041,
+      "eval_loss": 0.48121175169944763,
+      "eval_runtime": 16.5675,
+      "eval_samples_per_second": 73.034,
+      "eval_steps_per_second": 4.587,
+      "step": 1320
     },
     {
+      "epoch": 14.96,
+      "step": 1320,
+      "total_flos": 6.546875329145733e+18,
+      "train_loss": 0.44751356618874,
+      "train_runtime": 3414.1758,
+      "train_samples_per_second": 24.814,
+      "train_steps_per_second": 0.387
     }
   ],
   "logging_steps": 10,
+  "max_steps": 1320,
   "num_train_epochs": 15,
   "save_steps": 500,
+  "total_flos": 6.546875329145733e+18,
   "trial_name": null,
   "trial_params": null
 }