barten
/

vit-base-patch16-224-brand

+{
+    "epoch": 14.89,
+    "total_flos": 7.877470546062803e+18,
+    "train_loss": 0.5140632056590146,
+    "train_runtime": 3982.2883,
+    "train_samples_per_second": 25.704,
+    "train_steps_per_second": 0.399
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 14.89,
+    "total_flos": 7.877470546062803e+18,
+    "train_loss": 0.5140632056590146,
+    "train_runtime": 3982.2883,
+    "train_samples_per_second": 25.704,
+    "train_steps_per_second": 0.399
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,1117 @@

+{
+  "best_metric": 0.8398058252427184,
+  "best_model_checkpoint": "vit-base-patch16-224-brand/checkpoint-1590",
+  "epoch": 14.894613583138174,
+  "eval_steps": 500,
+  "global_step": 1590,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.09,
+      "learning_rate": 3.1446540880503146e-06,
+      "loss": 2.3942,
+      "step": 10
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 6.289308176100629e-06,
+      "loss": 2.3923,
+      "step": 20
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 9.433962264150944e-06,
+      "loss": 2.3106,
+      "step": 30
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 1.2578616352201259e-05,
+      "loss": 2.2216,
+      "step": 40
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 1.572327044025157e-05,
+      "loss": 2.0774,
+      "step": 50
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 1.8867924528301888e-05,
+      "loss": 2.0392,
+      "step": 60
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 2.2012578616352204e-05,
+      "loss": 1.8905,
+      "step": 70
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 2.5157232704402517e-05,
+      "loss": 1.8387,
+      "step": 80
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 2.830188679245283e-05,
+      "loss": 1.7255,
+      "step": 90
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 3.144654088050314e-05,
+      "loss": 1.6631,
+      "step": 100
+    },
+    {
+      "epoch": 0.99,
+      "eval_accuracy": 0.5494263018534863,
+      "eval_loss": 1.4344048500061035,
+      "eval_runtime": 29.697,
+      "eval_samples_per_second": 76.304,
+      "eval_steps_per_second": 4.782,
+      "step": 106
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 3.4591194968553456e-05,
+      "loss": 1.5273,
+      "step": 110
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 3.7735849056603776e-05,
+      "loss": 1.4406,
+      "step": 120
+    },
+    {
+      "epoch": 1.22,
+      "learning_rate": 4.088050314465409e-05,
+      "loss": 1.4031,
+      "step": 130
+    },
+    {
+      "epoch": 1.31,
+      "learning_rate": 4.402515723270441e-05,
+      "loss": 1.2573,
+      "step": 140
+    },
+    {
+      "epoch": 1.41,
+      "learning_rate": 4.716981132075472e-05,
+      "loss": 1.2428,
+      "step": 150
+    },
+    {
+      "epoch": 1.5,
+      "learning_rate": 4.9965059399021665e-05,
+      "loss": 1.1119,
+      "step": 160
+    },
+    {
+      "epoch": 1.59,
+      "learning_rate": 4.9615653389238295e-05,
+      "loss": 1.2198,
+      "step": 170
+    },
+    {
+      "epoch": 1.69,
+      "learning_rate": 4.9266247379454926e-05,
+      "loss": 1.0555,
+      "step": 180
+    },
+    {
+      "epoch": 1.78,
+      "learning_rate": 4.891684136967156e-05,
+      "loss": 1.0781,
+      "step": 190
+    },
+    {
+      "epoch": 1.87,
+      "learning_rate": 4.856743535988819e-05,
+      "loss": 1.0989,
+      "step": 200
+    },
+    {
+      "epoch": 1.97,
+      "learning_rate": 4.8218029350104823e-05,
+      "loss": 1.069,
+      "step": 210
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.7281553398058253,
+      "eval_loss": 0.8916863799095154,
+      "eval_runtime": 29.9218,
+      "eval_samples_per_second": 75.731,
+      "eval_steps_per_second": 4.746,
+      "step": 213
+    },
+    {
+      "epoch": 2.06,
+      "learning_rate": 4.7868623340321454e-05,
+      "loss": 0.9655,
+      "step": 220
+    },
+    {
+      "epoch": 2.15,
+      "learning_rate": 4.7519217330538084e-05,
+      "loss": 0.8571,
+      "step": 230
+    },
+    {
+      "epoch": 2.25,
+      "learning_rate": 4.716981132075472e-05,
+      "loss": 0.8375,
+      "step": 240
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 4.682040531097135e-05,
+      "loss": 0.8631,
+      "step": 250
+    },
+    {
+      "epoch": 2.44,
+      "learning_rate": 4.647099930118798e-05,
+      "loss": 0.8991,
+      "step": 260
+    },
+    {
+      "epoch": 2.53,
+      "learning_rate": 4.612159329140461e-05,
+      "loss": 0.9349,
+      "step": 270
+    },
+    {
+      "epoch": 2.62,
+      "learning_rate": 4.577218728162125e-05,
+      "loss": 0.8766,
+      "step": 280
+    },
+    {
+      "epoch": 2.72,
+      "learning_rate": 4.542278127183788e-05,
+      "loss": 0.8294,
+      "step": 290
+    },
+    {
+      "epoch": 2.81,
+      "learning_rate": 4.5073375262054504e-05,
+      "loss": 0.8507,
+      "step": 300
+    },
+    {
+      "epoch": 2.9,
+      "learning_rate": 4.472396925227114e-05,
+      "loss": 0.7529,
+      "step": 310
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 4.437456324248777e-05,
+      "loss": 0.801,
+      "step": 320
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.7533097969991174,
+      "eval_loss": 0.7611907720565796,
+      "eval_runtime": 29.9179,
+      "eval_samples_per_second": 75.741,
+      "eval_steps_per_second": 4.746,
+      "step": 320
+    },
+    {
+      "epoch": 3.09,
+      "learning_rate": 4.402515723270441e-05,
+      "loss": 0.7598,
+      "step": 330
+    },
+    {
+      "epoch": 3.19,
+      "learning_rate": 4.367575122292103e-05,
+      "loss": 0.6375,
+      "step": 340
+    },
+    {
+      "epoch": 3.28,
+      "learning_rate": 4.332634521313767e-05,
+      "loss": 0.6634,
+      "step": 350
+    },
+    {
+      "epoch": 3.37,
+      "learning_rate": 4.29769392033543e-05,
+      "loss": 0.6474,
+      "step": 360
+    },
+    {
+      "epoch": 3.47,
+      "learning_rate": 4.262753319357093e-05,
+      "loss": 0.6328,
+      "step": 370
+    },
+    {
+      "epoch": 3.56,
+      "learning_rate": 4.227812718378756e-05,
+      "loss": 0.6945,
+      "step": 380
+    },
+    {
+      "epoch": 3.65,
+      "learning_rate": 4.192872117400419e-05,
+      "loss": 0.6194,
+      "step": 390
+    },
+    {
+      "epoch": 3.75,
+      "learning_rate": 4.157931516422083e-05,
+      "loss": 0.6398,
+      "step": 400
+    },
+    {
+      "epoch": 3.84,
+      "learning_rate": 4.122990915443746e-05,
+      "loss": 0.6756,
+      "step": 410
+    },
+    {
+      "epoch": 3.93,
+      "learning_rate": 4.088050314465409e-05,
+      "loss": 0.6075,
+      "step": 420
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.792144748455428,
+      "eval_loss": 0.6522440314292908,
+      "eval_runtime": 29.5461,
+      "eval_samples_per_second": 76.694,
+      "eval_steps_per_second": 4.806,
+      "step": 427
+    },
+    {
+      "epoch": 4.03,
+      "learning_rate": 4.053109713487072e-05,
+      "loss": 0.5489,
+      "step": 430
+    },
+    {
+      "epoch": 4.12,
+      "learning_rate": 4.018169112508735e-05,
+      "loss": 0.5316,
+      "step": 440
+    },
+    {
+      "epoch": 4.22,
+      "learning_rate": 3.983228511530399e-05,
+      "loss": 0.523,
+      "step": 450
+    },
+    {
+      "epoch": 4.31,
+      "learning_rate": 3.948287910552062e-05,
+      "loss": 0.5247,
+      "step": 460
+    },
+    {
+      "epoch": 4.4,
+      "learning_rate": 3.913347309573725e-05,
+      "loss": 0.5356,
+      "step": 470
+    },
+    {
+      "epoch": 4.5,
+      "learning_rate": 3.878406708595388e-05,
+      "loss": 0.5128,
+      "step": 480
+    },
+    {
+      "epoch": 4.59,
+      "learning_rate": 3.8434661076170515e-05,
+      "loss": 0.5752,
+      "step": 490
+    },
+    {
+      "epoch": 4.68,
+      "learning_rate": 3.8085255066387145e-05,
+      "loss": 0.5445,
+      "step": 500
+    },
+    {
+      "epoch": 4.78,
+      "learning_rate": 3.7735849056603776e-05,
+      "loss": 0.5064,
+      "step": 510
+    },
+    {
+      "epoch": 4.87,
+      "learning_rate": 3.7386443046820406e-05,
+      "loss": 0.508,
+      "step": 520
+    },
+    {
+      "epoch": 4.96,
+      "learning_rate": 3.7037037037037037e-05,
+      "loss": 0.5046,
+      "step": 530
+    },
+    {
+      "epoch": 4.99,
+      "eval_accuracy": 0.8005295675198588,
+      "eval_loss": 0.6084854006767273,
+      "eval_runtime": 29.8921,
+      "eval_samples_per_second": 75.806,
+      "eval_steps_per_second": 4.75,
+      "step": 533
+    },
+    {
+      "epoch": 5.06,
+      "learning_rate": 3.6687631027253674e-05,
+      "loss": 0.4403,
+      "step": 540
+    },
+    {
+      "epoch": 5.15,
+      "learning_rate": 3.6338225017470304e-05,
+      "loss": 0.3919,
+      "step": 550
+    },
+    {
+      "epoch": 5.25,
+      "learning_rate": 3.5988819007686934e-05,
+      "loss": 0.4224,
+      "step": 560
+    },
+    {
+      "epoch": 5.34,
+      "learning_rate": 3.5639412997903565e-05,
+      "loss": 0.4708,
+      "step": 570
+    },
+    {
+      "epoch": 5.43,
+      "learning_rate": 3.52900069881202e-05,
+      "loss": 0.4206,
+      "step": 580
+    },
+    {
+      "epoch": 5.53,
+      "learning_rate": 3.494060097833683e-05,
+      "loss": 0.4416,
+      "step": 590
+    },
+    {
+      "epoch": 5.62,
+      "learning_rate": 3.4591194968553456e-05,
+      "loss": 0.4478,
+      "step": 600
+    },
+    {
+      "epoch": 5.71,
+      "learning_rate": 3.424178895877009e-05,
+      "loss": 0.4403,
+      "step": 610
+    },
+    {
+      "epoch": 5.81,
+      "learning_rate": 3.3892382948986724e-05,
+      "loss": 0.4428,
+      "step": 620
+    },
+    {
+      "epoch": 5.9,
+      "learning_rate": 3.354297693920336e-05,
+      "loss": 0.3941,
+      "step": 630
+    },
+    {
+      "epoch": 6.0,
+      "learning_rate": 3.3193570929419984e-05,
+      "loss": 0.4018,
+      "step": 640
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.8022947925860547,
+      "eval_loss": 0.6132453680038452,
+      "eval_runtime": 30.1158,
+      "eval_samples_per_second": 75.243,
+      "eval_steps_per_second": 4.715,
+      "step": 640
+    },
+    {
+      "epoch": 6.09,
+      "learning_rate": 3.284416491963662e-05,
+      "loss": 0.3719,
+      "step": 650
+    },
+    {
+      "epoch": 6.18,
+      "learning_rate": 3.249475890985325e-05,
+      "loss": 0.3549,
+      "step": 660
+    },
+    {
+      "epoch": 6.28,
+      "learning_rate": 3.214535290006988e-05,
+      "loss": 0.3866,
+      "step": 670
+    },
+    {
+      "epoch": 6.37,
+      "learning_rate": 3.179594689028651e-05,
+      "loss": 0.4172,
+      "step": 680
+    },
+    {
+      "epoch": 6.46,
+      "learning_rate": 3.144654088050314e-05,
+      "loss": 0.3798,
+      "step": 690
+    },
+    {
+      "epoch": 6.56,
+      "learning_rate": 3.109713487071978e-05,
+      "loss": 0.3288,
+      "step": 700
+    },
+    {
+      "epoch": 6.65,
+      "learning_rate": 3.074772886093641e-05,
+      "loss": 0.3829,
+      "step": 710
+    },
+    {
+      "epoch": 6.74,
+      "learning_rate": 3.0398322851153044e-05,
+      "loss": 0.3771,
+      "step": 720
+    },
+    {
+      "epoch": 6.84,
+      "learning_rate": 3.004891684136967e-05,
+      "loss": 0.3637,
+      "step": 730
+    },
+    {
+      "epoch": 6.93,
+      "learning_rate": 2.9699510831586302e-05,
+      "loss": 0.3641,
+      "step": 740
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.8292144748455428,
+      "eval_loss": 0.5509597659111023,
+      "eval_runtime": 29.6593,
+      "eval_samples_per_second": 76.401,
+      "eval_steps_per_second": 4.788,
+      "step": 747
+    },
+    {
+      "epoch": 7.03,
+      "learning_rate": 2.935010482180294e-05,
+      "loss": 0.373,
+      "step": 750
+    },
+    {
+      "epoch": 7.12,
+      "learning_rate": 2.9000698812019566e-05,
+      "loss": 0.3128,
+      "step": 760
+    },
+    {
+      "epoch": 7.21,
+      "learning_rate": 2.8651292802236203e-05,
+      "loss": 0.3177,
+      "step": 770
+    },
+    {
+      "epoch": 7.31,
+      "learning_rate": 2.830188679245283e-05,
+      "loss": 0.2853,
+      "step": 780
+    },
+    {
+      "epoch": 7.4,
+      "learning_rate": 2.7952480782669467e-05,
+      "loss": 0.2969,
+      "step": 790
+    },
+    {
+      "epoch": 7.49,
+      "learning_rate": 2.7603074772886094e-05,
+      "loss": 0.2786,
+      "step": 800
+    },
+    {
+      "epoch": 7.59,
+      "learning_rate": 2.7253668763102725e-05,
+      "loss": 0.2653,
+      "step": 810
+    },
+    {
+      "epoch": 7.68,
+      "learning_rate": 2.690426275331936e-05,
+      "loss": 0.2388,
+      "step": 820
+    },
+    {
+      "epoch": 7.78,
+      "learning_rate": 2.655485674353599e-05,
+      "loss": 0.2941,
+      "step": 830
+    },
+    {
+      "epoch": 7.87,
+      "learning_rate": 2.6205450733752623e-05,
+      "loss": 0.3248,
+      "step": 840
+    },
+    {
+      "epoch": 7.96,
+      "learning_rate": 2.5856044723969253e-05,
+      "loss": 0.4003,
+      "step": 850
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.824801412180053,
+      "eval_loss": 0.530396580696106,
+      "eval_runtime": 29.7498,
+      "eval_samples_per_second": 76.169,
+      "eval_steps_per_second": 4.773,
+      "step": 854
+    },
+    {
+      "epoch": 8.06,
+      "learning_rate": 2.5506638714185887e-05,
+      "loss": 0.2842,
+      "step": 860
+    },
+    {
+      "epoch": 8.15,
+      "learning_rate": 2.5157232704402517e-05,
+      "loss": 0.2404,
+      "step": 870
+    },
+    {
+      "epoch": 8.24,
+      "learning_rate": 2.4807826694619148e-05,
+      "loss": 0.2525,
+      "step": 880
+    },
+    {
+      "epoch": 8.34,
+      "learning_rate": 2.445842068483578e-05,
+      "loss": 0.2415,
+      "step": 890
+    },
+    {
+      "epoch": 8.43,
+      "learning_rate": 2.4109014675052412e-05,
+      "loss": 0.222,
+      "step": 900
+    },
+    {
+      "epoch": 8.52,
+      "learning_rate": 2.3759608665269042e-05,
+      "loss": 0.2461,
+      "step": 910
+    },
+    {
+      "epoch": 8.62,
+      "learning_rate": 2.3410202655485676e-05,
+      "loss": 0.2533,
+      "step": 920
+    },
+    {
+      "epoch": 8.71,
+      "learning_rate": 2.3060796645702306e-05,
+      "loss": 0.267,
+      "step": 930
+    },
+    {
+      "epoch": 8.81,
+      "learning_rate": 2.271139063591894e-05,
+      "loss": 0.2572,
+      "step": 940
+    },
+    {
+      "epoch": 8.9,
+      "learning_rate": 2.236198462613557e-05,
+      "loss": 0.2263,
+      "step": 950
+    },
+    {
+      "epoch": 8.99,
+      "learning_rate": 2.2012578616352204e-05,
+      "loss": 0.3142,
+      "step": 960
+    },
+    {
+      "epoch": 8.99,
+      "eval_accuracy": 0.8349514563106796,
+      "eval_loss": 0.5270902514457703,
+      "eval_runtime": 30.327,
+      "eval_samples_per_second": 74.719,
+      "eval_steps_per_second": 4.682,
+      "step": 960
+    },
+    {
+      "epoch": 9.09,
+      "learning_rate": 2.1663172606568835e-05,
+      "loss": 0.2163,
+      "step": 970
+    },
+    {
+      "epoch": 9.18,
+      "learning_rate": 2.1313766596785465e-05,
+      "loss": 0.21,
+      "step": 980
+    },
+    {
+      "epoch": 9.27,
+      "learning_rate": 2.0964360587002095e-05,
+      "loss": 0.2354,
+      "step": 990
+    },
+    {
+      "epoch": 9.37,
+      "learning_rate": 2.061495457721873e-05,
+      "loss": 0.2394,
+      "step": 1000
+    },
+    {
+      "epoch": 9.46,
+      "learning_rate": 2.026554856743536e-05,
+      "loss": 0.2225,
+      "step": 1010
+    },
+    {
+      "epoch": 9.56,
+      "learning_rate": 1.9916142557651993e-05,
+      "loss": 0.2392,
+      "step": 1020
+    },
+    {
+      "epoch": 9.65,
+      "learning_rate": 1.9566736547868624e-05,
+      "loss": 0.2237,
+      "step": 1030
+    },
+    {
+      "epoch": 9.74,
+      "learning_rate": 1.9217330538085258e-05,
+      "loss": 0.251,
+      "step": 1040
+    },
+    {
+      "epoch": 9.84,
+      "learning_rate": 1.8867924528301888e-05,
+      "loss": 0.2033,
+      "step": 1050
+    },
+    {
+      "epoch": 9.93,
+      "learning_rate": 1.8518518518518518e-05,
+      "loss": 0.2266,
+      "step": 1060
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.8362753751103266,
+      "eval_loss": 0.5450473427772522,
+      "eval_runtime": 29.6596,
+      "eval_samples_per_second": 76.4,
+      "eval_steps_per_second": 4.788,
+      "step": 1067
+    },
+    {
+      "epoch": 10.02,
+      "learning_rate": 1.8169112508735152e-05,
+      "loss": 0.211,
+      "step": 1070
+    },
+    {
+      "epoch": 10.12,
+      "learning_rate": 1.7819706498951782e-05,
+      "loss": 0.2449,
+      "step": 1080
+    },
+    {
+      "epoch": 10.21,
+      "learning_rate": 1.7470300489168416e-05,
+      "loss": 0.1846,
+      "step": 1090
+    },
+    {
+      "epoch": 10.3,
+      "learning_rate": 1.7120894479385047e-05,
+      "loss": 0.1763,
+      "step": 1100
+    },
+    {
+      "epoch": 10.4,
+      "learning_rate": 1.677148846960168e-05,
+      "loss": 0.2067,
+      "step": 1110
+    },
+    {
+      "epoch": 10.49,
+      "learning_rate": 1.642208245981831e-05,
+      "loss": 0.188,
+      "step": 1120
+    },
+    {
+      "epoch": 10.59,
+      "learning_rate": 1.607267645003494e-05,
+      "loss": 0.2359,
+      "step": 1130
+    },
+    {
+      "epoch": 10.68,
+      "learning_rate": 1.572327044025157e-05,
+      "loss": 0.187,
+      "step": 1140
+    },
+    {
+      "epoch": 10.77,
+      "learning_rate": 1.5373864430468205e-05,
+      "loss": 0.2369,
+      "step": 1150
+    },
+    {
+      "epoch": 10.87,
+      "learning_rate": 1.5024458420684836e-05,
+      "loss": 0.1856,
+      "step": 1160
+    },
+    {
+      "epoch": 10.96,
+      "learning_rate": 1.467505241090147e-05,
+      "loss": 0.1572,
+      "step": 1170
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.8323036187113857,
+      "eval_loss": 0.5316830277442932,
+      "eval_runtime": 29.5637,
+      "eval_samples_per_second": 76.648,
+      "eval_steps_per_second": 4.803,
+      "step": 1174
+    },
+    {
+      "epoch": 11.05,
+      "learning_rate": 1.4325646401118102e-05,
+      "loss": 0.1944,
+      "step": 1180
+    },
+    {
+      "epoch": 11.15,
+      "learning_rate": 1.3976240391334734e-05,
+      "loss": 0.1841,
+      "step": 1190
+    },
+    {
+      "epoch": 11.24,
+      "learning_rate": 1.3626834381551362e-05,
+      "loss": 0.1675,
+      "step": 1200
+    },
+    {
+      "epoch": 11.33,
+      "learning_rate": 1.3277428371767994e-05,
+      "loss": 0.1881,
+      "step": 1210
+    },
+    {
+      "epoch": 11.43,
+      "learning_rate": 1.2928022361984627e-05,
+      "loss": 0.2145,
+      "step": 1220
+    },
+    {
+      "epoch": 11.52,
+      "learning_rate": 1.2578616352201259e-05,
+      "loss": 0.1618,
+      "step": 1230
+    },
+    {
+      "epoch": 11.62,
+      "learning_rate": 1.222921034241789e-05,
+      "loss": 0.189,
+      "step": 1240
+    },
+    {
+      "epoch": 11.71,
+      "learning_rate": 1.1879804332634521e-05,
+      "loss": 0.1915,
+      "step": 1250
+    },
+    {
+      "epoch": 11.8,
+      "learning_rate": 1.1530398322851153e-05,
+      "loss": 0.1697,
+      "step": 1260
+    },
+    {
+      "epoch": 11.9,
+      "learning_rate": 1.1180992313067785e-05,
+      "loss": 0.1793,
+      "step": 1270
+    },
+    {
+      "epoch": 11.99,
+      "learning_rate": 1.0831586303284417e-05,
+      "loss": 0.1891,
+      "step": 1280
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.8362753751103266,
+      "eval_loss": 0.5269371867179871,
+      "eval_runtime": 29.7573,
+      "eval_samples_per_second": 76.149,
+      "eval_steps_per_second": 4.772,
+      "step": 1281
+    },
+    {
+      "epoch": 12.08,
+      "learning_rate": 1.0482180293501048e-05,
+      "loss": 0.1265,
+      "step": 1290
+    },
+    {
+      "epoch": 12.18,
+      "learning_rate": 1.013277428371768e-05,
+      "loss": 0.1668,
+      "step": 1300
+    },
+    {
+      "epoch": 12.27,
+      "learning_rate": 9.783368273934312e-06,
+      "loss": 0.179,
+      "step": 1310
+    },
+    {
+      "epoch": 12.37,
+      "learning_rate": 9.433962264150944e-06,
+      "loss": 0.176,
+      "step": 1320
+    },
+    {
+      "epoch": 12.46,
+      "learning_rate": 9.084556254367576e-06,
+      "loss": 0.1698,
+      "step": 1330
+    },
+    {
+      "epoch": 12.55,
+      "learning_rate": 8.735150244584208e-06,
+      "loss": 0.1563,
+      "step": 1340
+    },
+    {
+      "epoch": 12.65,
+      "learning_rate": 8.38574423480084e-06,
+      "loss": 0.1583,
+      "step": 1350
+    },
+    {
+      "epoch": 12.74,
+      "learning_rate": 8.03633822501747e-06,
+      "loss": 0.1185,
+      "step": 1360
+    },
+    {
+      "epoch": 12.83,
+      "learning_rate": 7.686932215234103e-06,
+      "loss": 0.1229,
+      "step": 1370
+    },
+    {
+      "epoch": 12.93,
+      "learning_rate": 7.337526205450735e-06,
+      "loss": 0.1551,
+      "step": 1380
+    },
+    {
+      "epoch": 12.99,
+      "eval_accuracy": 0.8375992939099736,
+      "eval_loss": 0.5339873433113098,
+      "eval_runtime": 29.8516,
+      "eval_samples_per_second": 75.909,
+      "eval_steps_per_second": 4.757,
+      "step": 1387
+    },
+    {
+      "epoch": 13.02,
+      "learning_rate": 6.988120195667367e-06,
+      "loss": 0.1566,
+      "step": 1390
+    },
+    {
+      "epoch": 13.11,
+      "learning_rate": 6.638714185883997e-06,
+      "loss": 0.1394,
+      "step": 1400
+    },
+    {
+      "epoch": 13.21,
+      "learning_rate": 6.289308176100629e-06,
+      "loss": 0.1642,
+      "step": 1410
+    },
+    {
+      "epoch": 13.3,
+      "learning_rate": 5.9399021663172605e-06,
+      "loss": 0.1334,
+      "step": 1420
+    },
+    {
+      "epoch": 13.4,
+      "learning_rate": 5.590496156533893e-06,
+      "loss": 0.157,
+      "step": 1430
+    },
+    {
+      "epoch": 13.49,
+      "learning_rate": 5.241090146750524e-06,
+      "loss": 0.1658,
+      "step": 1440
+    },
+    {
+      "epoch": 13.58,
+      "learning_rate": 4.891684136967156e-06,
+      "loss": 0.1692,
+      "step": 1450
+    },
+    {
+      "epoch": 13.68,
+      "learning_rate": 4.542278127183788e-06,
+      "loss": 0.1393,
+      "step": 1460
+    },
+    {
+      "epoch": 13.77,
+      "learning_rate": 4.19287211740042e-06,
+      "loss": 0.1492,
+      "step": 1470
+    },
+    {
+      "epoch": 13.86,
+      "learning_rate": 3.843466107617051e-06,
+      "loss": 0.1503,
+      "step": 1480
+    },
+    {
+      "epoch": 13.96,
+      "learning_rate": 3.4940600978336834e-06,
+      "loss": 0.1548,
+      "step": 1490
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.8367166813768756,
+      "eval_loss": 0.5312865376472473,
+      "eval_runtime": 29.7732,
+      "eval_samples_per_second": 76.109,
+      "eval_steps_per_second": 4.769,
+      "step": 1494
+    },
+    {
+      "epoch": 14.05,
+      "learning_rate": 3.1446540880503146e-06,
+      "loss": 0.1186,
+      "step": 1500
+    },
+    {
+      "epoch": 14.15,
+      "learning_rate": 2.7952480782669463e-06,
+      "loss": 0.1213,
+      "step": 1510
+    },
+    {
+      "epoch": 14.24,
+      "learning_rate": 2.445842068483578e-06,
+      "loss": 0.1601,
+      "step": 1520
+    },
+    {
+      "epoch": 14.33,
+      "learning_rate": 2.09643605870021e-06,
+      "loss": 0.1916,
+      "step": 1530
+    },
+    {
+      "epoch": 14.43,
+      "learning_rate": 1.7470300489168417e-06,
+      "loss": 0.1243,
+      "step": 1540
+    },
+    {
+      "epoch": 14.52,
+      "learning_rate": 1.3976240391334732e-06,
+      "loss": 0.1323,
+      "step": 1550
+    },
+    {
+      "epoch": 14.61,
+      "learning_rate": 1.048218029350105e-06,
+      "loss": 0.1535,
+      "step": 1560
+    },
+    {
+      "epoch": 14.71,
+      "learning_rate": 6.988120195667366e-07,
+      "loss": 0.1385,
+      "step": 1570
+    },
+    {
+      "epoch": 14.8,
+      "learning_rate": 3.494060097833683e-07,
+      "loss": 0.1466,
+      "step": 1580
+    },
+    {
+      "epoch": 14.89,
+      "learning_rate": 0.0,
+      "loss": 0.1781,
+      "step": 1590
+    },
+    {
+      "epoch": 14.89,
+      "eval_accuracy": 0.8398058252427184,
+      "eval_loss": 0.5298482775688171,
+      "eval_runtime": 29.7814,
+      "eval_samples_per_second": 76.088,
+      "eval_steps_per_second": 4.768,
+      "step": 1590
+    },
+    {
+      "epoch": 14.89,
+      "step": 1590,
+      "total_flos": 7.877470546062803e+18,
+      "train_loss": 0.5140632056590146,
+      "train_runtime": 3982.2883,
+      "train_samples_per_second": 25.704,
+      "train_steps_per_second": 0.399
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 1590,
+  "num_train_epochs": 15,
+  "save_steps": 500,
+  "total_flos": 7.877470546062803e+18,
+  "trial_name": null,
+  "trial_params": null
+}