vit-eGTZANplus / trainer_state.json

End of training

0aa2858 verified almost 2 years ago

196 kB

	{
	"best_metric": 0.8358047604560852,
	"best_model_checkpoint": "./vit-eGTZANplus\\checkpoint-480",
	"epoch": 50.0,
	"eval_steps": 10,
	"global_step": 5350,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.09,
	"learning_rate": 0.00019962616822429908,
	"loss": 2.4098,
	"step": 10
	},
	{
	"epoch": 0.09,
	"eval_accuracy": 0.14285714285714285,
	"eval_loss": 2.3848845958709717,
	"eval_runtime": 3.3561,
	"eval_samples_per_second": 56.316,
	"eval_steps_per_second": 7.151,
	"step": 10
	},
	{
	"epoch": 0.19,
	"learning_rate": 0.00019925233644859814,
	"loss": 2.3376,
	"step": 20
	},
	{
	"epoch": 0.19,
	"eval_accuracy": 0.21164021164021163,
	"eval_loss": 2.257709264755249,
	"eval_runtime": 3.2453,
	"eval_samples_per_second": 58.238,
	"eval_steps_per_second": 7.395,
	"step": 20
	},
	{
	"epoch": 0.28,
	"learning_rate": 0.0001988785046728972,
	"loss": 2.2047,
	"step": 30
	},
	{
	"epoch": 0.28,
	"eval_accuracy": 0.2962962962962963,
	"eval_loss": 2.158203125,
	"eval_runtime": 2.9918,
	"eval_samples_per_second": 63.172,
	"eval_steps_per_second": 8.022,
	"step": 30
	},
	{
	"epoch": 0.37,
	"learning_rate": 0.00019850467289719628,
	"loss": 2.1267,
	"step": 40
	},
	{
	"epoch": 0.37,
	"eval_accuracy": 0.3862433862433862,
	"eval_loss": 1.942036747932434,
	"eval_runtime": 3.0218,
	"eval_samples_per_second": 62.546,
	"eval_steps_per_second": 7.942,
	"step": 40
	},
	{
	"epoch": 0.47,
	"learning_rate": 0.00019813084112149535,
	"loss": 2.0365,
	"step": 50
	},
	{
	"epoch": 0.47,
	"eval_accuracy": 0.36507936507936506,
	"eval_loss": 1.9487409591674805,
	"eval_runtime": 2.938,
	"eval_samples_per_second": 64.329,
	"eval_steps_per_second": 8.169,
	"step": 50
	},
	{
	"epoch": 0.56,
	"learning_rate": 0.00019775700934579439,
	"loss": 1.9884,
	"step": 60
	},
	{
	"epoch": 0.56,
	"eval_accuracy": 0.4973544973544973,
	"eval_loss": 1.7399966716766357,
	"eval_runtime": 3.2957,
	"eval_samples_per_second": 57.348,
	"eval_steps_per_second": 7.282,
	"step": 60
	},
	{
	"epoch": 0.65,
	"learning_rate": 0.00019738317757009345,
	"loss": 1.8822,
	"step": 70
	},
	{
	"epoch": 0.65,
	"eval_accuracy": 0.455026455026455,
	"eval_loss": 1.6512662172317505,
	"eval_runtime": 3.1742,
	"eval_samples_per_second": 59.542,
	"eval_steps_per_second": 7.561,
	"step": 70
	},
	{
	"epoch": 0.75,
	"learning_rate": 0.00019700934579439255,
	"loss": 1.7083,
	"step": 80
	},
	{
	"epoch": 0.75,
	"eval_accuracy": 0.4603174603174603,
	"eval_loss": 1.560472011566162,
	"eval_runtime": 3.0275,
	"eval_samples_per_second": 62.429,
	"eval_steps_per_second": 7.927,
	"step": 80
	},
	{
	"epoch": 0.84,
	"learning_rate": 0.00019663551401869161,
	"loss": 1.6416,
	"step": 90
	},
	{
	"epoch": 0.84,
	"eval_accuracy": 0.49206349206349204,
	"eval_loss": 1.5726529359817505,
	"eval_runtime": 3.0636,
	"eval_samples_per_second": 61.691,
	"eval_steps_per_second": 7.834,
	"step": 90
	},
	{
	"epoch": 0.93,
	"learning_rate": 0.00019626168224299065,
	"loss": 1.6473,
	"step": 100
	},
	{
	"epoch": 0.93,
	"eval_accuracy": 0.4656084656084656,
	"eval_loss": 1.648504614830017,
	"eval_runtime": 3.2766,
	"eval_samples_per_second": 57.682,
	"eval_steps_per_second": 7.325,
	"step": 100
	},
	{
	"epoch": 1.03,
	"learning_rate": 0.0001959252336448598,
	"loss": 1.3355,
	"step": 110
	},
	{
	"epoch": 1.03,
	"eval_accuracy": 0.5343915343915344,
	"eval_loss": 1.4000248908996582,
	"eval_runtime": 3.1074,
	"eval_samples_per_second": 60.823,
	"eval_steps_per_second": 7.724,
	"step": 110
	},
	{
	"epoch": 1.12,
	"learning_rate": 0.00019555140186915888,
	"loss": 1.4677,
	"step": 120
	},
	{
	"epoch": 1.12,
	"eval_accuracy": 0.544973544973545,
	"eval_loss": 1.3445547819137573,
	"eval_runtime": 3.4486,
	"eval_samples_per_second": 54.805,
	"eval_steps_per_second": 6.959,
	"step": 120
	},
	{
	"epoch": 1.21,
	"learning_rate": 0.00019517757009345797,
	"loss": 1.3832,
	"step": 130
	},
	{
	"epoch": 1.21,
	"eval_accuracy": 0.5555555555555556,
	"eval_loss": 1.3656994104385376,
	"eval_runtime": 3.0673,
	"eval_samples_per_second": 61.618,
	"eval_steps_per_second": 7.824,
	"step": 130
	},
	{
	"epoch": 1.31,
	"learning_rate": 0.00019480373831775701,
	"loss": 1.3364,
	"step": 140
	},
	{
	"epoch": 1.31,
	"eval_accuracy": 0.582010582010582,
	"eval_loss": 1.255820631980896,
	"eval_runtime": 3.1137,
	"eval_samples_per_second": 60.7,
	"eval_steps_per_second": 7.708,
	"step": 140
	},
	{
	"epoch": 1.4,
	"learning_rate": 0.00019442990654205608,
	"loss": 1.3741,
	"step": 150
	},
	{
	"epoch": 1.4,
	"eval_accuracy": 0.5343915343915344,
	"eval_loss": 1.4308785200119019,
	"eval_runtime": 3.1126,
	"eval_samples_per_second": 60.721,
	"eval_steps_per_second": 7.711,
	"step": 150
	},
	{
	"epoch": 1.5,
	"learning_rate": 0.00019405607476635515,
	"loss": 1.3806,
	"step": 160
	},
	{
	"epoch": 1.5,
	"eval_accuracy": 0.5873015873015873,
	"eval_loss": 1.3130360841751099,
	"eval_runtime": 3.1851,
	"eval_samples_per_second": 59.339,
	"eval_steps_per_second": 7.535,
	"step": 160
	},
	{
	"epoch": 1.59,
	"learning_rate": 0.00019368224299065422,
	"loss": 1.096,
	"step": 170
	},
	{
	"epoch": 1.59,
	"eval_accuracy": 0.6084656084656085,
	"eval_loss": 1.2385209798812866,
	"eval_runtime": 3.165,
	"eval_samples_per_second": 59.716,
	"eval_steps_per_second": 7.583,
	"step": 170
	},
	{
	"epoch": 1.68,
	"learning_rate": 0.00019330841121495328,
	"loss": 1.2139,
	"step": 180
	},
	{
	"epoch": 1.68,
	"eval_accuracy": 0.5925925925925926,
	"eval_loss": 1.2447173595428467,
	"eval_runtime": 3.2024,
	"eval_samples_per_second": 59.019,
	"eval_steps_per_second": 7.494,
	"step": 180
	},
	{
	"epoch": 1.78,
	"learning_rate": 0.00019293457943925235,
	"loss": 1.1646,
	"step": 190
	},
	{
	"epoch": 1.78,
	"eval_accuracy": 0.6243386243386243,
	"eval_loss": 1.1505087614059448,
	"eval_runtime": 3.3803,
	"eval_samples_per_second": 55.912,
	"eval_steps_per_second": 7.1,
	"step": 190
	},
	{
	"epoch": 1.87,
	"learning_rate": 0.00019256074766355142,
	"loss": 1.1851,
	"step": 200
	},
	{
	"epoch": 1.87,
	"eval_accuracy": 0.5555555555555556,
	"eval_loss": 1.292531967163086,
	"eval_runtime": 3.3243,
	"eval_samples_per_second": 56.854,
	"eval_steps_per_second": 7.22,
	"step": 200
	},
	{
	"epoch": 1.96,
	"learning_rate": 0.00019218691588785048,
	"loss": 1.0773,
	"step": 210
	},
	{
	"epoch": 1.96,
	"eval_accuracy": 0.6825396825396826,
	"eval_loss": 1.025804042816162,
	"eval_runtime": 3.2438,
	"eval_samples_per_second": 58.265,
	"eval_steps_per_second": 7.399,
	"step": 210
	},
	{
	"epoch": 2.06,
	"learning_rate": 0.00019181308411214952,
	"loss": 1.2694,
	"step": 220
	},
	{
	"epoch": 2.06,
	"eval_accuracy": 0.5978835978835979,
	"eval_loss": 1.1972746849060059,
	"eval_runtime": 3.0541,
	"eval_samples_per_second": 61.884,
	"eval_steps_per_second": 7.858,
	"step": 220
	},
	{
	"epoch": 2.15,
	"learning_rate": 0.00019143925233644862,
	"loss": 0.8254,
	"step": 230
	},
	{
	"epoch": 2.15,
	"eval_accuracy": 0.7142857142857143,
	"eval_loss": 0.9814253449440002,
	"eval_runtime": 3.1455,
	"eval_samples_per_second": 60.086,
	"eval_steps_per_second": 7.63,
	"step": 230
	},
	{
	"epoch": 2.24,
	"learning_rate": 0.0001910654205607477,
	"loss": 0.8614,
	"step": 240
	},
	{
	"epoch": 2.24,
	"eval_accuracy": 0.656084656084656,
	"eval_loss": 1.1236768960952759,
	"eval_runtime": 3.1907,
	"eval_samples_per_second": 59.235,
	"eval_steps_per_second": 7.522,
	"step": 240
	},
	{
	"epoch": 2.34,
	"learning_rate": 0.00019069158878504673,
	"loss": 0.961,
	"step": 250
	},
	{
	"epoch": 2.34,
	"eval_accuracy": 0.6666666666666666,
	"eval_loss": 1.0817521810531616,
	"eval_runtime": 3.2851,
	"eval_samples_per_second": 57.533,
	"eval_steps_per_second": 7.306,
	"step": 250
	},
	{
	"epoch": 2.43,
	"learning_rate": 0.0001903177570093458,
	"loss": 0.8305,
	"step": 260
	},
	{
	"epoch": 2.43,
	"eval_accuracy": 0.6613756613756614,
	"eval_loss": 1.0328330993652344,
	"eval_runtime": 3.1629,
	"eval_samples_per_second": 59.756,
	"eval_steps_per_second": 7.588,
	"step": 260
	},
	{
	"epoch": 2.52,
	"learning_rate": 0.00018994392523364486,
	"loss": 0.882,
	"step": 270
	},
	{
	"epoch": 2.52,
	"eval_accuracy": 0.6349206349206349,
	"eval_loss": 1.1382650136947632,
	"eval_runtime": 3.1128,
	"eval_samples_per_second": 60.718,
	"eval_steps_per_second": 7.71,
	"step": 270
	},
	{
	"epoch": 2.62,
	"learning_rate": 0.00018957009345794396,
	"loss": 0.9153,
	"step": 280
	},
	{
	"epoch": 2.62,
	"eval_accuracy": 0.6507936507936508,
	"eval_loss": 1.0411267280578613,
	"eval_runtime": 3.1356,
	"eval_samples_per_second": 60.275,
	"eval_steps_per_second": 7.654,
	"step": 280
	},
	{
	"epoch": 2.71,
	"learning_rate": 0.000189196261682243,
	"loss": 0.8855,
	"step": 290
	},
	{
	"epoch": 2.71,
	"eval_accuracy": 0.6984126984126984,
	"eval_loss": 0.9475411772727966,
	"eval_runtime": 3.2668,
	"eval_samples_per_second": 57.854,
	"eval_steps_per_second": 7.347,
	"step": 290
	},
	{
	"epoch": 2.8,
	"learning_rate": 0.00018882242990654206,
	"loss": 0.8792,
	"step": 300
	},
	{
	"epoch": 2.8,
	"eval_accuracy": 0.5978835978835979,
	"eval_loss": 1.1673120260238647,
	"eval_runtime": 3.2828,
	"eval_samples_per_second": 57.574,
	"eval_steps_per_second": 7.311,
	"step": 300
	},
	{
	"epoch": 2.9,
	"learning_rate": 0.00018844859813084113,
	"loss": 0.8555,
	"step": 310
	},
	{
	"epoch": 2.9,
	"eval_accuracy": 0.7407407407407407,
	"eval_loss": 0.8777327537536621,
	"eval_runtime": 3.2563,
	"eval_samples_per_second": 58.041,
	"eval_steps_per_second": 7.37,
	"step": 310
	},
	{
	"epoch": 2.99,
	"learning_rate": 0.0001880747663551402,
	"loss": 0.8841,
	"step": 320
	},
	{
	"epoch": 2.99,
	"eval_accuracy": 0.671957671957672,
	"eval_loss": 1.0181235074996948,
	"eval_runtime": 3.2414,
	"eval_samples_per_second": 58.308,
	"eval_steps_per_second": 7.404,
	"step": 320
	},
	{
	"epoch": 3.08,
	"learning_rate": 0.00018770093457943926,
	"loss": 0.5579,
	"step": 330
	},
	{
	"epoch": 3.08,
	"eval_accuracy": 0.6613756613756614,
	"eval_loss": 1.052778959274292,
	"eval_runtime": 3.3555,
	"eval_samples_per_second": 56.326,
	"eval_steps_per_second": 7.153,
	"step": 330
	},
	{
	"epoch": 3.18,
	"learning_rate": 0.00018732710280373833,
	"loss": 0.5953,
	"step": 340
	},
	{
	"epoch": 3.18,
	"eval_accuracy": 0.6455026455026455,
	"eval_loss": 1.095900058746338,
	"eval_runtime": 3.2945,
	"eval_samples_per_second": 57.369,
	"eval_steps_per_second": 7.285,
	"step": 340
	},
	{
	"epoch": 3.27,
	"learning_rate": 0.0001869532710280374,
	"loss": 0.62,
	"step": 350
	},
	{
	"epoch": 3.27,
	"eval_accuracy": 0.7037037037037037,
	"eval_loss": 0.9120954275131226,
	"eval_runtime": 3.6012,
	"eval_samples_per_second": 52.483,
	"eval_steps_per_second": 6.664,
	"step": 350
	},
	{
	"epoch": 3.36,
	"learning_rate": 0.00018657943925233644,
	"loss": 0.7633,
	"step": 360
	},
	{
	"epoch": 3.36,
	"eval_accuracy": 0.6984126984126984,
	"eval_loss": 0.926105797290802,
	"eval_runtime": 3.4368,
	"eval_samples_per_second": 54.992,
	"eval_steps_per_second": 6.983,
	"step": 360
	},
	{
	"epoch": 3.46,
	"learning_rate": 0.0001862056074766355,
	"loss": 0.7009,
	"step": 370
	},
	{
	"epoch": 3.46,
	"eval_accuracy": 0.6296296296296297,
	"eval_loss": 1.1945137977600098,
	"eval_runtime": 3.788,
	"eval_samples_per_second": 49.895,
	"eval_steps_per_second": 6.336,
	"step": 370
	},
	{
	"epoch": 3.55,
	"learning_rate": 0.0001858317757009346,
	"loss": 0.8007,
	"step": 380
	},
	{
	"epoch": 3.55,
	"eval_accuracy": 0.6296296296296297,
	"eval_loss": 1.0851304531097412,
	"eval_runtime": 3.287,
	"eval_samples_per_second": 57.499,
	"eval_steps_per_second": 7.301,
	"step": 380
	},
	{
	"epoch": 3.64,
	"learning_rate": 0.00018545794392523367,
	"loss": 0.7921,
	"step": 390
	},
	{
	"epoch": 3.64,
	"eval_accuracy": 0.6984126984126984,
	"eval_loss": 0.935813307762146,
	"eval_runtime": 3.1749,
	"eval_samples_per_second": 59.529,
	"eval_steps_per_second": 7.559,
	"step": 390
	},
	{
	"epoch": 3.74,
	"learning_rate": 0.0001850841121495327,
	"loss": 0.5837,
	"step": 400
	},
	{
	"epoch": 3.74,
	"eval_accuracy": 0.6666666666666666,
	"eval_loss": 0.987457811832428,
	"eval_runtime": 3.1206,
	"eval_samples_per_second": 60.565,
	"eval_steps_per_second": 7.691,
	"step": 400
	},
	{
	"epoch": 3.83,
	"learning_rate": 0.00018471028037383178,
	"loss": 0.6557,
	"step": 410
	},
	{
	"epoch": 3.83,
	"eval_accuracy": 0.6931216931216931,
	"eval_loss": 0.9543613791465759,
	"eval_runtime": 3.2455,
	"eval_samples_per_second": 58.235,
	"eval_steps_per_second": 7.395,
	"step": 410
	},
	{
	"epoch": 3.93,
	"learning_rate": 0.00018433644859813084,
	"loss": 0.8081,
	"step": 420
	},
	{
	"epoch": 3.93,
	"eval_accuracy": 0.656084656084656,
	"eval_loss": 1.087867259979248,
	"eval_runtime": 3.0993,
	"eval_samples_per_second": 60.981,
	"eval_steps_per_second": 7.744,
	"step": 420
	},
	{
	"epoch": 4.02,
	"learning_rate": 0.0001839626168224299,
	"loss": 0.7486,
	"step": 430
	},
	{
	"epoch": 4.02,
	"eval_accuracy": 0.6190476190476191,
	"eval_loss": 1.266100287437439,
	"eval_runtime": 3.1838,
	"eval_samples_per_second": 59.363,
	"eval_steps_per_second": 7.538,
	"step": 430
	},
	{
	"epoch": 4.11,
	"learning_rate": 0.00018358878504672898,
	"loss": 0.5166,
	"step": 440
	},
	{
	"epoch": 4.11,
	"eval_accuracy": 0.7142857142857143,
	"eval_loss": 0.9324920773506165,
	"eval_runtime": 3.1917,
	"eval_samples_per_second": 59.216,
	"eval_steps_per_second": 7.52,
	"step": 440
	},
	{
	"epoch": 4.21,
	"learning_rate": 0.00018321495327102804,
	"loss": 0.4375,
	"step": 450
	},
	{
	"epoch": 4.21,
	"eval_accuracy": 0.7037037037037037,
	"eval_loss": 0.8819901943206787,
	"eval_runtime": 3.1479,
	"eval_samples_per_second": 60.04,
	"eval_steps_per_second": 7.624,
	"step": 450
	},
	{
	"epoch": 4.3,
	"learning_rate": 0.0001828411214953271,
	"loss": 0.4839,
	"step": 460
	},
	{
	"epoch": 4.3,
	"eval_accuracy": 0.6825396825396826,
	"eval_loss": 1.0533747673034668,
	"eval_runtime": 3.1426,
	"eval_samples_per_second": 60.141,
	"eval_steps_per_second": 7.637,
	"step": 460
	},
	{
	"epoch": 4.39,
	"learning_rate": 0.00018246728971962618,
	"loss": 0.3932,
	"step": 470
	},
	{
	"epoch": 4.39,
	"eval_accuracy": 0.7037037037037037,
	"eval_loss": 1.0015952587127686,
	"eval_runtime": 3.1739,
	"eval_samples_per_second": 59.548,
	"eval_steps_per_second": 7.562,
	"step": 470
	},
	{
	"epoch": 4.49,
	"learning_rate": 0.00018209345794392525,
	"loss": 0.4672,
	"step": 480
	},
	{
	"epoch": 4.49,
	"eval_accuracy": 0.746031746031746,
	"eval_loss": 0.8358047604560852,
	"eval_runtime": 3.1086,
	"eval_samples_per_second": 60.8,
	"eval_steps_per_second": 7.721,
	"step": 480
	},
	{
	"epoch": 4.58,
	"learning_rate": 0.0001817196261682243,
	"loss": 0.4839,
	"step": 490
	},
	{
	"epoch": 4.58,
	"eval_accuracy": 0.6666666666666666,
	"eval_loss": 1.0010868310928345,
	"eval_runtime": 3.436,
	"eval_samples_per_second": 55.006,
	"eval_steps_per_second": 6.985,
	"step": 490
	},
	{
	"epoch": 4.67,
	"learning_rate": 0.00018134579439252338,
	"loss": 0.4536,
	"step": 500
	},
	{
	"epoch": 4.67,
	"eval_accuracy": 0.5925925925925926,
	"eval_loss": 1.4390077590942383,
	"eval_runtime": 3.2086,
	"eval_samples_per_second": 58.905,
	"eval_steps_per_second": 7.48,
	"step": 500
	},
	{
	"epoch": 4.77,
	"learning_rate": 0.00018097196261682242,
	"loss": 0.5925,
	"step": 510
	},
	{
	"epoch": 4.77,
	"eval_accuracy": 0.6455026455026455,
	"eval_loss": 1.0699883699417114,
	"eval_runtime": 3.2145,
	"eval_samples_per_second": 58.796,
	"eval_steps_per_second": 7.466,
	"step": 510
	},
	{
	"epoch": 4.86,
	"learning_rate": 0.0001805981308411215,
	"loss": 0.4905,
	"step": 520
	},
	{
	"epoch": 4.86,
	"eval_accuracy": 0.6772486772486772,
	"eval_loss": 1.0934034585952759,
	"eval_runtime": 3.1633,
	"eval_samples_per_second": 59.748,
	"eval_steps_per_second": 7.587,
	"step": 520
	},
	{
	"epoch": 4.95,
	"learning_rate": 0.00018022429906542058,
	"loss": 0.6323,
	"step": 530
	},
	{
	"epoch": 4.95,
	"eval_accuracy": 0.656084656084656,
	"eval_loss": 1.074127197265625,
	"eval_runtime": 3.0611,
	"eval_samples_per_second": 61.742,
	"eval_steps_per_second": 7.84,
	"step": 530
	},
	{
	"epoch": 5.05,
	"learning_rate": 0.00017985046728971965,
	"loss": 0.3686,
	"step": 540
	},
	{
	"epoch": 5.05,
	"eval_accuracy": 0.6613756613756614,
	"eval_loss": 1.17642080783844,
	"eval_runtime": 3.1625,
	"eval_samples_per_second": 59.764,
	"eval_steps_per_second": 7.589,
	"step": 540
	},
	{
	"epoch": 5.14,
	"learning_rate": 0.0001794766355140187,
	"loss": 0.3233,
	"step": 550
	},
	{
	"epoch": 5.14,
	"eval_accuracy": 0.6666666666666666,
	"eval_loss": 0.9969061017036438,
	"eval_runtime": 3.1186,
	"eval_samples_per_second": 60.604,
	"eval_steps_per_second": 7.696,
	"step": 550
	},
	{
	"epoch": 5.23,
	"learning_rate": 0.00017910280373831776,
	"loss": 0.2791,
	"step": 560
	},
	{
	"epoch": 5.23,
	"eval_accuracy": 0.6613756613756614,
	"eval_loss": 1.20182466506958,
	"eval_runtime": 3.2809,
	"eval_samples_per_second": 57.607,
	"eval_steps_per_second": 7.315,
	"step": 560
	},
	{
	"epoch": 5.33,
	"learning_rate": 0.00017872897196261682,
	"loss": 0.2798,
	"step": 570
	},
	{
	"epoch": 5.33,
	"eval_accuracy": 0.6772486772486772,
	"eval_loss": 1.0335559844970703,
	"eval_runtime": 3.1419,
	"eval_samples_per_second": 60.155,
	"eval_steps_per_second": 7.639,
	"step": 570
	},
	{
	"epoch": 5.42,
	"learning_rate": 0.0001783551401869159,
	"loss": 0.2892,
	"step": 580
	},
	{
	"epoch": 5.42,
	"eval_accuracy": 0.6296296296296297,
	"eval_loss": 1.3315926790237427,
	"eval_runtime": 3.2144,
	"eval_samples_per_second": 58.797,
	"eval_steps_per_second": 7.466,
	"step": 580
	},
	{
	"epoch": 5.51,
	"learning_rate": 0.00017798130841121496,
	"loss": 0.317,
	"step": 590
	},
	{
	"epoch": 5.51,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.0159733295440674,
	"eval_runtime": 3.1281,
	"eval_samples_per_second": 60.42,
	"eval_steps_per_second": 7.672,
	"step": 590
	},
	{
	"epoch": 5.61,
	"learning_rate": 0.00017760747663551403,
	"loss": 0.3673,
	"step": 600
	},
	{
	"epoch": 5.61,
	"eval_accuracy": 0.6190476190476191,
	"eval_loss": 1.3200335502624512,
	"eval_runtime": 2.9997,
	"eval_samples_per_second": 63.006,
	"eval_steps_per_second": 8.001,
	"step": 600
	},
	{
	"epoch": 5.7,
	"learning_rate": 0.0001772336448598131,
	"loss": 0.4733,
	"step": 610
	},
	{
	"epoch": 5.7,
	"eval_accuracy": 0.6455026455026455,
	"eval_loss": 1.2423778772354126,
	"eval_runtime": 3.2132,
	"eval_samples_per_second": 58.819,
	"eval_steps_per_second": 7.469,
	"step": 610
	},
	{
	"epoch": 5.79,
	"learning_rate": 0.00017685981308411216,
	"loss": 0.4683,
	"step": 620
	},
	{
	"epoch": 5.79,
	"eval_accuracy": 0.7248677248677249,
	"eval_loss": 0.8893383145332336,
	"eval_runtime": 3.1811,
	"eval_samples_per_second": 59.413,
	"eval_steps_per_second": 7.545,
	"step": 620
	},
	{
	"epoch": 5.89,
	"learning_rate": 0.00017648598130841123,
	"loss": 0.4179,
	"step": 630
	},
	{
	"epoch": 5.89,
	"eval_accuracy": 0.7142857142857143,
	"eval_loss": 1.0192750692367554,
	"eval_runtime": 3.1066,
	"eval_samples_per_second": 60.839,
	"eval_steps_per_second": 7.726,
	"step": 630
	},
	{
	"epoch": 5.98,
	"learning_rate": 0.0001761121495327103,
	"loss": 0.3667,
	"step": 640
	},
	{
	"epoch": 5.98,
	"eval_accuracy": 0.7037037037037037,
	"eval_loss": 0.9950593113899231,
	"eval_runtime": 3.1029,
	"eval_samples_per_second": 60.911,
	"eval_steps_per_second": 7.735,
	"step": 640
	},
	{
	"epoch": 6.07,
	"learning_rate": 0.00017573831775700936,
	"loss": 0.2212,
	"step": 650
	},
	{
	"epoch": 6.07,
	"eval_accuracy": 0.7354497354497355,
	"eval_loss": 0.9019126296043396,
	"eval_runtime": 3.0407,
	"eval_samples_per_second": 62.156,
	"eval_steps_per_second": 7.893,
	"step": 650
	},
	{
	"epoch": 6.17,
	"learning_rate": 0.0001753644859813084,
	"loss": 0.1881,
	"step": 660
	},
	{
	"epoch": 6.17,
	"eval_accuracy": 0.656084656084656,
	"eval_loss": 1.1512494087219238,
	"eval_runtime": 3.0574,
	"eval_samples_per_second": 61.818,
	"eval_steps_per_second": 7.85,
	"step": 660
	},
	{
	"epoch": 6.26,
	"learning_rate": 0.0001749906542056075,
	"loss": 0.2403,
	"step": 670
	},
	{
	"epoch": 6.26,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.0092432498931885,
	"eval_runtime": 3.1346,
	"eval_samples_per_second": 60.295,
	"eval_steps_per_second": 7.657,
	"step": 670
	},
	{
	"epoch": 6.36,
	"learning_rate": 0.00017461682242990656,
	"loss": 0.2597,
	"step": 680
	},
	{
	"epoch": 6.36,
	"eval_accuracy": 0.6825396825396826,
	"eval_loss": 1.1817060708999634,
	"eval_runtime": 3.0592,
	"eval_samples_per_second": 61.781,
	"eval_steps_per_second": 7.845,
	"step": 680
	},
	{
	"epoch": 6.45,
	"learning_rate": 0.00017424299065420563,
	"loss": 0.2644,
	"step": 690
	},
	{
	"epoch": 6.45,
	"eval_accuracy": 0.6507936507936508,
	"eval_loss": 1.258557677268982,
	"eval_runtime": 3.1473,
	"eval_samples_per_second": 60.051,
	"eval_steps_per_second": 7.626,
	"step": 690
	},
	{
	"epoch": 6.54,
	"learning_rate": 0.00017386915887850467,
	"loss": 0.2562,
	"step": 700
	},
	{
	"epoch": 6.54,
	"eval_accuracy": 0.7195767195767195,
	"eval_loss": 1.0005096197128296,
	"eval_runtime": 3.1123,
	"eval_samples_per_second": 60.726,
	"eval_steps_per_second": 7.711,
	"step": 700
	},
	{
	"epoch": 6.64,
	"learning_rate": 0.00017349532710280374,
	"loss": 0.1487,
	"step": 710
	},
	{
	"epoch": 6.64,
	"eval_accuracy": 0.6507936507936508,
	"eval_loss": 1.2767467498779297,
	"eval_runtime": 3.1275,
	"eval_samples_per_second": 60.433,
	"eval_steps_per_second": 7.674,
	"step": 710
	},
	{
	"epoch": 6.73,
	"learning_rate": 0.00017312149532710283,
	"loss": 0.2953,
	"step": 720
	},
	{
	"epoch": 6.73,
	"eval_accuracy": 0.6984126984126984,
	"eval_loss": 1.253779649734497,
	"eval_runtime": 3.2123,
	"eval_samples_per_second": 58.836,
	"eval_steps_per_second": 7.471,
	"step": 720
	},
	{
	"epoch": 6.82,
	"learning_rate": 0.00017274766355140187,
	"loss": 0.1725,
	"step": 730
	},
	{
	"epoch": 6.82,
	"eval_accuracy": 0.656084656084656,
	"eval_loss": 1.2238225936889648,
	"eval_runtime": 3.1844,
	"eval_samples_per_second": 59.353,
	"eval_steps_per_second": 7.537,
	"step": 730
	},
	{
	"epoch": 6.92,
	"learning_rate": 0.00017237383177570094,
	"loss": 0.2037,
	"step": 740
	},
	{
	"epoch": 6.92,
	"eval_accuracy": 0.6084656084656085,
	"eval_loss": 1.468080759048462,
	"eval_runtime": 3.1309,
	"eval_samples_per_second": 60.366,
	"eval_steps_per_second": 7.666,
	"step": 740
	},
	{
	"epoch": 7.01,
	"learning_rate": 0.000172,
	"loss": 0.2592,
	"step": 750
	},
	{
	"epoch": 7.01,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.2074000835418701,
	"eval_runtime": 3.2681,
	"eval_samples_per_second": 57.831,
	"eval_steps_per_second": 7.344,
	"step": 750
	},
	{
	"epoch": 7.1,
	"learning_rate": 0.00017162616822429907,
	"loss": 0.1851,
	"step": 760
	},
	{
	"epoch": 7.1,
	"eval_accuracy": 0.6825396825396826,
	"eval_loss": 1.1313153505325317,
	"eval_runtime": 3.1857,
	"eval_samples_per_second": 59.328,
	"eval_steps_per_second": 7.534,
	"step": 760
	},
	{
	"epoch": 7.2,
	"learning_rate": 0.00017125233644859814,
	"loss": 0.0958,
	"step": 770
	},
	{
	"epoch": 7.2,
	"eval_accuracy": 0.6931216931216931,
	"eval_loss": 1.222944974899292,
	"eval_runtime": 3.1213,
	"eval_samples_per_second": 60.551,
	"eval_steps_per_second": 7.689,
	"step": 770
	},
	{
	"epoch": 7.29,
	"learning_rate": 0.0001708785046728972,
	"loss": 0.0947,
	"step": 780
	},
	{
	"epoch": 7.29,
	"eval_accuracy": 0.6613756613756614,
	"eval_loss": 1.3873189687728882,
	"eval_runtime": 3.0939,
	"eval_samples_per_second": 61.087,
	"eval_steps_per_second": 7.757,
	"step": 780
	},
	{
	"epoch": 7.38,
	"learning_rate": 0.00017050467289719628,
	"loss": 0.2053,
	"step": 790
	},
	{
	"epoch": 7.38,
	"eval_accuracy": 0.6666666666666666,
	"eval_loss": 1.4111433029174805,
	"eval_runtime": 3.0678,
	"eval_samples_per_second": 61.607,
	"eval_steps_per_second": 7.823,
	"step": 790
	},
	{
	"epoch": 7.48,
	"learning_rate": 0.00017013084112149534,
	"loss": 0.2165,
	"step": 800
	},
	{
	"epoch": 7.48,
	"eval_accuracy": 0.6878306878306878,
	"eval_loss": 1.3087962865829468,
	"eval_runtime": 3.1862,
	"eval_samples_per_second": 59.319,
	"eval_steps_per_second": 7.533,
	"step": 800
	},
	{
	"epoch": 7.57,
	"learning_rate": 0.00016975700934579438,
	"loss": 0.2425,
	"step": 810
	},
	{
	"epoch": 7.57,
	"eval_accuracy": 0.6984126984126984,
	"eval_loss": 1.3991620540618896,
	"eval_runtime": 3.2153,
	"eval_samples_per_second": 58.781,
	"eval_steps_per_second": 7.464,
	"step": 810
	},
	{
	"epoch": 7.66,
	"learning_rate": 0.00016938317757009348,
	"loss": 0.1644,
	"step": 820
	},
	{
	"epoch": 7.66,
	"eval_accuracy": 0.7248677248677249,
	"eval_loss": 1.080649733543396,
	"eval_runtime": 3.2137,
	"eval_samples_per_second": 58.811,
	"eval_steps_per_second": 7.468,
	"step": 820
	},
	{
	"epoch": 7.76,
	"learning_rate": 0.00016900934579439254,
	"loss": 0.3093,
	"step": 830
	},
	{
	"epoch": 7.76,
	"eval_accuracy": 0.6878306878306878,
	"eval_loss": 1.214190125465393,
	"eval_runtime": 3.1342,
	"eval_samples_per_second": 60.302,
	"eval_steps_per_second": 7.657,
	"step": 830
	},
	{
	"epoch": 7.85,
	"learning_rate": 0.0001686355140186916,
	"loss": 0.2525,
	"step": 840
	},
	{
	"epoch": 7.85,
	"eval_accuracy": 0.656084656084656,
	"eval_loss": 1.3408259153366089,
	"eval_runtime": 3.0897,
	"eval_samples_per_second": 61.171,
	"eval_steps_per_second": 7.768,
	"step": 840
	},
	{
	"epoch": 7.94,
	"learning_rate": 0.00016826168224299065,
	"loss": 0.3339,
	"step": 850
	},
	{
	"epoch": 7.94,
	"eval_accuracy": 0.7248677248677249,
	"eval_loss": 1.1808757781982422,
	"eval_runtime": 3.2528,
	"eval_samples_per_second": 58.104,
	"eval_steps_per_second": 7.378,
	"step": 850
	},
	{
	"epoch": 8.04,
	"learning_rate": 0.00016788785046728972,
	"loss": 0.1044,
	"step": 860
	},
	{
	"epoch": 8.04,
	"eval_accuracy": 0.6666666666666666,
	"eval_loss": 1.2688654661178589,
	"eval_runtime": 3.09,
	"eval_samples_per_second": 61.165,
	"eval_steps_per_second": 7.767,
	"step": 860
	},
	{
	"epoch": 8.13,
	"learning_rate": 0.0001675140186915888,
	"loss": 0.093,
	"step": 870
	},
	{
	"epoch": 8.13,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.209309697151184,
	"eval_runtime": 3.1281,
	"eval_samples_per_second": 60.421,
	"eval_steps_per_second": 7.672,
	"step": 870
	},
	{
	"epoch": 8.22,
	"learning_rate": 0.00016714018691588785,
	"loss": 0.2934,
	"step": 880
	},
	{
	"epoch": 8.22,
	"eval_accuracy": 0.671957671957672,
	"eval_loss": 1.1540151834487915,
	"eval_runtime": 3.27,
	"eval_samples_per_second": 57.798,
	"eval_steps_per_second": 7.339,
	"step": 880
	},
	{
	"epoch": 8.32,
	"learning_rate": 0.00016676635514018692,
	"loss": 0.2133,
	"step": 890
	},
	{
	"epoch": 8.32,
	"eval_accuracy": 0.6349206349206349,
	"eval_loss": 1.5835676193237305,
	"eval_runtime": 3.2878,
	"eval_samples_per_second": 57.485,
	"eval_steps_per_second": 7.3,
	"step": 890
	},
	{
	"epoch": 8.41,
	"learning_rate": 0.000166392523364486,
	"loss": 0.2045,
	"step": 900
	},
	{
	"epoch": 8.41,
	"eval_accuracy": 0.6507936507936508,
	"eval_loss": 1.2564616203308105,
	"eval_runtime": 3.1746,
	"eval_samples_per_second": 59.536,
	"eval_steps_per_second": 7.56,
	"step": 900
	},
	{
	"epoch": 8.5,
	"learning_rate": 0.00016601869158878506,
	"loss": 0.2886,
	"step": 910
	},
	{
	"epoch": 8.5,
	"eval_accuracy": 0.6613756613756614,
	"eval_loss": 1.3674818277359009,
	"eval_runtime": 3.2413,
	"eval_samples_per_second": 58.311,
	"eval_steps_per_second": 7.405,
	"step": 910
	},
	{
	"epoch": 8.6,
	"learning_rate": 0.00016564485981308412,
	"loss": 0.128,
	"step": 920
	},
	{
	"epoch": 8.6,
	"eval_accuracy": 0.671957671957672,
	"eval_loss": 1.2137342691421509,
	"eval_runtime": 3.222,
	"eval_samples_per_second": 58.658,
	"eval_steps_per_second": 7.449,
	"step": 920
	},
	{
	"epoch": 8.69,
	"learning_rate": 0.0001652710280373832,
	"loss": 0.0785,
	"step": 930
	},
	{
	"epoch": 8.69,
	"eval_accuracy": 0.6825396825396826,
	"eval_loss": 1.3206517696380615,
	"eval_runtime": 3.21,
	"eval_samples_per_second": 58.878,
	"eval_steps_per_second": 7.477,
	"step": 930
	},
	{
	"epoch": 8.79,
	"learning_rate": 0.00016489719626168226,
	"loss": 0.1409,
	"step": 940
	},
	{
	"epoch": 8.79,
	"eval_accuracy": 0.6878306878306878,
	"eval_loss": 1.2279229164123535,
	"eval_runtime": 3.1127,
	"eval_samples_per_second": 60.719,
	"eval_steps_per_second": 7.71,
	"step": 940
	},
	{
	"epoch": 8.88,
	"learning_rate": 0.00016452336448598132,
	"loss": 0.1221,
	"step": 950
	},
	{
	"epoch": 8.88,
	"eval_accuracy": 0.7513227513227513,
	"eval_loss": 0.9318807125091553,
	"eval_runtime": 3.2281,
	"eval_samples_per_second": 58.549,
	"eval_steps_per_second": 7.435,
	"step": 950
	},
	{
	"epoch": 8.97,
	"learning_rate": 0.00016414953271028036,
	"loss": 0.112,
	"step": 960
	},
	{
	"epoch": 8.97,
	"eval_accuracy": 0.671957671957672,
	"eval_loss": 1.267318606376648,
	"eval_runtime": 3.1888,
	"eval_samples_per_second": 59.27,
	"eval_steps_per_second": 7.526,
	"step": 960
	},
	{
	"epoch": 9.07,
	"learning_rate": 0.00016377570093457946,
	"loss": 0.0863,
	"step": 970
	},
	{
	"epoch": 9.07,
	"eval_accuracy": 0.6931216931216931,
	"eval_loss": 1.3446311950683594,
	"eval_runtime": 3.2112,
	"eval_samples_per_second": 58.857,
	"eval_steps_per_second": 7.474,
	"step": 970
	},
	{
	"epoch": 9.16,
	"learning_rate": 0.00016340186915887853,
	"loss": 0.0915,
	"step": 980
	},
	{
	"epoch": 9.16,
	"eval_accuracy": 0.7037037037037037,
	"eval_loss": 1.1720484495162964,
	"eval_runtime": 3.1413,
	"eval_samples_per_second": 60.167,
	"eval_steps_per_second": 7.64,
	"step": 980
	},
	{
	"epoch": 9.25,
	"learning_rate": 0.00016302803738317757,
	"loss": 0.0911,
	"step": 990
	},
	{
	"epoch": 9.25,
	"eval_accuracy": 0.6984126984126984,
	"eval_loss": 1.2161829471588135,
	"eval_runtime": 3.2839,
	"eval_samples_per_second": 57.553,
	"eval_steps_per_second": 7.308,
	"step": 990
	},
	{
	"epoch": 9.35,
	"learning_rate": 0.00016265420560747663,
	"loss": 0.0763,
	"step": 1000
	},
	{
	"epoch": 9.35,
	"eval_accuracy": 0.7142857142857143,
	"eval_loss": 1.1872042417526245,
	"eval_runtime": 3.1612,
	"eval_samples_per_second": 59.787,
	"eval_steps_per_second": 7.592,
	"step": 1000
	},
	{
	"epoch": 9.44,
	"learning_rate": 0.0001622803738317757,
	"loss": 0.0524,
	"step": 1010
	},
	{
	"epoch": 9.44,
	"eval_accuracy": 0.6878306878306878,
	"eval_loss": 1.3205093145370483,
	"eval_runtime": 3.1614,
	"eval_samples_per_second": 59.784,
	"eval_steps_per_second": 7.592,
	"step": 1010
	},
	{
	"epoch": 9.53,
	"learning_rate": 0.0001619065420560748,
	"loss": 0.1508,
	"step": 1020
	},
	{
	"epoch": 9.53,
	"eval_accuracy": 0.6507936507936508,
	"eval_loss": 1.5726176500320435,
	"eval_runtime": 3.161,
	"eval_samples_per_second": 59.791,
	"eval_steps_per_second": 7.593,
	"step": 1020
	},
	{
	"epoch": 9.63,
	"learning_rate": 0.00016153271028037383,
	"loss": 0.0994,
	"step": 1030
	},
	{
	"epoch": 9.63,
	"eval_accuracy": 0.6931216931216931,
	"eval_loss": 1.3505302667617798,
	"eval_runtime": 3.1505,
	"eval_samples_per_second": 59.99,
	"eval_steps_per_second": 7.618,
	"step": 1030
	},
	{
	"epoch": 9.72,
	"learning_rate": 0.0001611588785046729,
	"loss": 0.223,
	"step": 1040
	},
	{
	"epoch": 9.72,
	"eval_accuracy": 0.671957671957672,
	"eval_loss": 1.3896968364715576,
	"eval_runtime": 3.1746,
	"eval_samples_per_second": 59.536,
	"eval_steps_per_second": 7.56,
	"step": 1040
	},
	{
	"epoch": 9.81,
	"learning_rate": 0.00016078504672897197,
	"loss": 0.1115,
	"step": 1050
	},
	{
	"epoch": 9.81,
	"eval_accuracy": 0.6772486772486772,
	"eval_loss": 1.3965896368026733,
	"eval_runtime": 3.2706,
	"eval_samples_per_second": 57.787,
	"eval_steps_per_second": 7.338,
	"step": 1050
	},
	{
	"epoch": 9.91,
	"learning_rate": 0.00016041121495327104,
	"loss": 0.1485,
	"step": 1060
	},
	{
	"epoch": 9.91,
	"eval_accuracy": 0.6878306878306878,
	"eval_loss": 1.4686475992202759,
	"eval_runtime": 3.1507,
	"eval_samples_per_second": 59.987,
	"eval_steps_per_second": 7.617,
	"step": 1060
	},
	{
	"epoch": 10.0,
	"learning_rate": 0.0001600373831775701,
	"loss": 0.18,
	"step": 1070
	},
	{
	"epoch": 10.0,
	"eval_accuracy": 0.6878306878306878,
	"eval_loss": 1.2233675718307495,
	"eval_runtime": 3.1543,
	"eval_samples_per_second": 59.919,
	"eval_steps_per_second": 7.609,
	"step": 1070
	},
	{
	"epoch": 10.09,
	"learning_rate": 0.00015966355140186917,
	"loss": 0.1366,
	"step": 1080
	},
	{
	"epoch": 10.09,
	"eval_accuracy": 0.6666666666666666,
	"eval_loss": 1.4836784601211548,
	"eval_runtime": 3.2142,
	"eval_samples_per_second": 58.802,
	"eval_steps_per_second": 7.467,
	"step": 1080
	},
	{
	"epoch": 10.19,
	"learning_rate": 0.00015928971962616824,
	"loss": 0.149,
	"step": 1090
	},
	{
	"epoch": 10.19,
	"eval_accuracy": 0.671957671957672,
	"eval_loss": 1.4587175846099854,
	"eval_runtime": 3.2536,
	"eval_samples_per_second": 58.09,
	"eval_steps_per_second": 7.377,
	"step": 1090
	},
	{
	"epoch": 10.28,
	"learning_rate": 0.0001589158878504673,
	"loss": 0.1618,
	"step": 1100
	},
	{
	"epoch": 10.28,
	"eval_accuracy": 0.6666666666666666,
	"eval_loss": 1.3593031167984009,
	"eval_runtime": 3.1414,
	"eval_samples_per_second": 60.165,
	"eval_steps_per_second": 7.64,
	"step": 1100
	},
	{
	"epoch": 10.37,
	"learning_rate": 0.00015854205607476635,
	"loss": 0.1302,
	"step": 1110
	},
	{
	"epoch": 10.37,
	"eval_accuracy": 0.6349206349206349,
	"eval_loss": 1.5082346200942993,
	"eval_runtime": 3.1372,
	"eval_samples_per_second": 60.244,
	"eval_steps_per_second": 7.65,
	"step": 1110
	},
	{
	"epoch": 10.47,
	"learning_rate": 0.00015816822429906544,
	"loss": 0.0208,
	"step": 1120
	},
	{
	"epoch": 10.47,
	"eval_accuracy": 0.7037037037037037,
	"eval_loss": 1.4162836074829102,
	"eval_runtime": 3.2255,
	"eval_samples_per_second": 58.596,
	"eval_steps_per_second": 7.441,
	"step": 1120
	},
	{
	"epoch": 10.56,
	"learning_rate": 0.0001577943925233645,
	"loss": 0.0314,
	"step": 1130
	},
	{
	"epoch": 10.56,
	"eval_accuracy": 0.7248677248677249,
	"eval_loss": 1.2450639009475708,
	"eval_runtime": 3.2013,
	"eval_samples_per_second": 59.038,
	"eval_steps_per_second": 7.497,
	"step": 1130
	},
	{
	"epoch": 10.65,
	"learning_rate": 0.00015742056074766355,
	"loss": 0.0355,
	"step": 1140
	},
	{
	"epoch": 10.65,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.3142927885055542,
	"eval_runtime": 3.2738,
	"eval_samples_per_second": 57.732,
	"eval_steps_per_second": 7.331,
	"step": 1140
	},
	{
	"epoch": 10.75,
	"learning_rate": 0.00015704672897196261,
	"loss": 0.1024,
	"step": 1150
	},
	{
	"epoch": 10.75,
	"eval_accuracy": 0.6878306878306878,
	"eval_loss": 1.4214942455291748,
	"eval_runtime": 3.2147,
	"eval_samples_per_second": 58.792,
	"eval_steps_per_second": 7.466,
	"step": 1150
	},
	{
	"epoch": 10.84,
	"learning_rate": 0.00015667289719626168,
	"loss": 0.0733,
	"step": 1160
	},
	{
	"epoch": 10.84,
	"eval_accuracy": 0.7142857142857143,
	"eval_loss": 1.2427018880844116,
	"eval_runtime": 3.1456,
	"eval_samples_per_second": 60.085,
	"eval_steps_per_second": 7.63,
	"step": 1160
	},
	{
	"epoch": 10.93,
	"learning_rate": 0.00015629906542056078,
	"loss": 0.0542,
	"step": 1170
	},
	{
	"epoch": 10.93,
	"eval_accuracy": 0.6825396825396826,
	"eval_loss": 1.5809307098388672,
	"eval_runtime": 3.2372,
	"eval_samples_per_second": 58.384,
	"eval_steps_per_second": 7.414,
	"step": 1170
	},
	{
	"epoch": 11.03,
	"learning_rate": 0.00015592523364485982,
	"loss": 0.0995,
	"step": 1180
	},
	{
	"epoch": 11.03,
	"eval_accuracy": 0.6613756613756614,
	"eval_loss": 1.5994837284088135,
	"eval_runtime": 3.153,
	"eval_samples_per_second": 59.943,
	"eval_steps_per_second": 7.612,
	"step": 1180
	},
	{
	"epoch": 11.12,
	"learning_rate": 0.00015555140186915888,
	"loss": 0.0653,
	"step": 1190
	},
	{
	"epoch": 11.12,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.3932106494903564,
	"eval_runtime": 3.2168,
	"eval_samples_per_second": 58.753,
	"eval_steps_per_second": 7.461,
	"step": 1190
	},
	{
	"epoch": 11.21,
	"learning_rate": 0.00015517757009345795,
	"loss": 0.0339,
	"step": 1200
	},
	{
	"epoch": 11.21,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.2856649160385132,
	"eval_runtime": 3.0564,
	"eval_samples_per_second": 61.837,
	"eval_steps_per_second": 7.852,
	"step": 1200
	},
	{
	"epoch": 11.31,
	"learning_rate": 0.00015480373831775702,
	"loss": 0.1038,
	"step": 1210
	},
	{
	"epoch": 11.31,
	"eval_accuracy": 0.7407407407407407,
	"eval_loss": 1.2895965576171875,
	"eval_runtime": 3.1971,
	"eval_samples_per_second": 59.115,
	"eval_steps_per_second": 7.507,
	"step": 1210
	},
	{
	"epoch": 11.4,
	"learning_rate": 0.00015442990654205608,
	"loss": 0.0415,
	"step": 1220
	},
	{
	"epoch": 11.4,
	"eval_accuracy": 0.7354497354497355,
	"eval_loss": 1.2908622026443481,
	"eval_runtime": 3.2149,
	"eval_samples_per_second": 58.789,
	"eval_steps_per_second": 7.465,
	"step": 1220
	},
	{
	"epoch": 11.5,
	"learning_rate": 0.00015405607476635515,
	"loss": 0.0629,
	"step": 1230
	},
	{
	"epoch": 11.5,
	"eval_accuracy": 0.7142857142857143,
	"eval_loss": 1.3047831058502197,
	"eval_runtime": 3.228,
	"eval_samples_per_second": 58.55,
	"eval_steps_per_second": 7.435,
	"step": 1230
	},
	{
	"epoch": 11.59,
	"learning_rate": 0.00015368224299065422,
	"loss": 0.0137,
	"step": 1240
	},
	{
	"epoch": 11.59,
	"eval_accuracy": 0.7195767195767195,
	"eval_loss": 1.3543046712875366,
	"eval_runtime": 3.1086,
	"eval_samples_per_second": 60.8,
	"eval_steps_per_second": 7.721,
	"step": 1240
	},
	{
	"epoch": 11.68,
	"learning_rate": 0.0001533084112149533,
	"loss": 0.035,
	"step": 1250
	},
	{
	"epoch": 11.68,
	"eval_accuracy": 0.7301587301587301,
	"eval_loss": 1.2130463123321533,
	"eval_runtime": 3.4203,
	"eval_samples_per_second": 55.258,
	"eval_steps_per_second": 7.017,
	"step": 1250
	},
	{
	"epoch": 11.78,
	"learning_rate": 0.00015293457943925233,
	"loss": 0.0102,
	"step": 1260
	},
	{
	"epoch": 11.78,
	"eval_accuracy": 0.7248677248677249,
	"eval_loss": 1.2087303400039673,
	"eval_runtime": 3.3746,
	"eval_samples_per_second": 56.006,
	"eval_steps_per_second": 7.112,
	"step": 1260
	},
	{
	"epoch": 11.87,
	"learning_rate": 0.00015256074766355142,
	"loss": 0.0409,
	"step": 1270
	},
	{
	"epoch": 11.87,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.2329652309417725,
	"eval_runtime": 3.1081,
	"eval_samples_per_second": 60.809,
	"eval_steps_per_second": 7.722,
	"step": 1270
	},
	{
	"epoch": 11.96,
	"learning_rate": 0.0001521869158878505,
	"loss": 0.0659,
	"step": 1280
	},
	{
	"epoch": 11.96,
	"eval_accuracy": 0.7142857142857143,
	"eval_loss": 1.3084936141967773,
	"eval_runtime": 3.3561,
	"eval_samples_per_second": 56.315,
	"eval_steps_per_second": 7.151,
	"step": 1280
	},
	{
	"epoch": 12.06,
	"learning_rate": 0.00015181308411214953,
	"loss": 0.035,
	"step": 1290
	},
	{
	"epoch": 12.06,
	"eval_accuracy": 0.7248677248677249,
	"eval_loss": 1.405351161956787,
	"eval_runtime": 3.4254,
	"eval_samples_per_second": 55.175,
	"eval_steps_per_second": 7.006,
	"step": 1290
	},
	{
	"epoch": 12.15,
	"learning_rate": 0.0001514392523364486,
	"loss": 0.103,
	"step": 1300
	},
	{
	"epoch": 12.15,
	"eval_accuracy": 0.7248677248677249,
	"eval_loss": 1.464030146598816,
	"eval_runtime": 3.2557,
	"eval_samples_per_second": 58.053,
	"eval_steps_per_second": 7.372,
	"step": 1300
	},
	{
	"epoch": 12.24,
	"learning_rate": 0.00015106542056074766,
	"loss": 0.0238,
	"step": 1310
	},
	{
	"epoch": 12.24,
	"eval_accuracy": 0.7037037037037037,
	"eval_loss": 1.347579002380371,
	"eval_runtime": 3.048,
	"eval_samples_per_second": 62.008,
	"eval_steps_per_second": 7.874,
	"step": 1310
	},
	{
	"epoch": 12.34,
	"learning_rate": 0.00015069158878504676,
	"loss": 0.0196,
	"step": 1320
	},
	{
	"epoch": 12.34,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.40040123462677,
	"eval_runtime": 3.1832,
	"eval_samples_per_second": 59.375,
	"eval_steps_per_second": 7.54,
	"step": 1320
	},
	{
	"epoch": 12.43,
	"learning_rate": 0.0001503177570093458,
	"loss": 0.009,
	"step": 1330
	},
	{
	"epoch": 12.43,
	"eval_accuracy": 0.7142857142857143,
	"eval_loss": 1.4277156591415405,
	"eval_runtime": 3.2679,
	"eval_samples_per_second": 57.836,
	"eval_steps_per_second": 7.344,
	"step": 1330
	},
	{
	"epoch": 12.52,
	"learning_rate": 0.00014994392523364486,
	"loss": 0.0238,
	"step": 1340
	},
	{
	"epoch": 12.52,
	"eval_accuracy": 0.7407407407407407,
	"eval_loss": 1.4086812734603882,
	"eval_runtime": 3.2187,
	"eval_samples_per_second": 58.719,
	"eval_steps_per_second": 7.456,
	"step": 1340
	},
	{
	"epoch": 12.62,
	"learning_rate": 0.00014957009345794393,
	"loss": 0.0468,
	"step": 1350
	},
	{
	"epoch": 12.62,
	"eval_accuracy": 0.7195767195767195,
	"eval_loss": 1.3357652425765991,
	"eval_runtime": 3.1607,
	"eval_samples_per_second": 59.798,
	"eval_steps_per_second": 7.593,
	"step": 1350
	},
	{
	"epoch": 12.71,
	"learning_rate": 0.000149196261682243,
	"loss": 0.0207,
	"step": 1360
	},
	{
	"epoch": 12.71,
	"eval_accuracy": 0.7142857142857143,
	"eval_loss": 1.4172828197479248,
	"eval_runtime": 3.0888,
	"eval_samples_per_second": 61.188,
	"eval_steps_per_second": 7.77,
	"step": 1360
	},
	{
	"epoch": 12.8,
	"learning_rate": 0.00014882242990654207,
	"loss": 0.0138,
	"step": 1370
	},
	{
	"epoch": 12.8,
	"eval_accuracy": 0.7037037037037037,
	"eval_loss": 1.4307596683502197,
	"eval_runtime": 3.1887,
	"eval_samples_per_second": 59.271,
	"eval_steps_per_second": 7.526,
	"step": 1370
	},
	{
	"epoch": 12.9,
	"learning_rate": 0.00014844859813084113,
	"loss": 0.0241,
	"step": 1380
	},
	{
	"epoch": 12.9,
	"eval_accuracy": 0.6772486772486772,
	"eval_loss": 1.6381709575653076,
	"eval_runtime": 3.2282,
	"eval_samples_per_second": 58.546,
	"eval_steps_per_second": 7.434,
	"step": 1380
	},
	{
	"epoch": 12.99,
	"learning_rate": 0.0001480747663551402,
	"loss": 0.0224,
	"step": 1390
	},
	{
	"epoch": 12.99,
	"eval_accuracy": 0.6984126984126984,
	"eval_loss": 1.513045072555542,
	"eval_runtime": 3.1555,
	"eval_samples_per_second": 59.896,
	"eval_steps_per_second": 7.606,
	"step": 1390
	},
	{
	"epoch": 13.08,
	"learning_rate": 0.00014770093457943924,
	"loss": 0.0367,
	"step": 1400
	},
	{
	"epoch": 13.08,
	"eval_accuracy": 0.7037037037037037,
	"eval_loss": 1.5821019411087036,
	"eval_runtime": 3.1013,
	"eval_samples_per_second": 60.941,
	"eval_steps_per_second": 7.739,
	"step": 1400
	},
	{
	"epoch": 13.18,
	"learning_rate": 0.0001473271028037383,
	"loss": 0.0201,
	"step": 1410
	},
	{
	"epoch": 13.18,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.499505877494812,
	"eval_runtime": 3.3162,
	"eval_samples_per_second": 56.994,
	"eval_steps_per_second": 7.237,
	"step": 1410
	},
	{
	"epoch": 13.27,
	"learning_rate": 0.0001469532710280374,
	"loss": 0.0431,
	"step": 1420
	},
	{
	"epoch": 13.27,
	"eval_accuracy": 0.7354497354497355,
	"eval_loss": 1.3571968078613281,
	"eval_runtime": 3.1517,
	"eval_samples_per_second": 59.968,
	"eval_steps_per_second": 7.615,
	"step": 1420
	},
	{
	"epoch": 13.36,
	"learning_rate": 0.00014657943925233647,
	"loss": 0.0137,
	"step": 1430
	},
	{
	"epoch": 13.36,
	"eval_accuracy": 0.7248677248677249,
	"eval_loss": 1.3700077533721924,
	"eval_runtime": 3.0539,
	"eval_samples_per_second": 61.889,
	"eval_steps_per_second": 7.859,
	"step": 1430
	},
	{
	"epoch": 13.46,
	"learning_rate": 0.0001462056074766355,
	"loss": 0.0498,
	"step": 1440
	},
	{
	"epoch": 13.46,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.6434003114700317,
	"eval_runtime": 3.0715,
	"eval_samples_per_second": 61.534,
	"eval_steps_per_second": 7.814,
	"step": 1440
	},
	{
	"epoch": 13.55,
	"learning_rate": 0.00014583177570093458,
	"loss": 0.0175,
	"step": 1450
	},
	{
	"epoch": 13.55,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.7298402786254883,
	"eval_runtime": 3.1073,
	"eval_samples_per_second": 60.825,
	"eval_steps_per_second": 7.724,
	"step": 1450
	},
	{
	"epoch": 13.64,
	"learning_rate": 0.00014545794392523364,
	"loss": 0.0142,
	"step": 1460
	},
	{
	"epoch": 13.64,
	"eval_accuracy": 0.7142857142857143,
	"eval_loss": 1.5783988237380981,
	"eval_runtime": 3.116,
	"eval_samples_per_second": 60.655,
	"eval_steps_per_second": 7.702,
	"step": 1460
	},
	{
	"epoch": 13.74,
	"learning_rate": 0.0001450841121495327,
	"loss": 0.0235,
	"step": 1470
	},
	{
	"epoch": 13.74,
	"eval_accuracy": 0.6984126984126984,
	"eval_loss": 1.6561763286590576,
	"eval_runtime": 3.2007,
	"eval_samples_per_second": 59.049,
	"eval_steps_per_second": 7.498,
	"step": 1470
	},
	{
	"epoch": 13.83,
	"learning_rate": 0.00014471028037383178,
	"loss": 0.0524,
	"step": 1480
	},
	{
	"epoch": 13.83,
	"eval_accuracy": 0.6984126984126984,
	"eval_loss": 1.831541657447815,
	"eval_runtime": 3.3046,
	"eval_samples_per_second": 57.193,
	"eval_steps_per_second": 7.263,
	"step": 1480
	},
	{
	"epoch": 13.93,
	"learning_rate": 0.00014433644859813085,
	"loss": 0.0506,
	"step": 1490
	},
	{
	"epoch": 13.93,
	"eval_accuracy": 0.6825396825396826,
	"eval_loss": 1.6628289222717285,
	"eval_runtime": 3.2548,
	"eval_samples_per_second": 58.068,
	"eval_steps_per_second": 7.374,
	"step": 1490
	},
	{
	"epoch": 14.02,
	"learning_rate": 0.0001439626168224299,
	"loss": 0.0566,
	"step": 1500
	},
	{
	"epoch": 14.02,
	"eval_accuracy": 0.6878306878306878,
	"eval_loss": 1.6691248416900635,
	"eval_runtime": 3.3252,
	"eval_samples_per_second": 56.839,
	"eval_steps_per_second": 7.218,
	"step": 1500
	},
	{
	"epoch": 14.11,
	"learning_rate": 0.00014358878504672898,
	"loss": 0.0872,
	"step": 1510
	},
	{
	"epoch": 14.11,
	"eval_accuracy": 0.6084656084656085,
	"eval_loss": 2.196704387664795,
	"eval_runtime": 3.2014,
	"eval_samples_per_second": 59.037,
	"eval_steps_per_second": 7.497,
	"step": 1510
	},
	{
	"epoch": 14.21,
	"learning_rate": 0.00014321495327102805,
	"loss": 0.1338,
	"step": 1520
	},
	{
	"epoch": 14.21,
	"eval_accuracy": 0.6507936507936508,
	"eval_loss": 1.7845758199691772,
	"eval_runtime": 3.176,
	"eval_samples_per_second": 59.51,
	"eval_steps_per_second": 7.557,
	"step": 1520
	},
	{
	"epoch": 14.3,
	"learning_rate": 0.00014284112149532711,
	"loss": 0.0222,
	"step": 1530
	},
	{
	"epoch": 14.3,
	"eval_accuracy": 0.6772486772486772,
	"eval_loss": 1.6833900213241577,
	"eval_runtime": 3.1793,
	"eval_samples_per_second": 59.447,
	"eval_steps_per_second": 7.549,
	"step": 1530
	},
	{
	"epoch": 14.39,
	"learning_rate": 0.00014246728971962618,
	"loss": 0.0254,
	"step": 1540
	},
	{
	"epoch": 14.39,
	"eval_accuracy": 0.656084656084656,
	"eval_loss": 1.9036774635314941,
	"eval_runtime": 3.1611,
	"eval_samples_per_second": 59.789,
	"eval_steps_per_second": 7.592,
	"step": 1540
	},
	{
	"epoch": 14.49,
	"learning_rate": 0.00014209345794392522,
	"loss": 0.0244,
	"step": 1550
	},
	{
	"epoch": 14.49,
	"eval_accuracy": 0.7037037037037037,
	"eval_loss": 1.5309627056121826,
	"eval_runtime": 3.1613,
	"eval_samples_per_second": 59.786,
	"eval_steps_per_second": 7.592,
	"step": 1550
	},
	{
	"epoch": 14.58,
	"learning_rate": 0.0001417196261682243,
	"loss": 0.0178,
	"step": 1560
	},
	{
	"epoch": 14.58,
	"eval_accuracy": 0.6825396825396826,
	"eval_loss": 1.53221595287323,
	"eval_runtime": 3.144,
	"eval_samples_per_second": 60.114,
	"eval_steps_per_second": 7.634,
	"step": 1560
	},
	{
	"epoch": 14.67,
	"learning_rate": 0.00014134579439252338,
	"loss": 0.0045,
	"step": 1570
	},
	{
	"epoch": 14.67,
	"eval_accuracy": 0.7301587301587301,
	"eval_loss": 1.3083724975585938,
	"eval_runtime": 3.1864,
	"eval_samples_per_second": 59.314,
	"eval_steps_per_second": 7.532,
	"step": 1570
	},
	{
	"epoch": 14.77,
	"learning_rate": 0.00014097196261682245,
	"loss": 0.0485,
	"step": 1580
	},
	{
	"epoch": 14.77,
	"eval_accuracy": 0.7354497354497355,
	"eval_loss": 1.2855416536331177,
	"eval_runtime": 3.2166,
	"eval_samples_per_second": 58.758,
	"eval_steps_per_second": 7.461,
	"step": 1580
	},
	{
	"epoch": 14.86,
	"learning_rate": 0.0001405981308411215,
	"loss": 0.0575,
	"step": 1590
	},
	{
	"epoch": 14.86,
	"eval_accuracy": 0.7301587301587301,
	"eval_loss": 1.3779939413070679,
	"eval_runtime": 3.2389,
	"eval_samples_per_second": 58.353,
	"eval_steps_per_second": 7.41,
	"step": 1590
	},
	{
	"epoch": 14.95,
	"learning_rate": 0.00014022429906542056,
	"loss": 0.0131,
	"step": 1600
	},
	{
	"epoch": 14.95,
	"eval_accuracy": 0.6984126984126984,
	"eval_loss": 1.6261014938354492,
	"eval_runtime": 3.1879,
	"eval_samples_per_second": 59.286,
	"eval_steps_per_second": 7.528,
	"step": 1600
	},
	{
	"epoch": 15.05,
	"learning_rate": 0.00013985046728971963,
	"loss": 0.0059,
	"step": 1610
	},
	{
	"epoch": 15.05,
	"eval_accuracy": 0.6931216931216931,
	"eval_loss": 1.6843873262405396,
	"eval_runtime": 3.2196,
	"eval_samples_per_second": 58.702,
	"eval_steps_per_second": 7.454,
	"step": 1610
	},
	{
	"epoch": 15.14,
	"learning_rate": 0.0001394766355140187,
	"loss": 0.0113,
	"step": 1620
	},
	{
	"epoch": 15.14,
	"eval_accuracy": 0.7248677248677249,
	"eval_loss": 1.4520890712738037,
	"eval_runtime": 3.1975,
	"eval_samples_per_second": 59.108,
	"eval_steps_per_second": 7.506,
	"step": 1620
	},
	{
	"epoch": 15.23,
	"learning_rate": 0.00013910280373831776,
	"loss": 0.0264,
	"step": 1630
	},
	{
	"epoch": 15.23,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.5394195318222046,
	"eval_runtime": 3.2412,
	"eval_samples_per_second": 58.312,
	"eval_steps_per_second": 7.405,
	"step": 1630
	},
	{
	"epoch": 15.33,
	"learning_rate": 0.00013872897196261683,
	"loss": 0.0131,
	"step": 1640
	},
	{
	"epoch": 15.33,
	"eval_accuracy": 0.7248677248677249,
	"eval_loss": 1.521421194076538,
	"eval_runtime": 3.2643,
	"eval_samples_per_second": 57.899,
	"eval_steps_per_second": 7.352,
	"step": 1640
	},
	{
	"epoch": 15.42,
	"learning_rate": 0.0001383551401869159,
	"loss": 0.0067,
	"step": 1650
	},
	{
	"epoch": 15.42,
	"eval_accuracy": 0.6984126984126984,
	"eval_loss": 1.8741341829299927,
	"eval_runtime": 3.2542,
	"eval_samples_per_second": 58.079,
	"eval_steps_per_second": 7.375,
	"step": 1650
	},
	{
	"epoch": 15.51,
	"learning_rate": 0.00013798130841121496,
	"loss": 0.1502,
	"step": 1660
	},
	{
	"epoch": 15.51,
	"eval_accuracy": 0.7037037037037037,
	"eval_loss": 1.5996290445327759,
	"eval_runtime": 3.2543,
	"eval_samples_per_second": 58.076,
	"eval_steps_per_second": 7.375,
	"step": 1660
	},
	{
	"epoch": 15.61,
	"learning_rate": 0.00013760747663551403,
	"loss": 0.0505,
	"step": 1670
	},
	{
	"epoch": 15.61,
	"eval_accuracy": 0.6984126984126984,
	"eval_loss": 1.5197315216064453,
	"eval_runtime": 3.3082,
	"eval_samples_per_second": 57.131,
	"eval_steps_per_second": 7.255,
	"step": 1670
	},
	{
	"epoch": 15.7,
	"learning_rate": 0.0001372336448598131,
	"loss": 0.0096,
	"step": 1680
	},
	{
	"epoch": 15.7,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.562042236328125,
	"eval_runtime": 3.2413,
	"eval_samples_per_second": 58.31,
	"eval_steps_per_second": 7.404,
	"step": 1680
	},
	{
	"epoch": 15.79,
	"learning_rate": 0.00013685981308411216,
	"loss": 0.0623,
	"step": 1690
	},
	{
	"epoch": 15.79,
	"eval_accuracy": 0.7301587301587301,
	"eval_loss": 1.5186712741851807,
	"eval_runtime": 3.3016,
	"eval_samples_per_second": 57.244,
	"eval_steps_per_second": 7.269,
	"step": 1690
	},
	{
	"epoch": 15.89,
	"learning_rate": 0.0001364859813084112,
	"loss": 0.0732,
	"step": 1700
	},
	{
	"epoch": 15.89,
	"eval_accuracy": 0.6825396825396826,
	"eval_loss": 1.5817829370498657,
	"eval_runtime": 3.2211,
	"eval_samples_per_second": 58.675,
	"eval_steps_per_second": 7.451,
	"step": 1700
	},
	{
	"epoch": 15.98,
	"learning_rate": 0.00013611214953271027,
	"loss": 0.0587,
	"step": 1710
	},
	{
	"epoch": 15.98,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.331645131111145,
	"eval_runtime": 3.254,
	"eval_samples_per_second": 58.083,
	"eval_steps_per_second": 7.376,
	"step": 1710
	},
	{
	"epoch": 16.07,
	"learning_rate": 0.00013573831775700936,
	"loss": 0.0135,
	"step": 1720
	},
	{
	"epoch": 16.07,
	"eval_accuracy": 0.7142857142857143,
	"eval_loss": 1.5572881698608398,
	"eval_runtime": 3.1348,
	"eval_samples_per_second": 60.292,
	"eval_steps_per_second": 7.656,
	"step": 1720
	},
	{
	"epoch": 16.17,
	"learning_rate": 0.00013536448598130843,
	"loss": 0.0405,
	"step": 1730
	},
	{
	"epoch": 16.17,
	"eval_accuracy": 0.7195767195767195,
	"eval_loss": 1.5583974123001099,
	"eval_runtime": 3.1747,
	"eval_samples_per_second": 59.534,
	"eval_steps_per_second": 7.56,
	"step": 1730
	},
	{
	"epoch": 16.26,
	"learning_rate": 0.00013499065420560747,
	"loss": 0.0379,
	"step": 1740
	},
	{
	"epoch": 16.26,
	"eval_accuracy": 0.6613756613756614,
	"eval_loss": 1.8542115688323975,
	"eval_runtime": 3.4991,
	"eval_samples_per_second": 54.014,
	"eval_steps_per_second": 6.859,
	"step": 1740
	},
	{
	"epoch": 16.36,
	"learning_rate": 0.00013461682242990654,
	"loss": 0.0778,
	"step": 1750
	},
	{
	"epoch": 16.36,
	"eval_accuracy": 0.6772486772486772,
	"eval_loss": 1.81163489818573,
	"eval_runtime": 3.2013,
	"eval_samples_per_second": 59.039,
	"eval_steps_per_second": 7.497,
	"step": 1750
	},
	{
	"epoch": 16.45,
	"learning_rate": 0.00013424299065420563,
	"loss": 0.0178,
	"step": 1760
	},
	{
	"epoch": 16.45,
	"eval_accuracy": 0.7037037037037037,
	"eval_loss": 1.6405593156814575,
	"eval_runtime": 3.1824,
	"eval_samples_per_second": 59.389,
	"eval_steps_per_second": 7.541,
	"step": 1760
	},
	{
	"epoch": 16.54,
	"learning_rate": 0.00013386915887850467,
	"loss": 0.0252,
	"step": 1770
	},
	{
	"epoch": 16.54,
	"eval_accuracy": 0.6772486772486772,
	"eval_loss": 1.6421043872833252,
	"eval_runtime": 3.2328,
	"eval_samples_per_second": 58.464,
	"eval_steps_per_second": 7.424,
	"step": 1770
	},
	{
	"epoch": 16.64,
	"learning_rate": 0.00013349532710280374,
	"loss": 0.0638,
	"step": 1780
	},
	{
	"epoch": 16.64,
	"eval_accuracy": 0.746031746031746,
	"eval_loss": 1.4504343271255493,
	"eval_runtime": 3.1566,
	"eval_samples_per_second": 59.875,
	"eval_steps_per_second": 7.603,
	"step": 1780
	},
	{
	"epoch": 16.73,
	"learning_rate": 0.0001331214953271028,
	"loss": 0.0138,
	"step": 1790
	},
	{
	"epoch": 16.73,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.5848379135131836,
	"eval_runtime": 3.2276,
	"eval_samples_per_second": 58.557,
	"eval_steps_per_second": 7.436,
	"step": 1790
	},
	{
	"epoch": 16.82,
	"learning_rate": 0.00013274766355140188,
	"loss": 0.1027,
	"step": 1800
	},
	{
	"epoch": 16.82,
	"eval_accuracy": 0.7354497354497355,
	"eval_loss": 1.5205998420715332,
	"eval_runtime": 3.2514,
	"eval_samples_per_second": 58.128,
	"eval_steps_per_second": 7.381,
	"step": 1800
	},
	{
	"epoch": 16.92,
	"learning_rate": 0.00013237383177570094,
	"loss": 0.086,
	"step": 1810
	},
	{
	"epoch": 16.92,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.3391714096069336,
	"eval_runtime": 3.2275,
	"eval_samples_per_second": 58.56,
	"eval_steps_per_second": 7.436,
	"step": 1810
	},
	{
	"epoch": 17.01,
	"learning_rate": 0.000132,
	"loss": 0.1029,
	"step": 1820
	},
	{
	"epoch": 17.01,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.4613063335418701,
	"eval_runtime": 3.268,
	"eval_samples_per_second": 57.834,
	"eval_steps_per_second": 7.344,
	"step": 1820
	},
	{
	"epoch": 17.1,
	"learning_rate": 0.00013162616822429908,
	"loss": 0.115,
	"step": 1830
	},
	{
	"epoch": 17.1,
	"eval_accuracy": 0.6931216931216931,
	"eval_loss": 1.7344552278518677,
	"eval_runtime": 3.2414,
	"eval_samples_per_second": 58.308,
	"eval_steps_per_second": 7.404,
	"step": 1830
	},
	{
	"epoch": 17.2,
	"learning_rate": 0.00013125233644859814,
	"loss": 0.0286,
	"step": 1840
	},
	{
	"epoch": 17.2,
	"eval_accuracy": 0.7301587301587301,
	"eval_loss": 1.5347076654434204,
	"eval_runtime": 3.2891,
	"eval_samples_per_second": 57.462,
	"eval_steps_per_second": 7.297,
	"step": 1840
	},
	{
	"epoch": 17.29,
	"learning_rate": 0.00013087850467289718,
	"loss": 0.0608,
	"step": 1850
	},
	{
	"epoch": 17.29,
	"eval_accuracy": 0.6931216931216931,
	"eval_loss": 1.5781868696212769,
	"eval_runtime": 3.2271,
	"eval_samples_per_second": 58.566,
	"eval_steps_per_second": 7.437,
	"step": 1850
	},
	{
	"epoch": 17.38,
	"learning_rate": 0.00013050467289719628,
	"loss": 0.1215,
	"step": 1860
	},
	{
	"epoch": 17.38,
	"eval_accuracy": 0.6931216931216931,
	"eval_loss": 1.5484486818313599,
	"eval_runtime": 3.2944,
	"eval_samples_per_second": 57.37,
	"eval_steps_per_second": 7.285,
	"step": 1860
	},
	{
	"epoch": 17.48,
	"learning_rate": 0.00013013084112149535,
	"loss": 0.095,
	"step": 1870
	},
	{
	"epoch": 17.48,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.5258464813232422,
	"eval_runtime": 3.265,
	"eval_samples_per_second": 57.887,
	"eval_steps_per_second": 7.351,
	"step": 1870
	},
	{
	"epoch": 17.57,
	"learning_rate": 0.0001297570093457944,
	"loss": 0.0176,
	"step": 1880
	},
	{
	"epoch": 17.57,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.5887885093688965,
	"eval_runtime": 3.1883,
	"eval_samples_per_second": 59.278,
	"eval_steps_per_second": 7.527,
	"step": 1880
	},
	{
	"epoch": 17.66,
	"learning_rate": 0.00012938317757009345,
	"loss": 0.0208,
	"step": 1890
	},
	{
	"epoch": 17.66,
	"eval_accuracy": 0.6878306878306878,
	"eval_loss": 2.017876625061035,
	"eval_runtime": 3.1617,
	"eval_samples_per_second": 59.778,
	"eval_steps_per_second": 7.591,
	"step": 1890
	},
	{
	"epoch": 17.76,
	"learning_rate": 0.00012900934579439252,
	"loss": 0.0752,
	"step": 1900
	},
	{
	"epoch": 17.76,
	"eval_accuracy": 0.6878306878306878,
	"eval_loss": 1.8983193635940552,
	"eval_runtime": 3.3023,
	"eval_samples_per_second": 57.233,
	"eval_steps_per_second": 7.268,
	"step": 1900
	},
	{
	"epoch": 17.85,
	"learning_rate": 0.00012863551401869162,
	"loss": 0.0609,
	"step": 1910
	},
	{
	"epoch": 17.85,
	"eval_accuracy": 0.7037037037037037,
	"eval_loss": 1.6523683071136475,
	"eval_runtime": 3.2531,
	"eval_samples_per_second": 58.099,
	"eval_steps_per_second": 7.378,
	"step": 1910
	},
	{
	"epoch": 17.94,
	"learning_rate": 0.00012826168224299066,
	"loss": 0.0059,
	"step": 1920
	},
	{
	"epoch": 17.94,
	"eval_accuracy": 0.6984126984126984,
	"eval_loss": 1.6338155269622803,
	"eval_runtime": 3.2413,
	"eval_samples_per_second": 58.309,
	"eval_steps_per_second": 7.404,
	"step": 1920
	},
	{
	"epoch": 18.04,
	"learning_rate": 0.00012788785046728972,
	"loss": 0.0264,
	"step": 1930
	},
	{
	"epoch": 18.04,
	"eval_accuracy": 0.7037037037037037,
	"eval_loss": 1.6208415031433105,
	"eval_runtime": 3.4796,
	"eval_samples_per_second": 54.317,
	"eval_steps_per_second": 6.897,
	"step": 1930
	},
	{
	"epoch": 18.13,
	"learning_rate": 0.0001275140186915888,
	"loss": 0.0128,
	"step": 1940
	},
	{
	"epoch": 18.13,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.521356225013733,
	"eval_runtime": 3.1889,
	"eval_samples_per_second": 59.268,
	"eval_steps_per_second": 7.526,
	"step": 1940
	},
	{
	"epoch": 18.22,
	"learning_rate": 0.00012714018691588786,
	"loss": 0.0053,
	"step": 1950
	},
	{
	"epoch": 18.22,
	"eval_accuracy": 0.7195767195767195,
	"eval_loss": 1.5842546224594116,
	"eval_runtime": 3.1478,
	"eval_samples_per_second": 60.042,
	"eval_steps_per_second": 7.624,
	"step": 1950
	},
	{
	"epoch": 18.32,
	"learning_rate": 0.00012676635514018692,
	"loss": 0.0129,
	"step": 1960
	},
	{
	"epoch": 18.32,
	"eval_accuracy": 0.7248677248677249,
	"eval_loss": 1.5440059900283813,
	"eval_runtime": 4.1754,
	"eval_samples_per_second": 45.265,
	"eval_steps_per_second": 5.748,
	"step": 1960
	},
	{
	"epoch": 18.41,
	"learning_rate": 0.000126392523364486,
	"loss": 0.016,
	"step": 1970
	},
	{
	"epoch": 18.41,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.4988614320755005,
	"eval_runtime": 3.1898,
	"eval_samples_per_second": 59.252,
	"eval_steps_per_second": 7.524,
	"step": 1970
	},
	{
	"epoch": 18.5,
	"learning_rate": 0.00012601869158878506,
	"loss": 0.0696,
	"step": 1980
	},
	{
	"epoch": 18.5,
	"eval_accuracy": 0.7407407407407407,
	"eval_loss": 1.4819732904434204,
	"eval_runtime": 3.1615,
	"eval_samples_per_second": 59.781,
	"eval_steps_per_second": 7.591,
	"step": 1980
	},
	{
	"epoch": 18.6,
	"learning_rate": 0.00012564485981308413,
	"loss": 0.0217,
	"step": 1990
	},
	{
	"epoch": 18.6,
	"eval_accuracy": 0.7195767195767195,
	"eval_loss": 1.4832117557525635,
	"eval_runtime": 3.179,
	"eval_samples_per_second": 59.452,
	"eval_steps_per_second": 7.549,
	"step": 1990
	},
	{
	"epoch": 18.69,
	"learning_rate": 0.00012527102803738317,
	"loss": 0.006,
	"step": 2000
	},
	{
	"epoch": 18.69,
	"eval_accuracy": 0.6772486772486772,
	"eval_loss": 1.9052395820617676,
	"eval_runtime": 3.1938,
	"eval_samples_per_second": 59.176,
	"eval_steps_per_second": 7.514,
	"step": 2000
	},
	{
	"epoch": 18.79,
	"learning_rate": 0.00012489719626168226,
	"loss": 0.0357,
	"step": 2010
	},
	{
	"epoch": 18.79,
	"eval_accuracy": 0.6984126984126984,
	"eval_loss": 1.73564612865448,
	"eval_runtime": 3.3743,
	"eval_samples_per_second": 56.012,
	"eval_steps_per_second": 7.113,
	"step": 2010
	},
	{
	"epoch": 18.88,
	"learning_rate": 0.00012452336448598133,
	"loss": 0.0197,
	"step": 2020
	},
	{
	"epoch": 18.88,
	"eval_accuracy": 0.7301587301587301,
	"eval_loss": 1.617836594581604,
	"eval_runtime": 3.185,
	"eval_samples_per_second": 59.34,
	"eval_steps_per_second": 7.535,
	"step": 2020
	},
	{
	"epoch": 18.97,
	"learning_rate": 0.00012414953271028037,
	"loss": 0.0331,
	"step": 2030
	},
	{
	"epoch": 18.97,
	"eval_accuracy": 0.7407407407407407,
	"eval_loss": 1.5125271081924438,
	"eval_runtime": 3.228,
	"eval_samples_per_second": 58.55,
	"eval_steps_per_second": 7.435,
	"step": 2030
	},
	{
	"epoch": 19.07,
	"learning_rate": 0.00012381308411214953,
	"loss": 0.2593,
	"step": 2040
	},
	{
	"epoch": 19.07,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.6546989679336548,
	"eval_runtime": 3.1974,
	"eval_samples_per_second": 59.111,
	"eval_steps_per_second": 7.506,
	"step": 2040
	},
	{
	"epoch": 19.16,
	"learning_rate": 0.0001234392523364486,
	"loss": 0.0134,
	"step": 2050
	},
	{
	"epoch": 19.16,
	"eval_accuracy": 0.6931216931216931,
	"eval_loss": 1.6934614181518555,
	"eval_runtime": 3.2069,
	"eval_samples_per_second": 58.936,
	"eval_steps_per_second": 7.484,
	"step": 2050
	},
	{
	"epoch": 19.25,
	"learning_rate": 0.0001230654205607477,
	"loss": 0.0069,
	"step": 2060
	},
	{
	"epoch": 19.25,
	"eval_accuracy": 0.7407407407407407,
	"eval_loss": 1.5514878034591675,
	"eval_runtime": 3.2273,
	"eval_samples_per_second": 58.563,
	"eval_steps_per_second": 7.437,
	"step": 2060
	},
	{
	"epoch": 19.35,
	"learning_rate": 0.00012269158878504673,
	"loss": 0.0083,
	"step": 2070
	},
	{
	"epoch": 19.35,
	"eval_accuracy": 0.7248677248677249,
	"eval_loss": 1.576420545578003,
	"eval_runtime": 3.1752,
	"eval_samples_per_second": 59.525,
	"eval_steps_per_second": 7.559,
	"step": 2070
	},
	{
	"epoch": 19.44,
	"learning_rate": 0.0001223177570093458,
	"loss": 0.0299,
	"step": 2080
	},
	{
	"epoch": 19.44,
	"eval_accuracy": 0.7301587301587301,
	"eval_loss": 1.5843783617019653,
	"eval_runtime": 3.1803,
	"eval_samples_per_second": 59.428,
	"eval_steps_per_second": 7.546,
	"step": 2080
	},
	{
	"epoch": 19.53,
	"learning_rate": 0.00012194392523364486,
	"loss": 0.002,
	"step": 2090
	},
	{
	"epoch": 19.53,
	"eval_accuracy": 0.746031746031746,
	"eval_loss": 1.5910844802856445,
	"eval_runtime": 3.1724,
	"eval_samples_per_second": 59.576,
	"eval_steps_per_second": 7.565,
	"step": 2090
	},
	{
	"epoch": 19.63,
	"learning_rate": 0.00012157009345794393,
	"loss": 0.0022,
	"step": 2100
	},
	{
	"epoch": 19.63,
	"eval_accuracy": 0.7513227513227513,
	"eval_loss": 1.5894769430160522,
	"eval_runtime": 3.2193,
	"eval_samples_per_second": 58.708,
	"eval_steps_per_second": 7.455,
	"step": 2100
	},
	{
	"epoch": 19.72,
	"learning_rate": 0.00012119626168224301,
	"loss": 0.0024,
	"step": 2110
	},
	{
	"epoch": 19.72,
	"eval_accuracy": 0.7513227513227513,
	"eval_loss": 1.586985468864441,
	"eval_runtime": 3.1897,
	"eval_samples_per_second": 59.254,
	"eval_steps_per_second": 7.524,
	"step": 2110
	},
	{
	"epoch": 19.81,
	"learning_rate": 0.00012082242990654206,
	"loss": 0.0082,
	"step": 2120
	},
	{
	"epoch": 19.81,
	"eval_accuracy": 0.7407407407407407,
	"eval_loss": 1.582448124885559,
	"eval_runtime": 3.1594,
	"eval_samples_per_second": 59.821,
	"eval_steps_per_second": 7.596,
	"step": 2120
	},
	{
	"epoch": 19.91,
	"learning_rate": 0.00012044859813084113,
	"loss": 0.0022,
	"step": 2130
	},
	{
	"epoch": 19.91,
	"eval_accuracy": 0.7354497354497355,
	"eval_loss": 1.5609190464019775,
	"eval_runtime": 3.3172,
	"eval_samples_per_second": 56.976,
	"eval_steps_per_second": 7.235,
	"step": 2130
	},
	{
	"epoch": 20.0,
	"learning_rate": 0.00012007476635514018,
	"loss": 0.02,
	"step": 2140
	},
	{
	"epoch": 20.0,
	"eval_accuracy": 0.7354497354497355,
	"eval_loss": 1.6138461828231812,
	"eval_runtime": 3.3238,
	"eval_samples_per_second": 56.863,
	"eval_steps_per_second": 7.221,
	"step": 2140
	},
	{
	"epoch": 20.09,
	"learning_rate": 0.00011970093457943925,
	"loss": 0.0063,
	"step": 2150
	},
	{
	"epoch": 20.09,
	"eval_accuracy": 0.7037037037037037,
	"eval_loss": 1.7616651058197021,
	"eval_runtime": 3.2361,
	"eval_samples_per_second": 58.403,
	"eval_steps_per_second": 7.416,
	"step": 2150
	},
	{
	"epoch": 20.19,
	"learning_rate": 0.00011932710280373833,
	"loss": 0.0021,
	"step": 2160
	},
	{
	"epoch": 20.19,
	"eval_accuracy": 0.6984126984126984,
	"eval_loss": 1.7941789627075195,
	"eval_runtime": 5.8284,
	"eval_samples_per_second": 32.428,
	"eval_steps_per_second": 4.118,
	"step": 2160
	},
	{
	"epoch": 20.28,
	"learning_rate": 0.0001189532710280374,
	"loss": 0.0068,
	"step": 2170
	},
	{
	"epoch": 20.28,
	"eval_accuracy": 0.7142857142857143,
	"eval_loss": 1.7489572763442993,
	"eval_runtime": 3.085,
	"eval_samples_per_second": 61.265,
	"eval_steps_per_second": 7.78,
	"step": 2170
	},
	{
	"epoch": 20.37,
	"learning_rate": 0.00011857943925233645,
	"loss": 0.0078,
	"step": 2180
	},
	{
	"epoch": 20.37,
	"eval_accuracy": 0.7354497354497355,
	"eval_loss": 1.6500416994094849,
	"eval_runtime": 3.0679,
	"eval_samples_per_second": 61.606,
	"eval_steps_per_second": 7.823,
	"step": 2180
	},
	{
	"epoch": 20.47,
	"learning_rate": 0.00011820560747663552,
	"loss": 0.0019,
	"step": 2190
	},
	{
	"epoch": 20.47,
	"eval_accuracy": 0.7513227513227513,
	"eval_loss": 1.5972764492034912,
	"eval_runtime": 3.3043,
	"eval_samples_per_second": 57.198,
	"eval_steps_per_second": 7.263,
	"step": 2190
	},
	{
	"epoch": 20.56,
	"learning_rate": 0.00011783177570093457,
	"loss": 0.0052,
	"step": 2200
	},
	{
	"epoch": 20.56,
	"eval_accuracy": 0.7301587301587301,
	"eval_loss": 1.64747154712677,
	"eval_runtime": 3.2063,
	"eval_samples_per_second": 58.947,
	"eval_steps_per_second": 7.485,
	"step": 2200
	},
	{
	"epoch": 20.65,
	"learning_rate": 0.00011745794392523365,
	"loss": 0.0169,
	"step": 2210
	},
	{
	"epoch": 20.65,
	"eval_accuracy": 0.7195767195767195,
	"eval_loss": 1.6964852809906006,
	"eval_runtime": 3.2678,
	"eval_samples_per_second": 57.837,
	"eval_steps_per_second": 7.344,
	"step": 2210
	},
	{
	"epoch": 20.75,
	"learning_rate": 0.00011708411214953272,
	"loss": 0.011,
	"step": 2220
	},
	{
	"epoch": 20.75,
	"eval_accuracy": 0.708994708994709,
	"eval_loss": 1.7380739450454712,
	"eval_runtime": 3.1484,
	"eval_samples_per_second": 60.03,
	"eval_steps_per_second": 7.623,
	"step": 2220
	},
	{
	"epoch": 20.84,
	"learning_rate": 0.00011671028037383178,
	"loss": 0.0141,
	"step": 2230
	},
	{
	"epoch": 20.84,
	"eval_accuracy": 0.7354497354497355,
	"eval_loss": 1.6947896480560303,
	"eval_runtime": 3.3613,
	"eval_samples_per_second": 56.228,
	"eval_steps_per_second": 7.14,
	"step": 2230
	},
	{
	"epoch": 20.93,
	"learning_rate": 0.00011633644859813084,
	"loss": 0.026,
	"step": 2240
	},
	{
	"epoch": 20.93,
	"eval_accuracy": 0.7037037037037037,
	"eval_loss": 1.7711342573165894,
	"eval_runtime": 3.2033,
	"eval_samples_per_second": 59.001,
	"eval_steps_per_second": 7.492,
	"step": 2240
	},
	{
	"epoch": 21.03,
	"learning_rate": 0.00011596261682242991,
	"loss": 0.0019,
	"step": 2250
	},
	{
	"epoch": 21.03,
	"eval_accuracy": 0.6825396825396826,
	"eval_loss": 1.8577070236206055,
	"eval_runtime": 3.1485,
	"eval_samples_per_second": 60.03,
	"eval_steps_per_second": 7.623,
	"step": 2250
	},
	{
	"epoch": 21.12,
	"learning_rate": 0.00011558878504672899,
	"loss": 0.0523,
	"step": 2260
	},
	{
	"epoch": 21.12,
	"eval_accuracy": 0.6878306878306878,
	"eval_loss": 1.837315320968628,
	"eval_runtime": 3.1213,
	"eval_samples_per_second": 60.552,
	"eval_steps_per_second": 7.689,
	"step": 2260
	},
	{
	"epoch": 21.21,
	"learning_rate": 0.00011521495327102804,
	"loss": 0.0234,
	"step": 2270
	},
	{
	"epoch": 21.21,
	"eval_accuracy": 0.7248677248677249,
	"eval_loss": 1.7204312086105347,
	"eval_runtime": 3.3214,
	"eval_samples_per_second": 56.904,
	"eval_steps_per_second": 7.226,
	"step": 2270
	},
	{
	"epoch": 21.31,
	"learning_rate": 0.00011484112149532711,
	"loss": 0.0105,
	"step": 2280
	},
	{
	"epoch": 21.31,
	"eval_accuracy": 0.7195767195767195,
	"eval_loss": 1.6235790252685547,
	"eval_runtime": 3.1507,
	"eval_samples_per_second": 59.986,
	"eval_steps_per_second": 7.617,
	"step": 2280
	},
	{
	"epoch": 21.4,
	"learning_rate": 0.00011446728971962617,
	"loss": 0.048,
	"step": 2290
	},
	{
	"epoch": 21.4,
	"eval_accuracy": 0.6984126984126984,
	"eval_loss": 1.8592135906219482,
	"eval_runtime": 3.1589,
	"eval_samples_per_second": 59.83,
	"eval_steps_per_second": 7.598,
	"step": 2290
	},
	{
	"epoch": 21.5,
	"learning_rate": 0.00011409345794392523,
	"loss": 0.0456,
	"step": 2300
	},
	{
	"epoch": 21.5,
	"eval_accuracy": 0.7142857142857143,
	"eval_loss": 1.7222115993499756,
	"eval_runtime": 3.1346,
	"eval_samples_per_second": 60.296,
	"eval_steps_per_second": 7.657,
	"step": 2300
	},
	{
	"epoch": 21.59,
	"learning_rate": 0.00011371962616822431,
	"loss": 0.0129,
	"step": 2310
	},
	{
	"epoch": 21.59,
	"eval_accuracy": 0.7142857142857143,
	"eval_loss": 1.6260654926300049,
	"eval_runtime": 3.1239,
	"eval_samples_per_second": 60.501,
	"eval_steps_per_second": 7.683,
	"step": 2310
	},
	{
	"epoch": 21.68,
	"learning_rate": 0.00011334579439252338,
	"loss": 0.0048,
	"step": 2320
	},
	{
	"epoch": 21.68,
	"eval_accuracy": 0.7142857142857143,
	"eval_loss": 1.5359770059585571,
	"eval_runtime": 3.254,
	"eval_samples_per_second": 58.083,
	"eval_steps_per_second": 7.376,
	"step": 2320
	},
	{
	"epoch": 21.78,
	"learning_rate": 0.00011297196261682243,
	"loss": 0.0217,
	"step": 2330
	},
	{
	"epoch": 21.78,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.4278719425201416,
	"eval_runtime": 3.2536,
	"eval_samples_per_second": 58.09,
	"eval_steps_per_second": 7.376,
	"step": 2330
	},
	{
	"epoch": 21.87,
	"learning_rate": 0.0001125981308411215,
	"loss": 0.011,
	"step": 2340
	},
	{
	"epoch": 21.87,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.369935393333435,
	"eval_runtime": 3.0331,
	"eval_samples_per_second": 62.312,
	"eval_steps_per_second": 7.913,
	"step": 2340
	},
	{
	"epoch": 21.96,
	"learning_rate": 0.00011222429906542056,
	"loss": 0.0104,
	"step": 2350
	},
	{
	"epoch": 21.96,
	"eval_accuracy": 0.6878306878306878,
	"eval_loss": 1.9012395143508911,
	"eval_runtime": 3.1254,
	"eval_samples_per_second": 60.472,
	"eval_steps_per_second": 7.679,
	"step": 2350
	},
	{
	"epoch": 22.06,
	"learning_rate": 0.00011185046728971964,
	"loss": 0.0204,
	"step": 2360
	},
	{
	"epoch": 22.06,
	"eval_accuracy": 0.7354497354497355,
	"eval_loss": 1.5529383420944214,
	"eval_runtime": 3.1087,
	"eval_samples_per_second": 60.796,
	"eval_steps_per_second": 7.72,
	"step": 2360
	},
	{
	"epoch": 22.15,
	"learning_rate": 0.0001114766355140187,
	"loss": 0.02,
	"step": 2370
	},
	{
	"epoch": 22.15,
	"eval_accuracy": 0.6931216931216931,
	"eval_loss": 1.7242515087127686,
	"eval_runtime": 3.0296,
	"eval_samples_per_second": 62.384,
	"eval_steps_per_second": 7.922,
	"step": 2370
	},
	{
	"epoch": 22.24,
	"learning_rate": 0.00011110280373831776,
	"loss": 0.0394,
	"step": 2380
	},
	{
	"epoch": 22.24,
	"eval_accuracy": 0.6931216931216931,
	"eval_loss": 1.8429406881332397,
	"eval_runtime": 3.2178,
	"eval_samples_per_second": 58.735,
	"eval_steps_per_second": 7.458,
	"step": 2380
	},
	{
	"epoch": 22.34,
	"learning_rate": 0.00011072897196261682,
	"loss": 0.0217,
	"step": 2390
	},
	{
	"epoch": 22.34,
	"eval_accuracy": 0.7407407407407407,
	"eval_loss": 1.6551986932754517,
	"eval_runtime": 3.0937,
	"eval_samples_per_second": 61.092,
	"eval_steps_per_second": 7.758,
	"step": 2390
	},
	{
	"epoch": 22.43,
	"learning_rate": 0.00011035514018691588,
	"loss": 0.0407,
	"step": 2400
	},
	{
	"epoch": 22.43,
	"eval_accuracy": 0.7407407407407407,
	"eval_loss": 1.584214687347412,
	"eval_runtime": 3.0876,
	"eval_samples_per_second": 61.213,
	"eval_steps_per_second": 7.773,
	"step": 2400
	},
	{
	"epoch": 22.52,
	"learning_rate": 0.00010998130841121497,
	"loss": 0.0075,
	"step": 2410
	},
	{
	"epoch": 22.52,
	"eval_accuracy": 0.7354497354497355,
	"eval_loss": 1.5881952047348022,
	"eval_runtime": 3.1026,
	"eval_samples_per_second": 60.916,
	"eval_steps_per_second": 7.735,
	"step": 2410
	},
	{
	"epoch": 22.62,
	"learning_rate": 0.00010960747663551403,
	"loss": 0.0144,
	"step": 2420
	},
	{
	"epoch": 22.62,
	"eval_accuracy": 0.7301587301587301,
	"eval_loss": 1.6610509157180786,
	"eval_runtime": 3.2448,
	"eval_samples_per_second": 58.248,
	"eval_steps_per_second": 7.397,
	"step": 2420
	},
	{
	"epoch": 22.71,
	"learning_rate": 0.00010923364485981309,
	"loss": 0.0021,
	"step": 2430
	},
	{
	"epoch": 22.71,
	"eval_accuracy": 0.746031746031746,
	"eval_loss": 1.7075546979904175,
	"eval_runtime": 3.273,
	"eval_samples_per_second": 57.746,
	"eval_steps_per_second": 7.333,
	"step": 2430
	},
	{
	"epoch": 22.8,
	"learning_rate": 0.00010885981308411215,
	"loss": 0.0019,
	"step": 2440
	},
	{
	"epoch": 22.8,
	"eval_accuracy": 0.7354497354497355,
	"eval_loss": 1.616317629814148,
	"eval_runtime": 3.3746,
	"eval_samples_per_second": 56.006,
	"eval_steps_per_second": 7.112,
	"step": 2440
	},
	{
	"epoch": 22.9,
	"learning_rate": 0.00010848598130841121,
	"loss": 0.0074,
	"step": 2450
	},
	{
	"epoch": 22.9,
	"eval_accuracy": 0.746031746031746,
	"eval_loss": 1.5530917644500732,
	"eval_runtime": 3.2179,
	"eval_samples_per_second": 58.735,
	"eval_steps_per_second": 7.458,
	"step": 2450
	},
	{
	"epoch": 22.99,
	"learning_rate": 0.0001081121495327103,
	"loss": 0.0195,
	"step": 2460
	},
	{
	"epoch": 22.99,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5417741537094116,
	"eval_runtime": 3.3609,
	"eval_samples_per_second": 56.235,
	"eval_steps_per_second": 7.141,
	"step": 2460
	},
	{
	"epoch": 23.08,
	"learning_rate": 0.00010773831775700935,
	"loss": 0.0085,
	"step": 2470
	},
	{
	"epoch": 23.08,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.532561182975769,
	"eval_runtime": 3.2217,
	"eval_samples_per_second": 58.664,
	"eval_steps_per_second": 7.449,
	"step": 2470
	},
	{
	"epoch": 23.18,
	"learning_rate": 0.00010736448598130842,
	"loss": 0.0015,
	"step": 2480
	},
	{
	"epoch": 23.18,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.530474305152893,
	"eval_runtime": 3.1097,
	"eval_samples_per_second": 60.778,
	"eval_steps_per_second": 7.718,
	"step": 2480
	},
	{
	"epoch": 23.27,
	"learning_rate": 0.00010699065420560748,
	"loss": 0.0015,
	"step": 2490
	},
	{
	"epoch": 23.27,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.530909776687622,
	"eval_runtime": 3.3395,
	"eval_samples_per_second": 56.594,
	"eval_steps_per_second": 7.187,
	"step": 2490
	},
	{
	"epoch": 23.36,
	"learning_rate": 0.00010661682242990654,
	"loss": 0.0058,
	"step": 2500
	},
	{
	"epoch": 23.36,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5259517431259155,
	"eval_runtime": 3.1744,
	"eval_samples_per_second": 59.539,
	"eval_steps_per_second": 7.56,
	"step": 2500
	},
	{
	"epoch": 23.46,
	"learning_rate": 0.00010624299065420562,
	"loss": 0.0015,
	"step": 2510
	},
	{
	"epoch": 23.46,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5237162113189697,
	"eval_runtime": 3.3526,
	"eval_samples_per_second": 56.374,
	"eval_steps_per_second": 7.159,
	"step": 2510
	},
	{
	"epoch": 23.55,
	"learning_rate": 0.00010586915887850468,
	"loss": 0.0083,
	"step": 2520
	},
	{
	"epoch": 23.55,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.5256061553955078,
	"eval_runtime": 3.4146,
	"eval_samples_per_second": 55.351,
	"eval_steps_per_second": 7.029,
	"step": 2520
	},
	{
	"epoch": 23.64,
	"learning_rate": 0.00010549532710280374,
	"loss": 0.0102,
	"step": 2530
	},
	{
	"epoch": 23.64,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5389765501022339,
	"eval_runtime": 3.0883,
	"eval_samples_per_second": 61.198,
	"eval_steps_per_second": 7.771,
	"step": 2530
	},
	{
	"epoch": 23.74,
	"learning_rate": 0.0001051214953271028,
	"loss": 0.0014,
	"step": 2540
	},
	{
	"epoch": 23.74,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.551665186882019,
	"eval_runtime": 3.2146,
	"eval_samples_per_second": 58.794,
	"eval_steps_per_second": 7.466,
	"step": 2540
	},
	{
	"epoch": 23.83,
	"learning_rate": 0.00010474766355140186,
	"loss": 0.0137,
	"step": 2550
	},
	{
	"epoch": 23.83,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.5628893375396729,
	"eval_runtime": 3.2259,
	"eval_samples_per_second": 58.589,
	"eval_steps_per_second": 7.44,
	"step": 2550
	},
	{
	"epoch": 23.93,
	"learning_rate": 0.00010437383177570095,
	"loss": 0.0211,
	"step": 2560
	},
	{
	"epoch": 23.93,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5249507427215576,
	"eval_runtime": 3.1967,
	"eval_samples_per_second": 59.123,
	"eval_steps_per_second": 7.508,
	"step": 2560
	},
	{
	"epoch": 24.02,
	"learning_rate": 0.00010400000000000001,
	"loss": 0.0014,
	"step": 2570
	},
	{
	"epoch": 24.02,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5051255226135254,
	"eval_runtime": 3.3479,
	"eval_samples_per_second": 56.454,
	"eval_steps_per_second": 7.169,
	"step": 2570
	},
	{
	"epoch": 24.11,
	"learning_rate": 0.00010362616822429907,
	"loss": 0.0102,
	"step": 2580
	},
	{
	"epoch": 24.11,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.4923993349075317,
	"eval_runtime": 3.3214,
	"eval_samples_per_second": 56.904,
	"eval_steps_per_second": 7.226,
	"step": 2580
	},
	{
	"epoch": 24.21,
	"learning_rate": 0.00010325233644859813,
	"loss": 0.0032,
	"step": 2590
	},
	{
	"epoch": 24.21,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.4887175559997559,
	"eval_runtime": 3.2614,
	"eval_samples_per_second": 57.95,
	"eval_steps_per_second": 7.359,
	"step": 2590
	},
	{
	"epoch": 24.3,
	"learning_rate": 0.0001028785046728972,
	"loss": 0.0012,
	"step": 2600
	},
	{
	"epoch": 24.3,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.4899401664733887,
	"eval_runtime": 3.1875,
	"eval_samples_per_second": 59.295,
	"eval_steps_per_second": 7.53,
	"step": 2600
	},
	{
	"epoch": 24.39,
	"learning_rate": 0.00010250467289719628,
	"loss": 0.0013,
	"step": 2610
	},
	{
	"epoch": 24.39,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.4907020330429077,
	"eval_runtime": 3.2459,
	"eval_samples_per_second": 58.227,
	"eval_steps_per_second": 7.394,
	"step": 2610
	},
	{
	"epoch": 24.49,
	"learning_rate": 0.00010213084112149533,
	"loss": 0.0013,
	"step": 2620
	},
	{
	"epoch": 24.49,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.4912313222885132,
	"eval_runtime": 3.1875,
	"eval_samples_per_second": 59.294,
	"eval_steps_per_second": 7.529,
	"step": 2620
	},
	{
	"epoch": 24.58,
	"learning_rate": 0.0001017570093457944,
	"loss": 0.0012,
	"step": 2630
	},
	{
	"epoch": 24.58,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.4922280311584473,
	"eval_runtime": 3.428,
	"eval_samples_per_second": 55.134,
	"eval_steps_per_second": 7.001,
	"step": 2630
	},
	{
	"epoch": 24.67,
	"learning_rate": 0.00010138317757009345,
	"loss": 0.0131,
	"step": 2640
	},
	{
	"epoch": 24.67,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.501592755317688,
	"eval_runtime": 3.3214,
	"eval_samples_per_second": 56.904,
	"eval_steps_per_second": 7.226,
	"step": 2640
	},
	{
	"epoch": 24.77,
	"learning_rate": 0.00010100934579439252,
	"loss": 0.0266,
	"step": 2650
	},
	{
	"epoch": 24.77,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.517897129058838,
	"eval_runtime": 3.3613,
	"eval_samples_per_second": 56.229,
	"eval_steps_per_second": 7.14,
	"step": 2650
	},
	{
	"epoch": 24.86,
	"learning_rate": 0.0001006355140186916,
	"loss": 0.0072,
	"step": 2660
	},
	{
	"epoch": 24.86,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5467013120651245,
	"eval_runtime": 3.2995,
	"eval_samples_per_second": 57.281,
	"eval_steps_per_second": 7.274,
	"step": 2660
	},
	{
	"epoch": 24.95,
	"learning_rate": 0.00010026168224299067,
	"loss": 0.0084,
	"step": 2670
	},
	{
	"epoch": 24.95,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.5633758306503296,
	"eval_runtime": 3.3204,
	"eval_samples_per_second": 56.921,
	"eval_steps_per_second": 7.228,
	"step": 2670
	},
	{
	"epoch": 25.05,
	"learning_rate": 9.988785046728972e-05,
	"loss": 0.0141,
	"step": 2680
	},
	{
	"epoch": 25.05,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.549333095550537,
	"eval_runtime": 3.3387,
	"eval_samples_per_second": 56.609,
	"eval_steps_per_second": 7.188,
	"step": 2680
	},
	{
	"epoch": 25.14,
	"learning_rate": 9.95140186915888e-05,
	"loss": 0.006,
	"step": 2690
	},
	{
	"epoch": 25.14,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5422124862670898,
	"eval_runtime": 3.2678,
	"eval_samples_per_second": 57.837,
	"eval_steps_per_second": 7.344,
	"step": 2690
	},
	{
	"epoch": 25.23,
	"learning_rate": 9.914018691588785e-05,
	"loss": 0.0049,
	"step": 2700
	},
	{
	"epoch": 25.23,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5276082754135132,
	"eval_runtime": 3.4271,
	"eval_samples_per_second": 55.149,
	"eval_steps_per_second": 7.003,
	"step": 2700
	},
	{
	"epoch": 25.33,
	"learning_rate": 9.876635514018692e-05,
	"loss": 0.0012,
	"step": 2710
	},
	{
	"epoch": 25.33,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5173016786575317,
	"eval_runtime": 3.3173,
	"eval_samples_per_second": 56.973,
	"eval_steps_per_second": 7.235,
	"step": 2710
	},
	{
	"epoch": 25.42,
	"learning_rate": 9.839252336448599e-05,
	"loss": 0.0012,
	"step": 2720
	},
	{
	"epoch": 25.42,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5145915746688843,
	"eval_runtime": 3.3338,
	"eval_samples_per_second": 56.692,
	"eval_steps_per_second": 7.199,
	"step": 2720
	},
	{
	"epoch": 25.51,
	"learning_rate": 9.801869158878506e-05,
	"loss": 0.0104,
	"step": 2730
	},
	{
	"epoch": 25.51,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5092376470565796,
	"eval_runtime": 3.3686,
	"eval_samples_per_second": 56.107,
	"eval_steps_per_second": 7.125,
	"step": 2730
	},
	{
	"epoch": 25.61,
	"learning_rate": 9.764485981308412e-05,
	"loss": 0.0011,
	"step": 2740
	},
	{
	"epoch": 25.61,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5066778659820557,
	"eval_runtime": 3.2919,
	"eval_samples_per_second": 57.415,
	"eval_steps_per_second": 7.291,
	"step": 2740
	},
	{
	"epoch": 25.7,
	"learning_rate": 9.727102803738318e-05,
	"loss": 0.01,
	"step": 2750
	},
	{
	"epoch": 25.7,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5135998725891113,
	"eval_runtime": 3.3065,
	"eval_samples_per_second": 57.16,
	"eval_steps_per_second": 7.258,
	"step": 2750
	},
	{
	"epoch": 25.79,
	"learning_rate": 9.689719626168224e-05,
	"loss": 0.0012,
	"step": 2760
	},
	{
	"epoch": 25.79,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5182033777236938,
	"eval_runtime": 3.1889,
	"eval_samples_per_second": 59.268,
	"eval_steps_per_second": 7.526,
	"step": 2760
	},
	{
	"epoch": 25.89,
	"learning_rate": 9.652336448598131e-05,
	"loss": 0.0011,
	"step": 2770
	},
	{
	"epoch": 25.89,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5205999612808228,
	"eval_runtime": 3.2413,
	"eval_samples_per_second": 58.311,
	"eval_steps_per_second": 7.405,
	"step": 2770
	},
	{
	"epoch": 25.98,
	"learning_rate": 9.614953271028038e-05,
	"loss": 0.0199,
	"step": 2780
	},
	{
	"epoch": 25.98,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5461922883987427,
	"eval_runtime": 3.1874,
	"eval_samples_per_second": 59.295,
	"eval_steps_per_second": 7.53,
	"step": 2780
	},
	{
	"epoch": 26.07,
	"learning_rate": 9.577570093457945e-05,
	"loss": 0.0105,
	"step": 2790
	},
	{
	"epoch": 26.07,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.560713291168213,
	"eval_runtime": 3.3195,
	"eval_samples_per_second": 56.936,
	"eval_steps_per_second": 7.23,
	"step": 2790
	},
	{
	"epoch": 26.17,
	"learning_rate": 9.540186915887851e-05,
	"loss": 0.0011,
	"step": 2800
	},
	{
	"epoch": 26.17,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5657832622528076,
	"eval_runtime": 3.108,
	"eval_samples_per_second": 60.811,
	"eval_steps_per_second": 7.722,
	"step": 2800
	},
	{
	"epoch": 26.26,
	"learning_rate": 9.502803738317757e-05,
	"loss": 0.004,
	"step": 2810
	},
	{
	"epoch": 26.26,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5667065382003784,
	"eval_runtime": 3.1078,
	"eval_samples_per_second": 60.815,
	"eval_steps_per_second": 7.723,
	"step": 2810
	},
	{
	"epoch": 26.36,
	"learning_rate": 9.465420560747665e-05,
	"loss": 0.0011,
	"step": 2820
	},
	{
	"epoch": 26.36,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.565108060836792,
	"eval_runtime": 3.1483,
	"eval_samples_per_second": 60.032,
	"eval_steps_per_second": 7.623,
	"step": 2820
	},
	{
	"epoch": 26.45,
	"learning_rate": 9.42803738317757e-05,
	"loss": 0.0129,
	"step": 2830
	},
	{
	"epoch": 26.45,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5749871730804443,
	"eval_runtime": 3.086,
	"eval_samples_per_second": 61.245,
	"eval_steps_per_second": 7.777,
	"step": 2830
	},
	{
	"epoch": 26.54,
	"learning_rate": 9.390654205607478e-05,
	"loss": 0.0102,
	"step": 2840
	},
	{
	"epoch": 26.54,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.574375867843628,
	"eval_runtime": 3.141,
	"eval_samples_per_second": 60.171,
	"eval_steps_per_second": 7.641,
	"step": 2840
	},
	{
	"epoch": 26.64,
	"learning_rate": 9.353271028037384e-05,
	"loss": 0.0041,
	"step": 2850
	},
	{
	"epoch": 26.64,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5728485584259033,
	"eval_runtime": 3.0982,
	"eval_samples_per_second": 61.002,
	"eval_steps_per_second": 7.746,
	"step": 2850
	},
	{
	"epoch": 26.73,
	"learning_rate": 9.31588785046729e-05,
	"loss": 0.0082,
	"step": 2860
	},
	{
	"epoch": 26.73,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5666193962097168,
	"eval_runtime": 3.0518,
	"eval_samples_per_second": 61.93,
	"eval_steps_per_second": 7.864,
	"step": 2860
	},
	{
	"epoch": 26.82,
	"learning_rate": 9.278504672897197e-05,
	"loss": 0.0069,
	"step": 2870
	},
	{
	"epoch": 26.82,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5484100580215454,
	"eval_runtime": 3.1504,
	"eval_samples_per_second": 59.992,
	"eval_steps_per_second": 7.618,
	"step": 2870
	},
	{
	"epoch": 26.92,
	"learning_rate": 9.241121495327104e-05,
	"loss": 0.0058,
	"step": 2880
	},
	{
	"epoch": 26.92,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5442478656768799,
	"eval_runtime": 3.2682,
	"eval_samples_per_second": 57.831,
	"eval_steps_per_second": 7.344,
	"step": 2880
	},
	{
	"epoch": 27.01,
	"learning_rate": 9.20373831775701e-05,
	"loss": 0.0011,
	"step": 2890
	},
	{
	"epoch": 27.01,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5461711883544922,
	"eval_runtime": 3.0931,
	"eval_samples_per_second": 61.105,
	"eval_steps_per_second": 7.759,
	"step": 2890
	},
	{
	"epoch": 27.1,
	"learning_rate": 9.166355140186916e-05,
	"loss": 0.0058,
	"step": 2900
	},
	{
	"epoch": 27.1,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5431169271469116,
	"eval_runtime": 3.0975,
	"eval_samples_per_second": 61.016,
	"eval_steps_per_second": 7.748,
	"step": 2900
	},
	{
	"epoch": 27.2,
	"learning_rate": 9.128971962616823e-05,
	"loss": 0.0054,
	"step": 2910
	},
	{
	"epoch": 27.2,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5305052995681763,
	"eval_runtime": 3.1126,
	"eval_samples_per_second": 60.722,
	"eval_steps_per_second": 7.711,
	"step": 2910
	},
	{
	"epoch": 27.29,
	"learning_rate": 9.091588785046729e-05,
	"loss": 0.0064,
	"step": 2920
	},
	{
	"epoch": 27.29,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5352741479873657,
	"eval_runtime": 3.1506,
	"eval_samples_per_second": 59.988,
	"eval_steps_per_second": 7.618,
	"step": 2920
	},
	{
	"epoch": 27.38,
	"learning_rate": 9.054205607476636e-05,
	"loss": 0.0116,
	"step": 2930
	},
	{
	"epoch": 27.38,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.546917200088501,
	"eval_runtime": 3.3601,
	"eval_samples_per_second": 56.248,
	"eval_steps_per_second": 7.143,
	"step": 2930
	},
	{
	"epoch": 27.48,
	"learning_rate": 9.016822429906543e-05,
	"loss": 0.001,
	"step": 2940
	},
	{
	"epoch": 27.48,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5545085668563843,
	"eval_runtime": 3.1606,
	"eval_samples_per_second": 59.798,
	"eval_steps_per_second": 7.593,
	"step": 2940
	},
	{
	"epoch": 27.57,
	"learning_rate": 8.97943925233645e-05,
	"loss": 0.0058,
	"step": 2950
	},
	{
	"epoch": 27.57,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.554548978805542,
	"eval_runtime": 3.2008,
	"eval_samples_per_second": 59.047,
	"eval_steps_per_second": 7.498,
	"step": 2950
	},
	{
	"epoch": 27.66,
	"learning_rate": 8.942056074766355e-05,
	"loss": 0.0056,
	"step": 2960
	},
	{
	"epoch": 27.66,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.546671748161316,
	"eval_runtime": 3.4523,
	"eval_samples_per_second": 54.747,
	"eval_steps_per_second": 6.952,
	"step": 2960
	},
	{
	"epoch": 27.76,
	"learning_rate": 8.904672897196263e-05,
	"loss": 0.001,
	"step": 2970
	},
	{
	"epoch": 27.76,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5371477603912354,
	"eval_runtime": 3.2841,
	"eval_samples_per_second": 57.551,
	"eval_steps_per_second": 7.308,
	"step": 2970
	},
	{
	"epoch": 27.85,
	"learning_rate": 8.867289719626168e-05,
	"loss": 0.0153,
	"step": 2980
	},
	{
	"epoch": 27.85,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5416946411132812,
	"eval_runtime": 3.3871,
	"eval_samples_per_second": 55.799,
	"eval_steps_per_second": 7.086,
	"step": 2980
	},
	{
	"epoch": 27.94,
	"learning_rate": 8.829906542056075e-05,
	"loss": 0.0063,
	"step": 2990
	},
	{
	"epoch": 27.94,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.556403636932373,
	"eval_runtime": 3.2332,
	"eval_samples_per_second": 58.456,
	"eval_steps_per_second": 7.423,
	"step": 2990
	},
	{
	"epoch": 28.04,
	"learning_rate": 8.792523364485982e-05,
	"loss": 0.001,
	"step": 3000
	},
	{
	"epoch": 28.04,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5654370784759521,
	"eval_runtime": 3.2405,
	"eval_samples_per_second": 58.325,
	"eval_steps_per_second": 7.406,
	"step": 3000
	},
	{
	"epoch": 28.13,
	"learning_rate": 8.755140186915888e-05,
	"loss": 0.001,
	"step": 3010
	},
	{
	"epoch": 28.13,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5694721937179565,
	"eval_runtime": 3.2113,
	"eval_samples_per_second": 58.854,
	"eval_steps_per_second": 7.474,
	"step": 3010
	},
	{
	"epoch": 28.22,
	"learning_rate": 8.717757009345795e-05,
	"loss": 0.001,
	"step": 3020
	},
	{
	"epoch": 28.22,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5711843967437744,
	"eval_runtime": 3.1919,
	"eval_samples_per_second": 59.213,
	"eval_steps_per_second": 7.519,
	"step": 3020
	},
	{
	"epoch": 28.32,
	"learning_rate": 8.6803738317757e-05,
	"loss": 0.0043,
	"step": 3030
	},
	{
	"epoch": 28.32,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.573392391204834,
	"eval_runtime": 3.0318,
	"eval_samples_per_second": 62.338,
	"eval_steps_per_second": 7.916,
	"step": 3030
	},
	{
	"epoch": 28.41,
	"learning_rate": 8.642990654205609e-05,
	"loss": 0.0043,
	"step": 3040
	},
	{
	"epoch": 28.41,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5829499959945679,
	"eval_runtime": 3.2944,
	"eval_samples_per_second": 57.37,
	"eval_steps_per_second": 7.285,
	"step": 3040
	},
	{
	"epoch": 28.5,
	"learning_rate": 8.605607476635514e-05,
	"loss": 0.0009,
	"step": 3050
	},
	{
	"epoch": 28.5,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5897167921066284,
	"eval_runtime": 3.1612,
	"eval_samples_per_second": 59.787,
	"eval_steps_per_second": 7.592,
	"step": 3050
	},
	{
	"epoch": 28.6,
	"learning_rate": 8.56822429906542e-05,
	"loss": 0.0009,
	"step": 3060
	},
	{
	"epoch": 28.6,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5928257703781128,
	"eval_runtime": 3.2548,
	"eval_samples_per_second": 58.068,
	"eval_steps_per_second": 7.374,
	"step": 3060
	},
	{
	"epoch": 28.69,
	"learning_rate": 8.530841121495327e-05,
	"loss": 0.0136,
	"step": 3070
	},
	{
	"epoch": 28.69,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5987612009048462,
	"eval_runtime": 3.0819,
	"eval_samples_per_second": 61.325,
	"eval_steps_per_second": 7.787,
	"step": 3070
	},
	{
	"epoch": 28.79,
	"learning_rate": 8.493457943925234e-05,
	"loss": 0.0106,
	"step": 3080
	},
	{
	"epoch": 28.79,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5925683975219727,
	"eval_runtime": 3.4371,
	"eval_samples_per_second": 54.988,
	"eval_steps_per_second": 6.983,
	"step": 3080
	},
	{
	"epoch": 28.88,
	"learning_rate": 8.456074766355141e-05,
	"loss": 0.0169,
	"step": 3090
	},
	{
	"epoch": 28.88,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5758073329925537,
	"eval_runtime": 3.1208,
	"eval_samples_per_second": 60.562,
	"eval_steps_per_second": 7.69,
	"step": 3090
	},
	{
	"epoch": 28.97,
	"learning_rate": 8.418691588785048e-05,
	"loss": 0.0058,
	"step": 3100
	},
	{
	"epoch": 28.97,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5587332248687744,
	"eval_runtime": 3.2941,
	"eval_samples_per_second": 57.375,
	"eval_steps_per_second": 7.286,
	"step": 3100
	},
	{
	"epoch": 29.07,
	"learning_rate": 8.381308411214953e-05,
	"loss": 0.0008,
	"step": 3110
	},
	{
	"epoch": 29.07,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5488831996917725,
	"eval_runtime": 3.104,
	"eval_samples_per_second": 60.89,
	"eval_steps_per_second": 7.732,
	"step": 3110
	},
	{
	"epoch": 29.16,
	"learning_rate": 8.343925233644861e-05,
	"loss": 0.0106,
	"step": 3120
	},
	{
	"epoch": 29.16,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5524382591247559,
	"eval_runtime": 3.1857,
	"eval_samples_per_second": 59.327,
	"eval_steps_per_second": 7.534,
	"step": 3120
	},
	{
	"epoch": 29.25,
	"learning_rate": 8.306542056074766e-05,
	"loss": 0.0066,
	"step": 3130
	},
	{
	"epoch": 29.25,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5529749393463135,
	"eval_runtime": 3.2947,
	"eval_samples_per_second": 57.365,
	"eval_steps_per_second": 7.284,
	"step": 3130
	},
	{
	"epoch": 29.35,
	"learning_rate": 8.269158878504673e-05,
	"loss": 0.0047,
	"step": 3140
	},
	{
	"epoch": 29.35,
	"eval_accuracy": 0.7724867724867724,
	"eval_loss": 1.561766266822815,
	"eval_runtime": 3.0618,
	"eval_samples_per_second": 61.729,
	"eval_steps_per_second": 7.839,
	"step": 3140
	},
	{
	"epoch": 29.44,
	"learning_rate": 8.23177570093458e-05,
	"loss": 0.0009,
	"step": 3150
	},
	{
	"epoch": 29.44,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.562992811203003,
	"eval_runtime": 4.4425,
	"eval_samples_per_second": 42.543,
	"eval_steps_per_second": 5.402,
	"step": 3150
	},
	{
	"epoch": 29.53,
	"learning_rate": 8.194392523364487e-05,
	"loss": 0.01,
	"step": 3160
	},
	{
	"epoch": 29.53,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5655356645584106,
	"eval_runtime": 3.1679,
	"eval_samples_per_second": 59.661,
	"eval_steps_per_second": 7.576,
	"step": 3160
	},
	{
	"epoch": 29.63,
	"learning_rate": 8.157009345794393e-05,
	"loss": 0.0131,
	"step": 3170
	},
	{
	"epoch": 29.63,
	"eval_accuracy": 0.7724867724867724,
	"eval_loss": 1.568717360496521,
	"eval_runtime": 4.272,
	"eval_samples_per_second": 44.242,
	"eval_steps_per_second": 5.618,
	"step": 3170
	},
	{
	"epoch": 29.72,
	"learning_rate": 8.119626168224299e-05,
	"loss": 0.0065,
	"step": 3180
	},
	{
	"epoch": 29.72,
	"eval_accuracy": 0.7724867724867724,
	"eval_loss": 1.5695167779922485,
	"eval_runtime": 3.2729,
	"eval_samples_per_second": 57.748,
	"eval_steps_per_second": 7.333,
	"step": 3180
	},
	{
	"epoch": 29.81,
	"learning_rate": 8.082242990654207e-05,
	"loss": 0.0049,
	"step": 3190
	},
	{
	"epoch": 29.81,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5673458576202393,
	"eval_runtime": 3.2283,
	"eval_samples_per_second": 58.545,
	"eval_steps_per_second": 7.434,
	"step": 3190
	},
	{
	"epoch": 29.91,
	"learning_rate": 8.044859813084112e-05,
	"loss": 0.0008,
	"step": 3200
	},
	{
	"epoch": 29.91,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5677809715270996,
	"eval_runtime": 3.2238,
	"eval_samples_per_second": 58.627,
	"eval_steps_per_second": 7.445,
	"step": 3200
	},
	{
	"epoch": 30.0,
	"learning_rate": 8.00747663551402e-05,
	"loss": 0.0009,
	"step": 3210
	},
	{
	"epoch": 30.0,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.569243311882019,
	"eval_runtime": 3.2344,
	"eval_samples_per_second": 58.434,
	"eval_steps_per_second": 7.42,
	"step": 3210
	},
	{
	"epoch": 30.09,
	"learning_rate": 7.970093457943925e-05,
	"loss": 0.0008,
	"step": 3220
	},
	{
	"epoch": 30.09,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.569542407989502,
	"eval_runtime": 3.1865,
	"eval_samples_per_second": 59.312,
	"eval_steps_per_second": 7.532,
	"step": 3220
	},
	{
	"epoch": 30.19,
	"learning_rate": 7.932710280373832e-05,
	"loss": 0.0008,
	"step": 3230
	},
	{
	"epoch": 30.19,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5703235864639282,
	"eval_runtime": 3.1705,
	"eval_samples_per_second": 59.612,
	"eval_steps_per_second": 7.57,
	"step": 3230
	},
	{
	"epoch": 30.28,
	"learning_rate": 7.895327102803739e-05,
	"loss": 0.0047,
	"step": 3240
	},
	{
	"epoch": 30.28,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5737032890319824,
	"eval_runtime": 3.2402,
	"eval_samples_per_second": 58.33,
	"eval_steps_per_second": 7.407,
	"step": 3240
	},
	{
	"epoch": 30.37,
	"learning_rate": 7.857943925233646e-05,
	"loss": 0.0008,
	"step": 3250
	},
	{
	"epoch": 30.37,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5757778882980347,
	"eval_runtime": 3.1947,
	"eval_samples_per_second": 59.16,
	"eval_steps_per_second": 7.512,
	"step": 3250
	},
	{
	"epoch": 30.47,
	"learning_rate": 7.820560747663552e-05,
	"loss": 0.0059,
	"step": 3260
	},
	{
	"epoch": 30.47,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5871896743774414,
	"eval_runtime": 3.2182,
	"eval_samples_per_second": 58.729,
	"eval_steps_per_second": 7.458,
	"step": 3260
	},
	{
	"epoch": 30.56,
	"learning_rate": 7.783177570093458e-05,
	"loss": 0.0091,
	"step": 3270
	},
	{
	"epoch": 30.56,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.608903169631958,
	"eval_runtime": 3.1183,
	"eval_samples_per_second": 60.61,
	"eval_steps_per_second": 7.696,
	"step": 3270
	},
	{
	"epoch": 30.65,
	"learning_rate": 7.745794392523364e-05,
	"loss": 0.0033,
	"step": 3280
	},
	{
	"epoch": 30.65,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.623267650604248,
	"eval_runtime": 3.1768,
	"eval_samples_per_second": 59.494,
	"eval_steps_per_second": 7.555,
	"step": 3280
	},
	{
	"epoch": 30.75,
	"learning_rate": 7.708411214953271e-05,
	"loss": 0.0165,
	"step": 3290
	},
	{
	"epoch": 30.75,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.611799955368042,
	"eval_runtime": 3.266,
	"eval_samples_per_second": 57.869,
	"eval_steps_per_second": 7.348,
	"step": 3290
	},
	{
	"epoch": 30.84,
	"learning_rate": 7.671028037383178e-05,
	"loss": 0.015,
	"step": 3300
	},
	{
	"epoch": 30.84,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5901665687561035,
	"eval_runtime": 3.1817,
	"eval_samples_per_second": 59.402,
	"eval_steps_per_second": 7.543,
	"step": 3300
	},
	{
	"epoch": 30.93,
	"learning_rate": 7.633644859813085e-05,
	"loss": 0.0049,
	"step": 3310
	},
	{
	"epoch": 30.93,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5764192342758179,
	"eval_runtime": 3.4445,
	"eval_samples_per_second": 54.87,
	"eval_steps_per_second": 6.968,
	"step": 3310
	},
	{
	"epoch": 31.03,
	"learning_rate": 7.596261682242991e-05,
	"loss": 0.0008,
	"step": 3320
	},
	{
	"epoch": 31.03,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5679030418395996,
	"eval_runtime": 3.18,
	"eval_samples_per_second": 59.433,
	"eval_steps_per_second": 7.547,
	"step": 3320
	},
	{
	"epoch": 31.12,
	"learning_rate": 7.558878504672897e-05,
	"loss": 0.0071,
	"step": 3330
	},
	{
	"epoch": 31.12,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5708253383636475,
	"eval_runtime": 3.2342,
	"eval_samples_per_second": 58.438,
	"eval_steps_per_second": 7.421,
	"step": 3330
	},
	{
	"epoch": 31.21,
	"learning_rate": 7.521495327102805e-05,
	"loss": 0.0068,
	"step": 3340
	},
	{
	"epoch": 31.21,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5782489776611328,
	"eval_runtime": 3.0933,
	"eval_samples_per_second": 61.099,
	"eval_steps_per_second": 7.759,
	"step": 3340
	},
	{
	"epoch": 31.31,
	"learning_rate": 7.48411214953271e-05,
	"loss": 0.0058,
	"step": 3350
	},
	{
	"epoch": 31.31,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5822737216949463,
	"eval_runtime": 3.2696,
	"eval_samples_per_second": 57.806,
	"eval_steps_per_second": 7.34,
	"step": 3350
	},
	{
	"epoch": 31.4,
	"learning_rate": 7.446728971962618e-05,
	"loss": 0.0008,
	"step": 3360
	},
	{
	"epoch": 31.4,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5795854330062866,
	"eval_runtime": 3.2032,
	"eval_samples_per_second": 59.004,
	"eval_steps_per_second": 7.493,
	"step": 3360
	},
	{
	"epoch": 31.5,
	"learning_rate": 7.409345794392524e-05,
	"loss": 0.0008,
	"step": 3370
	},
	{
	"epoch": 31.5,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5795681476593018,
	"eval_runtime": 3.2182,
	"eval_samples_per_second": 58.729,
	"eval_steps_per_second": 7.458,
	"step": 3370
	},
	{
	"epoch": 31.59,
	"learning_rate": 7.37196261682243e-05,
	"loss": 0.0084,
	"step": 3380
	},
	{
	"epoch": 31.59,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5760174989700317,
	"eval_runtime": 3.1968,
	"eval_samples_per_second": 59.122,
	"eval_steps_per_second": 7.508,
	"step": 3380
	},
	{
	"epoch": 31.68,
	"learning_rate": 7.334579439252337e-05,
	"loss": 0.0074,
	"step": 3390
	},
	{
	"epoch": 31.68,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5738554000854492,
	"eval_runtime": 3.2685,
	"eval_samples_per_second": 57.825,
	"eval_steps_per_second": 7.343,
	"step": 3390
	},
	{
	"epoch": 31.78,
	"learning_rate": 7.297196261682244e-05,
	"loss": 0.0039,
	"step": 3400
	},
	{
	"epoch": 31.78,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5700509548187256,
	"eval_runtime": 3.1115,
	"eval_samples_per_second": 60.742,
	"eval_steps_per_second": 7.713,
	"step": 3400
	},
	{
	"epoch": 31.87,
	"learning_rate": 7.25981308411215e-05,
	"loss": 0.0144,
	"step": 3410
	},
	{
	"epoch": 31.87,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5835039615631104,
	"eval_runtime": 3.3036,
	"eval_samples_per_second": 57.211,
	"eval_steps_per_second": 7.265,
	"step": 3410
	},
	{
	"epoch": 31.96,
	"learning_rate": 7.222429906542056e-05,
	"loss": 0.0051,
	"step": 3420
	},
	{
	"epoch": 31.96,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5920816659927368,
	"eval_runtime": 3.4411,
	"eval_samples_per_second": 54.924,
	"eval_steps_per_second": 6.975,
	"step": 3420
	},
	{
	"epoch": 32.06,
	"learning_rate": 7.185046728971963e-05,
	"loss": 0.0054,
	"step": 3430
	},
	{
	"epoch": 32.06,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5909570455551147,
	"eval_runtime": 3.0254,
	"eval_samples_per_second": 62.471,
	"eval_steps_per_second": 7.933,
	"step": 3430
	},
	{
	"epoch": 32.15,
	"learning_rate": 7.14766355140187e-05,
	"loss": 0.0047,
	"step": 3440
	},
	{
	"epoch": 32.15,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5870330333709717,
	"eval_runtime": 3.3063,
	"eval_samples_per_second": 57.163,
	"eval_steps_per_second": 7.259,
	"step": 3440
	},
	{
	"epoch": 32.24,
	"learning_rate": 7.110280373831776e-05,
	"loss": 0.0125,
	"step": 3450
	},
	{
	"epoch": 32.24,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.5907707214355469,
	"eval_runtime": 3.0785,
	"eval_samples_per_second": 61.394,
	"eval_steps_per_second": 7.796,
	"step": 3450
	},
	{
	"epoch": 32.34,
	"learning_rate": 7.072897196261683e-05,
	"loss": 0.0057,
	"step": 3460
	},
	{
	"epoch": 32.34,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5986977815628052,
	"eval_runtime": 3.0752,
	"eval_samples_per_second": 61.459,
	"eval_steps_per_second": 7.804,
	"step": 3460
	},
	{
	"epoch": 32.43,
	"learning_rate": 7.03551401869159e-05,
	"loss": 0.0007,
	"step": 3470
	},
	{
	"epoch": 32.43,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.6025718450546265,
	"eval_runtime": 3.1619,
	"eval_samples_per_second": 59.775,
	"eval_steps_per_second": 7.59,
	"step": 3470
	},
	{
	"epoch": 32.52,
	"learning_rate": 6.998130841121495e-05,
	"loss": 0.006,
	"step": 3480
	},
	{
	"epoch": 32.52,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.5968295335769653,
	"eval_runtime": 3.0263,
	"eval_samples_per_second": 62.452,
	"eval_steps_per_second": 7.93,
	"step": 3480
	},
	{
	"epoch": 32.62,
	"learning_rate": 6.960747663551403e-05,
	"loss": 0.0007,
	"step": 3490
	},
	{
	"epoch": 32.62,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.594142198562622,
	"eval_runtime": 3.2795,
	"eval_samples_per_second": 57.631,
	"eval_steps_per_second": 7.318,
	"step": 3490
	},
	{
	"epoch": 32.71,
	"learning_rate": 6.923364485981308e-05,
	"loss": 0.0007,
	"step": 3500
	},
	{
	"epoch": 32.71,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.59373140335083,
	"eval_runtime": 3.0541,
	"eval_samples_per_second": 61.884,
	"eval_steps_per_second": 7.858,
	"step": 3500
	},
	{
	"epoch": 32.8,
	"learning_rate": 6.885981308411215e-05,
	"loss": 0.0097,
	"step": 3510
	},
	{
	"epoch": 32.8,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.600218415260315,
	"eval_runtime": 3.105,
	"eval_samples_per_second": 60.87,
	"eval_steps_per_second": 7.73,
	"step": 3510
	},
	{
	"epoch": 32.9,
	"learning_rate": 6.848598130841122e-05,
	"loss": 0.0105,
	"step": 3520
	},
	{
	"epoch": 32.9,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6051002740859985,
	"eval_runtime": 3.4012,
	"eval_samples_per_second": 55.569,
	"eval_steps_per_second": 7.056,
	"step": 3520
	},
	{
	"epoch": 32.99,
	"learning_rate": 6.811214953271028e-05,
	"loss": 0.0007,
	"step": 3530
	},
	{
	"epoch": 32.99,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6050375699996948,
	"eval_runtime": 3.0547,
	"eval_samples_per_second": 61.873,
	"eval_steps_per_second": 7.857,
	"step": 3530
	},
	{
	"epoch": 33.08,
	"learning_rate": 6.773831775700935e-05,
	"loss": 0.0006,
	"step": 3540
	},
	{
	"epoch": 33.08,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6053138971328735,
	"eval_runtime": 3.1748,
	"eval_samples_per_second": 59.531,
	"eval_steps_per_second": 7.559,
	"step": 3540
	},
	{
	"epoch": 33.18,
	"learning_rate": 6.73644859813084e-05,
	"loss": 0.0008,
	"step": 3550
	},
	{
	"epoch": 33.18,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6058577299118042,
	"eval_runtime": 3.1448,
	"eval_samples_per_second": 60.099,
	"eval_steps_per_second": 7.632,
	"step": 3550
	},
	{
	"epoch": 33.27,
	"learning_rate": 6.699065420560749e-05,
	"loss": 0.0061,
	"step": 3560
	},
	{
	"epoch": 33.27,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.605916976928711,
	"eval_runtime": 3.094,
	"eval_samples_per_second": 61.086,
	"eval_steps_per_second": 7.757,
	"step": 3560
	},
	{
	"epoch": 33.36,
	"learning_rate": 6.661682242990654e-05,
	"loss": 0.0098,
	"step": 3570
	},
	{
	"epoch": 33.36,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6077380180358887,
	"eval_runtime": 3.1529,
	"eval_samples_per_second": 59.944,
	"eval_steps_per_second": 7.612,
	"step": 3570
	},
	{
	"epoch": 33.46,
	"learning_rate": 6.624299065420561e-05,
	"loss": 0.005,
	"step": 3580
	},
	{
	"epoch": 33.46,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6049844026565552,
	"eval_runtime": 3.2167,
	"eval_samples_per_second": 58.755,
	"eval_steps_per_second": 7.461,
	"step": 3580
	},
	{
	"epoch": 33.55,
	"learning_rate": 6.586915887850467e-05,
	"loss": 0.0007,
	"step": 3590
	},
	{
	"epoch": 33.55,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6010342836380005,
	"eval_runtime": 3.1643,
	"eval_samples_per_second": 59.729,
	"eval_steps_per_second": 7.585,
	"step": 3590
	},
	{
	"epoch": 33.64,
	"learning_rate": 6.549532710280374e-05,
	"loss": 0.0065,
	"step": 3600
	},
	{
	"epoch": 33.64,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6033494472503662,
	"eval_runtime": 3.3617,
	"eval_samples_per_second": 56.222,
	"eval_steps_per_second": 7.139,
	"step": 3600
	},
	{
	"epoch": 33.74,
	"learning_rate": 6.512149532710281e-05,
	"loss": 0.0047,
	"step": 3610
	},
	{
	"epoch": 33.74,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.602766513824463,
	"eval_runtime": 3.347,
	"eval_samples_per_second": 56.469,
	"eval_steps_per_second": 7.171,
	"step": 3610
	},
	{
	"epoch": 33.83,
	"learning_rate": 6.474766355140188e-05,
	"loss": 0.0174,
	"step": 3620
	},
	{
	"epoch": 33.83,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.6135550737380981,
	"eval_runtime": 3.3024,
	"eval_samples_per_second": 57.231,
	"eval_steps_per_second": 7.267,
	"step": 3620
	},
	{
	"epoch": 33.93,
	"learning_rate": 6.437383177570093e-05,
	"loss": 0.0057,
	"step": 3630
	},
	{
	"epoch": 33.93,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.6196566820144653,
	"eval_runtime": 3.1607,
	"eval_samples_per_second": 59.797,
	"eval_steps_per_second": 7.593,
	"step": 3630
	},
	{
	"epoch": 34.02,
	"learning_rate": 6.400000000000001e-05,
	"loss": 0.0007,
	"step": 3640
	},
	{
	"epoch": 34.02,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.6192022562026978,
	"eval_runtime": 3.2012,
	"eval_samples_per_second": 59.04,
	"eval_steps_per_second": 7.497,
	"step": 3640
	},
	{
	"epoch": 34.11,
	"learning_rate": 6.362616822429906e-05,
	"loss": 0.01,
	"step": 3650
	},
	{
	"epoch": 34.11,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.616557240486145,
	"eval_runtime": 3.0372,
	"eval_samples_per_second": 62.228,
	"eval_steps_per_second": 7.902,
	"step": 3650
	},
	{
	"epoch": 34.21,
	"learning_rate": 6.325233644859813e-05,
	"loss": 0.0144,
	"step": 3660
	},
	{
	"epoch": 34.21,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.6212772130966187,
	"eval_runtime": 3.1343,
	"eval_samples_per_second": 60.3,
	"eval_steps_per_second": 7.657,
	"step": 3660
	},
	{
	"epoch": 34.3,
	"learning_rate": 6.28785046728972e-05,
	"loss": 0.0007,
	"step": 3670
	},
	{
	"epoch": 34.3,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.6278337240219116,
	"eval_runtime": 3.1421,
	"eval_samples_per_second": 60.15,
	"eval_steps_per_second": 7.638,
	"step": 3670
	},
	{
	"epoch": 34.39,
	"learning_rate": 6.250467289719625e-05,
	"loss": 0.0095,
	"step": 3680
	},
	{
	"epoch": 34.39,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6321161985397339,
	"eval_runtime": 3.249,
	"eval_samples_per_second": 58.171,
	"eval_steps_per_second": 7.387,
	"step": 3680
	},
	{
	"epoch": 34.49,
	"learning_rate": 6.213084112149533e-05,
	"loss": 0.0006,
	"step": 3690
	},
	{
	"epoch": 34.49,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6336792707443237,
	"eval_runtime": 3.1451,
	"eval_samples_per_second": 60.093,
	"eval_steps_per_second": 7.631,
	"step": 3690
	},
	{
	"epoch": 34.58,
	"learning_rate": 6.175700934579439e-05,
	"loss": 0.0007,
	"step": 3700
	},
	{
	"epoch": 34.58,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6350607872009277,
	"eval_runtime": 3.1678,
	"eval_samples_per_second": 59.662,
	"eval_steps_per_second": 7.576,
	"step": 3700
	},
	{
	"epoch": 34.67,
	"learning_rate": 6.138317757009347e-05,
	"loss": 0.0006,
	"step": 3710
	},
	{
	"epoch": 34.67,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6363701820373535,
	"eval_runtime": 3.2215,
	"eval_samples_per_second": 58.669,
	"eval_steps_per_second": 7.45,
	"step": 3710
	},
	{
	"epoch": 34.77,
	"learning_rate": 6.100934579439253e-05,
	"loss": 0.0063,
	"step": 3720
	},
	{
	"epoch": 34.77,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6366699934005737,
	"eval_runtime": 3.2135,
	"eval_samples_per_second": 58.815,
	"eval_steps_per_second": 7.469,
	"step": 3720
	},
	{
	"epoch": 34.86,
	"learning_rate": 6.0635514018691595e-05,
	"loss": 0.0062,
	"step": 3730
	},
	{
	"epoch": 34.86,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6348670721054077,
	"eval_runtime": 3.0917,
	"eval_samples_per_second": 61.132,
	"eval_steps_per_second": 7.763,
	"step": 3730
	},
	{
	"epoch": 34.95,
	"learning_rate": 6.0261682242990656e-05,
	"loss": 0.0064,
	"step": 3740
	},
	{
	"epoch": 34.95,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6241209506988525,
	"eval_runtime": 3.38,
	"eval_samples_per_second": 55.917,
	"eval_steps_per_second": 7.101,
	"step": 3740
	},
	{
	"epoch": 35.05,
	"learning_rate": 5.9887850467289716e-05,
	"loss": 0.0006,
	"step": 3750
	},
	{
	"epoch": 35.05,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6208295822143555,
	"eval_runtime": 3.2066,
	"eval_samples_per_second": 58.942,
	"eval_steps_per_second": 7.485,
	"step": 3750
	},
	{
	"epoch": 35.14,
	"learning_rate": 5.951401869158879e-05,
	"loss": 0.0006,
	"step": 3760
	},
	{
	"epoch": 35.14,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6204679012298584,
	"eval_runtime": 3.2685,
	"eval_samples_per_second": 57.825,
	"eval_steps_per_second": 7.343,
	"step": 3760
	},
	{
	"epoch": 35.23,
	"learning_rate": 5.914018691588785e-05,
	"loss": 0.0137,
	"step": 3770
	},
	{
	"epoch": 35.23,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6377967596054077,
	"eval_runtime": 3.1739,
	"eval_samples_per_second": 59.549,
	"eval_steps_per_second": 7.562,
	"step": 3770
	},
	{
	"epoch": 35.33,
	"learning_rate": 5.8766355140186925e-05,
	"loss": 0.0007,
	"step": 3780
	},
	{
	"epoch": 35.33,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6510041952133179,
	"eval_runtime": 3.0141,
	"eval_samples_per_second": 62.706,
	"eval_steps_per_second": 7.963,
	"step": 3780
	},
	{
	"epoch": 35.42,
	"learning_rate": 5.8392523364485985e-05,
	"loss": 0.0113,
	"step": 3790
	},
	{
	"epoch": 35.42,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6442958116531372,
	"eval_runtime": 3.0277,
	"eval_samples_per_second": 62.424,
	"eval_steps_per_second": 7.927,
	"step": 3790
	},
	{
	"epoch": 35.51,
	"learning_rate": 5.8018691588785046e-05,
	"loss": 0.0112,
	"step": 3800
	},
	{
	"epoch": 35.51,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6433544158935547,
	"eval_runtime": 3.1874,
	"eval_samples_per_second": 59.295,
	"eval_steps_per_second": 7.53,
	"step": 3800
	},
	{
	"epoch": 35.61,
	"learning_rate": 5.764485981308412e-05,
	"loss": 0.0006,
	"step": 3810
	},
	{
	"epoch": 35.61,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6435635089874268,
	"eval_runtime": 3.281,
	"eval_samples_per_second": 57.604,
	"eval_steps_per_second": 7.315,
	"step": 3810
	},
	{
	"epoch": 35.7,
	"learning_rate": 5.727102803738318e-05,
	"loss": 0.0006,
	"step": 3820
	},
	{
	"epoch": 35.7,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6441317796707153,
	"eval_runtime": 3.1827,
	"eval_samples_per_second": 59.384,
	"eval_steps_per_second": 7.541,
	"step": 3820
	},
	{
	"epoch": 35.79,
	"learning_rate": 5.6897196261682254e-05,
	"loss": 0.0145,
	"step": 3830
	},
	{
	"epoch": 35.79,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6258851289749146,
	"eval_runtime": 3.2346,
	"eval_samples_per_second": 58.431,
	"eval_steps_per_second": 7.42,
	"step": 3830
	},
	{
	"epoch": 35.89,
	"learning_rate": 5.6523364485981315e-05,
	"loss": 0.0006,
	"step": 3840
	},
	{
	"epoch": 35.89,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6195772886276245,
	"eval_runtime": 3.2109,
	"eval_samples_per_second": 58.862,
	"eval_steps_per_second": 7.475,
	"step": 3840
	},
	{
	"epoch": 35.98,
	"learning_rate": 5.6149532710280375e-05,
	"loss": 0.0047,
	"step": 3850
	},
	{
	"epoch": 35.98,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6145455837249756,
	"eval_runtime": 3.1308,
	"eval_samples_per_second": 60.367,
	"eval_steps_per_second": 7.666,
	"step": 3850
	},
	{
	"epoch": 36.07,
	"learning_rate": 5.577570093457944e-05,
	"loss": 0.0096,
	"step": 3860
	},
	{
	"epoch": 36.07,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6121631860733032,
	"eval_runtime": 3.1516,
	"eval_samples_per_second": 59.97,
	"eval_steps_per_second": 7.615,
	"step": 3860
	},
	{
	"epoch": 36.17,
	"learning_rate": 5.54018691588785e-05,
	"loss": 0.0006,
	"step": 3870
	},
	{
	"epoch": 36.17,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6133732795715332,
	"eval_runtime": 3.2412,
	"eval_samples_per_second": 58.312,
	"eval_steps_per_second": 7.405,
	"step": 3870
	},
	{
	"epoch": 36.26,
	"learning_rate": 5.502803738317758e-05,
	"loss": 0.0063,
	"step": 3880
	},
	{
	"epoch": 36.26,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6175814867019653,
	"eval_runtime": 3.1207,
	"eval_samples_per_second": 60.563,
	"eval_steps_per_second": 7.691,
	"step": 3880
	},
	{
	"epoch": 36.36,
	"learning_rate": 5.465420560747664e-05,
	"loss": 0.0049,
	"step": 3890
	},
	{
	"epoch": 36.36,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6226632595062256,
	"eval_runtime": 3.2034,
	"eval_samples_per_second": 59.0,
	"eval_steps_per_second": 7.492,
	"step": 3890
	},
	{
	"epoch": 36.45,
	"learning_rate": 5.42803738317757e-05,
	"loss": 0.0006,
	"step": 3900
	},
	{
	"epoch": 36.45,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6221052408218384,
	"eval_runtime": 3.2707,
	"eval_samples_per_second": 57.786,
	"eval_steps_per_second": 7.338,
	"step": 3900
	},
	{
	"epoch": 36.54,
	"learning_rate": 5.390654205607477e-05,
	"loss": 0.0057,
	"step": 3910
	},
	{
	"epoch": 36.54,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.626526951789856,
	"eval_runtime": 3.2153,
	"eval_samples_per_second": 58.781,
	"eval_steps_per_second": 7.464,
	"step": 3910
	},
	{
	"epoch": 36.64,
	"learning_rate": 5.353271028037383e-05,
	"loss": 0.0006,
	"step": 3920
	},
	{
	"epoch": 36.64,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6315840482711792,
	"eval_runtime": 3.2376,
	"eval_samples_per_second": 58.377,
	"eval_steps_per_second": 7.413,
	"step": 3920
	},
	{
	"epoch": 36.73,
	"learning_rate": 5.3158878504672906e-05,
	"loss": 0.0095,
	"step": 3930
	},
	{
	"epoch": 36.73,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6349341869354248,
	"eval_runtime": 3.1421,
	"eval_samples_per_second": 60.15,
	"eval_steps_per_second": 7.638,
	"step": 3930
	},
	{
	"epoch": 36.82,
	"learning_rate": 5.2785046728971966e-05,
	"loss": 0.0062,
	"step": 3940
	},
	{
	"epoch": 36.82,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6396187543869019,
	"eval_runtime": 3.1897,
	"eval_samples_per_second": 59.254,
	"eval_steps_per_second": 7.524,
	"step": 3940
	},
	{
	"epoch": 36.92,
	"learning_rate": 5.241121495327103e-05,
	"loss": 0.0062,
	"step": 3950
	},
	{
	"epoch": 36.92,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6347572803497314,
	"eval_runtime": 3.3171,
	"eval_samples_per_second": 56.978,
	"eval_steps_per_second": 7.235,
	"step": 3950
	},
	{
	"epoch": 37.01,
	"learning_rate": 5.20373831775701e-05,
	"loss": 0.0052,
	"step": 3960
	},
	{
	"epoch": 37.01,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6283901929855347,
	"eval_runtime": 3.2006,
	"eval_samples_per_second": 59.051,
	"eval_steps_per_second": 7.499,
	"step": 3960
	},
	{
	"epoch": 37.1,
	"learning_rate": 5.166355140186916e-05,
	"loss": 0.0054,
	"step": 3970
	},
	{
	"epoch": 37.1,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6296182870864868,
	"eval_runtime": 3.2544,
	"eval_samples_per_second": 58.075,
	"eval_steps_per_second": 7.375,
	"step": 3970
	},
	{
	"epoch": 37.2,
	"learning_rate": 5.128971962616823e-05,
	"loss": 0.0142,
	"step": 3980
	},
	{
	"epoch": 37.2,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6342829465866089,
	"eval_runtime": 3.2879,
	"eval_samples_per_second": 57.483,
	"eval_steps_per_second": 7.299,
	"step": 3980
	},
	{
	"epoch": 37.29,
	"learning_rate": 5.091588785046729e-05,
	"loss": 0.0006,
	"step": 3990
	},
	{
	"epoch": 37.29,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6389538049697876,
	"eval_runtime": 3.1746,
	"eval_samples_per_second": 59.535,
	"eval_steps_per_second": 7.56,
	"step": 3990
	},
	{
	"epoch": 37.38,
	"learning_rate": 5.0542056074766356e-05,
	"loss": 0.0056,
	"step": 4000
	},
	{
	"epoch": 37.38,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.63650643825531,
	"eval_runtime": 3.2374,
	"eval_samples_per_second": 58.38,
	"eval_steps_per_second": 7.413,
	"step": 4000
	},
	{
	"epoch": 37.48,
	"learning_rate": 5.0168224299065423e-05,
	"loss": 0.0006,
	"step": 4010
	},
	{
	"epoch": 37.48,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6352988481521606,
	"eval_runtime": 3.2389,
	"eval_samples_per_second": 58.353,
	"eval_steps_per_second": 7.41,
	"step": 4010
	},
	{
	"epoch": 37.57,
	"learning_rate": 4.9794392523364484e-05,
	"loss": 0.0006,
	"step": 4020
	},
	{
	"epoch": 37.57,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6355526447296143,
	"eval_runtime": 3.3214,
	"eval_samples_per_second": 56.904,
	"eval_steps_per_second": 7.226,
	"step": 4020
	},
	{
	"epoch": 37.66,
	"learning_rate": 4.942056074766355e-05,
	"loss": 0.0006,
	"step": 4030
	},
	{
	"epoch": 37.66,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6356136798858643,
	"eval_runtime": 3.3612,
	"eval_samples_per_second": 56.23,
	"eval_steps_per_second": 7.14,
	"step": 4030
	},
	{
	"epoch": 37.76,
	"learning_rate": 4.904672897196262e-05,
	"loss": 0.0006,
	"step": 4040
	},
	{
	"epoch": 37.76,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6366937160491943,
	"eval_runtime": 3.2144,
	"eval_samples_per_second": 58.797,
	"eval_steps_per_second": 7.466,
	"step": 4040
	},
	{
	"epoch": 37.85,
	"learning_rate": 4.8672897196261686e-05,
	"loss": 0.01,
	"step": 4050
	},
	{
	"epoch": 37.85,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.631759762763977,
	"eval_runtime": 3.29,
	"eval_samples_per_second": 57.446,
	"eval_steps_per_second": 7.295,
	"step": 4050
	},
	{
	"epoch": 37.94,
	"learning_rate": 4.829906542056075e-05,
	"loss": 0.0151,
	"step": 4060
	},
	{
	"epoch": 37.94,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6293249130249023,
	"eval_runtime": 3.1536,
	"eval_samples_per_second": 59.931,
	"eval_steps_per_second": 7.61,
	"step": 4060
	},
	{
	"epoch": 38.04,
	"learning_rate": 4.792523364485981e-05,
	"loss": 0.006,
	"step": 4070
	},
	{
	"epoch": 38.04,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6346244812011719,
	"eval_runtime": 3.2143,
	"eval_samples_per_second": 58.801,
	"eval_steps_per_second": 7.467,
	"step": 4070
	},
	{
	"epoch": 38.13,
	"learning_rate": 4.755140186915888e-05,
	"loss": 0.0006,
	"step": 4080
	},
	{
	"epoch": 38.13,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6401140689849854,
	"eval_runtime": 3.257,
	"eval_samples_per_second": 58.028,
	"eval_steps_per_second": 7.369,
	"step": 4080
	},
	{
	"epoch": 38.22,
	"learning_rate": 4.717757009345795e-05,
	"loss": 0.0006,
	"step": 4090
	},
	{
	"epoch": 38.22,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.642866849899292,
	"eval_runtime": 3.1879,
	"eval_samples_per_second": 59.286,
	"eval_steps_per_second": 7.528,
	"step": 4090
	},
	{
	"epoch": 38.32,
	"learning_rate": 4.6803738317757015e-05,
	"loss": 0.0093,
	"step": 4100
	},
	{
	"epoch": 38.32,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.635596513748169,
	"eval_runtime": 3.2354,
	"eval_samples_per_second": 58.417,
	"eval_steps_per_second": 7.418,
	"step": 4100
	},
	{
	"epoch": 38.41,
	"learning_rate": 4.6429906542056075e-05,
	"loss": 0.0046,
	"step": 4110
	},
	{
	"epoch": 38.41,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6306812763214111,
	"eval_runtime": 3.2449,
	"eval_samples_per_second": 58.246,
	"eval_steps_per_second": 7.396,
	"step": 4110
	},
	{
	"epoch": 38.5,
	"learning_rate": 4.605607476635514e-05,
	"loss": 0.0111,
	"step": 4120
	},
	{
	"epoch": 38.5,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.6402584314346313,
	"eval_runtime": 3.1872,
	"eval_samples_per_second": 59.299,
	"eval_steps_per_second": 7.53,
	"step": 4120
	},
	{
	"epoch": 38.6,
	"learning_rate": 4.56822429906542e-05,
	"loss": 0.0005,
	"step": 4130
	},
	{
	"epoch": 38.6,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.6475365161895752,
	"eval_runtime": 3.5346,
	"eval_samples_per_second": 53.472,
	"eval_steps_per_second": 6.79,
	"step": 4130
	},
	{
	"epoch": 38.69,
	"learning_rate": 4.530841121495327e-05,
	"loss": 0.0006,
	"step": 4140
	},
	{
	"epoch": 38.69,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.6509393453598022,
	"eval_runtime": 3.062,
	"eval_samples_per_second": 61.724,
	"eval_steps_per_second": 7.838,
	"step": 4140
	},
	{
	"epoch": 38.79,
	"learning_rate": 4.493457943925234e-05,
	"loss": 0.0006,
	"step": 4150
	},
	{
	"epoch": 38.79,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.652215600013733,
	"eval_runtime": 3.5079,
	"eval_samples_per_second": 53.878,
	"eval_steps_per_second": 6.842,
	"step": 4150
	},
	{
	"epoch": 38.88,
	"learning_rate": 4.4560747663551405e-05,
	"loss": 0.0075,
	"step": 4160
	},
	{
	"epoch": 38.88,
	"eval_accuracy": 0.7566137566137566,
	"eval_loss": 1.653160810470581,
	"eval_runtime": 3.2762,
	"eval_samples_per_second": 57.688,
	"eval_steps_per_second": 7.325,
	"step": 4160
	},
	{
	"epoch": 38.97,
	"learning_rate": 4.418691588785047e-05,
	"loss": 0.0097,
	"step": 4170
	},
	{
	"epoch": 38.97,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6547893285751343,
	"eval_runtime": 3.2144,
	"eval_samples_per_second": 58.797,
	"eval_steps_per_second": 7.466,
	"step": 4170
	},
	{
	"epoch": 39.07,
	"learning_rate": 4.381308411214953e-05,
	"loss": 0.0058,
	"step": 4180
	},
	{
	"epoch": 39.07,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6471433639526367,
	"eval_runtime": 3.2814,
	"eval_samples_per_second": 57.598,
	"eval_steps_per_second": 7.314,
	"step": 4180
	},
	{
	"epoch": 39.16,
	"learning_rate": 4.34392523364486e-05,
	"loss": 0.0049,
	"step": 4190
	},
	{
	"epoch": 39.16,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6409401893615723,
	"eval_runtime": 3.1609,
	"eval_samples_per_second": 59.793,
	"eval_steps_per_second": 7.593,
	"step": 4190
	},
	{
	"epoch": 39.25,
	"learning_rate": 4.306542056074767e-05,
	"loss": 0.0111,
	"step": 4200
	},
	{
	"epoch": 39.25,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6414356231689453,
	"eval_runtime": 3.2279,
	"eval_samples_per_second": 58.552,
	"eval_steps_per_second": 7.435,
	"step": 4200
	},
	{
	"epoch": 39.35,
	"learning_rate": 4.2691588785046734e-05,
	"loss": 0.0052,
	"step": 4210
	},
	{
	"epoch": 39.35,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.652433156967163,
	"eval_runtime": 3.1373,
	"eval_samples_per_second": 60.242,
	"eval_steps_per_second": 7.65,
	"step": 4210
	},
	{
	"epoch": 39.44,
	"learning_rate": 4.23177570093458e-05,
	"loss": 0.0005,
	"step": 4220
	},
	{
	"epoch": 39.44,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.657133936882019,
	"eval_runtime": 3.2697,
	"eval_samples_per_second": 57.804,
	"eval_steps_per_second": 7.34,
	"step": 4220
	},
	{
	"epoch": 39.53,
	"learning_rate": 4.194392523364486e-05,
	"loss": 0.0052,
	"step": 4230
	},
	{
	"epoch": 39.53,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6594574451446533,
	"eval_runtime": 3.2345,
	"eval_samples_per_second": 58.432,
	"eval_steps_per_second": 7.42,
	"step": 4230
	},
	{
	"epoch": 39.63,
	"learning_rate": 4.157009345794393e-05,
	"loss": 0.0061,
	"step": 4240
	},
	{
	"epoch": 39.63,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6557565927505493,
	"eval_runtime": 3.268,
	"eval_samples_per_second": 57.833,
	"eval_steps_per_second": 7.344,
	"step": 4240
	},
	{
	"epoch": 39.72,
	"learning_rate": 4.119626168224299e-05,
	"loss": 0.0056,
	"step": 4250
	},
	{
	"epoch": 39.72,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.649285912513733,
	"eval_runtime": 3.2248,
	"eval_samples_per_second": 58.608,
	"eval_steps_per_second": 7.442,
	"step": 4250
	},
	{
	"epoch": 39.81,
	"learning_rate": 4.082242990654206e-05,
	"loss": 0.0006,
	"step": 4260
	},
	{
	"epoch": 39.81,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6455833911895752,
	"eval_runtime": 3.1611,
	"eval_samples_per_second": 59.789,
	"eval_steps_per_second": 7.592,
	"step": 4260
	},
	{
	"epoch": 39.91,
	"learning_rate": 4.0448598130841124e-05,
	"loss": 0.011,
	"step": 4270
	},
	{
	"epoch": 39.91,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6422607898712158,
	"eval_runtime": 3.2656,
	"eval_samples_per_second": 57.877,
	"eval_steps_per_second": 7.349,
	"step": 4270
	},
	{
	"epoch": 40.0,
	"learning_rate": 4.0074766355140184e-05,
	"loss": 0.006,
	"step": 4280
	},
	{
	"epoch": 40.0,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6446949243545532,
	"eval_runtime": 3.3462,
	"eval_samples_per_second": 56.481,
	"eval_steps_per_second": 7.172,
	"step": 4280
	},
	{
	"epoch": 40.09,
	"learning_rate": 3.970093457943925e-05,
	"loss": 0.0043,
	"step": 4290
	},
	{
	"epoch": 40.09,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6466460227966309,
	"eval_runtime": 3.3213,
	"eval_samples_per_second": 56.906,
	"eval_steps_per_second": 7.226,
	"step": 4290
	},
	{
	"epoch": 40.19,
	"learning_rate": 3.932710280373832e-05,
	"loss": 0.0098,
	"step": 4300
	},
	{
	"epoch": 40.19,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6464401483535767,
	"eval_runtime": 3.1753,
	"eval_samples_per_second": 59.521,
	"eval_steps_per_second": 7.558,
	"step": 4300
	},
	{
	"epoch": 40.28,
	"learning_rate": 3.8953271028037386e-05,
	"loss": 0.006,
	"step": 4310
	},
	{
	"epoch": 40.28,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6519055366516113,
	"eval_runtime": 3.2608,
	"eval_samples_per_second": 57.961,
	"eval_steps_per_second": 7.36,
	"step": 4310
	},
	{
	"epoch": 40.37,
	"learning_rate": 3.857943925233645e-05,
	"loss": 0.0053,
	"step": 4320
	},
	{
	"epoch": 40.37,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6609773635864258,
	"eval_runtime": 3.2634,
	"eval_samples_per_second": 57.916,
	"eval_steps_per_second": 7.354,
	"step": 4320
	},
	{
	"epoch": 40.47,
	"learning_rate": 3.8205607476635514e-05,
	"loss": 0.0005,
	"step": 4330
	},
	{
	"epoch": 40.47,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6645921468734741,
	"eval_runtime": 3.2004,
	"eval_samples_per_second": 59.054,
	"eval_steps_per_second": 7.499,
	"step": 4330
	},
	{
	"epoch": 40.56,
	"learning_rate": 3.783177570093458e-05,
	"loss": 0.0006,
	"step": 4340
	},
	{
	"epoch": 40.56,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6660394668579102,
	"eval_runtime": 3.415,
	"eval_samples_per_second": 55.344,
	"eval_steps_per_second": 7.028,
	"step": 4340
	},
	{
	"epoch": 40.65,
	"learning_rate": 3.745794392523365e-05,
	"loss": 0.0082,
	"step": 4350
	},
	{
	"epoch": 40.65,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.669595718383789,
	"eval_runtime": 3.3898,
	"eval_samples_per_second": 55.756,
	"eval_steps_per_second": 7.08,
	"step": 4350
	},
	{
	"epoch": 40.75,
	"learning_rate": 3.7084112149532715e-05,
	"loss": 0.0064,
	"step": 4360
	},
	{
	"epoch": 40.75,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.672002911567688,
	"eval_runtime": 3.3575,
	"eval_samples_per_second": 56.291,
	"eval_steps_per_second": 7.148,
	"step": 4360
	},
	{
	"epoch": 40.84,
	"learning_rate": 3.6710280373831776e-05,
	"loss": 0.0005,
	"step": 4370
	},
	{
	"epoch": 40.84,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6732321977615356,
	"eval_runtime": 2.9775,
	"eval_samples_per_second": 63.477,
	"eval_steps_per_second": 8.061,
	"step": 4370
	},
	{
	"epoch": 40.93,
	"learning_rate": 3.633644859813084e-05,
	"loss": 0.0065,
	"step": 4380
	},
	{
	"epoch": 40.93,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6676148176193237,
	"eval_runtime": 3.245,
	"eval_samples_per_second": 58.243,
	"eval_steps_per_second": 7.396,
	"step": 4380
	},
	{
	"epoch": 41.03,
	"learning_rate": 3.5962616822429904e-05,
	"loss": 0.006,
	"step": 4390
	},
	{
	"epoch": 41.03,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6597942113876343,
	"eval_runtime": 3.4525,
	"eval_samples_per_second": 54.742,
	"eval_steps_per_second": 6.951,
	"step": 4390
	},
	{
	"epoch": 41.12,
	"learning_rate": 3.558878504672897e-05,
	"loss": 0.0047,
	"step": 4400
	},
	{
	"epoch": 41.12,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6621626615524292,
	"eval_runtime": 3.1882,
	"eval_samples_per_second": 59.28,
	"eval_steps_per_second": 7.528,
	"step": 4400
	},
	{
	"epoch": 41.21,
	"learning_rate": 3.521495327102804e-05,
	"loss": 0.0055,
	"step": 4410
	},
	{
	"epoch": 41.21,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6600810289382935,
	"eval_runtime": 3.1527,
	"eval_samples_per_second": 59.949,
	"eval_steps_per_second": 7.613,
	"step": 4410
	},
	{
	"epoch": 41.31,
	"learning_rate": 3.4841121495327105e-05,
	"loss": 0.0049,
	"step": 4420
	},
	{
	"epoch": 41.31,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6604359149932861,
	"eval_runtime": 3.0872,
	"eval_samples_per_second": 61.22,
	"eval_steps_per_second": 7.774,
	"step": 4420
	},
	{
	"epoch": 41.4,
	"learning_rate": 3.446728971962617e-05,
	"loss": 0.0005,
	"step": 4430
	},
	{
	"epoch": 41.4,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.664872646331787,
	"eval_runtime": 3.2713,
	"eval_samples_per_second": 57.776,
	"eval_steps_per_second": 7.337,
	"step": 4430
	},
	{
	"epoch": 41.5,
	"learning_rate": 3.409345794392523e-05,
	"loss": 0.005,
	"step": 4440
	},
	{
	"epoch": 41.5,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6663637161254883,
	"eval_runtime": 3.1479,
	"eval_samples_per_second": 60.04,
	"eval_steps_per_second": 7.624,
	"step": 4440
	},
	{
	"epoch": 41.59,
	"learning_rate": 3.37196261682243e-05,
	"loss": 0.0098,
	"step": 4450
	},
	{
	"epoch": 41.59,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6684166193008423,
	"eval_runtime": 3.1477,
	"eval_samples_per_second": 60.043,
	"eval_steps_per_second": 7.625,
	"step": 4450
	},
	{
	"epoch": 41.68,
	"learning_rate": 3.334579439252337e-05,
	"loss": 0.0005,
	"step": 4460
	},
	{
	"epoch": 41.68,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.672025203704834,
	"eval_runtime": 3.1099,
	"eval_samples_per_second": 60.773,
	"eval_steps_per_second": 7.717,
	"step": 4460
	},
	{
	"epoch": 41.78,
	"learning_rate": 3.2971962616822435e-05,
	"loss": 0.0148,
	"step": 4470
	},
	{
	"epoch": 41.78,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6690597534179688,
	"eval_runtime": 3.17,
	"eval_samples_per_second": 59.622,
	"eval_steps_per_second": 7.571,
	"step": 4470
	},
	{
	"epoch": 41.87,
	"learning_rate": 3.25981308411215e-05,
	"loss": 0.0005,
	"step": 4480
	},
	{
	"epoch": 41.87,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6645516157150269,
	"eval_runtime": 3.0775,
	"eval_samples_per_second": 61.414,
	"eval_steps_per_second": 7.799,
	"step": 4480
	},
	{
	"epoch": 41.96,
	"learning_rate": 3.222429906542056e-05,
	"loss": 0.0052,
	"step": 4490
	},
	{
	"epoch": 41.96,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6626436710357666,
	"eval_runtime": 3.1486,
	"eval_samples_per_second": 60.027,
	"eval_steps_per_second": 7.622,
	"step": 4490
	},
	{
	"epoch": 42.06,
	"learning_rate": 3.185046728971963e-05,
	"loss": 0.0052,
	"step": 4500
	},
	{
	"epoch": 42.06,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6587588787078857,
	"eval_runtime": 3.3613,
	"eval_samples_per_second": 56.229,
	"eval_steps_per_second": 7.14,
	"step": 4500
	},
	{
	"epoch": 42.15,
	"learning_rate": 3.147663551401869e-05,
	"loss": 0.0044,
	"step": 4510
	},
	{
	"epoch": 42.15,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6567378044128418,
	"eval_runtime": 3.1117,
	"eval_samples_per_second": 60.738,
	"eval_steps_per_second": 7.713,
	"step": 4510
	},
	{
	"epoch": 42.24,
	"learning_rate": 3.110280373831776e-05,
	"loss": 0.0059,
	"step": 4520
	},
	{
	"epoch": 42.24,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6559375524520874,
	"eval_runtime": 3.1594,
	"eval_samples_per_second": 59.821,
	"eval_steps_per_second": 7.596,
	"step": 4520
	},
	{
	"epoch": 42.34,
	"learning_rate": 3.0728971962616824e-05,
	"loss": 0.0005,
	"step": 4530
	},
	{
	"epoch": 42.34,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6584206819534302,
	"eval_runtime": 3.215,
	"eval_samples_per_second": 58.786,
	"eval_steps_per_second": 7.465,
	"step": 4530
	},
	{
	"epoch": 42.43,
	"learning_rate": 3.0355140186915888e-05,
	"loss": 0.0046,
	"step": 4540
	},
	{
	"epoch": 42.43,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.658771276473999,
	"eval_runtime": 3.081,
	"eval_samples_per_second": 61.344,
	"eval_steps_per_second": 7.79,
	"step": 4540
	},
	{
	"epoch": 42.52,
	"learning_rate": 2.9981308411214952e-05,
	"loss": 0.0005,
	"step": 4550
	},
	{
	"epoch": 42.52,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6556823253631592,
	"eval_runtime": 3.7215,
	"eval_samples_per_second": 50.786,
	"eval_steps_per_second": 6.449,
	"step": 4550
	},
	{
	"epoch": 42.62,
	"learning_rate": 2.960747663551402e-05,
	"loss": 0.0005,
	"step": 4560
	},
	{
	"epoch": 42.62,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6551687717437744,
	"eval_runtime": 3.2069,
	"eval_samples_per_second": 58.935,
	"eval_steps_per_second": 7.484,
	"step": 4560
	},
	{
	"epoch": 42.71,
	"learning_rate": 2.9233644859813087e-05,
	"loss": 0.0005,
	"step": 4570
	},
	{
	"epoch": 42.71,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.655452013015747,
	"eval_runtime": 3.2606,
	"eval_samples_per_second": 57.964,
	"eval_steps_per_second": 7.361,
	"step": 4570
	},
	{
	"epoch": 42.8,
	"learning_rate": 2.8859813084112154e-05,
	"loss": 0.0107,
	"step": 4580
	},
	{
	"epoch": 42.8,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6596006155014038,
	"eval_runtime": 3.241,
	"eval_samples_per_second": 58.315,
	"eval_steps_per_second": 7.405,
	"step": 4580
	},
	{
	"epoch": 42.9,
	"learning_rate": 2.8485981308411214e-05,
	"loss": 0.015,
	"step": 4590
	},
	{
	"epoch": 42.9,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6657310724258423,
	"eval_runtime": 3.1747,
	"eval_samples_per_second": 59.534,
	"eval_steps_per_second": 7.56,
	"step": 4590
	},
	{
	"epoch": 42.99,
	"learning_rate": 2.811214953271028e-05,
	"loss": 0.0052,
	"step": 4600
	},
	{
	"epoch": 42.99,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6676826477050781,
	"eval_runtime": 3.254,
	"eval_samples_per_second": 58.083,
	"eval_steps_per_second": 7.376,
	"step": 4600
	},
	{
	"epoch": 43.08,
	"learning_rate": 2.7738317757009345e-05,
	"loss": 0.0051,
	"step": 4610
	},
	{
	"epoch": 43.08,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.668189525604248,
	"eval_runtime": 3.1876,
	"eval_samples_per_second": 59.293,
	"eval_steps_per_second": 7.529,
	"step": 4610
	},
	{
	"epoch": 43.18,
	"learning_rate": 2.7364485981308413e-05,
	"loss": 0.0051,
	"step": 4620
	},
	{
	"epoch": 43.18,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6663062572479248,
	"eval_runtime": 3.3928,
	"eval_samples_per_second": 55.707,
	"eval_steps_per_second": 7.074,
	"step": 4620
	},
	{
	"epoch": 43.27,
	"learning_rate": 2.699065420560748e-05,
	"loss": 0.0005,
	"step": 4630
	},
	{
	"epoch": 43.27,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.664025068283081,
	"eval_runtime": 3.2939,
	"eval_samples_per_second": 57.378,
	"eval_steps_per_second": 7.286,
	"step": 4630
	},
	{
	"epoch": 43.36,
	"learning_rate": 2.6616822429906547e-05,
	"loss": 0.0088,
	"step": 4640
	},
	{
	"epoch": 43.36,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6622815132141113,
	"eval_runtime": 3.135,
	"eval_samples_per_second": 60.287,
	"eval_steps_per_second": 7.655,
	"step": 4640
	},
	{
	"epoch": 43.46,
	"learning_rate": 2.6242990654205607e-05,
	"loss": 0.0053,
	"step": 4650
	},
	{
	"epoch": 43.46,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.664080262184143,
	"eval_runtime": 3.2274,
	"eval_samples_per_second": 58.56,
	"eval_steps_per_second": 7.436,
	"step": 4650
	},
	{
	"epoch": 43.55,
	"learning_rate": 2.5869158878504675e-05,
	"loss": 0.0064,
	"step": 4660
	},
	{
	"epoch": 43.55,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.665493130683899,
	"eval_runtime": 3.1518,
	"eval_samples_per_second": 59.966,
	"eval_steps_per_second": 7.615,
	"step": 4660
	},
	{
	"epoch": 43.64,
	"learning_rate": 2.549532710280374e-05,
	"loss": 0.0005,
	"step": 4670
	},
	{
	"epoch": 43.64,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6664865016937256,
	"eval_runtime": 3.2866,
	"eval_samples_per_second": 57.506,
	"eval_steps_per_second": 7.302,
	"step": 4670
	},
	{
	"epoch": 43.74,
	"learning_rate": 2.5121495327102806e-05,
	"loss": 0.005,
	"step": 4680
	},
	{
	"epoch": 43.74,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6677204370498657,
	"eval_runtime": 3.2047,
	"eval_samples_per_second": 58.976,
	"eval_steps_per_second": 7.489,
	"step": 4680
	},
	{
	"epoch": 43.83,
	"learning_rate": 2.474766355140187e-05,
	"loss": 0.0049,
	"step": 4690
	},
	{
	"epoch": 43.83,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6758949756622314,
	"eval_runtime": 3.4806,
	"eval_samples_per_second": 54.301,
	"eval_steps_per_second": 6.895,
	"step": 4690
	},
	{
	"epoch": 43.93,
	"learning_rate": 2.4373831775700937e-05,
	"loss": 0.0055,
	"step": 4700
	},
	{
	"epoch": 43.93,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6764609813690186,
	"eval_runtime": 3.2004,
	"eval_samples_per_second": 59.055,
	"eval_steps_per_second": 7.499,
	"step": 4700
	},
	{
	"epoch": 44.02,
	"learning_rate": 2.4e-05,
	"loss": 0.0144,
	"step": 4710
	},
	{
	"epoch": 44.02,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6740403175354004,
	"eval_runtime": 3.2944,
	"eval_samples_per_second": 57.37,
	"eval_steps_per_second": 7.285,
	"step": 4710
	},
	{
	"epoch": 44.11,
	"learning_rate": 2.3626168224299068e-05,
	"loss": 0.0005,
	"step": 4720
	},
	{
	"epoch": 44.11,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6708952188491821,
	"eval_runtime": 3.0279,
	"eval_samples_per_second": 62.42,
	"eval_steps_per_second": 7.926,
	"step": 4720
	},
	{
	"epoch": 44.21,
	"learning_rate": 2.325233644859813e-05,
	"loss": 0.0051,
	"step": 4730
	},
	{
	"epoch": 44.21,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6715834140777588,
	"eval_runtime": 3.2347,
	"eval_samples_per_second": 58.428,
	"eval_steps_per_second": 7.419,
	"step": 4730
	},
	{
	"epoch": 44.3,
	"learning_rate": 2.2878504672897196e-05,
	"loss": 0.005,
	"step": 4740
	},
	{
	"epoch": 44.3,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6689761877059937,
	"eval_runtime": 3.1331,
	"eval_samples_per_second": 60.324,
	"eval_steps_per_second": 7.66,
	"step": 4740
	},
	{
	"epoch": 44.39,
	"learning_rate": 2.2504672897196263e-05,
	"loss": 0.0005,
	"step": 4750
	},
	{
	"epoch": 44.39,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6669028997421265,
	"eval_runtime": 2.9298,
	"eval_samples_per_second": 64.509,
	"eval_steps_per_second": 8.192,
	"step": 4750
	},
	{
	"epoch": 44.49,
	"learning_rate": 2.2130841121495327e-05,
	"loss": 0.005,
	"step": 4760
	},
	{
	"epoch": 44.49,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6714545488357544,
	"eval_runtime": 3.0674,
	"eval_samples_per_second": 61.615,
	"eval_steps_per_second": 7.824,
	"step": 4760
	},
	{
	"epoch": 44.58,
	"learning_rate": 2.1757009345794394e-05,
	"loss": 0.0005,
	"step": 4770
	},
	{
	"epoch": 44.58,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6736085414886475,
	"eval_runtime": 2.9894,
	"eval_samples_per_second": 63.222,
	"eval_steps_per_second": 8.028,
	"step": 4770
	},
	{
	"epoch": 44.67,
	"learning_rate": 2.138317757009346e-05,
	"loss": 0.0046,
	"step": 4780
	},
	{
	"epoch": 44.67,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.676229476928711,
	"eval_runtime": 2.9735,
	"eval_samples_per_second": 63.562,
	"eval_steps_per_second": 8.071,
	"step": 4780
	},
	{
	"epoch": 44.77,
	"learning_rate": 2.1009345794392525e-05,
	"loss": 0.0055,
	"step": 4790
	},
	{
	"epoch": 44.77,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6757352352142334,
	"eval_runtime": 3.1208,
	"eval_samples_per_second": 60.561,
	"eval_steps_per_second": 7.69,
	"step": 4790
	},
	{
	"epoch": 44.86,
	"learning_rate": 2.063551401869159e-05,
	"loss": 0.0098,
	"step": 4800
	},
	{
	"epoch": 44.86,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.670250654220581,
	"eval_runtime": 3.1041,
	"eval_samples_per_second": 60.887,
	"eval_steps_per_second": 7.732,
	"step": 4800
	},
	{
	"epoch": 44.95,
	"learning_rate": 2.0261682242990653e-05,
	"loss": 0.005,
	"step": 4810
	},
	{
	"epoch": 44.95,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6712110042572021,
	"eval_runtime": 3.374,
	"eval_samples_per_second": 56.016,
	"eval_steps_per_second": 7.113,
	"step": 4810
	},
	{
	"epoch": 45.05,
	"learning_rate": 1.988785046728972e-05,
	"loss": 0.005,
	"step": 4820
	},
	{
	"epoch": 45.05,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6744420528411865,
	"eval_runtime": 3.1947,
	"eval_samples_per_second": 59.161,
	"eval_steps_per_second": 7.513,
	"step": 4820
	},
	{
	"epoch": 45.14,
	"learning_rate": 1.9514018691588787e-05,
	"loss": 0.0005,
	"step": 4830
	},
	{
	"epoch": 45.14,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6774510145187378,
	"eval_runtime": 3.126,
	"eval_samples_per_second": 60.46,
	"eval_steps_per_second": 7.677,
	"step": 4830
	},
	{
	"epoch": 45.23,
	"learning_rate": 1.914018691588785e-05,
	"loss": 0.0005,
	"step": 4840
	},
	{
	"epoch": 45.23,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6790132522583008,
	"eval_runtime": 2.9821,
	"eval_samples_per_second": 63.379,
	"eval_steps_per_second": 8.048,
	"step": 4840
	},
	{
	"epoch": 45.33,
	"learning_rate": 1.8766355140186918e-05,
	"loss": 0.0005,
	"step": 4850
	},
	{
	"epoch": 45.33,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6794980764389038,
	"eval_runtime": 3.139,
	"eval_samples_per_second": 60.21,
	"eval_steps_per_second": 7.646,
	"step": 4850
	},
	{
	"epoch": 45.42,
	"learning_rate": 1.8392523364485982e-05,
	"loss": 0.0049,
	"step": 4860
	},
	{
	"epoch": 45.42,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6801530122756958,
	"eval_runtime": 2.945,
	"eval_samples_per_second": 64.176,
	"eval_steps_per_second": 8.149,
	"step": 4860
	},
	{
	"epoch": 45.51,
	"learning_rate": 1.8018691588785046e-05,
	"loss": 0.0051,
	"step": 4870
	},
	{
	"epoch": 45.51,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6776082515716553,
	"eval_runtime": 2.9852,
	"eval_samples_per_second": 63.313,
	"eval_steps_per_second": 8.04,
	"step": 4870
	},
	{
	"epoch": 45.61,
	"learning_rate": 1.7644859813084113e-05,
	"loss": 0.0049,
	"step": 4880
	},
	{
	"epoch": 45.61,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6780359745025635,
	"eval_runtime": 3.0255,
	"eval_samples_per_second": 62.469,
	"eval_steps_per_second": 7.933,
	"step": 4880
	},
	{
	"epoch": 45.7,
	"learning_rate": 1.7271028037383177e-05,
	"loss": 0.0091,
	"step": 4890
	},
	{
	"epoch": 45.7,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6785778999328613,
	"eval_runtime": 2.9136,
	"eval_samples_per_second": 64.868,
	"eval_steps_per_second": 8.237,
	"step": 4890
	},
	{
	"epoch": 45.79,
	"learning_rate": 1.6897196261682244e-05,
	"loss": 0.0046,
	"step": 4900
	},
	{
	"epoch": 45.79,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6758513450622559,
	"eval_runtime": 2.9184,
	"eval_samples_per_second": 64.761,
	"eval_steps_per_second": 8.224,
	"step": 4900
	},
	{
	"epoch": 45.89,
	"learning_rate": 1.652336448598131e-05,
	"loss": 0.0056,
	"step": 4910
	},
	{
	"epoch": 45.89,
	"eval_accuracy": 0.7724867724867724,
	"eval_loss": 1.6727031469345093,
	"eval_runtime": 2.9001,
	"eval_samples_per_second": 65.169,
	"eval_steps_per_second": 8.275,
	"step": 4910
	},
	{
	"epoch": 45.98,
	"learning_rate": 1.6149532710280375e-05,
	"loss": 0.011,
	"step": 4920
	},
	{
	"epoch": 45.98,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6746748685836792,
	"eval_runtime": 2.9034,
	"eval_samples_per_second": 65.095,
	"eval_steps_per_second": 8.266,
	"step": 4920
	},
	{
	"epoch": 46.07,
	"learning_rate": 1.577570093457944e-05,
	"loss": 0.0093,
	"step": 4930
	},
	{
	"epoch": 46.07,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.674180507659912,
	"eval_runtime": 2.9574,
	"eval_samples_per_second": 63.907,
	"eval_steps_per_second": 8.115,
	"step": 4930
	},
	{
	"epoch": 46.17,
	"learning_rate": 1.5401869158878503e-05,
	"loss": 0.0047,
	"step": 4940
	},
	{
	"epoch": 46.17,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6757071018218994,
	"eval_runtime": 2.8997,
	"eval_samples_per_second": 65.179,
	"eval_steps_per_second": 8.277,
	"step": 4940
	},
	{
	"epoch": 46.26,
	"learning_rate": 1.502803738317757e-05,
	"loss": 0.0089,
	"step": 4950
	},
	{
	"epoch": 46.26,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6735711097717285,
	"eval_runtime": 3.1476,
	"eval_samples_per_second": 60.046,
	"eval_steps_per_second": 7.625,
	"step": 4950
	},
	{
	"epoch": 46.36,
	"learning_rate": 1.4654205607476637e-05,
	"loss": 0.0005,
	"step": 4960
	},
	{
	"epoch": 46.36,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6719815731048584,
	"eval_runtime": 3.192,
	"eval_samples_per_second": 59.21,
	"eval_steps_per_second": 7.519,
	"step": 4960
	},
	{
	"epoch": 46.45,
	"learning_rate": 1.4280373831775701e-05,
	"loss": 0.0005,
	"step": 4970
	},
	{
	"epoch": 46.45,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6716129779815674,
	"eval_runtime": 2.9471,
	"eval_samples_per_second": 64.131,
	"eval_steps_per_second": 8.144,
	"step": 4970
	},
	{
	"epoch": 46.54,
	"learning_rate": 1.3906542056074767e-05,
	"loss": 0.0097,
	"step": 4980
	},
	{
	"epoch": 46.54,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.672421932220459,
	"eval_runtime": 2.9663,
	"eval_samples_per_second": 63.716,
	"eval_steps_per_second": 8.091,
	"step": 4980
	},
	{
	"epoch": 46.64,
	"learning_rate": 1.3532710280373834e-05,
	"loss": 0.0005,
	"step": 4990
	},
	{
	"epoch": 46.64,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.671976089477539,
	"eval_runtime": 3.0014,
	"eval_samples_per_second": 62.971,
	"eval_steps_per_second": 7.996,
	"step": 4990
	},
	{
	"epoch": 46.73,
	"learning_rate": 1.3158878504672898e-05,
	"loss": 0.0005,
	"step": 5000
	},
	{
	"epoch": 46.73,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6718426942825317,
	"eval_runtime": 3.162,
	"eval_samples_per_second": 59.772,
	"eval_steps_per_second": 7.59,
	"step": 5000
	},
	{
	"epoch": 46.82,
	"learning_rate": 1.2785046728971963e-05,
	"loss": 0.0004,
	"step": 5010
	},
	{
	"epoch": 46.82,
	"eval_accuracy": 0.7671957671957672,
	"eval_loss": 1.6721214056015015,
	"eval_runtime": 2.9348,
	"eval_samples_per_second": 64.4,
	"eval_steps_per_second": 8.178,
	"step": 5010
	},
	{
	"epoch": 46.92,
	"learning_rate": 1.2411214953271029e-05,
	"loss": 0.0107,
	"step": 5020
	},
	{
	"epoch": 46.92,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6742489337921143,
	"eval_runtime": 2.9616,
	"eval_samples_per_second": 63.816,
	"eval_steps_per_second": 8.104,
	"step": 5020
	},
	{
	"epoch": 47.01,
	"learning_rate": 1.2037383177570094e-05,
	"loss": 0.0051,
	"step": 5030
	},
	{
	"epoch": 47.01,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6763916015625,
	"eval_runtime": 3.3324,
	"eval_samples_per_second": 56.716,
	"eval_steps_per_second": 7.202,
	"step": 5030
	},
	{
	"epoch": 47.1,
	"learning_rate": 1.166355140186916e-05,
	"loss": 0.0004,
	"step": 5040
	},
	{
	"epoch": 47.1,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6787925958633423,
	"eval_runtime": 2.994,
	"eval_samples_per_second": 63.127,
	"eval_steps_per_second": 8.016,
	"step": 5040
	},
	{
	"epoch": 47.2,
	"learning_rate": 1.1289719626168224e-05,
	"loss": 0.0048,
	"step": 5050
	},
	{
	"epoch": 47.2,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.67880380153656,
	"eval_runtime": 2.9739,
	"eval_samples_per_second": 63.554,
	"eval_steps_per_second": 8.07,
	"step": 5050
	},
	{
	"epoch": 47.29,
	"learning_rate": 1.0915887850467291e-05,
	"loss": 0.0005,
	"step": 5060
	},
	{
	"epoch": 47.29,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6779260635375977,
	"eval_runtime": 2.9453,
	"eval_samples_per_second": 64.171,
	"eval_steps_per_second": 8.149,
	"step": 5060
	},
	{
	"epoch": 47.38,
	"learning_rate": 1.0542056074766356e-05,
	"loss": 0.0048,
	"step": 5070
	},
	{
	"epoch": 47.38,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6772257089614868,
	"eval_runtime": 3.0548,
	"eval_samples_per_second": 61.87,
	"eval_steps_per_second": 7.856,
	"step": 5070
	},
	{
	"epoch": 47.48,
	"learning_rate": 1.016822429906542e-05,
	"loss": 0.0044,
	"step": 5080
	},
	{
	"epoch": 47.48,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.677033543586731,
	"eval_runtime": 3.0759,
	"eval_samples_per_second": 61.446,
	"eval_steps_per_second": 7.803,
	"step": 5080
	},
	{
	"epoch": 47.57,
	"learning_rate": 9.794392523364486e-06,
	"loss": 0.0004,
	"step": 5090
	},
	{
	"epoch": 47.57,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6759369373321533,
	"eval_runtime": 3.134,
	"eval_samples_per_second": 60.306,
	"eval_steps_per_second": 7.658,
	"step": 5090
	},
	{
	"epoch": 47.66,
	"learning_rate": 9.420560747663553e-06,
	"loss": 0.0053,
	"step": 5100
	},
	{
	"epoch": 47.66,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6769102811813354,
	"eval_runtime": 3.2383,
	"eval_samples_per_second": 58.363,
	"eval_steps_per_second": 7.411,
	"step": 5100
	},
	{
	"epoch": 47.76,
	"learning_rate": 9.046728971962617e-06,
	"loss": 0.0093,
	"step": 5110
	},
	{
	"epoch": 47.76,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6791408061981201,
	"eval_runtime": 3.1946,
	"eval_samples_per_second": 59.163,
	"eval_steps_per_second": 7.513,
	"step": 5110
	},
	{
	"epoch": 47.85,
	"learning_rate": 8.672897196261682e-06,
	"loss": 0.0046,
	"step": 5120
	},
	{
	"epoch": 47.85,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6781762838363647,
	"eval_runtime": 3.0007,
	"eval_samples_per_second": 62.986,
	"eval_steps_per_second": 7.998,
	"step": 5120
	},
	{
	"epoch": 47.94,
	"learning_rate": 8.299065420560748e-06,
	"loss": 0.0101,
	"step": 5130
	},
	{
	"epoch": 47.94,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.679875135421753,
	"eval_runtime": 2.8961,
	"eval_samples_per_second": 65.259,
	"eval_steps_per_second": 8.287,
	"step": 5130
	},
	{
	"epoch": 48.04,
	"learning_rate": 7.925233644859813e-06,
	"loss": 0.0055,
	"step": 5140
	},
	{
	"epoch": 48.04,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6814370155334473,
	"eval_runtime": 2.99,
	"eval_samples_per_second": 63.21,
	"eval_steps_per_second": 8.027,
	"step": 5140
	},
	{
	"epoch": 48.13,
	"learning_rate": 7.551401869158879e-06,
	"loss": 0.0004,
	"step": 5150
	},
	{
	"epoch": 48.13,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6820155382156372,
	"eval_runtime": 3.0809,
	"eval_samples_per_second": 61.346,
	"eval_steps_per_second": 7.79,
	"step": 5150
	},
	{
	"epoch": 48.22,
	"learning_rate": 7.1775700934579445e-06,
	"loss": 0.0005,
	"step": 5160
	},
	{
	"epoch": 48.22,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6822861433029175,
	"eval_runtime": 2.9449,
	"eval_samples_per_second": 64.179,
	"eval_steps_per_second": 8.15,
	"step": 5160
	},
	{
	"epoch": 48.32,
	"learning_rate": 6.803738317757009e-06,
	"loss": 0.005,
	"step": 5170
	},
	{
	"epoch": 48.32,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.682709813117981,
	"eval_runtime": 3.0319,
	"eval_samples_per_second": 62.337,
	"eval_steps_per_second": 7.916,
	"step": 5170
	},
	{
	"epoch": 48.41,
	"learning_rate": 6.429906542056075e-06,
	"loss": 0.0093,
	"step": 5180
	},
	{
	"epoch": 48.41,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6838692426681519,
	"eval_runtime": 3.0335,
	"eval_samples_per_second": 62.304,
	"eval_steps_per_second": 7.912,
	"step": 5180
	},
	{
	"epoch": 48.5,
	"learning_rate": 6.05607476635514e-06,
	"loss": 0.0048,
	"step": 5190
	},
	{
	"epoch": 48.5,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6845488548278809,
	"eval_runtime": 3.0676,
	"eval_samples_per_second": 61.612,
	"eval_steps_per_second": 7.824,
	"step": 5190
	},
	{
	"epoch": 48.6,
	"learning_rate": 5.682242990654206e-06,
	"loss": 0.0005,
	"step": 5200
	},
	{
	"epoch": 48.6,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6849009990692139,
	"eval_runtime": 3.008,
	"eval_samples_per_second": 62.832,
	"eval_steps_per_second": 7.979,
	"step": 5200
	},
	{
	"epoch": 48.69,
	"learning_rate": 5.308411214953271e-06,
	"loss": 0.0005,
	"step": 5210
	},
	{
	"epoch": 48.69,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6851400136947632,
	"eval_runtime": 2.9174,
	"eval_samples_per_second": 64.784,
	"eval_steps_per_second": 8.227,
	"step": 5210
	},
	{
	"epoch": 48.79,
	"learning_rate": 4.934579439252337e-06,
	"loss": 0.0136,
	"step": 5220
	},
	{
	"epoch": 48.79,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.686295747756958,
	"eval_runtime": 2.9681,
	"eval_samples_per_second": 63.678,
	"eval_steps_per_second": 8.086,
	"step": 5220
	},
	{
	"epoch": 48.88,
	"learning_rate": 4.560747663551402e-06,
	"loss": 0.005,
	"step": 5230
	},
	{
	"epoch": 48.88,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6866832971572876,
	"eval_runtime": 2.9518,
	"eval_samples_per_second": 64.029,
	"eval_steps_per_second": 8.131,
	"step": 5230
	},
	{
	"epoch": 48.97,
	"learning_rate": 4.186915887850468e-06,
	"loss": 0.0096,
	"step": 5240
	},
	{
	"epoch": 48.97,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.685899257659912,
	"eval_runtime": 3.0006,
	"eval_samples_per_second": 62.987,
	"eval_steps_per_second": 7.998,
	"step": 5240
	},
	{
	"epoch": 49.07,
	"learning_rate": 3.813084112149533e-06,
	"loss": 0.0048,
	"step": 5250
	},
	{
	"epoch": 49.07,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6844896078109741,
	"eval_runtime": 2.9876,
	"eval_samples_per_second": 63.261,
	"eval_steps_per_second": 8.033,
	"step": 5250
	},
	{
	"epoch": 49.16,
	"learning_rate": 3.4392523364485985e-06,
	"loss": 0.0048,
	"step": 5260
	},
	{
	"epoch": 49.16,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6853784322738647,
	"eval_runtime": 2.9873,
	"eval_samples_per_second": 63.267,
	"eval_steps_per_second": 8.034,
	"step": 5260
	},
	{
	"epoch": 49.25,
	"learning_rate": 3.0654205607476637e-06,
	"loss": 0.0093,
	"step": 5270
	},
	{
	"epoch": 49.25,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6857768297195435,
	"eval_runtime": 2.9803,
	"eval_samples_per_second": 63.416,
	"eval_steps_per_second": 8.053,
	"step": 5270
	},
	{
	"epoch": 49.35,
	"learning_rate": 2.691588785046729e-06,
	"loss": 0.0004,
	"step": 5280
	},
	{
	"epoch": 49.35,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6857463121414185,
	"eval_runtime": 3.0292,
	"eval_samples_per_second": 62.393,
	"eval_steps_per_second": 7.923,
	"step": 5280
	},
	{
	"epoch": 49.44,
	"learning_rate": 2.3177570093457947e-06,
	"loss": 0.0095,
	"step": 5290
	},
	{
	"epoch": 49.44,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.685395359992981,
	"eval_runtime": 2.9645,
	"eval_samples_per_second": 63.755,
	"eval_steps_per_second": 8.096,
	"step": 5290
	},
	{
	"epoch": 49.53,
	"learning_rate": 1.94392523364486e-06,
	"loss": 0.0005,
	"step": 5300
	},
	{
	"epoch": 49.53,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6847246885299683,
	"eval_runtime": 3.0054,
	"eval_samples_per_second": 62.887,
	"eval_steps_per_second": 7.986,
	"step": 5300
	},
	{
	"epoch": 49.63,
	"learning_rate": 1.5700934579439254e-06,
	"loss": 0.0005,
	"step": 5310
	},
	{
	"epoch": 49.63,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6844700574874878,
	"eval_runtime": 2.9223,
	"eval_samples_per_second": 64.676,
	"eval_steps_per_second": 8.213,
	"step": 5310
	},
	{
	"epoch": 49.72,
	"learning_rate": 1.1962616822429907e-06,
	"loss": 0.0092,
	"step": 5320
	},
	{
	"epoch": 49.72,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6847366094589233,
	"eval_runtime": 3.0496,
	"eval_samples_per_second": 61.975,
	"eval_steps_per_second": 7.87,
	"step": 5320
	},
	{
	"epoch": 49.81,
	"learning_rate": 8.224299065420561e-07,
	"loss": 0.0005,
	"step": 5330
	},
	{
	"epoch": 49.81,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6845016479492188,
	"eval_runtime": 3.1606,
	"eval_samples_per_second": 59.798,
	"eval_steps_per_second": 7.593,
	"step": 5330
	},
	{
	"epoch": 49.91,
	"learning_rate": 4.4859813084112153e-07,
	"loss": 0.0092,
	"step": 5340
	},
	{
	"epoch": 49.91,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.684584140777588,
	"eval_runtime": 2.921,
	"eval_samples_per_second": 64.704,
	"eval_steps_per_second": 8.216,
	"step": 5340
	},
	{
	"epoch": 50.0,
	"learning_rate": 7.476635514018692e-08,
	"loss": 0.0005,
	"step": 5350
	},
	{
	"epoch": 50.0,
	"eval_accuracy": 0.7619047619047619,
	"eval_loss": 1.6846909523010254,
	"eval_runtime": 2.9853,
	"eval_samples_per_second": 63.309,
	"eval_steps_per_second": 8.039,
	"step": 5350
	},
	{
	"epoch": 50.0,
	"step": 5350,
	"total_flos": 6.575784632757043e+18,
	"train_loss": 0.14066274270554568,
	"train_runtime": 4434.2749,
	"train_samples_per_second": 19.135,
	"train_steps_per_second": 1.207
	}
	],
	"logging_steps": 10,
	"max_steps": 5350,
	"num_train_epochs": 50,
	"save_steps": 10,
	"total_flos": 6.575784632757043e+18,
	"trial_name": null,
	"trial_params": null
	}