wavlm-base_2 / trainer_state.json

End of training

f8fabf9 over 2 years ago

74.1 kB

	{
	"best_metric": 0.9965786507808726,
	"best_model_checkpoint": "/home/cloudwalker/ASVmodel/wavlm-base_2/checkpoint-300",
	"epoch": 49.9054820415879,
	"eval_steps": 100,
	"global_step": 19800,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.25,
	"learning_rate": 1.515151515151515e-05,
	"loss": 0.4872,
	"step": 100
	},
	{
	"epoch": 0.25,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.21796834468841553,
	"eval_runtime": 498.2273,
	"eval_samples_per_second": 49.865,
	"eval_steps_per_second": 24.932,
	"step": 100
	},
	{
	"epoch": 0.5,
	"learning_rate": 3.03030303030303e-05,
	"loss": 0.1571,
	"step": 200
	},
	{
	"epoch": 0.5,
	"eval_accuracy": 0.93342456931251,
	"eval_loss": 0.2581726014614105,
	"eval_runtime": 500.3876,
	"eval_samples_per_second": 49.65,
	"eval_steps_per_second": 24.825,
	"step": 200
	},
	{
	"epoch": 0.76,
	"learning_rate": 4.545454545454545e-05,
	"loss": 0.0644,
	"step": 300
	},
	{
	"epoch": 0.76,
	"eval_accuracy": 0.9965786507808726,
	"eval_loss": 0.024423159658908844,
	"eval_runtime": 500.4785,
	"eval_samples_per_second": 49.64,
	"eval_steps_per_second": 24.82,
	"step": 300
	},
	{
	"epoch": 1.01,
	"learning_rate": 6.06060606060606e-05,
	"loss": 0.0553,
	"step": 400
	},
	{
	"epoch": 1.01,
	"eval_accuracy": 0.9927950410561907,
	"eval_loss": 0.11555636674165726,
	"eval_runtime": 500.405,
	"eval_samples_per_second": 49.648,
	"eval_steps_per_second": 24.824,
	"step": 400
	},
	{
	"epoch": 1.26,
	"learning_rate": 7.575757575757576e-05,
	"loss": 0.1108,
	"step": 500
	},
	{
	"epoch": 1.26,
	"eval_accuracy": 0.9898164546771856,
	"eval_loss": 0.1576482504606247,
	"eval_runtime": 500.3246,
	"eval_samples_per_second": 49.656,
	"eval_steps_per_second": 24.828,
	"step": 500
	},
	{
	"epoch": 1.51,
	"learning_rate": 9.09090909090909e-05,
	"loss": 0.0849,
	"step": 600
	},
	{
	"epoch": 1.51,
	"eval_accuracy": 0.9946868459185316,
	"eval_loss": 0.08708283305168152,
	"eval_runtime": 500.3759,
	"eval_samples_per_second": 49.651,
	"eval_steps_per_second": 24.825,
	"step": 600
	},
	{
	"epoch": 1.76,
	"learning_rate": 0.00010606060606060605,
	"loss": 0.0635,
	"step": 700
	},
	{
	"epoch": 1.76,
	"eval_accuracy": 0.9938818225728546,
	"eval_loss": 0.10875184088945389,
	"eval_runtime": 500.3093,
	"eval_samples_per_second": 49.657,
	"eval_steps_per_second": 24.829,
	"step": 700
	},
	{
	"epoch": 2.02,
	"learning_rate": 0.0001212121212121212,
	"loss": 0.0504,
	"step": 800
	},
	{
	"epoch": 2.02,
	"eval_accuracy": 0.9789888906778297,
	"eval_loss": 0.4074054956436157,
	"eval_runtime": 500.4204,
	"eval_samples_per_second": 49.646,
	"eval_steps_per_second": 24.823,
	"step": 800
	},
	{
	"epoch": 2.27,
	"learning_rate": 0.00013636363636363634,
	"loss": 0.1075,
	"step": 900
	},
	{
	"epoch": 2.27,
	"eval_accuracy": 0.9814442118821446,
	"eval_loss": 0.2954882085323334,
	"eval_runtime": 500.4501,
	"eval_samples_per_second": 49.643,
	"eval_steps_per_second": 24.822,
	"step": 900
	},
	{
	"epoch": 2.52,
	"learning_rate": 0.00015151515151515152,
	"loss": 0.2387,
	"step": 1000
	},
	{
	"epoch": 2.52,
	"eval_accuracy": 0.9956126227660602,
	"eval_loss": 0.06512398272752762,
	"eval_runtime": 500.7096,
	"eval_samples_per_second": 49.618,
	"eval_steps_per_second": 24.809,
	"step": 1000
	},
	{
	"epoch": 2.77,
	"learning_rate": 0.00016666666666666666,
	"loss": 0.3052,
	"step": 1100
	},
	{
	"epoch": 2.77,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.23793257772922516,
	"eval_runtime": 500.5364,
	"eval_samples_per_second": 49.635,
	"eval_steps_per_second": 24.817,
	"step": 1100
	},
	{
	"epoch": 3.02,
	"learning_rate": 0.0001818181818181818,
	"loss": 0.3336,
	"step": 1200
	},
	{
	"epoch": 3.02,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.35269346833229065,
	"eval_runtime": 501.0064,
	"eval_samples_per_second": 49.588,
	"eval_steps_per_second": 24.794,
	"step": 1200
	},
	{
	"epoch": 3.28,
	"learning_rate": 0.00019696969696969695,
	"loss": 0.3322,
	"step": 1300
	},
	{
	"epoch": 3.28,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33067458868026733,
	"eval_runtime": 502.8336,
	"eval_samples_per_second": 49.408,
	"eval_steps_per_second": 24.704,
	"step": 1300
	},
	{
	"epoch": 3.53,
	"learning_rate": 0.0002121212121212121,
	"loss": 0.3201,
	"step": 1400
	},
	{
	"epoch": 3.53,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.34046611189842224,
	"eval_runtime": 500.7806,
	"eval_samples_per_second": 49.611,
	"eval_steps_per_second": 24.805,
	"step": 1400
	},
	{
	"epoch": 3.78,
	"learning_rate": 0.00022727272727272725,
	"loss": 0.3406,
	"step": 1500
	},
	{
	"epoch": 3.78,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33353403210639954,
	"eval_runtime": 500.7499,
	"eval_samples_per_second": 49.614,
	"eval_steps_per_second": 24.807,
	"step": 1500
	},
	{
	"epoch": 4.03,
	"learning_rate": 0.0002424242424242424,
	"loss": 0.3475,
	"step": 1600
	},
	{
	"epoch": 4.03,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3340916931629181,
	"eval_runtime": 500.598,
	"eval_samples_per_second": 49.629,
	"eval_steps_per_second": 24.814,
	"step": 1600
	},
	{
	"epoch": 4.28,
	"learning_rate": 0.00025757575757575756,
	"loss": 0.3312,
	"step": 1700
	},
	{
	"epoch": 4.28,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33610448241233826,
	"eval_runtime": 500.8798,
	"eval_samples_per_second": 49.601,
	"eval_steps_per_second": 24.8,
	"step": 1700
	},
	{
	"epoch": 4.54,
	"learning_rate": 0.0002727272727272727,
	"loss": 0.3367,
	"step": 1800
	},
	{
	"epoch": 4.54,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3309839069843292,
	"eval_runtime": 500.5768,
	"eval_samples_per_second": 49.631,
	"eval_steps_per_second": 24.815,
	"step": 1800
	},
	{
	"epoch": 4.79,
	"learning_rate": 0.00028787878787878786,
	"loss": 0.3284,
	"step": 1900
	},
	{
	"epoch": 4.79,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33385568857192993,
	"eval_runtime": 500.453,
	"eval_samples_per_second": 49.643,
	"eval_steps_per_second": 24.822,
	"step": 1900
	},
	{
	"epoch": 5.04,
	"learning_rate": 0.00029966329966329963,
	"loss": 0.3267,
	"step": 2000
	},
	{
	"epoch": 5.04,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3350389301776886,
	"eval_runtime": 500.7512,
	"eval_samples_per_second": 49.613,
	"eval_steps_per_second": 24.807,
	"step": 2000
	},
	{
	"epoch": 5.29,
	"learning_rate": 0.00029797979797979794,
	"loss": 0.338,
	"step": 2100
	},
	{
	"epoch": 5.29,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33081698417663574,
	"eval_runtime": 500.5738,
	"eval_samples_per_second": 49.631,
	"eval_steps_per_second": 24.816,
	"step": 2100
	},
	{
	"epoch": 5.55,
	"learning_rate": 0.00029629629629629624,
	"loss": 0.3277,
	"step": 2200
	},
	{
	"epoch": 5.55,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.330895334482193,
	"eval_runtime": 500.5595,
	"eval_samples_per_second": 49.632,
	"eval_steps_per_second": 24.816,
	"step": 2200
	},
	{
	"epoch": 5.8,
	"learning_rate": 0.0002946127946127946,
	"loss": 0.3294,
	"step": 2300
	},
	{
	"epoch": 5.8,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3312866687774658,
	"eval_runtime": 500.6862,
	"eval_samples_per_second": 49.62,
	"eval_steps_per_second": 24.81,
	"step": 2300
	},
	{
	"epoch": 6.05,
	"learning_rate": 0.0002929292929292929,
	"loss": 0.3315,
	"step": 2400
	},
	{
	"epoch": 6.05,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33599570393562317,
	"eval_runtime": 500.6176,
	"eval_samples_per_second": 49.627,
	"eval_steps_per_second": 24.813,
	"step": 2400
	},
	{
	"epoch": 6.3,
	"learning_rate": 0.00029124579124579125,
	"loss": 0.3397,
	"step": 2500
	},
	{
	"epoch": 6.3,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33067843317985535,
	"eval_runtime": 500.7157,
	"eval_samples_per_second": 49.617,
	"eval_steps_per_second": 24.808,
	"step": 2500
	},
	{
	"epoch": 6.55,
	"learning_rate": 0.00028956228956228955,
	"loss": 0.3318,
	"step": 2600
	},
	{
	"epoch": 6.55,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3359489440917969,
	"eval_runtime": 500.805,
	"eval_samples_per_second": 49.608,
	"eval_steps_per_second": 24.804,
	"step": 2600
	},
	{
	"epoch": 6.81,
	"learning_rate": 0.00028787878787878786,
	"loss": 0.3312,
	"step": 2700
	},
	{
	"epoch": 6.81,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3307555615901947,
	"eval_runtime": 500.6263,
	"eval_samples_per_second": 49.626,
	"eval_steps_per_second": 24.813,
	"step": 2700
	},
	{
	"epoch": 7.06,
	"learning_rate": 0.00028619528619528616,
	"loss": 0.3155,
	"step": 2800
	},
	{
	"epoch": 7.06,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33172452449798584,
	"eval_runtime": 500.7242,
	"eval_samples_per_second": 49.616,
	"eval_steps_per_second": 24.808,
	"step": 2800
	},
	{
	"epoch": 7.31,
	"learning_rate": 0.0002845117845117845,
	"loss": 0.3304,
	"step": 2900
	},
	{
	"epoch": 7.31,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33618223667144775,
	"eval_runtime": 500.5229,
	"eval_samples_per_second": 49.636,
	"eval_steps_per_second": 24.818,
	"step": 2900
	},
	{
	"epoch": 7.56,
	"learning_rate": 0.0002828282828282828,
	"loss": 0.338,
	"step": 3000
	},
	{
	"epoch": 7.56,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3341616988182068,
	"eval_runtime": 500.7918,
	"eval_samples_per_second": 49.609,
	"eval_steps_per_second": 24.805,
	"step": 3000
	},
	{
	"epoch": 7.81,
	"learning_rate": 0.0002811447811447811,
	"loss": 0.3241,
	"step": 3100
	},
	{
	"epoch": 7.81,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.330985426902771,
	"eval_runtime": 500.924,
	"eval_samples_per_second": 49.596,
	"eval_steps_per_second": 24.798,
	"step": 3100
	},
	{
	"epoch": 8.07,
	"learning_rate": 0.0002794612794612794,
	"loss": 0.3325,
	"step": 3200
	},
	{
	"epoch": 8.07,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33258649706840515,
	"eval_runtime": 500.7775,
	"eval_samples_per_second": 49.611,
	"eval_steps_per_second": 24.805,
	"step": 3200
	},
	{
	"epoch": 8.32,
	"learning_rate": 0.0002777777777777778,
	"loss": 0.3202,
	"step": 3300
	},
	{
	"epoch": 8.32,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3345409035682678,
	"eval_runtime": 501.0057,
	"eval_samples_per_second": 49.588,
	"eval_steps_per_second": 24.794,
	"step": 3300
	},
	{
	"epoch": 8.57,
	"learning_rate": 0.0002760942760942761,
	"loss": 0.3315,
	"step": 3400
	},
	{
	"epoch": 8.57,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3335334360599518,
	"eval_runtime": 500.8188,
	"eval_samples_per_second": 49.607,
	"eval_steps_per_second": 24.803,
	"step": 3400
	},
	{
	"epoch": 8.82,
	"learning_rate": 0.0002744107744107744,
	"loss": 0.3288,
	"step": 3500
	},
	{
	"epoch": 8.82,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33116644620895386,
	"eval_runtime": 501.0568,
	"eval_samples_per_second": 49.583,
	"eval_steps_per_second": 24.792,
	"step": 3500
	},
	{
	"epoch": 9.07,
	"learning_rate": 0.0002727272727272727,
	"loss": 0.3371,
	"step": 3600
	},
	{
	"epoch": 9.07,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.34014323353767395,
	"eval_runtime": 500.7918,
	"eval_samples_per_second": 49.609,
	"eval_steps_per_second": 24.805,
	"step": 3600
	},
	{
	"epoch": 9.33,
	"learning_rate": 0.00027104377104377104,
	"loss": 0.3409,
	"step": 3700
	},
	{
	"epoch": 9.33,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33300086855888367,
	"eval_runtime": 500.8108,
	"eval_samples_per_second": 49.608,
	"eval_steps_per_second": 24.804,
	"step": 3700
	},
	{
	"epoch": 9.58,
	"learning_rate": 0.00026936026936026934,
	"loss": 0.3236,
	"step": 3800
	},
	{
	"epoch": 9.58,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3329709768295288,
	"eval_runtime": 500.7254,
	"eval_samples_per_second": 49.616,
	"eval_steps_per_second": 24.808,
	"step": 3800
	},
	{
	"epoch": 9.83,
	"learning_rate": 0.00026767676767676764,
	"loss": 0.3224,
	"step": 3900
	},
	{
	"epoch": 9.83,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3320678770542145,
	"eval_runtime": 500.9946,
	"eval_samples_per_second": 49.589,
	"eval_steps_per_second": 24.795,
	"step": 3900
	},
	{
	"epoch": 10.08,
	"learning_rate": 0.00026599326599326595,
	"loss": 0.3439,
	"step": 4000
	},
	{
	"epoch": 10.08,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33262181282043457,
	"eval_runtime": 501.0278,
	"eval_samples_per_second": 49.586,
	"eval_steps_per_second": 24.793,
	"step": 4000
	},
	{
	"epoch": 10.33,
	"learning_rate": 0.0002643097643097643,
	"loss": 0.3382,
	"step": 4100
	},
	{
	"epoch": 10.33,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3310418426990509,
	"eval_runtime": 501.0043,
	"eval_samples_per_second": 49.588,
	"eval_steps_per_second": 24.794,
	"step": 4100
	},
	{
	"epoch": 10.59,
	"learning_rate": 0.0002626262626262626,
	"loss": 0.3307,
	"step": 4200
	},
	{
	"epoch": 10.59,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33820316195487976,
	"eval_runtime": 501.0192,
	"eval_samples_per_second": 49.587,
	"eval_steps_per_second": 24.793,
	"step": 4200
	},
	{
	"epoch": 10.84,
	"learning_rate": 0.0002609427609427609,
	"loss": 0.3231,
	"step": 4300
	},
	{
	"epoch": 10.84,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3324846625328064,
	"eval_runtime": 500.6054,
	"eval_samples_per_second": 49.628,
	"eval_steps_per_second": 24.814,
	"step": 4300
	},
	{
	"epoch": 11.09,
	"learning_rate": 0.0002592592592592592,
	"loss": 0.3095,
	"step": 4400
	},
	{
	"epoch": 11.09,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3348234295845032,
	"eval_runtime": 500.6559,
	"eval_samples_per_second": 49.623,
	"eval_steps_per_second": 24.811,
	"step": 4400
	},
	{
	"epoch": 11.34,
	"learning_rate": 0.00025757575757575756,
	"loss": 0.3442,
	"step": 4500
	},
	{
	"epoch": 11.34,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33274412155151367,
	"eval_runtime": 501.0421,
	"eval_samples_per_second": 49.585,
	"eval_steps_per_second": 24.792,
	"step": 4500
	},
	{
	"epoch": 11.59,
	"learning_rate": 0.00025589225589225587,
	"loss": 0.3269,
	"step": 4600
	},
	{
	"epoch": 11.59,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33261528611183167,
	"eval_runtime": 500.8659,
	"eval_samples_per_second": 49.602,
	"eval_steps_per_second": 24.801,
	"step": 4600
	},
	{
	"epoch": 11.85,
	"learning_rate": 0.00025420875420875417,
	"loss": 0.3323,
	"step": 4700
	},
	{
	"epoch": 11.85,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3308444619178772,
	"eval_runtime": 501.0609,
	"eval_samples_per_second": 49.583,
	"eval_steps_per_second": 24.791,
	"step": 4700
	},
	{
	"epoch": 12.1,
	"learning_rate": 0.0002525252525252525,
	"loss": 0.3313,
	"step": 4800
	},
	{
	"epoch": 12.1,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3308044970035553,
	"eval_runtime": 500.8061,
	"eval_samples_per_second": 49.608,
	"eval_steps_per_second": 24.804,
	"step": 4800
	},
	{
	"epoch": 12.35,
	"learning_rate": 0.0002508417508417508,
	"loss": 0.3283,
	"step": 4900
	},
	{
	"epoch": 12.35,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3314284384250641,
	"eval_runtime": 500.7554,
	"eval_samples_per_second": 49.613,
	"eval_steps_per_second": 24.807,
	"step": 4900
	},
	{
	"epoch": 12.6,
	"learning_rate": 0.00024915824915824913,
	"loss": 0.3331,
	"step": 5000
	},
	{
	"epoch": 12.6,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3306741416454315,
	"eval_runtime": 500.9128,
	"eval_samples_per_second": 49.597,
	"eval_steps_per_second": 24.799,
	"step": 5000
	},
	{
	"epoch": 12.85,
	"learning_rate": 0.0002474747474747475,
	"loss": 0.3317,
	"step": 5100
	},
	{
	"epoch": 12.85,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3343793749809265,
	"eval_runtime": 500.7387,
	"eval_samples_per_second": 49.615,
	"eval_steps_per_second": 24.807,
	"step": 5100
	},
	{
	"epoch": 13.11,
	"learning_rate": 0.0002457912457912458,
	"loss": 0.3283,
	"step": 5200
	},
	{
	"epoch": 13.11,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33199575543403625,
	"eval_runtime": 500.8527,
	"eval_samples_per_second": 49.603,
	"eval_steps_per_second": 24.802,
	"step": 5200
	},
	{
	"epoch": 13.36,
	"learning_rate": 0.00024410774410774406,
	"loss": 0.3263,
	"step": 5300
	},
	{
	"epoch": 13.36,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33114317059516907,
	"eval_runtime": 500.8605,
	"eval_samples_per_second": 49.603,
	"eval_steps_per_second": 24.801,
	"step": 5300
	},
	{
	"epoch": 13.61,
	"learning_rate": 0.0002424242424242424,
	"loss": 0.3421,
	"step": 5400
	},
	{
	"epoch": 13.61,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3306863009929657,
	"eval_runtime": 500.9253,
	"eval_samples_per_second": 49.596,
	"eval_steps_per_second": 24.798,
	"step": 5400
	},
	{
	"epoch": 13.86,
	"learning_rate": 0.00024074074074074072,
	"loss": 0.3164,
	"step": 5500
	},
	{
	"epoch": 13.86,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3318192958831787,
	"eval_runtime": 500.4762,
	"eval_samples_per_second": 49.641,
	"eval_steps_per_second": 24.82,
	"step": 5500
	},
	{
	"epoch": 14.11,
	"learning_rate": 0.00023905723905723905,
	"loss": 0.3315,
	"step": 5600
	},
	{
	"epoch": 14.11,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3335217535495758,
	"eval_runtime": 500.848,
	"eval_samples_per_second": 49.604,
	"eval_steps_per_second": 24.802,
	"step": 5600
	},
	{
	"epoch": 14.37,
	"learning_rate": 0.00023737373737373732,
	"loss": 0.3415,
	"step": 5700
	},
	{
	"epoch": 14.37,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3314845860004425,
	"eval_runtime": 500.8633,
	"eval_samples_per_second": 49.602,
	"eval_steps_per_second": 24.801,
	"step": 5700
	},
	{
	"epoch": 14.62,
	"learning_rate": 0.00023569023569023565,
	"loss": 0.3325,
	"step": 5800
	},
	{
	"epoch": 14.62,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33067190647125244,
	"eval_runtime": 500.8182,
	"eval_samples_per_second": 49.607,
	"eval_steps_per_second": 24.803,
	"step": 5800
	},
	{
	"epoch": 14.87,
	"learning_rate": 0.00023400673400673398,
	"loss": 0.3264,
	"step": 5900
	},
	{
	"epoch": 14.87,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33295896649360657,
	"eval_runtime": 500.9198,
	"eval_samples_per_second": 49.597,
	"eval_steps_per_second": 24.798,
	"step": 5900
	},
	{
	"epoch": 15.12,
	"learning_rate": 0.0002323232323232323,
	"loss": 0.3223,
	"step": 6000
	},
	{
	"epoch": 15.12,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3306836187839508,
	"eval_runtime": 500.9444,
	"eval_samples_per_second": 49.594,
	"eval_steps_per_second": 24.797,
	"step": 6000
	},
	{
	"epoch": 15.37,
	"learning_rate": 0.00023063973063973064,
	"loss": 0.3289,
	"step": 6100
	},
	{
	"epoch": 15.37,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3328978717327118,
	"eval_runtime": 500.8768,
	"eval_samples_per_second": 49.601,
	"eval_steps_per_second": 24.801,
	"step": 6100
	},
	{
	"epoch": 15.63,
	"learning_rate": 0.00022895622895622892,
	"loss": 0.3353,
	"step": 6200
	},
	{
	"epoch": 15.63,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33112406730651855,
	"eval_runtime": 500.9115,
	"eval_samples_per_second": 49.598,
	"eval_steps_per_second": 24.799,
	"step": 6200
	},
	{
	"epoch": 15.88,
	"learning_rate": 0.00022727272727272725,
	"loss": 0.3246,
	"step": 6300
	},
	{
	"epoch": 15.88,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3310993015766144,
	"eval_runtime": 501.1149,
	"eval_samples_per_second": 49.577,
	"eval_steps_per_second": 24.789,
	"step": 6300
	},
	{
	"epoch": 16.13,
	"learning_rate": 0.00022558922558922557,
	"loss": 0.3425,
	"step": 6400
	},
	{
	"epoch": 16.13,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.330674409866333,
	"eval_runtime": 500.85,
	"eval_samples_per_second": 49.604,
	"eval_steps_per_second": 24.802,
	"step": 6400
	},
	{
	"epoch": 16.38,
	"learning_rate": 0.0002239057239057239,
	"loss": 0.331,
	"step": 6500
	},
	{
	"epoch": 16.38,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3306954503059387,
	"eval_runtime": 501.1853,
	"eval_samples_per_second": 49.57,
	"eval_steps_per_second": 24.785,
	"step": 6500
	},
	{
	"epoch": 16.64,
	"learning_rate": 0.00022222222222222218,
	"loss": 0.3293,
	"step": 6600
	},
	{
	"epoch": 16.64,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33531516790390015,
	"eval_runtime": 500.9658,
	"eval_samples_per_second": 49.592,
	"eval_steps_per_second": 24.796,
	"step": 6600
	},
	{
	"epoch": 16.89,
	"learning_rate": 0.0002205387205387205,
	"loss": 0.3249,
	"step": 6700
	},
	{
	"epoch": 16.89,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3339368402957916,
	"eval_runtime": 500.8138,
	"eval_samples_per_second": 49.607,
	"eval_steps_per_second": 24.804,
	"step": 6700
	},
	{
	"epoch": 17.14,
	"learning_rate": 0.00021885521885521884,
	"loss": 0.3214,
	"step": 6800
	},
	{
	"epoch": 17.14,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3337734639644623,
	"eval_runtime": 500.9586,
	"eval_samples_per_second": 49.593,
	"eval_steps_per_second": 24.796,
	"step": 6800
	},
	{
	"epoch": 17.39,
	"learning_rate": 0.00021717171717171717,
	"loss": 0.3259,
	"step": 6900
	},
	{
	"epoch": 17.39,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3327140212059021,
	"eval_runtime": 501.0122,
	"eval_samples_per_second": 49.588,
	"eval_steps_per_second": 24.794,
	"step": 6900
	},
	{
	"epoch": 17.64,
	"learning_rate": 0.00021548821548821544,
	"loss": 0.3408,
	"step": 7000
	},
	{
	"epoch": 17.64,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33182209730148315,
	"eval_runtime": 500.9279,
	"eval_samples_per_second": 49.596,
	"eval_steps_per_second": 24.798,
	"step": 7000
	},
	{
	"epoch": 17.9,
	"learning_rate": 0.00021380471380471377,
	"loss": 0.3258,
	"step": 7100
	},
	{
	"epoch": 17.9,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33183717727661133,
	"eval_runtime": 501.2678,
	"eval_samples_per_second": 49.562,
	"eval_steps_per_second": 24.781,
	"step": 7100
	},
	{
	"epoch": 18.15,
	"learning_rate": 0.0002121212121212121,
	"loss": 0.3299,
	"step": 7200
	},
	{
	"epoch": 18.15,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33080849051475525,
	"eval_runtime": 501.2555,
	"eval_samples_per_second": 49.564,
	"eval_steps_per_second": 24.782,
	"step": 7200
	},
	{
	"epoch": 18.4,
	"learning_rate": 0.00021043771043771043,
	"loss": 0.327,
	"step": 7300
	},
	{
	"epoch": 18.4,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3371123671531677,
	"eval_runtime": 500.9892,
	"eval_samples_per_second": 49.59,
	"eval_steps_per_second": 24.795,
	"step": 7300
	},
	{
	"epoch": 18.65,
	"learning_rate": 0.00020875420875420876,
	"loss": 0.3317,
	"step": 7400
	},
	{
	"epoch": 18.65,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3307543694972992,
	"eval_runtime": 500.9046,
	"eval_samples_per_second": 49.598,
	"eval_steps_per_second": 24.799,
	"step": 7400
	},
	{
	"epoch": 18.9,
	"learning_rate": 0.00020707070707070703,
	"loss": 0.3291,
	"step": 7500
	},
	{
	"epoch": 18.9,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33100253343582153,
	"eval_runtime": 500.936,
	"eval_samples_per_second": 49.595,
	"eval_steps_per_second": 24.798,
	"step": 7500
	},
	{
	"epoch": 19.16,
	"learning_rate": 0.00020538720538720536,
	"loss": 0.3263,
	"step": 7600
	},
	{
	"epoch": 19.16,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33248230814933777,
	"eval_runtime": 500.8588,
	"eval_samples_per_second": 49.603,
	"eval_steps_per_second": 24.801,
	"step": 7600
	},
	{
	"epoch": 19.41,
	"learning_rate": 0.0002037037037037037,
	"loss": 0.3223,
	"step": 7700
	},
	{
	"epoch": 19.41,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33463332056999207,
	"eval_runtime": 500.8344,
	"eval_samples_per_second": 49.605,
	"eval_steps_per_second": 24.803,
	"step": 7700
	},
	{
	"epoch": 19.66,
	"learning_rate": 0.00020202020202020202,
	"loss": 0.3403,
	"step": 7800
	},
	{
	"epoch": 19.66,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3315812647342682,
	"eval_runtime": 500.8929,
	"eval_samples_per_second": 49.599,
	"eval_steps_per_second": 24.8,
	"step": 7800
	},
	{
	"epoch": 19.91,
	"learning_rate": 0.0002003367003367003,
	"loss": 0.3265,
	"step": 7900
	},
	{
	"epoch": 19.91,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3309071660041809,
	"eval_runtime": 500.8065,
	"eval_samples_per_second": 49.608,
	"eval_steps_per_second": 24.804,
	"step": 7900
	},
	{
	"epoch": 20.16,
	"learning_rate": 0.00019865319865319862,
	"loss": 0.33,
	"step": 8000
	},
	{
	"epoch": 20.16,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3318468928337097,
	"eval_runtime": 501.0869,
	"eval_samples_per_second": 49.58,
	"eval_steps_per_second": 24.79,
	"step": 8000
	},
	{
	"epoch": 20.42,
	"learning_rate": 0.00019696969696969695,
	"loss": 0.3488,
	"step": 8100
	},
	{
	"epoch": 20.42,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33127933740615845,
	"eval_runtime": 500.8956,
	"eval_samples_per_second": 49.599,
	"eval_steps_per_second": 24.8,
	"step": 8100
	},
	{
	"epoch": 20.67,
	"learning_rate": 0.00019528619528619528,
	"loss": 0.3293,
	"step": 8200
	},
	{
	"epoch": 20.67,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33354687690734863,
	"eval_runtime": 501.2059,
	"eval_samples_per_second": 49.568,
	"eval_steps_per_second": 24.784,
	"step": 8200
	},
	{
	"epoch": 20.92,
	"learning_rate": 0.00019360269360269356,
	"loss": 0.3095,
	"step": 8300
	},
	{
	"epoch": 20.92,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33559244871139526,
	"eval_runtime": 501.1442,
	"eval_samples_per_second": 49.575,
	"eval_steps_per_second": 24.787,
	"step": 8300
	},
	{
	"epoch": 21.17,
	"learning_rate": 0.0001919191919191919,
	"loss": 0.3366,
	"step": 8400
	},
	{
	"epoch": 21.17,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3331533968448639,
	"eval_runtime": 501.0445,
	"eval_samples_per_second": 49.584,
	"eval_steps_per_second": 24.792,
	"step": 8400
	},
	{
	"epoch": 21.42,
	"learning_rate": 0.00019023569023569022,
	"loss": 0.317,
	"step": 8500
	},
	{
	"epoch": 21.42,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3337852358818054,
	"eval_runtime": 501.2024,
	"eval_samples_per_second": 49.569,
	"eval_steps_per_second": 24.784,
	"step": 8500
	},
	{
	"epoch": 21.68,
	"learning_rate": 0.00018855218855218854,
	"loss": 0.3299,
	"step": 8600
	},
	{
	"epoch": 21.68,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3308347165584564,
	"eval_runtime": 501.0,
	"eval_samples_per_second": 49.589,
	"eval_steps_per_second": 24.794,
	"step": 8600
	},
	{
	"epoch": 21.93,
	"learning_rate": 0.00018686868686868687,
	"loss": 0.3434,
	"step": 8700
	},
	{
	"epoch": 21.93,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.330965131521225,
	"eval_runtime": 501.1751,
	"eval_samples_per_second": 49.571,
	"eval_steps_per_second": 24.786,
	"step": 8700
	},
	{
	"epoch": 22.18,
	"learning_rate": 0.00018518518518518515,
	"loss": 0.3208,
	"step": 8800
	},
	{
	"epoch": 22.18,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3308819830417633,
	"eval_runtime": 501.189,
	"eval_samples_per_second": 49.57,
	"eval_steps_per_second": 24.785,
	"step": 8800
	},
	{
	"epoch": 22.43,
	"learning_rate": 0.00018350168350168348,
	"loss": 0.3351,
	"step": 8900
	},
	{
	"epoch": 22.43,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33238929510116577,
	"eval_runtime": 501.2428,
	"eval_samples_per_second": 49.565,
	"eval_steps_per_second": 24.782,
	"step": 8900
	},
	{
	"epoch": 22.68,
	"learning_rate": 0.0001818181818181818,
	"loss": 0.3301,
	"step": 9000
	},
	{
	"epoch": 22.68,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3308260440826416,
	"eval_runtime": 500.8427,
	"eval_samples_per_second": 49.604,
	"eval_steps_per_second": 24.802,
	"step": 9000
	},
	{
	"epoch": 22.94,
	"learning_rate": 0.00018013468013468014,
	"loss": 0.3196,
	"step": 9100
	},
	{
	"epoch": 22.94,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3329552710056305,
	"eval_runtime": 501.1009,
	"eval_samples_per_second": 49.579,
	"eval_steps_per_second": 24.789,
	"step": 9100
	},
	{
	"epoch": 23.19,
	"learning_rate": 0.0001784511784511784,
	"loss": 0.3339,
	"step": 9200
	},
	{
	"epoch": 23.19,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33333924412727356,
	"eval_runtime": 500.8988,
	"eval_samples_per_second": 49.599,
	"eval_steps_per_second": 24.799,
	"step": 9200
	},
	{
	"epoch": 23.44,
	"learning_rate": 0.00017676767676767674,
	"loss": 0.3249,
	"step": 9300
	},
	{
	"epoch": 23.44,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3307563364505768,
	"eval_runtime": 501.0394,
	"eval_samples_per_second": 49.585,
	"eval_steps_per_second": 24.792,
	"step": 9300
	},
	{
	"epoch": 23.69,
	"learning_rate": 0.00017508417508417507,
	"loss": 0.3247,
	"step": 9400
	},
	{
	"epoch": 23.69,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3338105082511902,
	"eval_runtime": 500.7662,
	"eval_samples_per_second": 49.612,
	"eval_steps_per_second": 24.806,
	"step": 9400
	},
	{
	"epoch": 23.94,
	"learning_rate": 0.0001734006734006734,
	"loss": 0.3369,
	"step": 9500
	},
	{
	"epoch": 23.94,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3312574028968811,
	"eval_runtime": 501.3028,
	"eval_samples_per_second": 49.559,
	"eval_steps_per_second": 24.779,
	"step": 9500
	},
	{
	"epoch": 24.2,
	"learning_rate": 0.00017171717171717167,
	"loss": 0.3291,
	"step": 9600
	},
	{
	"epoch": 24.2,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3320288062095642,
	"eval_runtime": 501.3419,
	"eval_samples_per_second": 49.555,
	"eval_steps_per_second": 24.777,
	"step": 9600
	},
	{
	"epoch": 24.45,
	"learning_rate": 0.00017003367003367,
	"loss": 0.3307,
	"step": 9700
	},
	{
	"epoch": 24.45,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33087393641471863,
	"eval_runtime": 501.1809,
	"eval_samples_per_second": 49.571,
	"eval_steps_per_second": 24.785,
	"step": 9700
	},
	{
	"epoch": 24.7,
	"learning_rate": 0.00016835016835016833,
	"loss": 0.3328,
	"step": 9800
	},
	{
	"epoch": 24.7,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33073562383651733,
	"eval_runtime": 500.8708,
	"eval_samples_per_second": 49.602,
	"eval_steps_per_second": 24.801,
	"step": 9800
	},
	{
	"epoch": 24.95,
	"learning_rate": 0.00016666666666666666,
	"loss": 0.3277,
	"step": 9900
	},
	{
	"epoch": 24.95,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3341946601867676,
	"eval_runtime": 501.1287,
	"eval_samples_per_second": 49.576,
	"eval_steps_per_second": 24.788,
	"step": 9900
	},
	{
	"epoch": 25.2,
	"learning_rate": 0.000164983164983165,
	"loss": 0.3278,
	"step": 10000
	},
	{
	"epoch": 25.2,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3309917449951172,
	"eval_runtime": 500.9142,
	"eval_samples_per_second": 49.597,
	"eval_steps_per_second": 24.799,
	"step": 10000
	},
	{
	"epoch": 25.46,
	"learning_rate": 0.00016329966329966327,
	"loss": 0.3197,
	"step": 10100
	},
	{
	"epoch": 25.46,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3348841965198517,
	"eval_runtime": 501.1589,
	"eval_samples_per_second": 49.573,
	"eval_steps_per_second": 24.787,
	"step": 10100
	},
	{
	"epoch": 25.71,
	"learning_rate": 0.0001616161616161616,
	"loss": 0.3273,
	"step": 10200
	},
	{
	"epoch": 25.71,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3321140706539154,
	"eval_runtime": 501.4344,
	"eval_samples_per_second": 49.546,
	"eval_steps_per_second": 24.773,
	"step": 10200
	},
	{
	"epoch": 25.96,
	"learning_rate": 0.00015993265993265992,
	"loss": 0.3345,
	"step": 10300
	},
	{
	"epoch": 25.96,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3312225043773651,
	"eval_runtime": 500.9045,
	"eval_samples_per_second": 49.598,
	"eval_steps_per_second": 24.799,
	"step": 10300
	},
	{
	"epoch": 26.21,
	"learning_rate": 0.00015824915824915825,
	"loss": 0.3351,
	"step": 10400
	},
	{
	"epoch": 26.21,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33248284459114075,
	"eval_runtime": 501.2052,
	"eval_samples_per_second": 49.569,
	"eval_steps_per_second": 24.784,
	"step": 10400
	},
	{
	"epoch": 26.47,
	"learning_rate": 0.00015656565656565653,
	"loss": 0.3144,
	"step": 10500
	},
	{
	"epoch": 26.47,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.334583580493927,
	"eval_runtime": 501.103,
	"eval_samples_per_second": 49.579,
	"eval_steps_per_second": 24.789,
	"step": 10500
	},
	{
	"epoch": 26.72,
	"learning_rate": 0.00015488215488215486,
	"loss": 0.3361,
	"step": 10600
	},
	{
	"epoch": 26.72,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33112606406211853,
	"eval_runtime": 500.6859,
	"eval_samples_per_second": 49.62,
	"eval_steps_per_second": 24.81,
	"step": 10600
	},
	{
	"epoch": 26.97,
	"learning_rate": 0.00015319865319865319,
	"loss": 0.3334,
	"step": 10700
	},
	{
	"epoch": 26.97,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3306848406791687,
	"eval_runtime": 500.81,
	"eval_samples_per_second": 49.608,
	"eval_steps_per_second": 24.804,
	"step": 10700
	},
	{
	"epoch": 27.22,
	"learning_rate": 0.00015151515151515152,
	"loss": 0.3287,
	"step": 10800
	},
	{
	"epoch": 27.22,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3373050093650818,
	"eval_runtime": 501.0133,
	"eval_samples_per_second": 49.588,
	"eval_steps_per_second": 24.794,
	"step": 10800
	},
	{
	"epoch": 27.47,
	"learning_rate": 0.00014983164983164982,
	"loss": 0.3374,
	"step": 10900
	},
	{
	"epoch": 27.47,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3306737244129181,
	"eval_runtime": 501.4272,
	"eval_samples_per_second": 49.547,
	"eval_steps_per_second": 24.773,
	"step": 10900
	},
	{
	"epoch": 27.73,
	"learning_rate": 0.00014814814814814812,
	"loss": 0.3302,
	"step": 11000
	},
	{
	"epoch": 27.73,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3306819200515747,
	"eval_runtime": 501.0901,
	"eval_samples_per_second": 49.58,
	"eval_steps_per_second": 24.79,
	"step": 11000
	},
	{
	"epoch": 27.98,
	"learning_rate": 0.00014646464646464645,
	"loss": 0.3245,
	"step": 11100
	},
	{
	"epoch": 27.98,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33153215050697327,
	"eval_runtime": 501.2107,
	"eval_samples_per_second": 49.568,
	"eval_steps_per_second": 24.784,
	"step": 11100
	},
	{
	"epoch": 28.23,
	"learning_rate": 0.00014478114478114478,
	"loss": 0.3353,
	"step": 11200
	},
	{
	"epoch": 28.23,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33351030945777893,
	"eval_runtime": 501.1769,
	"eval_samples_per_second": 49.571,
	"eval_steps_per_second": 24.786,
	"step": 11200
	},
	{
	"epoch": 28.48,
	"learning_rate": 0.00014309764309764308,
	"loss": 0.3191,
	"step": 11300
	},
	{
	"epoch": 28.48,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33356890082359314,
	"eval_runtime": 501.2908,
	"eval_samples_per_second": 49.56,
	"eval_steps_per_second": 24.78,
	"step": 11300
	},
	{
	"epoch": 28.73,
	"learning_rate": 0.0001414141414141414,
	"loss": 0.3226,
	"step": 11400
	},
	{
	"epoch": 28.73,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33081722259521484,
	"eval_runtime": 501.1297,
	"eval_samples_per_second": 49.576,
	"eval_steps_per_second": 24.788,
	"step": 11400
	},
	{
	"epoch": 28.99,
	"learning_rate": 0.0001397306397306397,
	"loss": 0.3384,
	"step": 11500
	},
	{
	"epoch": 28.99,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3321709930896759,
	"eval_runtime": 501.2824,
	"eval_samples_per_second": 49.561,
	"eval_steps_per_second": 24.78,
	"step": 11500
	},
	{
	"epoch": 29.24,
	"learning_rate": 0.00013804713804713804,
	"loss": 0.3368,
	"step": 11600
	},
	{
	"epoch": 29.24,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3336506485939026,
	"eval_runtime": 500.9493,
	"eval_samples_per_second": 49.594,
	"eval_steps_per_second": 24.797,
	"step": 11600
	},
	{
	"epoch": 29.49,
	"learning_rate": 0.00013636363636363634,
	"loss": 0.3224,
	"step": 11700
	},
	{
	"epoch": 29.49,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3331962823867798,
	"eval_runtime": 501.3861,
	"eval_samples_per_second": 49.551,
	"eval_steps_per_second": 24.775,
	"step": 11700
	},
	{
	"epoch": 29.74,
	"learning_rate": 0.00013468013468013467,
	"loss": 0.3224,
	"step": 11800
	},
	{
	"epoch": 29.74,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3318473696708679,
	"eval_runtime": 501.3052,
	"eval_samples_per_second": 49.559,
	"eval_steps_per_second": 24.779,
	"step": 11800
	},
	{
	"epoch": 29.99,
	"learning_rate": 0.00013299663299663297,
	"loss": 0.3363,
	"step": 11900
	},
	{
	"epoch": 29.99,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3309670388698578,
	"eval_runtime": 501.4331,
	"eval_samples_per_second": 49.546,
	"eval_steps_per_second": 24.773,
	"step": 11900
	},
	{
	"epoch": 30.25,
	"learning_rate": 0.0001313131313131313,
	"loss": 0.327,
	"step": 12000
	},
	{
	"epoch": 30.25,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3306976854801178,
	"eval_runtime": 501.4726,
	"eval_samples_per_second": 49.542,
	"eval_steps_per_second": 24.771,
	"step": 12000
	},
	{
	"epoch": 30.5,
	"learning_rate": 0.0001296296296296296,
	"loss": 0.3291,
	"step": 12100
	},
	{
	"epoch": 30.5,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3306950628757477,
	"eval_runtime": 501.0845,
	"eval_samples_per_second": 49.58,
	"eval_steps_per_second": 24.79,
	"step": 12100
	},
	{
	"epoch": 30.75,
	"learning_rate": 0.00012794612794612793,
	"loss": 0.3369,
	"step": 12200
	},
	{
	"epoch": 30.75,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3321588933467865,
	"eval_runtime": 501.0681,
	"eval_samples_per_second": 49.582,
	"eval_steps_per_second": 24.791,
	"step": 12200
	},
	{
	"epoch": 31.0,
	"learning_rate": 0.00012626262626262626,
	"loss": 0.3211,
	"step": 12300
	},
	{
	"epoch": 31.0,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3328503370285034,
	"eval_runtime": 501.3433,
	"eval_samples_per_second": 49.555,
	"eval_steps_per_second": 24.777,
	"step": 12300
	},
	{
	"epoch": 31.25,
	"learning_rate": 0.00012457912457912456,
	"loss": 0.329,
	"step": 12400
	},
	{
	"epoch": 31.25,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33213621377944946,
	"eval_runtime": 501.089,
	"eval_samples_per_second": 49.58,
	"eval_steps_per_second": 24.79,
	"step": 12400
	},
	{
	"epoch": 31.51,
	"learning_rate": 0.0001228956228956229,
	"loss": 0.3206,
	"step": 12500
	},
	{
	"epoch": 31.51,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33089062571525574,
	"eval_runtime": 501.0382,
	"eval_samples_per_second": 49.585,
	"eval_steps_per_second": 24.793,
	"step": 12500
	},
	{
	"epoch": 31.76,
	"learning_rate": 0.0001212121212121212,
	"loss": 0.3339,
	"step": 12600
	},
	{
	"epoch": 31.76,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3331972658634186,
	"eval_runtime": 501.242,
	"eval_samples_per_second": 49.565,
	"eval_steps_per_second": 24.782,
	"step": 12600
	},
	{
	"epoch": 32.01,
	"learning_rate": 0.00011952861952861952,
	"loss": 0.3323,
	"step": 12700
	},
	{
	"epoch": 32.01,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3316064476966858,
	"eval_runtime": 501.0626,
	"eval_samples_per_second": 49.583,
	"eval_steps_per_second": 24.791,
	"step": 12700
	},
	{
	"epoch": 32.26,
	"learning_rate": 0.00011784511784511783,
	"loss": 0.3273,
	"step": 12800
	},
	{
	"epoch": 32.26,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3323478400707245,
	"eval_runtime": 501.4098,
	"eval_samples_per_second": 49.548,
	"eval_steps_per_second": 24.774,
	"step": 12800
	},
	{
	"epoch": 32.51,
	"learning_rate": 0.00011616161616161616,
	"loss": 0.3362,
	"step": 12900
	},
	{
	"epoch": 32.51,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33072328567504883,
	"eval_runtime": 501.8013,
	"eval_samples_per_second": 49.51,
	"eval_steps_per_second": 24.755,
	"step": 12900
	},
	{
	"epoch": 32.77,
	"learning_rate": 0.00011447811447811446,
	"loss": 0.3387,
	"step": 13000
	},
	{
	"epoch": 32.77,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3308790922164917,
	"eval_runtime": 501.2768,
	"eval_samples_per_second": 49.561,
	"eval_steps_per_second": 24.781,
	"step": 13000
	},
	{
	"epoch": 33.02,
	"learning_rate": 0.00011279461279461279,
	"loss": 0.3173,
	"step": 13100
	},
	{
	"epoch": 33.02,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33112308382987976,
	"eval_runtime": 501.2827,
	"eval_samples_per_second": 49.561,
	"eval_steps_per_second": 24.78,
	"step": 13100
	},
	{
	"epoch": 33.27,
	"learning_rate": 0.00011111111111111109,
	"loss": 0.3291,
	"step": 13200
	},
	{
	"epoch": 33.27,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33085396885871887,
	"eval_runtime": 501.2449,
	"eval_samples_per_second": 49.565,
	"eval_steps_per_second": 24.782,
	"step": 13200
	},
	{
	"epoch": 33.52,
	"learning_rate": 0.00010942760942760942,
	"loss": 0.3316,
	"step": 13300
	},
	{
	"epoch": 33.52,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33154767751693726,
	"eval_runtime": 501.0257,
	"eval_samples_per_second": 49.586,
	"eval_steps_per_second": 24.793,
	"step": 13300
	},
	{
	"epoch": 33.77,
	"learning_rate": 0.00010774410774410772,
	"loss": 0.3366,
	"step": 13400
	},
	{
	"epoch": 33.77,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33317822217941284,
	"eval_runtime": 501.0403,
	"eval_samples_per_second": 49.585,
	"eval_steps_per_second": 24.792,
	"step": 13400
	},
	{
	"epoch": 34.03,
	"learning_rate": 0.00010606060606060605,
	"loss": 0.3115,
	"step": 13500
	},
	{
	"epoch": 34.03,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3382599353790283,
	"eval_runtime": 500.7949,
	"eval_samples_per_second": 49.609,
	"eval_steps_per_second": 24.805,
	"step": 13500
	},
	{
	"epoch": 34.28,
	"learning_rate": 0.00010437710437710438,
	"loss": 0.3275,
	"step": 13600
	},
	{
	"epoch": 34.28,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.332431823015213,
	"eval_runtime": 500.933,
	"eval_samples_per_second": 49.595,
	"eval_steps_per_second": 24.798,
	"step": 13600
	},
	{
	"epoch": 34.53,
	"learning_rate": 0.00010269360269360268,
	"loss": 0.3373,
	"step": 13700
	},
	{
	"epoch": 34.53,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33150389790534973,
	"eval_runtime": 500.781,
	"eval_samples_per_second": 49.611,
	"eval_steps_per_second": 24.805,
	"step": 13700
	},
	{
	"epoch": 34.78,
	"learning_rate": 0.00010101010101010101,
	"loss": 0.3247,
	"step": 13800
	},
	{
	"epoch": 34.78,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3313423693180084,
	"eval_runtime": 501.1265,
	"eval_samples_per_second": 49.576,
	"eval_steps_per_second": 24.788,
	"step": 13800
	},
	{
	"epoch": 35.03,
	"learning_rate": 9.932659932659931e-05,
	"loss": 0.3349,
	"step": 13900
	},
	{
	"epoch": 35.03,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33250102400779724,
	"eval_runtime": 501.0936,
	"eval_samples_per_second": 49.58,
	"eval_steps_per_second": 24.79,
	"step": 13900
	},
	{
	"epoch": 35.29,
	"learning_rate": 9.764309764309764e-05,
	"loss": 0.3223,
	"step": 14000
	},
	{
	"epoch": 35.29,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33122116327285767,
	"eval_runtime": 500.9681,
	"eval_samples_per_second": 49.592,
	"eval_steps_per_second": 24.796,
	"step": 14000
	},
	{
	"epoch": 35.54,
	"learning_rate": 9.595959595959594e-05,
	"loss": 0.3321,
	"step": 14100
	},
	{
	"epoch": 35.54,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3307776153087616,
	"eval_runtime": 500.9865,
	"eval_samples_per_second": 49.59,
	"eval_steps_per_second": 24.795,
	"step": 14100
	},
	{
	"epoch": 35.79,
	"learning_rate": 9.427609427609427e-05,
	"loss": 0.3304,
	"step": 14200
	},
	{
	"epoch": 35.79,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3315562605857849,
	"eval_runtime": 500.788,
	"eval_samples_per_second": 49.61,
	"eval_steps_per_second": 24.805,
	"step": 14200
	},
	{
	"epoch": 36.04,
	"learning_rate": 9.259259259259257e-05,
	"loss": 0.3262,
	"step": 14300
	},
	{
	"epoch": 36.04,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33196473121643066,
	"eval_runtime": 501.0344,
	"eval_samples_per_second": 49.585,
	"eval_steps_per_second": 24.793,
	"step": 14300
	},
	{
	"epoch": 36.29,
	"learning_rate": 9.09090909090909e-05,
	"loss": 0.3239,
	"step": 14400
	},
	{
	"epoch": 36.29,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3316847085952759,
	"eval_runtime": 501.0629,
	"eval_samples_per_second": 49.583,
	"eval_steps_per_second": 24.791,
	"step": 14400
	},
	{
	"epoch": 36.55,
	"learning_rate": 8.92255892255892e-05,
	"loss": 0.3325,
	"step": 14500
	},
	{
	"epoch": 36.55,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3308143615722656,
	"eval_runtime": 500.8635,
	"eval_samples_per_second": 49.602,
	"eval_steps_per_second": 24.801,
	"step": 14500
	},
	{
	"epoch": 36.8,
	"learning_rate": 8.754208754208753e-05,
	"loss": 0.325,
	"step": 14600
	},
	{
	"epoch": 36.8,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3316170275211334,
	"eval_runtime": 500.7755,
	"eval_samples_per_second": 49.611,
	"eval_steps_per_second": 24.806,
	"step": 14600
	},
	{
	"epoch": 37.05,
	"learning_rate": 8.585858585858584e-05,
	"loss": 0.3416,
	"step": 14700
	},
	{
	"epoch": 37.05,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3310682773590088,
	"eval_runtime": 501.0155,
	"eval_samples_per_second": 49.587,
	"eval_steps_per_second": 24.794,
	"step": 14700
	},
	{
	"epoch": 37.3,
	"learning_rate": 8.417508417508417e-05,
	"loss": 0.3226,
	"step": 14800
	},
	{
	"epoch": 37.3,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33090585470199585,
	"eval_runtime": 500.9851,
	"eval_samples_per_second": 49.59,
	"eval_steps_per_second": 24.795,
	"step": 14800
	},
	{
	"epoch": 37.56,
	"learning_rate": 8.24915824915825e-05,
	"loss": 0.3286,
	"step": 14900
	},
	{
	"epoch": 37.56,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3306817412376404,
	"eval_runtime": 500.941,
	"eval_samples_per_second": 49.595,
	"eval_steps_per_second": 24.797,
	"step": 14900
	},
	{
	"epoch": 37.81,
	"learning_rate": 8.08080808080808e-05,
	"loss": 0.3284,
	"step": 15000
	},
	{
	"epoch": 37.81,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3312084972858429,
	"eval_runtime": 500.7822,
	"eval_samples_per_second": 49.61,
	"eval_steps_per_second": 24.805,
	"step": 15000
	},
	{
	"epoch": 38.06,
	"learning_rate": 7.912457912457913e-05,
	"loss": 0.3298,
	"step": 15100
	},
	{
	"epoch": 38.06,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33263882994651794,
	"eval_runtime": 500.7072,
	"eval_samples_per_second": 49.618,
	"eval_steps_per_second": 24.809,
	"step": 15100
	},
	{
	"epoch": 38.31,
	"learning_rate": 7.744107744107743e-05,
	"loss": 0.3383,
	"step": 15200
	},
	{
	"epoch": 38.31,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33113569021224976,
	"eval_runtime": 501.0449,
	"eval_samples_per_second": 49.584,
	"eval_steps_per_second": 24.792,
	"step": 15200
	},
	{
	"epoch": 38.56,
	"learning_rate": 7.575757575757576e-05,
	"loss": 0.3418,
	"step": 15300
	},
	{
	"epoch": 38.56,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33080732822418213,
	"eval_runtime": 501.1158,
	"eval_samples_per_second": 49.577,
	"eval_steps_per_second": 24.789,
	"step": 15300
	},
	{
	"epoch": 38.82,
	"learning_rate": 7.407407407407406e-05,
	"loss": 0.3123,
	"step": 15400
	},
	{
	"epoch": 38.82,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3311246931552887,
	"eval_runtime": 501.2192,
	"eval_samples_per_second": 49.567,
	"eval_steps_per_second": 24.784,
	"step": 15400
	},
	{
	"epoch": 39.07,
	"learning_rate": 7.239057239057239e-05,
	"loss": 0.3237,
	"step": 15500
	},
	{
	"epoch": 39.07,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3346453011035919,
	"eval_runtime": 501.3886,
	"eval_samples_per_second": 49.55,
	"eval_steps_per_second": 24.775,
	"step": 15500
	},
	{
	"epoch": 39.32,
	"learning_rate": 7.07070707070707e-05,
	"loss": 0.3261,
	"step": 15600
	},
	{
	"epoch": 39.32,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33250510692596436,
	"eval_runtime": 501.4416,
	"eval_samples_per_second": 49.545,
	"eval_steps_per_second": 24.773,
	"step": 15600
	},
	{
	"epoch": 39.57,
	"learning_rate": 6.902356902356902e-05,
	"loss": 0.3269,
	"step": 15700
	},
	{
	"epoch": 39.57,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33122241497039795,
	"eval_runtime": 501.3022,
	"eval_samples_per_second": 49.559,
	"eval_steps_per_second": 24.779,
	"step": 15700
	},
	{
	"epoch": 39.82,
	"learning_rate": 6.734006734006734e-05,
	"loss": 0.3267,
	"step": 15800
	},
	{
	"epoch": 39.82,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3319133520126343,
	"eval_runtime": 501.3262,
	"eval_samples_per_second": 49.557,
	"eval_steps_per_second": 24.778,
	"step": 15800
	},
	{
	"epoch": 40.08,
	"learning_rate": 6.565656565656565e-05,
	"loss": 0.3381,
	"step": 15900
	},
	{
	"epoch": 40.08,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33269181847572327,
	"eval_runtime": 500.8586,
	"eval_samples_per_second": 49.603,
	"eval_steps_per_second": 24.801,
	"step": 15900
	},
	{
	"epoch": 40.33,
	"learning_rate": 6.397306397306397e-05,
	"loss": 0.3238,
	"step": 16000
	},
	{
	"epoch": 40.33,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3325785994529724,
	"eval_runtime": 501.1224,
	"eval_samples_per_second": 49.577,
	"eval_steps_per_second": 24.788,
	"step": 16000
	},
	{
	"epoch": 40.58,
	"learning_rate": 6.228956228956228e-05,
	"loss": 0.3299,
	"step": 16100
	},
	{
	"epoch": 40.58,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33203861117362976,
	"eval_runtime": 500.8556,
	"eval_samples_per_second": 49.603,
	"eval_steps_per_second": 24.802,
	"step": 16100
	},
	{
	"epoch": 40.83,
	"learning_rate": 6.06060606060606e-05,
	"loss": 0.3385,
	"step": 16200
	},
	{
	"epoch": 40.83,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33086949586868286,
	"eval_runtime": 501.1006,
	"eval_samples_per_second": 49.579,
	"eval_steps_per_second": 24.789,
	"step": 16200
	},
	{
	"epoch": 41.08,
	"learning_rate": 5.8922558922558913e-05,
	"loss": 0.3268,
	"step": 16300
	},
	{
	"epoch": 41.08,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33224013447761536,
	"eval_runtime": 500.9055,
	"eval_samples_per_second": 49.598,
	"eval_steps_per_second": 24.799,
	"step": 16300
	},
	{
	"epoch": 41.34,
	"learning_rate": 5.723905723905723e-05,
	"loss": 0.3253,
	"step": 16400
	},
	{
	"epoch": 41.34,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3319920301437378,
	"eval_runtime": 501.2306,
	"eval_samples_per_second": 49.566,
	"eval_steps_per_second": 24.783,
	"step": 16400
	},
	{
	"epoch": 41.59,
	"learning_rate": 5.5555555555555545e-05,
	"loss": 0.3261,
	"step": 16500
	},
	{
	"epoch": 41.59,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33143314719200134,
	"eval_runtime": 501.0325,
	"eval_samples_per_second": 49.586,
	"eval_steps_per_second": 24.793,
	"step": 16500
	},
	{
	"epoch": 41.84,
	"learning_rate": 5.387205387205386e-05,
	"loss": 0.3362,
	"step": 16600
	},
	{
	"epoch": 41.84,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3324301838874817,
	"eval_runtime": 500.7987,
	"eval_samples_per_second": 49.609,
	"eval_steps_per_second": 24.804,
	"step": 16600
	},
	{
	"epoch": 42.09,
	"learning_rate": 5.218855218855219e-05,
	"loss": 0.3203,
	"step": 16700
	},
	{
	"epoch": 42.09,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3325912356376648,
	"eval_runtime": 500.6821,
	"eval_samples_per_second": 49.62,
	"eval_steps_per_second": 24.81,
	"step": 16700
	},
	{
	"epoch": 42.34,
	"learning_rate": 5.0505050505050505e-05,
	"loss": 0.325,
	"step": 16800
	},
	{
	"epoch": 42.34,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3323043882846832,
	"eval_runtime": 501.26,
	"eval_samples_per_second": 49.563,
	"eval_steps_per_second": 24.782,
	"step": 16800
	},
	{
	"epoch": 42.6,
	"learning_rate": 4.882154882154882e-05,
	"loss": 0.3172,
	"step": 16900
	},
	{
	"epoch": 42.6,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33261871337890625,
	"eval_runtime": 500.9553,
	"eval_samples_per_second": 49.593,
	"eval_steps_per_second": 24.797,
	"step": 16900
	},
	{
	"epoch": 42.85,
	"learning_rate": 4.7138047138047136e-05,
	"loss": 0.3361,
	"step": 17000
	},
	{
	"epoch": 42.85,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3307626247406006,
	"eval_runtime": 501.0928,
	"eval_samples_per_second": 49.58,
	"eval_steps_per_second": 24.79,
	"step": 17000
	},
	{
	"epoch": 43.1,
	"learning_rate": 4.545454545454545e-05,
	"loss": 0.3432,
	"step": 17100
	},
	{
	"epoch": 43.1,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3309696614742279,
	"eval_runtime": 501.4895,
	"eval_samples_per_second": 49.54,
	"eval_steps_per_second": 24.77,
	"step": 17100
	},
	{
	"epoch": 43.35,
	"learning_rate": 4.377104377104377e-05,
	"loss": 0.3396,
	"step": 17200
	},
	{
	"epoch": 43.35,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3312534689903259,
	"eval_runtime": 501.211,
	"eval_samples_per_second": 49.568,
	"eval_steps_per_second": 24.784,
	"step": 17200
	},
	{
	"epoch": 43.6,
	"learning_rate": 4.208754208754208e-05,
	"loss": 0.3163,
	"step": 17300
	},
	{
	"epoch": 43.6,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33276140689849854,
	"eval_runtime": 501.2264,
	"eval_samples_per_second": 49.566,
	"eval_steps_per_second": 24.783,
	"step": 17300
	},
	{
	"epoch": 43.86,
	"learning_rate": 4.04040404040404e-05,
	"loss": 0.3353,
	"step": 17400
	},
	{
	"epoch": 43.86,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3318198025226593,
	"eval_runtime": 501.088,
	"eval_samples_per_second": 49.58,
	"eval_steps_per_second": 24.79,
	"step": 17400
	},
	{
	"epoch": 44.11,
	"learning_rate": 3.8720538720538714e-05,
	"loss": 0.3299,
	"step": 17500
	},
	{
	"epoch": 44.11,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3316582441329956,
	"eval_runtime": 501.3763,
	"eval_samples_per_second": 49.552,
	"eval_steps_per_second": 24.776,
	"step": 17500
	},
	{
	"epoch": 44.36,
	"learning_rate": 3.703703703703703e-05,
	"loss": 0.3213,
	"step": 17600
	},
	{
	"epoch": 44.36,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33194538950920105,
	"eval_runtime": 501.7895,
	"eval_samples_per_second": 49.511,
	"eval_steps_per_second": 24.755,
	"step": 17600
	},
	{
	"epoch": 44.61,
	"learning_rate": 3.535353535353535e-05,
	"loss": 0.3253,
	"step": 17700
	},
	{
	"epoch": 44.61,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33288490772247314,
	"eval_runtime": 501.1283,
	"eval_samples_per_second": 49.576,
	"eval_steps_per_second": 24.788,
	"step": 17700
	},
	{
	"epoch": 44.86,
	"learning_rate": 3.367003367003367e-05,
	"loss": 0.3391,
	"step": 17800
	},
	{
	"epoch": 44.86,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33222696185112,
	"eval_runtime": 501.5052,
	"eval_samples_per_second": 49.539,
	"eval_steps_per_second": 24.769,
	"step": 17800
	},
	{
	"epoch": 45.12,
	"learning_rate": 3.198653198653198e-05,
	"loss": 0.3179,
	"step": 17900
	},
	{
	"epoch": 45.12,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.333011269569397,
	"eval_runtime": 500.7091,
	"eval_samples_per_second": 49.618,
	"eval_steps_per_second": 24.809,
	"step": 17900
	},
	{
	"epoch": 45.37,
	"learning_rate": 3.03030303030303e-05,
	"loss": 0.3348,
	"step": 18000
	},
	{
	"epoch": 45.37,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3321002721786499,
	"eval_runtime": 501.2516,
	"eval_samples_per_second": 49.564,
	"eval_steps_per_second": 24.782,
	"step": 18000
	},
	{
	"epoch": 45.62,
	"learning_rate": 2.8619528619528615e-05,
	"loss": 0.3116,
	"step": 18100
	},
	{
	"epoch": 45.62,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33259570598602295,
	"eval_runtime": 501.2743,
	"eval_samples_per_second": 49.562,
	"eval_steps_per_second": 24.781,
	"step": 18100
	},
	{
	"epoch": 45.87,
	"learning_rate": 2.693602693602693e-05,
	"loss": 0.3334,
	"step": 18200
	},
	{
	"epoch": 45.87,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33218705654144287,
	"eval_runtime": 501.0248,
	"eval_samples_per_second": 49.586,
	"eval_steps_per_second": 24.793,
	"step": 18200
	},
	{
	"epoch": 46.12,
	"learning_rate": 2.5252525252525253e-05,
	"loss": 0.3401,
	"step": 18300
	},
	{
	"epoch": 46.12,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3314586579799652,
	"eval_runtime": 501.1615,
	"eval_samples_per_second": 49.573,
	"eval_steps_per_second": 24.786,
	"step": 18300
	},
	{
	"epoch": 46.38,
	"learning_rate": 2.3569023569023568e-05,
	"loss": 0.3381,
	"step": 18400
	},
	{
	"epoch": 46.38,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33111417293548584,
	"eval_runtime": 501.2779,
	"eval_samples_per_second": 49.561,
	"eval_steps_per_second": 24.781,
	"step": 18400
	},
	{
	"epoch": 46.63,
	"learning_rate": 2.1885521885521884e-05,
	"loss": 0.3154,
	"step": 18500
	},
	{
	"epoch": 46.63,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3327486515045166,
	"eval_runtime": 500.9424,
	"eval_samples_per_second": 49.595,
	"eval_steps_per_second": 24.797,
	"step": 18500
	},
	{
	"epoch": 46.88,
	"learning_rate": 2.02020202020202e-05,
	"loss": 0.3348,
	"step": 18600
	},
	{
	"epoch": 46.88,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33224716782569885,
	"eval_runtime": 500.9745,
	"eval_samples_per_second": 49.591,
	"eval_steps_per_second": 24.796,
	"step": 18600
	},
	{
	"epoch": 47.13,
	"learning_rate": 1.8518518518518515e-05,
	"loss": 0.3285,
	"step": 18700
	},
	{
	"epoch": 47.13,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3325360119342804,
	"eval_runtime": 501.157,
	"eval_samples_per_second": 49.573,
	"eval_steps_per_second": 24.787,
	"step": 18700
	},
	{
	"epoch": 47.39,
	"learning_rate": 1.6835016835016834e-05,
	"loss": 0.3256,
	"step": 18800
	},
	{
	"epoch": 47.39,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3328581750392914,
	"eval_runtime": 501.2027,
	"eval_samples_per_second": 49.569,
	"eval_steps_per_second": 24.784,
	"step": 18800
	},
	{
	"epoch": 47.64,
	"learning_rate": 1.515151515151515e-05,
	"loss": 0.3389,
	"step": 18900
	},
	{
	"epoch": 47.64,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3324856758117676,
	"eval_runtime": 501.1837,
	"eval_samples_per_second": 49.571,
	"eval_steps_per_second": 24.785,
	"step": 18900
	},
	{
	"epoch": 47.89,
	"learning_rate": 1.3468013468013465e-05,
	"loss": 0.3288,
	"step": 19000
	},
	{
	"epoch": 47.89,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3326534032821655,
	"eval_runtime": 501.4739,
	"eval_samples_per_second": 49.542,
	"eval_steps_per_second": 24.771,
	"step": 19000
	},
	{
	"epoch": 48.14,
	"learning_rate": 1.1784511784511784e-05,
	"loss": 0.3172,
	"step": 19100
	},
	{
	"epoch": 48.14,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3326767683029175,
	"eval_runtime": 500.8014,
	"eval_samples_per_second": 49.608,
	"eval_steps_per_second": 24.804,
	"step": 19100
	},
	{
	"epoch": 48.39,
	"learning_rate": 1.01010101010101e-05,
	"loss": 0.3211,
	"step": 19200
	},
	{
	"epoch": 48.39,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.3324893116950989,
	"eval_runtime": 500.8057,
	"eval_samples_per_second": 49.608,
	"eval_steps_per_second": 24.804,
	"step": 19200
	},
	{
	"epoch": 48.65,
	"learning_rate": 8.417508417508417e-06,
	"loss": 0.3348,
	"step": 19300
	},
	{
	"epoch": 48.65,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33247503638267517,
	"eval_runtime": 501.0569,
	"eval_samples_per_second": 49.583,
	"eval_steps_per_second": 24.792,
	"step": 19300
	},
	{
	"epoch": 48.9,
	"learning_rate": 6.7340067340067325e-06,
	"loss": 0.3327,
	"step": 19400
	},
	{
	"epoch": 48.9,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33261463046073914,
	"eval_runtime": 501.0903,
	"eval_samples_per_second": 49.58,
	"eval_steps_per_second": 24.79,
	"step": 19400
	},
	{
	"epoch": 49.15,
	"learning_rate": 5.05050505050505e-06,
	"loss": 0.3341,
	"step": 19500
	},
	{
	"epoch": 49.15,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33255448937416077,
	"eval_runtime": 500.9292,
	"eval_samples_per_second": 49.596,
	"eval_steps_per_second": 24.798,
	"step": 19500
	},
	{
	"epoch": 49.4,
	"learning_rate": 3.3670033670033663e-06,
	"loss": 0.3344,
	"step": 19600
	},
	{
	"epoch": 49.4,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33247339725494385,
	"eval_runtime": 501.4588,
	"eval_samples_per_second": 49.543,
	"eval_steps_per_second": 24.772,
	"step": 19600
	},
	{
	"epoch": 49.65,
	"learning_rate": 1.6835016835016831e-06,
	"loss": 0.3207,
	"step": 19700
	},
	{
	"epoch": 49.65,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33257797360420227,
	"eval_runtime": 501.4807,
	"eval_samples_per_second": 49.541,
	"eval_steps_per_second": 24.771,
	"step": 19700
	},
	{
	"epoch": 49.91,
	"learning_rate": 0.0,
	"loss": 0.3299,
	"step": 19800
	},
	{
	"epoch": 49.91,
	"eval_accuracy": 0.8974400257607471,
	"eval_loss": 0.33260539174079895,
	"eval_runtime": 501.1869,
	"eval_samples_per_second": 49.57,
	"eval_steps_per_second": 24.785,
	"step": 19800
	},
	{
	"epoch": 49.91,
	"step": 19800,
	"total_flos": 7.53101543607702e+19,
	"train_loss": 0.3200095210412536,
	"train_runtime": 116243.9445,
	"train_samples_per_second": 10.917,
	"train_steps_per_second": 0.17
	}
	],
	"logging_steps": 100,
	"max_steps": 19800,
	"num_train_epochs": 50,
	"save_steps": 100,
	"total_flos": 7.53101543607702e+19,
	"trial_name": null,
	"trial_params": null
	}