whisper_13 / trainer_state.json

Upload 8 files

15af6a2 verified 3 months ago

97.8 kB

	{
	"best_global_step": 13000,
	"best_metric": 13.793103448275861,
	"best_model_checkpoint": "./whisper-large-v3-atc-mrezzat/checkpoint-13000",
	"epoch": 27.956989247311828,
	"eval_steps": 500,
	"global_step": 13000,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.053763440860215055,
	"grad_norm": 7.093221187591553,
	"learning_rate": 4.800000000000001e-07,
	"loss": 1.2803,
	"step": 25
	},
	{
	"epoch": 0.10752688172043011,
	"grad_norm": 3.561824321746826,
	"learning_rate": 9.800000000000001e-07,
	"loss": 1.024,
	"step": 50
	},
	{
	"epoch": 0.16129032258064516,
	"grad_norm": 3.972370147705078,
	"learning_rate": 1.48e-06,
	"loss": 0.8323,
	"step": 75
	},
	{
	"epoch": 0.21505376344086022,
	"grad_norm": 5.043467044830322,
	"learning_rate": 1.98e-06,
	"loss": 0.7706,
	"step": 100
	},
	{
	"epoch": 0.26881720430107525,
	"grad_norm": 3.704352855682373,
	"learning_rate": 2.4800000000000004e-06,
	"loss": 0.6839,
	"step": 125
	},
	{
	"epoch": 0.3225806451612903,
	"grad_norm": 2.454521894454956,
	"learning_rate": 2.9800000000000003e-06,
	"loss": 0.6756,
	"step": 150
	},
	{
	"epoch": 0.3763440860215054,
	"grad_norm": 4.109330654144287,
	"learning_rate": 3.48e-06,
	"loss": 0.6282,
	"step": 175
	},
	{
	"epoch": 0.43010752688172044,
	"grad_norm": 3.429811477661133,
	"learning_rate": 3.980000000000001e-06,
	"loss": 0.5735,
	"step": 200
	},
	{
	"epoch": 0.4838709677419355,
	"grad_norm": 3.641101121902466,
	"learning_rate": 4.48e-06,
	"loss": 0.535,
	"step": 225
	},
	{
	"epoch": 0.5376344086021505,
	"grad_norm": 3.169020652770996,
	"learning_rate": 4.980000000000001e-06,
	"loss": 0.5174,
	"step": 250
	},
	{
	"epoch": 0.5913978494623656,
	"grad_norm": 2.9315528869628906,
	"learning_rate": 5.480000000000001e-06,
	"loss": 0.446,
	"step": 275
	},
	{
	"epoch": 0.6451612903225806,
	"grad_norm": 3.473388671875,
	"learning_rate": 5.98e-06,
	"loss": 0.5147,
	"step": 300
	},
	{
	"epoch": 0.6989247311827957,
	"grad_norm": 3.428112506866455,
	"learning_rate": 6.480000000000001e-06,
	"loss": 0.466,
	"step": 325
	},
	{
	"epoch": 0.7526881720430108,
	"grad_norm": 2.7643871307373047,
	"learning_rate": 6.98e-06,
	"loss": 0.4712,
	"step": 350
	},
	{
	"epoch": 0.8064516129032258,
	"grad_norm": 2.77138352394104,
	"learning_rate": 7.48e-06,
	"loss": 0.4456,
	"step": 375
	},
	{
	"epoch": 0.8602150537634409,
	"grad_norm": 3.0843310356140137,
	"learning_rate": 7.980000000000002e-06,
	"loss": 0.508,
	"step": 400
	},
	{
	"epoch": 0.9139784946236559,
	"grad_norm": 2.7599642276763916,
	"learning_rate": 8.48e-06,
	"loss": 0.4453,
	"step": 425
	},
	{
	"epoch": 0.967741935483871,
	"grad_norm": 3.672558546066284,
	"learning_rate": 8.98e-06,
	"loss": 0.4443,
	"step": 450
	},
	{
	"epoch": 1.021505376344086,
	"grad_norm": 3.0827476978302,
	"learning_rate": 9.48e-06,
	"loss": 0.3988,
	"step": 475
	},
	{
	"epoch": 1.075268817204301,
	"grad_norm": 2.4267773628234863,
	"learning_rate": 9.980000000000001e-06,
	"loss": 0.3737,
	"step": 500
	},
	{
	"epoch": 1.075268817204301,
	"eval_loss": 0.27068084478378296,
	"eval_runtime": 204.8229,
	"eval_samples_per_second": 4.619,
	"eval_steps_per_second": 0.581,
	"eval_wer": 16.612739206804108,
	"step": 500
	},
	{
	"epoch": 1.129032258064516,
	"grad_norm": 1.7745027542114258,
	"learning_rate": 9.982156133828997e-06,
	"loss": 0.3749,
	"step": 525
	},
	{
	"epoch": 1.1827956989247312,
	"grad_norm": 2.5673892498016357,
	"learning_rate": 9.963568773234202e-06,
	"loss": 0.3547,
	"step": 550
	},
	{
	"epoch": 1.2365591397849462,
	"grad_norm": 3.1428632736206055,
	"learning_rate": 9.944981412639407e-06,
	"loss": 0.3335,
	"step": 575
	},
	{
	"epoch": 1.2903225806451613,
	"grad_norm": 3.2400989532470703,
	"learning_rate": 9.92639405204461e-06,
	"loss": 0.3382,
	"step": 600
	},
	{
	"epoch": 1.3440860215053765,
	"grad_norm": 3.075026273727417,
	"learning_rate": 9.907806691449815e-06,
	"loss": 0.3641,
	"step": 625
	},
	{
	"epoch": 1.3978494623655915,
	"grad_norm": 2.6721091270446777,
	"learning_rate": 9.88921933085502e-06,
	"loss": 0.358,
	"step": 650
	},
	{
	"epoch": 1.4516129032258065,
	"grad_norm": 1.545538306236267,
	"learning_rate": 9.870631970260223e-06,
	"loss": 0.334,
	"step": 675
	},
	{
	"epoch": 1.5053763440860215,
	"grad_norm": 2.7524378299713135,
	"learning_rate": 9.852044609665428e-06,
	"loss": 0.3401,
	"step": 700
	},
	{
	"epoch": 1.5591397849462365,
	"grad_norm": 2.7014448642730713,
	"learning_rate": 9.833457249070633e-06,
	"loss": 0.3305,
	"step": 725
	},
	{
	"epoch": 1.6129032258064515,
	"grad_norm": 2.5529074668884277,
	"learning_rate": 9.814869888475837e-06,
	"loss": 0.316,
	"step": 750
	},
	{
	"epoch": 1.6666666666666665,
	"grad_norm": 2.5125572681427,
	"learning_rate": 9.796282527881042e-06,
	"loss": 0.3324,
	"step": 775
	},
	{
	"epoch": 1.7204301075268817,
	"grad_norm": 3.541673183441162,
	"learning_rate": 9.777695167286247e-06,
	"loss": 0.3025,
	"step": 800
	},
	{
	"epoch": 1.7741935483870968,
	"grad_norm": 2.809391498565674,
	"learning_rate": 9.75910780669145e-06,
	"loss": 0.3263,
	"step": 825
	},
	{
	"epoch": 1.827956989247312,
	"grad_norm": 3.627777576446533,
	"learning_rate": 9.740520446096655e-06,
	"loss": 0.3209,
	"step": 850
	},
	{
	"epoch": 1.881720430107527,
	"grad_norm": 2.672043561935425,
	"learning_rate": 9.721933085501858e-06,
	"loss": 0.2879,
	"step": 875
	},
	{
	"epoch": 1.935483870967742,
	"grad_norm": 2.783828020095825,
	"learning_rate": 9.703345724907063e-06,
	"loss": 0.2813,
	"step": 900
	},
	{
	"epoch": 1.989247311827957,
	"grad_norm": 3.2919387817382812,
	"learning_rate": 9.684758364312268e-06,
	"loss": 0.3037,
	"step": 925
	},
	{
	"epoch": 2.043010752688172,
	"grad_norm": 2.6845808029174805,
	"learning_rate": 9.666171003717473e-06,
	"loss": 0.2344,
	"step": 950
	},
	{
	"epoch": 2.096774193548387,
	"grad_norm": 2.9660229682922363,
	"learning_rate": 9.647583643122678e-06,
	"loss": 0.1819,
	"step": 975
	},
	{
	"epoch": 2.150537634408602,
	"grad_norm": 1.8242266178131104,
	"learning_rate": 9.628996282527881e-06,
	"loss": 0.2016,
	"step": 1000
	},
	{
	"epoch": 2.150537634408602,
	"eval_loss": 0.27269652485847473,
	"eval_runtime": 202.1375,
	"eval_samples_per_second": 4.68,
	"eval_steps_per_second": 0.589,
	"eval_wer": 14.246094111121382,
	"step": 1000
	},
	{
	"epoch": 2.204301075268817,
	"grad_norm": 2.224641799926758,
	"learning_rate": 9.610408921933086e-06,
	"loss": 0.2209,
	"step": 1025
	},
	{
	"epoch": 2.258064516129032,
	"grad_norm": 2.039360761642456,
	"learning_rate": 9.59182156133829e-06,
	"loss": 0.2072,
	"step": 1050
	},
	{
	"epoch": 2.3118279569892475,
	"grad_norm": 2.753037929534912,
	"learning_rate": 9.573234200743495e-06,
	"loss": 0.1707,
	"step": 1075
	},
	{
	"epoch": 2.3655913978494625,
	"grad_norm": 2.8433048725128174,
	"learning_rate": 9.5546468401487e-06,
	"loss": 0.2005,
	"step": 1100
	},
	{
	"epoch": 2.4193548387096775,
	"grad_norm": 2.2583348751068115,
	"learning_rate": 9.536059479553905e-06,
	"loss": 0.1792,
	"step": 1125
	},
	{
	"epoch": 2.4731182795698925,
	"grad_norm": 2.151129722595215,
	"learning_rate": 9.51747211895911e-06,
	"loss": 0.2076,
	"step": 1150
	},
	{
	"epoch": 2.5268817204301075,
	"grad_norm": 2.289693593978882,
	"learning_rate": 9.498884758364313e-06,
	"loss": 0.1901,
	"step": 1175
	},
	{
	"epoch": 2.5806451612903225,
	"grad_norm": 2.0624475479125977,
	"learning_rate": 9.480297397769518e-06,
	"loss": 0.1938,
	"step": 1200
	},
	{
	"epoch": 2.6344086021505375,
	"grad_norm": 2.455775737762451,
	"learning_rate": 9.461710037174721e-06,
	"loss": 0.2116,
	"step": 1225
	},
	{
	"epoch": 2.688172043010753,
	"grad_norm": 1.853768229484558,
	"learning_rate": 9.443122676579926e-06,
	"loss": 0.2008,
	"step": 1250
	},
	{
	"epoch": 2.741935483870968,
	"grad_norm": 2.4691860675811768,
	"learning_rate": 9.424535315985131e-06,
	"loss": 0.2167,
	"step": 1275
	},
	{
	"epoch": 2.795698924731183,
	"grad_norm": 1.8937417268753052,
	"learning_rate": 9.405947955390336e-06,
	"loss": 0.1864,
	"step": 1300
	},
	{
	"epoch": 2.849462365591398,
	"grad_norm": 2.786158323287964,
	"learning_rate": 9.38736059479554e-06,
	"loss": 0.1916,
	"step": 1325
	},
	{
	"epoch": 2.903225806451613,
	"grad_norm": 2.7571518421173096,
	"learning_rate": 9.368773234200744e-06,
	"loss": 0.1982,
	"step": 1350
	},
	{
	"epoch": 2.956989247311828,
	"grad_norm": 2.334691286087036,
	"learning_rate": 9.35018587360595e-06,
	"loss": 0.1864,
	"step": 1375
	},
	{
	"epoch": 3.010752688172043,
	"grad_norm": 1.4865392446517944,
	"learning_rate": 9.331598513011153e-06,
	"loss": 0.1593,
	"step": 1400
	},
	{
	"epoch": 3.064516129032258,
	"grad_norm": 1.797865629196167,
	"learning_rate": 9.313011152416358e-06,
	"loss": 0.1123,
	"step": 1425
	},
	{
	"epoch": 3.118279569892473,
	"grad_norm": 1.5422674417495728,
	"learning_rate": 9.294423791821563e-06,
	"loss": 0.1132,
	"step": 1450
	},
	{
	"epoch": 3.172043010752688,
	"grad_norm": 1.649880290031433,
	"learning_rate": 9.275836431226768e-06,
	"loss": 0.1075,
	"step": 1475
	},
	{
	"epoch": 3.225806451612903,
	"grad_norm": 2.0276639461517334,
	"learning_rate": 9.25724907063197e-06,
	"loss": 0.1164,
	"step": 1500
	},
	{
	"epoch": 3.225806451612903,
	"eval_loss": 0.28087103366851807,
	"eval_runtime": 202.3199,
	"eval_samples_per_second": 4.676,
	"eval_steps_per_second": 0.588,
	"eval_wer": 15.050383655357308,
	"step": 1500
	},
	{
	"epoch": 3.279569892473118,
	"grad_norm": 2.4856255054473877,
	"learning_rate": 9.238661710037176e-06,
	"loss": 0.1112,
	"step": 1525
	},
	{
	"epoch": 3.3333333333333335,
	"grad_norm": 2.857877492904663,
	"learning_rate": 9.220074349442379e-06,
	"loss": 0.1131,
	"step": 1550
	},
	{
	"epoch": 3.3870967741935485,
	"grad_norm": 1.7496925592422485,
	"learning_rate": 9.201486988847584e-06,
	"loss": 0.1306,
	"step": 1575
	},
	{
	"epoch": 3.4408602150537635,
	"grad_norm": 1.9851291179656982,
	"learning_rate": 9.182899628252789e-06,
	"loss": 0.114,
	"step": 1600
	},
	{
	"epoch": 3.4946236559139785,
	"grad_norm": 2.6501877307891846,
	"learning_rate": 9.164312267657994e-06,
	"loss": 0.1208,
	"step": 1625
	},
	{
	"epoch": 3.5483870967741935,
	"grad_norm": 1.6141562461853027,
	"learning_rate": 9.145724907063197e-06,
	"loss": 0.1194,
	"step": 1650
	},
	{
	"epoch": 3.6021505376344085,
	"grad_norm": 2.246312141418457,
	"learning_rate": 9.127137546468402e-06,
	"loss": 0.121,
	"step": 1675
	},
	{
	"epoch": 3.6559139784946235,
	"grad_norm": 1.7408199310302734,
	"learning_rate": 9.108550185873607e-06,
	"loss": 0.1178,
	"step": 1700
	},
	{
	"epoch": 3.709677419354839,
	"grad_norm": 2.1992955207824707,
	"learning_rate": 9.08996282527881e-06,
	"loss": 0.0901,
	"step": 1725
	},
	{
	"epoch": 3.763440860215054,
	"grad_norm": 2.057574987411499,
	"learning_rate": 9.071375464684016e-06,
	"loss": 0.0999,
	"step": 1750
	},
	{
	"epoch": 3.817204301075269,
	"grad_norm": 2.032602548599243,
	"learning_rate": 9.052788104089219e-06,
	"loss": 0.1057,
	"step": 1775
	},
	{
	"epoch": 3.870967741935484,
	"grad_norm": 1.700415849685669,
	"learning_rate": 9.034200743494424e-06,
	"loss": 0.1127,
	"step": 1800
	},
	{
	"epoch": 3.924731182795699,
	"grad_norm": 2.944364070892334,
	"learning_rate": 9.015613382899629e-06,
	"loss": 0.1304,
	"step": 1825
	},
	{
	"epoch": 3.978494623655914,
	"grad_norm": 2.807861804962158,
	"learning_rate": 8.997026022304834e-06,
	"loss": 0.1215,
	"step": 1850
	},
	{
	"epoch": 4.032258064516129,
	"grad_norm": 2.064152717590332,
	"learning_rate": 8.978438661710039e-06,
	"loss": 0.0942,
	"step": 1875
	},
	{
	"epoch": 4.086021505376344,
	"grad_norm": 2.315067768096924,
	"learning_rate": 8.959851301115242e-06,
	"loss": 0.0636,
	"step": 1900
	},
	{
	"epoch": 4.139784946236559,
	"grad_norm": 1.4923697710037231,
	"learning_rate": 8.941263940520447e-06,
	"loss": 0.0553,
	"step": 1925
	},
	{
	"epoch": 4.193548387096774,
	"grad_norm": 1.0652992725372314,
	"learning_rate": 8.92267657992565e-06,
	"loss": 0.0545,
	"step": 1950
	},
	{
	"epoch": 4.247311827956989,
	"grad_norm": 1.9834535121917725,
	"learning_rate": 8.904089219330855e-06,
	"loss": 0.049,
	"step": 1975
	},
	{
	"epoch": 4.301075268817204,
	"grad_norm": 1.4393575191497803,
	"learning_rate": 8.88550185873606e-06,
	"loss": 0.0551,
	"step": 2000
	},
	{
	"epoch": 4.301075268817204,
	"eval_loss": 0.3065280318260193,
	"eval_runtime": 202.95,
	"eval_samples_per_second": 4.661,
	"eval_steps_per_second": 0.586,
	"eval_wer": 15.087362484977351,
	"step": 2000
	},
	{
	"epoch": 4.354838709677419,
	"grad_norm": 1.7886149883270264,
	"learning_rate": 8.866914498141265e-06,
	"loss": 0.0629,
	"step": 2025
	},
	{
	"epoch": 4.408602150537634,
	"grad_norm": 1.470372200012207,
	"learning_rate": 8.84832713754647e-06,
	"loss": 0.0569,
	"step": 2050
	},
	{
	"epoch": 4.462365591397849,
	"grad_norm": 2.3206701278686523,
	"learning_rate": 8.829739776951673e-06,
	"loss": 0.0612,
	"step": 2075
	},
	{
	"epoch": 4.516129032258064,
	"grad_norm": 1.5979121923446655,
	"learning_rate": 8.811152416356878e-06,
	"loss": 0.0703,
	"step": 2100
	},
	{
	"epoch": 4.56989247311828,
	"grad_norm": 2.818779945373535,
	"learning_rate": 8.792565055762082e-06,
	"loss": 0.0637,
	"step": 2125
	},
	{
	"epoch": 4.623655913978495,
	"grad_norm": 2.848932981491089,
	"learning_rate": 8.773977695167287e-06,
	"loss": 0.0636,
	"step": 2150
	},
	{
	"epoch": 4.67741935483871,
	"grad_norm": 1.2150336503982544,
	"learning_rate": 8.755390334572492e-06,
	"loss": 0.0898,
	"step": 2175
	},
	{
	"epoch": 4.731182795698925,
	"grad_norm": 2.5077340602874756,
	"learning_rate": 8.736802973977697e-06,
	"loss": 0.0509,
	"step": 2200
	},
	{
	"epoch": 4.78494623655914,
	"grad_norm": 2.6455860137939453,
	"learning_rate": 8.7182156133829e-06,
	"loss": 0.0662,
	"step": 2225
	},
	{
	"epoch": 4.838709677419355,
	"grad_norm": 2.1598827838897705,
	"learning_rate": 8.699628252788105e-06,
	"loss": 0.0618,
	"step": 2250
	},
	{
	"epoch": 4.89247311827957,
	"grad_norm": 1.961423397064209,
	"learning_rate": 8.68104089219331e-06,
	"loss": 0.0687,
	"step": 2275
	},
	{
	"epoch": 4.946236559139785,
	"grad_norm": 1.5583302974700928,
	"learning_rate": 8.662453531598513e-06,
	"loss": 0.0587,
	"step": 2300
	},
	{
	"epoch": 5.0,
	"grad_norm": 1.7334260940551758,
	"learning_rate": 8.643866171003718e-06,
	"loss": 0.0639,
	"step": 2325
	},
	{
	"epoch": 5.053763440860215,
	"grad_norm": 1.385697364807129,
	"learning_rate": 8.625278810408923e-06,
	"loss": 0.0295,
	"step": 2350
	},
	{
	"epoch": 5.10752688172043,
	"grad_norm": 1.8390223979949951,
	"learning_rate": 8.606691449814128e-06,
	"loss": 0.0336,
	"step": 2375
	},
	{
	"epoch": 5.161290322580645,
	"grad_norm": 1.6100000143051147,
	"learning_rate": 8.588104089219331e-06,
	"loss": 0.0346,
	"step": 2400
	},
	{
	"epoch": 5.21505376344086,
	"grad_norm": 1.8762363195419312,
	"learning_rate": 8.569516728624536e-06,
	"loss": 0.0355,
	"step": 2425
	},
	{
	"epoch": 5.268817204301075,
	"grad_norm": 0.8988639116287231,
	"learning_rate": 8.55092936802974e-06,
	"loss": 0.038,
	"step": 2450
	},
	{
	"epoch": 5.32258064516129,
	"grad_norm": 1.372160792350769,
	"learning_rate": 8.532342007434945e-06,
	"loss": 0.0443,
	"step": 2475
	},
	{
	"epoch": 5.376344086021505,
	"grad_norm": 1.3820526599884033,
	"learning_rate": 8.51375464684015e-06,
	"loss": 0.0345,
	"step": 2500
	},
	{
	"epoch": 5.376344086021505,
	"eval_loss": 0.31700512766838074,
	"eval_runtime": 202.9264,
	"eval_samples_per_second": 4.662,
	"eval_steps_per_second": 0.586,
	"eval_wer": 14.902468336877137,
	"step": 2500
	},
	{
	"epoch": 5.43010752688172,
	"grad_norm": 1.8369241952896118,
	"learning_rate": 8.495167286245355e-06,
	"loss": 0.0362,
	"step": 2525
	},
	{
	"epoch": 5.483870967741936,
	"grad_norm": 1.735297441482544,
	"learning_rate": 8.476579925650558e-06,
	"loss": 0.0369,
	"step": 2550
	},
	{
	"epoch": 5.53763440860215,
	"grad_norm": 2.1869583129882812,
	"learning_rate": 8.457992565055763e-06,
	"loss": 0.0359,
	"step": 2575
	},
	{
	"epoch": 5.591397849462366,
	"grad_norm": 0.9142827987670898,
	"learning_rate": 8.439405204460968e-06,
	"loss": 0.0369,
	"step": 2600
	},
	{
	"epoch": 5.645161290322581,
	"grad_norm": 1.5425326824188232,
	"learning_rate": 8.420817843866171e-06,
	"loss": 0.0413,
	"step": 2625
	},
	{
	"epoch": 5.698924731182796,
	"grad_norm": 1.532554268836975,
	"learning_rate": 8.402230483271376e-06,
	"loss": 0.0455,
	"step": 2650
	},
	{
	"epoch": 5.752688172043011,
	"grad_norm": 1.7818132638931274,
	"learning_rate": 8.38364312267658e-06,
	"loss": 0.0351,
	"step": 2675
	},
	{
	"epoch": 5.806451612903226,
	"grad_norm": 0.8005560040473938,
	"learning_rate": 8.365055762081784e-06,
	"loss": 0.0446,
	"step": 2700
	},
	{
	"epoch": 5.860215053763441,
	"grad_norm": 1.37205171585083,
	"learning_rate": 8.34646840148699e-06,
	"loss": 0.0447,
	"step": 2725
	},
	{
	"epoch": 5.913978494623656,
	"grad_norm": 0.9380530714988708,
	"learning_rate": 8.327881040892194e-06,
	"loss": 0.0335,
	"step": 2750
	},
	{
	"epoch": 5.967741935483871,
	"grad_norm": 2.020190954208374,
	"learning_rate": 8.3092936802974e-06,
	"loss": 0.0354,
	"step": 2775
	},
	{
	"epoch": 6.021505376344086,
	"grad_norm": 0.7758223414421082,
	"learning_rate": 8.290706319702603e-06,
	"loss": 0.0245,
	"step": 2800
	},
	{
	"epoch": 6.075268817204301,
	"grad_norm": 1.127894639968872,
	"learning_rate": 8.272118959107808e-06,
	"loss": 0.0233,
	"step": 2825
	},
	{
	"epoch": 6.129032258064516,
	"grad_norm": 0.7980286478996277,
	"learning_rate": 8.253531598513011e-06,
	"loss": 0.0234,
	"step": 2850
	},
	{
	"epoch": 6.182795698924731,
	"grad_norm": 1.1685783863067627,
	"learning_rate": 8.234944237918216e-06,
	"loss": 0.0311,
	"step": 2875
	},
	{
	"epoch": 6.236559139784946,
	"grad_norm": 1.3557145595550537,
	"learning_rate": 8.216356877323421e-06,
	"loss": 0.0219,
	"step": 2900
	},
	{
	"epoch": 6.290322580645161,
	"grad_norm": 0.7474266290664673,
	"learning_rate": 8.197769516728626e-06,
	"loss": 0.0244,
	"step": 2925
	},
	{
	"epoch": 6.344086021505376,
	"grad_norm": 0.9074203968048096,
	"learning_rate": 8.179182156133829e-06,
	"loss": 0.0195,
	"step": 2950
	},
	{
	"epoch": 6.397849462365591,
	"grad_norm": 1.0333547592163086,
	"learning_rate": 8.160594795539034e-06,
	"loss": 0.0284,
	"step": 2975
	},
	{
	"epoch": 6.451612903225806,
	"grad_norm": 1.9100396633148193,
	"learning_rate": 8.142007434944239e-06,
	"loss": 0.0186,
	"step": 3000
	},
	{
	"epoch": 6.451612903225806,
	"eval_loss": 0.3364327549934387,
	"eval_runtime": 203.4115,
	"eval_samples_per_second": 4.651,
	"eval_steps_per_second": 0.585,
	"eval_wer": 14.77304243320699,
	"step": 3000
	},
	{
	"epoch": 6.505376344086022,
	"grad_norm": 0.6991943120956421,
	"learning_rate": 8.123420074349442e-06,
	"loss": 0.0201,
	"step": 3025
	},
	{
	"epoch": 6.559139784946236,
	"grad_norm": 2.668675422668457,
	"learning_rate": 8.104832713754647e-06,
	"loss": 0.0257,
	"step": 3050
	},
	{
	"epoch": 6.612903225806452,
	"grad_norm": 1.0620919466018677,
	"learning_rate": 8.086245353159852e-06,
	"loss": 0.0275,
	"step": 3075
	},
	{
	"epoch": 6.666666666666667,
	"grad_norm": 1.9009549617767334,
	"learning_rate": 8.067657992565057e-06,
	"loss": 0.0215,
	"step": 3100
	},
	{
	"epoch": 6.720430107526882,
	"grad_norm": 0.8860704302787781,
	"learning_rate": 8.04907063197026e-06,
	"loss": 0.0199,
	"step": 3125
	},
	{
	"epoch": 6.774193548387097,
	"grad_norm": 1.2130790948867798,
	"learning_rate": 8.030483271375466e-06,
	"loss": 0.0237,
	"step": 3150
	},
	{
	"epoch": 6.827956989247312,
	"grad_norm": 1.5909550189971924,
	"learning_rate": 8.011895910780669e-06,
	"loss": 0.0269,
	"step": 3175
	},
	{
	"epoch": 6.881720430107527,
	"grad_norm": 1.6755486726760864,
	"learning_rate": 7.993308550185874e-06,
	"loss": 0.0339,
	"step": 3200
	},
	{
	"epoch": 6.935483870967742,
	"grad_norm": 1.2641445398330688,
	"learning_rate": 7.974721189591079e-06,
	"loss": 0.0204,
	"step": 3225
	},
	{
	"epoch": 6.989247311827957,
	"grad_norm": 1.7877347469329834,
	"learning_rate": 7.956133828996284e-06,
	"loss": 0.0266,
	"step": 3250
	},
	{
	"epoch": 7.043010752688172,
	"grad_norm": 0.9837028384208679,
	"learning_rate": 7.937546468401489e-06,
	"loss": 0.02,
	"step": 3275
	},
	{
	"epoch": 7.096774193548387,
	"grad_norm": 1.2097680568695068,
	"learning_rate": 7.918959107806692e-06,
	"loss": 0.0126,
	"step": 3300
	},
	{
	"epoch": 7.150537634408602,
	"grad_norm": 1.447039246559143,
	"learning_rate": 7.900371747211897e-06,
	"loss": 0.018,
	"step": 3325
	},
	{
	"epoch": 7.204301075268817,
	"grad_norm": 0.8316716551780701,
	"learning_rate": 7.8817843866171e-06,
	"loss": 0.0178,
	"step": 3350
	},
	{
	"epoch": 7.258064516129032,
	"grad_norm": 0.9670646786689758,
	"learning_rate": 7.863197026022305e-06,
	"loss": 0.0122,
	"step": 3375
	},
	{
	"epoch": 7.311827956989247,
	"grad_norm": 1.4154245853424072,
	"learning_rate": 7.84460966542751e-06,
	"loss": 0.0171,
	"step": 3400
	},
	{
	"epoch": 7.365591397849462,
	"grad_norm": 1.3647488355636597,
	"learning_rate": 7.826022304832714e-06,
	"loss": 0.0151,
	"step": 3425
	},
	{
	"epoch": 7.419354838709677,
	"grad_norm": 1.548120141029358,
	"learning_rate": 7.807434944237919e-06,
	"loss": 0.0149,
	"step": 3450
	},
	{
	"epoch": 7.473118279569892,
	"grad_norm": 1.6091225147247314,
	"learning_rate": 7.788847583643124e-06,
	"loss": 0.0168,
	"step": 3475
	},
	{
	"epoch": 7.526881720430108,
	"grad_norm": 1.1116617918014526,
	"learning_rate": 7.770260223048329e-06,
	"loss": 0.0161,
	"step": 3500
	},
	{
	"epoch": 7.526881720430108,
	"eval_loss": 0.34663301706314087,
	"eval_runtime": 202.0433,
	"eval_samples_per_second": 4.682,
	"eval_steps_per_second": 0.589,
	"eval_wer": 14.551169455486734,
	"step": 3500
	},
	{
	"epoch": 7.580645161290323,
	"grad_norm": 1.468459129333496,
	"learning_rate": 7.751672862453532e-06,
	"loss": 0.0193,
	"step": 3525
	},
	{
	"epoch": 7.634408602150538,
	"grad_norm": 1.2769989967346191,
	"learning_rate": 7.733085501858737e-06,
	"loss": 0.0184,
	"step": 3550
	},
	{
	"epoch": 7.688172043010753,
	"grad_norm": 1.0488286018371582,
	"learning_rate": 7.71449814126394e-06,
	"loss": 0.019,
	"step": 3575
	},
	{
	"epoch": 7.741935483870968,
	"grad_norm": 0.8325207829475403,
	"learning_rate": 7.695910780669145e-06,
	"loss": 0.0252,
	"step": 3600
	},
	{
	"epoch": 7.795698924731183,
	"grad_norm": 0.7656351923942566,
	"learning_rate": 7.67732342007435e-06,
	"loss": 0.0155,
	"step": 3625
	},
	{
	"epoch": 7.849462365591398,
	"grad_norm": 0.9184199571609497,
	"learning_rate": 7.658736059479555e-06,
	"loss": 0.028,
	"step": 3650
	},
	{
	"epoch": 7.903225806451613,
	"grad_norm": 1.2135573625564575,
	"learning_rate": 7.64014869888476e-06,
	"loss": 0.0178,
	"step": 3675
	},
	{
	"epoch": 7.956989247311828,
	"grad_norm": 0.8172153830528259,
	"learning_rate": 7.621561338289963e-06,
	"loss": 0.0254,
	"step": 3700
	},
	{
	"epoch": 8.010752688172044,
	"grad_norm": 0.431659072637558,
	"learning_rate": 7.602973977695168e-06,
	"loss": 0.0145,
	"step": 3725
	},
	{
	"epoch": 8.064516129032258,
	"grad_norm": 0.9533307552337646,
	"learning_rate": 7.584386617100372e-06,
	"loss": 0.0165,
	"step": 3750
	},
	{
	"epoch": 8.118279569892474,
	"grad_norm": 0.7198922038078308,
	"learning_rate": 7.565799256505577e-06,
	"loss": 0.0107,
	"step": 3775
	},
	{
	"epoch": 8.172043010752688,
	"grad_norm": 0.8582783937454224,
	"learning_rate": 7.547211895910781e-06,
	"loss": 0.0123,
	"step": 3800
	},
	{
	"epoch": 8.225806451612904,
	"grad_norm": 1.0113513469696045,
	"learning_rate": 7.528624535315986e-06,
	"loss": 0.014,
	"step": 3825
	},
	{
	"epoch": 8.279569892473118,
	"grad_norm": 0.7275539040565491,
	"learning_rate": 7.51003717472119e-06,
	"loss": 0.0115,
	"step": 3850
	},
	{
	"epoch": 8.333333333333334,
	"grad_norm": 0.4298296570777893,
	"learning_rate": 7.491449814126395e-06,
	"loss": 0.0104,
	"step": 3875
	},
	{
	"epoch": 8.387096774193548,
	"grad_norm": 0.7536816596984863,
	"learning_rate": 7.4728624535316e-06,
	"loss": 0.0132,
	"step": 3900
	},
	{
	"epoch": 8.440860215053764,
	"grad_norm": 1.0941580533981323,
	"learning_rate": 7.454275092936804e-06,
	"loss": 0.012,
	"step": 3925
	},
	{
	"epoch": 8.494623655913978,
	"grad_norm": 1.0508357286453247,
	"learning_rate": 7.435687732342009e-06,
	"loss": 0.0135,
	"step": 3950
	},
	{
	"epoch": 8.548387096774194,
	"grad_norm": 0.6876735687255859,
	"learning_rate": 7.417100371747212e-06,
	"loss": 0.0156,
	"step": 3975
	},
	{
	"epoch": 8.602150537634408,
	"grad_norm": 0.8525980114936829,
	"learning_rate": 7.398513011152417e-06,
	"loss": 0.0106,
	"step": 4000
	},
	{
	"epoch": 8.602150537634408,
	"eval_loss": 0.3538697063922882,
	"eval_runtime": 202.0959,
	"eval_samples_per_second": 4.681,
	"eval_steps_per_second": 0.589,
	"eval_wer": 14.338541185171488,
	"step": 4000
	},
	{
	"epoch": 8.655913978494624,
	"grad_norm": 0.5362399220466614,
	"learning_rate": 7.379925650557621e-06,
	"loss": 0.0123,
	"step": 4025
	},
	{
	"epoch": 8.709677419354838,
	"grad_norm": 0.8804866671562195,
	"learning_rate": 7.361338289962826e-06,
	"loss": 0.0171,
	"step": 4050
	},
	{
	"epoch": 8.763440860215054,
	"grad_norm": 0.8643043041229248,
	"learning_rate": 7.34275092936803e-06,
	"loss": 0.0144,
	"step": 4075
	},
	{
	"epoch": 8.817204301075268,
	"grad_norm": 0.8704060912132263,
	"learning_rate": 7.3241635687732344e-06,
	"loss": 0.0121,
	"step": 4100
	},
	{
	"epoch": 8.870967741935484,
	"grad_norm": 0.6113823056221008,
	"learning_rate": 7.305576208178439e-06,
	"loss": 0.0154,
	"step": 4125
	},
	{
	"epoch": 8.924731182795698,
	"grad_norm": 1.1631172895431519,
	"learning_rate": 7.2869888475836436e-06,
	"loss": 0.0109,
	"step": 4150
	},
	{
	"epoch": 8.978494623655914,
	"grad_norm": 0.8042282462120056,
	"learning_rate": 7.2684014869888485e-06,
	"loss": 0.0158,
	"step": 4175
	},
	{
	"epoch": 9.03225806451613,
	"grad_norm": 0.18347720801830292,
	"learning_rate": 7.249814126394053e-06,
	"loss": 0.0132,
	"step": 4200
	},
	{
	"epoch": 9.086021505376344,
	"grad_norm": 0.7228168845176697,
	"learning_rate": 7.231226765799258e-06,
	"loss": 0.0099,
	"step": 4225
	},
	{
	"epoch": 9.13978494623656,
	"grad_norm": 0.35777589678764343,
	"learning_rate": 7.212639405204461e-06,
	"loss": 0.0129,
	"step": 4250
	},
	{
	"epoch": 9.193548387096774,
	"grad_norm": 0.2701317071914673,
	"learning_rate": 7.194052044609666e-06,
	"loss": 0.0095,
	"step": 4275
	},
	{
	"epoch": 9.24731182795699,
	"grad_norm": 1.6921519041061401,
	"learning_rate": 7.17546468401487e-06,
	"loss": 0.0082,
	"step": 4300
	},
	{
	"epoch": 9.301075268817204,
	"grad_norm": 0.27636006474494934,
	"learning_rate": 7.156877323420075e-06,
	"loss": 0.0075,
	"step": 4325
	},
	{
	"epoch": 9.35483870967742,
	"grad_norm": 0.7335753440856934,
	"learning_rate": 7.138289962825279e-06,
	"loss": 0.0102,
	"step": 4350
	},
	{
	"epoch": 9.408602150537634,
	"grad_norm": 0.9723600149154663,
	"learning_rate": 7.119702602230484e-06,
	"loss": 0.0104,
	"step": 4375
	},
	{
	"epoch": 9.46236559139785,
	"grad_norm": 0.2777242660522461,
	"learning_rate": 7.101115241635689e-06,
	"loss": 0.0138,
	"step": 4400
	},
	{
	"epoch": 9.516129032258064,
	"grad_norm": 0.42475125193595886,
	"learning_rate": 7.082527881040892e-06,
	"loss": 0.0074,
	"step": 4425
	},
	{
	"epoch": 9.56989247311828,
	"grad_norm": 0.6463161110877991,
	"learning_rate": 7.063940520446097e-06,
	"loss": 0.0105,
	"step": 4450
	},
	{
	"epoch": 9.623655913978494,
	"grad_norm": 1.2284172773361206,
	"learning_rate": 7.0453531598513015e-06,
	"loss": 0.0086,
	"step": 4475
	},
	{
	"epoch": 9.67741935483871,
	"grad_norm": 0.6127483248710632,
	"learning_rate": 7.0267657992565065e-06,
	"loss": 0.013,
	"step": 4500
	},
	{
	"epoch": 9.67741935483871,
	"eval_loss": 0.3432445228099823,
	"eval_runtime": 202.5879,
	"eval_samples_per_second": 4.67,
	"eval_steps_per_second": 0.587,
	"eval_wer": 14.883978922067117,
	"step": 4500
	},
	{
	"epoch": 9.731182795698924,
	"grad_norm": 1.6641124486923218,
	"learning_rate": 7.008178438661711e-06,
	"loss": 0.0117,
	"step": 4525
	},
	{
	"epoch": 9.78494623655914,
	"grad_norm": 0.49032703042030334,
	"learning_rate": 6.989591078066915e-06,
	"loss": 0.0113,
	"step": 4550
	},
	{
	"epoch": 9.838709677419354,
	"grad_norm": 1.0603209733963013,
	"learning_rate": 6.971003717472119e-06,
	"loss": 0.0093,
	"step": 4575
	},
	{
	"epoch": 9.89247311827957,
	"grad_norm": 1.1902903318405151,
	"learning_rate": 6.952416356877324e-06,
	"loss": 0.009,
	"step": 4600
	},
	{
	"epoch": 9.946236559139784,
	"grad_norm": 0.4575275182723999,
	"learning_rate": 6.933828996282529e-06,
	"loss": 0.0103,
	"step": 4625
	},
	{
	"epoch": 10.0,
	"grad_norm": 2.514280080795288,
	"learning_rate": 6.915241635687733e-06,
	"loss": 0.0146,
	"step": 4650
	},
	{
	"epoch": 10.053763440860216,
	"grad_norm": 0.28566455841064453,
	"learning_rate": 6.896654275092938e-06,
	"loss": 0.008,
	"step": 4675
	},
	{
	"epoch": 10.10752688172043,
	"grad_norm": 0.3524170219898224,
	"learning_rate": 6.878066914498141e-06,
	"loss": 0.0057,
	"step": 4700
	},
	{
	"epoch": 10.161290322580646,
	"grad_norm": 1.7274552583694458,
	"learning_rate": 6.859479553903346e-06,
	"loss": 0.0083,
	"step": 4725
	},
	{
	"epoch": 10.21505376344086,
	"grad_norm": 0.31285515427589417,
	"learning_rate": 6.84089219330855e-06,
	"loss": 0.0071,
	"step": 4750
	},
	{
	"epoch": 10.268817204301076,
	"grad_norm": 0.8492361307144165,
	"learning_rate": 6.822304832713755e-06,
	"loss": 0.0086,
	"step": 4775
	},
	{
	"epoch": 10.32258064516129,
	"grad_norm": 0.39797672629356384,
	"learning_rate": 6.8037174721189595e-06,
	"loss": 0.0088,
	"step": 4800
	},
	{
	"epoch": 10.376344086021506,
	"grad_norm": 0.410177618265152,
	"learning_rate": 6.7851301115241644e-06,
	"loss": 0.0085,
	"step": 4825
	},
	{
	"epoch": 10.43010752688172,
	"grad_norm": 0.45091158151626587,
	"learning_rate": 6.766542750929369e-06,
	"loss": 0.0062,
	"step": 4850
	},
	{
	"epoch": 10.483870967741936,
	"grad_norm": 1.3592181205749512,
	"learning_rate": 6.747955390334573e-06,
	"loss": 0.01,
	"step": 4875
	},
	{
	"epoch": 10.53763440860215,
	"grad_norm": 0.4976150691509247,
	"learning_rate": 6.729368029739778e-06,
	"loss": 0.0069,
	"step": 4900
	},
	{
	"epoch": 10.591397849462366,
	"grad_norm": 0.14256972074508667,
	"learning_rate": 6.710780669144982e-06,
	"loss": 0.0064,
	"step": 4925
	},
	{
	"epoch": 10.64516129032258,
	"grad_norm": 0.7307581901550293,
	"learning_rate": 6.692193308550187e-06,
	"loss": 0.0075,
	"step": 4950
	},
	{
	"epoch": 10.698924731182796,
	"grad_norm": 0.8009108901023865,
	"learning_rate": 6.673605947955391e-06,
	"loss": 0.0071,
	"step": 4975
	},
	{
	"epoch": 10.75268817204301,
	"grad_norm": 0.7494556307792664,
	"learning_rate": 6.655018587360595e-06,
	"loss": 0.0092,
	"step": 5000
	},
	{
	"epoch": 10.75268817204301,
	"eval_loss": 0.3648987114429474,
	"eval_runtime": 202.4649,
	"eval_samples_per_second": 4.672,
	"eval_steps_per_second": 0.588,
	"eval_wer": 14.218359988906352,
	"step": 5000
	},
	{
	"epoch": 10.806451612903226,
	"grad_norm": 1.12769615650177,
	"learning_rate": 6.636431226765799e-06,
	"loss": 0.0091,
	"step": 5025
	},
	{
	"epoch": 10.86021505376344,
	"grad_norm": 0.7359474897384644,
	"learning_rate": 6.617843866171004e-06,
	"loss": 0.0112,
	"step": 5050
	},
	{
	"epoch": 10.913978494623656,
	"grad_norm": 0.4451664090156555,
	"learning_rate": 6.599256505576209e-06,
	"loss": 0.0098,
	"step": 5075
	},
	{
	"epoch": 10.967741935483872,
	"grad_norm": 0.364681214094162,
	"learning_rate": 6.580669144981413e-06,
	"loss": 0.0087,
	"step": 5100
	},
	{
	"epoch": 11.021505376344086,
	"grad_norm": 0.416103720664978,
	"learning_rate": 6.562081784386618e-06,
	"loss": 0.0072,
	"step": 5125
	},
	{
	"epoch": 11.075268817204302,
	"grad_norm": 0.2710916996002197,
	"learning_rate": 6.5434944237918215e-06,
	"loss": 0.0063,
	"step": 5150
	},
	{
	"epoch": 11.129032258064516,
	"grad_norm": 1.4234521389007568,
	"learning_rate": 6.5249070631970265e-06,
	"loss": 0.0062,
	"step": 5175
	},
	{
	"epoch": 11.182795698924732,
	"grad_norm": 0.800237238407135,
	"learning_rate": 6.506319702602231e-06,
	"loss": 0.0075,
	"step": 5200
	},
	{
	"epoch": 11.236559139784946,
	"grad_norm": 0.4724205732345581,
	"learning_rate": 6.487732342007436e-06,
	"loss": 0.0053,
	"step": 5225
	},
	{
	"epoch": 11.290322580645162,
	"grad_norm": 0.12521684169769287,
	"learning_rate": 6.46914498141264e-06,
	"loss": 0.0079,
	"step": 5250
	},
	{
	"epoch": 11.344086021505376,
	"grad_norm": 0.2039920538663864,
	"learning_rate": 6.450557620817845e-06,
	"loss": 0.0069,
	"step": 5275
	},
	{
	"epoch": 11.397849462365592,
	"grad_norm": 1.678312063217163,
	"learning_rate": 6.43197026022305e-06,
	"loss": 0.008,
	"step": 5300
	},
	{
	"epoch": 11.451612903225806,
	"grad_norm": 0.8350504636764526,
	"learning_rate": 6.413382899628253e-06,
	"loss": 0.0069,
	"step": 5325
	},
	{
	"epoch": 11.505376344086022,
	"grad_norm": 0.6541998982429504,
	"learning_rate": 6.394795539033458e-06,
	"loss": 0.009,
	"step": 5350
	},
	{
	"epoch": 11.559139784946236,
	"grad_norm": 1.2869340181350708,
	"learning_rate": 6.376208178438662e-06,
	"loss": 0.0051,
	"step": 5375
	},
	{
	"epoch": 11.612903225806452,
	"grad_norm": 0.987830638885498,
	"learning_rate": 6.357620817843867e-06,
	"loss": 0.0072,
	"step": 5400
	},
	{
	"epoch": 11.666666666666666,
	"grad_norm": 0.4543008804321289,
	"learning_rate": 6.339033457249071e-06,
	"loss": 0.0065,
	"step": 5425
	},
	{
	"epoch": 11.720430107526882,
	"grad_norm": 0.866301953792572,
	"learning_rate": 6.320446096654275e-06,
	"loss": 0.0071,
	"step": 5450
	},
	{
	"epoch": 11.774193548387096,
	"grad_norm": 1.1665536165237427,
	"learning_rate": 6.3018587360594795e-06,
	"loss": 0.0089,
	"step": 5475
	},
	{
	"epoch": 11.827956989247312,
	"grad_norm": 0.5745353102684021,
	"learning_rate": 6.2832713754646845e-06,
	"loss": 0.0086,
	"step": 5500
	},
	{
	"epoch": 11.827956989247312,
	"eval_loss": 0.3715842068195343,
	"eval_runtime": 202.8772,
	"eval_samples_per_second": 4.663,
	"eval_steps_per_second": 0.587,
	"eval_wer": 15.586576684847925,
	"step": 5500
	},
	{
	"epoch": 11.881720430107526,
	"grad_norm": 0.7137680053710938,
	"learning_rate": 6.2646840148698895e-06,
	"loss": 0.0063,
	"step": 5525
	},
	{
	"epoch": 11.935483870967742,
	"grad_norm": 1.8331615924835205,
	"learning_rate": 6.246096654275094e-06,
	"loss": 0.0052,
	"step": 5550
	},
	{
	"epoch": 11.989247311827956,
	"grad_norm": 1.306740403175354,
	"learning_rate": 6.2275092936802986e-06,
	"loss": 0.0084,
	"step": 5575
	},
	{
	"epoch": 12.043010752688172,
	"grad_norm": 0.4689745008945465,
	"learning_rate": 6.208921933085502e-06,
	"loss": 0.0054,
	"step": 5600
	},
	{
	"epoch": 12.096774193548388,
	"grad_norm": 0.8853312134742737,
	"learning_rate": 6.190334572490707e-06,
	"loss": 0.0038,
	"step": 5625
	},
	{
	"epoch": 12.150537634408602,
	"grad_norm": 0.18394626677036285,
	"learning_rate": 6.171747211895911e-06,
	"loss": 0.0058,
	"step": 5650
	},
	{
	"epoch": 12.204301075268818,
	"grad_norm": 0.35906341671943665,
	"learning_rate": 6.153159851301116e-06,
	"loss": 0.0048,
	"step": 5675
	},
	{
	"epoch": 12.258064516129032,
	"grad_norm": 0.0934007316827774,
	"learning_rate": 6.13457249070632e-06,
	"loss": 0.0056,
	"step": 5700
	},
	{
	"epoch": 12.311827956989248,
	"grad_norm": 0.6383976340293884,
	"learning_rate": 6.115985130111525e-06,
	"loss": 0.0049,
	"step": 5725
	},
	{
	"epoch": 12.365591397849462,
	"grad_norm": 0.3622893989086151,
	"learning_rate": 6.097397769516728e-06,
	"loss": 0.0064,
	"step": 5750
	},
	{
	"epoch": 12.419354838709678,
	"grad_norm": 0.21196268498897552,
	"learning_rate": 6.078810408921933e-06,
	"loss": 0.0064,
	"step": 5775
	},
	{
	"epoch": 12.473118279569892,
	"grad_norm": 0.3381194472312927,
	"learning_rate": 6.060223048327138e-06,
	"loss": 0.0054,
	"step": 5800
	},
	{
	"epoch": 12.526881720430108,
	"grad_norm": 1.9906443357467651,
	"learning_rate": 6.041635687732342e-06,
	"loss": 0.0061,
	"step": 5825
	},
	{
	"epoch": 12.580645161290322,
	"grad_norm": 0.3197634220123291,
	"learning_rate": 6.023048327137547e-06,
	"loss": 0.0053,
	"step": 5850
	},
	{
	"epoch": 12.634408602150538,
	"grad_norm": 0.18474631011486053,
	"learning_rate": 6.0044609665427515e-06,
	"loss": 0.0065,
	"step": 5875
	},
	{
	"epoch": 12.688172043010752,
	"grad_norm": 0.8498281240463257,
	"learning_rate": 5.985873605947956e-06,
	"loss": 0.004,
	"step": 5900
	},
	{
	"epoch": 12.741935483870968,
	"grad_norm": 0.4391692578792572,
	"learning_rate": 5.96728624535316e-06,
	"loss": 0.006,
	"step": 5925
	},
	{
	"epoch": 12.795698924731182,
	"grad_norm": 0.6688899993896484,
	"learning_rate": 5.948698884758365e-06,
	"loss": 0.0053,
	"step": 5950
	},
	{
	"epoch": 12.849462365591398,
	"grad_norm": 0.9713292121887207,
	"learning_rate": 5.930111524163569e-06,
	"loss": 0.0072,
	"step": 5975
	},
	{
	"epoch": 12.903225806451612,
	"grad_norm": 0.8484262228012085,
	"learning_rate": 5.911524163568774e-06,
	"loss": 0.0068,
	"step": 6000
	},
	{
	"epoch": 12.903225806451612,
	"eval_loss": 0.37204521894454956,
	"eval_runtime": 201.9047,
	"eval_samples_per_second": 4.685,
	"eval_steps_per_second": 0.589,
	"eval_wer": 14.588148285106776,
	"step": 6000
	},
	{
	"epoch": 12.956989247311828,
	"grad_norm": 1.0728837251663208,
	"learning_rate": 5.892936802973979e-06,
	"loss": 0.0084,
	"step": 6025
	},
	{
	"epoch": 13.010752688172044,
	"grad_norm": 0.4754142761230469,
	"learning_rate": 5.874349442379182e-06,
	"loss": 0.0087,
	"step": 6050
	},
	{
	"epoch": 13.064516129032258,
	"grad_norm": 0.3025985062122345,
	"learning_rate": 5.855762081784387e-06,
	"loss": 0.0063,
	"step": 6075
	},
	{
	"epoch": 13.118279569892474,
	"grad_norm": 0.3236280083656311,
	"learning_rate": 5.837174721189591e-06,
	"loss": 0.0055,
	"step": 6100
	},
	{
	"epoch": 13.172043010752688,
	"grad_norm": 0.508432924747467,
	"learning_rate": 5.818587360594796e-06,
	"loss": 0.0053,
	"step": 6125
	},
	{
	"epoch": 13.225806451612904,
	"grad_norm": 1.6511017084121704,
	"learning_rate": 5.8e-06,
	"loss": 0.0046,
	"step": 6150
	},
	{
	"epoch": 13.279569892473118,
	"grad_norm": 0.142063707113266,
	"learning_rate": 5.781412639405205e-06,
	"loss": 0.0051,
	"step": 6175
	},
	{
	"epoch": 13.333333333333334,
	"grad_norm": 0.11750756949186325,
	"learning_rate": 5.762825278810409e-06,
	"loss": 0.0048,
	"step": 6200
	},
	{
	"epoch": 13.387096774193548,
	"grad_norm": 0.8060685396194458,
	"learning_rate": 5.744237918215614e-06,
	"loss": 0.0057,
	"step": 6225
	},
	{
	"epoch": 13.440860215053764,
	"grad_norm": 0.452999472618103,
	"learning_rate": 5.725650557620819e-06,
	"loss": 0.0059,
	"step": 6250
	},
	{
	"epoch": 13.494623655913978,
	"grad_norm": 1.3556956052780151,
	"learning_rate": 5.707063197026023e-06,
	"loss": 0.0049,
	"step": 6275
	},
	{
	"epoch": 13.548387096774194,
	"grad_norm": 0.1406233310699463,
	"learning_rate": 5.688475836431228e-06,
	"loss": 0.0041,
	"step": 6300
	},
	{
	"epoch": 13.602150537634408,
	"grad_norm": 0.6670034527778625,
	"learning_rate": 5.669888475836432e-06,
	"loss": 0.0057,
	"step": 6325
	},
	{
	"epoch": 13.655913978494624,
	"grad_norm": 1.7057311534881592,
	"learning_rate": 5.651301115241636e-06,
	"loss": 0.0056,
	"step": 6350
	},
	{
	"epoch": 13.709677419354838,
	"grad_norm": 0.7842967510223389,
	"learning_rate": 5.63271375464684e-06,
	"loss": 0.0062,
	"step": 6375
	},
	{
	"epoch": 13.763440860215054,
	"grad_norm": 0.7574280500411987,
	"learning_rate": 5.614126394052045e-06,
	"loss": 0.006,
	"step": 6400
	},
	{
	"epoch": 13.817204301075268,
	"grad_norm": 1.1247819662094116,
	"learning_rate": 5.595539033457249e-06,
	"loss": 0.0091,
	"step": 6425
	},
	{
	"epoch": 13.870967741935484,
	"grad_norm": 0.5980854034423828,
	"learning_rate": 5.576951672862454e-06,
	"loss": 0.005,
	"step": 6450
	},
	{
	"epoch": 13.924731182795698,
	"grad_norm": 0.6640056371688843,
	"learning_rate": 5.558364312267659e-06,
	"loss": 0.0061,
	"step": 6475
	},
	{
	"epoch": 13.978494623655914,
	"grad_norm": 0.6742274165153503,
	"learning_rate": 5.5397769516728625e-06,
	"loss": 0.0056,
	"step": 6500
	},
	{
	"epoch": 13.978494623655914,
	"eval_loss": 0.37743857502937317,
	"eval_runtime": 202.8285,
	"eval_samples_per_second": 4.664,
	"eval_steps_per_second": 0.587,
	"eval_wer": 14.819265970232042,
	"step": 6500
	},
	{
	"epoch": 14.03225806451613,
	"grad_norm": 0.1915878802537918,
	"learning_rate": 5.5211895910780674e-06,
	"loss": 0.0045,
	"step": 6525
	},
	{
	"epoch": 14.086021505376344,
	"grad_norm": 0.09815018624067307,
	"learning_rate": 5.5026022304832716e-06,
	"loss": 0.0057,
	"step": 6550
	},
	{
	"epoch": 14.13978494623656,
	"grad_norm": 0.04359288886189461,
	"learning_rate": 5.4840148698884765e-06,
	"loss": 0.005,
	"step": 6575
	},
	{
	"epoch": 14.193548387096774,
	"grad_norm": 0.28134745359420776,
	"learning_rate": 5.465427509293681e-06,
	"loss": 0.0029,
	"step": 6600
	},
	{
	"epoch": 14.24731182795699,
	"grad_norm": 0.6944845914840698,
	"learning_rate": 5.446840148698886e-06,
	"loss": 0.0056,
	"step": 6625
	},
	{
	"epoch": 14.301075268817204,
	"grad_norm": 1.5637778043746948,
	"learning_rate": 5.428252788104089e-06,
	"loss": 0.0037,
	"step": 6650
	},
	{
	"epoch": 14.35483870967742,
	"grad_norm": 0.49470245838165283,
	"learning_rate": 5.409665427509294e-06,
	"loss": 0.0064,
	"step": 6675
	},
	{
	"epoch": 14.408602150537634,
	"grad_norm": 0.055743150413036346,
	"learning_rate": 5.391078066914499e-06,
	"loss": 0.0033,
	"step": 6700
	},
	{
	"epoch": 14.46236559139785,
	"grad_norm": 0.20047767460346222,
	"learning_rate": 5.372490706319703e-06,
	"loss": 0.0047,
	"step": 6725
	},
	{
	"epoch": 14.516129032258064,
	"grad_norm": 0.36383625864982605,
	"learning_rate": 5.353903345724908e-06,
	"loss": 0.0037,
	"step": 6750
	},
	{
	"epoch": 14.56989247311828,
	"grad_norm": 0.07147414237260818,
	"learning_rate": 5.335315985130112e-06,
	"loss": 0.0026,
	"step": 6775
	},
	{
	"epoch": 14.623655913978494,
	"grad_norm": 0.28435853123664856,
	"learning_rate": 5.316728624535316e-06,
	"loss": 0.0043,
	"step": 6800
	},
	{
	"epoch": 14.67741935483871,
	"grad_norm": 0.27296435832977295,
	"learning_rate": 5.29814126394052e-06,
	"loss": 0.0068,
	"step": 6825
	},
	{
	"epoch": 14.731182795698924,
	"grad_norm": 0.9266132116317749,
	"learning_rate": 5.279553903345725e-06,
	"loss": 0.0065,
	"step": 6850
	},
	{
	"epoch": 14.78494623655914,
	"grad_norm": 0.4447098970413208,
	"learning_rate": 5.2609665427509295e-06,
	"loss": 0.0051,
	"step": 6875
	},
	{
	"epoch": 14.838709677419354,
	"grad_norm": 0.6710329055786133,
	"learning_rate": 5.2423791821561345e-06,
	"loss": 0.0044,
	"step": 6900
	},
	{
	"epoch": 14.89247311827957,
	"grad_norm": 0.5553959012031555,
	"learning_rate": 5.2237918215613395e-06,
	"loss": 0.0062,
	"step": 6925
	},
	{
	"epoch": 14.946236559139784,
	"grad_norm": 0.867906928062439,
	"learning_rate": 5.205204460966543e-06,
	"loss": 0.0075,
	"step": 6950
	},
	{
	"epoch": 15.0,
	"grad_norm": 0.5631603002548218,
	"learning_rate": 5.186617100371748e-06,
	"loss": 0.0056,
	"step": 6975
	},
	{
	"epoch": 15.053763440860216,
	"grad_norm": 0.16968116164207458,
	"learning_rate": 5.168029739776952e-06,
	"loss": 0.0032,
	"step": 7000
	},
	{
	"epoch": 15.053763440860216,
	"eval_loss": 0.3897517919540405,
	"eval_runtime": 202.1138,
	"eval_samples_per_second": 4.681,
	"eval_steps_per_second": 0.589,
	"eval_wer": 14.597392992511788,
	"step": 7000
	},
	{
	"epoch": 15.10752688172043,
	"grad_norm": 0.43974125385284424,
	"learning_rate": 5.149442379182157e-06,
	"loss": 0.005,
	"step": 7025
	},
	{
	"epoch": 15.161290322580646,
	"grad_norm": 0.1777154952287674,
	"learning_rate": 5.130855018587361e-06,
	"loss": 0.0023,
	"step": 7050
	},
	{
	"epoch": 15.21505376344086,
	"grad_norm": 0.0768185630440712,
	"learning_rate": 5.112267657992566e-06,
	"loss": 0.0045,
	"step": 7075
	},
	{
	"epoch": 15.268817204301076,
	"grad_norm": 0.04717967286705971,
	"learning_rate": 5.093680297397769e-06,
	"loss": 0.0043,
	"step": 7100
	},
	{
	"epoch": 15.32258064516129,
	"grad_norm": 0.25022652745246887,
	"learning_rate": 5.075092936802974e-06,
	"loss": 0.003,
	"step": 7125
	},
	{
	"epoch": 15.376344086021506,
	"grad_norm": 0.07506144791841507,
	"learning_rate": 5.056505576208179e-06,
	"loss": 0.0043,
	"step": 7150
	},
	{
	"epoch": 15.43010752688172,
	"grad_norm": 0.850889265537262,
	"learning_rate": 5.037918215613383e-06,
	"loss": 0.0055,
	"step": 7175
	},
	{
	"epoch": 15.483870967741936,
	"grad_norm": 0.5556985139846802,
	"learning_rate": 5.019330855018588e-06,
	"loss": 0.0051,
	"step": 7200
	},
	{
	"epoch": 15.53763440860215,
	"grad_norm": 0.0634092465043068,
	"learning_rate": 5.0007434944237924e-06,
	"loss": 0.003,
	"step": 7225
	},
	{
	"epoch": 15.591397849462366,
	"grad_norm": 0.2446642518043518,
	"learning_rate": 4.982156133828997e-06,
	"loss": 0.0047,
	"step": 7250
	},
	{
	"epoch": 15.64516129032258,
	"grad_norm": 1.191821575164795,
	"learning_rate": 4.9635687732342016e-06,
	"loss": 0.0045,
	"step": 7275
	},
	{
	"epoch": 15.698924731182796,
	"grad_norm": 0.4117543399333954,
	"learning_rate": 4.944981412639406e-06,
	"loss": 0.0062,
	"step": 7300
	},
	{
	"epoch": 15.75268817204301,
	"grad_norm": 0.8248342275619507,
	"learning_rate": 4.92639405204461e-06,
	"loss": 0.0043,
	"step": 7325
	},
	{
	"epoch": 15.806451612903226,
	"grad_norm": 0.29120975732803345,
	"learning_rate": 4.907806691449815e-06,
	"loss": 0.0061,
	"step": 7350
	},
	{
	"epoch": 15.86021505376344,
	"grad_norm": 0.0745767205953598,
	"learning_rate": 4.889219330855019e-06,
	"loss": 0.0048,
	"step": 7375
	},
	{
	"epoch": 15.913978494623656,
	"grad_norm": 0.10059848427772522,
	"learning_rate": 4.870631970260223e-06,
	"loss": 0.004,
	"step": 7400
	},
	{
	"epoch": 15.967741935483872,
	"grad_norm": 0.11489495635032654,
	"learning_rate": 4.852044609665428e-06,
	"loss": 0.004,
	"step": 7425
	},
	{
	"epoch": 16.021505376344088,
	"grad_norm": 0.04976237937808037,
	"learning_rate": 4.833457249070632e-06,
	"loss": 0.0036,
	"step": 7450
	},
	{
	"epoch": 16.0752688172043,
	"grad_norm": 0.13619866967201233,
	"learning_rate": 4.814869888475836e-06,
	"loss": 0.0031,
	"step": 7475
	},
	{
	"epoch": 16.129032258064516,
	"grad_norm": 0.35101068019866943,
	"learning_rate": 4.796282527881041e-06,
	"loss": 0.0037,
	"step": 7500
	},
	{
	"epoch": 16.129032258064516,
	"eval_loss": 0.390476793050766,
	"eval_runtime": 202.418,
	"eval_samples_per_second": 4.673,
	"eval_steps_per_second": 0.588,
	"eval_wer": 14.708329481371916,
	"step": 7500
	},
	{
	"epoch": 16.182795698924732,
	"grad_norm": 0.315719872713089,
	"learning_rate": 4.777695167286246e-06,
	"loss": 0.003,
	"step": 7525
	},
	{
	"epoch": 16.236559139784948,
	"grad_norm": 1.0123934745788574,
	"learning_rate": 4.75910780669145e-06,
	"loss": 0.0035,
	"step": 7550
	},
	{
	"epoch": 16.29032258064516,
	"grad_norm": 0.517242968082428,
	"learning_rate": 4.7405204460966545e-06,
	"loss": 0.003,
	"step": 7575
	},
	{
	"epoch": 16.344086021505376,
	"grad_norm": 0.06284263730049133,
	"learning_rate": 4.7219330855018595e-06,
	"loss": 0.0024,
	"step": 7600
	},
	{
	"epoch": 16.397849462365592,
	"grad_norm": 0.02318274788558483,
	"learning_rate": 4.703345724907064e-06,
	"loss": 0.0039,
	"step": 7625
	},
	{
	"epoch": 16.451612903225808,
	"grad_norm": 0.2524121105670929,
	"learning_rate": 4.684758364312268e-06,
	"loss": 0.0041,
	"step": 7650
	},
	{
	"epoch": 16.50537634408602,
	"grad_norm": 0.047711629420518875,
	"learning_rate": 4.666171003717473e-06,
	"loss": 0.0041,
	"step": 7675
	},
	{
	"epoch": 16.559139784946236,
	"grad_norm": 0.32103028893470764,
	"learning_rate": 4.647583643122677e-06,
	"loss": 0.0061,
	"step": 7700
	},
	{
	"epoch": 16.612903225806452,
	"grad_norm": 1.1334346532821655,
	"learning_rate": 4.628996282527882e-06,
	"loss": 0.0043,
	"step": 7725
	},
	{
	"epoch": 16.666666666666668,
	"grad_norm": 0.11029840260744095,
	"learning_rate": 4.610408921933086e-06,
	"loss": 0.0015,
	"step": 7750
	},
	{
	"epoch": 16.72043010752688,
	"grad_norm": 0.03998972475528717,
	"learning_rate": 4.59182156133829e-06,
	"loss": 0.0035,
	"step": 7775
	},
	{
	"epoch": 16.774193548387096,
	"grad_norm": 0.9175609946250916,
	"learning_rate": 4.573234200743495e-06,
	"loss": 0.0037,
	"step": 7800
	},
	{
	"epoch": 16.827956989247312,
	"grad_norm": 0.055633947253227234,
	"learning_rate": 4.554646840148699e-06,
	"loss": 0.0035,
	"step": 7825
	},
	{
	"epoch": 16.881720430107528,
	"grad_norm": 0.28876572847366333,
	"learning_rate": 4.536059479553903e-06,
	"loss": 0.0036,
	"step": 7850
	},
	{
	"epoch": 16.93548387096774,
	"grad_norm": 0.09186781197786331,
	"learning_rate": 4.517472118959108e-06,
	"loss": 0.0034,
	"step": 7875
	},
	{
	"epoch": 16.989247311827956,
	"grad_norm": 0.024787306785583496,
	"learning_rate": 4.4988847583643125e-06,
	"loss": 0.0035,
	"step": 7900
	},
	{
	"epoch": 17.043010752688172,
	"grad_norm": 0.30542510747909546,
	"learning_rate": 4.480297397769517e-06,
	"loss": 0.0027,
	"step": 7925
	},
	{
	"epoch": 17.096774193548388,
	"grad_norm": 0.20729881525039673,
	"learning_rate": 4.461710037174722e-06,
	"loss": 0.0016,
	"step": 7950
	},
	{
	"epoch": 17.150537634408604,
	"grad_norm": 0.17623752355575562,
	"learning_rate": 4.4431226765799266e-06,
	"loss": 0.003,
	"step": 7975
	},
	{
	"epoch": 17.204301075268816,
	"grad_norm": 1.2774063348770142,
	"learning_rate": 4.424535315985131e-06,
	"loss": 0.0041,
	"step": 8000
	},
	{
	"epoch": 17.204301075268816,
	"eval_loss": 0.38328301906585693,
	"eval_runtime": 202.8745,
	"eval_samples_per_second": 4.663,
	"eval_steps_per_second": 0.587,
	"eval_wer": 14.440232966626606,
	"step": 8000
	},
	{
	"epoch": 17.258064516129032,
	"grad_norm": 0.24027810990810394,
	"learning_rate": 4.405947955390335e-06,
	"loss": 0.0042,
	"step": 8025
	},
	{
	"epoch": 17.311827956989248,
	"grad_norm": 0.6575544476509094,
	"learning_rate": 4.38736059479554e-06,
	"loss": 0.0033,
	"step": 8050
	},
	{
	"epoch": 17.365591397849464,
	"grad_norm": 0.7652745842933655,
	"learning_rate": 4.368773234200744e-06,
	"loss": 0.0025,
	"step": 8075
	},
	{
	"epoch": 17.419354838709676,
	"grad_norm": 1.0893921852111816,
	"learning_rate": 4.350185873605948e-06,
	"loss": 0.0044,
	"step": 8100
	},
	{
	"epoch": 17.473118279569892,
	"grad_norm": 0.381245881319046,
	"learning_rate": 4.331598513011153e-06,
	"loss": 0.0053,
	"step": 8125
	},
	{
	"epoch": 17.526881720430108,
	"grad_norm": 0.6958642601966858,
	"learning_rate": 4.313011152416357e-06,
	"loss": 0.003,
	"step": 8150
	},
	{
	"epoch": 17.580645161290324,
	"grad_norm": 0.3542903661727905,
	"learning_rate": 4.294423791821561e-06,
	"loss": 0.0031,
	"step": 8175
	},
	{
	"epoch": 17.634408602150536,
	"grad_norm": 0.12086351215839386,
	"learning_rate": 4.275836431226766e-06,
	"loss": 0.0024,
	"step": 8200
	},
	{
	"epoch": 17.688172043010752,
	"grad_norm": 0.41448554396629333,
	"learning_rate": 4.2572490706319704e-06,
	"loss": 0.0035,
	"step": 8225
	},
	{
	"epoch": 17.741935483870968,
	"grad_norm": 0.06691323965787888,
	"learning_rate": 4.238661710037175e-06,
	"loss": 0.0035,
	"step": 8250
	},
	{
	"epoch": 17.795698924731184,
	"grad_norm": 0.7434226870536804,
	"learning_rate": 4.2200743494423795e-06,
	"loss": 0.0053,
	"step": 8275
	},
	{
	"epoch": 17.849462365591396,
	"grad_norm": 0.36501583456993103,
	"learning_rate": 4.201486988847584e-06,
	"loss": 0.004,
	"step": 8300
	},
	{
	"epoch": 17.903225806451612,
	"grad_norm": 0.2055322229862213,
	"learning_rate": 4.182899628252789e-06,
	"loss": 0.0043,
	"step": 8325
	},
	{
	"epoch": 17.956989247311828,
	"grad_norm": 0.7392027378082275,
	"learning_rate": 4.164312267657993e-06,
	"loss": 0.004,
	"step": 8350
	},
	{
	"epoch": 18.010752688172044,
	"grad_norm": 0.07294179499149323,
	"learning_rate": 4.145724907063197e-06,
	"loss": 0.0055,
	"step": 8375
	},
	{
	"epoch": 18.06451612903226,
	"grad_norm": 0.0656030923128128,
	"learning_rate": 4.127137546468402e-06,
	"loss": 0.0024,
	"step": 8400
	},
	{
	"epoch": 18.118279569892472,
	"grad_norm": 0.05267421901226044,
	"learning_rate": 4.108550185873607e-06,
	"loss": 0.0033,
	"step": 8425
	},
	{
	"epoch": 18.172043010752688,
	"grad_norm": 0.704990565776825,
	"learning_rate": 4.089962825278811e-06,
	"loss": 0.0047,
	"step": 8450
	},
	{
	"epoch": 18.225806451612904,
	"grad_norm": 0.24530240893363953,
	"learning_rate": 4.071375464684015e-06,
	"loss": 0.0043,
	"step": 8475
	},
	{
	"epoch": 18.27956989247312,
	"grad_norm": 0.19997531175613403,
	"learning_rate": 4.05278810408922e-06,
	"loss": 0.0035,
	"step": 8500
	},
	{
	"epoch": 18.27956989247312,
	"eval_loss": 0.3821885585784912,
	"eval_runtime": 203.3448,
	"eval_samples_per_second": 4.652,
	"eval_steps_per_second": 0.585,
	"eval_wer": 14.412498844411575,
	"step": 8500
	},
	{
	"epoch": 18.333333333333332,
	"grad_norm": 0.0332474559545517,
	"learning_rate": 4.034200743494424e-06,
	"loss": 0.0031,
	"step": 8525
	},
	{
	"epoch": 18.387096774193548,
	"grad_norm": 1.3561875820159912,
	"learning_rate": 4.015613382899628e-06,
	"loss": 0.0017,
	"step": 8550
	},
	{
	"epoch": 18.440860215053764,
	"grad_norm": 0.029482562094926834,
	"learning_rate": 3.997026022304833e-06,
	"loss": 0.0021,
	"step": 8575
	},
	{
	"epoch": 18.49462365591398,
	"grad_norm": 0.12231668084859848,
	"learning_rate": 3.9784386617100375e-06,
	"loss": 0.0043,
	"step": 8600
	},
	{
	"epoch": 18.548387096774192,
	"grad_norm": 0.044476673007011414,
	"learning_rate": 3.959851301115242e-06,
	"loss": 0.0024,
	"step": 8625
	},
	{
	"epoch": 18.602150537634408,
	"grad_norm": 0.6735191345214844,
	"learning_rate": 3.941263940520447e-06,
	"loss": 0.0032,
	"step": 8650
	},
	{
	"epoch": 18.655913978494624,
	"grad_norm": 1.0479316711425781,
	"learning_rate": 3.922676579925651e-06,
	"loss": 0.0024,
	"step": 8675
	},
	{
	"epoch": 18.70967741935484,
	"grad_norm": 0.023525085300207138,
	"learning_rate": 3.904089219330856e-06,
	"loss": 0.0049,
	"step": 8700
	},
	{
	"epoch": 18.763440860215052,
	"grad_norm": 0.165565624833107,
	"learning_rate": 3.88550185873606e-06,
	"loss": 0.0039,
	"step": 8725
	},
	{
	"epoch": 18.817204301075268,
	"grad_norm": 0.5960690379142761,
	"learning_rate": 3.866914498141264e-06,
	"loss": 0.003,
	"step": 8750
	},
	{
	"epoch": 18.870967741935484,
	"grad_norm": 0.23799718916416168,
	"learning_rate": 3.848327137546469e-06,
	"loss": 0.002,
	"step": 8775
	},
	{
	"epoch": 18.9247311827957,
	"grad_norm": 0.01600775308907032,
	"learning_rate": 3.829739776951673e-06,
	"loss": 0.0022,
	"step": 8800
	},
	{
	"epoch": 18.978494623655912,
	"grad_norm": 0.3210331201553345,
	"learning_rate": 3.8111524163568776e-06,
	"loss": 0.0033,
	"step": 8825
	},
	{
	"epoch": 19.032258064516128,
	"grad_norm": 0.05005327984690666,
	"learning_rate": 3.7925650557620818e-06,
	"loss": 0.0033,
	"step": 8850
	},
	{
	"epoch": 19.086021505376344,
	"grad_norm": 0.4820277690887451,
	"learning_rate": 3.7739776951672863e-06,
	"loss": 0.0034,
	"step": 8875
	},
	{
	"epoch": 19.13978494623656,
	"grad_norm": 0.1907467395067215,
	"learning_rate": 3.7553903345724913e-06,
	"loss": 0.0025,
	"step": 8900
	},
	{
	"epoch": 19.193548387096776,
	"grad_norm": 0.023403950035572052,
	"learning_rate": 3.7368029739776954e-06,
	"loss": 0.0024,
	"step": 8925
	},
	{
	"epoch": 19.247311827956988,
	"grad_norm": 0.02337467670440674,
	"learning_rate": 3.7182156133829e-06,
	"loss": 0.0038,
	"step": 8950
	},
	{
	"epoch": 19.301075268817204,
	"grad_norm": 0.42413467168807983,
	"learning_rate": 3.6996282527881046e-06,
	"loss": 0.0048,
	"step": 8975
	},
	{
	"epoch": 19.35483870967742,
	"grad_norm": 0.0469290092587471,
	"learning_rate": 3.6810408921933087e-06,
	"loss": 0.0034,
	"step": 9000
	},
	{
	"epoch": 19.35483870967742,
	"eval_loss": 0.38839593529701233,
	"eval_runtime": 202.9911,
	"eval_samples_per_second": 4.66,
	"eval_steps_per_second": 0.586,
	"eval_wer": 14.62512711472682,
	"step": 9000
	},
	{
	"epoch": 19.408602150537636,
	"grad_norm": 0.2083800882101059,
	"learning_rate": 3.6624535315985132e-06,
	"loss": 0.0029,
	"step": 9025
	},
	{
	"epoch": 19.462365591397848,
	"grad_norm": 0.16142559051513672,
	"learning_rate": 3.643866171003718e-06,
	"loss": 0.0028,
	"step": 9050
	},
	{
	"epoch": 19.516129032258064,
	"grad_norm": 0.02445228025317192,
	"learning_rate": 3.625278810408922e-06,
	"loss": 0.0031,
	"step": 9075
	},
	{
	"epoch": 19.56989247311828,
	"grad_norm": 0.10709693282842636,
	"learning_rate": 3.6066914498141265e-06,
	"loss": 0.0028,
	"step": 9100
	},
	{
	"epoch": 19.623655913978496,
	"grad_norm": 0.48716649413108826,
	"learning_rate": 3.5881040892193315e-06,
	"loss": 0.0024,
	"step": 9125
	},
	{
	"epoch": 19.677419354838708,
	"grad_norm": 0.043807078152894974,
	"learning_rate": 3.5695167286245356e-06,
	"loss": 0.0026,
	"step": 9150
	},
	{
	"epoch": 19.731182795698924,
	"grad_norm": 0.008909267373383045,
	"learning_rate": 3.55092936802974e-06,
	"loss": 0.0027,
	"step": 9175
	},
	{
	"epoch": 19.78494623655914,
	"grad_norm": 0.0496838316321373,
	"learning_rate": 3.5323420074349447e-06,
	"loss": 0.0028,
	"step": 9200
	},
	{
	"epoch": 19.838709677419356,
	"grad_norm": 0.3045809864997864,
	"learning_rate": 3.513754646840149e-06,
	"loss": 0.0043,
	"step": 9225
	},
	{
	"epoch": 19.892473118279568,
	"grad_norm": 0.019404035061597824,
	"learning_rate": 3.4951672862453534e-06,
	"loss": 0.0022,
	"step": 9250
	},
	{
	"epoch": 19.946236559139784,
	"grad_norm": 0.05067993700504303,
	"learning_rate": 3.476579925650558e-06,
	"loss": 0.0027,
	"step": 9275
	},
	{
	"epoch": 20.0,
	"grad_norm": 0.17729219794273376,
	"learning_rate": 3.457992565055762e-06,
	"loss": 0.0021,
	"step": 9300
	},
	{
	"epoch": 20.053763440860216,
	"grad_norm": 0.166994109749794,
	"learning_rate": 3.4394052044609666e-06,
	"loss": 0.0025,
	"step": 9325
	},
	{
	"epoch": 20.107526881720432,
	"grad_norm": 0.026689428836107254,
	"learning_rate": 3.4208178438661716e-06,
	"loss": 0.0035,
	"step": 9350
	},
	{
	"epoch": 20.161290322580644,
	"grad_norm": 0.016895387321710587,
	"learning_rate": 3.4022304832713757e-06,
	"loss": 0.0026,
	"step": 9375
	},
	{
	"epoch": 20.21505376344086,
	"grad_norm": 0.06793255358934402,
	"learning_rate": 3.3836431226765803e-06,
	"loss": 0.0015,
	"step": 9400
	},
	{
	"epoch": 20.268817204301076,
	"grad_norm": 0.034562163054943085,
	"learning_rate": 3.365055762081785e-06,
	"loss": 0.0027,
	"step": 9425
	},
	{
	"epoch": 20.322580645161292,
	"grad_norm": 0.16164565086364746,
	"learning_rate": 3.346468401486989e-06,
	"loss": 0.0023,
	"step": 9450
	},
	{
	"epoch": 20.376344086021504,
	"grad_norm": 0.015665782615542412,
	"learning_rate": 3.3278810408921935e-06,
	"loss": 0.002,
	"step": 9475
	},
	{
	"epoch": 20.43010752688172,
	"grad_norm": 0.009676897898316383,
	"learning_rate": 3.309293680297398e-06,
	"loss": 0.0027,
	"step": 9500
	},
	{
	"epoch": 20.43010752688172,
	"eval_loss": 0.39532387256622314,
	"eval_runtime": 202.6591,
	"eval_samples_per_second": 4.668,
	"eval_steps_per_second": 0.587,
	"eval_wer": 14.449477674031616,
	"step": 9500
	},
	{
	"epoch": 20.483870967741936,
	"grad_norm": 0.16924279928207397,
	"learning_rate": 3.2907063197026022e-06,
	"loss": 0.0022,
	"step": 9525
	},
	{
	"epoch": 20.537634408602152,
	"grad_norm": 0.3499106168746948,
	"learning_rate": 3.272118959107807e-06,
	"loss": 0.0017,
	"step": 9550
	},
	{
	"epoch": 20.591397849462364,
	"grad_norm": 0.5156524181365967,
	"learning_rate": 3.2535315985130113e-06,
	"loss": 0.0027,
	"step": 9575
	},
	{
	"epoch": 20.64516129032258,
	"grad_norm": 0.12964314222335815,
	"learning_rate": 3.234944237918216e-06,
	"loss": 0.0029,
	"step": 9600
	},
	{
	"epoch": 20.698924731182796,
	"grad_norm": 0.4109344482421875,
	"learning_rate": 3.2163568773234205e-06,
	"loss": 0.002,
	"step": 9625
	},
	{
	"epoch": 20.752688172043012,
	"grad_norm": 0.17528752982616425,
	"learning_rate": 3.197769516728625e-06,
	"loss": 0.0025,
	"step": 9650
	},
	{
	"epoch": 20.806451612903224,
	"grad_norm": 0.27459415793418884,
	"learning_rate": 3.179182156133829e-06,
	"loss": 0.002,
	"step": 9675
	},
	{
	"epoch": 20.86021505376344,
	"grad_norm": 0.7621147036552429,
	"learning_rate": 3.1605947955390337e-06,
	"loss": 0.0019,
	"step": 9700
	},
	{
	"epoch": 20.913978494623656,
	"grad_norm": 0.03115130215883255,
	"learning_rate": 3.1420074349442383e-06,
	"loss": 0.0021,
	"step": 9725
	},
	{
	"epoch": 20.967741935483872,
	"grad_norm": 0.3843834698200226,
	"learning_rate": 3.1234200743494424e-06,
	"loss": 0.0037,
	"step": 9750
	},
	{
	"epoch": 21.021505376344088,
	"grad_norm": 0.11314116418361664,
	"learning_rate": 3.104832713754647e-06,
	"loss": 0.0019,
	"step": 9775
	},
	{
	"epoch": 21.0752688172043,
	"grad_norm": 0.008430559188127518,
	"learning_rate": 3.0862453531598515e-06,
	"loss": 0.0016,
	"step": 9800
	},
	{
	"epoch": 21.129032258064516,
	"grad_norm": 0.014893501996994019,
	"learning_rate": 3.067657992565056e-06,
	"loss": 0.0012,
	"step": 9825
	},
	{
	"epoch": 21.182795698924732,
	"grad_norm": 0.020304594188928604,
	"learning_rate": 3.0490706319702606e-06,
	"loss": 0.0014,
	"step": 9850
	},
	{
	"epoch": 21.236559139784948,
	"grad_norm": 0.12655578553676605,
	"learning_rate": 3.030483271375465e-06,
	"loss": 0.0026,
	"step": 9875
	},
	{
	"epoch": 21.29032258064516,
	"grad_norm": 0.014000285416841507,
	"learning_rate": 3.0118959107806693e-06,
	"loss": 0.0026,
	"step": 9900
	},
	{
	"epoch": 21.344086021505376,
	"grad_norm": 0.026862381026148796,
	"learning_rate": 2.993308550185874e-06,
	"loss": 0.0024,
	"step": 9925
	},
	{
	"epoch": 21.397849462365592,
	"grad_norm": 0.03989304229617119,
	"learning_rate": 2.9747211895910784e-06,
	"loss": 0.0018,
	"step": 9950
	},
	{
	"epoch": 21.451612903225808,
	"grad_norm": 0.019757866859436035,
	"learning_rate": 2.9561338289962825e-06,
	"loss": 0.0031,
	"step": 9975
	},
	{
	"epoch": 21.50537634408602,
	"grad_norm": 0.02383114956319332,
	"learning_rate": 2.937546468401487e-06,
	"loss": 0.0022,
	"step": 10000
	},
	{
	"epoch": 21.50537634408602,
	"eval_loss": 0.40046602487564087,
	"eval_runtime": 202.0733,
	"eval_samples_per_second": 4.681,
	"eval_steps_per_second": 0.589,
	"eval_wer": 14.449477674031616,
	"step": 10000
	},
	{
	"epoch": 21.559139784946236,
	"grad_norm": 0.019417457282543182,
	"learning_rate": 2.9189591078066916e-06,
	"loss": 0.0027,
	"step": 10025
	},
	{
	"epoch": 21.612903225806452,
	"grad_norm": 0.15449251234531403,
	"learning_rate": 2.900371747211896e-06,
	"loss": 0.0017,
	"step": 10050
	},
	{
	"epoch": 21.666666666666668,
	"grad_norm": 0.16010086238384247,
	"learning_rate": 2.8817843866171008e-06,
	"loss": 0.0018,
	"step": 10075
	},
	{
	"epoch": 21.72043010752688,
	"grad_norm": 0.02312368154525757,
	"learning_rate": 2.8631970260223053e-06,
	"loss": 0.0036,
	"step": 10100
	},
	{
	"epoch": 21.774193548387096,
	"grad_norm": 0.040190454572439194,
	"learning_rate": 2.8446096654275094e-06,
	"loss": 0.0024,
	"step": 10125
	},
	{
	"epoch": 21.827956989247312,
	"grad_norm": 0.030338788405060768,
	"learning_rate": 2.826022304832714e-06,
	"loss": 0.0024,
	"step": 10150
	},
	{
	"epoch": 21.881720430107528,
	"grad_norm": 0.18002262711524963,
	"learning_rate": 2.8074349442379186e-06,
	"loss": 0.0029,
	"step": 10175
	},
	{
	"epoch": 21.93548387096774,
	"grad_norm": 0.047431185841560364,
	"learning_rate": 2.7888475836431227e-06,
	"loss": 0.0013,
	"step": 10200
	},
	{
	"epoch": 21.989247311827956,
	"grad_norm": 0.12101946771144867,
	"learning_rate": 2.7702602230483272e-06,
	"loss": 0.003,
	"step": 10225
	},
	{
	"epoch": 22.043010752688172,
	"grad_norm": 0.01733570732176304,
	"learning_rate": 2.751672862453532e-06,
	"loss": 0.0013,
	"step": 10250
	},
	{
	"epoch": 22.096774193548388,
	"grad_norm": 0.02413998357951641,
	"learning_rate": 2.7330855018587364e-06,
	"loss": 0.0024,
	"step": 10275
	},
	{
	"epoch": 22.150537634408604,
	"grad_norm": 0.006610923912376165,
	"learning_rate": 2.714498141263941e-06,
	"loss": 0.0015,
	"step": 10300
	},
	{
	"epoch": 22.204301075268816,
	"grad_norm": 0.11478333920240402,
	"learning_rate": 2.6959107806691455e-06,
	"loss": 0.0014,
	"step": 10325
	},
	{
	"epoch": 22.258064516129032,
	"grad_norm": 0.8776764869689941,
	"learning_rate": 2.6773234200743496e-06,
	"loss": 0.0019,
	"step": 10350
	},
	{
	"epoch": 22.311827956989248,
	"grad_norm": 0.020020902156829834,
	"learning_rate": 2.658736059479554e-06,
	"loss": 0.0022,
	"step": 10375
	},
	{
	"epoch": 22.365591397849464,
	"grad_norm": 0.019508883357048035,
	"learning_rate": 2.6401486988847587e-06,
	"loss": 0.0017,
	"step": 10400
	},
	{
	"epoch": 22.419354838709676,
	"grad_norm": 0.02609153278172016,
	"learning_rate": 2.621561338289963e-06,
	"loss": 0.0013,
	"step": 10425
	},
	{
	"epoch": 22.473118279569892,
	"grad_norm": 0.027138570323586464,
	"learning_rate": 2.6029739776951674e-06,
	"loss": 0.0019,
	"step": 10450
	},
	{
	"epoch": 22.526881720430108,
	"grad_norm": 0.01063444558531046,
	"learning_rate": 2.584386617100372e-06,
	"loss": 0.0026,
	"step": 10475
	},
	{
	"epoch": 22.580645161290324,
	"grad_norm": 0.24903129041194916,
	"learning_rate": 2.565799256505576e-06,
	"loss": 0.0027,
	"step": 10500
	},
	{
	"epoch": 22.580645161290324,
	"eval_loss": 0.40335774421691895,
	"eval_runtime": 202.0679,
	"eval_samples_per_second": 4.682,
	"eval_steps_per_second": 0.589,
	"eval_wer": 13.93177405935102,
	"step": 10500
	},
	{
	"epoch": 22.634408602150536,
	"grad_norm": 0.1529041826725006,
	"learning_rate": 2.547211895910781e-06,
	"loss": 0.0018,
	"step": 10525
	},
	{
	"epoch": 22.688172043010752,
	"grad_norm": 0.02129989117383957,
	"learning_rate": 2.5286245353159856e-06,
	"loss": 0.0013,
	"step": 10550
	},
	{
	"epoch": 22.741935483870968,
	"grad_norm": 0.013442150317132473,
	"learning_rate": 2.5100371747211898e-06,
	"loss": 0.0028,
	"step": 10575
	},
	{
	"epoch": 22.795698924731184,
	"grad_norm": 0.024951398372650146,
	"learning_rate": 2.4914498141263943e-06,
	"loss": 0.0022,
	"step": 10600
	},
	{
	"epoch": 22.849462365591396,
	"grad_norm": 0.3933217525482178,
	"learning_rate": 2.472862453531599e-06,
	"loss": 0.0033,
	"step": 10625
	},
	{
	"epoch": 22.903225806451612,
	"grad_norm": 0.030309738591313362,
	"learning_rate": 2.454275092936803e-06,
	"loss": 0.0012,
	"step": 10650
	},
	{
	"epoch": 22.956989247311828,
	"grad_norm": 0.1965196579694748,
	"learning_rate": 2.4356877323420076e-06,
	"loss": 0.0019,
	"step": 10675
	},
	{
	"epoch": 23.010752688172044,
	"grad_norm": 0.2897844612598419,
	"learning_rate": 2.417100371747212e-06,
	"loss": 0.0017,
	"step": 10700
	},
	{
	"epoch": 23.06451612903226,
	"grad_norm": 0.010055635124444962,
	"learning_rate": 2.3985130111524167e-06,
	"loss": 0.0017,
	"step": 10725
	},
	{
	"epoch": 23.118279569892472,
	"grad_norm": 0.02669104002416134,
	"learning_rate": 2.379925650557621e-06,
	"loss": 0.0005,
	"step": 10750
	},
	{
	"epoch": 23.172043010752688,
	"grad_norm": 0.2305319756269455,
	"learning_rate": 2.3613382899628253e-06,
	"loss": 0.0015,
	"step": 10775
	},
	{
	"epoch": 23.225806451612904,
	"grad_norm": 0.009956962428987026,
	"learning_rate": 2.34275092936803e-06,
	"loss": 0.0024,
	"step": 10800
	},
	{
	"epoch": 23.27956989247312,
	"grad_norm": 0.1403415948152542,
	"learning_rate": 2.3241635687732345e-06,
	"loss": 0.0014,
	"step": 10825
	},
	{
	"epoch": 23.333333333333332,
	"grad_norm": 0.21458983421325684,
	"learning_rate": 2.305576208178439e-06,
	"loss": 0.0017,
	"step": 10850
	},
	{
	"epoch": 23.387096774193548,
	"grad_norm": 0.008475505746901035,
	"learning_rate": 2.286988847583643e-06,
	"loss": 0.001,
	"step": 10875
	},
	{
	"epoch": 23.440860215053764,
	"grad_norm": 0.02105923928320408,
	"learning_rate": 2.2684014869888477e-06,
	"loss": 0.0013,
	"step": 10900
	},
	{
	"epoch": 23.49462365591398,
	"grad_norm": 0.007669220678508282,
	"learning_rate": 2.2498141263940523e-06,
	"loss": 0.0016,
	"step": 10925
	},
	{
	"epoch": 23.548387096774192,
	"grad_norm": 0.007480244617909193,
	"learning_rate": 2.231226765799257e-06,
	"loss": 0.0013,
	"step": 10950
	},
	{
	"epoch": 23.602150537634408,
	"grad_norm": 0.00940194632858038,
	"learning_rate": 2.212639405204461e-06,
	"loss": 0.0031,
	"step": 10975
	},
	{
	"epoch": 23.655913978494624,
	"grad_norm": 0.013057105243206024,
	"learning_rate": 2.1940520446096655e-06,
	"loss": 0.0012,
	"step": 11000
	},
	{
	"epoch": 23.655913978494624,
	"eval_loss": 0.40596359968185425,
	"eval_runtime": 202.5237,
	"eval_samples_per_second": 4.671,
	"eval_steps_per_second": 0.588,
	"eval_wer": 13.941018766756033,
	"step": 11000
	},
	{
	"epoch": 23.70967741935484,
	"grad_norm": 0.0065338280983269215,
	"learning_rate": 2.17546468401487e-06,
	"loss": 0.0015,
	"step": 11025
	},
	{
	"epoch": 23.763440860215052,
	"grad_norm": 0.013204723596572876,
	"learning_rate": 2.1568773234200746e-06,
	"loss": 0.003,
	"step": 11050
	},
	{
	"epoch": 23.817204301075268,
	"grad_norm": 0.027307022362947464,
	"learning_rate": 2.138289962825279e-06,
	"loss": 0.0027,
	"step": 11075
	},
	{
	"epoch": 23.870967741935484,
	"grad_norm": 0.014446156099438667,
	"learning_rate": 2.1197026022304833e-06,
	"loss": 0.0014,
	"step": 11100
	},
	{
	"epoch": 23.9247311827957,
	"grad_norm": 0.014391875825822353,
	"learning_rate": 2.101115241635688e-06,
	"loss": 0.0031,
	"step": 11125
	},
	{
	"epoch": 23.978494623655912,
	"grad_norm": 0.0412728525698185,
	"learning_rate": 2.0825278810408924e-06,
	"loss": 0.0022,
	"step": 11150
	},
	{
	"epoch": 24.032258064516128,
	"grad_norm": 0.009646103717386723,
	"learning_rate": 2.063940520446097e-06,
	"loss": 0.0015,
	"step": 11175
	},
	{
	"epoch": 24.086021505376344,
	"grad_norm": 0.007044603582471609,
	"learning_rate": 2.045353159851301e-06,
	"loss": 0.0012,
	"step": 11200
	},
	{
	"epoch": 24.13978494623656,
	"grad_norm": 0.013142594136297703,
	"learning_rate": 2.0267657992565057e-06,
	"loss": 0.0013,
	"step": 11225
	},
	{
	"epoch": 24.193548387096776,
	"grad_norm": 0.006704692263156176,
	"learning_rate": 2.00817843866171e-06,
	"loss": 0.0015,
	"step": 11250
	},
	{
	"epoch": 24.247311827956988,
	"grad_norm": 0.005626600701361895,
	"learning_rate": 1.9895910780669148e-06,
	"loss": 0.0012,
	"step": 11275
	},
	{
	"epoch": 24.301075268817204,
	"grad_norm": 0.008840459398925304,
	"learning_rate": 1.9710037174721193e-06,
	"loss": 0.0019,
	"step": 11300
	},
	{
	"epoch": 24.35483870967742,
	"grad_norm": 0.005357383284717798,
	"learning_rate": 1.9524163568773235e-06,
	"loss": 0.0011,
	"step": 11325
	},
	{
	"epoch": 24.408602150537636,
	"grad_norm": 0.005820517428219318,
	"learning_rate": 1.933828996282528e-06,
	"loss": 0.0014,
	"step": 11350
	},
	{
	"epoch": 24.462365591397848,
	"grad_norm": 0.12261584401130676,
	"learning_rate": 1.9152416356877326e-06,
	"loss": 0.0009,
	"step": 11375
	},
	{
	"epoch": 24.516129032258064,
	"grad_norm": 0.16665996611118317,
	"learning_rate": 1.8966542750929371e-06,
	"loss": 0.0032,
	"step": 11400
	},
	{
	"epoch": 24.56989247311828,
	"grad_norm": 0.006091310176998377,
	"learning_rate": 1.8780669144981415e-06,
	"loss": 0.0016,
	"step": 11425
	},
	{
	"epoch": 24.623655913978496,
	"grad_norm": 0.027028294280171394,
	"learning_rate": 1.8594795539033458e-06,
	"loss": 0.0013,
	"step": 11450
	},
	{
	"epoch": 24.677419354838708,
	"grad_norm": 0.107554592192173,
	"learning_rate": 1.8408921933085502e-06,
	"loss": 0.0014,
	"step": 11475
	},
	{
	"epoch": 24.731182795698924,
	"grad_norm": 0.006071150302886963,
	"learning_rate": 1.822304832713755e-06,
	"loss": 0.0008,
	"step": 11500
	},
	{
	"epoch": 24.731182795698924,
	"eval_loss": 0.4129054546356201,
	"eval_runtime": 202.4824,
	"eval_samples_per_second": 4.672,
	"eval_steps_per_second": 0.588,
	"eval_wer": 13.848571692705928,
	"step": 11500
	},
	{
	"epoch": 24.78494623655914,
	"grad_norm": 0.005664244759827852,
	"learning_rate": 1.8037174721189593e-06,
	"loss": 0.0019,
	"step": 11525
	},
	{
	"epoch": 24.838709677419356,
	"grad_norm": 0.007854313589632511,
	"learning_rate": 1.7851301115241638e-06,
	"loss": 0.0019,
	"step": 11550
	},
	{
	"epoch": 24.892473118279568,
	"grad_norm": 0.1173175498843193,
	"learning_rate": 1.7665427509293682e-06,
	"loss": 0.002,
	"step": 11575
	},
	{
	"epoch": 24.946236559139784,
	"grad_norm": 0.005052879452705383,
	"learning_rate": 1.7479553903345725e-06,
	"loss": 0.0021,
	"step": 11600
	},
	{
	"epoch": 25.0,
	"grad_norm": 0.011530703864991665,
	"learning_rate": 1.7293680297397773e-06,
	"loss": 0.0017,
	"step": 11625
	},
	{
	"epoch": 25.053763440860216,
	"grad_norm": 0.07344318926334381,
	"learning_rate": 1.7107806691449816e-06,
	"loss": 0.002,
	"step": 11650
	},
	{
	"epoch": 25.107526881720432,
	"grad_norm": 0.12406457215547562,
	"learning_rate": 1.692193308550186e-06,
	"loss": 0.0017,
	"step": 11675
	},
	{
	"epoch": 25.161290322580644,
	"grad_norm": 0.005189701449126005,
	"learning_rate": 1.6736059479553903e-06,
	"loss": 0.0016,
	"step": 11700
	},
	{
	"epoch": 25.21505376344086,
	"grad_norm": 0.3264636993408203,
	"learning_rate": 1.655018587360595e-06,
	"loss": 0.0021,
	"step": 11725
	},
	{
	"epoch": 25.268817204301076,
	"grad_norm": 0.004206045996397734,
	"learning_rate": 1.6364312267657994e-06,
	"loss": 0.0014,
	"step": 11750
	},
	{
	"epoch": 25.322580645161292,
	"grad_norm": 0.12464595586061478,
	"learning_rate": 1.6178438661710038e-06,
	"loss": 0.0019,
	"step": 11775
	},
	{
	"epoch": 25.376344086021504,
	"grad_norm": 0.0052951849065721035,
	"learning_rate": 1.5992565055762083e-06,
	"loss": 0.001,
	"step": 11800
	},
	{
	"epoch": 25.43010752688172,
	"grad_norm": 0.20631186664104462,
	"learning_rate": 1.5806691449814127e-06,
	"loss": 0.0013,
	"step": 11825
	},
	{
	"epoch": 25.483870967741936,
	"grad_norm": 0.005665977951139212,
	"learning_rate": 1.5620817843866174e-06,
	"loss": 0.0023,
	"step": 11850
	},
	{
	"epoch": 25.537634408602152,
	"grad_norm": 0.18204852938652039,
	"learning_rate": 1.5434944237918218e-06,
	"loss": 0.0017,
	"step": 11875
	},
	{
	"epoch": 25.591397849462364,
	"grad_norm": 0.004289372358471155,
	"learning_rate": 1.5249070631970261e-06,
	"loss": 0.0005,
	"step": 11900
	},
	{
	"epoch": 25.64516129032258,
	"grad_norm": 0.06818500906229019,
	"learning_rate": 1.5063197026022305e-06,
	"loss": 0.0005,
	"step": 11925
	},
	{
	"epoch": 25.698924731182796,
	"grad_norm": 0.14878062903881073,
	"learning_rate": 1.487732342007435e-06,
	"loss": 0.0016,
	"step": 11950
	},
	{
	"epoch": 25.752688172043012,
	"grad_norm": 0.003890681779012084,
	"learning_rate": 1.4691449814126396e-06,
	"loss": 0.0016,
	"step": 11975
	},
	{
	"epoch": 25.806451612903224,
	"grad_norm": 0.004652164876461029,
	"learning_rate": 1.450557620817844e-06,
	"loss": 0.001,
	"step": 12000
	},
	{
	"epoch": 25.806451612903224,
	"eval_loss": 0.4189203381538391,
	"eval_runtime": 202.0119,
	"eval_samples_per_second": 4.683,
	"eval_steps_per_second": 0.589,
	"eval_wer": 13.830082277895904,
	"step": 12000
	},
	{
	"epoch": 25.86021505376344,
	"grad_norm": 0.16533516347408295,
	"learning_rate": 1.4319702602230485e-06,
	"loss": 0.0011,
	"step": 12025
	},
	{
	"epoch": 25.913978494623656,
	"grad_norm": 0.0048462748527526855,
	"learning_rate": 1.4133828996282528e-06,
	"loss": 0.001,
	"step": 12050
	},
	{
	"epoch": 25.967741935483872,
	"grad_norm": 0.0046990737318992615,
	"learning_rate": 1.3947955390334576e-06,
	"loss": 0.0017,
	"step": 12075
	},
	{
	"epoch": 26.021505376344088,
	"grad_norm": 0.003037052694708109,
	"learning_rate": 1.376208178438662e-06,
	"loss": 0.0024,
	"step": 12100
	},
	{
	"epoch": 26.0752688172043,
	"grad_norm": 0.08328765630722046,
	"learning_rate": 1.3576208178438663e-06,
	"loss": 0.0011,
	"step": 12125
	},
	{
	"epoch": 26.129032258064516,
	"grad_norm": 0.002522684633731842,
	"learning_rate": 1.3390334572490706e-06,
	"loss": 0.0022,
	"step": 12150
	},
	{
	"epoch": 26.182795698924732,
	"grad_norm": 0.00458819093182683,
	"learning_rate": 1.3204460966542752e-06,
	"loss": 0.0018,
	"step": 12175
	},
	{
	"epoch": 26.236559139784948,
	"grad_norm": 0.004143861588090658,
	"learning_rate": 1.3018587360594797e-06,
	"loss": 0.0008,
	"step": 12200
	},
	{
	"epoch": 26.29032258064516,
	"grad_norm": 0.006522686220705509,
	"learning_rate": 1.283271375464684e-06,
	"loss": 0.0014,
	"step": 12225
	},
	{
	"epoch": 26.344086021505376,
	"grad_norm": 0.0033553235698491335,
	"learning_rate": 1.2646840148698886e-06,
	"loss": 0.0018,
	"step": 12250
	},
	{
	"epoch": 26.397849462365592,
	"grad_norm": 0.004214679356664419,
	"learning_rate": 1.2460966542750932e-06,
	"loss": 0.0014,
	"step": 12275
	},
	{
	"epoch": 26.451612903225808,
	"grad_norm": 0.23780201375484467,
	"learning_rate": 1.2275092936802975e-06,
	"loss": 0.0021,
	"step": 12300
	},
	{
	"epoch": 26.50537634408602,
	"grad_norm": 0.003071879968047142,
	"learning_rate": 1.2089219330855019e-06,
	"loss": 0.0021,
	"step": 12325
	},
	{
	"epoch": 26.559139784946236,
	"grad_norm": 0.003364423755556345,
	"learning_rate": 1.1903345724907064e-06,
	"loss": 0.0015,
	"step": 12350
	},
	{
	"epoch": 26.612903225806452,
	"grad_norm": 0.30511873960494995,
	"learning_rate": 1.1717472118959108e-06,
	"loss": 0.0018,
	"step": 12375
	},
	{
	"epoch": 26.666666666666668,
	"grad_norm": 0.003765388624742627,
	"learning_rate": 1.1531598513011153e-06,
	"loss": 0.0026,
	"step": 12400
	},
	{
	"epoch": 26.72043010752688,
	"grad_norm": 0.13415110111236572,
	"learning_rate": 1.1345724907063199e-06,
	"loss": 0.0012,
	"step": 12425
	},
	{
	"epoch": 26.774193548387096,
	"grad_norm": 0.0052949776872992516,
	"learning_rate": 1.1159851301115242e-06,
	"loss": 0.0006,
	"step": 12450
	},
	{
	"epoch": 26.827956989247312,
	"grad_norm": 0.0027304012328386307,
	"learning_rate": 1.0973977695167288e-06,
	"loss": 0.001,
	"step": 12475
	},
	{
	"epoch": 26.881720430107528,
	"grad_norm": 0.004548298195004463,
	"learning_rate": 1.0788104089219331e-06,
	"loss": 0.0008,
	"step": 12500
	},
	{
	"epoch": 26.881720430107528,
	"eval_loss": 0.4191061854362488,
	"eval_runtime": 207.3533,
	"eval_samples_per_second": 4.562,
	"eval_steps_per_second": 0.574,
	"eval_wer": 13.959508181566052,
	"step": 12500
	},
	{
	"epoch": 26.93548387096774,
	"grad_norm": 0.0037072377745062113,
	"learning_rate": 1.0602230483271377e-06,
	"loss": 0.002,
	"step": 12525
	},
	{
	"epoch": 26.989247311827956,
	"grad_norm": 0.004865365568548441,
	"learning_rate": 1.041635687732342e-06,
	"loss": 0.0012,
	"step": 12550
	},
	{
	"epoch": 27.043010752688172,
	"grad_norm": 0.16591113805770874,
	"learning_rate": 1.0230483271375466e-06,
	"loss": 0.0008,
	"step": 12575
	},
	{
	"epoch": 27.096774193548388,
	"grad_norm": 0.003480426501482725,
	"learning_rate": 1.004460966542751e-06,
	"loss": 0.002,
	"step": 12600
	},
	{
	"epoch": 27.150537634408604,
	"grad_norm": 0.003888448467478156,
	"learning_rate": 9.858736059479555e-07,
	"loss": 0.001,
	"step": 12625
	},
	{
	"epoch": 27.204301075268816,
	"grad_norm": 0.004046307876706123,
	"learning_rate": 9.6728624535316e-07,
	"loss": 0.0022,
	"step": 12650
	},
	{
	"epoch": 27.258064516129032,
	"grad_norm": 0.004325231071561575,
	"learning_rate": 9.486988847583644e-07,
	"loss": 0.0024,
	"step": 12675
	},
	{
	"epoch": 27.311827956989248,
	"grad_norm": 0.1196964755654335,
	"learning_rate": 9.301115241635688e-07,
	"loss": 0.001,
	"step": 12700
	},
	{
	"epoch": 27.365591397849464,
	"grad_norm": 0.003892822889611125,
	"learning_rate": 9.115241635687733e-07,
	"loss": 0.002,
	"step": 12725
	},
	{
	"epoch": 27.419354838709676,
	"grad_norm": 0.0024752148892730474,
	"learning_rate": 8.929368029739778e-07,
	"loss": 0.0007,
	"step": 12750
	},
	{
	"epoch": 27.473118279569892,
	"grad_norm": 0.00464650196954608,
	"learning_rate": 8.743494423791822e-07,
	"loss": 0.0019,
	"step": 12775
	},
	{
	"epoch": 27.526881720430108,
	"grad_norm": 0.2570537328720093,
	"learning_rate": 8.557620817843867e-07,
	"loss": 0.0022,
	"step": 12800
	},
	{
	"epoch": 27.580645161290324,
	"grad_norm": 0.003213089657947421,
	"learning_rate": 8.371747211895912e-07,
	"loss": 0.0008,
	"step": 12825
	},
	{
	"epoch": 27.634408602150536,
	"grad_norm": 0.0038951928727328777,
	"learning_rate": 8.185873605947955e-07,
	"loss": 0.0013,
	"step": 12850
	},
	{
	"epoch": 27.688172043010752,
	"grad_norm": 0.0030759673099964857,
	"learning_rate": 8.000000000000001e-07,
	"loss": 0.0009,
	"step": 12875
	},
	{
	"epoch": 27.741935483870968,
	"grad_norm": 0.0037837938871234655,
	"learning_rate": 7.814126394052045e-07,
	"loss": 0.0022,
	"step": 12900
	},
	{
	"epoch": 27.795698924731184,
	"grad_norm": 0.0026918076910078526,
	"learning_rate": 7.62825278810409e-07,
	"loss": 0.0016,
	"step": 12925
	},
	{
	"epoch": 27.849462365591396,
	"grad_norm": 0.0030537450220435858,
	"learning_rate": 7.442379182156134e-07,
	"loss": 0.0008,
	"step": 12950
	},
	{
	"epoch": 27.903225806451612,
	"grad_norm": 0.11770904064178467,
	"learning_rate": 7.25650557620818e-07,
	"loss": 0.0014,
	"step": 12975
	},
	{
	"epoch": 27.956989247311828,
	"grad_norm": 0.0030784786213189363,
	"learning_rate": 7.070631970260223e-07,
	"loss": 0.0018,
	"step": 13000
	},
	{
	"epoch": 27.956989247311828,
	"eval_loss": 0.421833336353302,
	"eval_runtime": 202.7221,
	"eval_samples_per_second": 4.666,
	"eval_steps_per_second": 0.587,
	"eval_wer": 13.793103448275861,
	"step": 13000
	}
	],
	"logging_steps": 25,
	"max_steps": 13950,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 30,
	"save_steps": 500,
	"stateful_callbacks": {
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": false
	},
	"attributes": {}
	}
	},
	"total_flos": 1.4130840981661286e+21,
	"train_batch_size": 8,
	"trial_name": null,
	"trial_params": null
	}