whisper-tiny-khmer / trainer_state.json

Upload 15 files

bc945b2 verified about 1 year ago

56.4 kB

	{
	"best_metric": 0.6916529645033369,
	"best_model_checkpoint": "d:\\DataTicon\\Whisper-Khmer-Small\\whisper-khmer\\outputs\\whisper-khmer-tiny\\checkpoint-3000",
	"epoch": 2.7447392497712717,
	"eval_steps": 500,
	"global_step": 3000,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.009149130832570906,
	"grad_norm": 76.3263931274414,
	"learning_rate": 5e-06,
	"loss": 3.7253,
	"step": 10
	},
	{
	"epoch": 0.018298261665141813,
	"grad_norm": 23.748031616210938,
	"learning_rate": 1.5e-05,
	"loss": 2.8873,
	"step": 20
	},
	{
	"epoch": 0.027447392497712716,
	"grad_norm": 17.664098739624023,
	"learning_rate": 2.5e-05,
	"loss": 2.2375,
	"step": 30
	},
	{
	"epoch": 0.036596523330283626,
	"grad_norm": 12.52354907989502,
	"learning_rate": 3.5e-05,
	"loss": 1.8201,
	"step": 40
	},
	{
	"epoch": 0.04574565416285453,
	"grad_norm": 27.447662353515625,
	"learning_rate": 4.5e-05,
	"loss": 1.6313,
	"step": 50
	},
	{
	"epoch": 0.05489478499542543,
	"grad_norm": 24.413909912109375,
	"learning_rate": 4.992257664911737e-05,
	"loss": 1.6002,
	"step": 60
	},
	{
	"epoch": 0.06404391582799634,
	"grad_norm": 21.101381301879883,
	"learning_rate": 4.976772994735213e-05,
	"loss": 1.5404,
	"step": 70
	},
	{
	"epoch": 0.07319304666056725,
	"grad_norm": 14.289061546325684,
	"learning_rate": 4.961288324558687e-05,
	"loss": 1.4752,
	"step": 80
	},
	{
	"epoch": 0.08234217749313816,
	"grad_norm": 14.361418724060059,
	"learning_rate": 4.945803654382162e-05,
	"loss": 1.4342,
	"step": 90
	},
	{
	"epoch": 0.09149130832570906,
	"grad_norm": 10.036293983459473,
	"learning_rate": 4.930318984205637e-05,
	"loss": 1.3983,
	"step": 100
	},
	{
	"epoch": 0.10064043915827996,
	"grad_norm": 14.588384628295898,
	"learning_rate": 4.9148343140291115e-05,
	"loss": 1.3811,
	"step": 110
	},
	{
	"epoch": 0.10978956999085086,
	"grad_norm": 11.769558906555176,
	"learning_rate": 4.899349643852586e-05,
	"loss": 1.3395,
	"step": 120
	},
	{
	"epoch": 0.11893870082342177,
	"grad_norm": 15.153656959533691,
	"learning_rate": 4.883864973676061e-05,
	"loss": 1.3043,
	"step": 130
	},
	{
	"epoch": 0.1280878316559927,
	"grad_norm": 10.691374778747559,
	"learning_rate": 4.8683803034995354e-05,
	"loss": 1.2971,
	"step": 140
	},
	{
	"epoch": 0.1372369624885636,
	"grad_norm": 18.516103744506836,
	"learning_rate": 4.85289563332301e-05,
	"loss": 1.2716,
	"step": 150
	},
	{
	"epoch": 0.1463860933211345,
	"grad_norm": 10.616347312927246,
	"learning_rate": 4.837410963146485e-05,
	"loss": 1.2456,
	"step": 160
	},
	{
	"epoch": 0.1555352241537054,
	"grad_norm": 14.87991714477539,
	"learning_rate": 4.82192629296996e-05,
	"loss": 1.2224,
	"step": 170
	},
	{
	"epoch": 0.16468435498627632,
	"grad_norm": 19.040470123291016,
	"learning_rate": 4.806441622793435e-05,
	"loss": 1.2364,
	"step": 180
	},
	{
	"epoch": 0.17383348581884722,
	"grad_norm": 18.312976837158203,
	"learning_rate": 4.7909569526169096e-05,
	"loss": 1.1906,
	"step": 190
	},
	{
	"epoch": 0.18298261665141813,
	"grad_norm": 21.12237548828125,
	"learning_rate": 4.7754722824403844e-05,
	"loss": 1.1894,
	"step": 200
	},
	{
	"epoch": 0.19213174748398903,
	"grad_norm": 8.743210792541504,
	"learning_rate": 4.759987612263859e-05,
	"loss": 1.1648,
	"step": 210
	},
	{
	"epoch": 0.2012808783165599,
	"grad_norm": 11.74830150604248,
	"learning_rate": 4.744502942087334e-05,
	"loss": 1.1461,
	"step": 220
	},
	{
	"epoch": 0.21043000914913082,
	"grad_norm": 15.216257095336914,
	"learning_rate": 4.729018271910808e-05,
	"loss": 1.1189,
	"step": 230
	},
	{
	"epoch": 0.21957913998170173,
	"grad_norm": 17.434612274169922,
	"learning_rate": 4.713533601734284e-05,
	"loss": 1.126,
	"step": 240
	},
	{
	"epoch": 0.22872827081427263,
	"grad_norm": 11.15873908996582,
	"learning_rate": 4.698048931557758e-05,
	"loss": 1.0959,
	"step": 250
	},
	{
	"epoch": 0.23787740164684354,
	"grad_norm": 13.587617874145508,
	"learning_rate": 4.682564261381233e-05,
	"loss": 1.0969,
	"step": 260
	},
	{
	"epoch": 0.24702653247941445,
	"grad_norm": 11.1122407913208,
	"learning_rate": 4.6670795912047076e-05,
	"loss": 1.0839,
	"step": 270
	},
	{
	"epoch": 0.2561756633119854,
	"grad_norm": 16.767852783203125,
	"learning_rate": 4.6515949210281825e-05,
	"loss": 1.053,
	"step": 280
	},
	{
	"epoch": 0.2653247941445563,
	"grad_norm": 14.137765884399414,
	"learning_rate": 4.6361102508516566e-05,
	"loss": 1.0309,
	"step": 290
	},
	{
	"epoch": 0.2744739249771272,
	"grad_norm": 13.212748527526855,
	"learning_rate": 4.620625580675132e-05,
	"loss": 0.9809,
	"step": 300
	},
	{
	"epoch": 0.2836230558096981,
	"grad_norm": 12.678833961486816,
	"learning_rate": 4.605140910498606e-05,
	"loss": 0.9719,
	"step": 310
	},
	{
	"epoch": 0.292772186642269,
	"grad_norm": 11.58700180053711,
	"learning_rate": 4.589656240322082e-05,
	"loss": 0.9258,
	"step": 320
	},
	{
	"epoch": 0.3019213174748399,
	"grad_norm": 10.919293403625488,
	"learning_rate": 4.574171570145556e-05,
	"loss": 0.8796,
	"step": 330
	},
	{
	"epoch": 0.3110704483074108,
	"grad_norm": 10.442853927612305,
	"learning_rate": 4.558686899969031e-05,
	"loss": 0.8912,
	"step": 340
	},
	{
	"epoch": 0.3202195791399817,
	"grad_norm": 11.729557991027832,
	"learning_rate": 4.543202229792506e-05,
	"loss": 0.8275,
	"step": 350
	},
	{
	"epoch": 0.32936870997255263,
	"grad_norm": 9.217303276062012,
	"learning_rate": 4.5277175596159805e-05,
	"loss": 0.7889,
	"step": 360
	},
	{
	"epoch": 0.33851784080512354,
	"grad_norm": 13.999395370483398,
	"learning_rate": 4.512232889439455e-05,
	"loss": 0.736,
	"step": 370
	},
	{
	"epoch": 0.34766697163769444,
	"grad_norm": 18.503355026245117,
	"learning_rate": 4.49674821926293e-05,
	"loss": 0.7104,
	"step": 380
	},
	{
	"epoch": 0.35681610247026535,
	"grad_norm": 11.04101848602295,
	"learning_rate": 4.4812635490864044e-05,
	"loss": 0.7163,
	"step": 390
	},
	{
	"epoch": 0.36596523330283626,
	"grad_norm": 9.643781661987305,
	"learning_rate": 4.465778878909879e-05,
	"loss": 0.6944,
	"step": 400
	},
	{
	"epoch": 0.37511436413540716,
	"grad_norm": 8.121737480163574,
	"learning_rate": 4.450294208733354e-05,
	"loss": 0.6771,
	"step": 410
	},
	{
	"epoch": 0.38426349496797807,
	"grad_norm": 12.704200744628906,
	"learning_rate": 4.434809538556829e-05,
	"loss": 0.6185,
	"step": 420
	},
	{
	"epoch": 0.3934126258005489,
	"grad_norm": 8.623883247375488,
	"learning_rate": 4.419324868380304e-05,
	"loss": 0.6471,
	"step": 430
	},
	{
	"epoch": 0.4025617566331198,
	"grad_norm": 9.99401569366455,
	"learning_rate": 4.4038401982037786e-05,
	"loss": 0.6112,
	"step": 440
	},
	{
	"epoch": 0.41171088746569073,
	"grad_norm": 9.302281379699707,
	"learning_rate": 4.3883555280272534e-05,
	"loss": 0.6054,
	"step": 450
	},
	{
	"epoch": 0.42086001829826164,
	"grad_norm": 12.407485961914062,
	"learning_rate": 4.372870857850728e-05,
	"loss": 0.6045,
	"step": 460
	},
	{
	"epoch": 0.43000914913083255,
	"grad_norm": 11.521641731262207,
	"learning_rate": 4.357386187674203e-05,
	"loss": 0.5927,
	"step": 470
	},
	{
	"epoch": 0.43915827996340345,
	"grad_norm": 18.213590621948242,
	"learning_rate": 4.341901517497677e-05,
	"loss": 0.5654,
	"step": 480
	},
	{
	"epoch": 0.44830741079597436,
	"grad_norm": 9.964733123779297,
	"learning_rate": 4.326416847321153e-05,
	"loss": 0.5561,
	"step": 490
	},
	{
	"epoch": 0.45745654162854527,
	"grad_norm": 10.646913528442383,
	"learning_rate": 4.310932177144627e-05,
	"loss": 0.5174,
	"step": 500
	},
	{
	"epoch": 0.45745654162854527,
	"eval_loss": 0.5902902483940125,
	"eval_runtime": 436.5208,
	"eval_samples_per_second": 1.766,
	"eval_steps_per_second": 0.112,
	"eval_wer": 0.9019247509430313,
	"step": 500
	},
	{
	"epoch": 0.46660567246111617,
	"grad_norm": 7.100905895233154,
	"learning_rate": 4.295447506968102e-05,
	"loss": 0.5449,
	"step": 510
	},
	{
	"epoch": 0.4757548032936871,
	"grad_norm": 14.554773330688477,
	"learning_rate": 4.2799628367915767e-05,
	"loss": 0.5277,
	"step": 520
	},
	{
	"epoch": 0.484903934126258,
	"grad_norm": 12.082781791687012,
	"learning_rate": 4.2644781666150515e-05,
	"loss": 0.5299,
	"step": 530
	},
	{
	"epoch": 0.4940530649588289,
	"grad_norm": 8.607912063598633,
	"learning_rate": 4.2489934964385257e-05,
	"loss": 0.5395,
	"step": 540
	},
	{
	"epoch": 0.5032021957913998,
	"grad_norm": 9.982528686523438,
	"learning_rate": 4.233508826262001e-05,
	"loss": 0.5197,
	"step": 550
	},
	{
	"epoch": 0.5123513266239708,
	"grad_norm": 12.866645812988281,
	"learning_rate": 4.2180241560854753e-05,
	"loss": 0.4857,
	"step": 560
	},
	{
	"epoch": 0.5215004574565416,
	"grad_norm": 9.12654972076416,
	"learning_rate": 4.20253948590895e-05,
	"loss": 0.4852,
	"step": 570
	},
	{
	"epoch": 0.5306495882891126,
	"grad_norm": 7.0818705558776855,
	"learning_rate": 4.187054815732425e-05,
	"loss": 0.5013,
	"step": 580
	},
	{
	"epoch": 0.5397987191216834,
	"grad_norm": 9.520069122314453,
	"learning_rate": 4.1715701455559e-05,
	"loss": 0.4656,
	"step": 590
	},
	{
	"epoch": 0.5489478499542544,
	"grad_norm": 8.271717071533203,
	"learning_rate": 4.156085475379375e-05,
	"loss": 0.4866,
	"step": 600
	},
	{
	"epoch": 0.5580969807868252,
	"grad_norm": 9.679398536682129,
	"learning_rate": 4.1406008052028496e-05,
	"loss": 0.5045,
	"step": 610
	},
	{
	"epoch": 0.5672461116193962,
	"grad_norm": 9.209792137145996,
	"learning_rate": 4.125116135026324e-05,
	"loss": 0.435,
	"step": 620
	},
	{
	"epoch": 0.576395242451967,
	"grad_norm": 7.2256669998168945,
	"learning_rate": 4.109631464849799e-05,
	"loss": 0.4575,
	"step": 630
	},
	{
	"epoch": 0.585544373284538,
	"grad_norm": 7.8047990798950195,
	"learning_rate": 4.0941467946732734e-05,
	"loss": 0.4598,
	"step": 640
	},
	{
	"epoch": 0.5946935041171089,
	"grad_norm": 7.035597801208496,
	"learning_rate": 4.078662124496748e-05,
	"loss": 0.4714,
	"step": 650
	},
	{
	"epoch": 0.6038426349496798,
	"grad_norm": 7.996973514556885,
	"learning_rate": 4.063177454320223e-05,
	"loss": 0.4596,
	"step": 660
	},
	{
	"epoch": 0.6129917657822507,
	"grad_norm": 6.872828960418701,
	"learning_rate": 4.047692784143698e-05,
	"loss": 0.4106,
	"step": 670
	},
	{
	"epoch": 0.6221408966148216,
	"grad_norm": 6.923854827880859,
	"learning_rate": 4.032208113967173e-05,
	"loss": 0.42,
	"step": 680
	},
	{
	"epoch": 0.6312900274473925,
	"grad_norm": 12.70057487487793,
	"learning_rate": 4.0167234437906476e-05,
	"loss": 0.4229,
	"step": 690
	},
	{
	"epoch": 0.6404391582799634,
	"grad_norm": 6.876515865325928,
	"learning_rate": 4.0012387736141224e-05,
	"loss": 0.4114,
	"step": 700
	},
	{
	"epoch": 0.6495882891125343,
	"grad_norm": 7.49954891204834,
	"learning_rate": 3.9857541034375966e-05,
	"loss": 0.4163,
	"step": 710
	},
	{
	"epoch": 0.6587374199451053,
	"grad_norm": 6.375706672668457,
	"learning_rate": 3.970269433261072e-05,
	"loss": 0.4067,
	"step": 720
	},
	{
	"epoch": 0.6678865507776761,
	"grad_norm": 5.803896427154541,
	"learning_rate": 3.954784763084546e-05,
	"loss": 0.4269,
	"step": 730
	},
	{
	"epoch": 0.6770356816102471,
	"grad_norm": 9.036760330200195,
	"learning_rate": 3.939300092908022e-05,
	"loss": 0.4117,
	"step": 740
	},
	{
	"epoch": 0.6861848124428179,
	"grad_norm": 6.481241226196289,
	"learning_rate": 3.923815422731496e-05,
	"loss": 0.4561,
	"step": 750
	},
	{
	"epoch": 0.6953339432753889,
	"grad_norm": 7.707711219787598,
	"learning_rate": 3.908330752554971e-05,
	"loss": 0.4075,
	"step": 760
	},
	{
	"epoch": 0.7044830741079597,
	"grad_norm": 6.894267559051514,
	"learning_rate": 3.892846082378446e-05,
	"loss": 0.4036,
	"step": 770
	},
	{
	"epoch": 0.7136322049405307,
	"grad_norm": 6.747013568878174,
	"learning_rate": 3.8773614122019205e-05,
	"loss": 0.4139,
	"step": 780
	},
	{
	"epoch": 0.7227813357731016,
	"grad_norm": 8.749561309814453,
	"learning_rate": 3.861876742025395e-05,
	"loss": 0.391,
	"step": 790
	},
	{
	"epoch": 0.7319304666056725,
	"grad_norm": 6.197606086730957,
	"learning_rate": 3.84639207184887e-05,
	"loss": 0.4115,
	"step": 800
	},
	{
	"epoch": 0.7410795974382434,
	"grad_norm": 6.012449264526367,
	"learning_rate": 3.8309074016723444e-05,
	"loss": 0.43,
	"step": 810
	},
	{
	"epoch": 0.7502287282708143,
	"grad_norm": 9.235795021057129,
	"learning_rate": 3.815422731495819e-05,
	"loss": 0.4013,
	"step": 820
	},
	{
	"epoch": 0.7593778591033852,
	"grad_norm": 6.508467197418213,
	"learning_rate": 3.799938061319294e-05,
	"loss": 0.4084,
	"step": 830
	},
	{
	"epoch": 0.7685269899359561,
	"grad_norm": 12.164517402648926,
	"learning_rate": 3.784453391142769e-05,
	"loss": 0.422,
	"step": 840
	},
	{
	"epoch": 0.777676120768527,
	"grad_norm": 6.47005033493042,
	"learning_rate": 3.768968720966244e-05,
	"loss": 0.3806,
	"step": 850
	},
	{
	"epoch": 0.7868252516010978,
	"grad_norm": 6.4245476722717285,
	"learning_rate": 3.7534840507897186e-05,
	"loss": 0.3772,
	"step": 860
	},
	{
	"epoch": 0.7959743824336688,
	"grad_norm": 6.941617965698242,
	"learning_rate": 3.737999380613193e-05,
	"loss": 0.3621,
	"step": 870
	},
	{
	"epoch": 0.8051235132662397,
	"grad_norm": 6.679232120513916,
	"learning_rate": 3.722514710436668e-05,
	"loss": 0.3699,
	"step": 880
	},
	{
	"epoch": 0.8142726440988106,
	"grad_norm": 7.287721157073975,
	"learning_rate": 3.7070300402601424e-05,
	"loss": 0.3728,
	"step": 890
	},
	{
	"epoch": 0.8234217749313815,
	"grad_norm": 7.297004699707031,
	"learning_rate": 3.691545370083617e-05,
	"loss": 0.3823,
	"step": 900
	},
	{
	"epoch": 0.8325709057639524,
	"grad_norm": 5.730973720550537,
	"learning_rate": 3.676060699907092e-05,
	"loss": 0.3716,
	"step": 910
	},
	{
	"epoch": 0.8417200365965233,
	"grad_norm": 8.157340049743652,
	"learning_rate": 3.660576029730567e-05,
	"loss": 0.3731,
	"step": 920
	},
	{
	"epoch": 0.8508691674290942,
	"grad_norm": 8.863473892211914,
	"learning_rate": 3.645091359554042e-05,
	"loss": 0.3445,
	"step": 930
	},
	{
	"epoch": 0.8600182982616651,
	"grad_norm": 5.911675453186035,
	"learning_rate": 3.6296066893775166e-05,
	"loss": 0.3671,
	"step": 940
	},
	{
	"epoch": 0.869167429094236,
	"grad_norm": 6.246954441070557,
	"learning_rate": 3.6141220192009915e-05,
	"loss": 0.3876,
	"step": 950
	},
	{
	"epoch": 0.8783165599268069,
	"grad_norm": 4.594511032104492,
	"learning_rate": 3.5986373490244656e-05,
	"loss": 0.3637,
	"step": 960
	},
	{
	"epoch": 0.8874656907593779,
	"grad_norm": 7.323066234588623,
	"learning_rate": 3.583152678847941e-05,
	"loss": 0.3624,
	"step": 970
	},
	{
	"epoch": 0.8966148215919487,
	"grad_norm": 6.408933639526367,
	"learning_rate": 3.567668008671415e-05,
	"loss": 0.3496,
	"step": 980
	},
	{
	"epoch": 0.9057639524245197,
	"grad_norm": 5.430429935455322,
	"learning_rate": 3.552183338494891e-05,
	"loss": 0.368,
	"step": 990
	},
	{
	"epoch": 0.9149130832570905,
	"grad_norm": 7.088529109954834,
	"learning_rate": 3.536698668318365e-05,
	"loss": 0.3655,
	"step": 1000
	},
	{
	"epoch": 0.9149130832570905,
	"eval_loss": 0.3907645046710968,
	"eval_runtime": 424.8249,
	"eval_samples_per_second": 1.815,
	"eval_steps_per_second": 0.115,
	"eval_wer": 0.8130380114130961,
	"step": 1000
	},
	{
	"epoch": 0.9240622140896615,
	"grad_norm": 5.1332292556762695,
	"learning_rate": 3.52121399814184e-05,
	"loss": 0.3153,
	"step": 1010
	},
	{
	"epoch": 0.9332113449222323,
	"grad_norm": 5.477539539337158,
	"learning_rate": 3.505729327965315e-05,
	"loss": 0.3383,
	"step": 1020
	},
	{
	"epoch": 0.9423604757548033,
	"grad_norm": 6.7095866203308105,
	"learning_rate": 3.4902446577887895e-05,
	"loss": 0.3351,
	"step": 1030
	},
	{
	"epoch": 0.9515096065873742,
	"grad_norm": 4.704165935516357,
	"learning_rate": 3.474759987612264e-05,
	"loss": 0.3144,
	"step": 1040
	},
	{
	"epoch": 0.9606587374199451,
	"grad_norm": 9.83104419708252,
	"learning_rate": 3.459275317435739e-05,
	"loss": 0.3667,
	"step": 1050
	},
	{
	"epoch": 0.969807868252516,
	"grad_norm": 6.172043323516846,
	"learning_rate": 3.4437906472592134e-05,
	"loss": 0.3298,
	"step": 1060
	},
	{
	"epoch": 0.9789569990850869,
	"grad_norm": 6.027336597442627,
	"learning_rate": 3.428305977082688e-05,
	"loss": 0.3269,
	"step": 1070
	},
	{
	"epoch": 0.9881061299176578,
	"grad_norm": 6.435912132263184,
	"learning_rate": 3.412821306906163e-05,
	"loss": 0.3203,
	"step": 1080
	},
	{
	"epoch": 0.9972552607502287,
	"grad_norm": 7.0265913009643555,
	"learning_rate": 3.397336636729638e-05,
	"loss": 0.3413,
	"step": 1090
	},
	{
	"epoch": 1.0064043915827996,
	"grad_norm": 6.904513835906982,
	"learning_rate": 3.381851966553112e-05,
	"loss": 0.3164,
	"step": 1100
	},
	{
	"epoch": 1.0155535224153704,
	"grad_norm": 5.236996173858643,
	"learning_rate": 3.3663672963765876e-05,
	"loss": 0.2675,
	"step": 1110
	},
	{
	"epoch": 1.0247026532479415,
	"grad_norm": 6.988259792327881,
	"learning_rate": 3.350882626200062e-05,
	"loss": 0.3134,
	"step": 1120
	},
	{
	"epoch": 1.0338517840805124,
	"grad_norm": 8.87595272064209,
	"learning_rate": 3.335397956023537e-05,
	"loss": 0.3065,
	"step": 1130
	},
	{
	"epoch": 1.0430009149130832,
	"grad_norm": 7.2589287757873535,
	"learning_rate": 3.3199132858470114e-05,
	"loss": 0.2798,
	"step": 1140
	},
	{
	"epoch": 1.052150045745654,
	"grad_norm": 7.233737945556641,
	"learning_rate": 3.304428615670486e-05,
	"loss": 0.2954,
	"step": 1150
	},
	{
	"epoch": 1.0612991765782251,
	"grad_norm": 4.9386887550354,
	"learning_rate": 3.288943945493961e-05,
	"loss": 0.2959,
	"step": 1160
	},
	{
	"epoch": 1.070448307410796,
	"grad_norm": 6.335395812988281,
	"learning_rate": 3.273459275317436e-05,
	"loss": 0.295,
	"step": 1170
	},
	{
	"epoch": 1.0795974382433668,
	"grad_norm": 6.33104944229126,
	"learning_rate": 3.257974605140911e-05,
	"loss": 0.2997,
	"step": 1180
	},
	{
	"epoch": 1.0887465690759377,
	"grad_norm": 5.694860458374023,
	"learning_rate": 3.2424899349643856e-05,
	"loss": 0.262,
	"step": 1190
	},
	{
	"epoch": 1.0978956999085088,
	"grad_norm": 5.777647018432617,
	"learning_rate": 3.2270052647878605e-05,
	"loss": 0.2822,
	"step": 1200
	},
	{
	"epoch": 1.1070448307410796,
	"grad_norm": 8.250167846679688,
	"learning_rate": 3.2115205946113346e-05,
	"loss": 0.2778,
	"step": 1210
	},
	{
	"epoch": 1.1161939615736505,
	"grad_norm": 4.275432586669922,
	"learning_rate": 3.19603592443481e-05,
	"loss": 0.2793,
	"step": 1220
	},
	{
	"epoch": 1.1253430924062213,
	"grad_norm": 4.831576824188232,
	"learning_rate": 3.180551254258284e-05,
	"loss": 0.2815,
	"step": 1230
	},
	{
	"epoch": 1.1344922232387924,
	"grad_norm": 5.6868720054626465,
	"learning_rate": 3.165066584081759e-05,
	"loss": 0.3085,
	"step": 1240
	},
	{
	"epoch": 1.1436413540713632,
	"grad_norm": 5.878891944885254,
	"learning_rate": 3.149581913905234e-05,
	"loss": 0.2543,
	"step": 1250
	},
	{
	"epoch": 1.152790484903934,
	"grad_norm": 5.85615348815918,
	"learning_rate": 3.134097243728709e-05,
	"loss": 0.2538,
	"step": 1260
	},
	{
	"epoch": 1.161939615736505,
	"grad_norm": 4.6179118156433105,
	"learning_rate": 3.118612573552184e-05,
	"loss": 0.2565,
	"step": 1270
	},
	{
	"epoch": 1.171088746569076,
	"grad_norm": 5.257189750671387,
	"learning_rate": 3.1031279033756585e-05,
	"loss": 0.2681,
	"step": 1280
	},
	{
	"epoch": 1.1802378774016469,
	"grad_norm": 4.76942253112793,
	"learning_rate": 3.087643233199133e-05,
	"loss": 0.2826,
	"step": 1290
	},
	{
	"epoch": 1.1893870082342177,
	"grad_norm": 5.82953405380249,
	"learning_rate": 3.072158563022608e-05,
	"loss": 0.2826,
	"step": 1300
	},
	{
	"epoch": 1.1985361390667886,
	"grad_norm": 5.2305731773376465,
	"learning_rate": 3.0566738928460824e-05,
	"loss": 0.2598,
	"step": 1310
	},
	{
	"epoch": 1.2076852698993596,
	"grad_norm": 5.51474666595459,
	"learning_rate": 3.0411892226695572e-05,
	"loss": 0.2685,
	"step": 1320
	},
	{
	"epoch": 1.2168344007319305,
	"grad_norm": 7.23142147064209,
	"learning_rate": 3.025704552493032e-05,
	"loss": 0.285,
	"step": 1330
	},
	{
	"epoch": 1.2259835315645013,
	"grad_norm": 5.186690807342529,
	"learning_rate": 3.010219882316507e-05,
	"loss": 0.2872,
	"step": 1340
	},
	{
	"epoch": 1.2351326623970722,
	"grad_norm": 5.723147392272949,
	"learning_rate": 2.9947352121399814e-05,
	"loss": 0.2631,
	"step": 1350
	},
	{
	"epoch": 1.2442817932296433,
	"grad_norm": 4.612165451049805,
	"learning_rate": 2.9792505419634566e-05,
	"loss": 0.2966,
	"step": 1360
	},
	{
	"epoch": 1.2534309240622141,
	"grad_norm": 5.467476844787598,
	"learning_rate": 2.963765871786931e-05,
	"loss": 0.2308,
	"step": 1370
	},
	{
	"epoch": 1.262580054894785,
	"grad_norm": 4.7134785652160645,
	"learning_rate": 2.9482812016104063e-05,
	"loss": 0.2781,
	"step": 1380
	},
	{
	"epoch": 1.2717291857273558,
	"grad_norm": 4.138732433319092,
	"learning_rate": 2.9327965314338808e-05,
	"loss": 0.2452,
	"step": 1390
	},
	{
	"epoch": 1.2808783165599267,
	"grad_norm": 4.39865255355835,
	"learning_rate": 2.9173118612573553e-05,
	"loss": 0.2759,
	"step": 1400
	},
	{
	"epoch": 1.2900274473924978,
	"grad_norm": 6.269981384277344,
	"learning_rate": 2.9018271910808305e-05,
	"loss": 0.2802,
	"step": 1410
	},
	{
	"epoch": 1.2991765782250686,
	"grad_norm": 5.472837924957275,
	"learning_rate": 2.886342520904305e-05,
	"loss": 0.282,
	"step": 1420
	},
	{
	"epoch": 1.3083257090576395,
	"grad_norm": 5.290619850158691,
	"learning_rate": 2.8708578507277795e-05,
	"loss": 0.2443,
	"step": 1430
	},
	{
	"epoch": 1.3174748398902105,
	"grad_norm": 4.903107643127441,
	"learning_rate": 2.8553731805512546e-05,
	"loss": 0.255,
	"step": 1440
	},
	{
	"epoch": 1.3266239707227814,
	"grad_norm": 5.144070625305176,
	"learning_rate": 2.839888510374729e-05,
	"loss": 0.2375,
	"step": 1450
	},
	{
	"epoch": 1.3357731015553522,
	"grad_norm": 4.945043087005615,
	"learning_rate": 2.8244038401982036e-05,
	"loss": 0.2381,
	"step": 1460
	},
	{
	"epoch": 1.344922232387923,
	"grad_norm": 5.670736789703369,
	"learning_rate": 2.8089191700216788e-05,
	"loss": 0.2398,
	"step": 1470
	},
	{
	"epoch": 1.354071363220494,
	"grad_norm": 5.526036739349365,
	"learning_rate": 2.7934344998451533e-05,
	"loss": 0.2748,
	"step": 1480
	},
	{
	"epoch": 1.363220494053065,
	"grad_norm": 4.805148601531982,
	"learning_rate": 2.7779498296686278e-05,
	"loss": 0.2412,
	"step": 1490
	},
	{
	"epoch": 1.3723696248856359,
	"grad_norm": 4.122767925262451,
	"learning_rate": 2.762465159492103e-05,
	"loss": 0.2805,
	"step": 1500
	},
	{
	"epoch": 1.3723696248856359,
	"eval_loss": 0.33601683378219604,
	"eval_runtime": 432.4301,
	"eval_samples_per_second": 1.783,
	"eval_steps_per_second": 0.113,
	"eval_wer": 0.7586807234742238,
	"step": 1500
	},
	{
	"epoch": 1.3815187557182067,
	"grad_norm": 4.068643569946289,
	"learning_rate": 2.7469804893155775e-05,
	"loss": 0.2527,
	"step": 1510
	},
	{
	"epoch": 1.3906678865507778,
	"grad_norm": 5.818108081817627,
	"learning_rate": 2.7314958191390527e-05,
	"loss": 0.2707,
	"step": 1520
	},
	{
	"epoch": 1.3998170173833486,
	"grad_norm": 6.448596477508545,
	"learning_rate": 2.7160111489625272e-05,
	"loss": 0.2466,
	"step": 1530
	},
	{
	"epoch": 1.4089661482159195,
	"grad_norm": 6.120127201080322,
	"learning_rate": 2.7005264787860017e-05,
	"loss": 0.259,
	"step": 1540
	},
	{
	"epoch": 1.4181152790484903,
	"grad_norm": 4.396270751953125,
	"learning_rate": 2.685041808609477e-05,
	"loss": 0.2505,
	"step": 1550
	},
	{
	"epoch": 1.4272644098810612,
	"grad_norm": 3.8976686000823975,
	"learning_rate": 2.6695571384329514e-05,
	"loss": 0.2429,
	"step": 1560
	},
	{
	"epoch": 1.4364135407136323,
	"grad_norm": 4.241589069366455,
	"learning_rate": 2.6540724682564262e-05,
	"loss": 0.2424,
	"step": 1570
	},
	{
	"epoch": 1.445562671546203,
	"grad_norm": 6.113090515136719,
	"learning_rate": 2.638587798079901e-05,
	"loss": 0.2642,
	"step": 1580
	},
	{
	"epoch": 1.454711802378774,
	"grad_norm": 4.122611999511719,
	"learning_rate": 2.623103127903376e-05,
	"loss": 0.2259,
	"step": 1590
	},
	{
	"epoch": 1.463860933211345,
	"grad_norm": 4.869472026824951,
	"learning_rate": 2.6076184577268504e-05,
	"loss": 0.2542,
	"step": 1600
	},
	{
	"epoch": 1.4730100640439159,
	"grad_norm": 4.926369667053223,
	"learning_rate": 2.5921337875503256e-05,
	"loss": 0.2789,
	"step": 1610
	},
	{
	"epoch": 1.4821591948764867,
	"grad_norm": 5.319028854370117,
	"learning_rate": 2.5766491173738e-05,
	"loss": 0.265,
	"step": 1620
	},
	{
	"epoch": 1.4913083257090576,
	"grad_norm": 6.620922088623047,
	"learning_rate": 2.5611644471972746e-05,
	"loss": 0.2442,
	"step": 1630
	},
	{
	"epoch": 1.5004574565416284,
	"grad_norm": 5.458837032318115,
	"learning_rate": 2.5456797770207498e-05,
	"loss": 0.252,
	"step": 1640
	},
	{
	"epoch": 1.5096065873741995,
	"grad_norm": 5.415153503417969,
	"learning_rate": 2.5301951068442243e-05,
	"loss": 0.237,
	"step": 1650
	},
	{
	"epoch": 1.5187557182067704,
	"grad_norm": 4.952278137207031,
	"learning_rate": 2.5147104366676995e-05,
	"loss": 0.2577,
	"step": 1660
	},
	{
	"epoch": 1.5279048490393414,
	"grad_norm": 4.834970951080322,
	"learning_rate": 2.499225766491174e-05,
	"loss": 0.2452,
	"step": 1670
	},
	{
	"epoch": 1.5370539798719123,
	"grad_norm": 5.410050392150879,
	"learning_rate": 2.4837410963146488e-05,
	"loss": 0.2258,
	"step": 1680
	},
	{
	"epoch": 1.5462031107044831,
	"grad_norm": 4.104517936706543,
	"learning_rate": 2.4682564261381233e-05,
	"loss": 0.229,
	"step": 1690
	},
	{
	"epoch": 1.555352241537054,
	"grad_norm": 4.475819110870361,
	"learning_rate": 2.452771755961598e-05,
	"loss": 0.2589,
	"step": 1700
	},
	{
	"epoch": 1.5645013723696248,
	"grad_norm": 3.8395609855651855,
	"learning_rate": 2.437287085785073e-05,
	"loss": 0.2269,
	"step": 1710
	},
	{
	"epoch": 1.5736505032021957,
	"grad_norm": 4.9355621337890625,
	"learning_rate": 2.4218024156085475e-05,
	"loss": 0.2625,
	"step": 1720
	},
	{
	"epoch": 1.5827996340347665,
	"grad_norm": 4.053934097290039,
	"learning_rate": 2.4063177454320223e-05,
	"loss": 0.2559,
	"step": 1730
	},
	{
	"epoch": 1.5919487648673376,
	"grad_norm": 5.001983642578125,
	"learning_rate": 2.3908330752554972e-05,
	"loss": 0.23,
	"step": 1740
	},
	{
	"epoch": 1.6010978956999085,
	"grad_norm": 5.705740928649902,
	"learning_rate": 2.375348405078972e-05,
	"loss": 0.2173,
	"step": 1750
	},
	{
	"epoch": 1.6102470265324795,
	"grad_norm": 4.854909420013428,
	"learning_rate": 2.3598637349024465e-05,
	"loss": 0.2297,
	"step": 1760
	},
	{
	"epoch": 1.6193961573650504,
	"grad_norm": 3.785277843475342,
	"learning_rate": 2.3443790647259214e-05,
	"loss": 0.2065,
	"step": 1770
	},
	{
	"epoch": 1.6285452881976212,
	"grad_norm": 5.307765960693359,
	"learning_rate": 2.3288943945493962e-05,
	"loss": 0.2246,
	"step": 1780
	},
	{
	"epoch": 1.637694419030192,
	"grad_norm": 5.032717704772949,
	"learning_rate": 2.3134097243728707e-05,
	"loss": 0.2168,
	"step": 1790
	},
	{
	"epoch": 1.646843549862763,
	"grad_norm": 4.665537357330322,
	"learning_rate": 2.2979250541963456e-05,
	"loss": 0.2409,
	"step": 1800
	},
	{
	"epoch": 1.6559926806953338,
	"grad_norm": 4.126980304718018,
	"learning_rate": 2.2824403840198204e-05,
	"loss": 0.2397,
	"step": 1810
	},
	{
	"epoch": 1.6651418115279049,
	"grad_norm": 5.973440170288086,
	"learning_rate": 2.2669557138432952e-05,
	"loss": 0.2654,
	"step": 1820
	},
	{
	"epoch": 1.6742909423604757,
	"grad_norm": 4.972531795501709,
	"learning_rate": 2.25147104366677e-05,
	"loss": 0.2636,
	"step": 1830
	},
	{
	"epoch": 1.6834400731930468,
	"grad_norm": 6.962503910064697,
	"learning_rate": 2.235986373490245e-05,
	"loss": 0.2629,
	"step": 1840
	},
	{
	"epoch": 1.6925892040256176,
	"grad_norm": 4.002923488616943,
	"learning_rate": 2.2205017033137198e-05,
	"loss": 0.2333,
	"step": 1850
	},
	{
	"epoch": 1.7017383348581885,
	"grad_norm": 5.305150985717773,
	"learning_rate": 2.2050170331371943e-05,
	"loss": 0.2535,
	"step": 1860
	},
	{
	"epoch": 1.7108874656907593,
	"grad_norm": 4.577486038208008,
	"learning_rate": 2.189532362960669e-05,
	"loss": 0.2307,
	"step": 1870
	},
	{
	"epoch": 1.7200365965233302,
	"grad_norm": 4.220026016235352,
	"learning_rate": 2.174047692784144e-05,
	"loss": 0.2461,
	"step": 1880
	},
	{
	"epoch": 1.729185727355901,
	"grad_norm": 5.4357428550720215,
	"learning_rate": 2.1585630226076188e-05,
	"loss": 0.2297,
	"step": 1890
	},
	{
	"epoch": 1.738334858188472,
	"grad_norm": 5.218511581420898,
	"learning_rate": 2.1430783524310933e-05,
	"loss": 0.2419,
	"step": 1900
	},
	{
	"epoch": 1.747483989021043,
	"grad_norm": 6.166689395904541,
	"learning_rate": 2.127593682254568e-05,
	"loss": 0.2471,
	"step": 1910
	},
	{
	"epoch": 1.756633119853614,
	"grad_norm": 5.226531982421875,
	"learning_rate": 2.112109012078043e-05,
	"loss": 0.238,
	"step": 1920
	},
	{
	"epoch": 1.7657822506861849,
	"grad_norm": 6.10182523727417,
	"learning_rate": 2.0966243419015175e-05,
	"loss": 0.2654,
	"step": 1930
	},
	{
	"epoch": 1.7749313815187557,
	"grad_norm": 4.4128737449646,
	"learning_rate": 2.0811396717249923e-05,
	"loss": 0.23,
	"step": 1940
	},
	{
	"epoch": 1.7840805123513266,
	"grad_norm": 4.541961193084717,
	"learning_rate": 2.065655001548467e-05,
	"loss": 0.2067,
	"step": 1950
	},
	{
	"epoch": 1.7932296431838974,
	"grad_norm": 8.150908470153809,
	"learning_rate": 2.050170331371942e-05,
	"loss": 0.224,
	"step": 1960
	},
	{
	"epoch": 1.8023787740164683,
	"grad_norm": 4.411103248596191,
	"learning_rate": 2.0346856611954165e-05,
	"loss": 0.2244,
	"step": 1970
	},
	{
	"epoch": 1.8115279048490394,
	"grad_norm": 4.345833778381348,
	"learning_rate": 2.0192009910188913e-05,
	"loss": 0.225,
	"step": 1980
	},
	{
	"epoch": 1.8206770356816102,
	"grad_norm": 4.550020694732666,
	"learning_rate": 2.0037163208423662e-05,
	"loss": 0.2406,
	"step": 1990
	},
	{
	"epoch": 1.8298261665141813,
	"grad_norm": 3.8560264110565186,
	"learning_rate": 1.988231650665841e-05,
	"loss": 0.2461,
	"step": 2000
	},
	{
	"epoch": 1.8298261665141813,
	"eval_loss": 0.29912057518959045,
	"eval_runtime": 422.9004,
	"eval_samples_per_second": 1.823,
	"eval_steps_per_second": 0.116,
	"eval_wer": 0.7281651997291808,
	"step": 2000
	},
	{
	"epoch": 1.8389752973467521,
	"grad_norm": 5.020371437072754,
	"learning_rate": 1.9727469804893155e-05,
	"loss": 0.2257,
	"step": 2010
	},
	{
	"epoch": 1.848124428179323,
	"grad_norm": 6.07639741897583,
	"learning_rate": 1.9572623103127904e-05,
	"loss": 0.2146,
	"step": 2020
	},
	{
	"epoch": 1.8572735590118938,
	"grad_norm": 5.103982925415039,
	"learning_rate": 1.9417776401362652e-05,
	"loss": 0.2248,
	"step": 2030
	},
	{
	"epoch": 1.8664226898444647,
	"grad_norm": 5.3223042488098145,
	"learning_rate": 1.9262929699597397e-05,
	"loss": 0.2162,
	"step": 2040
	},
	{
	"epoch": 1.8755718206770355,
	"grad_norm": 4.5631103515625,
	"learning_rate": 1.9108082997832146e-05,
	"loss": 0.2279,
	"step": 2050
	},
	{
	"epoch": 1.8847209515096066,
	"grad_norm": 4.72071647644043,
	"learning_rate": 1.8953236296066894e-05,
	"loss": 0.251,
	"step": 2060
	},
	{
	"epoch": 1.8938700823421775,
	"grad_norm": 4.969239234924316,
	"learning_rate": 1.8798389594301642e-05,
	"loss": 0.2172,
	"step": 2070
	},
	{
	"epoch": 1.9030192131747485,
	"grad_norm": 4.407639026641846,
	"learning_rate": 1.864354289253639e-05,
	"loss": 0.2098,
	"step": 2080
	},
	{
	"epoch": 1.9121683440073194,
	"grad_norm": 3.3802950382232666,
	"learning_rate": 1.8488696190771136e-05,
	"loss": 0.2192,
	"step": 2090
	},
	{
	"epoch": 1.9213174748398902,
	"grad_norm": 4.947459697723389,
	"learning_rate": 1.8333849489005884e-05,
	"loss": 0.2278,
	"step": 2100
	},
	{
	"epoch": 1.930466605672461,
	"grad_norm": 4.750110626220703,
	"learning_rate": 1.8179002787240633e-05,
	"loss": 0.2185,
	"step": 2110
	},
	{
	"epoch": 1.939615736505032,
	"grad_norm": 4.515120506286621,
	"learning_rate": 1.802415608547538e-05,
	"loss": 0.2045,
	"step": 2120
	},
	{
	"epoch": 1.9487648673376028,
	"grad_norm": 4.280106067657471,
	"learning_rate": 1.786930938371013e-05,
	"loss": 0.2051,
	"step": 2130
	},
	{
	"epoch": 1.9579139981701739,
	"grad_norm": 4.002866268157959,
	"learning_rate": 1.7714462681944878e-05,
	"loss": 0.2301,
	"step": 2140
	},
	{
	"epoch": 1.9670631290027447,
	"grad_norm": 4.178459644317627,
	"learning_rate": 1.7559615980179623e-05,
	"loss": 0.2202,
	"step": 2150
	},
	{
	"epoch": 1.9762122598353158,
	"grad_norm": 6.406257629394531,
	"learning_rate": 1.740476927841437e-05,
	"loss": 0.225,
	"step": 2160
	},
	{
	"epoch": 1.9853613906678866,
	"grad_norm": 4.606039524078369,
	"learning_rate": 1.724992257664912e-05,
	"loss": 0.2446,
	"step": 2170
	},
	{
	"epoch": 1.9945105215004575,
	"grad_norm": 4.238482475280762,
	"learning_rate": 1.7095075874883865e-05,
	"loss": 0.2524,
	"step": 2180
	},
	{
	"epoch": 2.0036596523330283,
	"grad_norm": 3.64787220954895,
	"learning_rate": 1.6940229173118613e-05,
	"loss": 0.218,
	"step": 2190
	},
	{
	"epoch": 2.012808783165599,
	"grad_norm": 3.7717037200927734,
	"learning_rate": 1.6785382471353362e-05,
	"loss": 0.1669,
	"step": 2200
	},
	{
	"epoch": 2.02195791399817,
	"grad_norm": 2.716965675354004,
	"learning_rate": 1.663053576958811e-05,
	"loss": 0.1806,
	"step": 2210
	},
	{
	"epoch": 2.031107044830741,
	"grad_norm": 4.059733867645264,
	"learning_rate": 1.6475689067822855e-05,
	"loss": 0.186,
	"step": 2220
	},
	{
	"epoch": 2.040256175663312,
	"grad_norm": 4.125363349914551,
	"learning_rate": 1.6320842366057604e-05,
	"loss": 0.1872,
	"step": 2230
	},
	{
	"epoch": 2.049405306495883,
	"grad_norm": 3.4910032749176025,
	"learning_rate": 1.6165995664292352e-05,
	"loss": 0.1519,
	"step": 2240
	},
	{
	"epoch": 2.058554437328454,
	"grad_norm": 2.8993113040924072,
	"learning_rate": 1.6011148962527097e-05,
	"loss": 0.1744,
	"step": 2250
	},
	{
	"epoch": 2.0677035681610247,
	"grad_norm": 4.730359077453613,
	"learning_rate": 1.5856302260761845e-05,
	"loss": 0.1627,
	"step": 2260
	},
	{
	"epoch": 2.0768526989935956,
	"grad_norm": 5.577477931976318,
	"learning_rate": 1.5701455558996594e-05,
	"loss": 0.1753,
	"step": 2270
	},
	{
	"epoch": 2.0860018298261664,
	"grad_norm": 4.823721885681152,
	"learning_rate": 1.5546608857231342e-05,
	"loss": 0.1821,
	"step": 2280
	},
	{
	"epoch": 2.0951509606587373,
	"grad_norm": 3.287593364715576,
	"learning_rate": 1.5391762155466087e-05,
	"loss": 0.1573,
	"step": 2290
	},
	{
	"epoch": 2.104300091491308,
	"grad_norm": 5.850045204162598,
	"learning_rate": 1.5236915453700837e-05,
	"loss": 0.1786,
	"step": 2300
	},
	{
	"epoch": 2.1134492223238794,
	"grad_norm": 4.332837104797363,
	"learning_rate": 1.5082068751935586e-05,
	"loss": 0.1884,
	"step": 2310
	},
	{
	"epoch": 2.1225983531564503,
	"grad_norm": 3.266853094100952,
	"learning_rate": 1.4927222050170331e-05,
	"loss": 0.1589,
	"step": 2320
	},
	{
	"epoch": 2.131747483989021,
	"grad_norm": 3.742208242416382,
	"learning_rate": 1.477237534840508e-05,
	"loss": 0.1691,
	"step": 2330
	},
	{
	"epoch": 2.140896614821592,
	"grad_norm": 4.098796844482422,
	"learning_rate": 1.4617528646639828e-05,
	"loss": 0.1622,
	"step": 2340
	},
	{
	"epoch": 2.150045745654163,
	"grad_norm": 5.091181755065918,
	"learning_rate": 1.4462681944874576e-05,
	"loss": 0.185,
	"step": 2350
	},
	{
	"epoch": 2.1591948764867337,
	"grad_norm": 3.2334043979644775,
	"learning_rate": 1.4307835243109321e-05,
	"loss": 0.1573,
	"step": 2360
	},
	{
	"epoch": 2.1683440073193045,
	"grad_norm": 3.941044569015503,
	"learning_rate": 1.415298854134407e-05,
	"loss": 0.17,
	"step": 2370
	},
	{
	"epoch": 2.1774931381518754,
	"grad_norm": 4.680139541625977,
	"learning_rate": 1.3998141839578818e-05,
	"loss": 0.1652,
	"step": 2380
	},
	{
	"epoch": 2.1866422689844462,
	"grad_norm": 3.671124219894409,
	"learning_rate": 1.3843295137813565e-05,
	"loss": 0.1637,
	"step": 2390
	},
	{
	"epoch": 2.1957913998170175,
	"grad_norm": 3.4199767112731934,
	"learning_rate": 1.3688448436048313e-05,
	"loss": 0.1822,
	"step": 2400
	},
	{
	"epoch": 2.2049405306495884,
	"grad_norm": 4.193777084350586,
	"learning_rate": 1.353360173428306e-05,
	"loss": 0.1724,
	"step": 2410
	},
	{
	"epoch": 2.2140896614821592,
	"grad_norm": 3.5047738552093506,
	"learning_rate": 1.3378755032517808e-05,
	"loss": 0.1661,
	"step": 2420
	},
	{
	"epoch": 2.22323879231473,
	"grad_norm": 4.056273460388184,
	"learning_rate": 1.3223908330752555e-05,
	"loss": 0.1476,
	"step": 2430
	},
	{
	"epoch": 2.232387923147301,
	"grad_norm": 5.089756488800049,
	"learning_rate": 1.3069061628987303e-05,
	"loss": 0.1785,
	"step": 2440
	},
	{
	"epoch": 2.241537053979872,
	"grad_norm": 3.5870766639709473,
	"learning_rate": 1.2914214927222052e-05,
	"loss": 0.1835,
	"step": 2450
	},
	{
	"epoch": 2.2506861848124426,
	"grad_norm": 3.9031713008880615,
	"learning_rate": 1.2759368225456797e-05,
	"loss": 0.1725,
	"step": 2460
	},
	{
	"epoch": 2.259835315645014,
	"grad_norm": 4.2854437828063965,
	"learning_rate": 1.2604521523691545e-05,
	"loss": 0.1774,
	"step": 2470
	},
	{
	"epoch": 2.268984446477585,
	"grad_norm": 4.6277756690979,
	"learning_rate": 1.2449674821926294e-05,
	"loss": 0.1583,
	"step": 2480
	},
	{
	"epoch": 2.2781335773101556,
	"grad_norm": 5.180362224578857,
	"learning_rate": 1.229482812016104e-05,
	"loss": 0.1636,
	"step": 2490
	},
	{
	"epoch": 2.2872827081427265,
	"grad_norm": 2.9935238361358643,
	"learning_rate": 1.2139981418395789e-05,
	"loss": 0.1486,
	"step": 2500
	},
	{
	"epoch": 2.2872827081427265,
	"eval_loss": 0.2814071476459503,
	"eval_runtime": 424.1932,
	"eval_samples_per_second": 1.818,
	"eval_steps_per_second": 0.116,
	"eval_wer": 0.7055808105232615,
	"step": 2500
	},
	{
	"epoch": 2.2964318389752973,
	"grad_norm": 3.3283779621124268,
	"learning_rate": 1.1985134716630536e-05,
	"loss": 0.158,
	"step": 2510
	},
	{
	"epoch": 2.305580969807868,
	"grad_norm": 4.186689376831055,
	"learning_rate": 1.1830288014865284e-05,
	"loss": 0.1598,
	"step": 2520
	},
	{
	"epoch": 2.314730100640439,
	"grad_norm": 3.5572612285614014,
	"learning_rate": 1.167544131310003e-05,
	"loss": 0.1492,
	"step": 2530
	},
	{
	"epoch": 2.32387923147301,
	"grad_norm": 2.8076884746551514,
	"learning_rate": 1.1520594611334779e-05,
	"loss": 0.1637,
	"step": 2540
	},
	{
	"epoch": 2.3330283623055807,
	"grad_norm": 4.602914810180664,
	"learning_rate": 1.1365747909569528e-05,
	"loss": 0.1526,
	"step": 2550
	},
	{
	"epoch": 2.342177493138152,
	"grad_norm": 2.5850772857666016,
	"learning_rate": 1.1210901207804274e-05,
	"loss": 0.159,
	"step": 2560
	},
	{
	"epoch": 2.351326623970723,
	"grad_norm": 5.045381546020508,
	"learning_rate": 1.1056054506039023e-05,
	"loss": 0.1503,
	"step": 2570
	},
	{
	"epoch": 2.3604757548032937,
	"grad_norm": 4.628170967102051,
	"learning_rate": 1.090120780427377e-05,
	"loss": 0.159,
	"step": 2580
	},
	{
	"epoch": 2.3696248856358646,
	"grad_norm": 3.4683902263641357,
	"learning_rate": 1.0746361102508518e-05,
	"loss": 0.1613,
	"step": 2590
	},
	{
	"epoch": 2.3787740164684354,
	"grad_norm": 4.1546525955200195,
	"learning_rate": 1.0591514400743265e-05,
	"loss": 0.1482,
	"step": 2600
	},
	{
	"epoch": 2.3879231473010063,
	"grad_norm": 5.595340251922607,
	"learning_rate": 1.0436667698978013e-05,
	"loss": 0.1654,
	"step": 2610
	},
	{
	"epoch": 2.397072278133577,
	"grad_norm": 4.809768199920654,
	"learning_rate": 1.028182099721276e-05,
	"loss": 0.1457,
	"step": 2620
	},
	{
	"epoch": 2.4062214089661484,
	"grad_norm": 3.541982889175415,
	"learning_rate": 1.0126974295447506e-05,
	"loss": 0.163,
	"step": 2630
	},
	{
	"epoch": 2.4153705397987193,
	"grad_norm": 5.883151054382324,
	"learning_rate": 9.972127593682255e-06,
	"loss": 0.1761,
	"step": 2640
	},
	{
	"epoch": 2.42451967063129,
	"grad_norm": 4.718671798706055,
	"learning_rate": 9.817280891917002e-06,
	"loss": 0.1562,
	"step": 2650
	},
	{
	"epoch": 2.433668801463861,
	"grad_norm": 3.135131597518921,
	"learning_rate": 9.66243419015175e-06,
	"loss": 0.1669,
	"step": 2660
	},
	{
	"epoch": 2.442817932296432,
	"grad_norm": 5.202821254730225,
	"learning_rate": 9.507587488386498e-06,
	"loss": 0.1748,
	"step": 2670
	},
	{
	"epoch": 2.4519670631290027,
	"grad_norm": 5.344453811645508,
	"learning_rate": 9.352740786621247e-06,
	"loss": 0.1641,
	"step": 2680
	},
	{
	"epoch": 2.4611161939615736,
	"grad_norm": 3.3761284351348877,
	"learning_rate": 9.197894084855993e-06,
	"loss": 0.1574,
	"step": 2690
	},
	{
	"epoch": 2.4702653247941444,
	"grad_norm": 5.866576671600342,
	"learning_rate": 9.04304738309074e-06,
	"loss": 0.1621,
	"step": 2700
	},
	{
	"epoch": 2.4794144556267153,
	"grad_norm": 4.291085720062256,
	"learning_rate": 8.888200681325489e-06,
	"loss": 0.1614,
	"step": 2710
	},
	{
	"epoch": 2.4885635864592865,
	"grad_norm": 2.837286949157715,
	"learning_rate": 8.733353979560235e-06,
	"loss": 0.1654,
	"step": 2720
	},
	{
	"epoch": 2.4977127172918574,
	"grad_norm": 3.848227024078369,
	"learning_rate": 8.578507277794984e-06,
	"loss": 0.1578,
	"step": 2730
	},
	{
	"epoch": 2.5068618481244282,
	"grad_norm": 3.820240020751953,
	"learning_rate": 8.42366057602973e-06,
	"loss": 0.1627,
	"step": 2740
	},
	{
	"epoch": 2.516010978956999,
	"grad_norm": 3.1845788955688477,
	"learning_rate": 8.268813874264479e-06,
	"loss": 0.1718,
	"step": 2750
	},
	{
	"epoch": 2.52516010978957,
	"grad_norm": 4.4272236824035645,
	"learning_rate": 8.113967172499226e-06,
	"loss": 0.1624,
	"step": 2760
	},
	{
	"epoch": 2.534309240622141,
	"grad_norm": 3.211336374282837,
	"learning_rate": 7.959120470733972e-06,
	"loss": 0.1571,
	"step": 2770
	},
	{
	"epoch": 2.5434583714547117,
	"grad_norm": 3.920867443084717,
	"learning_rate": 7.80427376896872e-06,
	"loss": 0.1499,
	"step": 2780
	},
	{
	"epoch": 2.552607502287283,
	"grad_norm": 5.123950481414795,
	"learning_rate": 7.64942706720347e-06,
	"loss": 0.1475,
	"step": 2790
	},
	{
	"epoch": 2.5617566331198534,
	"grad_norm": 3.7110486030578613,
	"learning_rate": 7.494580365438217e-06,
	"loss": 0.1552,
	"step": 2800
	},
	{
	"epoch": 2.5709057639524246,
	"grad_norm": 4.068341255187988,
	"learning_rate": 7.3397336636729635e-06,
	"loss": 0.1494,
	"step": 2810
	},
	{
	"epoch": 2.5800548947849955,
	"grad_norm": 4.653831958770752,
	"learning_rate": 7.184886961907712e-06,
	"loss": 0.161,
	"step": 2820
	},
	{
	"epoch": 2.5892040256175664,
	"grad_norm": 3.5324552059173584,
	"learning_rate": 7.0300402601424595e-06,
	"loss": 0.16,
	"step": 2830
	},
	{
	"epoch": 2.598353156450137,
	"grad_norm": 5.100922107696533,
	"learning_rate": 6.875193558377208e-06,
	"loss": 0.1549,
	"step": 2840
	},
	{
	"epoch": 2.607502287282708,
	"grad_norm": 3.772149085998535,
	"learning_rate": 6.720346856611955e-06,
	"loss": 0.1613,
	"step": 2850
	},
	{
	"epoch": 2.616651418115279,
	"grad_norm": 4.288483619689941,
	"learning_rate": 6.565500154846701e-06,
	"loss": 0.1605,
	"step": 2860
	},
	{
	"epoch": 2.6258005489478498,
	"grad_norm": 3.9227993488311768,
	"learning_rate": 6.41065345308145e-06,
	"loss": 0.1538,
	"step": 2870
	},
	{
	"epoch": 2.634949679780421,
	"grad_norm": 3.3688392639160156,
	"learning_rate": 6.255806751316197e-06,
	"loss": 0.173,
	"step": 2880
	},
	{
	"epoch": 2.644098810612992,
	"grad_norm": 3.6099278926849365,
	"learning_rate": 6.100960049550945e-06,
	"loss": 0.1739,
	"step": 2890
	},
	{
	"epoch": 2.6532479414455628,
	"grad_norm": 3.802189826965332,
	"learning_rate": 5.9461133477856925e-06,
	"loss": 0.1506,
	"step": 2900
	},
	{
	"epoch": 2.6623970722781336,
	"grad_norm": 3.382754325866699,
	"learning_rate": 5.79126664602044e-06,
	"loss": 0.1701,
	"step": 2910
	},
	{
	"epoch": 2.6715462031107045,
	"grad_norm": 3.056814193725586,
	"learning_rate": 5.636419944255188e-06,
	"loss": 0.1638,
	"step": 2920
	},
	{
	"epoch": 2.6806953339432753,
	"grad_norm": 3.345564842224121,
	"learning_rate": 5.481573242489935e-06,
	"loss": 0.1318,
	"step": 2930
	},
	{
	"epoch": 2.689844464775846,
	"grad_norm": 3.740990400314331,
	"learning_rate": 5.326726540724683e-06,
	"loss": 0.1611,
	"step": 2940
	},
	{
	"epoch": 2.6989935956084175,
	"grad_norm": 2.8473143577575684,
	"learning_rate": 5.17187983895943e-06,
	"loss": 0.1684,
	"step": 2950
	},
	{
	"epoch": 2.708142726440988,
	"grad_norm": 2.8555662631988525,
	"learning_rate": 5.017033137194178e-06,
	"loss": 0.1883,
	"step": 2960
	},
	{
	"epoch": 2.717291857273559,
	"grad_norm": 4.181397438049316,
	"learning_rate": 4.8621864354289254e-06,
	"loss": 0.1677,
	"step": 2970
	},
	{
	"epoch": 2.72644098810613,
	"grad_norm": 4.9955949783325195,
	"learning_rate": 4.707339733663673e-06,
	"loss": 0.1724,
	"step": 2980
	},
	{
	"epoch": 2.735590118938701,
	"grad_norm": 3.999300956726074,
	"learning_rate": 4.552493031898421e-06,
	"loss": 0.1433,
	"step": 2990
	},
	{
	"epoch": 2.7447392497712717,
	"grad_norm": 3.054906129837036,
	"learning_rate": 4.397646330133168e-06,
	"loss": 0.1796,
	"step": 3000
	},
	{
	"epoch": 2.7447392497712717,
	"eval_loss": 0.2692735195159912,
	"eval_runtime": 414.8696,
	"eval_samples_per_second": 1.858,
	"eval_steps_per_second": 0.118,
	"eval_wer": 0.6916529645033369,
	"step": 3000
	}
	],
	"logging_steps": 10,
	"max_steps": 3279,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 3,
	"save_steps": 500,
	"stateful_callbacks": {
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": false
	},
	"attributes": {}
	}
	},
	"total_flos": 1.18116487028736e+18,
	"train_batch_size": 16,
	"trial_name": null,
	"trial_params": null
	}