rrf / trainer_state.json

Upload checkpoint

aa2141c verified 1 day ago

17.6 kB

	{
	"best_global_step": 600,
	"best_metric": 0.23669058084487915,
	"best_model_checkpoint": "./checkpoints/qwen253-lora-leduc_random_l_s35/checkpoint-600",
	"epoch": 1.0,
	"eval_steps": 200,
	"global_step": 661,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.015128593040847202,
	"grad_norm": 7.96875,
	"learning_rate": 8.999999999999999e-06,
	"loss": 0.5547,
	"mean_token_accuracy": 0.834239986538887,
	"num_tokens": 158163.0,
	"step": 10
	},
	{
	"epoch": 0.030257186081694403,
	"grad_norm": 3.1875,
	"learning_rate": 1.8999999999999998e-05,
	"loss": 0.2377,
	"mean_token_accuracy": 0.8513324618339538,
	"num_tokens": 316049.0,
	"step": 20
	},
	{
	"epoch": 0.0453857791225416,
	"grad_norm": 2.96875,
	"learning_rate": 2.9e-05,
	"loss": 0.2314,
	"mean_token_accuracy": 0.8561549067497254,
	"num_tokens": 472484.0,
	"step": 30
	},
	{
	"epoch": 0.060514372163388806,
	"grad_norm": 1.0625,
	"learning_rate": 3.499647414432928e-05,
	"loss": 0.2276,
	"mean_token_accuracy": 0.8648945838212967,
	"num_tokens": 631477.0,
	"step": 40
	},
	{
	"epoch": 0.07564296520423601,
	"grad_norm": 0.6875,
	"learning_rate": 3.4956824582777116e-05,
	"loss": 0.2311,
	"mean_token_accuracy": 0.853455251455307,
	"num_tokens": 790829.0,
	"step": 50
	},
	{
	"epoch": 0.0907715582450832,
	"grad_norm": 2.5,
	"learning_rate": 3.4873218311644976e-05,
	"loss": 0.2364,
	"mean_token_accuracy": 0.8518135726451874,
	"num_tokens": 949726.0,
	"step": 60
	},
	{
	"epoch": 0.1059001512859304,
	"grad_norm": 3.78125,
	"learning_rate": 3.474586585356039e-05,
	"loss": 0.2301,
	"mean_token_accuracy": 0.8524481028318405,
	"num_tokens": 1107604.0,
	"step": 70
	},
	{
	"epoch": 0.12102874432677761,
	"grad_norm": 3.125,
	"learning_rate": 3.457508788511535e-05,
	"loss": 0.231,
	"mean_token_accuracy": 0.8513583898544311,
	"num_tokens": 1265888.0,
	"step": 80
	},
	{
	"epoch": 0.1361573373676248,
	"grad_norm": 1.640625,
	"learning_rate": 3.436131442939487e-05,
	"loss": 0.2236,
	"mean_token_accuracy": 0.8561012089252472,
	"num_tokens": 1425168.0,
	"step": 90
	},
	{
	"epoch": 0.15128593040847202,
	"grad_norm": 0.75390625,
	"learning_rate": 3.4105083773168374e-05,
	"loss": 0.2259,
	"mean_token_accuracy": 0.8565482378005982,
	"num_tokens": 1582934.0,
	"step": 100
	},
	{
	"epoch": 0.1664145234493192,
	"grad_norm": 1.0390625,
	"learning_rate": 3.380704111147049e-05,
	"loss": 0.231,
	"mean_token_accuracy": 0.855805104970932,
	"num_tokens": 1741024.0,
	"step": 110
	},
	{
	"epoch": 0.1815431164901664,
	"grad_norm": 2.859375,
	"learning_rate": 3.3467936922984234e-05,
	"loss": 0.2247,
	"mean_token_accuracy": 0.8517077833414077,
	"num_tokens": 1898125.0,
	"step": 120
	},
	{
	"epoch": 0.19667170953101362,
	"grad_norm": 2.828125,
	"learning_rate": 3.308862508031743e-05,
	"loss": 0.2315,
	"mean_token_accuracy": 0.8443083852529526,
	"num_tokens": 2055835.0,
	"step": 130
	},
	{
	"epoch": 0.2118003025718608,
	"grad_norm": 0.6171875,
	"learning_rate": 3.267006069993065e-05,
	"loss": 0.2323,
	"mean_token_accuracy": 0.854484823346138,
	"num_tokens": 2213654.0,
	"step": 140
	},
	{
	"epoch": 0.22692889561270801,
	"grad_norm": 2.40625,
	"learning_rate": 3.221329773713071e-05,
	"loss": 0.2263,
	"mean_token_accuracy": 0.861380758881569,
	"num_tokens": 2373366.0,
	"step": 150
	},
	{
	"epoch": 0.24205748865355523,
	"grad_norm": 1.40625,
	"learning_rate": 3.1719486332185534e-05,
	"loss": 0.2313,
	"mean_token_accuracy": 0.8440588176250458,
	"num_tokens": 2532146.0,
	"step": 160
	},
	{
	"epoch": 0.25718608169440244,
	"grad_norm": 2.421875,
	"learning_rate": 3.118986991424293e-05,
	"loss": 0.23,
	"mean_token_accuracy": 0.8541617065668106,
	"num_tokens": 2691424.0,
	"step": 170
	},
	{
	"epoch": 0.2723146747352496,
	"grad_norm": 0.71875,
	"learning_rate": 3.0625782070345705e-05,
	"loss": 0.2279,
	"mean_token_accuracy": 0.855641770362854,
	"num_tokens": 2849973.0,
	"step": 180
	},
	{
	"epoch": 0.2874432677760968,
	"grad_norm": 4.5,
	"learning_rate": 3.002864318742703e-05,
	"loss": 0.2218,
	"mean_token_accuracy": 0.8619469672441482,
	"num_tokens": 3007503.0,
	"step": 190
	},
	{
	"epoch": 0.30257186081694404,
	"grad_norm": 2.203125,
	"learning_rate": 2.9399956875741492e-05,
	"loss": 0.2254,
	"mean_token_accuracy": 0.8585571944713593,
	"num_tokens": 3168059.0,
	"step": 200
	},
	{
	"epoch": 0.30257186081694404,
	"eval_loss": 0.2432168573141098,
	"eval_num_tokens": 3168059.0,
	"eval_runtime": 10.3614,
	"eval_samples_per_second": 20.654,
	"eval_steps_per_second": 20.654,
	"step": 200
	},
	{
	"epoch": 0.3177004538577912,
	"grad_norm": 2.40625,
	"learning_rate": 2.8741306182737877e-05,
	"loss": 0.2257,
	"mean_token_accuracy": 0.8514153599739075,
	"num_tokens": 3325430.0,
	"step": 210
	},
	{
	"epoch": 0.3328290468986384,
	"grad_norm": 2.125,
	"learning_rate": 2.805434960690712e-05,
	"loss": 0.2266,
	"mean_token_accuracy": 0.8573758780956269,
	"num_tokens": 3484988.0,
	"step": 220
	},
	{
	"epoch": 0.34795763993948564,
	"grad_norm": 1.6875,
	"learning_rate": 2.73408169216427e-05,
	"loss": 0.2257,
	"mean_token_accuracy": 0.8511970967054368,
	"num_tokens": 3644592.0,
	"step": 230
	},
	{
	"epoch": 0.3630862329803328,
	"grad_norm": 0.65234375,
	"learning_rate": 2.6602504819629076e-05,
	"loss": 0.2204,
	"mean_token_accuracy": 0.8690169095993042,
	"num_tokens": 3805280.0,
	"step": 240
	},
	{
	"epoch": 0.37821482602118,
	"grad_norm": 3.53125,
	"learning_rate": 2.5841272388725777e-05,
	"loss": 0.2157,
	"mean_token_accuracy": 0.8685499548912048,
	"num_tokens": 3965413.0,
	"step": 250
	},
	{
	"epoch": 0.39334341906202724,
	"grad_norm": 0.99609375,
	"learning_rate": 2.5059036430738846e-05,
	"loss": 0.223,
	"mean_token_accuracy": 0.8623712241649628,
	"num_tokens": 4122572.0,
	"step": 260
	},
	{
	"epoch": 0.4084720121028744,
	"grad_norm": 2.734375,
	"learning_rate": 2.4257766634867203e-05,
	"loss": 0.2281,
	"mean_token_accuracy": 0.8473478049039841,
	"num_tokens": 4280652.0,
	"step": 270
	},
	{
	"epoch": 0.4236006051437216,
	"grad_norm": 1.90625,
	"learning_rate": 2.3439480617977275e-05,
	"loss": 0.2195,
	"mean_token_accuracy": 0.8656352519989013,
	"num_tokens": 4440066.0,
	"step": 280
	},
	{
	"epoch": 0.43872919818456885,
	"grad_norm": 2.0625,
	"learning_rate": 2.2606238844194544e-05,
	"loss": 0.2267,
	"mean_token_accuracy": 0.8563310325145721,
	"num_tokens": 4598248.0,
	"step": 290
	},
	{
	"epoch": 0.45385779122541603,
	"grad_norm": 2.390625,
	"learning_rate": 2.1760139436604713e-05,
	"loss": 0.2268,
	"mean_token_accuracy": 0.8453394055366517,
	"num_tokens": 4755809.0,
	"step": 300
	},
	{
	"epoch": 0.4689863842662632,
	"grad_norm": 2.0625,
	"learning_rate": 2.0903312894128633e-05,
	"loss": 0.2285,
	"mean_token_accuracy": 0.8545234054327011,
	"num_tokens": 4913328.0,
	"step": 310
	},
	{
	"epoch": 0.48411497730711045,
	"grad_norm": 1.109375,
	"learning_rate": 2.0037916726874145e-05,
	"loss": 0.2271,
	"mean_token_accuracy": 0.8579858303070068,
	"num_tokens": 5072616.0,
	"step": 320
	},
	{
	"epoch": 0.49924357034795763,
	"grad_norm": 2.28125,
	"learning_rate": 1.9166130023473036e-05,
	"loss": 0.2222,
	"mean_token_accuracy": 0.8509624302387238,
	"num_tokens": 5231113.0,
	"step": 330
	},
	{
	"epoch": 0.5143721633888049,
	"grad_norm": 1.3125,
	"learning_rate": 1.829014796408282e-05,
	"loss": 0.2247,
	"mean_token_accuracy": 0.8627366036176681,
	"num_tokens": 5389029.0,
	"step": 340
	},
	{
	"epoch": 0.529500756429652,
	"grad_norm": 0.92578125,
	"learning_rate": 1.7412176292869573e-05,
	"loss": 0.2193,
	"mean_token_accuracy": 0.8546810537576676,
	"num_tokens": 5547970.0,
	"step": 350
	},
	{
	"epoch": 0.5446293494704992,
	"grad_norm": 0.67578125,
	"learning_rate": 1.653442576389043e-05,
	"loss": 0.221,
	"mean_token_accuracy": 0.8571889936923981,
	"num_tokens": 5707525.0,
	"step": 360
	},
	{
	"epoch": 0.5597579425113465,
	"grad_norm": 0.90234375,
	"learning_rate": 1.5659106574360977e-05,
	"loss": 0.2273,
	"mean_token_accuracy": 0.8585471630096435,
	"num_tokens": 5865689.0,
	"step": 370
	},
	{
	"epoch": 0.5748865355521936,
	"grad_norm": 1.2109375,
	"learning_rate": 1.4788422799324862e-05,
	"loss": 0.2317,
	"mean_token_accuracy": 0.8584190517663955,
	"num_tokens": 6021932.0,
	"step": 380
	},
	{
	"epoch": 0.5900151285930408,
	"grad_norm": 0.9453125,
	"learning_rate": 1.3924566841739079e-05,
	"loss": 0.2238,
	"mean_token_accuracy": 0.8559250921010971,
	"num_tokens": 6179562.0,
	"step": 390
	},
	{
	"epoch": 0.6051437216338881,
	"grad_norm": 0.828125,
	"learning_rate": 1.3069713911949962e-05,
	"loss": 0.2169,
	"mean_token_accuracy": 0.8574993282556533,
	"num_tokens": 6337908.0,
	"step": 400
	},
	{
	"epoch": 0.6051437216338881,
	"eval_loss": 0.24050775170326233,
	"eval_num_tokens": 6337908.0,
	"eval_runtime": 10.2898,
	"eval_samples_per_second": 20.797,
	"eval_steps_per_second": 20.797,
	"step": 400
	},
	{
	"epoch": 0.6202723146747352,
	"grad_norm": 1.3515625,
	"learning_rate": 1.222601655046052e-05,
	"loss": 0.2295,
	"mean_token_accuracy": 0.8591887027025222,
	"num_tokens": 6495268.0,
	"step": 410
	},
	{
	"epoch": 0.6354009077155824,
	"grad_norm": 1.0625,
	"learning_rate": 1.1395599207781006e-05,
	"loss": 0.2286,
	"mean_token_accuracy": 0.8543924212455749,
	"num_tokens": 6651839.0,
	"step": 420
	},
	{
	"epoch": 0.6505295007564297,
	"grad_norm": 0.98046875,
	"learning_rate": 1.0580552895010796e-05,
	"loss": 0.224,
	"mean_token_accuracy": 0.8684775650501251,
	"num_tokens": 6809804.0,
	"step": 430
	},
	{
	"epoch": 0.6656580937972768,
	"grad_norm": 1.3359375,
	"learning_rate": 9.782929918621475e-06,
	"loss": 0.2245,
	"mean_token_accuracy": 0.8595554202795028,
	"num_tokens": 6967079.0,
	"step": 440
	},
	{
	"epoch": 0.680786686838124,
	"grad_norm": 0.59765625,
	"learning_rate": 9.004738712699157e-06,
	"loss": 0.2204,
	"mean_token_accuracy": 0.863404393196106,
	"num_tokens": 7126399.0,
	"step": 450
	},
	{
	"epoch": 0.6959152798789713,
	"grad_norm": 1.234375,
	"learning_rate": 8.247938781658551e-06,
	"loss": 0.2206,
	"mean_token_accuracy": 0.8627041339874267,
	"num_tokens": 7285948.0,
	"step": 460
	},
	{
	"epoch": 0.7110438729198184,
	"grad_norm": 1.5546875,
	"learning_rate": 7.514435766163046e-06,
	"loss": 0.2279,
	"mean_token_accuracy": 0.8660434067249299,
	"num_tokens": 7443250.0,
	"step": 470
	},
	{
	"epoch": 0.7261724659606656,
	"grad_norm": 1.6015625,
	"learning_rate": 6.806076644675154e-06,
	"loss": 0.2233,
	"mean_token_accuracy": 0.8606104016304016,
	"num_tokens": 7601533.0,
	"step": 480
	},
	{
	"epoch": 0.7413010590015129,
	"grad_norm": 3.28125,
	"learning_rate": 6.124645082719727e-06,
	"loss": 0.2214,
	"mean_token_accuracy": 0.8641792595386505,
	"num_tokens": 7759173.0,
	"step": 490
	},
	{
	"epoch": 0.75642965204236,
	"grad_norm": 1.734375,
	"learning_rate": 5.471856941570691e-06,
	"loss": 0.2266,
	"mean_token_accuracy": 0.8583661437034606,
	"num_tokens": 7915271.0,
	"step": 500
	},
	{
	"epoch": 0.7715582450832073,
	"grad_norm": 2.171875,
	"learning_rate": 4.84935595767059e-06,
	"loss": 0.2239,
	"mean_token_accuracy": 0.863108116388321,
	"num_tokens": 8072725.0,
	"step": 510
	},
	{
	"epoch": 0.7866868381240545,
	"grad_norm": 2.65625,
	"learning_rate": 4.2587096036621585e-06,
	"loss": 0.219,
	"mean_token_accuracy": 0.8645495653152466,
	"num_tokens": 8232048.0,
	"step": 520
	},
	{
	"epoch": 0.8018154311649016,
	"grad_norm": 2.65625,
	"learning_rate": 3.70140514145403e-06,
	"loss": 0.2203,
	"mean_token_accuracy": 0.8692421615123749,
	"num_tokens": 8389234.0,
	"step": 530
	},
	{
	"epoch": 0.8169440242057489,
	"grad_norm": 0.89453125,
	"learning_rate": 3.1788458772590123e-06,
	"loss": 0.2153,
	"mean_token_accuracy": 0.857841071486473,
	"num_tokens": 8547295.0,
	"step": 540
	},
	{
	"epoch": 0.8320726172465961,
	"grad_norm": 3.0,
	"learning_rate": 2.6923476280348592e-06,
	"loss": 0.2211,
	"mean_token_accuracy": 0.8649828612804413,
	"num_tokens": 8706082.0,
	"step": 550
	},
	{
	"epoch": 0.8472012102874432,
	"grad_norm": 1.125,
	"learning_rate": 2.2431354082251086e-06,
	"loss": 0.2206,
	"mean_token_accuracy": 0.8666522175073623,
	"num_tokens": 8864131.0,
	"step": 560
	},
	{
	"epoch": 0.8623298033282905,
	"grad_norm": 1.3671875,
	"learning_rate": 1.8323403451428861e-06,
	"loss": 0.2223,
	"mean_token_accuracy": 0.8635704159736634,
	"num_tokens": 9022578.0,
	"step": 570
	},
	{
	"epoch": 0.8774583963691377,
	"grad_norm": 1.5625,
	"learning_rate": 1.4609968307647638e-06,
	"loss": 0.2143,
	"mean_token_accuracy": 0.8704730212688446,
	"num_tokens": 9181933.0,
	"step": 580
	},
	{
	"epoch": 0.8925869894099848,
	"grad_norm": 1.328125,
	"learning_rate": 1.1300399171065517e-06,
	"loss": 0.2153,
	"mean_token_accuracy": 0.8723822474479676,
	"num_tokens": 9341042.0,
	"step": 590
	},
	{
	"epoch": 0.9077155824508321,
	"grad_norm": 0.70703125,
	"learning_rate": 8.403029617395654e-07,
	"loss": 0.2257,
	"mean_token_accuracy": 0.8509276181459426,
	"num_tokens": 9497699.0,
	"step": 600
	},
	{
	"epoch": 0.9077155824508321,
	"eval_loss": 0.23669058084487915,
	"eval_num_tokens": 9497699.0,
	"eval_runtime": 10.2029,
	"eval_samples_per_second": 20.974,
	"eval_steps_per_second": 20.974,
	"step": 600
	},
	{
	"epoch": 0.9228441754916793,
	"grad_norm": 2.640625,
	"learning_rate": 5.925155293759559e-07,
	"loss": 0.2201,
	"mean_token_accuracy": 0.864446359872818,
	"num_tokens": 9655514.0,
	"step": 610
	},
	{
	"epoch": 0.9379727685325264,
	"grad_norm": 1.015625,
	"learning_rate": 3.8730155480696634e-07,
	"loss": 0.2278,
	"mean_token_accuracy": 0.848170417547226,
	"num_tokens": 9812955.0,
	"step": 620
	},
	{
	"epoch": 0.9531013615733737,
	"grad_norm": 0.8984375,
	"learning_rate": 2.2517777181995822e-07,
	"loss": 0.214,
	"mean_token_accuracy": 0.8704831153154373,
	"num_tokens": 9972847.0,
	"step": 630
	},
	{
	"epoch": 0.9682299546142209,
	"grad_norm": 1.15625,
	"learning_rate": 1.0655241205012516e-07,
	"loss": 0.2211,
	"mean_token_accuracy": 0.8742094576358795,
	"num_tokens": 10130896.0,
	"step": 640
	},
	{
	"epoch": 0.983358547655068,
	"grad_norm": 1.078125,
	"learning_rate": 3.172417704330077e-08,
	"loss": 0.2212,
	"mean_token_accuracy": 0.8658175647258759,
	"num_tokens": 10290834.0,
	"step": 650
	},
	{
	"epoch": 0.9984871406959153,
	"grad_norm": 0.56640625,
	"learning_rate": 8.814861181871691e-10,
	"loss": 0.2272,
	"mean_token_accuracy": 0.8598562389612198,
	"num_tokens": 10447704.0,
	"step": 660
	}
	],
	"logging_steps": 10,
	"max_steps": 661,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 1,
	"save_steps": 200,
	"stateful_callbacks": {
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": true
	},
	"attributes": {}
	}
	},
	"total_flos": 1.7413486193799168e+17,
	"train_batch_size": 16,
	"trial_name": null,
	"trial_params": null
	}