hcmus_handbook / trainer_state.json
truro7's picture
Upload 14 files
36fa5a2 verified
{
"best_global_step": 2370,
"best_metric": 0.9906666666666667,
"best_model_checkpoint": "/kaggle/working/checkpoint-2340",
"epoch": 9.531645569620252,
"eval_steps": 30,
"global_step": 2640,
"is_hyper_param_search": false,
"is_local_process_zero": true,
"is_world_process_zero": true,
"log_history": [
{
"epoch": 0.10849909584086799,
"grad_norm": 315.2345275878906,
"learning_rate": 2.091346153846154e-06,
"loss": 9.8551,
"step": 30
},
{
"epoch": 0.10849909584086799,
"eval_dim_128_cosine_accuracy@1": 0.464,
"eval_dim_128_cosine_accuracy@10": 0.8853333333333333,
"eval_dim_128_cosine_accuracy@3": 0.6933333333333334,
"eval_dim_128_cosine_accuracy@5": 0.7973333333333333,
"eval_dim_128_cosine_map@100": 0.5496550065264402,
"eval_dim_128_cosine_mrr@10": 0.5995142857142851,
"eval_dim_128_cosine_ndcg@10": 0.6258921644136968,
"eval_dim_128_cosine_precision@1": 0.464,
"eval_dim_128_cosine_precision@10": 0.11679999999999999,
"eval_dim_128_cosine_precision@3": 0.27466666666666667,
"eval_dim_128_cosine_precision@5": 0.19573333333333334,
"eval_dim_128_cosine_recall@1": 0.3509555555555555,
"eval_dim_128_cosine_recall@10": 0.8282222222222222,
"eval_dim_128_cosine_recall@3": 0.5997555555555556,
"eval_dim_128_cosine_recall@5": 0.7099333333333334,
"eval_runtime": 6.0549,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 30
},
{
"epoch": 0.21699819168173598,
"grad_norm": 186.59336853027344,
"learning_rate": 4.254807692307692e-06,
"loss": 9.0754,
"step": 60
},
{
"epoch": 0.21699819168173598,
"eval_dim_128_cosine_accuracy@1": 0.4866666666666667,
"eval_dim_128_cosine_accuracy@10": 0.9,
"eval_dim_128_cosine_accuracy@3": 0.72,
"eval_dim_128_cosine_accuracy@5": 0.8106666666666666,
"eval_dim_128_cosine_map@100": 0.5743604860247659,
"eval_dim_128_cosine_mrr@10": 0.6221666666666664,
"eval_dim_128_cosine_ndcg@10": 0.648443755577266,
"eval_dim_128_cosine_precision@1": 0.4866666666666667,
"eval_dim_128_cosine_precision@10": 0.11946666666666668,
"eval_dim_128_cosine_precision@3": 0.28577777777777774,
"eval_dim_128_cosine_precision@5": 0.20266666666666666,
"eval_dim_128_cosine_recall@1": 0.37006666666666665,
"eval_dim_128_cosine_recall@10": 0.8457777777777776,
"eval_dim_128_cosine_recall@3": 0.6275333333333333,
"eval_dim_128_cosine_recall@5": 0.7314888888888889,
"eval_runtime": 5.832,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 60
},
{
"epoch": 0.325497287522604,
"grad_norm": 134.42782592773438,
"learning_rate": 6.418269230769231e-06,
"loss": 6.8585,
"step": 90
},
{
"epoch": 0.325497287522604,
"eval_dim_128_cosine_accuracy@1": 0.492,
"eval_dim_128_cosine_accuracy@10": 0.9306666666666666,
"eval_dim_128_cosine_accuracy@3": 0.7493333333333333,
"eval_dim_128_cosine_accuracy@5": 0.8426666666666667,
"eval_dim_128_cosine_map@100": 0.5932772577532479,
"eval_dim_128_cosine_mrr@10": 0.638767724867724,
"eval_dim_128_cosine_ndcg@10": 0.6728559811105229,
"eval_dim_128_cosine_precision@1": 0.492,
"eval_dim_128_cosine_precision@10": 0.1250666666666667,
"eval_dim_128_cosine_precision@3": 0.3008888888888888,
"eval_dim_128_cosine_precision@5": 0.21226666666666666,
"eval_dim_128_cosine_recall@1": 0.3731777777777778,
"eval_dim_128_cosine_recall@10": 0.8826222222222221,
"eval_dim_128_cosine_recall@3": 0.6590888888888888,
"eval_dim_128_cosine_recall@5": 0.7681555555555556,
"eval_runtime": 5.9035,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 90
},
{
"epoch": 0.43399638336347196,
"grad_norm": 155.28692626953125,
"learning_rate": 8.581730769230769e-06,
"loss": 6.1144,
"step": 120
},
{
"epoch": 0.43399638336347196,
"eval_dim_128_cosine_accuracy@1": 0.5146666666666667,
"eval_dim_128_cosine_accuracy@10": 0.9413333333333334,
"eval_dim_128_cosine_accuracy@3": 0.776,
"eval_dim_128_cosine_accuracy@5": 0.8653333333333333,
"eval_dim_128_cosine_map@100": 0.621402267467731,
"eval_dim_128_cosine_mrr@10": 0.6640814814814808,
"eval_dim_128_cosine_ndcg@10": 0.697136893890822,
"eval_dim_128_cosine_precision@1": 0.5146666666666667,
"eval_dim_128_cosine_precision@10": 0.1272,
"eval_dim_128_cosine_precision@3": 0.31555555555555553,
"eval_dim_128_cosine_precision@5": 0.22266666666666668,
"eval_dim_128_cosine_recall@1": 0.3920666666666666,
"eval_dim_128_cosine_recall@10": 0.8955555555555555,
"eval_dim_128_cosine_recall@3": 0.6910444444444444,
"eval_dim_128_cosine_recall@5": 0.7971333333333334,
"eval_runtime": 5.8653,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 120
},
{
"epoch": 0.5424954792043399,
"grad_norm": 118.29597473144531,
"learning_rate": 1.0745192307692307e-05,
"loss": 5.6528,
"step": 150
},
{
"epoch": 0.5424954792043399,
"eval_dim_128_cosine_accuracy@1": 0.5493333333333333,
"eval_dim_128_cosine_accuracy@10": 0.9613333333333334,
"eval_dim_128_cosine_accuracy@3": 0.8053333333333333,
"eval_dim_128_cosine_accuracy@5": 0.8866666666666667,
"eval_dim_128_cosine_map@100": 0.6539806932391371,
"eval_dim_128_cosine_mrr@10": 0.694885714285714,
"eval_dim_128_cosine_ndcg@10": 0.7277068157948943,
"eval_dim_128_cosine_precision@1": 0.5493333333333333,
"eval_dim_128_cosine_precision@10": 0.13053333333333333,
"eval_dim_128_cosine_precision@3": 0.3302222222222222,
"eval_dim_128_cosine_precision@5": 0.22906666666666667,
"eval_dim_128_cosine_recall@1": 0.4256222222222222,
"eval_dim_128_cosine_recall@10": 0.9175555555555555,
"eval_dim_128_cosine_recall@3": 0.7210444444444446,
"eval_dim_128_cosine_recall@5": 0.8195777777777778,
"eval_runtime": 5.9122,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 150
},
{
"epoch": 0.650994575045208,
"grad_norm": 179.03628540039062,
"learning_rate": 1.2908653846153848e-05,
"loss": 4.1877,
"step": 180
},
{
"epoch": 0.650994575045208,
"eval_dim_128_cosine_accuracy@1": 0.58,
"eval_dim_128_cosine_accuracy@10": 0.96,
"eval_dim_128_cosine_accuracy@3": 0.8213333333333334,
"eval_dim_128_cosine_accuracy@5": 0.9026666666666666,
"eval_dim_128_cosine_map@100": 0.6707829477428588,
"eval_dim_128_cosine_mrr@10": 0.7146952380952377,
"eval_dim_128_cosine_ndcg@10": 0.7420757638776961,
"eval_dim_128_cosine_precision@1": 0.58,
"eval_dim_128_cosine_precision@10": 0.13133333333333333,
"eval_dim_128_cosine_precision@3": 0.3328888888888889,
"eval_dim_128_cosine_precision@5": 0.23226666666666665,
"eval_dim_128_cosine_recall@1": 0.4487333333333334,
"eval_dim_128_cosine_recall@10": 0.9215555555555555,
"eval_dim_128_cosine_recall@3": 0.7292666666666667,
"eval_dim_128_cosine_recall@5": 0.8331555555555555,
"eval_runtime": 5.8677,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 180
},
{
"epoch": 0.759493670886076,
"grad_norm": 151.75982666015625,
"learning_rate": 1.5072115384615385e-05,
"loss": 4.7228,
"step": 210
},
{
"epoch": 0.759493670886076,
"eval_dim_128_cosine_accuracy@1": 0.5946666666666667,
"eval_dim_128_cosine_accuracy@10": 0.968,
"eval_dim_128_cosine_accuracy@3": 0.844,
"eval_dim_128_cosine_accuracy@5": 0.9013333333333333,
"eval_dim_128_cosine_map@100": 0.6856459707356679,
"eval_dim_128_cosine_mrr@10": 0.7304285714285711,
"eval_dim_128_cosine_ndcg@10": 0.7575913556214288,
"eval_dim_128_cosine_precision@1": 0.5946666666666667,
"eval_dim_128_cosine_precision@10": 0.13426666666666667,
"eval_dim_128_cosine_precision@3": 0.3471111111111111,
"eval_dim_128_cosine_precision@5": 0.23546666666666666,
"eval_dim_128_cosine_recall@1": 0.45962222222222227,
"eval_dim_128_cosine_recall@10": 0.9353333333333333,
"eval_dim_128_cosine_recall@3": 0.7523777777777777,
"eval_dim_128_cosine_recall@5": 0.8356444444444443,
"eval_runtime": 5.8902,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 210
},
{
"epoch": 0.8679927667269439,
"grad_norm": 214.2377471923828,
"learning_rate": 1.723557692307692e-05,
"loss": 4.0221,
"step": 240
},
{
"epoch": 0.8679927667269439,
"eval_dim_128_cosine_accuracy@1": 0.612,
"eval_dim_128_cosine_accuracy@10": 0.9733333333333334,
"eval_dim_128_cosine_accuracy@3": 0.8626666666666667,
"eval_dim_128_cosine_accuracy@5": 0.916,
"eval_dim_128_cosine_map@100": 0.6999904279300393,
"eval_dim_128_cosine_mrr@10": 0.7443804232804232,
"eval_dim_128_cosine_ndcg@10": 0.7697324770393862,
"eval_dim_128_cosine_precision@1": 0.612,
"eval_dim_128_cosine_precision@10": 0.13493333333333332,
"eval_dim_128_cosine_precision@3": 0.35422222222222216,
"eval_dim_128_cosine_precision@5": 0.24266666666666667,
"eval_dim_128_cosine_recall@1": 0.47339999999999993,
"eval_dim_128_cosine_recall@10": 0.9408888888888889,
"eval_dim_128_cosine_recall@3": 0.7690444444444444,
"eval_dim_128_cosine_recall@5": 0.8578666666666667,
"eval_runtime": 5.8498,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 240
},
{
"epoch": 0.976491862567812,
"grad_norm": 156.14193725585938,
"learning_rate": 1.9399038461538464e-05,
"loss": 3.9123,
"step": 270
},
{
"epoch": 0.976491862567812,
"eval_dim_128_cosine_accuracy@1": 0.6306666666666667,
"eval_dim_128_cosine_accuracy@10": 0.964,
"eval_dim_128_cosine_accuracy@3": 0.8613333333333333,
"eval_dim_128_cosine_accuracy@5": 0.9213333333333333,
"eval_dim_128_cosine_map@100": 0.7102987033261746,
"eval_dim_128_cosine_mrr@10": 0.7547354497354491,
"eval_dim_128_cosine_ndcg@10": 0.7771945743046785,
"eval_dim_128_cosine_precision@1": 0.6306666666666667,
"eval_dim_128_cosine_precision@10": 0.13493333333333335,
"eval_dim_128_cosine_precision@3": 0.3591111111111111,
"eval_dim_128_cosine_precision@5": 0.24559999999999998,
"eval_dim_128_cosine_recall@1": 0.4836222222222222,
"eval_dim_128_cosine_recall@10": 0.939111111111111,
"eval_dim_128_cosine_recall@3": 0.7781111111111112,
"eval_dim_128_cosine_recall@5": 0.8682222222222221,
"eval_runtime": 5.9086,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 270
},
{
"epoch": 1.0831826401446654,
"grad_norm": 153.49703979492188,
"learning_rate": 2.15625e-05,
"loss": 3.5228,
"step": 300
},
{
"epoch": 1.0831826401446654,
"eval_dim_128_cosine_accuracy@1": 0.656,
"eval_dim_128_cosine_accuracy@10": 0.9786666666666667,
"eval_dim_128_cosine_accuracy@3": 0.884,
"eval_dim_128_cosine_accuracy@5": 0.9333333333333333,
"eval_dim_128_cosine_map@100": 0.7362484353910447,
"eval_dim_128_cosine_mrr@10": 0.7771227513227512,
"eval_dim_128_cosine_ndcg@10": 0.799929818130629,
"eval_dim_128_cosine_precision@1": 0.656,
"eval_dim_128_cosine_precision@10": 0.13706666666666667,
"eval_dim_128_cosine_precision@3": 0.376,
"eval_dim_128_cosine_precision@5": 0.25173333333333336,
"eval_dim_128_cosine_recall@1": 0.5051777777777777,
"eval_dim_128_cosine_recall@10": 0.9523999999999999,
"eval_dim_128_cosine_recall@3": 0.8113999999999999,
"eval_dim_128_cosine_recall@5": 0.8881777777777776,
"eval_runtime": 5.8629,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 300
},
{
"epoch": 1.1916817359855334,
"grad_norm": 167.0846710205078,
"learning_rate": 2.3725961538461538e-05,
"loss": 2.4771,
"step": 330
},
{
"epoch": 1.1916817359855334,
"eval_dim_128_cosine_accuracy@1": 0.6666666666666666,
"eval_dim_128_cosine_accuracy@10": 0.9773333333333334,
"eval_dim_128_cosine_accuracy@3": 0.892,
"eval_dim_128_cosine_accuracy@5": 0.944,
"eval_dim_128_cosine_map@100": 0.7456641904330115,
"eval_dim_128_cosine_mrr@10": 0.7862047619047616,
"eval_dim_128_cosine_ndcg@10": 0.8096525901298283,
"eval_dim_128_cosine_precision@1": 0.6666666666666666,
"eval_dim_128_cosine_precision@10": 0.13906666666666667,
"eval_dim_128_cosine_precision@3": 0.37866666666666665,
"eval_dim_128_cosine_precision@5": 0.2541333333333334,
"eval_dim_128_cosine_recall@1": 0.5160666666666666,
"eval_dim_128_cosine_recall@10": 0.9604444444444443,
"eval_dim_128_cosine_recall@3": 0.8168666666666666,
"eval_dim_128_cosine_recall@5": 0.8936888888888889,
"eval_runtime": 5.8895,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 330
},
{
"epoch": 1.3001808318264014,
"grad_norm": 74.62581634521484,
"learning_rate": 2.588942307692308e-05,
"loss": 3.1504,
"step": 360
},
{
"epoch": 1.3001808318264014,
"eval_dim_128_cosine_accuracy@1": 0.6666666666666666,
"eval_dim_128_cosine_accuracy@10": 0.9826666666666667,
"eval_dim_128_cosine_accuracy@3": 0.8893333333333333,
"eval_dim_128_cosine_accuracy@5": 0.944,
"eval_dim_128_cosine_map@100": 0.7472361751978799,
"eval_dim_128_cosine_mrr@10": 0.7875534391534394,
"eval_dim_128_cosine_ndcg@10": 0.8104762567757343,
"eval_dim_128_cosine_precision@1": 0.6666666666666666,
"eval_dim_128_cosine_precision@10": 0.13853333333333334,
"eval_dim_128_cosine_precision@3": 0.376,
"eval_dim_128_cosine_precision@5": 0.25653333333333334,
"eval_dim_128_cosine_recall@1": 0.5127333333333333,
"eval_dim_128_cosine_recall@10": 0.9604444444444443,
"eval_dim_128_cosine_recall@3": 0.8135333333333334,
"eval_dim_128_cosine_recall@5": 0.8999555555555556,
"eval_runtime": 5.8631,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 360
},
{
"epoch": 1.4086799276672695,
"grad_norm": 149.5690460205078,
"learning_rate": 2.8052884615384615e-05,
"loss": 2.9297,
"step": 390
},
{
"epoch": 1.4086799276672695,
"eval_dim_128_cosine_accuracy@1": 0.6746666666666666,
"eval_dim_128_cosine_accuracy@10": 0.9813333333333333,
"eval_dim_128_cosine_accuracy@3": 0.896,
"eval_dim_128_cosine_accuracy@5": 0.9506666666666667,
"eval_dim_128_cosine_map@100": 0.7516192130669271,
"eval_dim_128_cosine_mrr@10": 0.7923793650793653,
"eval_dim_128_cosine_ndcg@10": 0.8126537462626181,
"eval_dim_128_cosine_precision@1": 0.6746666666666666,
"eval_dim_128_cosine_precision@10": 0.13720000000000002,
"eval_dim_128_cosine_precision@3": 0.3817777777777778,
"eval_dim_128_cosine_precision@5": 0.25573333333333337,
"eval_dim_128_cosine_recall@1": 0.5205111111111111,
"eval_dim_128_cosine_recall@10": 0.9572888888888887,
"eval_dim_128_cosine_recall@3": 0.8241999999999999,
"eval_dim_128_cosine_recall@5": 0.9023111111111112,
"eval_runtime": 5.9239,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 390
},
{
"epoch": 1.5171790235081373,
"grad_norm": 77.68611145019531,
"learning_rate": 2.999987977631899e-05,
"loss": 2.7076,
"step": 420
},
{
"epoch": 1.5171790235081373,
"eval_dim_128_cosine_accuracy@1": 0.6773333333333333,
"eval_dim_128_cosine_accuracy@10": 0.9866666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9093333333333333,
"eval_dim_128_cosine_accuracy@5": 0.9586666666666667,
"eval_dim_128_cosine_map@100": 0.7607381303631893,
"eval_dim_128_cosine_mrr@10": 0.7977820105820109,
"eval_dim_128_cosine_ndcg@10": 0.8228788330287194,
"eval_dim_128_cosine_precision@1": 0.6773333333333333,
"eval_dim_128_cosine_precision@10": 0.14013333333333333,
"eval_dim_128_cosine_precision@3": 0.3933333333333333,
"eval_dim_128_cosine_precision@5": 0.2605333333333333,
"eval_dim_128_cosine_recall@1": 0.5189555555555555,
"eval_dim_128_cosine_recall@10": 0.9710666666666666,
"eval_dim_128_cosine_recall@3": 0.8426,
"eval_dim_128_cosine_recall@5": 0.9168888888888889,
"eval_runtime": 5.8411,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 420
},
{
"epoch": 1.6256781193490055,
"grad_norm": 149.3487091064453,
"learning_rate": 2.9985455266321168e-05,
"loss": 2.7434,
"step": 450
},
{
"epoch": 1.6256781193490055,
"eval_dim_128_cosine_accuracy@1": 0.7253333333333334,
"eval_dim_128_cosine_accuracy@10": 0.98,
"eval_dim_128_cosine_accuracy@3": 0.9213333333333333,
"eval_dim_128_cosine_accuracy@5": 0.9533333333333334,
"eval_dim_128_cosine_map@100": 0.7918996036201115,
"eval_dim_128_cosine_mrr@10": 0.827068783068783,
"eval_dim_128_cosine_ndcg@10": 0.8451670078690116,
"eval_dim_128_cosine_precision@1": 0.7253333333333334,
"eval_dim_128_cosine_precision@10": 0.14039999999999997,
"eval_dim_128_cosine_precision@3": 0.3991111111111111,
"eval_dim_128_cosine_precision@5": 0.2616,
"eval_dim_128_cosine_recall@1": 0.5640666666666666,
"eval_dim_128_cosine_recall@10": 0.9688888888888888,
"eval_dim_128_cosine_recall@3": 0.8515333333333333,
"eval_dim_128_cosine_recall@5": 0.9150222222222222,
"eval_runtime": 5.9172,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 450
},
{
"epoch": 1.7341772151898733,
"grad_norm": 129.0013885498047,
"learning_rate": 2.9947012511648994e-05,
"loss": 2.561,
"step": 480
},
{
"epoch": 1.7341772151898733,
"eval_dim_128_cosine_accuracy@1": 0.7,
"eval_dim_128_cosine_accuracy@10": 0.9853333333333333,
"eval_dim_128_cosine_accuracy@3": 0.9226666666666666,
"eval_dim_128_cosine_accuracy@5": 0.9666666666666667,
"eval_dim_128_cosine_map@100": 0.7798379056680812,
"eval_dim_128_cosine_mrr@10": 0.8131269841269839,
"eval_dim_128_cosine_ndcg@10": 0.8357143575068176,
"eval_dim_128_cosine_precision@1": 0.7,
"eval_dim_128_cosine_precision@10": 0.1396,
"eval_dim_128_cosine_precision@3": 0.39777777777777784,
"eval_dim_128_cosine_precision@5": 0.26266666666666666,
"eval_dim_128_cosine_recall@1": 0.5453999999999999,
"eval_dim_128_cosine_recall@10": 0.9688888888888888,
"eval_dim_128_cosine_recall@3": 0.8552222222222223,
"eval_dim_128_cosine_recall@5": 0.9237777777777777,
"eval_runtime": 5.8367,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 480
},
{
"epoch": 1.8426763110307414,
"grad_norm": 98.29137420654297,
"learning_rate": 2.9884613127213148e-05,
"loss": 2.4285,
"step": 510
},
{
"epoch": 1.8426763110307414,
"eval_dim_128_cosine_accuracy@1": 0.7173333333333334,
"eval_dim_128_cosine_accuracy@10": 0.9893333333333333,
"eval_dim_128_cosine_accuracy@3": 0.9253333333333333,
"eval_dim_128_cosine_accuracy@5": 0.9626666666666667,
"eval_dim_128_cosine_map@100": 0.7901487513600632,
"eval_dim_128_cosine_mrr@10": 0.8236164021164017,
"eval_dim_128_cosine_ndcg@10": 0.8446030620508496,
"eval_dim_128_cosine_precision@1": 0.7173333333333334,
"eval_dim_128_cosine_precision@10": 0.14053333333333334,
"eval_dim_128_cosine_precision@3": 0.40444444444444444,
"eval_dim_128_cosine_precision@5": 0.26266666666666666,
"eval_dim_128_cosine_recall@1": 0.5585111111111111,
"eval_dim_128_cosine_recall@10": 0.9728888888888888,
"eval_dim_128_cosine_recall@3": 0.8621999999999999,
"eval_dim_128_cosine_recall@5": 0.9233333333333333,
"eval_runtime": 5.9196,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 510
},
{
"epoch": 1.9511754068716094,
"grad_norm": 102.39818572998047,
"learning_rate": 2.9798357124902243e-05,
"loss": 2.2157,
"step": 540
},
{
"epoch": 1.9511754068716094,
"eval_dim_128_cosine_accuracy@1": 0.716,
"eval_dim_128_cosine_accuracy@10": 0.9866666666666667,
"eval_dim_128_cosine_accuracy@3": 0.928,
"eval_dim_128_cosine_accuracy@5": 0.964,
"eval_dim_128_cosine_map@100": 0.7895278151389357,
"eval_dim_128_cosine_mrr@10": 0.822948677248677,
"eval_dim_128_cosine_ndcg@10": 0.8451188705806435,
"eval_dim_128_cosine_precision@1": 0.716,
"eval_dim_128_cosine_precision@10": 0.14173333333333332,
"eval_dim_128_cosine_precision@3": 0.40844444444444444,
"eval_dim_128_cosine_precision@5": 0.2669333333333333,
"eval_dim_128_cosine_recall@1": 0.5518444444444445,
"eval_dim_128_cosine_recall@10": 0.9757777777777776,
"eval_dim_128_cosine_recall@3": 0.8693111111111111,
"eval_dim_128_cosine_recall@5": 0.9298666666666665,
"eval_runtime": 5.8565,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 540
},
{
"epoch": 2.057866184448463,
"grad_norm": 114.18648529052734,
"learning_rate": 2.968838275328673e-05,
"loss": 1.8836,
"step": 570
},
{
"epoch": 2.057866184448463,
"eval_dim_128_cosine_accuracy@1": 0.7266666666666667,
"eval_dim_128_cosine_accuracy@10": 0.9933333333333333,
"eval_dim_128_cosine_accuracy@3": 0.924,
"eval_dim_128_cosine_accuracy@5": 0.968,
"eval_dim_128_cosine_map@100": 0.8022806987141972,
"eval_dim_128_cosine_mrr@10": 0.8310841269841268,
"eval_dim_128_cosine_ndcg@10": 0.8545511025815758,
"eval_dim_128_cosine_precision@1": 0.7266666666666667,
"eval_dim_128_cosine_precision@10": 0.142,
"eval_dim_128_cosine_precision@3": 0.40977777777777774,
"eval_dim_128_cosine_precision@5": 0.2688,
"eval_dim_128_cosine_recall@1": 0.5671777777777778,
"eval_dim_128_cosine_recall@10": 0.9802222222222222,
"eval_dim_128_cosine_recall@3": 0.8701111111111111,
"eval_dim_128_cosine_recall@5": 0.9343111111111111,
"eval_runtime": 5.9035,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 570
},
{
"epoch": 2.1663652802893307,
"grad_norm": 157.45529174804688,
"learning_rate": 2.9554866276038176e-05,
"loss": 1.5806,
"step": 600
},
{
"epoch": 2.1663652802893307,
"eval_dim_128_cosine_accuracy@1": 0.728,
"eval_dim_128_cosine_accuracy@10": 0.984,
"eval_dim_128_cosine_accuracy@3": 0.928,
"eval_dim_128_cosine_accuracy@5": 0.9653333333333334,
"eval_dim_128_cosine_map@100": 0.8019827061342573,
"eval_dim_128_cosine_mrr@10": 0.8315973544973544,
"eval_dim_128_cosine_ndcg@10": 0.8517054457768715,
"eval_dim_128_cosine_precision@1": 0.728,
"eval_dim_128_cosine_precision@10": 0.14040000000000002,
"eval_dim_128_cosine_precision@3": 0.40977777777777774,
"eval_dim_128_cosine_precision@5": 0.2674666666666667,
"eval_dim_128_cosine_recall@1": 0.5694,
"eval_dim_128_cosine_recall@10": 0.9686666666666667,
"eval_dim_128_cosine_recall@3": 0.873,
"eval_dim_128_cosine_recall@5": 0.9314666666666666,
"eval_runtime": 5.8543,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 600
},
{
"epoch": 2.274864376130199,
"grad_norm": 105.01947021484375,
"learning_rate": 2.939802168941907e-05,
"loss": 1.445,
"step": 630
},
{
"epoch": 2.274864376130199,
"eval_dim_128_cosine_accuracy@1": 0.7466666666666667,
"eval_dim_128_cosine_accuracy@10": 0.9893333333333333,
"eval_dim_128_cosine_accuracy@3": 0.924,
"eval_dim_128_cosine_accuracy@5": 0.9706666666666667,
"eval_dim_128_cosine_map@100": 0.8131376123034114,
"eval_dim_128_cosine_mrr@10": 0.8407142857142856,
"eval_dim_128_cosine_ndcg@10": 0.8616407300458768,
"eval_dim_128_cosine_precision@1": 0.7466666666666667,
"eval_dim_128_cosine_precision@10": 0.14186666666666667,
"eval_dim_128_cosine_precision@3": 0.4111111111111111,
"eval_dim_128_cosine_precision@5": 0.2698666666666667,
"eval_dim_128_cosine_recall@1": 0.5811777777777778,
"eval_dim_128_cosine_recall@10": 0.9777777777777776,
"eval_dim_128_cosine_recall@3": 0.8699777777777778,
"eval_dim_128_cosine_recall@5": 0.9408888888888889,
"eval_runtime": 5.921,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 630
},
{
"epoch": 2.383363471971067,
"grad_norm": 68.85010528564453,
"learning_rate": 2.9218100379295923e-05,
"loss": 1.5858,
"step": 660
},
{
"epoch": 2.383363471971067,
"eval_dim_128_cosine_accuracy@1": 0.7733333333333333,
"eval_dim_128_cosine_accuracy@10": 0.9946666666666667,
"eval_dim_128_cosine_accuracy@3": 0.94,
"eval_dim_128_cosine_accuracy@5": 0.972,
"eval_dim_128_cosine_map@100": 0.8283586079505401,
"eval_dim_128_cosine_mrr@10": 0.8597894179894175,
"eval_dim_128_cosine_ndcg@10": 0.8753614537588903,
"eval_dim_128_cosine_precision@1": 0.7733333333333333,
"eval_dim_128_cosine_precision@10": 0.1424,
"eval_dim_128_cosine_precision@3": 0.41333333333333333,
"eval_dim_128_cosine_precision@5": 0.2730666666666666,
"eval_dim_128_cosine_recall@1": 0.6040666666666666,
"eval_dim_128_cosine_recall@10": 0.982888888888889,
"eval_dim_128_cosine_recall@3": 0.8804222222222221,
"eval_dim_128_cosine_recall@5": 0.9466666666666667,
"eval_runtime": 5.8572,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 660
},
{
"epoch": 2.491862567811935,
"grad_norm": 61.46901321411133,
"learning_rate": 2.9015390718225446e-05,
"loss": 1.7178,
"step": 690
},
{
"epoch": 2.491862567811935,
"eval_dim_128_cosine_accuracy@1": 0.7653333333333333,
"eval_dim_128_cosine_accuracy@10": 0.988,
"eval_dim_128_cosine_accuracy@3": 0.9426666666666667,
"eval_dim_128_cosine_accuracy@5": 0.964,
"eval_dim_128_cosine_map@100": 0.8242631913306179,
"eval_dim_128_cosine_mrr@10": 0.8544089947089946,
"eval_dim_128_cosine_ndcg@10": 0.8708043529651647,
"eval_dim_128_cosine_precision@1": 0.7653333333333333,
"eval_dim_128_cosine_precision@10": 0.14186666666666667,
"eval_dim_128_cosine_precision@3": 0.4151111111111111,
"eval_dim_128_cosine_precision@5": 0.2736,
"eval_dim_128_cosine_recall@1": 0.5971777777777778,
"eval_dim_128_cosine_recall@10": 0.9775555555555555,
"eval_dim_128_cosine_recall@3": 0.8844222222222223,
"eval_dim_128_cosine_recall@5": 0.9435555555555555,
"eval_runtime": 5.9148,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 690
},
{
"epoch": 2.600361663652803,
"grad_norm": 113.0821762084961,
"learning_rate": 2.8790217603259553e-05,
"loss": 2.048,
"step": 720
},
{
"epoch": 2.600361663652803,
"eval_dim_128_cosine_accuracy@1": 0.756,
"eval_dim_128_cosine_accuracy@10": 0.9906666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9373333333333334,
"eval_dim_128_cosine_accuracy@5": 0.9706666666666667,
"eval_dim_128_cosine_map@100": 0.8205536584233583,
"eval_dim_128_cosine_mrr@10": 0.8498878306878302,
"eval_dim_128_cosine_ndcg@10": 0.8682644499293225,
"eval_dim_128_cosine_precision@1": 0.756,
"eval_dim_128_cosine_precision@10": 0.142,
"eval_dim_128_cosine_precision@3": 0.416,
"eval_dim_128_cosine_precision@5": 0.2712,
"eval_dim_128_cosine_recall@1": 0.5851777777777778,
"eval_dim_128_cosine_recall@10": 0.9802222222222222,
"eval_dim_128_cosine_recall@3": 0.8835333333333333,
"eval_dim_128_cosine_recall@5": 0.9428888888888889,
"eval_runtime": 5.857,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 720
},
{
"epoch": 2.708860759493671,
"grad_norm": 98.30645751953125,
"learning_rate": 2.854294193520993e-05,
"loss": 1.9854,
"step": 750
},
{
"epoch": 2.708860759493671,
"eval_dim_128_cosine_accuracy@1": 0.7506666666666667,
"eval_dim_128_cosine_accuracy@10": 0.9906666666666667,
"eval_dim_128_cosine_accuracy@3": 0.94,
"eval_dim_128_cosine_accuracy@5": 0.9733333333333334,
"eval_dim_128_cosine_map@100": 0.8200211459278023,
"eval_dim_128_cosine_mrr@10": 0.847684126984127,
"eval_dim_128_cosine_ndcg@10": 0.8690218305880909,
"eval_dim_128_cosine_precision@1": 0.7506666666666667,
"eval_dim_128_cosine_precision@10": 0.14293333333333333,
"eval_dim_128_cosine_precision@3": 0.41422222222222216,
"eval_dim_128_cosine_precision@5": 0.2728,
"eval_dim_128_cosine_recall@1": 0.5834,
"eval_dim_128_cosine_recall@10": 0.9842222222222222,
"eval_dim_128_cosine_recall@3": 0.8848666666666667,
"eval_dim_128_cosine_recall@5": 0.949911111111111,
"eval_runtime": 5.9276,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 750
},
{
"epoch": 2.817359855334539,
"grad_norm": 99.96898651123047,
"learning_rate": 2.8273960040206944e-05,
"loss": 1.7509,
"step": 780
},
{
"epoch": 2.817359855334539,
"eval_dim_128_cosine_accuracy@1": 0.768,
"eval_dim_128_cosine_accuracy@10": 0.9933333333333333,
"eval_dim_128_cosine_accuracy@3": 0.928,
"eval_dim_128_cosine_accuracy@5": 0.9666666666666667,
"eval_dim_128_cosine_map@100": 0.8265327684080097,
"eval_dim_128_cosine_mrr@10": 0.8537306878306878,
"eval_dim_128_cosine_ndcg@10": 0.874434076175117,
"eval_dim_128_cosine_precision@1": 0.768,
"eval_dim_128_cosine_precision@10": 0.1436,
"eval_dim_128_cosine_precision@3": 0.4164444444444445,
"eval_dim_128_cosine_precision@5": 0.2717333333333333,
"eval_dim_128_cosine_recall@1": 0.5962888888888889,
"eval_dim_128_cosine_recall@10": 0.988,
"eval_dim_128_cosine_recall@3": 0.8801999999999999,
"eval_dim_128_cosine_recall@5": 0.9417777777777778,
"eval_runtime": 5.8618,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 780
},
{
"epoch": 2.9258589511754067,
"grad_norm": 51.06462860107422,
"learning_rate": 2.7983703034479776e-05,
"loss": 1.7643,
"step": 810
},
{
"epoch": 2.9258589511754067,
"eval_dim_128_cosine_accuracy@1": 0.768,
"eval_dim_128_cosine_accuracy@10": 0.9933333333333333,
"eval_dim_128_cosine_accuracy@3": 0.944,
"eval_dim_128_cosine_accuracy@5": 0.9786666666666667,
"eval_dim_128_cosine_map@100": 0.8314260359016753,
"eval_dim_128_cosine_mrr@10": 0.8591624338624337,
"eval_dim_128_cosine_ndcg@10": 0.878068113915343,
"eval_dim_128_cosine_precision@1": 0.768,
"eval_dim_128_cosine_precision@10": 0.14306666666666668,
"eval_dim_128_cosine_precision@3": 0.42177777777777775,
"eval_dim_128_cosine_precision@5": 0.27386666666666665,
"eval_dim_128_cosine_recall@1": 0.5998444444444444,
"eval_dim_128_cosine_recall@10": 0.9864444444444445,
"eval_dim_128_cosine_recall@3": 0.8922000000000001,
"eval_dim_128_cosine_recall@5": 0.9524888888888889,
"eval_runtime": 5.8979,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 810
},
{
"epoch": 3.0325497287522603,
"grad_norm": 18.758848190307617,
"learning_rate": 2.7672636133376114e-05,
"loss": 1.3132,
"step": 840
},
{
"epoch": 3.0325497287522603,
"eval_dim_128_cosine_accuracy@1": 0.7866666666666666,
"eval_dim_128_cosine_accuracy@10": 0.996,
"eval_dim_128_cosine_accuracy@3": 0.9466666666666667,
"eval_dim_128_cosine_accuracy@5": 0.98,
"eval_dim_128_cosine_map@100": 0.8412958111680221,
"eval_dim_128_cosine_mrr@10": 0.8707105820105822,
"eval_dim_128_cosine_ndcg@10": 0.8870114277280254,
"eval_dim_128_cosine_precision@1": 0.7866666666666666,
"eval_dim_128_cosine_precision@10": 0.14373333333333335,
"eval_dim_128_cosine_precision@3": 0.4191111111111111,
"eval_dim_128_cosine_precision@5": 0.27413333333333334,
"eval_dim_128_cosine_recall@1": 0.6145111111111111,
"eval_dim_128_cosine_recall@10": 0.9906666666666667,
"eval_dim_128_cosine_recall@3": 0.8904222222222223,
"eval_dim_128_cosine_recall@5": 0.9553777777777778,
"eval_runtime": 5.8715,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 840
},
{
"epoch": 3.1410488245931285,
"grad_norm": 80.79166412353516,
"learning_rate": 2.7341257905728747e-05,
"loss": 1.4164,
"step": 870
},
{
"epoch": 3.1410488245931285,
"eval_dim_128_cosine_accuracy@1": 0.788,
"eval_dim_128_cosine_accuracy@10": 0.9933333333333333,
"eval_dim_128_cosine_accuracy@3": 0.952,
"eval_dim_128_cosine_accuracy@5": 0.9773333333333334,
"eval_dim_128_cosine_map@100": 0.8411563326962374,
"eval_dim_128_cosine_mrr@10": 0.870403174603175,
"eval_dim_128_cosine_ndcg@10": 0.8855805978335399,
"eval_dim_128_cosine_precision@1": 0.788,
"eval_dim_128_cosine_precision@10": 0.14333333333333334,
"eval_dim_128_cosine_precision@3": 0.4271111111111111,
"eval_dim_128_cosine_precision@5": 0.27466666666666667,
"eval_dim_128_cosine_recall@1": 0.6171777777777777,
"eval_dim_128_cosine_recall@10": 0.9866666666666667,
"eval_dim_128_cosine_recall@3": 0.9044222222222221,
"eval_dim_128_cosine_recall@5": 0.9522222222222222,
"eval_runtime": 5.9114,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 870
},
{
"epoch": 3.2495479204339963,
"grad_norm": 50.864532470703125,
"learning_rate": 2.699009947476415e-05,
"loss": 1.3193,
"step": 900
},
{
"epoch": 3.2495479204339963,
"eval_dim_128_cosine_accuracy@1": 0.7866666666666666,
"eval_dim_128_cosine_accuracy@10": 0.992,
"eval_dim_128_cosine_accuracy@3": 0.944,
"eval_dim_128_cosine_accuracy@5": 0.9773333333333334,
"eval_dim_128_cosine_map@100": 0.8446231563231562,
"eval_dim_128_cosine_mrr@10": 0.8705698412698413,
"eval_dim_128_cosine_ndcg@10": 0.8869909648496189,
"eval_dim_128_cosine_precision@1": 0.7866666666666666,
"eval_dim_128_cosine_precision@10": 0.14293333333333333,
"eval_dim_128_cosine_precision@3": 0.42222222222222217,
"eval_dim_128_cosine_precision@5": 0.27386666666666665,
"eval_dim_128_cosine_recall@1": 0.6171777777777777,
"eval_dim_128_cosine_recall@10": 0.9848888888888888,
"eval_dim_128_cosine_recall@3": 0.8959777777777778,
"eval_dim_128_cosine_recall@5": 0.9530222222222222,
"eval_runtime": 5.8599,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 900
},
{
"epoch": 3.358047016274864,
"grad_norm": 145.7331085205078,
"learning_rate": 2.661972366683391e-05,
"loss": 1.176,
"step": 930
},
{
"epoch": 3.358047016274864,
"eval_dim_128_cosine_accuracy@1": 0.8053333333333333,
"eval_dim_128_cosine_accuracy@10": 1.0,
"eval_dim_128_cosine_accuracy@3": 0.9546666666666667,
"eval_dim_128_cosine_accuracy@5": 0.9826666666666667,
"eval_dim_128_cosine_map@100": 0.8539686133219344,
"eval_dim_128_cosine_mrr@10": 0.884364021164021,
"eval_dim_128_cosine_ndcg@10": 0.8973335428451416,
"eval_dim_128_cosine_precision@1": 0.8053333333333333,
"eval_dim_128_cosine_precision@10": 0.14346666666666666,
"eval_dim_128_cosine_precision@3": 0.4248888888888888,
"eval_dim_128_cosine_precision@5": 0.27440000000000003,
"eval_dim_128_cosine_recall@1": 0.6334,
"eval_dim_128_cosine_recall@10": 0.9922666666666667,
"eval_dim_128_cosine_recall@3": 0.9046000000000001,
"eval_dim_128_cosine_recall@5": 0.9575555555555555,
"eval_runtime": 5.9155,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 930
},
{
"epoch": 3.4665461121157324,
"grad_norm": 88.42583465576172,
"learning_rate": 2.6230724109333277e-05,
"loss": 1.1743,
"step": 960
},
{
"epoch": 3.4665461121157324,
"eval_dim_128_cosine_accuracy@1": 0.7866666666666666,
"eval_dim_128_cosine_accuracy@10": 1.0,
"eval_dim_128_cosine_accuracy@3": 0.964,
"eval_dim_128_cosine_accuracy@5": 0.984,
"eval_dim_128_cosine_map@100": 0.8529430216321521,
"eval_dim_128_cosine_mrr@10": 0.8761714285714284,
"eval_dim_128_cosine_ndcg@10": 0.8947015547083503,
"eval_dim_128_cosine_precision@1": 0.7866666666666666,
"eval_dim_128_cosine_precision@10": 0.14373333333333335,
"eval_dim_128_cosine_precision@3": 0.43377777777777776,
"eval_dim_128_cosine_precision@5": 0.27813333333333334,
"eval_dim_128_cosine_recall@1": 0.6160666666666667,
"eval_dim_128_cosine_recall@10": 0.9922222222222221,
"eval_dim_128_cosine_recall@3": 0.9190888888888888,
"eval_dim_128_cosine_recall@5": 0.9650666666666667,
"eval_runtime": 5.8593,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 960
},
{
"epoch": 3.5750452079566006,
"grad_norm": 64.10489654541016,
"learning_rate": 2.582372427925272e-05,
"loss": 1.0814,
"step": 990
},
{
"epoch": 3.5750452079566006,
"eval_dim_128_cosine_accuracy@1": 0.7946666666666666,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9586666666666667,
"eval_dim_128_cosine_accuracy@5": 0.976,
"eval_dim_128_cosine_map@100": 0.8514501038108632,
"eval_dim_128_cosine_mrr@10": 0.8771179894179892,
"eval_dim_128_cosine_ndcg@10": 0.8950774953185786,
"eval_dim_128_cosine_precision@1": 0.7946666666666666,
"eval_dim_128_cosine_precision@10": 0.14453333333333335,
"eval_dim_128_cosine_precision@3": 0.4297777777777778,
"eval_dim_128_cosine_precision@5": 0.2749333333333333,
"eval_dim_128_cosine_recall@1": 0.6240666666666667,
"eval_dim_128_cosine_recall@10": 0.9955555555555555,
"eval_dim_128_cosine_recall@3": 0.9095333333333333,
"eval_dim_128_cosine_recall@5": 0.9528888888888888,
"eval_runtime": 5.9107,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 990
},
{
"epoch": 3.6835443037974684,
"grad_norm": 101.1521224975586,
"learning_rate": 2.539937650388744e-05,
"loss": 1.0118,
"step": 1020
},
{
"epoch": 3.6835443037974684,
"eval_dim_128_cosine_accuracy@1": 0.816,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.956,
"eval_dim_128_cosine_accuracy@5": 0.98,
"eval_dim_128_cosine_map@100": 0.8649572895059165,
"eval_dim_128_cosine_mrr@10": 0.8898989417989419,
"eval_dim_128_cosine_ndcg@10": 0.9050620003654972,
"eval_dim_128_cosine_precision@1": 0.816,
"eval_dim_128_cosine_precision@10": 0.14453333333333335,
"eval_dim_128_cosine_precision@3": 0.4302222222222222,
"eval_dim_128_cosine_precision@5": 0.2768,
"eval_dim_128_cosine_recall@1": 0.6442888888888889,
"eval_dim_128_cosine_recall@10": 0.9953333333333333,
"eval_dim_128_cosine_recall@3": 0.9124222222222221,
"eval_dim_128_cosine_recall@5": 0.9590666666666666,
"eval_runtime": 5.8571,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1020
},
{
"epoch": 3.7920433996383363,
"grad_norm": 116.06410217285156,
"learning_rate": 2.495836091530647e-05,
"loss": 1.5867,
"step": 1050
},
{
"epoch": 3.7920433996383363,
"eval_dim_128_cosine_accuracy@1": 0.8253333333333334,
"eval_dim_128_cosine_accuracy@10": 0.996,
"eval_dim_128_cosine_accuracy@3": 0.96,
"eval_dim_128_cosine_accuracy@5": 0.9853333333333333,
"eval_dim_128_cosine_map@100": 0.8711365192509459,
"eval_dim_128_cosine_mrr@10": 0.896352380952381,
"eval_dim_128_cosine_ndcg@10": 0.9089495143919033,
"eval_dim_128_cosine_precision@1": 0.8253333333333334,
"eval_dim_128_cosine_precision@10": 0.14426666666666668,
"eval_dim_128_cosine_precision@3": 0.4342222222222222,
"eval_dim_128_cosine_precision@5": 0.27973333333333333,
"eval_dim_128_cosine_recall@1": 0.6511777777777777,
"eval_dim_128_cosine_recall@10": 0.9926666666666667,
"eval_dim_128_cosine_recall@3": 0.9175333333333333,
"eval_dim_128_cosine_recall@5": 0.967288888888889,
"eval_runtime": 5.9014,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1050
},
{
"epoch": 3.900542495479204,
"grad_norm": 143.17178344726562,
"learning_rate": 2.4501384360257114e-05,
"loss": 1.4378,
"step": 1080
},
{
"epoch": 3.900542495479204,
"eval_dim_128_cosine_accuracy@1": 0.8186666666666667,
"eval_dim_128_cosine_accuracy@10": 0.9973333333333333,
"eval_dim_128_cosine_accuracy@3": 0.9613333333333334,
"eval_dim_128_cosine_accuracy@5": 0.9826666666666667,
"eval_dim_128_cosine_map@100": 0.8726542441361317,
"eval_dim_128_cosine_mrr@10": 0.8923920634920633,
"eval_dim_128_cosine_ndcg@10": 0.9091914677425283,
"eval_dim_128_cosine_precision@1": 0.8186666666666667,
"eval_dim_128_cosine_precision@10": 0.14413333333333334,
"eval_dim_128_cosine_precision@3": 0.4368888888888888,
"eval_dim_128_cosine_precision@5": 0.27759999999999996,
"eval_dim_128_cosine_recall@1": 0.6500666666666666,
"eval_dim_128_cosine_recall@10": 0.9930666666666667,
"eval_dim_128_cosine_recall@3": 0.9250888888888888,
"eval_dim_128_cosine_recall@5": 0.964488888888889,
"eval_runtime": 5.8787,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1080
},
{
"epoch": 4.007233273056058,
"grad_norm": 74.21490478515625,
"learning_rate": 2.4029179267251854e-05,
"loss": 1.0735,
"step": 1110
},
{
"epoch": 4.007233273056058,
"eval_dim_128_cosine_accuracy@1": 0.82,
"eval_dim_128_cosine_accuracy@10": 0.996,
"eval_dim_128_cosine_accuracy@3": 0.964,
"eval_dim_128_cosine_accuracy@5": 0.984,
"eval_dim_128_cosine_map@100": 0.8692189085634471,
"eval_dim_128_cosine_mrr@10": 0.8922269841269843,
"eval_dim_128_cosine_ndcg@10": 0.9065950434274719,
"eval_dim_128_cosine_precision@1": 0.82,
"eval_dim_128_cosine_precision@10": 0.14386666666666667,
"eval_dim_128_cosine_precision@3": 0.43377777777777776,
"eval_dim_128_cosine_precision@5": 0.2789333333333333,
"eval_dim_128_cosine_recall@1": 0.6465111111111111,
"eval_dim_128_cosine_recall@10": 0.9915555555555555,
"eval_dim_128_cosine_recall@3": 0.9202,
"eval_dim_128_cosine_recall@5": 0.9662222222222222,
"eval_runtime": 5.9229,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1110
},
{
"epoch": 4.115732368896926,
"grad_norm": 49.57156753540039,
"learning_rate": 2.35425024726536e-05,
"loss": 0.8998,
"step": 1140
},
{
"epoch": 4.115732368896926,
"eval_dim_128_cosine_accuracy@1": 0.8173333333333334,
"eval_dim_128_cosine_accuracy@10": 0.996,
"eval_dim_128_cosine_accuracy@3": 0.9733333333333334,
"eval_dim_128_cosine_accuracy@5": 0.9813333333333333,
"eval_dim_128_cosine_map@100": 0.8711656472503531,
"eval_dim_128_cosine_mrr@10": 0.8947767195767194,
"eval_dim_128_cosine_ndcg@10": 0.9089196083999468,
"eval_dim_128_cosine_precision@1": 0.8173333333333334,
"eval_dim_128_cosine_precision@10": 0.14440000000000003,
"eval_dim_128_cosine_precision@3": 0.4382222222222222,
"eval_dim_128_cosine_precision@5": 0.27813333333333334,
"eval_dim_128_cosine_recall@1": 0.6416222222222222,
"eval_dim_128_cosine_recall@10": 0.9933333333333333,
"eval_dim_128_cosine_recall@3": 0.9297555555555557,
"eval_dim_128_cosine_recall@5": 0.9626222222222223,
"eval_runtime": 5.8566,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1140
},
{
"epoch": 4.224231464737794,
"grad_norm": 13.371626853942871,
"learning_rate": 2.3042134007640726e-05,
"loss": 0.9332,
"step": 1170
},
{
"epoch": 4.224231464737794,
"eval_dim_128_cosine_accuracy@1": 0.82,
"eval_dim_128_cosine_accuracy@10": 0.9973333333333333,
"eval_dim_128_cosine_accuracy@3": 0.972,
"eval_dim_128_cosine_accuracy@5": 0.9893333333333333,
"eval_dim_128_cosine_map@100": 0.874401100163824,
"eval_dim_128_cosine_mrr@10": 0.8957015873015872,
"eval_dim_128_cosine_ndcg@10": 0.909966755276973,
"eval_dim_128_cosine_precision@1": 0.82,
"eval_dim_128_cosine_precision@10": 0.1436,
"eval_dim_128_cosine_precision@3": 0.44177777777777777,
"eval_dim_128_cosine_precision@5": 0.2789333333333333,
"eval_dim_128_cosine_recall@1": 0.6458444444444444,
"eval_dim_128_cosine_recall@10": 0.9910222222222222,
"eval_dim_128_cosine_recall@3": 0.9333111111111111,
"eval_dim_128_cosine_recall@5": 0.9689333333333334,
"eval_runtime": 5.9323,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1170
},
{
"epoch": 4.3327305605786615,
"grad_norm": 71.3949203491211,
"learning_rate": 2.2528875847996185e-05,
"loss": 1.2196,
"step": 1200
},
{
"epoch": 4.3327305605786615,
"eval_dim_128_cosine_accuracy@1": 0.832,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9666666666666667,
"eval_dim_128_cosine_accuracy@5": 0.9866666666666667,
"eval_dim_128_cosine_map@100": 0.8747604252469021,
"eval_dim_128_cosine_mrr@10": 0.9006603174603176,
"eval_dim_128_cosine_ndcg@10": 0.9123266488922879,
"eval_dim_128_cosine_precision@1": 0.832,
"eval_dim_128_cosine_precision@10": 0.14453333333333335,
"eval_dim_128_cosine_precision@3": 0.4368888888888888,
"eval_dim_128_cosine_precision@5": 0.27973333333333333,
"eval_dim_128_cosine_recall@1": 0.6529555555555555,
"eval_dim_128_cosine_recall@10": 0.9953333333333333,
"eval_dim_128_cosine_recall@3": 0.9234888888888889,
"eval_dim_128_cosine_recall@5": 0.9683999999999999,
"eval_runtime": 5.8551,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1200
},
{
"epoch": 4.44122965641953,
"grad_norm": 16.15557861328125,
"learning_rate": 2.2003550628724412e-05,
"loss": 1.08,
"step": 1230
},
{
"epoch": 4.44122965641953,
"eval_dim_128_cosine_accuracy@1": 0.828,
"eval_dim_128_cosine_accuracy@10": 0.9973333333333333,
"eval_dim_128_cosine_accuracy@3": 0.9666666666666667,
"eval_dim_128_cosine_accuracy@5": 0.984,
"eval_dim_128_cosine_map@100": 0.8721032465646191,
"eval_dim_128_cosine_mrr@10": 0.8996158730158732,
"eval_dim_128_cosine_ndcg@10": 0.9104449932070232,
"eval_dim_128_cosine_precision@1": 0.828,
"eval_dim_128_cosine_precision@10": 0.14426666666666668,
"eval_dim_128_cosine_precision@3": 0.432,
"eval_dim_128_cosine_precision@5": 0.27813333333333334,
"eval_dim_128_cosine_recall@1": 0.6500666666666666,
"eval_dim_128_cosine_recall@10": 0.9933333333333333,
"eval_dim_128_cosine_recall@3": 0.9179333333333333,
"eval_dim_128_cosine_recall@5": 0.9643555555555555,
"eval_runtime": 5.9293,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1230
},
{
"epoch": 4.549728752260398,
"grad_norm": 69.02749633789062,
"learning_rate": 2.146700032555626e-05,
"loss": 1.0907,
"step": 1260
},
{
"epoch": 4.549728752260398,
"eval_dim_128_cosine_accuracy@1": 0.816,
"eval_dim_128_cosine_accuracy@10": 0.996,
"eval_dim_128_cosine_accuracy@3": 0.9733333333333334,
"eval_dim_128_cosine_accuracy@5": 0.9906666666666667,
"eval_dim_128_cosine_map@100": 0.8666906865356865,
"eval_dim_128_cosine_mrr@10": 0.8953608465608466,
"eval_dim_128_cosine_ndcg@10": 0.905665835237036,
"eval_dim_128_cosine_precision@1": 0.816,
"eval_dim_128_cosine_precision@10": 0.14359999999999998,
"eval_dim_128_cosine_precision@3": 0.43333333333333335,
"eval_dim_128_cosine_precision@5": 0.27786666666666665,
"eval_dim_128_cosine_recall@1": 0.6416222222222223,
"eval_dim_128_cosine_recall@10": 0.9897333333333332,
"eval_dim_128_cosine_recall@3": 0.9204222222222221,
"eval_dim_128_cosine_recall@5": 0.9659111111111112,
"eval_runtime": 5.8724,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1260
},
{
"epoch": 4.658227848101266,
"grad_norm": 97.21315002441406,
"learning_rate": 2.0920084905455194e-05,
"loss": 0.8068,
"step": 1290
},
{
"epoch": 4.658227848101266,
"eval_dim_128_cosine_accuracy@1": 0.8266666666666667,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9706666666666667,
"eval_dim_128_cosine_accuracy@5": 0.9866666666666667,
"eval_dim_128_cosine_map@100": 0.8721192061533238,
"eval_dim_128_cosine_mrr@10": 0.899405291005291,
"eval_dim_128_cosine_ndcg@10": 0.9098783995730497,
"eval_dim_128_cosine_precision@1": 0.8266666666666667,
"eval_dim_128_cosine_precision@10": 0.14373333333333335,
"eval_dim_128_cosine_precision@3": 0.4311111111111111,
"eval_dim_128_cosine_precision@5": 0.27786666666666665,
"eval_dim_128_cosine_recall@1": 0.6538444444444445,
"eval_dim_128_cosine_recall@10": 0.9917333333333332,
"eval_dim_128_cosine_recall@3": 0.9179333333333334,
"eval_dim_128_cosine_recall@5": 0.9646666666666667,
"eval_runtime": 5.938,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1290
},
{
"epoch": 4.766726943942134,
"grad_norm": 45.7645378112793,
"learning_rate": 2.036368094828768e-05,
"loss": 1.1293,
"step": 1320
},
{
"epoch": 4.766726943942134,
"eval_dim_128_cosine_accuracy@1": 0.8293333333333334,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.968,
"eval_dim_128_cosine_accuracy@5": 0.988,
"eval_dim_128_cosine_map@100": 0.8743681096681096,
"eval_dim_128_cosine_mrr@10": 0.9005476190476192,
"eval_dim_128_cosine_ndcg@10": 0.9115179029699592,
"eval_dim_128_cosine_precision@1": 0.8293333333333334,
"eval_dim_128_cosine_precision@10": 0.144,
"eval_dim_128_cosine_precision@3": 0.4302222222222222,
"eval_dim_128_cosine_precision@5": 0.27973333333333333,
"eval_dim_128_cosine_recall@1": 0.6571777777777777,
"eval_dim_128_cosine_recall@10": 0.9926666666666667,
"eval_dim_128_cosine_recall@3": 0.9148666666666668,
"eval_dim_128_cosine_recall@5": 0.9677333333333332,
"eval_runtime": 5.8634,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1320
},
{
"epoch": 4.875226039783001,
"grad_norm": 50.95180892944336,
"learning_rate": 1.979868024186686e-05,
"loss": 0.8142,
"step": 1350
},
{
"epoch": 4.875226039783001,
"eval_dim_128_cosine_accuracy@1": 0.8493333333333334,
"eval_dim_128_cosine_accuracy@10": 1.0,
"eval_dim_128_cosine_accuracy@3": 0.9746666666666667,
"eval_dim_128_cosine_accuracy@5": 0.992,
"eval_dim_128_cosine_map@100": 0.8879302955000233,
"eval_dim_128_cosine_mrr@10": 0.9139608465608466,
"eval_dim_128_cosine_ndcg@10": 0.9228500530144886,
"eval_dim_128_cosine_precision@1": 0.8493333333333334,
"eval_dim_128_cosine_precision@10": 0.14466666666666667,
"eval_dim_128_cosine_precision@3": 0.4364444444444444,
"eval_dim_128_cosine_precision@5": 0.2805333333333333,
"eval_dim_128_cosine_recall@1": 0.6725111111111111,
"eval_dim_128_cosine_recall@10": 0.9966666666666667,
"eval_dim_128_cosine_recall@3": 0.9257555555555554,
"eval_dim_128_cosine_recall@5": 0.9724888888888888,
"eval_runtime": 5.9066,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1350
},
{
"epoch": 4.98372513562387,
"grad_norm": 25.77345848083496,
"learning_rate": 1.9225988352621445e-05,
"loss": 1.0416,
"step": 1380
},
{
"epoch": 4.98372513562387,
"eval_dim_128_cosine_accuracy@1": 0.8546666666666667,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.972,
"eval_dim_128_cosine_accuracy@5": 0.9946666666666667,
"eval_dim_128_cosine_map@100": 0.895152090306458,
"eval_dim_128_cosine_mrr@10": 0.9158370370370371,
"eval_dim_128_cosine_ndcg@10": 0.9264969679337102,
"eval_dim_128_cosine_precision@1": 0.8546666666666667,
"eval_dim_128_cosine_precision@10": 0.14440000000000003,
"eval_dim_128_cosine_precision@3": 0.44,
"eval_dim_128_cosine_precision@5": 0.2832,
"eval_dim_128_cosine_recall@1": 0.6791777777777778,
"eval_dim_128_cosine_recall@10": 0.9950666666666667,
"eval_dim_128_cosine_recall@3": 0.9306444444444445,
"eval_dim_128_cosine_recall@5": 0.9809333333333334,
"eval_runtime": 5.8646,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1380
},
{
"epoch": 5.090415913200723,
"grad_norm": 42.34284591674805,
"learning_rate": 1.8646523174180587e-05,
"loss": 0.742,
"step": 1410
},
{
"epoch": 5.090415913200723,
"eval_dim_128_cosine_accuracy@1": 0.848,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9826666666666667,
"eval_dim_128_cosine_accuracy@5": 0.996,
"eval_dim_128_cosine_map@100": 0.8966787537811141,
"eval_dim_128_cosine_mrr@10": 0.9152666666666666,
"eval_dim_128_cosine_ndcg@10": 0.9270482377862029,
"eval_dim_128_cosine_precision@1": 0.848,
"eval_dim_128_cosine_precision@10": 0.14440000000000003,
"eval_dim_128_cosine_precision@3": 0.4511111111111111,
"eval_dim_128_cosine_precision@5": 0.28373333333333334,
"eval_dim_128_cosine_recall@1": 0.6714,
"eval_dim_128_cosine_recall@10": 0.9946666666666667,
"eval_dim_128_cosine_recall@3": 0.9499777777777778,
"eval_dim_128_cosine_recall@5": 0.9817333333333332,
"eval_runtime": 5.9187,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1410
},
{
"epoch": 5.198915009041591,
"grad_norm": 7.41603422164917,
"learning_rate": 1.806121345620111e-05,
"loss": 0.6726,
"step": 1440
},
{
"epoch": 5.198915009041591,
"eval_dim_128_cosine_accuracy@1": 0.848,
"eval_dim_128_cosine_accuracy@10": 0.9973333333333333,
"eval_dim_128_cosine_accuracy@3": 0.9826666666666667,
"eval_dim_128_cosine_accuracy@5": 0.9893333333333333,
"eval_dim_128_cosine_map@100": 0.8955358711549889,
"eval_dim_128_cosine_mrr@10": 0.9143195767195764,
"eval_dim_128_cosine_ndcg@10": 0.9244987067095748,
"eval_dim_128_cosine_precision@1": 0.848,
"eval_dim_128_cosine_precision@10": 0.14333333333333334,
"eval_dim_128_cosine_precision@3": 0.4511111111111112,
"eval_dim_128_cosine_precision@5": 0.2824,
"eval_dim_128_cosine_recall@1": 0.6707333333333334,
"eval_dim_128_cosine_recall@10": 0.9898666666666668,
"eval_dim_128_cosine_recall@3": 0.9497555555555555,
"eval_dim_128_cosine_recall@5": 0.9769333333333334,
"eval_runtime": 5.863,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1440
},
{
"epoch": 5.30741410488246,
"grad_norm": 23.097681045532227,
"learning_rate": 1.747099731579504e-05,
"loss": 0.7095,
"step": 1470
},
{
"epoch": 5.30741410488246,
"eval_dim_128_cosine_accuracy@1": 0.8533333333333334,
"eval_dim_128_cosine_accuracy@10": 1.0,
"eval_dim_128_cosine_accuracy@3": 0.9813333333333333,
"eval_dim_128_cosine_accuracy@5": 0.996,
"eval_dim_128_cosine_map@100": 0.89842804702073,
"eval_dim_128_cosine_mrr@10": 0.9160888888888891,
"eval_dim_128_cosine_ndcg@10": 0.9282736285073582,
"eval_dim_128_cosine_precision@1": 0.8533333333333334,
"eval_dim_128_cosine_precision@10": 0.14426666666666668,
"eval_dim_128_cosine_precision@3": 0.44844444444444437,
"eval_dim_128_cosine_precision@5": 0.2826666666666667,
"eval_dim_128_cosine_recall@1": 0.6785111111111112,
"eval_dim_128_cosine_recall@10": 0.9954666666666667,
"eval_dim_128_cosine_recall@3": 0.9468666666666666,
"eval_dim_128_cosine_recall@5": 0.9798666666666668,
"eval_runtime": 5.9043,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1470
},
{
"epoch": 5.4159132007233275,
"grad_norm": 41.660274505615234,
"learning_rate": 1.6876820733943202e-05,
"loss": 0.8308,
"step": 1500
},
{
"epoch": 5.4159132007233275,
"eval_dim_128_cosine_accuracy@1": 0.8506666666666667,
"eval_dim_128_cosine_accuracy@10": 1.0,
"eval_dim_128_cosine_accuracy@3": 0.9733333333333334,
"eval_dim_128_cosine_accuracy@5": 0.9933333333333333,
"eval_dim_128_cosine_map@100": 0.8962897397716547,
"eval_dim_128_cosine_mrr@10": 0.9141259259259258,
"eval_dim_128_cosine_ndcg@10": 0.926065218057395,
"eval_dim_128_cosine_precision@1": 0.8506666666666667,
"eval_dim_128_cosine_precision@10": 0.144,
"eval_dim_128_cosine_precision@3": 0.4471111111111112,
"eval_dim_128_cosine_precision@5": 0.2810666666666667,
"eval_dim_128_cosine_recall@1": 0.6736222222222222,
"eval_dim_128_cosine_recall@10": 0.9945333333333335,
"eval_dim_128_cosine_recall@3": 0.9406444444444445,
"eval_dim_128_cosine_recall@5": 0.9751555555555556,
"eval_runtime": 5.857,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1500
},
{
"epoch": 5.524412296564195,
"grad_norm": 98.27491760253906,
"learning_rate": 1.6279636039304888e-05,
"loss": 0.8933,
"step": 1530
},
{
"epoch": 5.524412296564195,
"eval_dim_128_cosine_accuracy@1": 0.852,
"eval_dim_128_cosine_accuracy@10": 1.0,
"eval_dim_128_cosine_accuracy@3": 0.9826666666666667,
"eval_dim_128_cosine_accuracy@5": 0.9946666666666667,
"eval_dim_128_cosine_map@100": 0.8978606545306544,
"eval_dim_128_cosine_mrr@10": 0.9169740740740739,
"eval_dim_128_cosine_ndcg@10": 0.9280348624229215,
"eval_dim_128_cosine_precision@1": 0.852,
"eval_dim_128_cosine_precision@10": 0.14426666666666668,
"eval_dim_128_cosine_precision@3": 0.4511111111111111,
"eval_dim_128_cosine_precision@5": 0.2826666666666667,
"eval_dim_128_cosine_recall@1": 0.6716222222222222,
"eval_dim_128_cosine_recall@10": 0.9958666666666668,
"eval_dim_128_cosine_recall@3": 0.9497555555555556,
"eval_dim_128_cosine_recall@5": 0.9793777777777778,
"eval_runtime": 5.9058,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1530
},
{
"epoch": 5.632911392405063,
"grad_norm": 38.60082244873047,
"learning_rate": 1.568040038185364e-05,
"loss": 0.9554,
"step": 1560
},
{
"epoch": 5.632911392405063,
"eval_dim_128_cosine_accuracy@1": 0.8493333333333334,
"eval_dim_128_cosine_accuracy@10": 1.0,
"eval_dim_128_cosine_accuracy@3": 0.98,
"eval_dim_128_cosine_accuracy@5": 0.9973333333333333,
"eval_dim_128_cosine_map@100": 0.8938330790257619,
"eval_dim_128_cosine_mrr@10": 0.9142888888888889,
"eval_dim_128_cosine_ndcg@10": 0.925368385464489,
"eval_dim_128_cosine_precision@1": 0.8493333333333334,
"eval_dim_128_cosine_precision@10": 0.14426666666666668,
"eval_dim_128_cosine_precision@3": 0.44666666666666666,
"eval_dim_128_cosine_precision@5": 0.28319999999999995,
"eval_dim_128_cosine_recall@1": 0.6682888888888889,
"eval_dim_128_cosine_recall@10": 0.9958666666666668,
"eval_dim_128_cosine_recall@3": 0.9433111111111111,
"eval_dim_128_cosine_recall@5": 0.9822222222222222,
"eval_runtime": 5.8495,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1560
},
{
"epoch": 5.741410488245931,
"grad_norm": 95.12468719482422,
"learning_rate": 1.5080074198785557e-05,
"loss": 1.0155,
"step": 1590
},
{
"epoch": 5.741410488245931,
"eval_dim_128_cosine_accuracy@1": 0.852,
"eval_dim_128_cosine_accuracy@10": 1.0,
"eval_dim_128_cosine_accuracy@3": 0.9786666666666667,
"eval_dim_128_cosine_accuracy@5": 0.9946666666666667,
"eval_dim_128_cosine_map@100": 0.8969539720332578,
"eval_dim_128_cosine_mrr@10": 0.9152751322751322,
"eval_dim_128_cosine_ndcg@10": 0.9274971707425689,
"eval_dim_128_cosine_precision@1": 0.852,
"eval_dim_128_cosine_precision@10": 0.14466666666666667,
"eval_dim_128_cosine_precision@3": 0.44888888888888884,
"eval_dim_128_cosine_precision@5": 0.28426666666666667,
"eval_dim_128_cosine_recall@1": 0.6716222222222222,
"eval_dim_128_cosine_recall@10": 0.9966666666666667,
"eval_dim_128_cosine_recall@3": 0.9459777777777778,
"eval_dim_128_cosine_recall@5": 0.9831555555555556,
"eval_runtime": 5.9231,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1590
},
{
"epoch": 5.8499095840868,
"grad_norm": 95.16857147216797,
"learning_rate": 1.4479619675158957e-05,
"loss": 0.7671,
"step": 1620
},
{
"epoch": 5.8499095840868,
"eval_dim_128_cosine_accuracy@1": 0.856,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.98,
"eval_dim_128_cosine_accuracy@5": 0.9946666666666667,
"eval_dim_128_cosine_map@100": 0.8994578403675177,
"eval_dim_128_cosine_mrr@10": 0.9167666666666668,
"eval_dim_128_cosine_ndcg@10": 0.9278245203077812,
"eval_dim_128_cosine_precision@1": 0.856,
"eval_dim_128_cosine_precision@10": 0.144,
"eval_dim_128_cosine_precision@3": 0.4497777777777778,
"eval_dim_128_cosine_precision@5": 0.284,
"eval_dim_128_cosine_recall@1": 0.6782888888888889,
"eval_dim_128_cosine_recall@10": 0.9926666666666667,
"eval_dim_128_cosine_recall@3": 0.9457555555555555,
"eval_dim_128_cosine_recall@5": 0.9820888888888888,
"eval_runtime": 5.8405,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1620
},
{
"epoch": 5.958408679927667,
"grad_norm": 53.67948532104492,
"learning_rate": 1.3879999201732607e-05,
"loss": 1.0426,
"step": 1650
},
{
"epoch": 5.958408679927667,
"eval_dim_128_cosine_accuracy@1": 0.8586666666666667,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9826666666666667,
"eval_dim_128_cosine_accuracy@5": 0.9973333333333333,
"eval_dim_128_cosine_map@100": 0.9012198624750842,
"eval_dim_128_cosine_mrr@10": 0.9194888888888889,
"eval_dim_128_cosine_ndcg@10": 0.9297915866349458,
"eval_dim_128_cosine_precision@1": 0.8586666666666667,
"eval_dim_128_cosine_precision@10": 0.14426666666666668,
"eval_dim_128_cosine_precision@3": 0.4528888888888889,
"eval_dim_128_cosine_precision@5": 0.2853333333333333,
"eval_dim_128_cosine_recall@1": 0.6751777777777778,
"eval_dim_128_cosine_recall@10": 0.994,
"eval_dim_128_cosine_recall@3": 0.9526444444444445,
"eval_dim_128_cosine_recall@5": 0.9867555555555555,
"eval_runtime": 5.9268,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1650
},
{
"epoch": 6.0650994575045205,
"grad_norm": 21.35325813293457,
"learning_rate": 1.3282173832474273e-05,
"loss": 0.8879,
"step": 1680
},
{
"epoch": 6.0650994575045205,
"eval_dim_128_cosine_accuracy@1": 0.864,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9866666666666667,
"eval_dim_128_cosine_accuracy@5": 0.9946666666666667,
"eval_dim_128_cosine_map@100": 0.9085956692666805,
"eval_dim_128_cosine_mrr@10": 0.9234222222222221,
"eval_dim_128_cosine_ndcg@10": 0.9345097688489636,
"eval_dim_128_cosine_precision@1": 0.864,
"eval_dim_128_cosine_precision@10": 0.14426666666666668,
"eval_dim_128_cosine_precision@3": 0.4573333333333333,
"eval_dim_128_cosine_precision@5": 0.2853333333333333,
"eval_dim_128_cosine_recall@1": 0.6825111111111111,
"eval_dim_128_cosine_recall@10": 0.994,
"eval_dim_128_cosine_recall@3": 0.9593111111111111,
"eval_dim_128_cosine_recall@5": 0.9863111111111111,
"eval_runtime": 5.8634,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1680
},
{
"epoch": 6.173598553345389,
"grad_norm": 3.867913246154785,
"learning_rate": 1.268710174421184e-05,
"loss": 0.6999,
"step": 1710
},
{
"epoch": 6.173598553345389,
"eval_dim_128_cosine_accuracy@1": 0.8653333333333333,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9786666666666667,
"eval_dim_128_cosine_accuracy@5": 0.9946666666666667,
"eval_dim_128_cosine_map@100": 0.9078902927190878,
"eval_dim_128_cosine_mrr@10": 0.9238666666666665,
"eval_dim_128_cosine_ndcg@10": 0.9339475022230823,
"eval_dim_128_cosine_precision@1": 0.8653333333333333,
"eval_dim_128_cosine_precision@10": 0.14413333333333334,
"eval_dim_128_cosine_precision@3": 0.4533333333333333,
"eval_dim_128_cosine_precision@5": 0.2856,
"eval_dim_128_cosine_recall@1": 0.6838444444444445,
"eval_dim_128_cosine_recall@10": 0.9933333333333333,
"eval_dim_128_cosine_recall@3": 0.9495333333333331,
"eval_dim_128_cosine_recall@5": 0.9863555555555555,
"eval_runtime": 5.91,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1710
},
{
"epoch": 6.282097649186257,
"grad_norm": 35.970428466796875,
"learning_rate": 1.2095736700895798e-05,
"loss": 0.7144,
"step": 1740
},
{
"epoch": 6.282097649186257,
"eval_dim_128_cosine_accuracy@1": 0.868,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9826666666666667,
"eval_dim_128_cosine_accuracy@5": 0.996,
"eval_dim_128_cosine_map@100": 0.9102439375439374,
"eval_dim_128_cosine_mrr@10": 0.9254126984126985,
"eval_dim_128_cosine_ndcg@10": 0.935435964814853,
"eval_dim_128_cosine_precision@1": 0.868,
"eval_dim_128_cosine_precision@10": 0.14413333333333334,
"eval_dim_128_cosine_precision@3": 0.4564444444444443,
"eval_dim_128_cosine_precision@5": 0.2848,
"eval_dim_128_cosine_recall@1": 0.6856222222222222,
"eval_dim_128_cosine_recall@10": 0.9933333333333333,
"eval_dim_128_cosine_recall@3": 0.9555333333333333,
"eval_dim_128_cosine_recall@5": 0.9853777777777777,
"eval_runtime": 5.8695,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1740
},
{
"epoch": 6.390596745027125,
"grad_norm": 114.22407531738281,
"learning_rate": 1.1509026524934597e-05,
"loss": 1.0946,
"step": 1770
},
{
"epoch": 6.390596745027125,
"eval_dim_128_cosine_accuracy@1": 0.8613333333333333,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.98,
"eval_dim_128_cosine_accuracy@5": 0.996,
"eval_dim_128_cosine_map@100": 0.9078267719156685,
"eval_dim_128_cosine_mrr@10": 0.9220793650793649,
"eval_dim_128_cosine_ndcg@10": 0.9336001983943315,
"eval_dim_128_cosine_precision@1": 0.8613333333333333,
"eval_dim_128_cosine_precision@10": 0.14413333333333334,
"eval_dim_128_cosine_precision@3": 0.45644444444444443,
"eval_dim_128_cosine_precision@5": 0.2853333333333333,
"eval_dim_128_cosine_recall@1": 0.6816222222222222,
"eval_dim_128_cosine_recall@10": 0.9933333333333333,
"eval_dim_128_cosine_recall@3": 0.9541999999999999,
"eval_dim_128_cosine_recall@5": 0.9868888888888888,
"eval_runtime": 5.9142,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1770
},
{
"epoch": 6.499095840867993,
"grad_norm": 8.424233436584473,
"learning_rate": 1.0927911578052903e-05,
"loss": 0.5136,
"step": 1800
},
{
"epoch": 6.499095840867993,
"eval_dim_128_cosine_accuracy@1": 0.8733333333333333,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9826666666666667,
"eval_dim_128_cosine_accuracy@5": 0.996,
"eval_dim_128_cosine_map@100": 0.9151832652201073,
"eval_dim_128_cosine_mrr@10": 0.9295777777777778,
"eval_dim_128_cosine_ndcg@10": 0.9390823223808145,
"eval_dim_128_cosine_precision@1": 0.8733333333333333,
"eval_dim_128_cosine_precision@10": 0.14413333333333334,
"eval_dim_128_cosine_precision@3": 0.45644444444444443,
"eval_dim_128_cosine_precision@5": 0.28586666666666666,
"eval_dim_128_cosine_recall@1": 0.6918444444444445,
"eval_dim_128_cosine_recall@10": 0.9933333333333333,
"eval_dim_128_cosine_recall@3": 0.9564222222222222,
"eval_dim_128_cosine_recall@5": 0.9878222222222223,
"eval_runtime": 5.8496,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1800
},
{
"epoch": 6.6075949367088604,
"grad_norm": 7.015948295593262,
"learning_rate": 1.0353323254107632e-05,
"loss": 0.3708,
"step": 1830
},
{
"epoch": 6.6075949367088604,
"eval_dim_128_cosine_accuracy@1": 0.8773333333333333,
"eval_dim_128_cosine_accuracy@10": 1.0,
"eval_dim_128_cosine_accuracy@3": 0.98,
"eval_dim_128_cosine_accuracy@5": 0.992,
"eval_dim_128_cosine_map@100": 0.913754870974062,
"eval_dim_128_cosine_mrr@10": 0.9307253968253969,
"eval_dim_128_cosine_ndcg@10": 0.9392228655817703,
"eval_dim_128_cosine_precision@1": 0.8773333333333333,
"eval_dim_128_cosine_precision@10": 0.14453333333333335,
"eval_dim_128_cosine_precision@3": 0.4542222222222222,
"eval_dim_128_cosine_precision@5": 0.2845333333333333,
"eval_dim_128_cosine_recall@1": 0.6931777777777778,
"eval_dim_128_cosine_recall@10": 0.996,
"eval_dim_128_cosine_recall@3": 0.9519777777777778,
"eval_dim_128_cosine_recall@5": 0.9828888888888888,
"eval_runtime": 5.9102,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1830
},
{
"epoch": 6.716094032549728,
"grad_norm": 30.462295532226562,
"learning_rate": 9.786182486277407e-06,
"loss": 0.6965,
"step": 1860
},
{
"epoch": 6.716094032549728,
"eval_dim_128_cosine_accuracy@1": 0.876,
"eval_dim_128_cosine_accuracy@10": 1.0,
"eval_dim_128_cosine_accuracy@3": 0.98,
"eval_dim_128_cosine_accuracy@5": 0.9946666666666667,
"eval_dim_128_cosine_map@100": 0.9139468020219427,
"eval_dim_128_cosine_mrr@10": 0.9297555555555557,
"eval_dim_128_cosine_ndcg@10": 0.9390525287534867,
"eval_dim_128_cosine_precision@1": 0.876,
"eval_dim_128_cosine_precision@10": 0.14440000000000003,
"eval_dim_128_cosine_precision@3": 0.4555555555555555,
"eval_dim_128_cosine_precision@5": 0.28373333333333334,
"eval_dim_128_cosine_recall@1": 0.692288888888889,
"eval_dim_128_cosine_recall@10": 0.9957333333333332,
"eval_dim_128_cosine_recall@3": 0.9541999999999999,
"eval_dim_128_cosine_recall@5": 0.9826666666666667,
"eval_runtime": 5.8625,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1860
},
{
"epoch": 6.824593128390597,
"grad_norm": 30.634235382080078,
"learning_rate": 9.227398271018092e-06,
"loss": 0.618,
"step": 1890
},
{
"epoch": 6.824593128390597,
"eval_dim_128_cosine_accuracy@1": 0.8746666666666667,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9786666666666667,
"eval_dim_128_cosine_accuracy@5": 0.9973333333333333,
"eval_dim_128_cosine_map@100": 0.9132103845155253,
"eval_dim_128_cosine_mrr@10": 0.928711111111111,
"eval_dim_128_cosine_ndcg@10": 0.9384138034588314,
"eval_dim_128_cosine_precision@1": 0.8746666666666667,
"eval_dim_128_cosine_precision@10": 0.14453333333333335,
"eval_dim_128_cosine_precision@3": 0.45466666666666666,
"eval_dim_128_cosine_precision@5": 0.2853333333333333,
"eval_dim_128_cosine_recall@1": 0.6905111111111111,
"eval_dim_128_cosine_recall@10": 0.9953333333333333,
"eval_dim_128_cosine_recall@3": 0.9519777777777778,
"eval_dim_128_cosine_recall@5": 0.9877777777777779,
"eval_runtime": 5.915,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1890
},
{
"epoch": 6.933092224231465,
"grad_norm": 84.823486328125,
"learning_rate": 8.677866211150136e-06,
"loss": 1.137,
"step": 1920
},
{
"epoch": 6.933092224231465,
"eval_dim_128_cosine_accuracy@1": 0.872,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.98,
"eval_dim_128_cosine_accuracy@5": 0.9946666666666667,
"eval_dim_128_cosine_map@100": 0.9153196825396827,
"eval_dim_128_cosine_mrr@10": 0.9281682539682541,
"eval_dim_128_cosine_ndcg@10": 0.9394034719939754,
"eval_dim_128_cosine_precision@1": 0.872,
"eval_dim_128_cosine_precision@10": 0.14453333333333335,
"eval_dim_128_cosine_precision@3": 0.4551111111111112,
"eval_dim_128_cosine_precision@5": 0.284,
"eval_dim_128_cosine_recall@1": 0.6911777777777778,
"eval_dim_128_cosine_recall@10": 0.9953333333333333,
"eval_dim_128_cosine_recall@3": 0.9539777777777778,
"eval_dim_128_cosine_recall@5": 0.9833333333333333,
"eval_runtime": 5.8586,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1920
},
{
"epoch": 7.039783001808318,
"grad_norm": 14.155540466308594,
"learning_rate": 8.13846708041285e-06,
"loss": 0.5326,
"step": 1950
},
{
"epoch": 7.039783001808318,
"eval_dim_128_cosine_accuracy@1": 0.876,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9813333333333333,
"eval_dim_128_cosine_accuracy@5": 0.996,
"eval_dim_128_cosine_map@100": 0.9162717328042327,
"eval_dim_128_cosine_mrr@10": 0.9304222222222225,
"eval_dim_128_cosine_ndcg@10": 0.9405782417080079,
"eval_dim_128_cosine_precision@1": 0.876,
"eval_dim_128_cosine_precision@10": 0.14466666666666667,
"eval_dim_128_cosine_precision@3": 0.4555555555555555,
"eval_dim_128_cosine_precision@5": 0.2850666666666667,
"eval_dim_128_cosine_recall@1": 0.6929555555555555,
"eval_dim_128_cosine_recall@10": 0.996,
"eval_dim_128_cosine_recall@3": 0.9550888888888888,
"eval_dim_128_cosine_recall@5": 0.9854666666666665,
"eval_runtime": 5.8895,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1950
},
{
"epoch": 7.1482820976491865,
"grad_norm": 5.926642417907715,
"learning_rate": 7.6100654117863254e-06,
"loss": 0.804,
"step": 1980
},
{
"epoch": 7.1482820976491865,
"eval_dim_128_cosine_accuracy@1": 0.8773333333333333,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9813333333333333,
"eval_dim_128_cosine_accuracy@5": 0.9973333333333333,
"eval_dim_128_cosine_map@100": 0.9163037292291328,
"eval_dim_128_cosine_mrr@10": 0.9311333333333334,
"eval_dim_128_cosine_ndcg@10": 0.940187825535024,
"eval_dim_128_cosine_precision@1": 0.8773333333333333,
"eval_dim_128_cosine_precision@10": 0.14426666666666665,
"eval_dim_128_cosine_precision@3": 0.4555555555555555,
"eval_dim_128_cosine_precision@5": 0.2850666666666667,
"eval_dim_128_cosine_recall@1": 0.694288888888889,
"eval_dim_128_cosine_recall@10": 0.994,
"eval_dim_128_cosine_recall@3": 0.9550888888888888,
"eval_dim_128_cosine_recall@5": 0.9865777777777777,
"eval_runtime": 5.8689,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 1980
},
{
"epoch": 7.256781193490054,
"grad_norm": 32.035621643066406,
"learning_rate": 7.093508111843476e-06,
"loss": 0.7989,
"step": 2010
},
{
"epoch": 7.256781193490054,
"eval_dim_128_cosine_accuracy@1": 0.884,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.984,
"eval_dim_128_cosine_accuracy@5": 0.9973333333333333,
"eval_dim_128_cosine_map@100": 0.9203901935708568,
"eval_dim_128_cosine_mrr@10": 0.9347555555555557,
"eval_dim_128_cosine_ndcg@10": 0.9432960759953539,
"eval_dim_128_cosine_precision@1": 0.884,
"eval_dim_128_cosine_precision@10": 0.1444,
"eval_dim_128_cosine_precision@3": 0.45688888888888884,
"eval_dim_128_cosine_precision@5": 0.28586666666666666,
"eval_dim_128_cosine_recall@1": 0.7009555555555556,
"eval_dim_128_cosine_recall@10": 0.9946666666666667,
"eval_dim_128_cosine_recall@3": 0.9584222222222222,
"eval_dim_128_cosine_recall@5": 0.9879111111111111,
"eval_runtime": 5.9403,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2010
},
{
"epoch": 7.365280289330922,
"grad_norm": 4.288305759429932,
"learning_rate": 6.589623103353283e-06,
"loss": 0.6908,
"step": 2040
},
{
"epoch": 7.365280289330922,
"eval_dim_128_cosine_accuracy@1": 0.88,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9826666666666667,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9196608913745559,
"eval_dim_128_cosine_mrr@10": 0.9319555555555554,
"eval_dim_128_cosine_ndcg@10": 0.9422073602962597,
"eval_dim_128_cosine_precision@1": 0.88,
"eval_dim_128_cosine_precision@10": 0.1444,
"eval_dim_128_cosine_precision@3": 0.4582222222222222,
"eval_dim_128_cosine_precision@5": 0.2869333333333333,
"eval_dim_128_cosine_recall@1": 0.698288888888889,
"eval_dim_128_cosine_recall@10": 0.9946666666666667,
"eval_dim_128_cosine_recall@3": 0.9588666666666668,
"eval_dim_128_cosine_recall@5": 0.9906222222222223,
"eval_runtime": 5.8591,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2040
},
{
"epoch": 7.47377938517179,
"grad_norm": 73.20112609863281,
"learning_rate": 6.099217998310606e-06,
"loss": 0.6518,
"step": 2070
},
{
"epoch": 7.47377938517179,
"eval_dim_128_cosine_accuracy@1": 0.8853333333333333,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.984,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9223404198975627,
"eval_dim_128_cosine_mrr@10": 0.9353111111111111,
"eval_dim_128_cosine_ndcg@10": 0.9447817040034601,
"eval_dim_128_cosine_precision@1": 0.8853333333333333,
"eval_dim_128_cosine_precision@10": 0.14466666666666667,
"eval_dim_128_cosine_precision@3": 0.4586666666666666,
"eval_dim_128_cosine_precision@5": 0.2869333333333333,
"eval_dim_128_cosine_recall@1": 0.7020666666666666,
"eval_dim_128_cosine_recall@10": 0.996,
"eval_dim_128_cosine_recall@3": 0.9601999999999999,
"eval_dim_128_cosine_recall@5": 0.9904444444444443,
"eval_runtime": 5.9172,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2070
},
{
"epoch": 7.582278481012658,
"grad_norm": 9.156688690185547,
"learning_rate": 5.623078803519595e-06,
"loss": 0.4915,
"step": 2100
},
{
"epoch": 7.582278481012658,
"eval_dim_128_cosine_accuracy@1": 0.8893333333333333,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.984,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9255765584974887,
"eval_dim_128_cosine_mrr@10": 0.9376888888888889,
"eval_dim_128_cosine_ndcg@10": 0.946947073613619,
"eval_dim_128_cosine_precision@1": 0.8893333333333333,
"eval_dim_128_cosine_precision@10": 0.14466666666666667,
"eval_dim_128_cosine_precision@3": 0.46044444444444443,
"eval_dim_128_cosine_precision@5": 0.2872,
"eval_dim_128_cosine_recall@1": 0.7051777777777778,
"eval_dim_128_cosine_recall@10": 0.996,
"eval_dim_128_cosine_recall@3": 0.9628666666666666,
"eval_dim_128_cosine_recall@5": 0.991111111111111,
"eval_runtime": 5.8614,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2100
},
{
"epoch": 7.6907775768535265,
"grad_norm": 4.278165817260742,
"learning_rate": 5.161968660805184e-06,
"loss": 0.4586,
"step": 2130
},
{
"epoch": 7.6907775768535265,
"eval_dim_128_cosine_accuracy@1": 0.8906666666666667,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.984,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.926481931895545,
"eval_dim_128_cosine_mrr@10": 0.9380666666666666,
"eval_dim_128_cosine_ndcg@10": 0.947266324500608,
"eval_dim_128_cosine_precision@1": 0.8906666666666667,
"eval_dim_128_cosine_precision@10": 0.14453333333333335,
"eval_dim_128_cosine_precision@3": 0.4604444444444445,
"eval_dim_128_cosine_precision@5": 0.28746666666666665,
"eval_dim_128_cosine_recall@1": 0.7065111111111111,
"eval_dim_128_cosine_recall@10": 0.9953333333333333,
"eval_dim_128_cosine_recall@3": 0.9626444444444444,
"eval_dim_128_cosine_recall@5": 0.9917777777777776,
"eval_runtime": 5.8932,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2130
},
{
"epoch": 7.799276672694394,
"grad_norm": 36.47736358642578,
"learning_rate": 4.716626623871968e-06,
"loss": 0.4537,
"step": 2160
},
{
"epoch": 7.799276672694394,
"eval_dim_128_cosine_accuracy@1": 0.8933333333333333,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.984,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9261875428220862,
"eval_dim_128_cosine_mrr@10": 0.9387333333333334,
"eval_dim_128_cosine_ndcg@10": 0.947003287713002,
"eval_dim_128_cosine_precision@1": 0.8933333333333333,
"eval_dim_128_cosine_precision@10": 0.1444,
"eval_dim_128_cosine_precision@3": 0.4591111111111111,
"eval_dim_128_cosine_precision@5": 0.2877333333333333,
"eval_dim_128_cosine_recall@1": 0.7085111111111111,
"eval_dim_128_cosine_recall@10": 0.9946666666666667,
"eval_dim_128_cosine_recall@3": 0.9608666666666666,
"eval_dim_128_cosine_recall@5": 0.9922222222222221,
"eval_runtime": 5.8563,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2160
},
{
"epoch": 7.907775768535262,
"grad_norm": 12.328997611999512,
"learning_rate": 4.287766473770755e-06,
"loss": 0.5117,
"step": 2190
},
{
"epoch": 7.907775768535262,
"eval_dim_128_cosine_accuracy@1": 0.8933333333333333,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.984,
"eval_dim_128_cosine_accuracy@5": 0.9973333333333333,
"eval_dim_128_cosine_map@100": 0.927080770223453,
"eval_dim_128_cosine_mrr@10": 0.9388444444444445,
"eval_dim_128_cosine_ndcg@10": 0.9475417170141722,
"eval_dim_128_cosine_precision@1": 0.8933333333333333,
"eval_dim_128_cosine_precision@10": 0.1444,
"eval_dim_128_cosine_precision@3": 0.46044444444444443,
"eval_dim_128_cosine_precision@5": 0.28746666666666665,
"eval_dim_128_cosine_recall@1": 0.7091777777777779,
"eval_dim_128_cosine_recall@10": 0.9946666666666667,
"eval_dim_128_cosine_recall@3": 0.9628666666666666,
"eval_dim_128_cosine_recall@5": 0.9908888888888888,
"eval_runtime": 5.9129,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2190
},
{
"epoch": 8.014466546112116,
"grad_norm": 30.67298698425293,
"learning_rate": 3.8760755748713984e-06,
"loss": 0.6986,
"step": 2220
},
{
"epoch": 8.014466546112116,
"eval_dim_128_cosine_accuracy@1": 0.896,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.984,
"eval_dim_128_cosine_accuracy@5": 0.9973333333333333,
"eval_dim_128_cosine_map@100": 0.9286057480911137,
"eval_dim_128_cosine_mrr@10": 0.9403777777777779,
"eval_dim_128_cosine_ndcg@10": 0.9486381203545307,
"eval_dim_128_cosine_precision@1": 0.896,
"eval_dim_128_cosine_precision@10": 0.1444,
"eval_dim_128_cosine_precision@3": 0.46088888888888885,
"eval_dim_128_cosine_precision@5": 0.28746666666666665,
"eval_dim_128_cosine_recall@1": 0.7111777777777778,
"eval_dim_128_cosine_recall@10": 0.9946666666666667,
"eval_dim_128_cosine_recall@3": 0.9633111111111111,
"eval_dim_128_cosine_recall@5": 0.9908888888888888,
"eval_runtime": 5.8609,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2220
},
{
"epoch": 8.122965641952984,
"grad_norm": 1.5760753154754639,
"learning_rate": 3.482213773175531e-06,
"loss": 0.439,
"step": 2250
},
{
"epoch": 8.122965641952984,
"eval_dim_128_cosine_accuracy@1": 0.892,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.984,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9268501925355582,
"eval_dim_128_cosine_mrr@10": 0.9379777777777778,
"eval_dim_128_cosine_ndcg@10": 0.9472364738873601,
"eval_dim_128_cosine_precision@1": 0.892,
"eval_dim_128_cosine_precision@10": 0.1444,
"eval_dim_128_cosine_precision@3": 0.4595555555555556,
"eval_dim_128_cosine_precision@5": 0.288,
"eval_dim_128_cosine_recall@1": 0.7085111111111111,
"eval_dim_128_cosine_recall@10": 0.9946666666666667,
"eval_dim_128_cosine_recall@3": 0.9613111111111111,
"eval_dim_128_cosine_recall@5": 0.9928888888888888,
"eval_runtime": 5.9215,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2250
},
{
"epoch": 8.231464737793852,
"grad_norm": 18.038986206054688,
"learning_rate": 3.1068123387348635e-06,
"loss": 0.7161,
"step": 2280
},
{
"epoch": 8.231464737793852,
"eval_dim_128_cosine_accuracy@1": 0.892,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9853333333333333,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9268143745143744,
"eval_dim_128_cosine_mrr@10": 0.9380222222222222,
"eval_dim_128_cosine_ndcg@10": 0.9472003973675673,
"eval_dim_128_cosine_precision@1": 0.892,
"eval_dim_128_cosine_precision@10": 0.1444,
"eval_dim_128_cosine_precision@3": 0.46,
"eval_dim_128_cosine_precision@5": 0.28826666666666667,
"eval_dim_128_cosine_recall@1": 0.7078444444444444,
"eval_dim_128_cosine_recall@10": 0.9946666666666667,
"eval_dim_128_cosine_recall@3": 0.9626444444444444,
"eval_dim_128_cosine_recall@5": 0.9935555555555555,
"eval_runtime": 6.2984,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2280
},
{
"epoch": 8.33996383363472,
"grad_norm": 12.559696197509766,
"learning_rate": 2.7504729538702427e-06,
"loss": 0.6017,
"step": 2310
},
{
"epoch": 8.33996383363472,
"eval_dim_128_cosine_accuracy@1": 0.892,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.988,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9269281106807422,
"eval_dim_128_cosine_mrr@10": 0.9384666666666667,
"eval_dim_128_cosine_ndcg@10": 0.9473667282424024,
"eval_dim_128_cosine_precision@1": 0.892,
"eval_dim_128_cosine_precision@10": 0.1444,
"eval_dim_128_cosine_precision@3": 0.4613333333333333,
"eval_dim_128_cosine_precision@5": 0.28826666666666667,
"eval_dim_128_cosine_recall@1": 0.7071777777777778,
"eval_dim_128_cosine_recall@10": 0.9946666666666667,
"eval_dim_128_cosine_recall@3": 0.9659777777777778,
"eval_dim_128_cosine_recall@5": 0.9935555555555555,
"eval_runtime": 5.9016,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2310
},
{
"epoch": 8.448462929475587,
"grad_norm": 31.18543243408203,
"learning_rate": 2.4137667488129887e-06,
"loss": 0.5401,
"step": 2340
},
{
"epoch": 8.448462929475587,
"eval_dim_128_cosine_accuracy@1": 0.8933333333333333,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9893333333333333,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9285061133987962,
"eval_dim_128_cosine_mrr@10": 0.9393111111111111,
"eval_dim_128_cosine_ndcg@10": 0.9483714677447728,
"eval_dim_128_cosine_precision@1": 0.8933333333333333,
"eval_dim_128_cosine_precision@10": 0.1444,
"eval_dim_128_cosine_precision@3": 0.46266666666666667,
"eval_dim_128_cosine_precision@5": 0.288,
"eval_dim_128_cosine_recall@1": 0.7085111111111112,
"eval_dim_128_cosine_recall@10": 0.9946666666666667,
"eval_dim_128_cosine_recall@3": 0.9686444444444444,
"eval_dim_128_cosine_recall@5": 0.9928888888888888,
"eval_runtime": 5.8553,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2340
},
{
"epoch": 8.556962025316455,
"grad_norm": 77.83521270751953,
"learning_rate": 2.0972333863142685e-06,
"loss": 0.5061,
"step": 2370
},
{
"epoch": 8.556962025316455,
"eval_dim_128_cosine_accuracy@1": 0.8986666666666666,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9906666666666667,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9309018907018908,
"eval_dim_128_cosine_mrr@10": 0.9427555555555555,
"eval_dim_128_cosine_ndcg@10": 0.9504180800389047,
"eval_dim_128_cosine_precision@1": 0.8986666666666666,
"eval_dim_128_cosine_precision@10": 0.1444,
"eval_dim_128_cosine_precision@3": 0.46266666666666667,
"eval_dim_128_cosine_precision@5": 0.2877333333333333,
"eval_dim_128_cosine_recall@1": 0.7138444444444444,
"eval_dim_128_cosine_recall@10": 0.9946666666666667,
"eval_dim_128_cosine_recall@3": 0.9693111111111111,
"eval_dim_128_cosine_recall@5": 0.9922222222222221,
"eval_runtime": 5.9013,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2370
},
{
"epoch": 8.665461121157323,
"grad_norm": 98.64642333984375,
"learning_rate": 1.8013801966895778e-06,
"loss": 0.6934,
"step": 2400
},
{
"epoch": 8.665461121157323,
"eval_dim_128_cosine_accuracy@1": 0.8973333333333333,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9893333333333333,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9307591831605443,
"eval_dim_128_cosine_mrr@10": 0.9419777777777778,
"eval_dim_128_cosine_ndcg@10": 0.9501743830896927,
"eval_dim_128_cosine_precision@1": 0.8973333333333333,
"eval_dim_128_cosine_precision@10": 0.1444,
"eval_dim_128_cosine_precision@3": 0.46266666666666667,
"eval_dim_128_cosine_precision@5": 0.28746666666666665,
"eval_dim_128_cosine_recall@1": 0.7131777777777778,
"eval_dim_128_cosine_recall@10": 0.9946666666666667,
"eval_dim_128_cosine_recall@3": 0.9686444444444444,
"eval_dim_128_cosine_recall@5": 0.9915555555555555,
"eval_runtime": 5.8527,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2400
},
{
"epoch": 8.773960216998193,
"grad_norm": 1.946149468421936,
"learning_rate": 1.5266813646847072e-06,
"loss": 0.4517,
"step": 2430
},
{
"epoch": 8.773960216998193,
"eval_dim_128_cosine_accuracy@1": 0.9026666666666666,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.988,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9324288704091135,
"eval_dim_128_cosine_mrr@10": 0.9445333333333333,
"eval_dim_128_cosine_ndcg@10": 0.9517986133734063,
"eval_dim_128_cosine_precision@1": 0.9026666666666666,
"eval_dim_128_cosine_precision@10": 0.14453333333333335,
"eval_dim_128_cosine_precision@3": 0.46266666666666667,
"eval_dim_128_cosine_precision@5": 0.288,
"eval_dim_128_cosine_recall@1": 0.7171777777777778,
"eval_dim_128_cosine_recall@10": 0.9953333333333333,
"eval_dim_128_cosine_recall@3": 0.9679777777777778,
"eval_dim_128_cosine_recall@5": 0.9928888888888888,
"eval_runtime": 5.9073,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2430
},
{
"epoch": 8.88245931283906,
"grad_norm": 21.574716567993164,
"learning_rate": 1.2735771694664666e-06,
"loss": 0.572,
"step": 2460
},
{
"epoch": 8.88245931283906,
"eval_dim_128_cosine_accuracy@1": 0.904,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.988,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9336610339069912,
"eval_dim_128_cosine_mrr@10": 0.9452666666666667,
"eval_dim_128_cosine_ndcg@10": 0.9526096908217102,
"eval_dim_128_cosine_precision@1": 0.904,
"eval_dim_128_cosine_precision@10": 0.14453333333333335,
"eval_dim_128_cosine_precision@3": 0.46266666666666667,
"eval_dim_128_cosine_precision@5": 0.2877333333333333,
"eval_dim_128_cosine_recall@1": 0.7191777777777778,
"eval_dim_128_cosine_recall@10": 0.9953333333333333,
"eval_dim_128_cosine_recall@3": 0.9679777777777778,
"eval_dim_128_cosine_recall@5": 0.9922222222222221,
"eval_runtime": 5.8559,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2460
},
{
"epoch": 8.990958408679928,
"grad_norm": 0.8837202191352844,
"learning_rate": 1.0424732789562375e-06,
"loss": 0.443,
"step": 2490
},
{
"epoch": 8.990958408679928,
"eval_dim_128_cosine_accuracy@1": 0.9026666666666666,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9893333333333333,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9337033582909054,
"eval_dim_128_cosine_mrr@10": 0.9449333333333334,
"eval_dim_128_cosine_ndcg@10": 0.9528233468066813,
"eval_dim_128_cosine_precision@1": 0.9026666666666666,
"eval_dim_128_cosine_precision@10": 0.14466666666666667,
"eval_dim_128_cosine_precision@3": 0.46266666666666667,
"eval_dim_128_cosine_precision@5": 0.28719999999999996,
"eval_dim_128_cosine_recall@1": 0.7185111111111111,
"eval_dim_128_cosine_recall@10": 0.996,
"eval_dim_128_cosine_recall@3": 0.9686444444444444,
"eval_dim_128_cosine_recall@5": 0.9908888888888888,
"eval_runtime": 5.9289,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2490
},
{
"epoch": 9.097649186256781,
"grad_norm": 1.874420404434204,
"learning_rate": 8.337400996374217e-07,
"loss": 0.5398,
"step": 2520
},
{
"epoch": 9.097649186256781,
"eval_dim_128_cosine_accuracy@1": 0.9013333333333333,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9893333333333333,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9329674755481389,
"eval_dim_128_cosine_mrr@10": 0.9442666666666667,
"eval_dim_128_cosine_ndcg@10": 0.9522996328809646,
"eval_dim_128_cosine_precision@1": 0.9013333333333333,
"eval_dim_128_cosine_precision@10": 0.14466666666666667,
"eval_dim_128_cosine_precision@3": 0.46222222222222215,
"eval_dim_128_cosine_precision@5": 0.28746666666666665,
"eval_dim_128_cosine_recall@1": 0.7171777777777778,
"eval_dim_128_cosine_recall@10": 0.996,
"eval_dim_128_cosine_recall@3": 0.9679777777777778,
"eval_dim_128_cosine_recall@5": 0.9915555555555555,
"eval_runtime": 5.8503,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2520
},
{
"epoch": 9.206148282097649,
"grad_norm": 59.69526290893555,
"learning_rate": 6.477121828789007e-07,
"loss": 0.6212,
"step": 2550
},
{
"epoch": 9.206148282097649,
"eval_dim_128_cosine_accuracy@1": 0.9,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9906666666666667,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9324262475822048,
"eval_dim_128_cosine_mrr@10": 0.9437111111111111,
"eval_dim_128_cosine_ndcg@10": 0.9516769041847347,
"eval_dim_128_cosine_precision@1": 0.9,
"eval_dim_128_cosine_precision@10": 0.14453333333333335,
"eval_dim_128_cosine_precision@3": 0.46266666666666667,
"eval_dim_128_cosine_precision@5": 0.2877333333333333,
"eval_dim_128_cosine_recall@1": 0.7158444444444444,
"eval_dim_128_cosine_recall@10": 0.9953333333333333,
"eval_dim_128_cosine_recall@3": 0.9693111111111111,
"eval_dim_128_cosine_recall@5": 0.9922222222222221,
"eval_runtime": 5.9234,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2550
},
{
"epoch": 9.314647377938517,
"grad_norm": 9.565635681152344,
"learning_rate": 4.846876887259627e-07,
"loss": 0.649,
"step": 2580
},
{
"epoch": 9.314647377938517,
"eval_dim_128_cosine_accuracy@1": 0.9,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9906666666666667,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9324377777777777,
"eval_dim_128_cosine_mrr@10": 0.9434888888888889,
"eval_dim_128_cosine_ndcg@10": 0.9518456891768204,
"eval_dim_128_cosine_precision@1": 0.9,
"eval_dim_128_cosine_precision@10": 0.14466666666666667,
"eval_dim_128_cosine_precision@3": 0.46266666666666667,
"eval_dim_128_cosine_precision@5": 0.2877333333333333,
"eval_dim_128_cosine_recall@1": 0.7158444444444444,
"eval_dim_128_cosine_recall@10": 0.996,
"eval_dim_128_cosine_recall@3": 0.9693111111111111,
"eval_dim_128_cosine_recall@5": 0.9922222222222221,
"eval_runtime": 5.858,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2580
},
{
"epoch": 9.423146473779385,
"grad_norm": 26.480701446533203,
"learning_rate": 3.4492790801822274e-07,
"loss": 0.3859,
"step": 2610
},
{
"epoch": 9.423146473779385,
"eval_dim_128_cosine_accuracy@1": 0.9013333333333333,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9893333333333333,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9332155555555555,
"eval_dim_128_cosine_mrr@10": 0.9440444444444446,
"eval_dim_128_cosine_ndcg@10": 0.952332103626852,
"eval_dim_128_cosine_precision@1": 0.9013333333333333,
"eval_dim_128_cosine_precision@10": 0.14466666666666667,
"eval_dim_128_cosine_precision@3": 0.46311111111111114,
"eval_dim_128_cosine_precision@5": 0.2877333333333333,
"eval_dim_128_cosine_recall@1": 0.7171777777777778,
"eval_dim_128_cosine_recall@10": 0.996,
"eval_dim_128_cosine_recall@3": 0.9688666666666667,
"eval_dim_128_cosine_recall@5": 0.9922222222222221,
"eval_runtime": 5.9075,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2610
},
{
"epoch": 9.531645569620252,
"grad_norm": 41.95344924926758,
"learning_rate": 2.2865684360036887e-07,
"loss": 0.4697,
"step": 2640
},
{
"epoch": 9.531645569620252,
"eval_dim_128_cosine_accuracy@1": 0.9013333333333333,
"eval_dim_128_cosine_accuracy@10": 0.9986666666666667,
"eval_dim_128_cosine_accuracy@3": 0.9893333333333333,
"eval_dim_128_cosine_accuracy@5": 0.9986666666666667,
"eval_dim_128_cosine_map@100": 0.9335488888888889,
"eval_dim_128_cosine_mrr@10": 0.9442666666666667,
"eval_dim_128_cosine_ndcg@10": 0.9525500526536282,
"eval_dim_128_cosine_precision@1": 0.9013333333333333,
"eval_dim_128_cosine_precision@10": 0.14466666666666667,
"eval_dim_128_cosine_precision@3": 0.46355555555555555,
"eval_dim_128_cosine_precision@5": 0.2877333333333333,
"eval_dim_128_cosine_recall@1": 0.7171777777777778,
"eval_dim_128_cosine_recall@10": 0.996,
"eval_dim_128_cosine_recall@3": 0.9693111111111111,
"eval_dim_128_cosine_recall@5": 0.9922222222222221,
"eval_runtime": 5.8522,
"eval_samples_per_second": 0.0,
"eval_steps_per_second": 0.0,
"step": 2640
}
],
"logging_steps": 30,
"max_steps": 2770,
"num_input_tokens_seen": 0,
"num_train_epochs": 10,
"save_steps": 60,
"stateful_callbacks": {
"TrainerControl": {
"args": {
"should_epoch_stop": false,
"should_evaluate": false,
"should_log": false,
"should_save": true,
"should_training_stop": false
},
"attributes": {}
}
},
"total_flos": 0.0,
"train_batch_size": 8,
"trial_name": null,
"trial_params": null
}