| { |
| "best_global_step": 2370, |
| "best_metric": 0.9906666666666667, |
| "best_model_checkpoint": "/kaggle/working/checkpoint-2340", |
| "epoch": 9.531645569620252, |
| "eval_steps": 30, |
| "global_step": 2640, |
| "is_hyper_param_search": false, |
| "is_local_process_zero": true, |
| "is_world_process_zero": true, |
| "log_history": [ |
| { |
| "epoch": 0.10849909584086799, |
| "grad_norm": 315.2345275878906, |
| "learning_rate": 2.091346153846154e-06, |
| "loss": 9.8551, |
| "step": 30 |
| }, |
| { |
| "epoch": 0.10849909584086799, |
| "eval_dim_128_cosine_accuracy@1": 0.464, |
| "eval_dim_128_cosine_accuracy@10": 0.8853333333333333, |
| "eval_dim_128_cosine_accuracy@3": 0.6933333333333334, |
| "eval_dim_128_cosine_accuracy@5": 0.7973333333333333, |
| "eval_dim_128_cosine_map@100": 0.5496550065264402, |
| "eval_dim_128_cosine_mrr@10": 0.5995142857142851, |
| "eval_dim_128_cosine_ndcg@10": 0.6258921644136968, |
| "eval_dim_128_cosine_precision@1": 0.464, |
| "eval_dim_128_cosine_precision@10": 0.11679999999999999, |
| "eval_dim_128_cosine_precision@3": 0.27466666666666667, |
| "eval_dim_128_cosine_precision@5": 0.19573333333333334, |
| "eval_dim_128_cosine_recall@1": 0.3509555555555555, |
| "eval_dim_128_cosine_recall@10": 0.8282222222222222, |
| "eval_dim_128_cosine_recall@3": 0.5997555555555556, |
| "eval_dim_128_cosine_recall@5": 0.7099333333333334, |
| "eval_runtime": 6.0549, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 30 |
| }, |
| { |
| "epoch": 0.21699819168173598, |
| "grad_norm": 186.59336853027344, |
| "learning_rate": 4.254807692307692e-06, |
| "loss": 9.0754, |
| "step": 60 |
| }, |
| { |
| "epoch": 0.21699819168173598, |
| "eval_dim_128_cosine_accuracy@1": 0.4866666666666667, |
| "eval_dim_128_cosine_accuracy@10": 0.9, |
| "eval_dim_128_cosine_accuracy@3": 0.72, |
| "eval_dim_128_cosine_accuracy@5": 0.8106666666666666, |
| "eval_dim_128_cosine_map@100": 0.5743604860247659, |
| "eval_dim_128_cosine_mrr@10": 0.6221666666666664, |
| "eval_dim_128_cosine_ndcg@10": 0.648443755577266, |
| "eval_dim_128_cosine_precision@1": 0.4866666666666667, |
| "eval_dim_128_cosine_precision@10": 0.11946666666666668, |
| "eval_dim_128_cosine_precision@3": 0.28577777777777774, |
| "eval_dim_128_cosine_precision@5": 0.20266666666666666, |
| "eval_dim_128_cosine_recall@1": 0.37006666666666665, |
| "eval_dim_128_cosine_recall@10": 0.8457777777777776, |
| "eval_dim_128_cosine_recall@3": 0.6275333333333333, |
| "eval_dim_128_cosine_recall@5": 0.7314888888888889, |
| "eval_runtime": 5.832, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 60 |
| }, |
| { |
| "epoch": 0.325497287522604, |
| "grad_norm": 134.42782592773438, |
| "learning_rate": 6.418269230769231e-06, |
| "loss": 6.8585, |
| "step": 90 |
| }, |
| { |
| "epoch": 0.325497287522604, |
| "eval_dim_128_cosine_accuracy@1": 0.492, |
| "eval_dim_128_cosine_accuracy@10": 0.9306666666666666, |
| "eval_dim_128_cosine_accuracy@3": 0.7493333333333333, |
| "eval_dim_128_cosine_accuracy@5": 0.8426666666666667, |
| "eval_dim_128_cosine_map@100": 0.5932772577532479, |
| "eval_dim_128_cosine_mrr@10": 0.638767724867724, |
| "eval_dim_128_cosine_ndcg@10": 0.6728559811105229, |
| "eval_dim_128_cosine_precision@1": 0.492, |
| "eval_dim_128_cosine_precision@10": 0.1250666666666667, |
| "eval_dim_128_cosine_precision@3": 0.3008888888888888, |
| "eval_dim_128_cosine_precision@5": 0.21226666666666666, |
| "eval_dim_128_cosine_recall@1": 0.3731777777777778, |
| "eval_dim_128_cosine_recall@10": 0.8826222222222221, |
| "eval_dim_128_cosine_recall@3": 0.6590888888888888, |
| "eval_dim_128_cosine_recall@5": 0.7681555555555556, |
| "eval_runtime": 5.9035, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 90 |
| }, |
| { |
| "epoch": 0.43399638336347196, |
| "grad_norm": 155.28692626953125, |
| "learning_rate": 8.581730769230769e-06, |
| "loss": 6.1144, |
| "step": 120 |
| }, |
| { |
| "epoch": 0.43399638336347196, |
| "eval_dim_128_cosine_accuracy@1": 0.5146666666666667, |
| "eval_dim_128_cosine_accuracy@10": 0.9413333333333334, |
| "eval_dim_128_cosine_accuracy@3": 0.776, |
| "eval_dim_128_cosine_accuracy@5": 0.8653333333333333, |
| "eval_dim_128_cosine_map@100": 0.621402267467731, |
| "eval_dim_128_cosine_mrr@10": 0.6640814814814808, |
| "eval_dim_128_cosine_ndcg@10": 0.697136893890822, |
| "eval_dim_128_cosine_precision@1": 0.5146666666666667, |
| "eval_dim_128_cosine_precision@10": 0.1272, |
| "eval_dim_128_cosine_precision@3": 0.31555555555555553, |
| "eval_dim_128_cosine_precision@5": 0.22266666666666668, |
| "eval_dim_128_cosine_recall@1": 0.3920666666666666, |
| "eval_dim_128_cosine_recall@10": 0.8955555555555555, |
| "eval_dim_128_cosine_recall@3": 0.6910444444444444, |
| "eval_dim_128_cosine_recall@5": 0.7971333333333334, |
| "eval_runtime": 5.8653, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 120 |
| }, |
| { |
| "epoch": 0.5424954792043399, |
| "grad_norm": 118.29597473144531, |
| "learning_rate": 1.0745192307692307e-05, |
| "loss": 5.6528, |
| "step": 150 |
| }, |
| { |
| "epoch": 0.5424954792043399, |
| "eval_dim_128_cosine_accuracy@1": 0.5493333333333333, |
| "eval_dim_128_cosine_accuracy@10": 0.9613333333333334, |
| "eval_dim_128_cosine_accuracy@3": 0.8053333333333333, |
| "eval_dim_128_cosine_accuracy@5": 0.8866666666666667, |
| "eval_dim_128_cosine_map@100": 0.6539806932391371, |
| "eval_dim_128_cosine_mrr@10": 0.694885714285714, |
| "eval_dim_128_cosine_ndcg@10": 0.7277068157948943, |
| "eval_dim_128_cosine_precision@1": 0.5493333333333333, |
| "eval_dim_128_cosine_precision@10": 0.13053333333333333, |
| "eval_dim_128_cosine_precision@3": 0.3302222222222222, |
| "eval_dim_128_cosine_precision@5": 0.22906666666666667, |
| "eval_dim_128_cosine_recall@1": 0.4256222222222222, |
| "eval_dim_128_cosine_recall@10": 0.9175555555555555, |
| "eval_dim_128_cosine_recall@3": 0.7210444444444446, |
| "eval_dim_128_cosine_recall@5": 0.8195777777777778, |
| "eval_runtime": 5.9122, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 150 |
| }, |
| { |
| "epoch": 0.650994575045208, |
| "grad_norm": 179.03628540039062, |
| "learning_rate": 1.2908653846153848e-05, |
| "loss": 4.1877, |
| "step": 180 |
| }, |
| { |
| "epoch": 0.650994575045208, |
| "eval_dim_128_cosine_accuracy@1": 0.58, |
| "eval_dim_128_cosine_accuracy@10": 0.96, |
| "eval_dim_128_cosine_accuracy@3": 0.8213333333333334, |
| "eval_dim_128_cosine_accuracy@5": 0.9026666666666666, |
| "eval_dim_128_cosine_map@100": 0.6707829477428588, |
| "eval_dim_128_cosine_mrr@10": 0.7146952380952377, |
| "eval_dim_128_cosine_ndcg@10": 0.7420757638776961, |
| "eval_dim_128_cosine_precision@1": 0.58, |
| "eval_dim_128_cosine_precision@10": 0.13133333333333333, |
| "eval_dim_128_cosine_precision@3": 0.3328888888888889, |
| "eval_dim_128_cosine_precision@5": 0.23226666666666665, |
| "eval_dim_128_cosine_recall@1": 0.4487333333333334, |
| "eval_dim_128_cosine_recall@10": 0.9215555555555555, |
| "eval_dim_128_cosine_recall@3": 0.7292666666666667, |
| "eval_dim_128_cosine_recall@5": 0.8331555555555555, |
| "eval_runtime": 5.8677, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 180 |
| }, |
| { |
| "epoch": 0.759493670886076, |
| "grad_norm": 151.75982666015625, |
| "learning_rate": 1.5072115384615385e-05, |
| "loss": 4.7228, |
| "step": 210 |
| }, |
| { |
| "epoch": 0.759493670886076, |
| "eval_dim_128_cosine_accuracy@1": 0.5946666666666667, |
| "eval_dim_128_cosine_accuracy@10": 0.968, |
| "eval_dim_128_cosine_accuracy@3": 0.844, |
| "eval_dim_128_cosine_accuracy@5": 0.9013333333333333, |
| "eval_dim_128_cosine_map@100": 0.6856459707356679, |
| "eval_dim_128_cosine_mrr@10": 0.7304285714285711, |
| "eval_dim_128_cosine_ndcg@10": 0.7575913556214288, |
| "eval_dim_128_cosine_precision@1": 0.5946666666666667, |
| "eval_dim_128_cosine_precision@10": 0.13426666666666667, |
| "eval_dim_128_cosine_precision@3": 0.3471111111111111, |
| "eval_dim_128_cosine_precision@5": 0.23546666666666666, |
| "eval_dim_128_cosine_recall@1": 0.45962222222222227, |
| "eval_dim_128_cosine_recall@10": 0.9353333333333333, |
| "eval_dim_128_cosine_recall@3": 0.7523777777777777, |
| "eval_dim_128_cosine_recall@5": 0.8356444444444443, |
| "eval_runtime": 5.8902, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 210 |
| }, |
| { |
| "epoch": 0.8679927667269439, |
| "grad_norm": 214.2377471923828, |
| "learning_rate": 1.723557692307692e-05, |
| "loss": 4.0221, |
| "step": 240 |
| }, |
| { |
| "epoch": 0.8679927667269439, |
| "eval_dim_128_cosine_accuracy@1": 0.612, |
| "eval_dim_128_cosine_accuracy@10": 0.9733333333333334, |
| "eval_dim_128_cosine_accuracy@3": 0.8626666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.916, |
| "eval_dim_128_cosine_map@100": 0.6999904279300393, |
| "eval_dim_128_cosine_mrr@10": 0.7443804232804232, |
| "eval_dim_128_cosine_ndcg@10": 0.7697324770393862, |
| "eval_dim_128_cosine_precision@1": 0.612, |
| "eval_dim_128_cosine_precision@10": 0.13493333333333332, |
| "eval_dim_128_cosine_precision@3": 0.35422222222222216, |
| "eval_dim_128_cosine_precision@5": 0.24266666666666667, |
| "eval_dim_128_cosine_recall@1": 0.47339999999999993, |
| "eval_dim_128_cosine_recall@10": 0.9408888888888889, |
| "eval_dim_128_cosine_recall@3": 0.7690444444444444, |
| "eval_dim_128_cosine_recall@5": 0.8578666666666667, |
| "eval_runtime": 5.8498, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 240 |
| }, |
| { |
| "epoch": 0.976491862567812, |
| "grad_norm": 156.14193725585938, |
| "learning_rate": 1.9399038461538464e-05, |
| "loss": 3.9123, |
| "step": 270 |
| }, |
| { |
| "epoch": 0.976491862567812, |
| "eval_dim_128_cosine_accuracy@1": 0.6306666666666667, |
| "eval_dim_128_cosine_accuracy@10": 0.964, |
| "eval_dim_128_cosine_accuracy@3": 0.8613333333333333, |
| "eval_dim_128_cosine_accuracy@5": 0.9213333333333333, |
| "eval_dim_128_cosine_map@100": 0.7102987033261746, |
| "eval_dim_128_cosine_mrr@10": 0.7547354497354491, |
| "eval_dim_128_cosine_ndcg@10": 0.7771945743046785, |
| "eval_dim_128_cosine_precision@1": 0.6306666666666667, |
| "eval_dim_128_cosine_precision@10": 0.13493333333333335, |
| "eval_dim_128_cosine_precision@3": 0.3591111111111111, |
| "eval_dim_128_cosine_precision@5": 0.24559999999999998, |
| "eval_dim_128_cosine_recall@1": 0.4836222222222222, |
| "eval_dim_128_cosine_recall@10": 0.939111111111111, |
| "eval_dim_128_cosine_recall@3": 0.7781111111111112, |
| "eval_dim_128_cosine_recall@5": 0.8682222222222221, |
| "eval_runtime": 5.9086, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 270 |
| }, |
| { |
| "epoch": 1.0831826401446654, |
| "grad_norm": 153.49703979492188, |
| "learning_rate": 2.15625e-05, |
| "loss": 3.5228, |
| "step": 300 |
| }, |
| { |
| "epoch": 1.0831826401446654, |
| "eval_dim_128_cosine_accuracy@1": 0.656, |
| "eval_dim_128_cosine_accuracy@10": 0.9786666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.884, |
| "eval_dim_128_cosine_accuracy@5": 0.9333333333333333, |
| "eval_dim_128_cosine_map@100": 0.7362484353910447, |
| "eval_dim_128_cosine_mrr@10": 0.7771227513227512, |
| "eval_dim_128_cosine_ndcg@10": 0.799929818130629, |
| "eval_dim_128_cosine_precision@1": 0.656, |
| "eval_dim_128_cosine_precision@10": 0.13706666666666667, |
| "eval_dim_128_cosine_precision@3": 0.376, |
| "eval_dim_128_cosine_precision@5": 0.25173333333333336, |
| "eval_dim_128_cosine_recall@1": 0.5051777777777777, |
| "eval_dim_128_cosine_recall@10": 0.9523999999999999, |
| "eval_dim_128_cosine_recall@3": 0.8113999999999999, |
| "eval_dim_128_cosine_recall@5": 0.8881777777777776, |
| "eval_runtime": 5.8629, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 300 |
| }, |
| { |
| "epoch": 1.1916817359855334, |
| "grad_norm": 167.0846710205078, |
| "learning_rate": 2.3725961538461538e-05, |
| "loss": 2.4771, |
| "step": 330 |
| }, |
| { |
| "epoch": 1.1916817359855334, |
| "eval_dim_128_cosine_accuracy@1": 0.6666666666666666, |
| "eval_dim_128_cosine_accuracy@10": 0.9773333333333334, |
| "eval_dim_128_cosine_accuracy@3": 0.892, |
| "eval_dim_128_cosine_accuracy@5": 0.944, |
| "eval_dim_128_cosine_map@100": 0.7456641904330115, |
| "eval_dim_128_cosine_mrr@10": 0.7862047619047616, |
| "eval_dim_128_cosine_ndcg@10": 0.8096525901298283, |
| "eval_dim_128_cosine_precision@1": 0.6666666666666666, |
| "eval_dim_128_cosine_precision@10": 0.13906666666666667, |
| "eval_dim_128_cosine_precision@3": 0.37866666666666665, |
| "eval_dim_128_cosine_precision@5": 0.2541333333333334, |
| "eval_dim_128_cosine_recall@1": 0.5160666666666666, |
| "eval_dim_128_cosine_recall@10": 0.9604444444444443, |
| "eval_dim_128_cosine_recall@3": 0.8168666666666666, |
| "eval_dim_128_cosine_recall@5": 0.8936888888888889, |
| "eval_runtime": 5.8895, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 330 |
| }, |
| { |
| "epoch": 1.3001808318264014, |
| "grad_norm": 74.62581634521484, |
| "learning_rate": 2.588942307692308e-05, |
| "loss": 3.1504, |
| "step": 360 |
| }, |
| { |
| "epoch": 1.3001808318264014, |
| "eval_dim_128_cosine_accuracy@1": 0.6666666666666666, |
| "eval_dim_128_cosine_accuracy@10": 0.9826666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.8893333333333333, |
| "eval_dim_128_cosine_accuracy@5": 0.944, |
| "eval_dim_128_cosine_map@100": 0.7472361751978799, |
| "eval_dim_128_cosine_mrr@10": 0.7875534391534394, |
| "eval_dim_128_cosine_ndcg@10": 0.8104762567757343, |
| "eval_dim_128_cosine_precision@1": 0.6666666666666666, |
| "eval_dim_128_cosine_precision@10": 0.13853333333333334, |
| "eval_dim_128_cosine_precision@3": 0.376, |
| "eval_dim_128_cosine_precision@5": 0.25653333333333334, |
| "eval_dim_128_cosine_recall@1": 0.5127333333333333, |
| "eval_dim_128_cosine_recall@10": 0.9604444444444443, |
| "eval_dim_128_cosine_recall@3": 0.8135333333333334, |
| "eval_dim_128_cosine_recall@5": 0.8999555555555556, |
| "eval_runtime": 5.8631, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 360 |
| }, |
| { |
| "epoch": 1.4086799276672695, |
| "grad_norm": 149.5690460205078, |
| "learning_rate": 2.8052884615384615e-05, |
| "loss": 2.9297, |
| "step": 390 |
| }, |
| { |
| "epoch": 1.4086799276672695, |
| "eval_dim_128_cosine_accuracy@1": 0.6746666666666666, |
| "eval_dim_128_cosine_accuracy@10": 0.9813333333333333, |
| "eval_dim_128_cosine_accuracy@3": 0.896, |
| "eval_dim_128_cosine_accuracy@5": 0.9506666666666667, |
| "eval_dim_128_cosine_map@100": 0.7516192130669271, |
| "eval_dim_128_cosine_mrr@10": 0.7923793650793653, |
| "eval_dim_128_cosine_ndcg@10": 0.8126537462626181, |
| "eval_dim_128_cosine_precision@1": 0.6746666666666666, |
| "eval_dim_128_cosine_precision@10": 0.13720000000000002, |
| "eval_dim_128_cosine_precision@3": 0.3817777777777778, |
| "eval_dim_128_cosine_precision@5": 0.25573333333333337, |
| "eval_dim_128_cosine_recall@1": 0.5205111111111111, |
| "eval_dim_128_cosine_recall@10": 0.9572888888888887, |
| "eval_dim_128_cosine_recall@3": 0.8241999999999999, |
| "eval_dim_128_cosine_recall@5": 0.9023111111111112, |
| "eval_runtime": 5.9239, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 390 |
| }, |
| { |
| "epoch": 1.5171790235081373, |
| "grad_norm": 77.68611145019531, |
| "learning_rate": 2.999987977631899e-05, |
| "loss": 2.7076, |
| "step": 420 |
| }, |
| { |
| "epoch": 1.5171790235081373, |
| "eval_dim_128_cosine_accuracy@1": 0.6773333333333333, |
| "eval_dim_128_cosine_accuracy@10": 0.9866666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9093333333333333, |
| "eval_dim_128_cosine_accuracy@5": 0.9586666666666667, |
| "eval_dim_128_cosine_map@100": 0.7607381303631893, |
| "eval_dim_128_cosine_mrr@10": 0.7977820105820109, |
| "eval_dim_128_cosine_ndcg@10": 0.8228788330287194, |
| "eval_dim_128_cosine_precision@1": 0.6773333333333333, |
| "eval_dim_128_cosine_precision@10": 0.14013333333333333, |
| "eval_dim_128_cosine_precision@3": 0.3933333333333333, |
| "eval_dim_128_cosine_precision@5": 0.2605333333333333, |
| "eval_dim_128_cosine_recall@1": 0.5189555555555555, |
| "eval_dim_128_cosine_recall@10": 0.9710666666666666, |
| "eval_dim_128_cosine_recall@3": 0.8426, |
| "eval_dim_128_cosine_recall@5": 0.9168888888888889, |
| "eval_runtime": 5.8411, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 420 |
| }, |
| { |
| "epoch": 1.6256781193490055, |
| "grad_norm": 149.3487091064453, |
| "learning_rate": 2.9985455266321168e-05, |
| "loss": 2.7434, |
| "step": 450 |
| }, |
| { |
| "epoch": 1.6256781193490055, |
| "eval_dim_128_cosine_accuracy@1": 0.7253333333333334, |
| "eval_dim_128_cosine_accuracy@10": 0.98, |
| "eval_dim_128_cosine_accuracy@3": 0.9213333333333333, |
| "eval_dim_128_cosine_accuracy@5": 0.9533333333333334, |
| "eval_dim_128_cosine_map@100": 0.7918996036201115, |
| "eval_dim_128_cosine_mrr@10": 0.827068783068783, |
| "eval_dim_128_cosine_ndcg@10": 0.8451670078690116, |
| "eval_dim_128_cosine_precision@1": 0.7253333333333334, |
| "eval_dim_128_cosine_precision@10": 0.14039999999999997, |
| "eval_dim_128_cosine_precision@3": 0.3991111111111111, |
| "eval_dim_128_cosine_precision@5": 0.2616, |
| "eval_dim_128_cosine_recall@1": 0.5640666666666666, |
| "eval_dim_128_cosine_recall@10": 0.9688888888888888, |
| "eval_dim_128_cosine_recall@3": 0.8515333333333333, |
| "eval_dim_128_cosine_recall@5": 0.9150222222222222, |
| "eval_runtime": 5.9172, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 450 |
| }, |
| { |
| "epoch": 1.7341772151898733, |
| "grad_norm": 129.0013885498047, |
| "learning_rate": 2.9947012511648994e-05, |
| "loss": 2.561, |
| "step": 480 |
| }, |
| { |
| "epoch": 1.7341772151898733, |
| "eval_dim_128_cosine_accuracy@1": 0.7, |
| "eval_dim_128_cosine_accuracy@10": 0.9853333333333333, |
| "eval_dim_128_cosine_accuracy@3": 0.9226666666666666, |
| "eval_dim_128_cosine_accuracy@5": 0.9666666666666667, |
| "eval_dim_128_cosine_map@100": 0.7798379056680812, |
| "eval_dim_128_cosine_mrr@10": 0.8131269841269839, |
| "eval_dim_128_cosine_ndcg@10": 0.8357143575068176, |
| "eval_dim_128_cosine_precision@1": 0.7, |
| "eval_dim_128_cosine_precision@10": 0.1396, |
| "eval_dim_128_cosine_precision@3": 0.39777777777777784, |
| "eval_dim_128_cosine_precision@5": 0.26266666666666666, |
| "eval_dim_128_cosine_recall@1": 0.5453999999999999, |
| "eval_dim_128_cosine_recall@10": 0.9688888888888888, |
| "eval_dim_128_cosine_recall@3": 0.8552222222222223, |
| "eval_dim_128_cosine_recall@5": 0.9237777777777777, |
| "eval_runtime": 5.8367, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 480 |
| }, |
| { |
| "epoch": 1.8426763110307414, |
| "grad_norm": 98.29137420654297, |
| "learning_rate": 2.9884613127213148e-05, |
| "loss": 2.4285, |
| "step": 510 |
| }, |
| { |
| "epoch": 1.8426763110307414, |
| "eval_dim_128_cosine_accuracy@1": 0.7173333333333334, |
| "eval_dim_128_cosine_accuracy@10": 0.9893333333333333, |
| "eval_dim_128_cosine_accuracy@3": 0.9253333333333333, |
| "eval_dim_128_cosine_accuracy@5": 0.9626666666666667, |
| "eval_dim_128_cosine_map@100": 0.7901487513600632, |
| "eval_dim_128_cosine_mrr@10": 0.8236164021164017, |
| "eval_dim_128_cosine_ndcg@10": 0.8446030620508496, |
| "eval_dim_128_cosine_precision@1": 0.7173333333333334, |
| "eval_dim_128_cosine_precision@10": 0.14053333333333334, |
| "eval_dim_128_cosine_precision@3": 0.40444444444444444, |
| "eval_dim_128_cosine_precision@5": 0.26266666666666666, |
| "eval_dim_128_cosine_recall@1": 0.5585111111111111, |
| "eval_dim_128_cosine_recall@10": 0.9728888888888888, |
| "eval_dim_128_cosine_recall@3": 0.8621999999999999, |
| "eval_dim_128_cosine_recall@5": 0.9233333333333333, |
| "eval_runtime": 5.9196, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 510 |
| }, |
| { |
| "epoch": 1.9511754068716094, |
| "grad_norm": 102.39818572998047, |
| "learning_rate": 2.9798357124902243e-05, |
| "loss": 2.2157, |
| "step": 540 |
| }, |
| { |
| "epoch": 1.9511754068716094, |
| "eval_dim_128_cosine_accuracy@1": 0.716, |
| "eval_dim_128_cosine_accuracy@10": 0.9866666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.928, |
| "eval_dim_128_cosine_accuracy@5": 0.964, |
| "eval_dim_128_cosine_map@100": 0.7895278151389357, |
| "eval_dim_128_cosine_mrr@10": 0.822948677248677, |
| "eval_dim_128_cosine_ndcg@10": 0.8451188705806435, |
| "eval_dim_128_cosine_precision@1": 0.716, |
| "eval_dim_128_cosine_precision@10": 0.14173333333333332, |
| "eval_dim_128_cosine_precision@3": 0.40844444444444444, |
| "eval_dim_128_cosine_precision@5": 0.2669333333333333, |
| "eval_dim_128_cosine_recall@1": 0.5518444444444445, |
| "eval_dim_128_cosine_recall@10": 0.9757777777777776, |
| "eval_dim_128_cosine_recall@3": 0.8693111111111111, |
| "eval_dim_128_cosine_recall@5": 0.9298666666666665, |
| "eval_runtime": 5.8565, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 540 |
| }, |
| { |
| "epoch": 2.057866184448463, |
| "grad_norm": 114.18648529052734, |
| "learning_rate": 2.968838275328673e-05, |
| "loss": 1.8836, |
| "step": 570 |
| }, |
| { |
| "epoch": 2.057866184448463, |
| "eval_dim_128_cosine_accuracy@1": 0.7266666666666667, |
| "eval_dim_128_cosine_accuracy@10": 0.9933333333333333, |
| "eval_dim_128_cosine_accuracy@3": 0.924, |
| "eval_dim_128_cosine_accuracy@5": 0.968, |
| "eval_dim_128_cosine_map@100": 0.8022806987141972, |
| "eval_dim_128_cosine_mrr@10": 0.8310841269841268, |
| "eval_dim_128_cosine_ndcg@10": 0.8545511025815758, |
| "eval_dim_128_cosine_precision@1": 0.7266666666666667, |
| "eval_dim_128_cosine_precision@10": 0.142, |
| "eval_dim_128_cosine_precision@3": 0.40977777777777774, |
| "eval_dim_128_cosine_precision@5": 0.2688, |
| "eval_dim_128_cosine_recall@1": 0.5671777777777778, |
| "eval_dim_128_cosine_recall@10": 0.9802222222222222, |
| "eval_dim_128_cosine_recall@3": 0.8701111111111111, |
| "eval_dim_128_cosine_recall@5": 0.9343111111111111, |
| "eval_runtime": 5.9035, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 570 |
| }, |
| { |
| "epoch": 2.1663652802893307, |
| "grad_norm": 157.45529174804688, |
| "learning_rate": 2.9554866276038176e-05, |
| "loss": 1.5806, |
| "step": 600 |
| }, |
| { |
| "epoch": 2.1663652802893307, |
| "eval_dim_128_cosine_accuracy@1": 0.728, |
| "eval_dim_128_cosine_accuracy@10": 0.984, |
| "eval_dim_128_cosine_accuracy@3": 0.928, |
| "eval_dim_128_cosine_accuracy@5": 0.9653333333333334, |
| "eval_dim_128_cosine_map@100": 0.8019827061342573, |
| "eval_dim_128_cosine_mrr@10": 0.8315973544973544, |
| "eval_dim_128_cosine_ndcg@10": 0.8517054457768715, |
| "eval_dim_128_cosine_precision@1": 0.728, |
| "eval_dim_128_cosine_precision@10": 0.14040000000000002, |
| "eval_dim_128_cosine_precision@3": 0.40977777777777774, |
| "eval_dim_128_cosine_precision@5": 0.2674666666666667, |
| "eval_dim_128_cosine_recall@1": 0.5694, |
| "eval_dim_128_cosine_recall@10": 0.9686666666666667, |
| "eval_dim_128_cosine_recall@3": 0.873, |
| "eval_dim_128_cosine_recall@5": 0.9314666666666666, |
| "eval_runtime": 5.8543, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 600 |
| }, |
| { |
| "epoch": 2.274864376130199, |
| "grad_norm": 105.01947021484375, |
| "learning_rate": 2.939802168941907e-05, |
| "loss": 1.445, |
| "step": 630 |
| }, |
| { |
| "epoch": 2.274864376130199, |
| "eval_dim_128_cosine_accuracy@1": 0.7466666666666667, |
| "eval_dim_128_cosine_accuracy@10": 0.9893333333333333, |
| "eval_dim_128_cosine_accuracy@3": 0.924, |
| "eval_dim_128_cosine_accuracy@5": 0.9706666666666667, |
| "eval_dim_128_cosine_map@100": 0.8131376123034114, |
| "eval_dim_128_cosine_mrr@10": 0.8407142857142856, |
| "eval_dim_128_cosine_ndcg@10": 0.8616407300458768, |
| "eval_dim_128_cosine_precision@1": 0.7466666666666667, |
| "eval_dim_128_cosine_precision@10": 0.14186666666666667, |
| "eval_dim_128_cosine_precision@3": 0.4111111111111111, |
| "eval_dim_128_cosine_precision@5": 0.2698666666666667, |
| "eval_dim_128_cosine_recall@1": 0.5811777777777778, |
| "eval_dim_128_cosine_recall@10": 0.9777777777777776, |
| "eval_dim_128_cosine_recall@3": 0.8699777777777778, |
| "eval_dim_128_cosine_recall@5": 0.9408888888888889, |
| "eval_runtime": 5.921, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 630 |
| }, |
| { |
| "epoch": 2.383363471971067, |
| "grad_norm": 68.85010528564453, |
| "learning_rate": 2.9218100379295923e-05, |
| "loss": 1.5858, |
| "step": 660 |
| }, |
| { |
| "epoch": 2.383363471971067, |
| "eval_dim_128_cosine_accuracy@1": 0.7733333333333333, |
| "eval_dim_128_cosine_accuracy@10": 0.9946666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.94, |
| "eval_dim_128_cosine_accuracy@5": 0.972, |
| "eval_dim_128_cosine_map@100": 0.8283586079505401, |
| "eval_dim_128_cosine_mrr@10": 0.8597894179894175, |
| "eval_dim_128_cosine_ndcg@10": 0.8753614537588903, |
| "eval_dim_128_cosine_precision@1": 0.7733333333333333, |
| "eval_dim_128_cosine_precision@10": 0.1424, |
| "eval_dim_128_cosine_precision@3": 0.41333333333333333, |
| "eval_dim_128_cosine_precision@5": 0.2730666666666666, |
| "eval_dim_128_cosine_recall@1": 0.6040666666666666, |
| "eval_dim_128_cosine_recall@10": 0.982888888888889, |
| "eval_dim_128_cosine_recall@3": 0.8804222222222221, |
| "eval_dim_128_cosine_recall@5": 0.9466666666666667, |
| "eval_runtime": 5.8572, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 660 |
| }, |
| { |
| "epoch": 2.491862567811935, |
| "grad_norm": 61.46901321411133, |
| "learning_rate": 2.9015390718225446e-05, |
| "loss": 1.7178, |
| "step": 690 |
| }, |
| { |
| "epoch": 2.491862567811935, |
| "eval_dim_128_cosine_accuracy@1": 0.7653333333333333, |
| "eval_dim_128_cosine_accuracy@10": 0.988, |
| "eval_dim_128_cosine_accuracy@3": 0.9426666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.964, |
| "eval_dim_128_cosine_map@100": 0.8242631913306179, |
| "eval_dim_128_cosine_mrr@10": 0.8544089947089946, |
| "eval_dim_128_cosine_ndcg@10": 0.8708043529651647, |
| "eval_dim_128_cosine_precision@1": 0.7653333333333333, |
| "eval_dim_128_cosine_precision@10": 0.14186666666666667, |
| "eval_dim_128_cosine_precision@3": 0.4151111111111111, |
| "eval_dim_128_cosine_precision@5": 0.2736, |
| "eval_dim_128_cosine_recall@1": 0.5971777777777778, |
| "eval_dim_128_cosine_recall@10": 0.9775555555555555, |
| "eval_dim_128_cosine_recall@3": 0.8844222222222223, |
| "eval_dim_128_cosine_recall@5": 0.9435555555555555, |
| "eval_runtime": 5.9148, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 690 |
| }, |
| { |
| "epoch": 2.600361663652803, |
| "grad_norm": 113.0821762084961, |
| "learning_rate": 2.8790217603259553e-05, |
| "loss": 2.048, |
| "step": 720 |
| }, |
| { |
| "epoch": 2.600361663652803, |
| "eval_dim_128_cosine_accuracy@1": 0.756, |
| "eval_dim_128_cosine_accuracy@10": 0.9906666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9373333333333334, |
| "eval_dim_128_cosine_accuracy@5": 0.9706666666666667, |
| "eval_dim_128_cosine_map@100": 0.8205536584233583, |
| "eval_dim_128_cosine_mrr@10": 0.8498878306878302, |
| "eval_dim_128_cosine_ndcg@10": 0.8682644499293225, |
| "eval_dim_128_cosine_precision@1": 0.756, |
| "eval_dim_128_cosine_precision@10": 0.142, |
| "eval_dim_128_cosine_precision@3": 0.416, |
| "eval_dim_128_cosine_precision@5": 0.2712, |
| "eval_dim_128_cosine_recall@1": 0.5851777777777778, |
| "eval_dim_128_cosine_recall@10": 0.9802222222222222, |
| "eval_dim_128_cosine_recall@3": 0.8835333333333333, |
| "eval_dim_128_cosine_recall@5": 0.9428888888888889, |
| "eval_runtime": 5.857, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 720 |
| }, |
| { |
| "epoch": 2.708860759493671, |
| "grad_norm": 98.30645751953125, |
| "learning_rate": 2.854294193520993e-05, |
| "loss": 1.9854, |
| "step": 750 |
| }, |
| { |
| "epoch": 2.708860759493671, |
| "eval_dim_128_cosine_accuracy@1": 0.7506666666666667, |
| "eval_dim_128_cosine_accuracy@10": 0.9906666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.94, |
| "eval_dim_128_cosine_accuracy@5": 0.9733333333333334, |
| "eval_dim_128_cosine_map@100": 0.8200211459278023, |
| "eval_dim_128_cosine_mrr@10": 0.847684126984127, |
| "eval_dim_128_cosine_ndcg@10": 0.8690218305880909, |
| "eval_dim_128_cosine_precision@1": 0.7506666666666667, |
| "eval_dim_128_cosine_precision@10": 0.14293333333333333, |
| "eval_dim_128_cosine_precision@3": 0.41422222222222216, |
| "eval_dim_128_cosine_precision@5": 0.2728, |
| "eval_dim_128_cosine_recall@1": 0.5834, |
| "eval_dim_128_cosine_recall@10": 0.9842222222222222, |
| "eval_dim_128_cosine_recall@3": 0.8848666666666667, |
| "eval_dim_128_cosine_recall@5": 0.949911111111111, |
| "eval_runtime": 5.9276, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 750 |
| }, |
| { |
| "epoch": 2.817359855334539, |
| "grad_norm": 99.96898651123047, |
| "learning_rate": 2.8273960040206944e-05, |
| "loss": 1.7509, |
| "step": 780 |
| }, |
| { |
| "epoch": 2.817359855334539, |
| "eval_dim_128_cosine_accuracy@1": 0.768, |
| "eval_dim_128_cosine_accuracy@10": 0.9933333333333333, |
| "eval_dim_128_cosine_accuracy@3": 0.928, |
| "eval_dim_128_cosine_accuracy@5": 0.9666666666666667, |
| "eval_dim_128_cosine_map@100": 0.8265327684080097, |
| "eval_dim_128_cosine_mrr@10": 0.8537306878306878, |
| "eval_dim_128_cosine_ndcg@10": 0.874434076175117, |
| "eval_dim_128_cosine_precision@1": 0.768, |
| "eval_dim_128_cosine_precision@10": 0.1436, |
| "eval_dim_128_cosine_precision@3": 0.4164444444444445, |
| "eval_dim_128_cosine_precision@5": 0.2717333333333333, |
| "eval_dim_128_cosine_recall@1": 0.5962888888888889, |
| "eval_dim_128_cosine_recall@10": 0.988, |
| "eval_dim_128_cosine_recall@3": 0.8801999999999999, |
| "eval_dim_128_cosine_recall@5": 0.9417777777777778, |
| "eval_runtime": 5.8618, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 780 |
| }, |
| { |
| "epoch": 2.9258589511754067, |
| "grad_norm": 51.06462860107422, |
| "learning_rate": 2.7983703034479776e-05, |
| "loss": 1.7643, |
| "step": 810 |
| }, |
| { |
| "epoch": 2.9258589511754067, |
| "eval_dim_128_cosine_accuracy@1": 0.768, |
| "eval_dim_128_cosine_accuracy@10": 0.9933333333333333, |
| "eval_dim_128_cosine_accuracy@3": 0.944, |
| "eval_dim_128_cosine_accuracy@5": 0.9786666666666667, |
| "eval_dim_128_cosine_map@100": 0.8314260359016753, |
| "eval_dim_128_cosine_mrr@10": 0.8591624338624337, |
| "eval_dim_128_cosine_ndcg@10": 0.878068113915343, |
| "eval_dim_128_cosine_precision@1": 0.768, |
| "eval_dim_128_cosine_precision@10": 0.14306666666666668, |
| "eval_dim_128_cosine_precision@3": 0.42177777777777775, |
| "eval_dim_128_cosine_precision@5": 0.27386666666666665, |
| "eval_dim_128_cosine_recall@1": 0.5998444444444444, |
| "eval_dim_128_cosine_recall@10": 0.9864444444444445, |
| "eval_dim_128_cosine_recall@3": 0.8922000000000001, |
| "eval_dim_128_cosine_recall@5": 0.9524888888888889, |
| "eval_runtime": 5.8979, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 810 |
| }, |
| { |
| "epoch": 3.0325497287522603, |
| "grad_norm": 18.758848190307617, |
| "learning_rate": 2.7672636133376114e-05, |
| "loss": 1.3132, |
| "step": 840 |
| }, |
| { |
| "epoch": 3.0325497287522603, |
| "eval_dim_128_cosine_accuracy@1": 0.7866666666666666, |
| "eval_dim_128_cosine_accuracy@10": 0.996, |
| "eval_dim_128_cosine_accuracy@3": 0.9466666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.98, |
| "eval_dim_128_cosine_map@100": 0.8412958111680221, |
| "eval_dim_128_cosine_mrr@10": 0.8707105820105822, |
| "eval_dim_128_cosine_ndcg@10": 0.8870114277280254, |
| "eval_dim_128_cosine_precision@1": 0.7866666666666666, |
| "eval_dim_128_cosine_precision@10": 0.14373333333333335, |
| "eval_dim_128_cosine_precision@3": 0.4191111111111111, |
| "eval_dim_128_cosine_precision@5": 0.27413333333333334, |
| "eval_dim_128_cosine_recall@1": 0.6145111111111111, |
| "eval_dim_128_cosine_recall@10": 0.9906666666666667, |
| "eval_dim_128_cosine_recall@3": 0.8904222222222223, |
| "eval_dim_128_cosine_recall@5": 0.9553777777777778, |
| "eval_runtime": 5.8715, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 840 |
| }, |
| { |
| "epoch": 3.1410488245931285, |
| "grad_norm": 80.79166412353516, |
| "learning_rate": 2.7341257905728747e-05, |
| "loss": 1.4164, |
| "step": 870 |
| }, |
| { |
| "epoch": 3.1410488245931285, |
| "eval_dim_128_cosine_accuracy@1": 0.788, |
| "eval_dim_128_cosine_accuracy@10": 0.9933333333333333, |
| "eval_dim_128_cosine_accuracy@3": 0.952, |
| "eval_dim_128_cosine_accuracy@5": 0.9773333333333334, |
| "eval_dim_128_cosine_map@100": 0.8411563326962374, |
| "eval_dim_128_cosine_mrr@10": 0.870403174603175, |
| "eval_dim_128_cosine_ndcg@10": 0.8855805978335399, |
| "eval_dim_128_cosine_precision@1": 0.788, |
| "eval_dim_128_cosine_precision@10": 0.14333333333333334, |
| "eval_dim_128_cosine_precision@3": 0.4271111111111111, |
| "eval_dim_128_cosine_precision@5": 0.27466666666666667, |
| "eval_dim_128_cosine_recall@1": 0.6171777777777777, |
| "eval_dim_128_cosine_recall@10": 0.9866666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9044222222222221, |
| "eval_dim_128_cosine_recall@5": 0.9522222222222222, |
| "eval_runtime": 5.9114, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 870 |
| }, |
| { |
| "epoch": 3.2495479204339963, |
| "grad_norm": 50.864532470703125, |
| "learning_rate": 2.699009947476415e-05, |
| "loss": 1.3193, |
| "step": 900 |
| }, |
| { |
| "epoch": 3.2495479204339963, |
| "eval_dim_128_cosine_accuracy@1": 0.7866666666666666, |
| "eval_dim_128_cosine_accuracy@10": 0.992, |
| "eval_dim_128_cosine_accuracy@3": 0.944, |
| "eval_dim_128_cosine_accuracy@5": 0.9773333333333334, |
| "eval_dim_128_cosine_map@100": 0.8446231563231562, |
| "eval_dim_128_cosine_mrr@10": 0.8705698412698413, |
| "eval_dim_128_cosine_ndcg@10": 0.8869909648496189, |
| "eval_dim_128_cosine_precision@1": 0.7866666666666666, |
| "eval_dim_128_cosine_precision@10": 0.14293333333333333, |
| "eval_dim_128_cosine_precision@3": 0.42222222222222217, |
| "eval_dim_128_cosine_precision@5": 0.27386666666666665, |
| "eval_dim_128_cosine_recall@1": 0.6171777777777777, |
| "eval_dim_128_cosine_recall@10": 0.9848888888888888, |
| "eval_dim_128_cosine_recall@3": 0.8959777777777778, |
| "eval_dim_128_cosine_recall@5": 0.9530222222222222, |
| "eval_runtime": 5.8599, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 900 |
| }, |
| { |
| "epoch": 3.358047016274864, |
| "grad_norm": 145.7331085205078, |
| "learning_rate": 2.661972366683391e-05, |
| "loss": 1.176, |
| "step": 930 |
| }, |
| { |
| "epoch": 3.358047016274864, |
| "eval_dim_128_cosine_accuracy@1": 0.8053333333333333, |
| "eval_dim_128_cosine_accuracy@10": 1.0, |
| "eval_dim_128_cosine_accuracy@3": 0.9546666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.9826666666666667, |
| "eval_dim_128_cosine_map@100": 0.8539686133219344, |
| "eval_dim_128_cosine_mrr@10": 0.884364021164021, |
| "eval_dim_128_cosine_ndcg@10": 0.8973335428451416, |
| "eval_dim_128_cosine_precision@1": 0.8053333333333333, |
| "eval_dim_128_cosine_precision@10": 0.14346666666666666, |
| "eval_dim_128_cosine_precision@3": 0.4248888888888888, |
| "eval_dim_128_cosine_precision@5": 0.27440000000000003, |
| "eval_dim_128_cosine_recall@1": 0.6334, |
| "eval_dim_128_cosine_recall@10": 0.9922666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9046000000000001, |
| "eval_dim_128_cosine_recall@5": 0.9575555555555555, |
| "eval_runtime": 5.9155, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 930 |
| }, |
| { |
| "epoch": 3.4665461121157324, |
| "grad_norm": 88.42583465576172, |
| "learning_rate": 2.6230724109333277e-05, |
| "loss": 1.1743, |
| "step": 960 |
| }, |
| { |
| "epoch": 3.4665461121157324, |
| "eval_dim_128_cosine_accuracy@1": 0.7866666666666666, |
| "eval_dim_128_cosine_accuracy@10": 1.0, |
| "eval_dim_128_cosine_accuracy@3": 0.964, |
| "eval_dim_128_cosine_accuracy@5": 0.984, |
| "eval_dim_128_cosine_map@100": 0.8529430216321521, |
| "eval_dim_128_cosine_mrr@10": 0.8761714285714284, |
| "eval_dim_128_cosine_ndcg@10": 0.8947015547083503, |
| "eval_dim_128_cosine_precision@1": 0.7866666666666666, |
| "eval_dim_128_cosine_precision@10": 0.14373333333333335, |
| "eval_dim_128_cosine_precision@3": 0.43377777777777776, |
| "eval_dim_128_cosine_precision@5": 0.27813333333333334, |
| "eval_dim_128_cosine_recall@1": 0.6160666666666667, |
| "eval_dim_128_cosine_recall@10": 0.9922222222222221, |
| "eval_dim_128_cosine_recall@3": 0.9190888888888888, |
| "eval_dim_128_cosine_recall@5": 0.9650666666666667, |
| "eval_runtime": 5.8593, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 960 |
| }, |
| { |
| "epoch": 3.5750452079566006, |
| "grad_norm": 64.10489654541016, |
| "learning_rate": 2.582372427925272e-05, |
| "loss": 1.0814, |
| "step": 990 |
| }, |
| { |
| "epoch": 3.5750452079566006, |
| "eval_dim_128_cosine_accuracy@1": 0.7946666666666666, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9586666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.976, |
| "eval_dim_128_cosine_map@100": 0.8514501038108632, |
| "eval_dim_128_cosine_mrr@10": 0.8771179894179892, |
| "eval_dim_128_cosine_ndcg@10": 0.8950774953185786, |
| "eval_dim_128_cosine_precision@1": 0.7946666666666666, |
| "eval_dim_128_cosine_precision@10": 0.14453333333333335, |
| "eval_dim_128_cosine_precision@3": 0.4297777777777778, |
| "eval_dim_128_cosine_precision@5": 0.2749333333333333, |
| "eval_dim_128_cosine_recall@1": 0.6240666666666667, |
| "eval_dim_128_cosine_recall@10": 0.9955555555555555, |
| "eval_dim_128_cosine_recall@3": 0.9095333333333333, |
| "eval_dim_128_cosine_recall@5": 0.9528888888888888, |
| "eval_runtime": 5.9107, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 990 |
| }, |
| { |
| "epoch": 3.6835443037974684, |
| "grad_norm": 101.1521224975586, |
| "learning_rate": 2.539937650388744e-05, |
| "loss": 1.0118, |
| "step": 1020 |
| }, |
| { |
| "epoch": 3.6835443037974684, |
| "eval_dim_128_cosine_accuracy@1": 0.816, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.956, |
| "eval_dim_128_cosine_accuracy@5": 0.98, |
| "eval_dim_128_cosine_map@100": 0.8649572895059165, |
| "eval_dim_128_cosine_mrr@10": 0.8898989417989419, |
| "eval_dim_128_cosine_ndcg@10": 0.9050620003654972, |
| "eval_dim_128_cosine_precision@1": 0.816, |
| "eval_dim_128_cosine_precision@10": 0.14453333333333335, |
| "eval_dim_128_cosine_precision@3": 0.4302222222222222, |
| "eval_dim_128_cosine_precision@5": 0.2768, |
| "eval_dim_128_cosine_recall@1": 0.6442888888888889, |
| "eval_dim_128_cosine_recall@10": 0.9953333333333333, |
| "eval_dim_128_cosine_recall@3": 0.9124222222222221, |
| "eval_dim_128_cosine_recall@5": 0.9590666666666666, |
| "eval_runtime": 5.8571, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1020 |
| }, |
| { |
| "epoch": 3.7920433996383363, |
| "grad_norm": 116.06410217285156, |
| "learning_rate": 2.495836091530647e-05, |
| "loss": 1.5867, |
| "step": 1050 |
| }, |
| { |
| "epoch": 3.7920433996383363, |
| "eval_dim_128_cosine_accuracy@1": 0.8253333333333334, |
| "eval_dim_128_cosine_accuracy@10": 0.996, |
| "eval_dim_128_cosine_accuracy@3": 0.96, |
| "eval_dim_128_cosine_accuracy@5": 0.9853333333333333, |
| "eval_dim_128_cosine_map@100": 0.8711365192509459, |
| "eval_dim_128_cosine_mrr@10": 0.896352380952381, |
| "eval_dim_128_cosine_ndcg@10": 0.9089495143919033, |
| "eval_dim_128_cosine_precision@1": 0.8253333333333334, |
| "eval_dim_128_cosine_precision@10": 0.14426666666666668, |
| "eval_dim_128_cosine_precision@3": 0.4342222222222222, |
| "eval_dim_128_cosine_precision@5": 0.27973333333333333, |
| "eval_dim_128_cosine_recall@1": 0.6511777777777777, |
| "eval_dim_128_cosine_recall@10": 0.9926666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9175333333333333, |
| "eval_dim_128_cosine_recall@5": 0.967288888888889, |
| "eval_runtime": 5.9014, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1050 |
| }, |
| { |
| "epoch": 3.900542495479204, |
| "grad_norm": 143.17178344726562, |
| "learning_rate": 2.4501384360257114e-05, |
| "loss": 1.4378, |
| "step": 1080 |
| }, |
| { |
| "epoch": 3.900542495479204, |
| "eval_dim_128_cosine_accuracy@1": 0.8186666666666667, |
| "eval_dim_128_cosine_accuracy@10": 0.9973333333333333, |
| "eval_dim_128_cosine_accuracy@3": 0.9613333333333334, |
| "eval_dim_128_cosine_accuracy@5": 0.9826666666666667, |
| "eval_dim_128_cosine_map@100": 0.8726542441361317, |
| "eval_dim_128_cosine_mrr@10": 0.8923920634920633, |
| "eval_dim_128_cosine_ndcg@10": 0.9091914677425283, |
| "eval_dim_128_cosine_precision@1": 0.8186666666666667, |
| "eval_dim_128_cosine_precision@10": 0.14413333333333334, |
| "eval_dim_128_cosine_precision@3": 0.4368888888888888, |
| "eval_dim_128_cosine_precision@5": 0.27759999999999996, |
| "eval_dim_128_cosine_recall@1": 0.6500666666666666, |
| "eval_dim_128_cosine_recall@10": 0.9930666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9250888888888888, |
| "eval_dim_128_cosine_recall@5": 0.964488888888889, |
| "eval_runtime": 5.8787, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1080 |
| }, |
| { |
| "epoch": 4.007233273056058, |
| "grad_norm": 74.21490478515625, |
| "learning_rate": 2.4029179267251854e-05, |
| "loss": 1.0735, |
| "step": 1110 |
| }, |
| { |
| "epoch": 4.007233273056058, |
| "eval_dim_128_cosine_accuracy@1": 0.82, |
| "eval_dim_128_cosine_accuracy@10": 0.996, |
| "eval_dim_128_cosine_accuracy@3": 0.964, |
| "eval_dim_128_cosine_accuracy@5": 0.984, |
| "eval_dim_128_cosine_map@100": 0.8692189085634471, |
| "eval_dim_128_cosine_mrr@10": 0.8922269841269843, |
| "eval_dim_128_cosine_ndcg@10": 0.9065950434274719, |
| "eval_dim_128_cosine_precision@1": 0.82, |
| "eval_dim_128_cosine_precision@10": 0.14386666666666667, |
| "eval_dim_128_cosine_precision@3": 0.43377777777777776, |
| "eval_dim_128_cosine_precision@5": 0.2789333333333333, |
| "eval_dim_128_cosine_recall@1": 0.6465111111111111, |
| "eval_dim_128_cosine_recall@10": 0.9915555555555555, |
| "eval_dim_128_cosine_recall@3": 0.9202, |
| "eval_dim_128_cosine_recall@5": 0.9662222222222222, |
| "eval_runtime": 5.9229, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1110 |
| }, |
| { |
| "epoch": 4.115732368896926, |
| "grad_norm": 49.57156753540039, |
| "learning_rate": 2.35425024726536e-05, |
| "loss": 0.8998, |
| "step": 1140 |
| }, |
| { |
| "epoch": 4.115732368896926, |
| "eval_dim_128_cosine_accuracy@1": 0.8173333333333334, |
| "eval_dim_128_cosine_accuracy@10": 0.996, |
| "eval_dim_128_cosine_accuracy@3": 0.9733333333333334, |
| "eval_dim_128_cosine_accuracy@5": 0.9813333333333333, |
| "eval_dim_128_cosine_map@100": 0.8711656472503531, |
| "eval_dim_128_cosine_mrr@10": 0.8947767195767194, |
| "eval_dim_128_cosine_ndcg@10": 0.9089196083999468, |
| "eval_dim_128_cosine_precision@1": 0.8173333333333334, |
| "eval_dim_128_cosine_precision@10": 0.14440000000000003, |
| "eval_dim_128_cosine_precision@3": 0.4382222222222222, |
| "eval_dim_128_cosine_precision@5": 0.27813333333333334, |
| "eval_dim_128_cosine_recall@1": 0.6416222222222222, |
| "eval_dim_128_cosine_recall@10": 0.9933333333333333, |
| "eval_dim_128_cosine_recall@3": 0.9297555555555557, |
| "eval_dim_128_cosine_recall@5": 0.9626222222222223, |
| "eval_runtime": 5.8566, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1140 |
| }, |
| { |
| "epoch": 4.224231464737794, |
| "grad_norm": 13.371626853942871, |
| "learning_rate": 2.3042134007640726e-05, |
| "loss": 0.9332, |
| "step": 1170 |
| }, |
| { |
| "epoch": 4.224231464737794, |
| "eval_dim_128_cosine_accuracy@1": 0.82, |
| "eval_dim_128_cosine_accuracy@10": 0.9973333333333333, |
| "eval_dim_128_cosine_accuracy@3": 0.972, |
| "eval_dim_128_cosine_accuracy@5": 0.9893333333333333, |
| "eval_dim_128_cosine_map@100": 0.874401100163824, |
| "eval_dim_128_cosine_mrr@10": 0.8957015873015872, |
| "eval_dim_128_cosine_ndcg@10": 0.909966755276973, |
| "eval_dim_128_cosine_precision@1": 0.82, |
| "eval_dim_128_cosine_precision@10": 0.1436, |
| "eval_dim_128_cosine_precision@3": 0.44177777777777777, |
| "eval_dim_128_cosine_precision@5": 0.2789333333333333, |
| "eval_dim_128_cosine_recall@1": 0.6458444444444444, |
| "eval_dim_128_cosine_recall@10": 0.9910222222222222, |
| "eval_dim_128_cosine_recall@3": 0.9333111111111111, |
| "eval_dim_128_cosine_recall@5": 0.9689333333333334, |
| "eval_runtime": 5.9323, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1170 |
| }, |
| { |
| "epoch": 4.3327305605786615, |
| "grad_norm": 71.3949203491211, |
| "learning_rate": 2.2528875847996185e-05, |
| "loss": 1.2196, |
| "step": 1200 |
| }, |
| { |
| "epoch": 4.3327305605786615, |
| "eval_dim_128_cosine_accuracy@1": 0.832, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9666666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.9866666666666667, |
| "eval_dim_128_cosine_map@100": 0.8747604252469021, |
| "eval_dim_128_cosine_mrr@10": 0.9006603174603176, |
| "eval_dim_128_cosine_ndcg@10": 0.9123266488922879, |
| "eval_dim_128_cosine_precision@1": 0.832, |
| "eval_dim_128_cosine_precision@10": 0.14453333333333335, |
| "eval_dim_128_cosine_precision@3": 0.4368888888888888, |
| "eval_dim_128_cosine_precision@5": 0.27973333333333333, |
| "eval_dim_128_cosine_recall@1": 0.6529555555555555, |
| "eval_dim_128_cosine_recall@10": 0.9953333333333333, |
| "eval_dim_128_cosine_recall@3": 0.9234888888888889, |
| "eval_dim_128_cosine_recall@5": 0.9683999999999999, |
| "eval_runtime": 5.8551, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1200 |
| }, |
| { |
| "epoch": 4.44122965641953, |
| "grad_norm": 16.15557861328125, |
| "learning_rate": 2.2003550628724412e-05, |
| "loss": 1.08, |
| "step": 1230 |
| }, |
| { |
| "epoch": 4.44122965641953, |
| "eval_dim_128_cosine_accuracy@1": 0.828, |
| "eval_dim_128_cosine_accuracy@10": 0.9973333333333333, |
| "eval_dim_128_cosine_accuracy@3": 0.9666666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.984, |
| "eval_dim_128_cosine_map@100": 0.8721032465646191, |
| "eval_dim_128_cosine_mrr@10": 0.8996158730158732, |
| "eval_dim_128_cosine_ndcg@10": 0.9104449932070232, |
| "eval_dim_128_cosine_precision@1": 0.828, |
| "eval_dim_128_cosine_precision@10": 0.14426666666666668, |
| "eval_dim_128_cosine_precision@3": 0.432, |
| "eval_dim_128_cosine_precision@5": 0.27813333333333334, |
| "eval_dim_128_cosine_recall@1": 0.6500666666666666, |
| "eval_dim_128_cosine_recall@10": 0.9933333333333333, |
| "eval_dim_128_cosine_recall@3": 0.9179333333333333, |
| "eval_dim_128_cosine_recall@5": 0.9643555555555555, |
| "eval_runtime": 5.9293, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1230 |
| }, |
| { |
| "epoch": 4.549728752260398, |
| "grad_norm": 69.02749633789062, |
| "learning_rate": 2.146700032555626e-05, |
| "loss": 1.0907, |
| "step": 1260 |
| }, |
| { |
| "epoch": 4.549728752260398, |
| "eval_dim_128_cosine_accuracy@1": 0.816, |
| "eval_dim_128_cosine_accuracy@10": 0.996, |
| "eval_dim_128_cosine_accuracy@3": 0.9733333333333334, |
| "eval_dim_128_cosine_accuracy@5": 0.9906666666666667, |
| "eval_dim_128_cosine_map@100": 0.8666906865356865, |
| "eval_dim_128_cosine_mrr@10": 0.8953608465608466, |
| "eval_dim_128_cosine_ndcg@10": 0.905665835237036, |
| "eval_dim_128_cosine_precision@1": 0.816, |
| "eval_dim_128_cosine_precision@10": 0.14359999999999998, |
| "eval_dim_128_cosine_precision@3": 0.43333333333333335, |
| "eval_dim_128_cosine_precision@5": 0.27786666666666665, |
| "eval_dim_128_cosine_recall@1": 0.6416222222222223, |
| "eval_dim_128_cosine_recall@10": 0.9897333333333332, |
| "eval_dim_128_cosine_recall@3": 0.9204222222222221, |
| "eval_dim_128_cosine_recall@5": 0.9659111111111112, |
| "eval_runtime": 5.8724, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1260 |
| }, |
| { |
| "epoch": 4.658227848101266, |
| "grad_norm": 97.21315002441406, |
| "learning_rate": 2.0920084905455194e-05, |
| "loss": 0.8068, |
| "step": 1290 |
| }, |
| { |
| "epoch": 4.658227848101266, |
| "eval_dim_128_cosine_accuracy@1": 0.8266666666666667, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9706666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.9866666666666667, |
| "eval_dim_128_cosine_map@100": 0.8721192061533238, |
| "eval_dim_128_cosine_mrr@10": 0.899405291005291, |
| "eval_dim_128_cosine_ndcg@10": 0.9098783995730497, |
| "eval_dim_128_cosine_precision@1": 0.8266666666666667, |
| "eval_dim_128_cosine_precision@10": 0.14373333333333335, |
| "eval_dim_128_cosine_precision@3": 0.4311111111111111, |
| "eval_dim_128_cosine_precision@5": 0.27786666666666665, |
| "eval_dim_128_cosine_recall@1": 0.6538444444444445, |
| "eval_dim_128_cosine_recall@10": 0.9917333333333332, |
| "eval_dim_128_cosine_recall@3": 0.9179333333333334, |
| "eval_dim_128_cosine_recall@5": 0.9646666666666667, |
| "eval_runtime": 5.938, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1290 |
| }, |
| { |
| "epoch": 4.766726943942134, |
| "grad_norm": 45.7645378112793, |
| "learning_rate": 2.036368094828768e-05, |
| "loss": 1.1293, |
| "step": 1320 |
| }, |
| { |
| "epoch": 4.766726943942134, |
| "eval_dim_128_cosine_accuracy@1": 0.8293333333333334, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.968, |
| "eval_dim_128_cosine_accuracy@5": 0.988, |
| "eval_dim_128_cosine_map@100": 0.8743681096681096, |
| "eval_dim_128_cosine_mrr@10": 0.9005476190476192, |
| "eval_dim_128_cosine_ndcg@10": 0.9115179029699592, |
| "eval_dim_128_cosine_precision@1": 0.8293333333333334, |
| "eval_dim_128_cosine_precision@10": 0.144, |
| "eval_dim_128_cosine_precision@3": 0.4302222222222222, |
| "eval_dim_128_cosine_precision@5": 0.27973333333333333, |
| "eval_dim_128_cosine_recall@1": 0.6571777777777777, |
| "eval_dim_128_cosine_recall@10": 0.9926666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9148666666666668, |
| "eval_dim_128_cosine_recall@5": 0.9677333333333332, |
| "eval_runtime": 5.8634, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1320 |
| }, |
| { |
| "epoch": 4.875226039783001, |
| "grad_norm": 50.95180892944336, |
| "learning_rate": 1.979868024186686e-05, |
| "loss": 0.8142, |
| "step": 1350 |
| }, |
| { |
| "epoch": 4.875226039783001, |
| "eval_dim_128_cosine_accuracy@1": 0.8493333333333334, |
| "eval_dim_128_cosine_accuracy@10": 1.0, |
| "eval_dim_128_cosine_accuracy@3": 0.9746666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.992, |
| "eval_dim_128_cosine_map@100": 0.8879302955000233, |
| "eval_dim_128_cosine_mrr@10": 0.9139608465608466, |
| "eval_dim_128_cosine_ndcg@10": 0.9228500530144886, |
| "eval_dim_128_cosine_precision@1": 0.8493333333333334, |
| "eval_dim_128_cosine_precision@10": 0.14466666666666667, |
| "eval_dim_128_cosine_precision@3": 0.4364444444444444, |
| "eval_dim_128_cosine_precision@5": 0.2805333333333333, |
| "eval_dim_128_cosine_recall@1": 0.6725111111111111, |
| "eval_dim_128_cosine_recall@10": 0.9966666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9257555555555554, |
| "eval_dim_128_cosine_recall@5": 0.9724888888888888, |
| "eval_runtime": 5.9066, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1350 |
| }, |
| { |
| "epoch": 4.98372513562387, |
| "grad_norm": 25.77345848083496, |
| "learning_rate": 1.9225988352621445e-05, |
| "loss": 1.0416, |
| "step": 1380 |
| }, |
| { |
| "epoch": 4.98372513562387, |
| "eval_dim_128_cosine_accuracy@1": 0.8546666666666667, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.972, |
| "eval_dim_128_cosine_accuracy@5": 0.9946666666666667, |
| "eval_dim_128_cosine_map@100": 0.895152090306458, |
| "eval_dim_128_cosine_mrr@10": 0.9158370370370371, |
| "eval_dim_128_cosine_ndcg@10": 0.9264969679337102, |
| "eval_dim_128_cosine_precision@1": 0.8546666666666667, |
| "eval_dim_128_cosine_precision@10": 0.14440000000000003, |
| "eval_dim_128_cosine_precision@3": 0.44, |
| "eval_dim_128_cosine_precision@5": 0.2832, |
| "eval_dim_128_cosine_recall@1": 0.6791777777777778, |
| "eval_dim_128_cosine_recall@10": 0.9950666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9306444444444445, |
| "eval_dim_128_cosine_recall@5": 0.9809333333333334, |
| "eval_runtime": 5.8646, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1380 |
| }, |
| { |
| "epoch": 5.090415913200723, |
| "grad_norm": 42.34284591674805, |
| "learning_rate": 1.8646523174180587e-05, |
| "loss": 0.742, |
| "step": 1410 |
| }, |
| { |
| "epoch": 5.090415913200723, |
| "eval_dim_128_cosine_accuracy@1": 0.848, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9826666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.996, |
| "eval_dim_128_cosine_map@100": 0.8966787537811141, |
| "eval_dim_128_cosine_mrr@10": 0.9152666666666666, |
| "eval_dim_128_cosine_ndcg@10": 0.9270482377862029, |
| "eval_dim_128_cosine_precision@1": 0.848, |
| "eval_dim_128_cosine_precision@10": 0.14440000000000003, |
| "eval_dim_128_cosine_precision@3": 0.4511111111111111, |
| "eval_dim_128_cosine_precision@5": 0.28373333333333334, |
| "eval_dim_128_cosine_recall@1": 0.6714, |
| "eval_dim_128_cosine_recall@10": 0.9946666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9499777777777778, |
| "eval_dim_128_cosine_recall@5": 0.9817333333333332, |
| "eval_runtime": 5.9187, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1410 |
| }, |
| { |
| "epoch": 5.198915009041591, |
| "grad_norm": 7.41603422164917, |
| "learning_rate": 1.806121345620111e-05, |
| "loss": 0.6726, |
| "step": 1440 |
| }, |
| { |
| "epoch": 5.198915009041591, |
| "eval_dim_128_cosine_accuracy@1": 0.848, |
| "eval_dim_128_cosine_accuracy@10": 0.9973333333333333, |
| "eval_dim_128_cosine_accuracy@3": 0.9826666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.9893333333333333, |
| "eval_dim_128_cosine_map@100": 0.8955358711549889, |
| "eval_dim_128_cosine_mrr@10": 0.9143195767195764, |
| "eval_dim_128_cosine_ndcg@10": 0.9244987067095748, |
| "eval_dim_128_cosine_precision@1": 0.848, |
| "eval_dim_128_cosine_precision@10": 0.14333333333333334, |
| "eval_dim_128_cosine_precision@3": 0.4511111111111112, |
| "eval_dim_128_cosine_precision@5": 0.2824, |
| "eval_dim_128_cosine_recall@1": 0.6707333333333334, |
| "eval_dim_128_cosine_recall@10": 0.9898666666666668, |
| "eval_dim_128_cosine_recall@3": 0.9497555555555555, |
| "eval_dim_128_cosine_recall@5": 0.9769333333333334, |
| "eval_runtime": 5.863, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1440 |
| }, |
| { |
| "epoch": 5.30741410488246, |
| "grad_norm": 23.097681045532227, |
| "learning_rate": 1.747099731579504e-05, |
| "loss": 0.7095, |
| "step": 1470 |
| }, |
| { |
| "epoch": 5.30741410488246, |
| "eval_dim_128_cosine_accuracy@1": 0.8533333333333334, |
| "eval_dim_128_cosine_accuracy@10": 1.0, |
| "eval_dim_128_cosine_accuracy@3": 0.9813333333333333, |
| "eval_dim_128_cosine_accuracy@5": 0.996, |
| "eval_dim_128_cosine_map@100": 0.89842804702073, |
| "eval_dim_128_cosine_mrr@10": 0.9160888888888891, |
| "eval_dim_128_cosine_ndcg@10": 0.9282736285073582, |
| "eval_dim_128_cosine_precision@1": 0.8533333333333334, |
| "eval_dim_128_cosine_precision@10": 0.14426666666666668, |
| "eval_dim_128_cosine_precision@3": 0.44844444444444437, |
| "eval_dim_128_cosine_precision@5": 0.2826666666666667, |
| "eval_dim_128_cosine_recall@1": 0.6785111111111112, |
| "eval_dim_128_cosine_recall@10": 0.9954666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9468666666666666, |
| "eval_dim_128_cosine_recall@5": 0.9798666666666668, |
| "eval_runtime": 5.9043, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1470 |
| }, |
| { |
| "epoch": 5.4159132007233275, |
| "grad_norm": 41.660274505615234, |
| "learning_rate": 1.6876820733943202e-05, |
| "loss": 0.8308, |
| "step": 1500 |
| }, |
| { |
| "epoch": 5.4159132007233275, |
| "eval_dim_128_cosine_accuracy@1": 0.8506666666666667, |
| "eval_dim_128_cosine_accuracy@10": 1.0, |
| "eval_dim_128_cosine_accuracy@3": 0.9733333333333334, |
| "eval_dim_128_cosine_accuracy@5": 0.9933333333333333, |
| "eval_dim_128_cosine_map@100": 0.8962897397716547, |
| "eval_dim_128_cosine_mrr@10": 0.9141259259259258, |
| "eval_dim_128_cosine_ndcg@10": 0.926065218057395, |
| "eval_dim_128_cosine_precision@1": 0.8506666666666667, |
| "eval_dim_128_cosine_precision@10": 0.144, |
| "eval_dim_128_cosine_precision@3": 0.4471111111111112, |
| "eval_dim_128_cosine_precision@5": 0.2810666666666667, |
| "eval_dim_128_cosine_recall@1": 0.6736222222222222, |
| "eval_dim_128_cosine_recall@10": 0.9945333333333335, |
| "eval_dim_128_cosine_recall@3": 0.9406444444444445, |
| "eval_dim_128_cosine_recall@5": 0.9751555555555556, |
| "eval_runtime": 5.857, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1500 |
| }, |
| { |
| "epoch": 5.524412296564195, |
| "grad_norm": 98.27491760253906, |
| "learning_rate": 1.6279636039304888e-05, |
| "loss": 0.8933, |
| "step": 1530 |
| }, |
| { |
| "epoch": 5.524412296564195, |
| "eval_dim_128_cosine_accuracy@1": 0.852, |
| "eval_dim_128_cosine_accuracy@10": 1.0, |
| "eval_dim_128_cosine_accuracy@3": 0.9826666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.9946666666666667, |
| "eval_dim_128_cosine_map@100": 0.8978606545306544, |
| "eval_dim_128_cosine_mrr@10": 0.9169740740740739, |
| "eval_dim_128_cosine_ndcg@10": 0.9280348624229215, |
| "eval_dim_128_cosine_precision@1": 0.852, |
| "eval_dim_128_cosine_precision@10": 0.14426666666666668, |
| "eval_dim_128_cosine_precision@3": 0.4511111111111111, |
| "eval_dim_128_cosine_precision@5": 0.2826666666666667, |
| "eval_dim_128_cosine_recall@1": 0.6716222222222222, |
| "eval_dim_128_cosine_recall@10": 0.9958666666666668, |
| "eval_dim_128_cosine_recall@3": 0.9497555555555556, |
| "eval_dim_128_cosine_recall@5": 0.9793777777777778, |
| "eval_runtime": 5.9058, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1530 |
| }, |
| { |
| "epoch": 5.632911392405063, |
| "grad_norm": 38.60082244873047, |
| "learning_rate": 1.568040038185364e-05, |
| "loss": 0.9554, |
| "step": 1560 |
| }, |
| { |
| "epoch": 5.632911392405063, |
| "eval_dim_128_cosine_accuracy@1": 0.8493333333333334, |
| "eval_dim_128_cosine_accuracy@10": 1.0, |
| "eval_dim_128_cosine_accuracy@3": 0.98, |
| "eval_dim_128_cosine_accuracy@5": 0.9973333333333333, |
| "eval_dim_128_cosine_map@100": 0.8938330790257619, |
| "eval_dim_128_cosine_mrr@10": 0.9142888888888889, |
| "eval_dim_128_cosine_ndcg@10": 0.925368385464489, |
| "eval_dim_128_cosine_precision@1": 0.8493333333333334, |
| "eval_dim_128_cosine_precision@10": 0.14426666666666668, |
| "eval_dim_128_cosine_precision@3": 0.44666666666666666, |
| "eval_dim_128_cosine_precision@5": 0.28319999999999995, |
| "eval_dim_128_cosine_recall@1": 0.6682888888888889, |
| "eval_dim_128_cosine_recall@10": 0.9958666666666668, |
| "eval_dim_128_cosine_recall@3": 0.9433111111111111, |
| "eval_dim_128_cosine_recall@5": 0.9822222222222222, |
| "eval_runtime": 5.8495, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1560 |
| }, |
| { |
| "epoch": 5.741410488245931, |
| "grad_norm": 95.12468719482422, |
| "learning_rate": 1.5080074198785557e-05, |
| "loss": 1.0155, |
| "step": 1590 |
| }, |
| { |
| "epoch": 5.741410488245931, |
| "eval_dim_128_cosine_accuracy@1": 0.852, |
| "eval_dim_128_cosine_accuracy@10": 1.0, |
| "eval_dim_128_cosine_accuracy@3": 0.9786666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.9946666666666667, |
| "eval_dim_128_cosine_map@100": 0.8969539720332578, |
| "eval_dim_128_cosine_mrr@10": 0.9152751322751322, |
| "eval_dim_128_cosine_ndcg@10": 0.9274971707425689, |
| "eval_dim_128_cosine_precision@1": 0.852, |
| "eval_dim_128_cosine_precision@10": 0.14466666666666667, |
| "eval_dim_128_cosine_precision@3": 0.44888888888888884, |
| "eval_dim_128_cosine_precision@5": 0.28426666666666667, |
| "eval_dim_128_cosine_recall@1": 0.6716222222222222, |
| "eval_dim_128_cosine_recall@10": 0.9966666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9459777777777778, |
| "eval_dim_128_cosine_recall@5": 0.9831555555555556, |
| "eval_runtime": 5.9231, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1590 |
| }, |
| { |
| "epoch": 5.8499095840868, |
| "grad_norm": 95.16857147216797, |
| "learning_rate": 1.4479619675158957e-05, |
| "loss": 0.7671, |
| "step": 1620 |
| }, |
| { |
| "epoch": 5.8499095840868, |
| "eval_dim_128_cosine_accuracy@1": 0.856, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.98, |
| "eval_dim_128_cosine_accuracy@5": 0.9946666666666667, |
| "eval_dim_128_cosine_map@100": 0.8994578403675177, |
| "eval_dim_128_cosine_mrr@10": 0.9167666666666668, |
| "eval_dim_128_cosine_ndcg@10": 0.9278245203077812, |
| "eval_dim_128_cosine_precision@1": 0.856, |
| "eval_dim_128_cosine_precision@10": 0.144, |
| "eval_dim_128_cosine_precision@3": 0.4497777777777778, |
| "eval_dim_128_cosine_precision@5": 0.284, |
| "eval_dim_128_cosine_recall@1": 0.6782888888888889, |
| "eval_dim_128_cosine_recall@10": 0.9926666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9457555555555555, |
| "eval_dim_128_cosine_recall@5": 0.9820888888888888, |
| "eval_runtime": 5.8405, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1620 |
| }, |
| { |
| "epoch": 5.958408679927667, |
| "grad_norm": 53.67948532104492, |
| "learning_rate": 1.3879999201732607e-05, |
| "loss": 1.0426, |
| "step": 1650 |
| }, |
| { |
| "epoch": 5.958408679927667, |
| "eval_dim_128_cosine_accuracy@1": 0.8586666666666667, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9826666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.9973333333333333, |
| "eval_dim_128_cosine_map@100": 0.9012198624750842, |
| "eval_dim_128_cosine_mrr@10": 0.9194888888888889, |
| "eval_dim_128_cosine_ndcg@10": 0.9297915866349458, |
| "eval_dim_128_cosine_precision@1": 0.8586666666666667, |
| "eval_dim_128_cosine_precision@10": 0.14426666666666668, |
| "eval_dim_128_cosine_precision@3": 0.4528888888888889, |
| "eval_dim_128_cosine_precision@5": 0.2853333333333333, |
| "eval_dim_128_cosine_recall@1": 0.6751777777777778, |
| "eval_dim_128_cosine_recall@10": 0.994, |
| "eval_dim_128_cosine_recall@3": 0.9526444444444445, |
| "eval_dim_128_cosine_recall@5": 0.9867555555555555, |
| "eval_runtime": 5.9268, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1650 |
| }, |
| { |
| "epoch": 6.0650994575045205, |
| "grad_norm": 21.35325813293457, |
| "learning_rate": 1.3282173832474273e-05, |
| "loss": 0.8879, |
| "step": 1680 |
| }, |
| { |
| "epoch": 6.0650994575045205, |
| "eval_dim_128_cosine_accuracy@1": 0.864, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9866666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.9946666666666667, |
| "eval_dim_128_cosine_map@100": 0.9085956692666805, |
| "eval_dim_128_cosine_mrr@10": 0.9234222222222221, |
| "eval_dim_128_cosine_ndcg@10": 0.9345097688489636, |
| "eval_dim_128_cosine_precision@1": 0.864, |
| "eval_dim_128_cosine_precision@10": 0.14426666666666668, |
| "eval_dim_128_cosine_precision@3": 0.4573333333333333, |
| "eval_dim_128_cosine_precision@5": 0.2853333333333333, |
| "eval_dim_128_cosine_recall@1": 0.6825111111111111, |
| "eval_dim_128_cosine_recall@10": 0.994, |
| "eval_dim_128_cosine_recall@3": 0.9593111111111111, |
| "eval_dim_128_cosine_recall@5": 0.9863111111111111, |
| "eval_runtime": 5.8634, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1680 |
| }, |
| { |
| "epoch": 6.173598553345389, |
| "grad_norm": 3.867913246154785, |
| "learning_rate": 1.268710174421184e-05, |
| "loss": 0.6999, |
| "step": 1710 |
| }, |
| { |
| "epoch": 6.173598553345389, |
| "eval_dim_128_cosine_accuracy@1": 0.8653333333333333, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9786666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.9946666666666667, |
| "eval_dim_128_cosine_map@100": 0.9078902927190878, |
| "eval_dim_128_cosine_mrr@10": 0.9238666666666665, |
| "eval_dim_128_cosine_ndcg@10": 0.9339475022230823, |
| "eval_dim_128_cosine_precision@1": 0.8653333333333333, |
| "eval_dim_128_cosine_precision@10": 0.14413333333333334, |
| "eval_dim_128_cosine_precision@3": 0.4533333333333333, |
| "eval_dim_128_cosine_precision@5": 0.2856, |
| "eval_dim_128_cosine_recall@1": 0.6838444444444445, |
| "eval_dim_128_cosine_recall@10": 0.9933333333333333, |
| "eval_dim_128_cosine_recall@3": 0.9495333333333331, |
| "eval_dim_128_cosine_recall@5": 0.9863555555555555, |
| "eval_runtime": 5.91, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1710 |
| }, |
| { |
| "epoch": 6.282097649186257, |
| "grad_norm": 35.970428466796875, |
| "learning_rate": 1.2095736700895798e-05, |
| "loss": 0.7144, |
| "step": 1740 |
| }, |
| { |
| "epoch": 6.282097649186257, |
| "eval_dim_128_cosine_accuracy@1": 0.868, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9826666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.996, |
| "eval_dim_128_cosine_map@100": 0.9102439375439374, |
| "eval_dim_128_cosine_mrr@10": 0.9254126984126985, |
| "eval_dim_128_cosine_ndcg@10": 0.935435964814853, |
| "eval_dim_128_cosine_precision@1": 0.868, |
| "eval_dim_128_cosine_precision@10": 0.14413333333333334, |
| "eval_dim_128_cosine_precision@3": 0.4564444444444443, |
| "eval_dim_128_cosine_precision@5": 0.2848, |
| "eval_dim_128_cosine_recall@1": 0.6856222222222222, |
| "eval_dim_128_cosine_recall@10": 0.9933333333333333, |
| "eval_dim_128_cosine_recall@3": 0.9555333333333333, |
| "eval_dim_128_cosine_recall@5": 0.9853777777777777, |
| "eval_runtime": 5.8695, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1740 |
| }, |
| { |
| "epoch": 6.390596745027125, |
| "grad_norm": 114.22407531738281, |
| "learning_rate": 1.1509026524934597e-05, |
| "loss": 1.0946, |
| "step": 1770 |
| }, |
| { |
| "epoch": 6.390596745027125, |
| "eval_dim_128_cosine_accuracy@1": 0.8613333333333333, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.98, |
| "eval_dim_128_cosine_accuracy@5": 0.996, |
| "eval_dim_128_cosine_map@100": 0.9078267719156685, |
| "eval_dim_128_cosine_mrr@10": 0.9220793650793649, |
| "eval_dim_128_cosine_ndcg@10": 0.9336001983943315, |
| "eval_dim_128_cosine_precision@1": 0.8613333333333333, |
| "eval_dim_128_cosine_precision@10": 0.14413333333333334, |
| "eval_dim_128_cosine_precision@3": 0.45644444444444443, |
| "eval_dim_128_cosine_precision@5": 0.2853333333333333, |
| "eval_dim_128_cosine_recall@1": 0.6816222222222222, |
| "eval_dim_128_cosine_recall@10": 0.9933333333333333, |
| "eval_dim_128_cosine_recall@3": 0.9541999999999999, |
| "eval_dim_128_cosine_recall@5": 0.9868888888888888, |
| "eval_runtime": 5.9142, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1770 |
| }, |
| { |
| "epoch": 6.499095840867993, |
| "grad_norm": 8.424233436584473, |
| "learning_rate": 1.0927911578052903e-05, |
| "loss": 0.5136, |
| "step": 1800 |
| }, |
| { |
| "epoch": 6.499095840867993, |
| "eval_dim_128_cosine_accuracy@1": 0.8733333333333333, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9826666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.996, |
| "eval_dim_128_cosine_map@100": 0.9151832652201073, |
| "eval_dim_128_cosine_mrr@10": 0.9295777777777778, |
| "eval_dim_128_cosine_ndcg@10": 0.9390823223808145, |
| "eval_dim_128_cosine_precision@1": 0.8733333333333333, |
| "eval_dim_128_cosine_precision@10": 0.14413333333333334, |
| "eval_dim_128_cosine_precision@3": 0.45644444444444443, |
| "eval_dim_128_cosine_precision@5": 0.28586666666666666, |
| "eval_dim_128_cosine_recall@1": 0.6918444444444445, |
| "eval_dim_128_cosine_recall@10": 0.9933333333333333, |
| "eval_dim_128_cosine_recall@3": 0.9564222222222222, |
| "eval_dim_128_cosine_recall@5": 0.9878222222222223, |
| "eval_runtime": 5.8496, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1800 |
| }, |
| { |
| "epoch": 6.6075949367088604, |
| "grad_norm": 7.015948295593262, |
| "learning_rate": 1.0353323254107632e-05, |
| "loss": 0.3708, |
| "step": 1830 |
| }, |
| { |
| "epoch": 6.6075949367088604, |
| "eval_dim_128_cosine_accuracy@1": 0.8773333333333333, |
| "eval_dim_128_cosine_accuracy@10": 1.0, |
| "eval_dim_128_cosine_accuracy@3": 0.98, |
| "eval_dim_128_cosine_accuracy@5": 0.992, |
| "eval_dim_128_cosine_map@100": 0.913754870974062, |
| "eval_dim_128_cosine_mrr@10": 0.9307253968253969, |
| "eval_dim_128_cosine_ndcg@10": 0.9392228655817703, |
| "eval_dim_128_cosine_precision@1": 0.8773333333333333, |
| "eval_dim_128_cosine_precision@10": 0.14453333333333335, |
| "eval_dim_128_cosine_precision@3": 0.4542222222222222, |
| "eval_dim_128_cosine_precision@5": 0.2845333333333333, |
| "eval_dim_128_cosine_recall@1": 0.6931777777777778, |
| "eval_dim_128_cosine_recall@10": 0.996, |
| "eval_dim_128_cosine_recall@3": 0.9519777777777778, |
| "eval_dim_128_cosine_recall@5": 0.9828888888888888, |
| "eval_runtime": 5.9102, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1830 |
| }, |
| { |
| "epoch": 6.716094032549728, |
| "grad_norm": 30.462295532226562, |
| "learning_rate": 9.786182486277407e-06, |
| "loss": 0.6965, |
| "step": 1860 |
| }, |
| { |
| "epoch": 6.716094032549728, |
| "eval_dim_128_cosine_accuracy@1": 0.876, |
| "eval_dim_128_cosine_accuracy@10": 1.0, |
| "eval_dim_128_cosine_accuracy@3": 0.98, |
| "eval_dim_128_cosine_accuracy@5": 0.9946666666666667, |
| "eval_dim_128_cosine_map@100": 0.9139468020219427, |
| "eval_dim_128_cosine_mrr@10": 0.9297555555555557, |
| "eval_dim_128_cosine_ndcg@10": 0.9390525287534867, |
| "eval_dim_128_cosine_precision@1": 0.876, |
| "eval_dim_128_cosine_precision@10": 0.14440000000000003, |
| "eval_dim_128_cosine_precision@3": 0.4555555555555555, |
| "eval_dim_128_cosine_precision@5": 0.28373333333333334, |
| "eval_dim_128_cosine_recall@1": 0.692288888888889, |
| "eval_dim_128_cosine_recall@10": 0.9957333333333332, |
| "eval_dim_128_cosine_recall@3": 0.9541999999999999, |
| "eval_dim_128_cosine_recall@5": 0.9826666666666667, |
| "eval_runtime": 5.8625, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1860 |
| }, |
| { |
| "epoch": 6.824593128390597, |
| "grad_norm": 30.634235382080078, |
| "learning_rate": 9.227398271018092e-06, |
| "loss": 0.618, |
| "step": 1890 |
| }, |
| { |
| "epoch": 6.824593128390597, |
| "eval_dim_128_cosine_accuracy@1": 0.8746666666666667, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9786666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.9973333333333333, |
| "eval_dim_128_cosine_map@100": 0.9132103845155253, |
| "eval_dim_128_cosine_mrr@10": 0.928711111111111, |
| "eval_dim_128_cosine_ndcg@10": 0.9384138034588314, |
| "eval_dim_128_cosine_precision@1": 0.8746666666666667, |
| "eval_dim_128_cosine_precision@10": 0.14453333333333335, |
| "eval_dim_128_cosine_precision@3": 0.45466666666666666, |
| "eval_dim_128_cosine_precision@5": 0.2853333333333333, |
| "eval_dim_128_cosine_recall@1": 0.6905111111111111, |
| "eval_dim_128_cosine_recall@10": 0.9953333333333333, |
| "eval_dim_128_cosine_recall@3": 0.9519777777777778, |
| "eval_dim_128_cosine_recall@5": 0.9877777777777779, |
| "eval_runtime": 5.915, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1890 |
| }, |
| { |
| "epoch": 6.933092224231465, |
| "grad_norm": 84.823486328125, |
| "learning_rate": 8.677866211150136e-06, |
| "loss": 1.137, |
| "step": 1920 |
| }, |
| { |
| "epoch": 6.933092224231465, |
| "eval_dim_128_cosine_accuracy@1": 0.872, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.98, |
| "eval_dim_128_cosine_accuracy@5": 0.9946666666666667, |
| "eval_dim_128_cosine_map@100": 0.9153196825396827, |
| "eval_dim_128_cosine_mrr@10": 0.9281682539682541, |
| "eval_dim_128_cosine_ndcg@10": 0.9394034719939754, |
| "eval_dim_128_cosine_precision@1": 0.872, |
| "eval_dim_128_cosine_precision@10": 0.14453333333333335, |
| "eval_dim_128_cosine_precision@3": 0.4551111111111112, |
| "eval_dim_128_cosine_precision@5": 0.284, |
| "eval_dim_128_cosine_recall@1": 0.6911777777777778, |
| "eval_dim_128_cosine_recall@10": 0.9953333333333333, |
| "eval_dim_128_cosine_recall@3": 0.9539777777777778, |
| "eval_dim_128_cosine_recall@5": 0.9833333333333333, |
| "eval_runtime": 5.8586, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1920 |
| }, |
| { |
| "epoch": 7.039783001808318, |
| "grad_norm": 14.155540466308594, |
| "learning_rate": 8.13846708041285e-06, |
| "loss": 0.5326, |
| "step": 1950 |
| }, |
| { |
| "epoch": 7.039783001808318, |
| "eval_dim_128_cosine_accuracy@1": 0.876, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9813333333333333, |
| "eval_dim_128_cosine_accuracy@5": 0.996, |
| "eval_dim_128_cosine_map@100": 0.9162717328042327, |
| "eval_dim_128_cosine_mrr@10": 0.9304222222222225, |
| "eval_dim_128_cosine_ndcg@10": 0.9405782417080079, |
| "eval_dim_128_cosine_precision@1": 0.876, |
| "eval_dim_128_cosine_precision@10": 0.14466666666666667, |
| "eval_dim_128_cosine_precision@3": 0.4555555555555555, |
| "eval_dim_128_cosine_precision@5": 0.2850666666666667, |
| "eval_dim_128_cosine_recall@1": 0.6929555555555555, |
| "eval_dim_128_cosine_recall@10": 0.996, |
| "eval_dim_128_cosine_recall@3": 0.9550888888888888, |
| "eval_dim_128_cosine_recall@5": 0.9854666666666665, |
| "eval_runtime": 5.8895, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1950 |
| }, |
| { |
| "epoch": 7.1482820976491865, |
| "grad_norm": 5.926642417907715, |
| "learning_rate": 7.6100654117863254e-06, |
| "loss": 0.804, |
| "step": 1980 |
| }, |
| { |
| "epoch": 7.1482820976491865, |
| "eval_dim_128_cosine_accuracy@1": 0.8773333333333333, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9813333333333333, |
| "eval_dim_128_cosine_accuracy@5": 0.9973333333333333, |
| "eval_dim_128_cosine_map@100": 0.9163037292291328, |
| "eval_dim_128_cosine_mrr@10": 0.9311333333333334, |
| "eval_dim_128_cosine_ndcg@10": 0.940187825535024, |
| "eval_dim_128_cosine_precision@1": 0.8773333333333333, |
| "eval_dim_128_cosine_precision@10": 0.14426666666666665, |
| "eval_dim_128_cosine_precision@3": 0.4555555555555555, |
| "eval_dim_128_cosine_precision@5": 0.2850666666666667, |
| "eval_dim_128_cosine_recall@1": 0.694288888888889, |
| "eval_dim_128_cosine_recall@10": 0.994, |
| "eval_dim_128_cosine_recall@3": 0.9550888888888888, |
| "eval_dim_128_cosine_recall@5": 0.9865777777777777, |
| "eval_runtime": 5.8689, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 1980 |
| }, |
| { |
| "epoch": 7.256781193490054, |
| "grad_norm": 32.035621643066406, |
| "learning_rate": 7.093508111843476e-06, |
| "loss": 0.7989, |
| "step": 2010 |
| }, |
| { |
| "epoch": 7.256781193490054, |
| "eval_dim_128_cosine_accuracy@1": 0.884, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.984, |
| "eval_dim_128_cosine_accuracy@5": 0.9973333333333333, |
| "eval_dim_128_cosine_map@100": 0.9203901935708568, |
| "eval_dim_128_cosine_mrr@10": 0.9347555555555557, |
| "eval_dim_128_cosine_ndcg@10": 0.9432960759953539, |
| "eval_dim_128_cosine_precision@1": 0.884, |
| "eval_dim_128_cosine_precision@10": 0.1444, |
| "eval_dim_128_cosine_precision@3": 0.45688888888888884, |
| "eval_dim_128_cosine_precision@5": 0.28586666666666666, |
| "eval_dim_128_cosine_recall@1": 0.7009555555555556, |
| "eval_dim_128_cosine_recall@10": 0.9946666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9584222222222222, |
| "eval_dim_128_cosine_recall@5": 0.9879111111111111, |
| "eval_runtime": 5.9403, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2010 |
| }, |
| { |
| "epoch": 7.365280289330922, |
| "grad_norm": 4.288305759429932, |
| "learning_rate": 6.589623103353283e-06, |
| "loss": 0.6908, |
| "step": 2040 |
| }, |
| { |
| "epoch": 7.365280289330922, |
| "eval_dim_128_cosine_accuracy@1": 0.88, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9826666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9196608913745559, |
| "eval_dim_128_cosine_mrr@10": 0.9319555555555554, |
| "eval_dim_128_cosine_ndcg@10": 0.9422073602962597, |
| "eval_dim_128_cosine_precision@1": 0.88, |
| "eval_dim_128_cosine_precision@10": 0.1444, |
| "eval_dim_128_cosine_precision@3": 0.4582222222222222, |
| "eval_dim_128_cosine_precision@5": 0.2869333333333333, |
| "eval_dim_128_cosine_recall@1": 0.698288888888889, |
| "eval_dim_128_cosine_recall@10": 0.9946666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9588666666666668, |
| "eval_dim_128_cosine_recall@5": 0.9906222222222223, |
| "eval_runtime": 5.8591, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2040 |
| }, |
| { |
| "epoch": 7.47377938517179, |
| "grad_norm": 73.20112609863281, |
| "learning_rate": 6.099217998310606e-06, |
| "loss": 0.6518, |
| "step": 2070 |
| }, |
| { |
| "epoch": 7.47377938517179, |
| "eval_dim_128_cosine_accuracy@1": 0.8853333333333333, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.984, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9223404198975627, |
| "eval_dim_128_cosine_mrr@10": 0.9353111111111111, |
| "eval_dim_128_cosine_ndcg@10": 0.9447817040034601, |
| "eval_dim_128_cosine_precision@1": 0.8853333333333333, |
| "eval_dim_128_cosine_precision@10": 0.14466666666666667, |
| "eval_dim_128_cosine_precision@3": 0.4586666666666666, |
| "eval_dim_128_cosine_precision@5": 0.2869333333333333, |
| "eval_dim_128_cosine_recall@1": 0.7020666666666666, |
| "eval_dim_128_cosine_recall@10": 0.996, |
| "eval_dim_128_cosine_recall@3": 0.9601999999999999, |
| "eval_dim_128_cosine_recall@5": 0.9904444444444443, |
| "eval_runtime": 5.9172, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2070 |
| }, |
| { |
| "epoch": 7.582278481012658, |
| "grad_norm": 9.156688690185547, |
| "learning_rate": 5.623078803519595e-06, |
| "loss": 0.4915, |
| "step": 2100 |
| }, |
| { |
| "epoch": 7.582278481012658, |
| "eval_dim_128_cosine_accuracy@1": 0.8893333333333333, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.984, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9255765584974887, |
| "eval_dim_128_cosine_mrr@10": 0.9376888888888889, |
| "eval_dim_128_cosine_ndcg@10": 0.946947073613619, |
| "eval_dim_128_cosine_precision@1": 0.8893333333333333, |
| "eval_dim_128_cosine_precision@10": 0.14466666666666667, |
| "eval_dim_128_cosine_precision@3": 0.46044444444444443, |
| "eval_dim_128_cosine_precision@5": 0.2872, |
| "eval_dim_128_cosine_recall@1": 0.7051777777777778, |
| "eval_dim_128_cosine_recall@10": 0.996, |
| "eval_dim_128_cosine_recall@3": 0.9628666666666666, |
| "eval_dim_128_cosine_recall@5": 0.991111111111111, |
| "eval_runtime": 5.8614, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2100 |
| }, |
| { |
| "epoch": 7.6907775768535265, |
| "grad_norm": 4.278165817260742, |
| "learning_rate": 5.161968660805184e-06, |
| "loss": 0.4586, |
| "step": 2130 |
| }, |
| { |
| "epoch": 7.6907775768535265, |
| "eval_dim_128_cosine_accuracy@1": 0.8906666666666667, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.984, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.926481931895545, |
| "eval_dim_128_cosine_mrr@10": 0.9380666666666666, |
| "eval_dim_128_cosine_ndcg@10": 0.947266324500608, |
| "eval_dim_128_cosine_precision@1": 0.8906666666666667, |
| "eval_dim_128_cosine_precision@10": 0.14453333333333335, |
| "eval_dim_128_cosine_precision@3": 0.4604444444444445, |
| "eval_dim_128_cosine_precision@5": 0.28746666666666665, |
| "eval_dim_128_cosine_recall@1": 0.7065111111111111, |
| "eval_dim_128_cosine_recall@10": 0.9953333333333333, |
| "eval_dim_128_cosine_recall@3": 0.9626444444444444, |
| "eval_dim_128_cosine_recall@5": 0.9917777777777776, |
| "eval_runtime": 5.8932, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2130 |
| }, |
| { |
| "epoch": 7.799276672694394, |
| "grad_norm": 36.47736358642578, |
| "learning_rate": 4.716626623871968e-06, |
| "loss": 0.4537, |
| "step": 2160 |
| }, |
| { |
| "epoch": 7.799276672694394, |
| "eval_dim_128_cosine_accuracy@1": 0.8933333333333333, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.984, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9261875428220862, |
| "eval_dim_128_cosine_mrr@10": 0.9387333333333334, |
| "eval_dim_128_cosine_ndcg@10": 0.947003287713002, |
| "eval_dim_128_cosine_precision@1": 0.8933333333333333, |
| "eval_dim_128_cosine_precision@10": 0.1444, |
| "eval_dim_128_cosine_precision@3": 0.4591111111111111, |
| "eval_dim_128_cosine_precision@5": 0.2877333333333333, |
| "eval_dim_128_cosine_recall@1": 0.7085111111111111, |
| "eval_dim_128_cosine_recall@10": 0.9946666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9608666666666666, |
| "eval_dim_128_cosine_recall@5": 0.9922222222222221, |
| "eval_runtime": 5.8563, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2160 |
| }, |
| { |
| "epoch": 7.907775768535262, |
| "grad_norm": 12.328997611999512, |
| "learning_rate": 4.287766473770755e-06, |
| "loss": 0.5117, |
| "step": 2190 |
| }, |
| { |
| "epoch": 7.907775768535262, |
| "eval_dim_128_cosine_accuracy@1": 0.8933333333333333, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.984, |
| "eval_dim_128_cosine_accuracy@5": 0.9973333333333333, |
| "eval_dim_128_cosine_map@100": 0.927080770223453, |
| "eval_dim_128_cosine_mrr@10": 0.9388444444444445, |
| "eval_dim_128_cosine_ndcg@10": 0.9475417170141722, |
| "eval_dim_128_cosine_precision@1": 0.8933333333333333, |
| "eval_dim_128_cosine_precision@10": 0.1444, |
| "eval_dim_128_cosine_precision@3": 0.46044444444444443, |
| "eval_dim_128_cosine_precision@5": 0.28746666666666665, |
| "eval_dim_128_cosine_recall@1": 0.7091777777777779, |
| "eval_dim_128_cosine_recall@10": 0.9946666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9628666666666666, |
| "eval_dim_128_cosine_recall@5": 0.9908888888888888, |
| "eval_runtime": 5.9129, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2190 |
| }, |
| { |
| "epoch": 8.014466546112116, |
| "grad_norm": 30.67298698425293, |
| "learning_rate": 3.8760755748713984e-06, |
| "loss": 0.6986, |
| "step": 2220 |
| }, |
| { |
| "epoch": 8.014466546112116, |
| "eval_dim_128_cosine_accuracy@1": 0.896, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.984, |
| "eval_dim_128_cosine_accuracy@5": 0.9973333333333333, |
| "eval_dim_128_cosine_map@100": 0.9286057480911137, |
| "eval_dim_128_cosine_mrr@10": 0.9403777777777779, |
| "eval_dim_128_cosine_ndcg@10": 0.9486381203545307, |
| "eval_dim_128_cosine_precision@1": 0.896, |
| "eval_dim_128_cosine_precision@10": 0.1444, |
| "eval_dim_128_cosine_precision@3": 0.46088888888888885, |
| "eval_dim_128_cosine_precision@5": 0.28746666666666665, |
| "eval_dim_128_cosine_recall@1": 0.7111777777777778, |
| "eval_dim_128_cosine_recall@10": 0.9946666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9633111111111111, |
| "eval_dim_128_cosine_recall@5": 0.9908888888888888, |
| "eval_runtime": 5.8609, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2220 |
| }, |
| { |
| "epoch": 8.122965641952984, |
| "grad_norm": 1.5760753154754639, |
| "learning_rate": 3.482213773175531e-06, |
| "loss": 0.439, |
| "step": 2250 |
| }, |
| { |
| "epoch": 8.122965641952984, |
| "eval_dim_128_cosine_accuracy@1": 0.892, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.984, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9268501925355582, |
| "eval_dim_128_cosine_mrr@10": 0.9379777777777778, |
| "eval_dim_128_cosine_ndcg@10": 0.9472364738873601, |
| "eval_dim_128_cosine_precision@1": 0.892, |
| "eval_dim_128_cosine_precision@10": 0.1444, |
| "eval_dim_128_cosine_precision@3": 0.4595555555555556, |
| "eval_dim_128_cosine_precision@5": 0.288, |
| "eval_dim_128_cosine_recall@1": 0.7085111111111111, |
| "eval_dim_128_cosine_recall@10": 0.9946666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9613111111111111, |
| "eval_dim_128_cosine_recall@5": 0.9928888888888888, |
| "eval_runtime": 5.9215, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2250 |
| }, |
| { |
| "epoch": 8.231464737793852, |
| "grad_norm": 18.038986206054688, |
| "learning_rate": 3.1068123387348635e-06, |
| "loss": 0.7161, |
| "step": 2280 |
| }, |
| { |
| "epoch": 8.231464737793852, |
| "eval_dim_128_cosine_accuracy@1": 0.892, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9853333333333333, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9268143745143744, |
| "eval_dim_128_cosine_mrr@10": 0.9380222222222222, |
| "eval_dim_128_cosine_ndcg@10": 0.9472003973675673, |
| "eval_dim_128_cosine_precision@1": 0.892, |
| "eval_dim_128_cosine_precision@10": 0.1444, |
| "eval_dim_128_cosine_precision@3": 0.46, |
| "eval_dim_128_cosine_precision@5": 0.28826666666666667, |
| "eval_dim_128_cosine_recall@1": 0.7078444444444444, |
| "eval_dim_128_cosine_recall@10": 0.9946666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9626444444444444, |
| "eval_dim_128_cosine_recall@5": 0.9935555555555555, |
| "eval_runtime": 6.2984, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2280 |
| }, |
| { |
| "epoch": 8.33996383363472, |
| "grad_norm": 12.559696197509766, |
| "learning_rate": 2.7504729538702427e-06, |
| "loss": 0.6017, |
| "step": 2310 |
| }, |
| { |
| "epoch": 8.33996383363472, |
| "eval_dim_128_cosine_accuracy@1": 0.892, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.988, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9269281106807422, |
| "eval_dim_128_cosine_mrr@10": 0.9384666666666667, |
| "eval_dim_128_cosine_ndcg@10": 0.9473667282424024, |
| "eval_dim_128_cosine_precision@1": 0.892, |
| "eval_dim_128_cosine_precision@10": 0.1444, |
| "eval_dim_128_cosine_precision@3": 0.4613333333333333, |
| "eval_dim_128_cosine_precision@5": 0.28826666666666667, |
| "eval_dim_128_cosine_recall@1": 0.7071777777777778, |
| "eval_dim_128_cosine_recall@10": 0.9946666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9659777777777778, |
| "eval_dim_128_cosine_recall@5": 0.9935555555555555, |
| "eval_runtime": 5.9016, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2310 |
| }, |
| { |
| "epoch": 8.448462929475587, |
| "grad_norm": 31.18543243408203, |
| "learning_rate": 2.4137667488129887e-06, |
| "loss": 0.5401, |
| "step": 2340 |
| }, |
| { |
| "epoch": 8.448462929475587, |
| "eval_dim_128_cosine_accuracy@1": 0.8933333333333333, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9893333333333333, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9285061133987962, |
| "eval_dim_128_cosine_mrr@10": 0.9393111111111111, |
| "eval_dim_128_cosine_ndcg@10": 0.9483714677447728, |
| "eval_dim_128_cosine_precision@1": 0.8933333333333333, |
| "eval_dim_128_cosine_precision@10": 0.1444, |
| "eval_dim_128_cosine_precision@3": 0.46266666666666667, |
| "eval_dim_128_cosine_precision@5": 0.288, |
| "eval_dim_128_cosine_recall@1": 0.7085111111111112, |
| "eval_dim_128_cosine_recall@10": 0.9946666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9686444444444444, |
| "eval_dim_128_cosine_recall@5": 0.9928888888888888, |
| "eval_runtime": 5.8553, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2340 |
| }, |
| { |
| "epoch": 8.556962025316455, |
| "grad_norm": 77.83521270751953, |
| "learning_rate": 2.0972333863142685e-06, |
| "loss": 0.5061, |
| "step": 2370 |
| }, |
| { |
| "epoch": 8.556962025316455, |
| "eval_dim_128_cosine_accuracy@1": 0.8986666666666666, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9906666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9309018907018908, |
| "eval_dim_128_cosine_mrr@10": 0.9427555555555555, |
| "eval_dim_128_cosine_ndcg@10": 0.9504180800389047, |
| "eval_dim_128_cosine_precision@1": 0.8986666666666666, |
| "eval_dim_128_cosine_precision@10": 0.1444, |
| "eval_dim_128_cosine_precision@3": 0.46266666666666667, |
| "eval_dim_128_cosine_precision@5": 0.2877333333333333, |
| "eval_dim_128_cosine_recall@1": 0.7138444444444444, |
| "eval_dim_128_cosine_recall@10": 0.9946666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9693111111111111, |
| "eval_dim_128_cosine_recall@5": 0.9922222222222221, |
| "eval_runtime": 5.9013, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2370 |
| }, |
| { |
| "epoch": 8.665461121157323, |
| "grad_norm": 98.64642333984375, |
| "learning_rate": 1.8013801966895778e-06, |
| "loss": 0.6934, |
| "step": 2400 |
| }, |
| { |
| "epoch": 8.665461121157323, |
| "eval_dim_128_cosine_accuracy@1": 0.8973333333333333, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9893333333333333, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9307591831605443, |
| "eval_dim_128_cosine_mrr@10": 0.9419777777777778, |
| "eval_dim_128_cosine_ndcg@10": 0.9501743830896927, |
| "eval_dim_128_cosine_precision@1": 0.8973333333333333, |
| "eval_dim_128_cosine_precision@10": 0.1444, |
| "eval_dim_128_cosine_precision@3": 0.46266666666666667, |
| "eval_dim_128_cosine_precision@5": 0.28746666666666665, |
| "eval_dim_128_cosine_recall@1": 0.7131777777777778, |
| "eval_dim_128_cosine_recall@10": 0.9946666666666667, |
| "eval_dim_128_cosine_recall@3": 0.9686444444444444, |
| "eval_dim_128_cosine_recall@5": 0.9915555555555555, |
| "eval_runtime": 5.8527, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2400 |
| }, |
| { |
| "epoch": 8.773960216998193, |
| "grad_norm": 1.946149468421936, |
| "learning_rate": 1.5266813646847072e-06, |
| "loss": 0.4517, |
| "step": 2430 |
| }, |
| { |
| "epoch": 8.773960216998193, |
| "eval_dim_128_cosine_accuracy@1": 0.9026666666666666, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.988, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9324288704091135, |
| "eval_dim_128_cosine_mrr@10": 0.9445333333333333, |
| "eval_dim_128_cosine_ndcg@10": 0.9517986133734063, |
| "eval_dim_128_cosine_precision@1": 0.9026666666666666, |
| "eval_dim_128_cosine_precision@10": 0.14453333333333335, |
| "eval_dim_128_cosine_precision@3": 0.46266666666666667, |
| "eval_dim_128_cosine_precision@5": 0.288, |
| "eval_dim_128_cosine_recall@1": 0.7171777777777778, |
| "eval_dim_128_cosine_recall@10": 0.9953333333333333, |
| "eval_dim_128_cosine_recall@3": 0.9679777777777778, |
| "eval_dim_128_cosine_recall@5": 0.9928888888888888, |
| "eval_runtime": 5.9073, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2430 |
| }, |
| { |
| "epoch": 8.88245931283906, |
| "grad_norm": 21.574716567993164, |
| "learning_rate": 1.2735771694664666e-06, |
| "loss": 0.572, |
| "step": 2460 |
| }, |
| { |
| "epoch": 8.88245931283906, |
| "eval_dim_128_cosine_accuracy@1": 0.904, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.988, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9336610339069912, |
| "eval_dim_128_cosine_mrr@10": 0.9452666666666667, |
| "eval_dim_128_cosine_ndcg@10": 0.9526096908217102, |
| "eval_dim_128_cosine_precision@1": 0.904, |
| "eval_dim_128_cosine_precision@10": 0.14453333333333335, |
| "eval_dim_128_cosine_precision@3": 0.46266666666666667, |
| "eval_dim_128_cosine_precision@5": 0.2877333333333333, |
| "eval_dim_128_cosine_recall@1": 0.7191777777777778, |
| "eval_dim_128_cosine_recall@10": 0.9953333333333333, |
| "eval_dim_128_cosine_recall@3": 0.9679777777777778, |
| "eval_dim_128_cosine_recall@5": 0.9922222222222221, |
| "eval_runtime": 5.8559, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2460 |
| }, |
| { |
| "epoch": 8.990958408679928, |
| "grad_norm": 0.8837202191352844, |
| "learning_rate": 1.0424732789562375e-06, |
| "loss": 0.443, |
| "step": 2490 |
| }, |
| { |
| "epoch": 8.990958408679928, |
| "eval_dim_128_cosine_accuracy@1": 0.9026666666666666, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9893333333333333, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9337033582909054, |
| "eval_dim_128_cosine_mrr@10": 0.9449333333333334, |
| "eval_dim_128_cosine_ndcg@10": 0.9528233468066813, |
| "eval_dim_128_cosine_precision@1": 0.9026666666666666, |
| "eval_dim_128_cosine_precision@10": 0.14466666666666667, |
| "eval_dim_128_cosine_precision@3": 0.46266666666666667, |
| "eval_dim_128_cosine_precision@5": 0.28719999999999996, |
| "eval_dim_128_cosine_recall@1": 0.7185111111111111, |
| "eval_dim_128_cosine_recall@10": 0.996, |
| "eval_dim_128_cosine_recall@3": 0.9686444444444444, |
| "eval_dim_128_cosine_recall@5": 0.9908888888888888, |
| "eval_runtime": 5.9289, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2490 |
| }, |
| { |
| "epoch": 9.097649186256781, |
| "grad_norm": 1.874420404434204, |
| "learning_rate": 8.337400996374217e-07, |
| "loss": 0.5398, |
| "step": 2520 |
| }, |
| { |
| "epoch": 9.097649186256781, |
| "eval_dim_128_cosine_accuracy@1": 0.9013333333333333, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9893333333333333, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9329674755481389, |
| "eval_dim_128_cosine_mrr@10": 0.9442666666666667, |
| "eval_dim_128_cosine_ndcg@10": 0.9522996328809646, |
| "eval_dim_128_cosine_precision@1": 0.9013333333333333, |
| "eval_dim_128_cosine_precision@10": 0.14466666666666667, |
| "eval_dim_128_cosine_precision@3": 0.46222222222222215, |
| "eval_dim_128_cosine_precision@5": 0.28746666666666665, |
| "eval_dim_128_cosine_recall@1": 0.7171777777777778, |
| "eval_dim_128_cosine_recall@10": 0.996, |
| "eval_dim_128_cosine_recall@3": 0.9679777777777778, |
| "eval_dim_128_cosine_recall@5": 0.9915555555555555, |
| "eval_runtime": 5.8503, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2520 |
| }, |
| { |
| "epoch": 9.206148282097649, |
| "grad_norm": 59.69526290893555, |
| "learning_rate": 6.477121828789007e-07, |
| "loss": 0.6212, |
| "step": 2550 |
| }, |
| { |
| "epoch": 9.206148282097649, |
| "eval_dim_128_cosine_accuracy@1": 0.9, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9906666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9324262475822048, |
| "eval_dim_128_cosine_mrr@10": 0.9437111111111111, |
| "eval_dim_128_cosine_ndcg@10": 0.9516769041847347, |
| "eval_dim_128_cosine_precision@1": 0.9, |
| "eval_dim_128_cosine_precision@10": 0.14453333333333335, |
| "eval_dim_128_cosine_precision@3": 0.46266666666666667, |
| "eval_dim_128_cosine_precision@5": 0.2877333333333333, |
| "eval_dim_128_cosine_recall@1": 0.7158444444444444, |
| "eval_dim_128_cosine_recall@10": 0.9953333333333333, |
| "eval_dim_128_cosine_recall@3": 0.9693111111111111, |
| "eval_dim_128_cosine_recall@5": 0.9922222222222221, |
| "eval_runtime": 5.9234, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2550 |
| }, |
| { |
| "epoch": 9.314647377938517, |
| "grad_norm": 9.565635681152344, |
| "learning_rate": 4.846876887259627e-07, |
| "loss": 0.649, |
| "step": 2580 |
| }, |
| { |
| "epoch": 9.314647377938517, |
| "eval_dim_128_cosine_accuracy@1": 0.9, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9906666666666667, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9324377777777777, |
| "eval_dim_128_cosine_mrr@10": 0.9434888888888889, |
| "eval_dim_128_cosine_ndcg@10": 0.9518456891768204, |
| "eval_dim_128_cosine_precision@1": 0.9, |
| "eval_dim_128_cosine_precision@10": 0.14466666666666667, |
| "eval_dim_128_cosine_precision@3": 0.46266666666666667, |
| "eval_dim_128_cosine_precision@5": 0.2877333333333333, |
| "eval_dim_128_cosine_recall@1": 0.7158444444444444, |
| "eval_dim_128_cosine_recall@10": 0.996, |
| "eval_dim_128_cosine_recall@3": 0.9693111111111111, |
| "eval_dim_128_cosine_recall@5": 0.9922222222222221, |
| "eval_runtime": 5.858, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2580 |
| }, |
| { |
| "epoch": 9.423146473779385, |
| "grad_norm": 26.480701446533203, |
| "learning_rate": 3.4492790801822274e-07, |
| "loss": 0.3859, |
| "step": 2610 |
| }, |
| { |
| "epoch": 9.423146473779385, |
| "eval_dim_128_cosine_accuracy@1": 0.9013333333333333, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9893333333333333, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9332155555555555, |
| "eval_dim_128_cosine_mrr@10": 0.9440444444444446, |
| "eval_dim_128_cosine_ndcg@10": 0.952332103626852, |
| "eval_dim_128_cosine_precision@1": 0.9013333333333333, |
| "eval_dim_128_cosine_precision@10": 0.14466666666666667, |
| "eval_dim_128_cosine_precision@3": 0.46311111111111114, |
| "eval_dim_128_cosine_precision@5": 0.2877333333333333, |
| "eval_dim_128_cosine_recall@1": 0.7171777777777778, |
| "eval_dim_128_cosine_recall@10": 0.996, |
| "eval_dim_128_cosine_recall@3": 0.9688666666666667, |
| "eval_dim_128_cosine_recall@5": 0.9922222222222221, |
| "eval_runtime": 5.9075, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2610 |
| }, |
| { |
| "epoch": 9.531645569620252, |
| "grad_norm": 41.95344924926758, |
| "learning_rate": 2.2865684360036887e-07, |
| "loss": 0.4697, |
| "step": 2640 |
| }, |
| { |
| "epoch": 9.531645569620252, |
| "eval_dim_128_cosine_accuracy@1": 0.9013333333333333, |
| "eval_dim_128_cosine_accuracy@10": 0.9986666666666667, |
| "eval_dim_128_cosine_accuracy@3": 0.9893333333333333, |
| "eval_dim_128_cosine_accuracy@5": 0.9986666666666667, |
| "eval_dim_128_cosine_map@100": 0.9335488888888889, |
| "eval_dim_128_cosine_mrr@10": 0.9442666666666667, |
| "eval_dim_128_cosine_ndcg@10": 0.9525500526536282, |
| "eval_dim_128_cosine_precision@1": 0.9013333333333333, |
| "eval_dim_128_cosine_precision@10": 0.14466666666666667, |
| "eval_dim_128_cosine_precision@3": 0.46355555555555555, |
| "eval_dim_128_cosine_precision@5": 0.2877333333333333, |
| "eval_dim_128_cosine_recall@1": 0.7171777777777778, |
| "eval_dim_128_cosine_recall@10": 0.996, |
| "eval_dim_128_cosine_recall@3": 0.9693111111111111, |
| "eval_dim_128_cosine_recall@5": 0.9922222222222221, |
| "eval_runtime": 5.8522, |
| "eval_samples_per_second": 0.0, |
| "eval_steps_per_second": 0.0, |
| "step": 2640 |
| } |
| ], |
| "logging_steps": 30, |
| "max_steps": 2770, |
| "num_input_tokens_seen": 0, |
| "num_train_epochs": 10, |
| "save_steps": 60, |
| "stateful_callbacks": { |
| "TrainerControl": { |
| "args": { |
| "should_epoch_stop": false, |
| "should_evaluate": false, |
| "should_log": false, |
| "should_save": true, |
| "should_training_stop": false |
| }, |
| "attributes": {} |
| } |
| }, |
| "total_flos": 0.0, |
| "train_batch_size": 8, |
| "trial_name": null, |
| "trial_params": null |
| } |
|
|