| model,aime24_acc,aime24_pass_acc,aime24_tokens,aime24_keywords,aime24_correct_tokens,aime24_wrong_tokens,aime24_clip_ratio,aime24_stop_tokens,aime24_stop_ratio,aime24_box_ratio,aime24_repeat_ratio,aime25_acc,aime25_pass_acc,aime25_tokens,aime25_keywords,aime25_correct_tokens,aime25_wrong_tokens,aime25_clip_ratio,aime25_stop_tokens,aime25_stop_ratio,aime25_box_ratio,aime25_repeat_ratio,amc23_acc,amc23_pass_acc,amc23_tokens,amc23_keywords,amc23_correct_tokens,amc23_wrong_tokens,amc23_clip_ratio,amc23_stop_tokens,amc23_stop_ratio,amc23_box_ratio,amc23_repeat_ratio,avg_acc,avg_pass_acc,avg_tokens,avg_keywords,avg_correct_tokens,avg_wrong_tokens,avg_clip_ratio,avg_stop_tokens,avg_stop_ratio,avg_box_ratio,avg_repeat_ratio | |
| eval_results_avg4-global_step_0,3.3,13.3,3141.233333333333,0.6,1161.0,3209.5172413793102,0.1,1712.3333333333333,0.9,0.8333333333333334,0.7333333333333333,2.5,6.7,1315.5,0.3,912.0,1329.4137931034484,0.03333333333333333,809.1379310344828,0.9666666666666667,0.9333333333333333,0.5666666666666667,25.0,47.5,2659.65,0.175,2267.8,2790.266666666667,0.1,930.1388888888889,0.9,0.825,0.675,10.266666666666667,22.5,2372.1277777777777,0.35833333333333334,1446.9333333333334,2443.065900383142,0.07777777777777778,1150.5367177522348,0.9222222222222222,0.8638888888888889,0.6583333333333333 | |
| eval_results_avg4-global_step_10,4.2,6.7,2217.633333333333,0.5,907.0,2311.25,0.06666666666666667,1259.142857142857,0.9333333333333333,0.8666666666666667,0.8,3.3,6.7,1434.7333333333333,3.1333333333333333,532.0,1465.8620689655172,0.03333333333333333,929.551724137931,0.9666666666666667,0.9,0.6666666666666666,32.5,60.0,1144.475,0.225,581.8,1332.0333333333333,0.025,763.6153846153846,0.975,0.975,0.75,13.333333333333334,24.46666666666667,1598.9472222222223,1.2861111111111112,673.6,1703.0484674329502,0.041666666666666664,984.1033219653909,0.9583333333333334,0.9138888888888889,0.7388888888888889 | |
| eval_results_avg4-global_step_20,5.0,16.7,1846.6666666666667,0.4,781.0,1883.4137931034484,0.06666666666666667,835.7857142857143,0.9333333333333333,0.9333333333333333,0.8,2.5,6.7,916.8333333333334,0.4666666666666667,1412.0,899.7586206896551,0.0,916.8333333333334,1.0,0.9666666666666667,0.7,35.6,57.5,1163.55,0.375,669.1666666666666,1375.4285714285713,0.025,783.1282051282051,0.975,0.975,0.6,14.366666666666667,26.96666666666667,1309.0166666666667,0.4138888888888889,954.0555555555555,1386.200328407225,0.030555555555555558,845.2490842490843,0.9694444444444444,0.9583333333333334,0.7000000000000001 | |
| eval_results_avg4-global_step_30,5.0,13.3,1007.1333333333333,0.6,473.0,1025.551724137931,0.0,1007.1333333333333,1.0,1.0,0.7,5.8,20.0,828.7,0.5333333333333333,735.0,839.1111111111111,0.0,828.7,1.0,1.0,0.7,36.2,65.0,732.675,0.375,710.875,747.2083333333334,0.0,732.675,1.0,1.0,0.725,15.666666666666666,32.766666666666666,856.1694444444444,0.5027777777777778,639.625,870.6237228607919,0.0,856.1694444444444,1.0,1.0,0.7083333333333334 | |
| eval_results_avg4-global_step_40,5.8,10.0,878.8,0.6666666666666666,650.0,895.1428571428571,0.0,878.8,1.0,1.0,0.8,1.7,3.3,839.4666666666667,0.8,0.0,839.4666666666667,0.0,839.4666666666667,1.0,1.0,0.7333333333333333,35.0,55.0,741.475,0.375,608.7857142857143,812.9230769230769,0.0,741.475,1.0,1.0,0.625,14.166666666666666,22.766666666666666,819.9138888888889,0.6138888888888889,419.5952380952381,849.1775335775336,0.0,819.9138888888889,1.0,1.0,0.7194444444444444 | |
| eval_results_avg4-global_step_50,5.8,10.0,815.9666666666667,0.7,706.5,823.7857142857143,0.0,815.9666666666667,1.0,1.0,0.6666666666666666,0.8,3.3,827.6666666666666,0.9,0.0,827.6666666666666,0.0,827.6666666666666,1.0,1.0,0.7,40.0,60.0,739.75,0.425,689.0666666666667,770.16,0.0,739.75,1.0,1.0,0.625,15.533333333333333,24.433333333333334,794.4611111111111,0.6749999999999999,465.18888888888887,807.204126984127,0.0,794.4611111111111,1.0,1.0,0.6638888888888889 | |
| eval_results_avg4-global_step_60,4.2,6.7,756.4,0.7333333333333333,435.0,767.4827586206897,0.0,756.4,1.0,1.0,0.7,1.7,3.3,828.2,1.0333333333333334,1049.0,820.5862068965517,0.0,828.2,1.0,1.0,0.7,44.4,62.5,706.125,0.3,678.8888888888889,728.4090909090909,0.0,706.125,1.0,1.0,0.675,16.766666666666666,24.166666666666668,763.5749999999999,0.6888888888888888,720.9629629629629,772.1593521421108,0.0,763.5749999999999,1.0,1.0,0.6916666666666668 | |
| eval_results_avg4-global_step_70,9.2,23.3,767.2,1.0666666666666667,767.75,767.1153846153846,0.0,767.2,1.0,1.0,0.5666666666666667,0.8,3.3,786.4666666666667,1.1,0.0,786.4666666666667,0.0,786.4666666666667,1.0,1.0,0.7,35.0,60.0,743.175,0.675,717.625,760.2083333333334,0.0,743.175,1.0,0.975,0.7,15.0,28.866666666666664,765.6138888888889,0.9472222222222223,495.125,771.2634615384617,0.0,765.6138888888889,1.0,0.9916666666666667,0.6555555555555556 | |
| eval_results_avg4-global_step_80,7.5,13.3,676.9333333333333,1.0666666666666667,733.3333333333334,670.6666666666666,0.0,676.9333333333333,1.0,0.7,0.7,2.5,6.7,697.5333333333333,0.7333333333333333,964.0,678.5,0.0,697.5333333333333,1.0,0.6,0.6333333333333333,30.6,55.0,715.95,0.675,646.5833333333334,745.6785714285714,0.0,715.95,1.0,0.65,0.55,13.533333333333333,25.0,696.8055555555557,0.8249999999999998,781.3055555555557,698.281746031746,0.0,696.8055555555557,1.0,0.6499999999999999,0.6277777777777778 | |
| eval_results_avg4-global_step_90,4.2,10.0,748.3,1.0666666666666667,528.0,755.8965517241379,0.0,748.3,1.0,0.9,0.6333333333333333,0.0,0.0,717.3333333333334,0.8,0.0,717.3333333333334,0.0,717.3333333333334,1.0,1.0,0.7333333333333333,26.2,40.0,722.3,0.475,589.25,779.3214285714286,0.0,722.3,1.0,0.925,0.75,10.133333333333333,16.666666666666668,729.3111111111111,0.7805555555555556,372.4166666666667,750.8504378762999,0.0,729.3111111111111,1.0,0.9416666666666668,0.7055555555555556 | |
| eval_results_avg4-global_step_100,4.2,10.0,646.2666666666667,1.1,580.5,650.9642857142857,0.0,646.2666666666667,1.0,0.8666666666666667,0.5333333333333333,0.0,0.0,682.8333333333334,1.0,0.0,682.8333333333334,0.0,682.8333333333334,1.0,0.9333333333333333,0.8,30.0,50.0,665.125,0.575,655.6666666666666,669.1785714285714,0.0,665.125,1.0,0.875,0.6,11.4,20.0,664.7416666666667,0.8916666666666666,412.0555555555555,667.6587301587301,0.0,664.7416666666667,1.0,0.8916666666666666,0.6444444444444445 | |