| model,aime24_acc,aime24_pass_acc,aime24_tokens,aime24_keywords,aime24_correct_tokens,aime24_wrong_tokens,aime24_clip_ratio,aime24_stop_tokens,aime24_stop_ratio,aime24_box_ratio,aime24_repeat_ratio,aime25_acc,aime25_pass_acc,aime25_tokens,aime25_keywords,aime25_correct_tokens,aime25_wrong_tokens,aime25_clip_ratio,aime25_stop_tokens,aime25_stop_ratio,aime25_box_ratio,aime25_repeat_ratio,amc23_acc,amc23_pass_acc,amc23_tokens,amc23_keywords,amc23_correct_tokens,amc23_wrong_tokens,amc23_clip_ratio,amc23_stop_tokens,amc23_stop_ratio,amc23_box_ratio,amc23_repeat_ratio,avg_acc,avg_pass_acc,avg_tokens,avg_keywords,avg_correct_tokens,avg_wrong_tokens,avg_clip_ratio,avg_stop_tokens,avg_stop_ratio,avg_box_ratio,avg_repeat_ratio | |
| eval_results_avg4-global_step_0,5.0,13.3,1491.7333333333333,0.4,612.0,1522.0689655172414,0.03333333333333333,991.448275862069,0.9666666666666667,0.9,0.8,1.7,6.7,2422.3,0.26666666666666666,0.0,2422.3,0.06666666666666667,1452.75,0.9333333333333333,0.7666666666666667,0.6,21.2,50.0,1462.15,0.225,600.75,1831.3214285714287,0.05,698.3947368421053,0.95,0.825,0.5,9.299999999999999,23.333333333333332,1792.0611111111114,0.2972222222222222,404.25,1925.2301313628902,0.05000000000000001,1047.5310042347248,0.9499999999999998,0.8305555555555556,0.6333333333333333 | |
| eval_results_avg4-global_step_10,4.2,13.3,2071.1,0.7333333333333333,1444.0,2092.7241379310344,0.06666666666666667,1076.1785714285713,0.9333333333333333,0.9,0.6333333333333333,3.3,10.0,1655.9666666666667,0.6333333333333333,0.0,1655.9666666666667,0.03333333333333333,1161.344827586207,0.9666666666666667,0.9,0.7666666666666667,32.5,62.5,2378.375,0.5,536.0,3265.4444444444443,0.1,865.1111111111111,0.9,0.9,0.675,13.333333333333334,28.599999999999998,2035.1472222222221,0.6222222222222222,660.0,2338.0450830140485,0.06666666666666667,1034.2115033752964,0.9333333333333332,0.9,0.6916666666666668 | |
| eval_results_avg4-global_step_20,4.2,10.0,1819.3333333333333,0.5,527.0,1863.896551724138,0.06666666666666667,806.6071428571429,0.9333333333333333,0.9333333333333333,0.8,2.5,3.3,788.5666666666667,0.6,530.0,797.4827586206897,0.0,788.5666666666667,1.0,1.0,0.5666666666666667,33.1,60.0,1519.925,0.3,552.3333333333334,2100.48,0.05,757.921052631579,0.95,0.95,0.65,13.266666666666667,24.433333333333334,1375.9416666666666,0.46666666666666673,536.4444444444445,1587.2864367816092,0.03888888888888889,784.3649540517963,0.9611111111111111,0.9611111111111111,0.6722222222222222 | |
| eval_results_avg4-global_step_30,6.7,16.7,2712.3333333333335,0.43333333333333335,675.0,2782.5862068965516,0.06666666666666667,1763.2857142857142,0.9333333333333333,0.8666666666666667,0.8333333333333334,0.8,3.3,1372.0,2.533333333333333,0.0,1372.0,0.03333333333333333,867.6551724137931,0.9666666666666667,0.9666666666666667,0.7333333333333333,37.5,60.0,801.725,0.175,675.2666666666667,877.6,0.0,801.725,1.0,1.0,0.625,15.0,26.666666666666668,1628.6861111111111,1.0472222222222223,450.0888888888889,1677.3954022988507,0.03333333333333333,1144.221962233169,0.9666666666666667,0.9444444444444445,0.7305555555555555 | |
| eval_results_avg4-global_step_40,7.5,13.3,1946.4666666666667,0.5333333333333333,824.0,2119.153846153846,0.06666666666666667,942.75,0.9333333333333333,0.9333333333333333,0.7666666666666667,4.2,6.7,863.7333333333333,0.43333333333333335,847.0,864.9285714285714,0.0,863.7333333333333,1.0,1.0,0.8,34.4,62.5,787.525,0.175,629.0714285714286,872.8461538461538,0.0,787.525,1.0,1.0,0.7,15.366666666666665,27.5,1199.2416666666666,0.38055555555555554,766.6904761904761,1285.642857142857,0.022222222222222223,864.6694444444444,0.9777777777777779,0.9777777777777779,0.7555555555555555 | |
| eval_results_avg4-global_step_50,5.8,10.0,2071.4666666666667,0.6,565.5,2179.035714285714,0.06666666666666667,1076.5357142857142,0.9333333333333333,0.9,0.8,4.2,16.7,843.4333333333333,0.6333333333333333,890.5,840.0714285714286,0.0,843.4333333333333,1.0,1.0,0.6333333333333333,32.5,55.0,1186.975,0.225,658.3333333333334,1413.5357142857142,0.025,807.1538461538462,0.975,0.975,0.6,14.166666666666666,27.233333333333334,1367.2916666666667,0.48611111111111116,704.7777777777778,1477.547619047619,0.030555555555555558,909.0409645909646,0.9694444444444444,0.9583333333333334,0.6777777777777777 | |
| eval_results_avg4-global_step_60,6.7,10.0,2410.1,0.6666666666666666,804.3333333333334,2588.5185185185187,0.06666666666666667,1439.4285714285713,0.9333333333333333,0.8666666666666667,0.7333333333333333,2.5,3.3,924.6333333333333,0.6,973.0,922.9655172413793,0.0,924.6333333333333,1.0,1.0,0.7333333333333333,33.8,52.5,1573.875,0.375,716.0,1941.5357142857142,0.05,814.8947368421053,0.95,0.95,0.725,14.333333333333334,21.933333333333334,1636.2027777777778,0.5472222222222222,831.1111111111112,1817.673250015204,0.03888888888888889,1059.6522138680034,0.9611111111111111,0.9388888888888888,0.7305555555555555 | |
| eval_results_avg4-global_step_70,7.5,16.7,2375.4333333333334,0.5666666666666667,1180.0,2460.8214285714284,0.06666666666666667,1402.2142857142858,0.9333333333333333,0.9,0.7666666666666667,4.2,10.0,1433.3666666666666,0.5666666666666667,1300.0,1437.9655172413793,0.03333333333333333,931.0689655172414,0.9666666666666667,0.9666666666666667,0.7666666666666667,36.2,60.0,1406.15,0.4,670.6428571428571,1802.1923076923076,0.025,1032.051282051282,0.975,0.95,0.75,15.966666666666669,28.900000000000002,1738.3166666666668,0.5111111111111111,1050.2142857142856,1900.3264178350385,0.041666666666666664,1121.7781777609364,0.9583333333333334,0.9388888888888888,0.7611111111111111 | |
| eval_results_avg4-global_step_80,5.8,16.7,2834.0,1.3333333333333333,0.0,2834.0,0.1,1371.5185185185185,0.9,0.8666666666666667,0.9333333333333333,5.8,13.3,1419.2,0.7333333333333333,1110.0,1453.5555555555557,0.03333333333333333,916.4137931034483,0.9666666666666667,0.9666666666666667,0.7666666666666667,35.0,50.0,2075.225,0.4,732.9411764705883,3067.3478260869565,0.075,946.2162162162163,0.925,0.925,0.75,15.533333333333333,26.666666666666668,2109.475,0.8222222222222221,614.3137254901961,2451.634460547504,0.06944444444444443,1078.0495092793942,0.9305555555555557,0.9194444444444446,0.8166666666666668 | |
| eval_results_avg4-global_step_90,8.3,16.7,2097.133333333333,0.8666666666666667,821.5,2188.25,0.06666666666666667,1104.107142857143,0.9333333333333333,0.9333333333333333,0.8666666666666667,4.2,10.0,979.6666666666666,1.0,744.0,987.7931034482758,0.0,979.6666666666666,1.0,1.0,0.8,39.4,65.0,1038.65,0.45,950.4375,1097.4583333333333,0.0,1038.65,1.0,1.0,0.7,17.3,30.566666666666666,1371.8166666666666,0.7722222222222223,838.6458333333334,1424.5004789272032,0.022222222222222223,1040.8079365079366,0.9777777777777779,0.9777777777777779,0.7888888888888889 | |
| eval_results_avg4-global_step_100,9.2,20.0,2757.4333333333334,0.7333333333333333,664.5,2906.9285714285716,0.06666666666666667,1811.5714285714287,0.9333333333333333,0.8666666666666667,0.8,1.7,3.3,2062.633333333333,1.1333333333333333,0.0,2062.633333333333,0.06666666666666667,1067.107142857143,0.9333333333333333,0.9,0.7666666666666667,40.6,62.5,917.4,0.55,757.8823529411765,1035.304347826087,0.0,917.4,1.0,1.0,0.825,17.166666666666668,28.599999999999998,1912.4888888888888,0.8055555555555557,474.1274509803922,2001.6220841959973,0.044444444444444446,1265.3595238095238,0.9555555555555556,0.9222222222222222,0.7972222222222222 | |