tmp-lpqm4 / eval_results_avg4 /eval_results.csv
bensondccnqwc's picture
Add files using upload-large-folder tool
a99ebfc verified
model,aime24_acc,aime24_pass_acc,aime24_tokens,aime24_keywords,aime24_correct_tokens,aime24_wrong_tokens,aime24_clip_ratio,aime24_stop_tokens,aime24_stop_ratio,aime24_box_ratio,aime24_repeat_ratio,aime25_acc,aime25_pass_acc,aime25_tokens,aime25_keywords,aime25_correct_tokens,aime25_wrong_tokens,aime25_clip_ratio,aime25_stop_tokens,aime25_stop_ratio,aime25_box_ratio,aime25_repeat_ratio,amc23_acc,amc23_pass_acc,amc23_tokens,amc23_keywords,amc23_correct_tokens,amc23_wrong_tokens,amc23_clip_ratio,amc23_stop_tokens,amc23_stop_ratio,amc23_box_ratio,amc23_repeat_ratio,avg_acc,avg_pass_acc,avg_tokens,avg_keywords,avg_correct_tokens,avg_wrong_tokens,avg_clip_ratio,avg_stop_tokens,avg_stop_ratio,avg_box_ratio,avg_repeat_ratio
eval_results_avg4-global_step_0,2.5,6.7,2604.0333333333333,7.466666666666667,1564.0,2639.896551724138,0.1,1115.5925925925926,0.9,0.8333333333333334,0.8,1.7,6.7,3296.8333333333335,0.7,1110.0,3372.2413793103447,0.13333333333333333,1056.1153846153845,0.8666666666666667,0.8666666666666667,0.7333333333333333,21.2,40.0,2133.9,0.15,729.4166666666666,2735.8214285714284,0.075,852.5135135135135,0.925,0.775,0.775,8.466666666666667,17.8,2678.2555555555555,2.772222222222222,1134.4722222222222,2915.9864532019706,0.10277777777777779,1008.0738302404967,0.8972222222222221,0.8250000000000001,0.7694444444444444
eval_results_avg4-global_step_10,5.8,13.3,2549.3333333333335,1.1,1519.3333333333333,2663.777777777778,0.06666666666666667,1588.5714285714287,0.9333333333333333,0.9333333333333333,0.7333333333333333,1.7,6.7,1699.6333333333334,0.6,0.0,1699.6333333333334,0.03333333333333333,1206.5172413793102,0.9666666666666667,0.9333333333333333,0.7333333333333333,31.2,45.0,1071.825,0.3,675.5714285714286,1285.1923076923076,0.0,1071.825,1.0,0.95,0.625,12.9,21.666666666666668,1773.5972222222224,0.6666666666666666,731.6349206349206,1882.8678062678064,0.03333333333333333,1288.971223316913,0.9666666666666667,0.9388888888888888,0.6972222222222223
eval_results_avg4-global_step_20,7.5,13.3,1499.2,0.3,766.6666666666666,1580.5925925925926,0.03333333333333333,999.4137931034483,0.9666666666666667,0.9333333333333333,0.7333333333333333,2.5,6.7,1315.1,0.3333333333333333,0.0,1315.1,0.03333333333333333,812.4137931034483,0.9666666666666667,0.9666666666666667,0.6666666666666666,31.9,55.0,870.825,0.275,680.2857142857143,973.4230769230769,0.0,870.825,1.0,0.975,0.675,13.966666666666667,25.0,1228.375,0.30277777777777776,482.3174603174603,1289.7052231718899,0.022222222222222223,894.2175287356322,0.9777777777777779,0.9583333333333334,0.6916666666666668
eval_results_avg4-global_step_30,5.8,13.3,2495.3,0.26666666666666666,517.0,2563.5172413793102,0.06666666666666667,1530.7142857142858,0.9333333333333333,0.8666666666666667,0.7666666666666667,3.3,6.7,838.2666666666667,0.43333333333333335,564.0,847.7241379310345,0.0,838.2666666666667,1.0,1.0,0.7,36.2,62.5,946.55,0.1,685.45,1207.65,0.0,946.55,1.0,0.975,0.75,15.100000000000001,27.5,1426.7055555555555,0.26666666666666666,588.8166666666667,1539.6304597701148,0.022222222222222223,1105.1769841269843,0.9777777777777779,0.9472222222222223,0.7388888888888889
eval_results_avg4-global_step_40,5.8,13.3,1955.8333333333333,6.966666666666667,747.0,1997.5172413793102,0.06666666666666667,952.7142857142857,0.9333333333333333,0.9333333333333333,0.7,1.7,6.7,861.4666666666667,0.4,0.0,861.4666666666667,0.0,861.4666666666667,1.0,1.0,0.7333333333333333,35.0,55.0,1062.125,0.175,645.3529411764706,1370.1739130434783,0.025,679.0769230769231,0.975,0.975,0.775,14.166666666666666,25.0,1293.1416666666667,2.513888888888889,464.1176470588236,1409.719273696485,0.030555555555555558,831.0859584859585,0.9694444444444444,0.9694444444444444,0.736111111111111
eval_results_avg4-global_step_50,6.7,13.3,2117.9666666666667,0.43333333333333335,841.3333333333334,2259.814814814815,0.06666666666666667,1126.5357142857142,0.9333333333333333,0.9333333333333333,0.7666666666666667,4.2,10.0,2448.133333333333,0.5333333333333333,1141.0,2541.5,0.1,942.4074074074074,0.9,0.9,0.8,38.1,57.5,1126.7,0.325,649.0833333333334,1331.392857142857,0.025,745.3333333333334,0.975,0.975,0.75,16.333333333333332,26.933333333333334,1897.6000000000001,0.4305555555555556,877.138888888889,2044.2358906525571,0.0638888888888889,938.0921516754851,0.9361111111111112,0.9361111111111112,0.7722222222222223
eval_results_avg4-global_step_60,5.8,6.7,3465.0333333333333,7.8,682.0,3663.8214285714284,0.13333333333333333,1536.6153846153845,0.8666666666666667,0.8333333333333334,0.7333333333333333,5.8,13.3,1436.9,0.6,1167.5,1456.142857142857,0.03333333333333333,934.7241379310345,0.9666666666666667,0.9666666666666667,0.7,37.5,55.0,996.4,0.125,621.4285714285714,1198.3076923076924,0.0,996.4,1.0,0.975,0.6,16.366666666666667,25.0,1966.111111111111,2.841666666666667,823.6428571428572,2106.0906593406594,0.05555555555555555,1155.9131741821398,0.9444444444444445,0.9249999999999999,0.6777777777777777
eval_results_avg4-global_step_70,5.0,10.0,2195.9,0.4666666666666667,709.6666666666666,2361.037037037037,0.06666666666666667,1209.9642857142858,0.9333333333333333,0.9,0.8666666666666667,1.7,3.3,2098.233333333333,0.43333333333333335,0.0,2098.233333333333,0.06666666666666667,1105.2857142857142,0.9333333333333333,0.9333333333333333,0.7333333333333333,35.6,52.5,1531.1,0.125,672.8181818181819,1856.655172413793,0.05,769.6052631578947,0.95,0.95,0.625,14.100000000000001,21.933333333333334,1941.7444444444445,0.3416666666666666,460.82828282828285,2105.3085142613877,0.061111111111111116,1028.2850877192982,0.9388888888888888,0.9277777777777777,0.7416666666666667
eval_results_avg4-global_step_80,6.7,16.7,2007.0333333333333,0.43333333333333335,0.0,2007.0333333333333,0.06666666666666667,1007.5714285714286,0.9333333333333333,0.9333333333333333,0.8,7.5,20.0,2807.5333333333333,0.43333333333333335,588.0,2884.0689655172414,0.13333333333333333,804.3846153846154,0.8666666666666667,0.8666666666666667,0.7333333333333333,35.6,55.0,810.5,0.175,609.6428571428571,918.6538461538462,0.0,810.5,1.0,1.0,0.75,16.599999999999998,30.566666666666666,1875.0222222222221,0.34722222222222227,399.2142857142857,1936.5853816681404,0.06666666666666667,874.1520146520146,0.9333333333333332,0.9333333333333332,0.7611111111111111
eval_results_avg4-global_step_90,8.3,13.3,1636.4333333333334,0.13333333333333333,878.6666666666666,1720.6296296296296,0.03333333333333333,1141.9310344827586,0.9666666666666667,0.9333333333333333,0.7666666666666667,1.7,3.3,1310.4333333333334,0.43333333333333335,786.0,1328.5172413793102,0.03333333333333333,803.8965517241379,0.9666666666666667,0.9666666666666667,0.8333333333333334,42.5,62.5,784.75,0.225,796.75,776.75,0.0,784.75,1.0,1.0,0.6,17.5,26.366666666666664,1243.8722222222223,0.2638888888888889,820.4722222222222,1275.29895700298,0.022222222222222223,910.1925287356322,0.9777777777777779,0.9666666666666667,0.7333333333333334
eval_results_avg4-global_step_100,5.8,16.7,2610.5666666666666,0.26666666666666666,1190.0,2659.551724137931,0.1,1122.888888888889,0.9,0.8666666666666667,0.7333333333333333,7.5,13.3,1856.7666666666667,0.43333333333333335,1135.75,1967.6923076923076,0.06666666666666667,846.5714285714286,0.9333333333333333,0.9333333333333333,0.8,30.6,60.0,845.4,0.3,690.6923076923077,919.8888888888889,0.0,845.4,1.0,1.0,0.8,14.633333333333335,30.0,1770.9111111111108,0.3333333333333333,1005.4807692307692,1849.0443069063758,0.05555555555555556,938.2867724867725,0.9444444444444445,0.9333333333333332,0.7777777777777777