tmp-lpqm4 / eval_results_avg32 /eval_results.csv
bensondccnqwc's picture
Add files using upload-large-folder tool
74dc70a verified
model,aime24_acc,aime24_pass_acc,aime24_tokens,aime24_keywords,aime24_correct_tokens,aime24_wrong_tokens,aime24_clip_ratio,aime24_stop_tokens,aime24_stop_ratio,aime24_box_ratio,aime24_repeat_ratio,aime25_acc,aime25_pass_acc,aime25_tokens,aime25_keywords,aime25_correct_tokens,aime25_wrong_tokens,aime25_clip_ratio,aime25_stop_tokens,aime25_stop_ratio,aime25_box_ratio,aime25_repeat_ratio,avg_acc,avg_pass_acc,avg_tokens,avg_keywords,avg_correct_tokens,avg_wrong_tokens,avg_clip_ratio,avg_stop_tokens,avg_stop_ratio,avg_box_ratio,avg_repeat_ratio
eval_results_avg32-global_step_10,4.3,23.3,2835.1666666666665,1.1666666666666667,1646.5,2920.0714285714284,0.06666666666666667,1894.9642857142858,0.9333333333333333,0.9,0.7666666666666667,3.5,36.7,1510.4333333333334,0.7,919.0,1530.8275862068965,0.03333333333333333,1011.0,0.9666666666666667,0.9333333333333333,0.8,3.9,30.0,2172.8,0.9333333333333333,1282.75,2225.4495073891626,0.05,1452.982142857143,0.95,0.9166666666666667,0.7833333333333334
eval_results_avg32-global_step_20,6.1,30.0,2586.2,0.36666666666666664,1439.6666666666667,2713.5925925925926,0.06666666666666667,1627.9285714285713,0.9333333333333333,0.8666666666666667,0.8,2.6,30.0,1502.1,5.266666666666667,0.0,1502.1,0.03333333333333333,1012.1034482758621,0.9666666666666667,0.9666666666666667,0.7666666666666667,4.35,30.0,2044.1499999999999,2.8166666666666664,719.8333333333334,2107.8462962962963,0.05,1320.0160098522167,0.95,0.9166666666666667,0.7833333333333334
eval_results_avg32-global_step_30,5.9,23.3,1426.5,0.26666666666666666,582.0,1455.6206896551723,0.03333333333333333,923.8620689655172,0.9666666666666667,0.9666666666666667,0.8,2.7,26.7,1052.1,0.4666666666666667,0.0,1052.1,0.0,1052.1,1.0,1.0,0.7333333333333333,4.300000000000001,25.0,1239.3,0.3666666666666667,291.0,1253.8603448275862,0.016666666666666666,987.9810344827586,0.9833333333333334,0.9833333333333334,0.7666666666666666
eval_results_avg32-global_step_40,6.6,30.0,3519.3333333333335,0.7,703.0,3720.5,0.1,2132.703703703704,0.9,0.8,0.7666666666666667,3.9,26.7,1426.0333333333333,0.43333333333333335,1064.0,1438.5172413793102,0.03333333333333333,923.6551724137931,0.9666666666666667,0.9666666666666667,0.7666666666666667,5.25,28.35,2472.6833333333334,0.5666666666666667,883.5,2579.508620689655,0.06666666666666667,1528.1794380587485,0.9333333333333333,0.8833333333333333,0.7666666666666667
eval_results_avg32-global_step_50,5.9,26.7,1848.9333333333334,0.36666666666666664,1034.5,1907.107142857143,0.06666666666666667,838.1428571428571,0.9333333333333333,0.9333333333333333,0.8,3.6,30.0,1298.9,0.3333333333333333,0.0,1298.9,0.03333333333333333,791.9655172413793,0.9666666666666667,0.9666666666666667,0.7666666666666667,4.75,28.35,1573.9166666666667,0.35,517.25,1603.0035714285714,0.05,815.0541871921182,0.95,0.95,0.7833333333333334
eval_results_avg32-global_step_60,6.7,30.0,2338.9333333333334,10.766666666666667,636.0,2397.655172413793,0.1,821.1111111111111,0.9,0.9,0.8,3.8,26.7,1387.9,0.5666666666666667,949.5,1419.2142857142858,0.03333333333333333,884.0344827586207,0.9666666666666667,0.9666666666666667,0.9,5.25,28.35,1863.4166666666667,5.666666666666667,792.75,1908.4347290640394,0.06666666666666667,852.5727969348659,0.9333333333333333,0.9333333333333333,0.8500000000000001
eval_results_avg32-global_step_70,8.0,26.7,1388.7333333333333,0.3,749.6666666666666,1459.7407407407406,0.03333333333333333,884.8965517241379,0.9666666666666667,0.9666666666666667,0.8333333333333334,4.0,26.7,804.1,0.5666666666666667,949.0,799.1034482758621,0.0,804.1,1.0,1.0,0.7,6.0,26.7,1096.4166666666667,0.43333333333333335,849.3333333333333,1129.4220945083014,0.016666666666666666,844.498275862069,0.9833333333333334,0.9833333333333334,0.7666666666666666
eval_results_avg32-global_step_80,7.2,33.3,1556.3333333333333,0.9333333333333333,950.0,1649.6153846153845,0.03333333333333333,1058.2413793103449,0.9666666666666667,0.9,0.7,3.3,23.3,1531.0333333333333,0.26666666666666666,566.0,1564.3103448275863,0.03333333333333333,1032.2068965517242,0.9666666666666667,0.9333333333333333,0.8666666666666667,5.25,28.299999999999997,1543.6833333333334,0.6,758.0,1606.9628647214854,0.03333333333333333,1045.2241379310344,0.9666666666666667,0.9166666666666667,0.7833333333333333
eval_results_avg32-global_step_90,7.8,33.3,3320.5333333333333,0.23333333333333334,1243.0,3392.1724137931033,0.16666666666666666,784.8,0.8333333333333334,0.8333333333333334,0.8,4.2,23.3,1890.7666666666667,0.4666666666666667,958.5,1957.357142857143,0.03333333333333333,1404.2758620689656,0.9666666666666667,0.9,0.7333333333333333,6.0,28.299999999999997,2605.65,0.35,1100.75,2674.764778325123,0.09999999999999999,1094.5379310344829,0.9,0.8666666666666667,0.7666666666666666
eval_results_avg32-global_step_100,8.8,30.0,1852.9333333333334,0.26666666666666666,584.5,1943.5357142857142,0.06666666666666667,842.9285714285714,0.9333333333333333,0.9333333333333333,0.7333333333333333,5.0,33.3,1624.5333333333333,0.36666666666666664,1284.5,1648.8214285714287,0.03333333333333333,1128.8275862068965,0.9666666666666667,0.9333333333333333,0.6333333333333333,6.9,31.65,1738.7333333333333,0.31666666666666665,934.5,1796.1785714285716,0.05,985.8780788177339,0.95,0.9333333333333333,0.6833333333333333