Zikang Shan's picture

Zikang Shan PRO

zkshan2002

·

https://zkshan2002.github.io/

zkshan2002

AI & ML interests

Reinforcement Learning

Organizations

zkshan2002 's datasets 31

zkshan2002/rstar2a

Viewer • Updated Sep 2, 2025 • 42.3k • 4

zkshan2002/alpaca_eval

Viewer • Updated Aug 26, 2025 • 805 • 470

zkshan2002/ultrafeedback_binarized

Viewer • Updated Aug 22, 2025 • 63.1k • 9

zkshan2002/simple_rl_level1to4

Viewer • Updated Aug 19, 2025 • 8.64k • 3

zkshan2002/simple_rl_level3to5

Viewer • Updated Aug 19, 2025 • 9.02k • 3

zkshan2002/dr_sft

Viewer • Updated Aug 9, 2025 • 5.91k • 3

zkshan2002/prime_sft

Viewer • Updated Aug 9, 2025 • 5.58k • 71

zkshan2002/prime_full

Viewer • Updated Aug 9, 2025 • 456k • 18

zkshan2002/dr_full

Viewer • Updated Aug 9, 2025 • 40.3k • 4

zkshan2002/dr_sft_legacy

Viewer • Updated Aug 8, 2025 • 6.03k • 38

zkshan2002/numina_math

Viewer • Updated Aug 8, 2025 • 455k • 11

zkshan2002/dr_debug3

Viewer • Updated Aug 8, 2025 • 40.3k • 11

zkshan2002/prime_math_legacy

Viewer • Updated Apr 24, 2025 • 456k • 5

zkshan2002/numia10k_gen0-r1d7b

Viewer • Updated Apr 15, 2025 • 10.2k • 9

zkshan2002/numia10k_gen0.75-r1d7b

Viewer • Updated Apr 15, 2025 • 10.2k • 4

zkshan2002/numia10k_sft-32b

Viewer • Updated Apr 12, 2025 • 2.13k • 31

zkshan2002/numia10k_sft-r1d32b

Viewer • Updated Apr 12, 2025 • 6.1k • 4

zkshan2002/numia10k_gen-32b

Viewer • Updated Apr 12, 2025 • 10.2k • 7

zkshan2002/numia10k_gen-r1d32b

Viewer • Updated Apr 12, 2025 • 10.2k • 5

zkshan2002/numia_math_train-10k

Viewer • Updated Apr 10, 2025 • 10.2k • 11

zkshan2002/gpqa_diamond

Viewer • Updated Apr 10, 2025 • 198 • 238

zkshan2002/olympiad_bench

Viewer • Updated Apr 10, 2025 • 675 • 8

zkshan2002/minerva_math

Viewer • Updated Apr 10, 2025 • 272 • 5

zkshan2002/math500

Viewer • Updated Apr 10, 2025 • 500 • 9

zkshan2002/amc23

Viewer • Updated Apr 10, 2025 • 40 • 9

zkshan2002/aime25

Viewer • Updated Apr 10, 2025 • 30 • 10

zkshan2002/aime24

Viewer • Updated Apr 10, 2025 • 30 • 3

zkshan2002/orz_hard-13k

Viewer • Updated Apr 3, 2025 • 13.5k • 15

zkshan2002/orz_extended-72k

Viewer • Updated Apr 3, 2025 • 72.4k • 14

zkshan2002/orz-57k

Viewer • Updated Mar 28, 2025 • 56.9k • 9