3 15 3

Zhepei Wei

weizhepei

https://weizhepei.com

AI & ML interests

None yet

Recent Activity

updated a dataset 4 days ago

weizhepei/swe-salvage-dev300

published a dataset 4 days ago

weizhepei/swe-salvage-dev300

updated a model about 1 month ago

relex-rlvr/RLVR-Qwen2.5-Math-1.5B

View all activity

Organizations

updated a dataset 4 days ago

weizhepei/swe-salvage-dev300

Viewer • Updated 4 days ago • 1.63k • 24

published a dataset 4 days ago

weizhepei/swe-salvage-dev300

Viewer • Updated 4 days ago • 1.63k • 24

updated a model about 1 month ago

relex-rlvr/RLVR-Qwen2.5-Math-1.5B

2B • Updated May 20 • 327

upvoted a paper about 1 month ago

You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories

Paper • 2605.21468 • Published May 20 • 51

submitted a paper to Daily Papers about 1 month ago

You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories

Paper • 2605.21468 • Published May 20 • 51

updated 2 models about 1 month ago

relex-rlvr/RLVR-Qwen3-4B-Base

Updated May 20 • 3

relex-rlvr/RELEX-Qwen2.5-Math-1.5B

2B • Updated May 20 • 10

published 6 models about 1 month ago

updated 3 models about 1 month ago

relex-rlvr/RLVR-Qwen3-8B-Base

8B • Updated May 20 • 54

relex-rlvr/RELEX-Qwen3-8B-Base

8B • Updated May 20 • 11 • 1

relex-rlvr/RELEX-Qwen3-4B-Base

4B • Updated May 20 • 9 • 1

upvoted a paper about 1 month ago

Code as Agent Harness

Paper • 2605.18747 • Published May 18 • 223

updated a model about 2 months ago

meng-lab/MATH-Qwen3-8B-Base-GRPO-Serval

Updated May 12

published a model about 2 months ago

meng-lab/MATH-OLMo-3-1025-7B-GRPO-Serval-15K

Updated May 12

upvoted a paper about 2 months ago

G-Zero: Self-Play for Open-Ended Generation from Zero Data

Paper • 2605.09959 • Published May 11 • 17

Zhepei Wei

AI & ML interests

Recent Activity

Organizations

weizhepei's activity