Yihong Wu's picture

Yihong Wu

Yihong7788

·

AI & ML interests

None yet

Recent Activity

updated a model 28 days ago

Yihong7788/qwen2_5_vl_3b_geo3k

published a model 28 days ago

Yihong7788/qwen2_5_vl_3b_geo3k

updated a model 28 days ago

Yihong7788/qwen2_5_vl_7b_geo3k

View all activity

Organizations

None yet

upvoted 2 papers 7 months ago

It Takes Two: Your GRPO Is Secretly DPO

Paper • 2510.00977 • Published Oct 1, 2025 • 32

On Predictability of Reinforcement Learning Dynamics for Large Language Models

Paper • 2510.00553 • Published Oct 1, 2025 • 9

upvoted a paper 12 months ago

REARANK: Reasoning Re-ranking Agent via Reinforcement Learning

Paper • 2505.20046 • Published May 26, 2025 • 18