caiyuchen

caiyuchen

·

AI & ML interests

None yet

Recent Activity

updated a dataset about 14 hours ago

caiyuchen/cryptoalpha-panel

published a dataset about 14 hours ago

caiyuchen/cryptoalpha-panel

upvoted a paper 19 days ago

OPD-Evolver: Cultivating Holistic Agent Evolver via On-Policy Distillation

View all activity

Organizations

None yet

upvoted a paper 19 days ago

OPD-Evolver: Cultivating Holistic Agent Evolver via On-Policy Distillation

Paper • 2606.17628 • Published 20 days ago • 28

upvoted a paper about 2 months ago

Learning to Foresee: Unveiling the Unlocking Efficiency of On-Policy Distillation

Paper • 2605.11739 • Published May 13 • 60

upvoted a paper 5 months ago

Composition-RL: Compose Your Verifiable Prompts for Reinforcement Learning of Large Language Models

Paper • 2602.12036 • Published Feb 12 • 95

upvoted 2 papers 9 months ago

On Predictability of Reinforcement Learning Dynamics for Large Language Models

Paper • 2510.00553 • Published Oct 1, 2025 • 9

Thinking-Free Policy Initialization Makes Distilled Reasoning Models More Effective and Efficient Reasoners

Paper • 2509.26226 • Published Sep 30, 2025 • 34