shuo yang

shuo-yan

AI & ML interests

None yet

Recent Activity

upvoted a paper 16 days ago

OPID: On-Policy Skill Distillation for Agentic Reinforcement Learning

upvoted a paper about 2 months ago

Maestro: Reinforcement Learning to Orchestrate Hierarchical Model-Skill Ensembles

new activity 5 months ago

Jinyang23/Spark-1.5B-ScienceWorld:Update README.md

View all activity

Organizations

None yet

upvoted a paper 16 days ago

OPID: On-Policy Skill Distillation for Agentic Reinforcement Learning

Paper • 2606.26790 • Published 17 days ago • 54

upvoted a paper about 2 months ago

Maestro: Reinforcement Learning to Orchestrate Hierarchical Model-Skill Ensembles

Paper • 2605.22177 • Published May 21 • 21

upvoted a paper 5 months ago

Spark: Strategic Policy-Aware Exploration via Dynamic Branching for Long-Horizon Agentic Learning

Paper • 2601.20209 • Published Jan 28 • 24