yi wei's picture

4

yi wei

yxxi

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

LongTraceRL: Learning Long-Context Reasoning from Search Agent Trajectories with Rubric Rewards

upvoted a paper 5 months ago

Chaining the Evidence: Robust Reinforcement Learning for Deep Search Agents with Citation-Aware Rubric Rewards

upvoted a paper 8 months ago

Boundary-Guided Policy Optimization for Memory-efficient RL of Diffusion Large Language Models

View all activity

Organizations

None yet

models 0

None public yet

datasets 0

None public yet