linok's picture

5

linok

linok23

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

LiveTalk: Real-Time Multimodal Interactive Video Diffusion via Improved On-Policy Distillation

upvoted a paper 2 months ago

BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced Policy Optimization with Adaptive Clipping

upvoted a paper 3 months ago

LIMI: Less is More for Agency

View all activity

Organizations

None yet

upvoted a paper 1 day ago

LiveTalk: Real-Time Multimodal Interactive Video Diffusion via Improved On-Policy Distillation

Paper • 2512.23576 • Published 1 day ago • 55

upvoted a paper 2 months ago

BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced Policy Optimization with Adaptive Clipping

Paper • 2510.18927 • Published Oct 21 • 83

upvoted a paper 3 months ago

LIMI: Less is More for Agency

Paper • 2509.17567 • Published Sep 22 • 102

upvoted a paper 6 months ago

OctoThinker: Mid-training Incentivizes Reinforcement Learning Scaling

Paper • 2506.20512 • Published Jun 25 • 48

upvoted a paper over 1 year ago

Programming Every Example: Lifting Pre-training Data Quality like Experts at Scale

Paper • 2409.17115 • Published Sep 25, 2024 • 63