Li Xiaozhe's picture

5 3

Li Xiaozhe

OliverLee

OliverLeeXZ

AI & ML interests

None yet

Recent Activity

authored a paper about 12 hours ago

Beyond Mode Collapse: Distribution Matching for Diverse Reasoning

authored a paper about 12 hours ago

What and When to Distill: Selective Hindsight Distillation for Multi-Turn Agents

upvoted a paper 1 day ago

What and When to Distill: Selective Hindsight Distillation for Multi-Turn Agents

View all activity

Organizations

None yet

upvoted 3 papers 1 day ago

What and When to Distill: Selective Hindsight Distillation for Multi-Turn Agents

Paper • 2605.19447 • Published 4 days ago • 2

Beyond Mode Collapse: Distribution Matching for Diverse Reasoning

Paper • 2605.19461 • Published 4 days ago • 1

Learning from Language Feedback via Variational Policy Distillation

Paper • 2605.15113 • Published 5 days ago • 9

upvoted a paper 4 months ago

TL-GRPO: Turn-Level RL for Reasoning-Guided Iterative Optimization

Paper • 2601.16480 • Published Jan 23 • 50

upvoted a paper about 1 year ago

LEGO-Puzzles: How Good Are MLLMs at Multi-Step Spatial Reasoning?

Paper • 2503.19990 • Published Mar 25, 2025 • 35