Qing Yang's picture

Qing Yang

hushqyang

·

AI & ML interests

LLM Engineering

Organizations

upvoted a paper 10 months ago

Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models

Paper • 2506.06395 • Published Jun 5, 2025 • 135

upvoted a paper 11 months ago

Reinforcement Learning for Reasoning in Large Language Models with One Training Example

Paper • 2504.20571 • Published Apr 29, 2025 • 98