YuxianJiang's picture

3

YuxianJiang

Linn3a3

AI & ML interests

None yet

Recent Activity

upvoted a paper about 16 hours ago

DARE: Diffusion Large Language Models Alignment and Reinforcement Executor

upvoted a paper 6 months ago

Conditional Advantage Estimation for Reinforcement Learning in Large Reasoning Models

upvoted a paper 6 months ago

Rethinking Entropy Regularization in Large Reasoning Models

View all activity

Organizations

None yet

upvoted a paper about 16 hours ago

DARE: Diffusion Large Language Models Alignment and Reinforcement Executor

Paper • 2604.04215 • Published 4 days ago • 17

upvoted 2 papers 6 months ago

Conditional Advantage Estimation for Reinforcement Learning in Large Reasoning Models

Paper • 2509.23962 • Published Sep 28, 2025 • 5

Rethinking Entropy Regularization in Large Reasoning Models

Paper • 2509.25133 • Published Sep 29, 2025 • 4