Qi Tiansheng's picture

2

Qi Tiansheng

TS789

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

Rethinking the Trust Region in LLM Reinforcement Learning

upvoted a paper 9 months ago

Optimizing Anytime Reasoning via Budget Relative Policy Optimization

View all activity

Organizations

None yet

upvoted a paper 1 day ago

Rethinking the Trust Region in LLM Reinforcement Learning

Paper • 2602.04879 • Published 1 day ago • 25

upvoted a paper 9 months ago

Optimizing Anytime Reasoning via Budget Relative Policy Optimization

Paper • 2505.13438 • Published May 19, 2025 • 36