Henry Chan's picture

2

Henry Chan

PirateOfSH

AI & ML interests

None yet

Recent Activity

upvoted a paper about 16 hours ago

ProRL: Effective Reinforcement Learning for Proactive Recommendation via Rectified Policy Gradient Estimation

upvoted a paper 6 months ago

Entropy Ratio Clipping as a Soft Global Constraint for Stable Reinforcement Learning

View all activity

Organizations

None yet

upvoted a paper about 16 hours ago

ProRL: Effective Reinforcement Learning for Proactive Recommendation via Rectified Policy Gradient Estimation

Paper • 2605.28293 • Published 2 days ago • 76

upvoted a paper 6 months ago

Entropy Ratio Clipping as a Soft Global Constraint for Stable Reinforcement Learning

Paper • 2512.05591 • Published Dec 5, 2025 • 17