Han Yang

yaanhaan

·

AI & ML interests

None yet

Recent Activity

updated a dataset 27 days ago

yaanhaan/CostAwareRAGDataset

published a dataset 27 days ago

yaanhaan/CostAwareRAGDataset

liked a dataset 3 months ago

qiaojin/PubMedQA

View all activity

Organizations

None yet

upvoted a paper 4 months ago

Self-Distilled Reasoner: On-Policy Self-Distillation for Large Language Models

Paper • 2601.18734 • Published Jan 26 • 8

upvoted an article 4 months ago

Article

NuminaMath 是如何荣膺首届 AIMO 进步奖的？

+6

yfleureau, liyongsea, edbeeching, lewtun, benlipkin, romansoletskyi, vwxyzjn, kashif

•

Jul 11, 2024

• 1

upvoted a paper 7 months ago

Memory-R1: Enhancing Large Language Model Agents to Manage and Utilize Memories via Reinforcement Learning

Paper • 2508.19828 • Published Aug 27, 2025 • 8

upvoted 2 collections 8 months ago

Reinforcement learning

195 items • Updated about 17 hours ago • 13

Agent & RL

55 items • Updated Nov 27, 2025 • 21