Yanhan Ye's picture

Yanhan Ye

CoolColoury

·

CoolColoury

AI & ML interests

None yet

Organizations

upvoted 2 papers 5 months ago

Rewarding the Rare: Uniqueness-Aware RL for Creative Problem Solving in LLMs

Paper • 2601.08763 • Published Jan 13 • 150

Collaborative Multi-Agent Test-Time Reinforcement Learning for Reasoning

Paper • 2601.09667 • Published Jan 14 • 92

upvoted a collection 8 months ago

PCC-Finetuned

11 items • Updated Sep 22, 2025 • 2

upvoted an article over 1 year ago

Article

Mastering Tensor Dimensions in Transformers

not-lain

•

Jan 12, 2025

• 185

upvoted a paper over 2 years ago

LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models

Paper • 2403.13372 • Published Mar 20, 2024 • 185