Dawn's picture

3

Dawn

LegendaryDawn

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 15 hours ago

Prepare Reasoning Language Models for Multi-Agent Debate with Self-Debate Reinforcement Learning

upvoted a paper about 15 hours ago

PhyCritic: Multimodal Critic Models for Physical AI

updated a model 1 day ago

LegendaryDawn/SDRL-baseline-Qwen3-8B-Base-DAPO-n8-bs256-long12-yarn2-step200

View all activity

Organizations

None yet

upvoted 2 papers about 15 hours ago

Prepare Reasoning Language Models for Multi-Agent Debate with Self-Debate Reinforcement Learning

Paper • 2601.22297 • Published 14 days ago • 1

PhyCritic: Multimodal Critic Models for Physical AI

Paper • 2602.11124 • Published 1 day ago • 40

upvoted a paper 2 months ago

Explore Data Left Behind in Reinforcement Learning for Reasoning Language Models

Paper • 2511.04800 • Published Nov 6, 2025 • 1