🧙 Guru - a koalazf99 Collection

koalazf99 's Collections

🐙 OctoThinker

🫐 ProX Projects

🧙 Guru

updated Jun 20, 2025

Revisiting Reinforcement Learning for LLM Reasoning from A Cross-Domain Perspective

Revisiting Reinforcement Learning for LLM Reasoning from A Cross-Domain Perspective

Paper • 2506.14965 • Published Jun 17, 2025 • 50
LLM360/guru-RL-92k

Viewer • Updated Aug 20, 2025 • 91.9k • 1.07k • 47
LLM360/guru-7B

Text Generation • 8B • Updated Jun 19, 2025 • 20 • • 3
LLM360/guru-32B

Text Generation • 33B • Updated Jun 19, 2025 • 10 • 2