DR Tulu - a rl-research Collection

rl-research 's Collections

DR Tulu

updated Feb 24

Models and data associated with DR Tulu, http://allenai-web/papers/drtulu

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

Paper • 2511.19399 • Published Nov 24, 2025 • 64

Note Our paper!
rl-research/DR-Tulu-8B

Text Generation • 8B • Updated Feb 24 • 2.36k • • 75

Note Final RLER-trained model.
rl-research/DR-Tulu-SFT-8B

Text Generation • 8B • Updated Nov 29, 2025 • 85 • • 5

Note SFT model.
rl-research/dr-tulu-sft-data

Viewer • Updated Nov 25, 2025 • 13.1k • 245 • 29

Note Data used for SFT training.
rl-research/dr-tulu-rl-data

Viewer • Updated Nov 25, 2025 • 4.88k • 223 • 14

Note Data used for RL training.
rl-research/DR-Tulu-No-RLER-8B

Text Generation • 8B • Updated Feb 24 • 6

Note Ablation model, trained with RL without RLER.