ArenaRL - a Alibaba-NLP Collection

Alibaba-NLP 's Collections

ArenaRL

updated Mar 2

Scaling RL for Open-Ended Agents via Tournamentbased Relative Ranking

Alibaba-NLP/Open-Travel

Preview • Updated Jan 16 • 185 • 4
Alibaba-NLP/Open-DeepResearch

Preview • Updated Jan 16 • 1.18k • 6
ArenaRL: Scaling RL for Open-Ended Agents via Tournament-based Relative Ranking

Paper • 2601.06487 • Published Jan 10 • 54