LongTraceRL - a THU-KEG Collection

THU-KEG 's Collections

OpenSAE-LLaMA-3.1-8B

LongTraceRL

updated Jun 1

LongTraceRL: Learning Long-Context Reasoning from Search Agent Trajectories with Rubric Rewards

THU-KEG/LongTraceRL

Viewer • Updated Jun 1 • 2.82k • 78 • 1
THU-KEG/LongTraceRL-4B

Reinforcement Learning • 4B • Updated Jun 1 • 6 • 1
THU-KEG/LongTraceRL-8B

Reinforcement Learning • Updated Jun 1 • 1
THU-KEG/LongTraceRL-30B

Reinforcement Learning • 31B • Updated Jun 1 • 6 • 1
LongTraceRL: Learning Long-Context Reasoning from Search Agent Trajectories with Rubric Rewards

Paper • 2605.31584 • Published May 29 • 43