forestliutc
/

UloRL

forestliutc commited on Jul 31, 2025

Commit

fbcdebe

verified ·

1 Parent(s): 66e754e

Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -5,11 +5,10 @@ base_model:
 ---
 <div align="center">
-#  UloRL
 <div>
    An <strong>U</strong>ltra-<strong>L</strong>ong <strong>O</strong>utput <strong>R</strong>einforcement <strong>L</strong>earning Approach for Advancing Large Language Models' Reasoning Abilities
 </div>
 </div>
 ## Overview

 ---
 <div align="center">
 <div>
    An <strong>U</strong>ltra-<strong>L</strong>ong <strong>O</strong>utput <strong>R</strong>einforcement <strong>L</strong>earning Approach for Advancing Large Language Models' Reasoning Abilities
 </div>
+<a href="https://arxiv.org/pdf/2507.19766" target="_blank">Paper</a> | <a href="https://github.com/liushulinle/UloRL" target="_blank">GitHub</a>
 </div>
 ## Overview