Tool-Augmented Reward Models - a ernie-research Collection

ernie-research 's Collections

NAVA (Native Audio-Visual Alignment for Generation)

Tool-Augmented Reward Models

Multilingual Code Pre-training (ERNIE-Code)

Pixel-based Pre-training (PixelGPT)

Macro-Action RLHF

Tool-Augmented Reward Models

updated May 21, 2025

[ICLR'24 Spotlight] Tool-Augmented Reward Modeling