OPID - a Jinyang23 Collection

Jinyang23 's Collections

OPID

updated 2 days ago

OPID

Jinyang23/OPID-ALFWorld-1.7B

Reinforcement Learning • 2B • Updated 7 days ago • 109 • 1
OPID: On-Policy Skill Distillation for Agentic Reinforcement Learning

Paper • 2606.26790 • Published 8 days ago • 53