AmberYifan
/

Qwen2.5-14B-Instruct-ultrafeedback-spin-iter2-RPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-14B-Instruct-ultrafeedback-spin-iter2-RPO

Commit History

Model save

5492ebd
verified

AmberYifan commited on Aug 7, 2025

Training in progress, epoch 1, checkpoint

6d3d9ec
verified

AmberYifan commited on Aug 7, 2025

Training in progress, epoch 1

66812cb
verified

AmberYifan commited on Aug 7, 2025

initial commit

5650c92
verified

AmberYifan commited on Aug 7, 2025