AmberYifan
/

Qwen2.5-14B-Instruct-wildfeedback-RPO-SPIN-iter1

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-14B-Instruct-wildfeedback-RPO-SPIN-iter1

Commit History

Model save

0c2cebe
verified

AmberYifan commited on Jul 29, 2025

Training in progress, epoch 1, checkpoint

4cfb634
verified

AmberYifan commited on Jul 29, 2025

Training in progress, epoch 1

e881dbd
verified

AmberYifan commited on Jul 29, 2025

initial commit

b687fbc
verified

AmberYifan commited on Jul 29, 2025