AmberYifan
/

Qwen2.5-14B-Instruct-wildfeedback-RPO-iterDPO-iter1

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-14B-Instruct-wildfeedback-RPO-iterDPO-iter1

Commit History

Model save

fb75b6a
verified

AmberYifan commited on Jul 29, 2025

Training in progress, epoch 1, checkpoint

77e7050
verified

AmberYifan commited on Jul 29, 2025

Training in progress, epoch 1

9690e04
verified

AmberYifan commited on Jul 29, 2025

initial commit

0507a68
verified

AmberYifan commited on Jul 29, 2025