AmberYifan
/

Qwen2.5-7B-Instruct-wildfeedback-DRIFT-iter2-RPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-7B-Instruct-wildfeedback-DRIFT-iter2-RPO

Commit History

Model save

5714c42
verified

AmberYifan commited on Aug 2, 2025

Training in progress, epoch 1, checkpoint

e45ae80
verified

AmberYifan commited on Aug 2, 2025

Training in progress, epoch 1

8a2768b
verified

AmberYifan commited on Aug 2, 2025

initial commit

6946621
verified

AmberYifan commited on Aug 2, 2025