AmberYifan
/

Llama-3.1-8B-Instruct-wildfeedback-RPO-iterDPO-iter1

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Llama-3.1-8B-Instruct-wildfeedback-RPO-iterDPO-iter1

Commit History

Model save

48afed1
verified

AmberYifan commited on Jul 28, 2025

Training in progress, epoch 1, checkpoint

94218fc
verified

AmberYifan commited on Jul 28, 2025

Training in progress, epoch 1

7b20d67
verified

AmberYifan commited on Jul 28, 2025

initial commit

5a5d827
verified

AmberYifan commited on Jul 28, 2025