AmberYifan
/

Llama-3-8B-Instruct-wildfeedback-RPO-iterDPO-iter1

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Llama-3-8B-Instruct-wildfeedback-RPO-iterDPO-iter1 / tokenizer.json

Commit History

Training in progress, epoch 1

90f4dda
verified

AmberYifan commited on Aug 30, 2025