AmberYifan
/

Qwen2.5-14B-Instruct-wildfeedback-RPO-iterDPO-iter1

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-14B-Instruct-wildfeedback-RPO-iterDPO-iter1 / vocab.json

AmberYifan's picture

Training in progress, epoch 1

9690e04 verified 9 months ago

history contribute delete

2.78 MB

File too large to display, you can check the raw version instead.