Sean13
/

llama-8b-instruct-rdpo-full-multipref-init-eta-0.99

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

llama-8b-instruct-rdpo-full-multipref-init-eta-0.99 / tokenizer.json

Sean13's picture

Training in progress, step 229

12a65af verified 5 months ago

history contribute delete

3.51 MB

File too large to display, you can check the raw version instead.