Sean13
/

llama-8b-instruct-rdpo-full

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

llama-8b-instruct-rdpo-full / tokenizer.json

Commit History

Model save

3802569
verified

Sean13 commited on Sep 23, 2025