Sean13
/

llama-8b-instruct-rdpo-full

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

llama-8b-instruct-rdpo-full / runs

845 kB

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

Sean13's picture

Model save

3802569 verified 7 months ago

Sep23_20-56-23_pm-d04f
Model save 7 months ago