nnheui
/

pythia-1.4b-dpo-full

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

pythia-1.4b-dpo-full

2.83 GB

1 contributor

History: 71 commits

nnheui's picture

End of training

1a33399 verified over 1 year ago