MattBou00
/

SingleLR001

Reinforcement Learning

text-generation

text-generation-inference

Model card Files Files and versions

2.49 GB

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

MattBou00's picture

Final model after RLHF training

e743e04 verified 8 months ago