kevinpro
/

R-PRM-7B-DPO

Text Generation

reinforcement-learning

Model card Files Files and versions

R-PRM-7B-DPO / fig

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

kevinpro's picture

Upload folder using huggingface_hub

4863973 verified about 1 year ago