Amartya77
/

RLHF_PPOppo_model

Reinforcement Learning

text2text-generation

Model card Files Files and versions

RLHF_PPOppo_model / README.md

Amartya77's picture

Create README.md

db7a170 verified about 2 years ago

|

history blame contribute delete

70 Bytes

license: mit
pipeline_tag: reinforcement-learning
tags:
  - code