nabeelshan
/

rlhf-gpt2-pipeline

Text Generation

reinforcement-learning

instruction-tuning

Eval Results (legacy)

Model card Files Files and versions

rlhf-gpt2-pipeline

1.01 GB

Ctrl+K

Ctrl+K

2 contributors

History: 9 commits

nabeelshan's picture

Update README.md

341dcc6 verified 7 months ago