Vibudhbh
/

gpt2-rlhf-implementation

Text Generation

reinforcement-learning-from-human-feedback

anthropic-hh-rlhf

chatgpt-style-training

supervised-fine-tuning

human-preferences

text-generation-inference

Model card Files Files and versions

gpt2-rlhf-implementation

499 MB

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

Vibudhbh's picture

Add comprehensive model card

baca339 verified 7 months ago