lordChipotle
/

Llama3GRPOReasoning

Reinforcement Learning

Model card Files Files and versions

Llama3GRPOReasoning

16.1 GB

Ctrl+K

Ctrl+K

1 contributor

History: 12 commits

lordChipotle's picture

Update README.md

b6e7b7a verified 10 months ago