Miracle12345
/

gemma-3-GRPO

Reinforcement Learning

instruction-tuning

Model card Files Files and versions

65.4 MB

Ctrl+K

Ctrl+K

1 contributor

History: 6 commits

Miracle12345's picture

finalize

c228698 9 months ago