Miracle12345
/

gemma-3-GRPO

Reinforcement Learning

instruction-tuning

Model card Files Files and versions

gemma-3-GRPO / tokenizer_config.json

Miracle12345's picture

Upload model trained with Unsloth

3c02089 verified 8 months ago

history contribute delete

1.16 MB

File too large to display, you can check the raw version instead.