celestialcreator
/

Qwen3.5-0.8B-GRPO-Math

Text Generation

reinforcement-learning

Model card Files Files and versions

Qwen3.5-0.8B-GRPO-Math

Ctrl+K

Ctrl+K

1 contributor

History: 10 commits

celestialcreator's picture

celestialcreator

Upload README.md with huggingface_hub

0a9c51e verified 4 months ago