celestialcreator
/

Qwen3.5-0.8B-GRPO-Math

Text Generation

reinforcement-learning

Model card Files Files and versions

Qwen3.5-0.8B-GRPO-Math / README.md

Commit History

Upload README.md with huggingface_hub

0a9c51e
verified

celestialcreator commited on 24 days ago

Upload README.md with huggingface_hub

57b9a33
verified

celestialcreator commited on 24 days ago

Upload README.md with huggingface_hub

6bc26de
verified

celestialcreator commited on 24 days ago