Macromrit
/

SmolLM2-135M-GRPO-Trained-For-Reasoning

Model card Files Files and versions

SmolLM2-135M-GRPO-Trained-For-Reasoning / tokenizer.json

Commit History

Upload folder using huggingface_hub

9afa2ee
verified

Macromrit commited on Mar 9, 2025