Macromrit
/

SmolLM2-135M-GRPO-Trained-For-Reasoning

Model card Files Files and versions

SmolLM2-135M-GRPO-Trained-For-Reasoning

Commit History

Update README.md

d95fa21
verified

Macromrit commited on Mar 9, 2025

Upload GRPO.png

b8a2908
verified

Macromrit commited on Mar 9, 2025

Update README.md

4682436
verified

Macromrit commited on Mar 9, 2025

Upload folder using huggingface_hub

9afa2ee
verified

Macromrit commited on Mar 9, 2025

initial commit

3e3a6a9
verified

Macromrit commited on Mar 9, 2025