smsk-01
/

SmolLM-135M-Instruct-GRPO

Text Generation

text-generation-inference

Model card Files Files and versions

SmolLM-135M-Instruct-GRPO

Commit History

Upload vocab (1).json

6d6c56d
verified

smsk-01 commited on Mar 10, 2025

Upload merges.txt

bb6c48f
verified

smsk-01 commited on Mar 10, 2025

Upload 3 files

9418c3f
verified

smsk-01 commited on Mar 10, 2025

Upload LlamaForCausalLM

6c52f66
verified

smsk-01 commited on Mar 10, 2025

initial commit

7bc674d
verified

smsk-01 commited on Mar 10, 2025