abdulsamad
/

SmolGRPO-135M

Text Generation

Reasoning-Course

text-generation-inference

Model card Files Files and versions

Commit History

Trained with Unsloth

cc87e89
verified

abdulsamad commited on Apr 6, 2025

Upload tokenizer

37b3e5f
verified

abdulsamad commited on Apr 6, 2025

Upload LlamaForCausalLM

f8a1cc0
verified

abdulsamad commited on Mar 14, 2025

initial commit

abae6ec
verified

abdulsamad commited on Mar 14, 2025