MohammadRafiML
/

Qwen3-4B-Instruct-2507-Capstone-MathRL

Reinforcement Learning

Model card Files Files and versions

Qwen3-4B-Instruct-2507-Capstone-MathRL / grpo_adapter

284 MB

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

MohammadRafiML's picture

Upload adapter_model.safetensors

078d9c8 verified 3 months ago