LLMAligned
/

grpo_gsm8k_model

Reinforcement Learning

Model card Files Files and versions

grpo_gsm8k_model

1.2 GB

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

LLMAligned's picture

Upload folder using huggingface_hub

c3ebce3 verified 6 months ago