zerg2187
/

GRPO_structeval_t_qwen3_v1

Reinforcement Learning

text-generation

structured-output

text-generation-inference

4-bit precision

Model card Files Files and versions

GRPO_structeval_t_qwen3_v1

2.67 GB

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

zerg2187's picture

Upload GRPO fine-tuned merged model

a49ffcb verified 4 months ago