kangdawei
/

MMR-Sigmoid-DR-GRPO-7B

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

MMR-Sigmoid-DR-GRPO-7B / adapter

334 MB

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

kangdawei's picture

Model save

47029a1 verified 4 months ago