kangdawei
/

MMR-DR_GRPO-lambda-0.8

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

MMR-DR_GRPO-lambda-0.8

1 contributor

History: 6 commits

kangdawei's picture

Training in progress, step 500

576de5e verified 4 months ago