kangdawei
/

DRA-DR_GRPO-7B

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Commit History

End of training

e16e6e5
verified

kangdawei commited on Nov 22, 2025

Model save

81d4b3e
verified

kangdawei commited on Nov 22, 2025

Training in progress, step 500

b190020
verified

kangdawei commited on Nov 22, 2025

Training in progress, step 450

281f9ea
verified

kangdawei commited on Nov 22, 2025

Training in progress, step 400

422d6f3
verified

kangdawei commited on Nov 22, 2025

Training in progress, step 350

ee07d13
verified

kangdawei commited on Nov 22, 2025

Training in progress, step 300

49506e3
verified

kangdawei commited on Nov 21, 2025

Training in progress, step 250

bfd7e9e
verified

kangdawei commited on Nov 21, 2025

Training in progress, step 200

d15cce6
verified

kangdawei commited on Nov 21, 2025

Training in progress, step 150

0916f6d
verified

kangdawei commited on Nov 21, 2025

Training in progress, step 100

30843db
verified

kangdawei commited on Nov 21, 2025

Training in progress, step 50

6905471
verified

kangdawei commited on Nov 21, 2025

initial commit

68610fa
verified

kangdawei commited on Nov 20, 2025