lisali126
/

DDR1_Q1.5B-GRPOFixReward

Model card Files Files and versions

DDR1_Q1.5B-GRPOFixReward / tokenizer.json

Commit History

Training in progress, step 20

168c976
verified

lisali126 commited on Dec 9, 2025