t2ance
/

CodeRM-SFT-Warmup-Selection-4B

Commit History

SFT warmup LoRA for 4B judge (9367 samples, 1 epoch)

bc9cb33
verified

t2ance commited on 1 day ago