shirwu
/

reward_model_train_debug

4-bit precision

Model card Files Files and versions

reward_model_train_debug / tokenizer.json

Commit History

Training in progress, step 1

10eee11
verified

shirwu commited on Feb 16, 2025