YYYYYYibo
/

selm_ours_iter_3

alignment-handbook

Generated from Trainer

Model card Files Files and versions

selm_ours_iter_3

Commit History

RDPO-7b-beta0.01-eta0.001

69d1953
verified

YYYYYYibo commited on Aug 22, 2024

Model save

241cf89
verified

YYYYYYibo commited on Aug 22, 2024

Training in progress, epoch 0

a50985f
verified

YYYYYYibo commited on Aug 22, 2024

initial commit

3269219
verified

YYYYYYibo commited on Aug 21, 2024