YYYYYYibo
/

approx_nash_rdpo_iter_3

alignment-handbook

Generated from Trainer

Model card Files Files and versions

approx_nash_rdpo_iter_3

Commit History

RDPO-7b-beta0.01-eta0.001

09bcec9
verified

YYYYYYibo commited on Aug 7, 2024

Model save

bf61105
verified

YYYYYYibo commited on Aug 7, 2024

Training in progress, epoch 0

4413efa
verified

YYYYYYibo commited on Aug 7, 2024

initial commit

04649ee
verified

YYYYYYibo commited on Aug 6, 2024