YYYYYYibo
/

two_agent_2_rdpo_iter_3

alignment-handbook

Generated from Trainer

Model card Files Files and versions

two_agent_2_rdpo_iter_3

Commit History

RDPO-7b-beta0.01-eta0.001

355b8bf
verified

YYYYYYibo commited on Aug 8, 2024

Model save

fe31a2a
verified

YYYYYYibo commited on Aug 8, 2024

Training in progress, epoch 0

13ff816
verified

YYYYYYibo commited on Aug 8, 2024

initial commit

4ccddd9
verified

YYYYYYibo commited on Aug 7, 2024