YYYYYYibo
/

two_agent_1_rdpo_iter_3

alignment-handbook

Generated from Trainer

Model card Files Files and versions

two_agent_1_rdpo_iter_3

Commit History

RDPO-7b-beta0.01-eta0.001

8349242
verified

YYYYYYibo commited on Aug 4, 2024

Model save

bae8ef4
verified

YYYYYYibo commited on Aug 4, 2024

Training in progress, epoch 0

a55b50d
verified

YYYYYYibo commited on Aug 4, 2024

initial commit

91565ea
verified

YYYYYYibo commited on Aug 4, 2024