YYYYYYibo
/

two_agent_rdpo_iter_3

alignment-handbook

Generated from Trainer

Model card Files Files and versions

two_agent_rdpo_iter_3

14.5 GB

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

YYYYYYibo's picture

RDPO-7b-beta0.01-eta0.001

94d7011 verified almost 2 years ago