YYYYYYibo
/

two_agent_rdpo_iter_3

alignment-handbook

Generated from Trainer

Model card Files Files and versions

two_agent_rdpo_iter_3

Commit History

RDPO-7b-beta0.01-eta0.001

94d7011
verified

YYYYYYibo commited on Aug 2, 2024

Model save

fc5ed99
verified

YYYYYYibo commited on Aug 2, 2024

Training in progress, step 100

8c90a58
verified

YYYYYYibo commited on Aug 2, 2024

initial commit

c5ceea2
verified

YYYYYYibo commited on Aug 2, 2024