YYYYYYibo
/

two_agent_1_rdpo_iter_2

alignment-handbook

Generated from Trainer

Model card Files Files and versions

two_agent_1_rdpo_iter_2

Commit History

RDPO-7b-beta0.01-eta0.001

910ab5c
verified

YYYYYYibo commited on Aug 3, 2024

Model save

950b756
verified

YYYYYYibo commited on Aug 3, 2024

Training in progress, step 100

a8e53af
verified

YYYYYYibo commited on Aug 3, 2024

initial commit

27c2f35
verified

YYYYYYibo commited on Aug 3, 2024