YYYYYYibo
/

two_agent_2_rdpo_iter_2

alignment-handbook

Generated from Trainer

Model card Files Files and versions

two_agent_2_rdpo_iter_2

Commit History

RDPO-7b-beta0.01-eta0.001

0c62071
verified

YYYYYYibo commited on Aug 7, 2024

Model save

3a95bf9
verified

YYYYYYibo commited on Aug 7, 2024

RDPO-7b-beta0.01-eta0.001

ad6f1d7
verified

YYYYYYibo commited on Aug 6, 2024

Model save

b101033
verified

YYYYYYibo commited on Aug 6, 2024

Training in progress, epoch 0

1fbee6d
verified

YYYYYYibo commited on Aug 6, 2024

initial commit

a84cb9a
verified

YYYYYYibo commited on Aug 6, 2024