YYYYYYibo
/

vanilla_dpo_iter_5

alignment-handbook

Generated from Trainer

Model card Files Files and versions

vanilla_dpo_iter_5

337 MB

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

YYYYYYibo's picture

DPO-7b-beta0.01

2021064 verified almost 2 years ago