YYYYYYibo
/

two_agent_rdpo_iter_3

alignment-handbook

Generated from Trainer

Model card Files Files and versions

two_agent_rdpo_iter_3 / generation_config.json

Commit History

Model save

fc5ed99
verified

YYYYYYibo commited on Aug 2, 2024