YYYYYYibo
/

two_agent_rdpo_iter_2

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Model card Files Files and versions

two_agent_rdpo_iter_2 / tokenizer.json

Commit History

Training in progress, step 100

e9d1149
verified

YYYYYYibo commited on Aug 1, 2024