cduoduo
/

TCMConverse-4B-SFT-PPO-MultiReward-Alignment

Model card Files Files and versions

TCMConverse-4B-SFT-PPO-MultiReward-Alignment

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

cduoduo's picture

Update README.md

ee420b2 verified over 1 year ago