LifelongAlignment
/

Qwen2.5-0.5B-Instruct_CPPO_REWARD_1

Model card Files Files and versions

Qwen2.5-0.5B-Instruct_CPPO_REWARD_1

5.94 GB

1 contributor

History: 2 commits

Shahradmz's picture

dataset 1 reward model training

f4f3f71 verified 10 months ago