quablab
/

smollm3-dpo-aligned

Text Generation

Generated from Trainer

Model card Files Files and versions

smollm3-dpo-aligned

12.3 GB

1 contributor

History: 13 commits

quablab's picture

Training in progress, step 1000

8570d57 verified 3 months ago