Tandogan
/

MNLP_M2_dpo_model

instruction-tuning

preference-modeling

Model card Files Files and versions

MNLP_M2_dpo_model

Commit History

Update README.md

ceb4140
verified

Tandogan commited on May 27, 2025

Update README.md

fea5737
verified

Tandogan commited on May 27, 2025

Upload tokenizer

97dffbe
verified

Tandogan commited on May 25, 2025

Upload best checkpoint from DPO on SFT (Tandogan/MNLP_M2_SFT) model finetuning

ca13d5c
verified

Tandogan commited on May 25, 2025

initial commit

e57bc69
verified

Tandogan commited on May 25, 2025