georgebu
/

dpo_model

Text Generation

text-generation-inference

Model card Files Files and versions

georgebu commited on Mar 28, 2025

Commit

199c02f

·

verified ·

1 Parent(s): af3d8d7

Update README.md

Files changed (1) hide show

README.md +2 -0

README.md CHANGED Viewed

@@ -7,4 +7,6 @@ language:
 base_model:
 - HuggingFaceTB/SmolLM-135M-Instruct
 ---

 base_model:
 - HuggingFaceTB/SmolLM-135M-Instruct
 ---
+## Описание модели
+В рамках домашнего задания по курсу "Современный NLP. Большие языковые модели" от vk.education было реализовано дообучение модели методом Direct Preference Optimization (DPO)