Update README.md
Browse files
README.md
CHANGED
|
@@ -11,4 +11,5 @@ base_model:
|
|
| 11 |
- HuggingFaceTB/SmolLM-135M-Instruct
|
| 12 |
---
|
| 13 |
|
| 14 |
-
## Описание модели
|
|
|
|
|
|
| 11 |
- HuggingFaceTB/SmolLM-135M-Instruct
|
| 12 |
---
|
| 13 |
|
| 14 |
+
## Описание модели
|
| 15 |
+
В рамках домашнего задания по курсу "Современный NLP. Большие языковые модели" от vk.education было реализовано дообучение модели методом Direct Preference Optimization (DPO)
|