Update README.md
Browse files
README.md
CHANGED
|
@@ -7,4 +7,6 @@ language:
|
|
| 7 |
base_model:
|
| 8 |
- HuggingFaceTB/SmolLM-135M-Instruct
|
| 9 |
---
|
|
|
|
|
|
|
| 10 |
|
|
|
|
| 7 |
base_model:
|
| 8 |
- HuggingFaceTB/SmolLM-135M-Instruct
|
| 9 |
---
|
| 10 |
+
## Описание модели
|
| 11 |
+
В рамках домашнего задания по курсу "Современный NLP. Большие языковые модели" от vk.education было реализовано дообучение модели методом Direct Preference Optimization (DPO)
|
| 12 |
|