Update README.md
Browse files
README.md
CHANGED
|
@@ -54,8 +54,11 @@
|
|
| 54 |
- **Заморозка:** последние 25 слоев модели
|
| 55 |
- **TRL:** не использовался (False)
|
| 56 |
- **Наблюдения:**
|
| 57 |
-
Модель успешно адаптировалась к специфике обучающих данных, запомнив общее содержание. Однако наблюдалась потеря диалоговой структуры: модель «сливалась» с документом и не обеспечивала точное завершение диалога.
|
| 58 |
|
|
|
|
|
|
|
|
|
|
|
|
|
| 59 |
### Эксперимент 2
|
| 60 |
|
| 61 |
- **Данные:** Синтетический набор из 2055 диалогов, где формат включает вопрос, ответ и контекст с доказательством.
|
|
@@ -70,6 +73,8 @@
|
|
| 70 |
|
| 71 |
### Функция потерь
|
| 72 |
|
|
|
|
|
|
|
| 73 |
В обоих экспериментах использовалась стандартная **CrossEntropy Loss**, что позволило обеспечить стабильное снижение ошибки на протяжении обучения.
|
| 74 |
|
| 75 |
### Training Infrastructure
|
|
|
|
| 54 |
- **Заморозка:** последние 25 слоев модели
|
| 55 |
- **TRL:** не использовался (False)
|
| 56 |
- **Наблюдения:**
|
|
|
|
| 57 |
|
| 58 |
+

|
| 59 |
+
|
| 60 |
+
Модель успешно адаптировалась к специфике обучающих данных, запомнив общее содержание. Однако наблюдалась потеря диалоговой структуры: модель «сливалась» с документом и не обеспечивала точное завершение диалога.
|
| 61 |
+

|
| 62 |
### Эксперимент 2
|
| 63 |
|
| 64 |
- **Данные:** Синтетический набор из 2055 диалогов, где формат включает вопрос, ответ и контекст с доказательством.
|
|
|
|
| 73 |
|
| 74 |
### Функция потерь
|
| 75 |
|
| 76 |
+
|
| 77 |
+
|
| 78 |
В обоих экспериментах использовалась стандартная **CrossEntropy Loss**, что позволило обеспечить стабильное снижение ошибки на протяжении обучения.
|
| 79 |
|
| 80 |
### Training Infrastructure
|