artiert
/

Qwen2.5-3B-WebdomInstruct

Model card Files Files and versions

artiert commited on Feb 28, 2025

Commit

a0d32b1

·

verified ·

1 Parent(s): 0edf4ec

Update README.md

Files changed (1) hide show

README.md +6 -1

README.md CHANGED Viewed

@@ -54,8 +54,11 @@
   - **Заморозка:** последние 25 слоев модели
   - **TRL:** не использовался (False)
 - **Наблюдения:**
-  Модель успешно адаптировалась к специфике обучающих данных, запомнив общее содержание. Однако наблюдалась потеря диалоговой структуры: модель «сливалась» с документом и не обеспечивала точное завершение диалога.
 ### Эксперимент 2
 - **Данные:** Синтетический набор из 2055 диалогов, где формат включает вопрос, ответ и контекст с доказательством.
@@ -70,6 +73,8 @@
 ### Функция потерь
 В обоих экспериментах использовалась стандартная **CrossEntropy Loss**, что позволило обеспечить стабильное снижение ошибки на протяжении обучения.
 ### Training Infrastructure

   - **Заморозка:** последние 25 слоев модели
   - **TRL:** не использовался (False)
 - **Наблюдения:**
+![image/png](https://cdn-uploads.huggingface.co/production/uploads/653fdf8e48491e1fde154812/R4eLRkvPX3KkSupjdZy1y.png)
+  Модель успешно адаптировалась к специфике обучающих данных, запомнив общее содержание. Однако наблюдалась потеря диалоговой структуры: модель «сливалась» с документом и не обеспечивала точное завершение диалога.
+![image/png](https://cdn-uploads.huggingface.co/production/uploads/653fdf8e48491e1fde154812/LrhCE2V9OFASnH7o8h1ii.png)
 ### Эксперимент 2
 - **Данные:** Синтетический набор из 2055 диалогов, где формат включает вопрос, ответ и контекст с доказательством.
 ### Функция потерь
 В обоих экспериментах использовалась стандартная **CrossEntropy Loss**, что позволило обеспечить стабильное снижение ошибки на протяжении обучения.
 ### Training Infrastructure