Update README.md
Browse files
README.md
CHANGED
|
@@ -9,28 +9,96 @@ base_model: openchat/openchat-3.5-1210
|
|
| 9 |
model-index:
|
| 10 |
- name: summarization_model
|
| 11 |
results: []
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 12 |
---
|
| 13 |
|
| 14 |
<!-- This model card has been generated automatically according to the information the Trainer had access to. You
|
| 15 |
should probably proofread and complete it, then remove this comment. -->
|
| 16 |
|
| 17 |
-
#
|
| 18 |
|
| 19 |
-
This model is a fine-tuned version of [openchat/openchat-3.5-1210](https://huggingface.co/openchat/openchat-3.5-1210)
|
| 20 |
|
| 21 |
## Model description
|
| 22 |
|
| 23 |
-
|
| 24 |
-
|
| 25 |
-
|
| 26 |
-
|
| 27 |
-
|
| 28 |
-
|
| 29 |
-
|
| 30 |
-
|
| 31 |
-
|
| 32 |
-
|
| 33 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 34 |
|
| 35 |
### Training hyperparameters
|
| 36 |
|
|
@@ -46,7 +114,7 @@ The following hyperparameters were used during training:
|
|
| 46 |
- num_epochs: 3.0
|
| 47 |
|
| 48 |
### Training results
|
| 49 |
-
|
| 50 |
|
| 51 |
|
| 52 |
### Framework versions
|
|
|
|
| 9 |
model-index:
|
| 10 |
- name: summarization_model
|
| 11 |
results: []
|
| 12 |
+
datasets:
|
| 13 |
+
- d0rj/samsum-ru
|
| 14 |
+
- zjkarina/matreshka
|
| 15 |
+
- rcp-meetings/rudialogsum_v2
|
| 16 |
+
language:
|
| 17 |
+
- ru
|
| 18 |
---
|
| 19 |
|
| 20 |
<!-- This model card has been generated automatically according to the information the Trainer had access to. You
|
| 21 |
should probably proofread and complete it, then remove this comment. -->
|
| 22 |
|
| 23 |
+
# ru_summarization_model
|
| 24 |
|
| 25 |
+
This model is a fine-tuned version of [openchat/openchat-3.5-1210](https://huggingface.co/openchat/openchat-3.5-1210) for summarization russian dialogs.
|
| 26 |
|
| 27 |
## Model description
|
| 28 |
|
| 29 |
+
Please use opencha3.5 template for inference.
|
| 30 |
+
|
| 31 |
+
Ты грамотный суммаризатор. Верни суммаризацию по диалогу между клиентом и оператором<|end_of_turn|>GPT4 Correct User:
|
| 32 |
+
...Диалог...
|
| 33 |
+
\nСуммаризация диалога:\n<|end_of_turn|>GPT4 Correct Assistant:
|
| 34 |
+
|
| 35 |
+
**Пример диалога**
|
| 36 |
+
|
| 37 |
+
```
|
| 38 |
+
Ты грамотный суммаризатор. Верни суммаризацию по диалогу между клиентом и оператором<|end_of_turn|>GPT4 Correct User:
|
| 39 |
+
Оператор: здравствуйте вас приветствует компания ростелеком вас приветствует премиальная служба ростелеком
|
| 40 |
+
Клиент: и
|
| 41 |
+
Оператор: ха
|
| 42 |
+
Оператор: специалисты центра компании ростелеком здравствуйте чем могу вам помочь
|
| 43 |
+
Клиент: здравствуйте
|
| 44 |
+
Клиент: писали в доме свет и от этого роутер не может подключиться к сети ростелекома пишет
|
| 45 |
+
Клиент: пережиток ------ стариком
|
| 46 |
+
Оператор: подскажите пожалуйста вы выполнили рентгеновского ротора
|
| 47 |
+
Оператор: питание на пять минут
|
| 48 |
+
Оператор: номер вашего лицевого счета подскажите
|
| 49 |
+
Клиент: -------
|
| 50 |
+
Клиент: -------
|
| 51 |
+
Клиент: -------
|
| 52 |
+
Клиент: -------
|
| 53 |
+
Клиент: -------
|
| 54 |
+
Клиент: и фамилию носит пожалуйста подскажите находит -------
|
| 55 |
+
Оператор: сейчас проверяем наличие аварий пожалуйста подождите не отключайтесь две минуты
|
| 56 |
+
Оператор: благодарю за ожидание уточните пожалуйста ваш контактный номер телефона и направленности масса технической поддержки персональному менеджеру вижу что у вас саладина не должно быть
|
| 57 |
+
Оператор: системе их нет
|
| 58 |
+
Клиент: -------
|
| 59 |
+
Оператор: -------
|
| 60 |
+
Оператор: -------
|
| 61 |
+
Клиент: -------
|
| 62 |
+
Оператор: -------
|
| 63 |
+
Оператор: вы оскорбляли линию то есть у вас сейчас указывалось что у вас совсем соединение есть окно активное у меня указано то у меня мощность сигнала минус двадцать шесть
|
| 64 |
+
Клиент: но я получается
|
| 65 |
+
Клиент: перед опустил его у меня открылась страница роутера в которой написано было что производится автоматическая
|
| 66 |
+
Клиент: настройка она покрутилась где-то какое-то время и после этого выдала что невозможно подключиться к сети ростелекома
|
| 67 |
+
Оператор: не восприняла хорошо эту информацию заявки ухожу
|
| 68 |
+
Оператор: точнее часто ориентировочно специалист с вами свяжется ожидайте пожалуйста
|
| 69 |
+
Оператор: всего доброго до свидания
|
| 70 |
+
|
| 71 |
+
\nСуммаризация диалога:\n<|end_of_turn|>GPT4 Correct Assistant:
|
| 72 |
+
```
|
| 73 |
+
|
| 74 |
+
**Ответ нейросети**
|
| 75 |
+
|
| 76 |
+
```
|
| 77 |
+
Клиент: сообщает, что роутер не может подключиться к сети ростелекома,
|
| 78 |
+
а Оператор: проверяет его и сообщает, что у него нет сигнала.
|
| 79 |
+
Клиент: сообщает свой номер лицевого счета и контактный номер телефона,
|
| 80 |
+
но Оператор: не может найти проблему.
|
| 81 |
+
В конце концов, Оператор: просит Клиент: подождать, пока специалист свяжется с ним.
|
| 82 |
+
```
|
| 83 |
+
|
| 84 |
+
**PS.**
|
| 85 |
+
_Диалог распознан системой vosk-0.42_
|
| 86 |
+
|
| 87 |
+
|
| 88 |
+
**Запуск демо через LLaMA_Factory**
|
| 89 |
+
|
| 90 |
+
```
|
| 91 |
+
python src/web_demo.py \
|
| 92 |
+
--model_name_or_path openchat/openchat-3.5-1210 \
|
| 93 |
+
--adapter_name_or_path bogdal/ru_openchat3.5-1210_summarization_adapter \
|
| 94 |
+
--template openchat \
|
| 95 |
+
--finetuning_type lora \
|
| 96 |
+
--quantization_bit 8 \
|
| 97 |
+
```
|
| 98 |
+
|
| 99 |
+
в интерфейсе необходимо внести системный промпт - "Ты грамотный суммаризатор. Верни суммаризацию по диалогу между клиентом и оператором"
|
| 100 |
+
и чистый диалог без добавочных токенов, оканчивающийся фразой
|
| 101 |
+
"\nСуммаризация диалога:"
|
| 102 |
|
| 103 |
### Training hyperparameters
|
| 104 |
|
|
|
|
| 114 |
- num_epochs: 3.0
|
| 115 |
|
| 116 |
### Training results
|
| 117 |
+
- loss: 0.4716
|
| 118 |
|
| 119 |
|
| 120 |
### Framework versions
|