|
|
--- |
|
|
tags: |
|
|
- sentence-transformers |
|
|
- sentence-similarity |
|
|
- feature-extraction |
|
|
- generated_from_trainer |
|
|
- dataset_size:41115 |
|
|
- loss:TripletLoss |
|
|
base_model: intfloat/multilingual-e5-large |
|
|
widget: |
|
|
- source_sentence: 'query: Какое заверение требуется для разрешения Финансового управляющего |
|
|
на снятие всех ограничений?' |
|
|
sentences: |
|
|
- 'passage: Выберите причину розыска? |
|
|
|
|
|
|
|
|
Интересует компенсация по вкладам 1991 года |
|
|
|
|
|
|
|
|
Сотрудник проверяет у клиента наличие оригинала сберкнижки или иного документа |
|
|
(копия книжки/дубликат книжки/договор вклада/квитанция ф. 31/банковский ордер |
|
|
или банковская справка, выписка/вкладчик получал компенсацию ранее по данному |
|
|
вкладу) (далее - Сберкнижка).' |
|
|
- "passage: При обращении клиента - банкрота для выполнения платежей по Плану реструктуризации\ |
|
|
\ долгов, он должен дополнительно предъявить: \n\n- Решение суда об утверждении\ |
|
|
\ Плана реструктуризации долгов;\n- Разрешение ФУ на снятие блокировок со счетов,\ |
|
|
\ отличных от Специального банковского счета (в случае необходимости)\n- Разрешение\ |
|
|
\ ФУ на снятие всех ограничений и возможность пользоваться всеми банковскими продуктами\ |
|
|
\ \n\n\n!!!!! Разрешение Финансового управляющего должно быть заверено личной\ |
|
|
\ подписью ФУ, копия удостоверена нотариусом (печать ФУ при наличии).\n\n\n\n\n\ |
|
|
Предоставлено разрешение ФУ на снятие всех ограничений \n\nДля снятия всех ограничений\ |
|
|
\ и для проведения платежей по \"Плану реструктуризации долгов\" необходимо\n\ |
|
|
Завести заявку через кнопку \"Решить вопрос клиента\" \n\nПо тематике: Банкротство\ |
|
|
\ ФЛ\n\nПрикрепить файлы сканов: \n - Решение АС о признании обоснованным заявления\ |
|
|
\ о признании гражданина банкротом и введения реструктуризации его долгов, \n\ |
|
|
\ + Решение АС об утверждении финансового управляющего (это может быть один документ),\ |
|
|
\ \n - Решение АС об утверждении Плана РД\n - Письменное разрешение/согласие финансового\ |
|
|
\ управляющего на снятие всех огранничений с продуктов должника с целью исполнения\ |
|
|
\ Плана РД. \n\n \nПосле снятия арестов, должник сам распоряжается счетами и\ |
|
|
\ выполняет операции согласно Плана реструктуризации долгов." |
|
|
- "passage: Для снятия всех ограничений необходимо предоставить Решение АС о завершении/прекращении\ |
|
|
\ банкротства.\n\n\n* В решении арбитражного суда могут быть указаны следующие\ |
|
|
\ определения:\n\n- Завершена реализация имущества;\n- Прекращено банкротство\ |
|
|
\ (в том числе заключение мирового соглашения);\n- Завершено конкурсное производство.\n\ |
|
|
\nКлиент обратился впервые\n\nСотрудник запрашивает у клиента Решение суда о завершении/\ |
|
|
\ прекращении процедуры банкротства (Копию). \n\nЕсли по клиенту закончилась процедура\ |
|
|
\ реструктуризация долгов и клиент пользовался банковской картой в качестве специального\ |
|
|
\ банковского счета с ежемесячным лимитом 50 000.00, необходимо проверить наличие\ |
|
|
\ установленного по карте лимита в АС ФС, и при его наличии, убрать выставленный\ |
|
|
\ лимит." |
|
|
- source_sentence: 'query: Каковы шаги для оформления заявки на разблокировку счета |
|
|
в АС ''Сбердруг''?' |
|
|
sentences: |
|
|
- "passage: Проверить наличие ареста на счет, с которого необходимо произвести выдачу\n\ |
|
|
\n\nЕСТЬ АРЕСТ на счете\n\nОформить заявку в АС \"Сбердруг\" на разблокировку\ |
|
|
\ счета\n1.\tОткрыть Каталог –> \nОбслуживание клиентов –> \nОперационный центр\ |
|
|
\ –> \nСопровождение операций Физических лиц –>\nФЛ. Работа с операциями Банкротов,\ |
|
|
\ откроется шаблон заявки.\n2.\tЗаполнить поля шаблона заявки в соответствии:\ |
|
|
\ \nНомер ТБ: Номер ТБ, ведения счета \nВыберите тематику запроса: Взаимодействие\ |
|
|
\ с ВСП/ОСБ\nТип запроса: Разблокировка счетов\nТема запроса: Разблокировка счетов\ |
|
|
\ для выдачи наличных\nДалее указать:\nФИО банкрота - ФИО банкрота \nНомер счета\ |
|
|
\ - Номер счета/вклада \nОбратился - (выбор Банкрот/ ФУ)\nВид получения\ |
|
|
\ (выбор нарочно / почта)\nВнутренний клиент (указать фамилию сотрудника,\ |
|
|
\ который сможет отследить исполнение заявки в случае отсутствия сотрудника, зарегистрировавшего\ |
|
|
\ заявку) \nСообщение в случае необходимости\n\n\nПрикрепить файлы сканов: ДУЛ\ |
|
|
\ клиента+ иные документы\nи нажать зеленую кнопку \"ОТПРАВИТЬ\".\nЗапрос направлен\ |
|
|
\ на исполнение.\n\nОригиналы всех предоставленных и оформленных в процессе подготовки\ |
|
|
\ заявки документов остаются у клиента." |
|
|
- 'passage: Кто обратился? |
|
|
|
|
|
|
|
|
Вкладчик/Представитель вкладчика (полномочия подтверждены) |
|
|
|
|
|
|
|
|
Выберите причину розыска?' |
|
|
- "passage: Сотрудник формирует заявку в \"Сбердруг\" по шаблону:\nКаталог→\nОбслуживание\ |
|
|
\ клиентов –> \nОперационный центр –> \nСопровождение операций Физических лиц\ |
|
|
\ –>\nФЛ. Работа с операциями Банкротов, откроется шаблон заявки\n\nЗаполнить\ |
|
|
\ поля шаблона заявки в соответствии: \nНомер ТБ: Номер ТБ, ведения счета (Для\ |
|
|
\ более быстрой обработки заявки верно указывайте ТБ клиента)\nВыберите тематику\ |
|
|
\ запроса: Взаимодействие с ВСП/ОСБ\n\nТип запроса: Разблокировка счетов\nТема\ |
|
|
\ запроса: Завершение процедуры банкротства\n\nДалее указать:\nФИО банкрота -\ |
|
|
\ ФИО банкрота \nНомер счета - Номер счета/вклада \nОбратился - (выбор\ |
|
|
\ Банкрот/ ФУ) \nВид получения - (выбор нарочно / почта)\nСообщение\ |
|
|
\ заполнить в случае необходимости указания особенностей\n\nК заявке приложить\ |
|
|
\ скан-копии:\n - Определение арбитражного суда о прекращении/завершении банкротства\n\ |
|
|
\ - ДУЛ Клиента\nнажать зеленую кнопку \"ОТПРАВИТЬ\".\nЗапрос направлен на исполнение.\n\ |
|
|
\n\nПредупредить клиента, что мероприятия по снятию ограничений с продуктов будут\ |
|
|
\ выполнены в течении 7 рабочих дней.\nОригиналы предоставленных документов остаются\ |
|
|
\ у клиента.\n\n!!!!!ОБЯЗАТЕЛЬНО ВЫБРАТЬ ВЕРНУЮ ТЕМУ ЗАПРОСА!!!!! Тема запроса:\ |
|
|
\ Завершение процедуры банкротства\nЕсли выбрать тему запроса: разблокировка счета,\ |
|
|
\ счет может заблокировать повторно \n\n\nВ случае если блокирован СБОЛ клиента\ |
|
|
\ дополнительно\nСотрудник регистрирует обращение в СРМ Розничный\nВыбирает\n\ |
|
|
Тематика: Банкротство физического лица\nПодтематика: Проведение операций\ |
|
|
\ по счету банкрота (в том числа открытие/закрытие)\nВыбирает причину обращения:\ |
|
|
\ РАЗБЛОКИРОВКА личного кабинета СБОЛ банкрота/ Блокировка Мобильного банка. \n\ |
|
|
В обращении обязательно указывает Фамилию Имя Отчество банкрота, День рождения.\ |
|
|
\ \nВкладывает в обращение:\n - Определение арбитражного суда о прекращении/завершении\ |
|
|
\ банкротства\n - ДУЛ Клиента \nОтправляет в работу." |
|
|
- source_sentence: 'query: Кто может выступать в качестве инициатора изменения контракта |
|
|
согласно документу с memo_id 63368?' |
|
|
sentences: |
|
|
- 'query: Кто имеет право запросить изменение контракта согласно документу с memo_id |
|
|
63368?' |
|
|
- 'query: Когда можно изменить контракт согласно memo_id 63368?' |
|
|
- 'query: Что необходимо отправить в ПЦП Центр комплаенс при подозрении на отмывание |
|
|
денег?' |
|
|
- source_sentence: 'query: Что нужно сделать, если клиент найден?' |
|
|
sentences: |
|
|
- 'query: Что делать, если произошел сбой в системе Сбол.про?' |
|
|
- 'query: Какие шаги необходимо предпринять, если клиент обнаружен?' |
|
|
- 'query: Что делать после того, как клиент найден?' |
|
|
- source_sentence: 'query: Кто отвечает за подтверждение замены владельца номинального |
|
|
счета?' |
|
|
sentences: |
|
|
- 'query: Кто должен дать согласие на смену владельца номинального счета?' |
|
|
- 'query: Где можно установить индивидуальные лимиты по Детской СберКарте для законного |
|
|
представителя?' |
|
|
- 'query: Какой документ требуется для подтверждения личности клиента при смене |
|
|
владельца номинального счета?' |
|
|
pipeline_tag: sentence-similarity |
|
|
library_name: sentence-transformers |
|
|
--- |
|
|
|
|
|
# SentenceTransformer based on intfloat/multilingual-e5-large |
|
|
|
|
|
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large) on the q2q_data and q2p_data datasets. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more. |
|
|
|
|
|
## Model Details |
|
|
|
|
|
### Model Description |
|
|
- **Model Type:** Sentence Transformer |
|
|
- **Base model:** [intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large) <!-- at revision 0dc5580a448e4284468b8909bae50fa925907bc5 --> |
|
|
- **Maximum Sequence Length:** 512 tokens |
|
|
- **Output Dimensionality:** 1024 dimensions |
|
|
- **Similarity Function:** Cosine Similarity |
|
|
- **Training Datasets:** |
|
|
- q2q_data |
|
|
- q2p_data |
|
|
<!-- - **Language:** Unknown --> |
|
|
<!-- - **License:** Unknown --> |
|
|
|
|
|
### Model Sources |
|
|
|
|
|
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net) |
|
|
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers) |
|
|
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers) |
|
|
|
|
|
### Full Model Architecture |
|
|
|
|
|
``` |
|
|
SentenceTransformer( |
|
|
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel |
|
|
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True}) |
|
|
(2): Normalize() |
|
|
) |
|
|
``` |
|
|
|
|
|
## Usage |
|
|
|
|
|
### Direct Usage (Sentence Transformers) |
|
|
|
|
|
First install the Sentence Transformers library: |
|
|
|
|
|
```bash |
|
|
pip install -U sentence-transformers |
|
|
``` |
|
|
|
|
|
Then you can load this model and run inference. |
|
|
```python |
|
|
from sentence_transformers import SentenceTransformer |
|
|
|
|
|
# Download from the 🤗 Hub |
|
|
model = SentenceTransformer("George2002/sledopyt_embedder") |
|
|
# Run inference |
|
|
sentences = [ |
|
|
'query: Кто отвечает за подтверждение замены владельца номинального счета?', |
|
|
'query: Кто должен дать согласие на смену владельца номинального счета?', |
|
|
'query: Какой документ требуется для подтверждения личности клиента при смене владельца номинального счета?', |
|
|
] |
|
|
embeddings = model.encode(sentences) |
|
|
print(embeddings.shape) |
|
|
# [3, 1024] |
|
|
|
|
|
# Get the similarity scores for the embeddings |
|
|
similarities = model.similarity(embeddings, embeddings) |
|
|
print(similarities.shape) |
|
|
# [3, 3] |
|
|
``` |
|
|
|
|
|
<!-- |
|
|
### Direct Usage (Transformers) |
|
|
|
|
|
<details><summary>Click to see the direct usage in Transformers</summary> |
|
|
|
|
|
</details> |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
### Downstream Usage (Sentence Transformers) |
|
|
|
|
|
You can finetune this model on your own dataset. |
|
|
|
|
|
<details><summary>Click to expand</summary> |
|
|
|
|
|
</details> |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
### Out-of-Scope Use |
|
|
|
|
|
*List how the model may foreseeably be misused and address what users ought not to do with the model.* |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
## Bias, Risks and Limitations |
|
|
|
|
|
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.* |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
### Recommendations |
|
|
|
|
|
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.* |
|
|
--> |
|
|
|
|
|
## Training Details |
|
|
|
|
|
### Training Datasets |
|
|
|
|
|
#### q2q_data |
|
|
|
|
|
* Dataset: q2q_data |
|
|
* Size: 33,406 training samples |
|
|
* Columns: <code>query_1</code>, <code>query_2</code>, and <code>negative</code> |
|
|
* Approximate statistics based on the first 1000 samples: |
|
|
| | query_1 | query_2 | negative | |
|
|
|:--------|:-----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------| |
|
|
| type | string | string | string | |
|
|
| details | <ul><li>min: 12 tokens</li><li>mean: 22.08 tokens</li><li>max: 42 tokens</li></ul> | <ul><li>min: 11 tokens</li><li>mean: 21.77 tokens</li><li>max: 43 tokens</li></ul> | <ul><li>min: 11 tokens</li><li>mean: 21.45 tokens</li><li>max: 39 tokens</li></ul> | |
|
|
* Samples: |
|
|
| query_1 | query_2 | negative | |
|
|
|:-----------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------| |
|
|
| <code>query: Какой телефон для отключения дневного расходного лимита для ребенка?</code> | <code>query: На какой номер нужно позвонить, чтобы снять лимит расходов на день для ребенка?</code> | <code>query: Как отключить лимиты по детской карте через мобильное приложение, если родитель хочет это сделать?</code> | |
|
|
| <code>query: При каком условии можно выбрать возраст ребенка представительством?</code> | <code>query: При каких обстоятельствах можно определить возраст ребенка в представительстве?</code> | <code>query: Какой статус должен быть у представителя для определения возраста ребенка?</code> | |
|
|
| <code>query: Какие бумаги нужны при обращении, если счет не удается найти?</code> | <code>query: Что требуется приложить к запросу, если счет отсутствует?</code> | <code>query: Что нужно предоставить для регистрации обращения, если счёт не обнаружен?</code> | |
|
|
* Loss: [<code>TripletLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#tripletloss) with these parameters: |
|
|
```json |
|
|
{ |
|
|
"distance_metric": "TripletDistanceMetric.EUCLIDEAN", |
|
|
"triplet_margin": 5 |
|
|
} |
|
|
``` |
|
|
|
|
|
#### q2p_data |
|
|
|
|
|
* Dataset: q2p_data |
|
|
* Size: 7,709 training samples |
|
|
* Columns: <code>query</code>, <code>chunk</code>, and <code>negative</code> |
|
|
* Approximate statistics based on the first 1000 samples: |
|
|
| | query | chunk | negative | |
|
|
|:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------| |
|
|
| type | string | string | string | |
|
|
| details | <ul><li>min: 13 tokens</li><li>mean: 22.14 tokens</li><li>max: 40 tokens</li></ul> | <ul><li>min: 12 tokens</li><li>mean: 162.33 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 12 tokens</li><li>mean: 129.72 tokens</li><li>max: 512 tokens</li></ul> | |
|
|
* Samples: |
|
|
| query | chunk | negative | |
|
|
|:-----------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| |
|
|
| <code>query: Что такое ДУЛ законного представителя и зачем он нужен?</code> | <code>passage: Документы, необходимые для прикрепления законного представителя к подопечному (несовершеннолетнему от 14 до 18 лет):<br><br>Приемный родитель<br><br>ДУЛ законного представителя<br><br>Документ из органа опеки и попечительства о передаче ребенка в приемную семью</code> | <code>passage: Документы, необходимые для прикрепления законного представителя к подопечному (несовершеннолетнему от 14 до 18 лет):<br><br>Попечитель (физ. лицо)<br><br>ДУЛ законного представителя<br><br>Решение органа опеки и попечительства о назначении попечителя</code> | |
|
|
| <code>query: Что требуется для получения выписки по счету вкладчика с ограниченной дееспособностью?</code> | <code>passage: Выписка по счету (вкладу) может быть выдана:<br><br>- Ограниченно дееспособный в силу пристрастия<br><br>-Доверенное лицо ограниченно дееспособного</code> | <code>passage: Кто обратился?<br><br>Вкладчик/Представитель вкладчика (полномочия подтверждены)<br><br>Выберите причину розыска?</code> | |
|
|
| <code>query: Какие учредительные документы необходимы для государственного социального учреждения?</code> | <code>passage: Документ (распоряжение/приказ/акт/путевка) органа опеки и попечительства о помещении (передаче под надзор) несовершеннолетнего в государственную социальную организацию <br><br>Учредительные документы государственного социального учреждения (далее –учреждение)<br><br>Свидетельство о постановке на учет в налоговом органе учреждения<br><br>Выписка из Единого государственного реестра юридических лиц<br><br>Свидетельство о государственной регистрации учреждения<br><br>Документ (как правило, приказ) о назначении (избрании) единоличного исполнительного органа (директора) социального учреждения</code> | <code>passage: Документ (распоряжение/приказ/акт/путевка) органа опеки и попечительства о помещении (передаче под надзор) ограниченно дееспособного гражданина в государственную социальную организацию <br>Учредительные документы государственного социального учреждения (далее –учреждение)<br><br>Свидетельство о постановке на учет в налоговом органе учреждения<br><br>Выписка из Единого государственного реестра юридических лиц<br><br>Свидетельство о государственной регистрации учреждения<br><br>Документы об избрании (назначении) единоличного исполнительного органа</code> | |
|
|
* Loss: [<code>TripletLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#tripletloss) with these parameters: |
|
|
```json |
|
|
{ |
|
|
"distance_metric": "TripletDistanceMetric.EUCLIDEAN", |
|
|
"triplet_margin": 5 |
|
|
} |
|
|
``` |
|
|
|
|
|
### Evaluation Datasets |
|
|
|
|
|
#### q2q_data |
|
|
|
|
|
* Dataset: q2q_data |
|
|
* Size: 1,759 evaluation samples |
|
|
* Columns: <code>query_1</code>, <code>query_2</code>, and <code>negative</code> |
|
|
* Approximate statistics based on the first 1000 samples: |
|
|
| | query_1 | query_2 | negative | |
|
|
|:--------|:-----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------| |
|
|
| type | string | string | string | |
|
|
| details | <ul><li>min: 11 tokens</li><li>mean: 22.02 tokens</li><li>max: 40 tokens</li></ul> | <ul><li>min: 11 tokens</li><li>mean: 21.69 tokens</li><li>max: 39 tokens</li></ul> | <ul><li>min: 12 tokens</li><li>mean: 21.38 tokens</li><li>max: 37 tokens</li></ul> | |
|
|
* Samples: |
|
|
| query_1 | query_2 | negative | |
|
|
|:---------------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------| |
|
|
| <code>query: Что необходимо сделать при получении отрицательного заключения?</code> | <code>query: Какие действия нужно предпринять после получения отрицательного ответа?</code> | <code>query: Какие шаги следует предпринять при получении негативного ответа после открытия счета?</code> | |
|
|
| <code>query: Нужно ли согласовывать операцию с комплаенсом при переводе в СБОЛ.Про?</code> | <code>query: Обязательно ли получить согласие комплаенса для операции перевода в СБОЛ.Про?</code> | <code>query: Необходимо ли согласовывать перевод с комплаенсом в СБОЛ.Про?</code> | |
|
|
| <code>query: Что появляется на экране после нажатия кнопки «Ребенок до 14 лет» или «Ребенок от 14 до 18 лет»?</code> | <code>query: Какой экран показывается после нажатия на кнопки «Ребенок до 14 лет» и «Ребенок от 14 до 18 лет»?</code> | <code>query: Каким лицам доступна выписка по счету несовершеннолетнего в возрасте от 14 до 18 лет?</code> | |
|
|
* Loss: [<code>TripletLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#tripletloss) with these parameters: |
|
|
```json |
|
|
{ |
|
|
"distance_metric": "TripletDistanceMetric.EUCLIDEAN", |
|
|
"triplet_margin": 5 |
|
|
} |
|
|
``` |
|
|
|
|
|
#### q2p_data |
|
|
|
|
|
* Dataset: q2p_data |
|
|
* Size: 406 evaluation samples |
|
|
* Columns: <code>query</code>, <code>chunk</code>, and <code>negative</code> |
|
|
* Approximate statistics based on the first 406 samples: |
|
|
| | query | chunk | negative | |
|
|
|:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------| |
|
|
| type | string | string | string | |
|
|
| details | <ul><li>min: 13 tokens</li><li>mean: 22.26 tokens</li><li>max: 40 tokens</li></ul> | <ul><li>min: 12 tokens</li><li>mean: 163.57 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 12 tokens</li><li>mean: 126.02 tokens</li><li>max: 512 tokens</li></ul> | |
|
|
* Samples: |
|
|
| query | chunk | negative | |
|
|
|:----------------------------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| |
|
|
| <code>query: Куда следует направить информацию, полученную для розыска?</code> | <code>passage: Выберите причину розыска?<br><br>Информация нужна для предоставления в Суд/в органы опеки/ др. гос органы<br><br>Зарегистрируй обращение в СРМ «Розничный». Приложи (при наличии) документы, подтверждающие .....</code> | <code>passage: Заполните информацию о подопечном</code> | |
|
|
| <code>query: Кто может обратиться за открытием карты МИР без согласия Финансового управляющего?</code> | <code>passage: С каким вопросом обратился банкрот?<br><br>06. Открытие счета/вклада (отличного от Специального счета банкрота)<br><br>Банкрот в любой стадии банкротства может открыть самостоятельно в стандартном режиме без согласия Финансового управляющего следующие виды счетов: <br><br>- Номинальный счет для получения пособий на подопечного/ алиментов на ребенка без согласия своего финансового управляющего. <br><br>Любой другой счет может открыть только банкрот в стадии реструктуризация долгов, предоставив разрешение Финансового управляющего<br><br>!!!!!! при обращении МОБИЛИЗОВАННОГО (участник СВО) банкрота (в стадии РИ) для открытия и получения карты МИР для зачисления военного довольствия, открываем и выдаем карту МИР БЕЗ РАЗРЕШЕНИЯ ФУ</code> | <code>passage: Банкрот в любой стадии банкротства может открыть самостоятельно в стандартном режиме без согласия Финансового управляющего следующие виды счетов: <br><br>- Номинальный счет для получения пособий на подопечного/ алиментов на ребенка без согласия своего финансового управляющего. <br><br>Любой другой счет может открыть только банкрот в стадии реструктуризация долгов, предоставив разрешение Финансового управляющего<br><br>!!!!!! при обращении МОБИЛИЗОВАННОГО (участник СВО) банкрота (в стадии РИ) для открытия и получения карты МИР для зачисления военного довольствия, открываем и выдаем карту МИР БЕЗ РАЗРЕШЕНИЯ ФУ<br><br>Процедура банкротства Реструктуризация долгов<br><br>Клиент, признанный банкротом в стадии реструктуризация долгов имеет право без согласия Финансового управляющего открыть счета:<br>- Специальный счет банкрота с ежемесячным лимитом в 50 000.00<br>- Счет ГЖС (Счет ГЖС открывается в стандартном режиме, арест/ блокировка на счет ГЖС не накладывается). <br>При открытии любого другого счёта банкрот должен п...</code> | |
|
|
| <code>query: Что должно быть на свидетельстве о рождении Украины для оформления Детской СберКарты?</code> | <code>passage: ВНИМАНИЕ !<br>С 23 октября 2023г. в МП СБОЛ станет доступным заказ Детской СберКарты по свидетельству о рождении Украины со штампом о гражданстве РФ.<br>Для получения Детской СберКарты в офисе банка необходимо будет предоставить нотариально заверенное удостоверение перевода на русский язык свидетельства о рождении Украины со штампом о гражданстве РФ.<br><br><br><br><br><br>Типичные вопросы по Детской СберКарте и ответы на них<br><br>18. Сколько изготавливается Детская СберКарта ?<br><br>Актуальные сроки выпуска карты размещены на сайте Банка: Детская СберКарт -> Тарифы -> Документы и ссылки</code> | <code>passage: ВНИМАНИЕ !<br>С 23 октября 2023г. в МП СБОЛ станет доступным заказ Детской СберКарты по свидетельству о рождении Украины со штампом о гражданстве РФ.<br>Для получения Детской СберКарты в офисе банка необходимо будет предоставить нотариально заверенное удостоверение перевода на русский язык свидетельства о рождении Украины со штампом о гражданстве РФ.<br><br><br><br><br><br>Типичные вопросы по Детской СберКарте и ответы на них<br><br>05. Бонусы Спасибо по Детской СберКарте<br><br>Выберите интересующий вопрос</code> | |
|
|
* Loss: [<code>TripletLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#tripletloss) with these parameters: |
|
|
```json |
|
|
{ |
|
|
"distance_metric": "TripletDistanceMetric.EUCLIDEAN", |
|
|
"triplet_margin": 5 |
|
|
} |
|
|
``` |
|
|
|
|
|
### Training Hyperparameters |
|
|
#### Non-Default Hyperparameters |
|
|
|
|
|
- `eval_strategy`: steps |
|
|
- `per_device_train_batch_size`: 36 |
|
|
- `learning_rate`: 1e-05 |
|
|
- `weight_decay`: 0.01 |
|
|
- `num_train_epochs`: 2 |
|
|
- `warmup_ratio`: 0.1 |
|
|
- `load_best_model_at_end`: True |
|
|
- `push_to_hub`: True |
|
|
- `hub_model_id`: George2002/sledopyt_embedder |
|
|
- `hub_strategy`: end |
|
|
|
|
|
#### All Hyperparameters |
|
|
<details><summary>Click to expand</summary> |
|
|
|
|
|
- `overwrite_output_dir`: False |
|
|
- `do_predict`: False |
|
|
- `eval_strategy`: steps |
|
|
- `prediction_loss_only`: True |
|
|
- `per_device_train_batch_size`: 36 |
|
|
- `per_device_eval_batch_size`: 8 |
|
|
- `per_gpu_train_batch_size`: None |
|
|
- `per_gpu_eval_batch_size`: None |
|
|
- `gradient_accumulation_steps`: 1 |
|
|
- `eval_accumulation_steps`: None |
|
|
- `torch_empty_cache_steps`: None |
|
|
- `learning_rate`: 1e-05 |
|
|
- `weight_decay`: 0.01 |
|
|
- `adam_beta1`: 0.9 |
|
|
- `adam_beta2`: 0.999 |
|
|
- `adam_epsilon`: 1e-08 |
|
|
- `max_grad_norm`: 1.0 |
|
|
- `num_train_epochs`: 2 |
|
|
- `max_steps`: -1 |
|
|
- `lr_scheduler_type`: linear |
|
|
- `lr_scheduler_kwargs`: {} |
|
|
- `warmup_ratio`: 0.1 |
|
|
- `warmup_steps`: 0 |
|
|
- `log_level`: passive |
|
|
- `log_level_replica`: warning |
|
|
- `log_on_each_node`: True |
|
|
- `logging_nan_inf_filter`: True |
|
|
- `save_safetensors`: True |
|
|
- `save_on_each_node`: False |
|
|
- `save_only_model`: False |
|
|
- `restore_callback_states_from_checkpoint`: False |
|
|
- `no_cuda`: False |
|
|
- `use_cpu`: False |
|
|
- `use_mps_device`: False |
|
|
- `seed`: 42 |
|
|
- `data_seed`: None |
|
|
- `jit_mode_eval`: False |
|
|
- `use_ipex`: False |
|
|
- `bf16`: False |
|
|
- `fp16`: False |
|
|
- `fp16_opt_level`: O1 |
|
|
- `half_precision_backend`: auto |
|
|
- `bf16_full_eval`: False |
|
|
- `fp16_full_eval`: False |
|
|
- `tf32`: None |
|
|
- `local_rank`: 0 |
|
|
- `ddp_backend`: None |
|
|
- `tpu_num_cores`: None |
|
|
- `tpu_metrics_debug`: False |
|
|
- `debug`: [] |
|
|
- `dataloader_drop_last`: True |
|
|
- `dataloader_num_workers`: 0 |
|
|
- `dataloader_prefetch_factor`: None |
|
|
- `past_index`: -1 |
|
|
- `disable_tqdm`: False |
|
|
- `remove_unused_columns`: True |
|
|
- `label_names`: None |
|
|
- `load_best_model_at_end`: True |
|
|
- `ignore_data_skip`: False |
|
|
- `fsdp`: [] |
|
|
- `fsdp_min_num_params`: 0 |
|
|
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False} |
|
|
- `tp_size`: 0 |
|
|
- `fsdp_transformer_layer_cls_to_wrap`: None |
|
|
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None} |
|
|
- `deepspeed`: None |
|
|
- `label_smoothing_factor`: 0.0 |
|
|
- `optim`: adamw_torch |
|
|
- `optim_args`: None |
|
|
- `adafactor`: False |
|
|
- `group_by_length`: False |
|
|
- `length_column_name`: length |
|
|
- `ddp_find_unused_parameters`: None |
|
|
- `ddp_bucket_cap_mb`: None |
|
|
- `ddp_broadcast_buffers`: False |
|
|
- `dataloader_pin_memory`: True |
|
|
- `dataloader_persistent_workers`: False |
|
|
- `skip_memory_metrics`: True |
|
|
- `use_legacy_prediction_loop`: False |
|
|
- `push_to_hub`: True |
|
|
- `resume_from_checkpoint`: None |
|
|
- `hub_model_id`: George2002/sledopyt_embedder |
|
|
- `hub_strategy`: end |
|
|
- `hub_private_repo`: None |
|
|
- `hub_always_push`: False |
|
|
- `gradient_checkpointing`: False |
|
|
- `gradient_checkpointing_kwargs`: None |
|
|
- `include_inputs_for_metrics`: False |
|
|
- `include_for_metrics`: [] |
|
|
- `eval_do_concat_batches`: True |
|
|
- `fp16_backend`: auto |
|
|
- `push_to_hub_model_id`: None |
|
|
- `push_to_hub_organization`: None |
|
|
- `mp_parameters`: |
|
|
- `auto_find_batch_size`: False |
|
|
- `full_determinism`: False |
|
|
- `torchdynamo`: None |
|
|
- `ray_scope`: last |
|
|
- `ddp_timeout`: 1800 |
|
|
- `torch_compile`: False |
|
|
- `torch_compile_backend`: None |
|
|
- `torch_compile_mode`: None |
|
|
- `include_tokens_per_second`: False |
|
|
- `include_num_input_tokens_seen`: False |
|
|
- `neftune_noise_alpha`: None |
|
|
- `optim_target_modules`: None |
|
|
- `batch_eval_metrics`: False |
|
|
- `eval_on_start`: False |
|
|
- `use_liger_kernel`: False |
|
|
- `eval_use_gather_object`: False |
|
|
- `average_tokens_across_devices`: False |
|
|
- `prompts`: None |
|
|
- `batch_sampler`: batch_sampler |
|
|
- `multi_dataset_batch_sampler`: proportional |
|
|
|
|
|
</details> |
|
|
|
|
|
### Training Logs |
|
|
<details><summary>Click to expand</summary> |
|
|
|
|
|
| Epoch | Step | Training Loss | q2q data loss | q2p data loss | |
|
|
|:------:|:----:|:-------------:|:-------------:|:-------------:| |
|
|
| 0.0175 | 10 | 4.957 | - | - | |
|
|
| 0.0351 | 20 | 4.9467 | - | - | |
|
|
| 0.0526 | 30 | 4.9452 | - | - | |
|
|
| 0.0702 | 40 | 4.9325 | - | - | |
|
|
| 0.0877 | 50 | 4.9056 | 4.8804 | 4.9222 | |
|
|
| 0.1053 | 60 | 4.9041 | - | - | |
|
|
| 0.1228 | 70 | 4.8866 | - | - | |
|
|
| 0.1404 | 80 | 4.844 | - | - | |
|
|
| 0.1579 | 90 | 4.8064 | - | - | |
|
|
| 0.1754 | 100 | 4.8182 | 4.7243 | 4.8660 | |
|
|
| 0.1930 | 110 | 4.7791 | - | - | |
|
|
| 0.2105 | 120 | 4.7659 | - | - | |
|
|
| 0.2281 | 130 | 4.7572 | - | - | |
|
|
| 0.2456 | 140 | 4.7234 | - | - | |
|
|
| 0.2632 | 150 | 4.726 | 4.6268 | 4.8712 | |
|
|
| 0.2807 | 160 | 4.6932 | - | - | |
|
|
| 0.2982 | 170 | 4.6654 | - | - | |
|
|
| 0.3158 | 180 | 4.6776 | - | - | |
|
|
| 0.3333 | 190 | 4.6617 | - | - | |
|
|
| 0.3509 | 200 | 4.6928 | 4.5581 | 4.8814 | |
|
|
| 0.3684 | 210 | 4.6497 | - | - | |
|
|
| 0.3860 | 220 | 4.677 | - | - | |
|
|
| 0.4035 | 230 | 4.6344 | - | - | |
|
|
| 0.4211 | 240 | 4.6612 | - | - | |
|
|
| 0.4386 | 250 | 4.6274 | 4.5154 | 4.8396 | |
|
|
| 0.4561 | 260 | 4.6556 | - | - | |
|
|
| 0.4737 | 270 | 4.6382 | - | - | |
|
|
| 0.4912 | 280 | 4.6053 | - | - | |
|
|
| 0.5088 | 290 | 4.6131 | - | - | |
|
|
| 0.5263 | 300 | 4.6453 | 4.4957 | 4.8314 | |
|
|
| 0.5439 | 310 | 4.5819 | - | - | |
|
|
| 0.5614 | 320 | 4.5948 | - | - | |
|
|
| 0.5789 | 330 | 4.5288 | - | - | |
|
|
| 0.5965 | 340 | 4.6152 | - | - | |
|
|
| 0.6140 | 350 | 4.5831 | 4.4657 | 4.7953 | |
|
|
| 0.6316 | 360 | 4.5507 | - | - | |
|
|
| 0.6491 | 370 | 4.5718 | - | - | |
|
|
| 0.6667 | 380 | 4.6269 | - | - | |
|
|
| 0.6842 | 390 | 4.6017 | - | - | |
|
|
| 0.7018 | 400 | 4.5155 | 4.4396 | 4.7694 | |
|
|
| 0.7193 | 410 | 4.5055 | - | - | |
|
|
| 0.7368 | 420 | 4.534 | - | - | |
|
|
| 0.7544 | 430 | 4.5358 | - | - | |
|
|
| 0.7719 | 440 | 4.5443 | - | - | |
|
|
| 0.7895 | 450 | 4.5309 | 4.4183 | 4.7751 | |
|
|
| 0.8070 | 460 | 4.5952 | - | - | |
|
|
| 0.8246 | 470 | 4.5561 | - | - | |
|
|
| 0.8421 | 480 | 4.5191 | - | - | |
|
|
| 0.8596 | 490 | 4.5066 | - | - | |
|
|
| 0.8772 | 500 | 4.4875 | 4.4138 | 4.8195 | |
|
|
| 0.8947 | 510 | 4.5051 | - | - | |
|
|
| 0.9123 | 520 | 4.4872 | - | - | |
|
|
| 0.9298 | 530 | 4.4918 | - | - | |
|
|
| 0.9474 | 540 | 4.5357 | - | - | |
|
|
| 0.9649 | 550 | 4.4898 | 4.3754 | 4.7799 | |
|
|
| 0.9825 | 560 | 4.5742 | - | - | |
|
|
| 1.0 | 570 | 4.5461 | - | - | |
|
|
| 1.0175 | 580 | 4.5505 | - | - | |
|
|
| 1.0351 | 590 | 4.5027 | - | - | |
|
|
| 1.0526 | 600 | 4.5747 | 4.4060 | 4.7915 | |
|
|
| 1.0702 | 610 | 4.5296 | - | - | |
|
|
| 1.0877 | 620 | 4.4262 | - | - | |
|
|
| 1.1053 | 630 | 4.5415 | - | - | |
|
|
| 1.1228 | 640 | 4.5386 | - | - | |
|
|
| 1.1404 | 650 | 4.4552 | 4.3632 | 4.8105 | |
|
|
| 1.1579 | 660 | 4.4473 | - | - | |
|
|
| 1.1754 | 670 | 4.5069 | - | - | |
|
|
| 1.1930 | 680 | 4.5129 | - | - | |
|
|
| 1.2105 | 690 | 4.4611 | - | - | |
|
|
| 1.2281 | 700 | 4.5104 | 4.3530 | 4.7875 | |
|
|
| 1.2456 | 710 | 4.4742 | - | - | |
|
|
| 1.2632 | 720 | 4.4887 | - | - | |
|
|
| 1.2807 | 730 | 4.406 | - | - | |
|
|
| 1.2982 | 740 | 4.4049 | - | - | |
|
|
| 1.3158 | 750 | 4.4165 | 4.3484 | 4.7866 | |
|
|
| 1.3333 | 760 | 4.4274 | - | - | |
|
|
| 1.3509 | 770 | 4.4855 | - | - | |
|
|
| 1.3684 | 780 | 4.4571 | - | - | |
|
|
| 1.3860 | 790 | 4.4307 | - | - | |
|
|
| 1.4035 | 800 | 4.4387 | 4.3450 | 4.7628 | |
|
|
| 1.4211 | 810 | 4.4592 | - | - | |
|
|
| 1.4386 | 820 | 4.4368 | - | - | |
|
|
| 1.4561 | 830 | 4.4863 | - | - | |
|
|
| 1.4737 | 840 | 4.463 | - | - | |
|
|
| 1.4912 | 850 | 4.4113 | 4.3252 | 4.7610 | |
|
|
| 1.5088 | 860 | 4.4368 | - | - | |
|
|
| 1.5263 | 870 | 4.4738 | - | - | |
|
|
| 1.5439 | 880 | 4.4195 | - | - | |
|
|
| 1.5614 | 890 | 4.4478 | - | - | |
|
|
| 1.5789 | 900 | 4.3849 | 4.3140 | 4.7519 | |
|
|
| 1.5965 | 910 | 4.4896 | - | - | |
|
|
| 1.6140 | 920 | 4.4301 | - | - | |
|
|
| 1.6316 | 930 | 4.4142 | - | - | |
|
|
| 1.6491 | 940 | 4.4582 | - | - | |
|
|
| 1.6667 | 950 | 4.5075 | 4.3189 | 4.7259 | |
|
|
| 1.6842 | 960 | 4.4454 | - | - | |
|
|
| 1.7018 | 970 | 4.3547 | - | - | |
|
|
| 1.7193 | 980 | 4.4016 | - | - | |
|
|
| 1.7368 | 990 | 4.4064 | - | - | |
|
|
| 1.7544 | 1000 | 4.4356 | 4.3151 | 4.7276 | |
|
|
| 1.7719 | 1010 | 4.4105 | - | - | |
|
|
| 1.7895 | 1020 | 4.4067 | - | - | |
|
|
| 1.8070 | 1030 | 4.4296 | - | - | |
|
|
| 1.8246 | 1040 | 4.4147 | - | - | |
|
|
| 1.8421 | 1050 | 4.3743 | 4.3136 | 4.7182 | |
|
|
| 1.8596 | 1060 | 4.4065 | - | - | |
|
|
| 1.8772 | 1070 | 4.4025 | - | - | |
|
|
| 1.8947 | 1080 | 4.3912 | - | - | |
|
|
| 1.9123 | 1090 | 4.3731 | - | - | |
|
|
| 1.9298 | 1100 | 4.3817 | 4.3120 | 4.7357 | |
|
|
| 1.9474 | 1110 | 4.4305 | - | - | |
|
|
| 1.9649 | 1120 | 4.3914 | - | - | |
|
|
| 1.9825 | 1130 | 4.4753 | - | - | |
|
|
| 2.0 | 1140 | 4.4536 | - | - | |
|
|
|
|
|
</details> |
|
|
|
|
|
### Framework Versions |
|
|
- Python: 3.10.12 |
|
|
- Sentence Transformers: 4.1.0 |
|
|
- Transformers: 4.51.3 |
|
|
- PyTorch: 2.6.0+cu124 |
|
|
- Accelerate: 1.6.0 |
|
|
- Datasets: 3.5.0 |
|
|
- Tokenizers: 0.21.1 |
|
|
|
|
|
## Citation |
|
|
|
|
|
### BibTeX |
|
|
|
|
|
#### Sentence Transformers |
|
|
```bibtex |
|
|
@inproceedings{reimers-2019-sentence-bert, |
|
|
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks", |
|
|
author = "Reimers, Nils and Gurevych, Iryna", |
|
|
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing", |
|
|
month = "11", |
|
|
year = "2019", |
|
|
publisher = "Association for Computational Linguistics", |
|
|
url = "https://arxiv.org/abs/1908.10084", |
|
|
} |
|
|
``` |
|
|
|
|
|
#### TripletLoss |
|
|
```bibtex |
|
|
@misc{hermans2017defense, |
|
|
title={In Defense of the Triplet Loss for Person Re-Identification}, |
|
|
author={Alexander Hermans and Lucas Beyer and Bastian Leibe}, |
|
|
year={2017}, |
|
|
eprint={1703.07737}, |
|
|
archivePrefix={arXiv}, |
|
|
primaryClass={cs.CV} |
|
|
} |
|
|
``` |
|
|
|
|
|
<!-- |
|
|
## Glossary |
|
|
|
|
|
*Clearly define terms in order to be accessible across audiences.* |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
## Model Card Authors |
|
|
|
|
|
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.* |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
## Model Card Contact |
|
|
|
|
|
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.* |
|
|
--> |