Model save
Browse files- README.md +194 -289
- all_results.json +8 -0
- logs/events.out.tfevents.1745227232.40da4c159cb3.2133.0 +3 -0
- logs/events.out.tfevents.1745227395.40da4c159cb3.4624.0 +3 -0
- logs/events.out.tfevents.1745229938.40da4c159cb3.37561.0 +3 -0
- model.safetensors +1 -1
- train_results.json +8 -0
- training_args.bin +1 -1
README.md
CHANGED
|
@@ -4,136 +4,118 @@ tags:
|
|
| 4 |
- sentence-similarity
|
| 5 |
- feature-extraction
|
| 6 |
- generated_from_trainer
|
| 7 |
-
- dataset_size:
|
| 8 |
- loss:MultipleNegativesRankingLoss
|
| 9 |
base_model: intfloat/multilingual-e5-large
|
| 10 |
widget:
|
| 11 |
-
- source_sentence: 'query:
|
| 12 |
-
свидетельству о рождении?'
|
| 13 |
sentences:
|
| 14 |
-
-
|
| 15 |
-
|
| 16 |
-
|
| 17 |
-
|
| 18 |
-
|
| 19 |
-
|
| 20 |
-
|
| 21 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 22 |
sentences:
|
| 23 |
-
- 'query: Какое количество бонусов можно получить за покупки с Детской СберКартой?'
|
| 24 |
-
- "passage: Клиент обратился с вопросом о невозможности оплачивать кредит в полном\
|
| 25 |
-
\ объеме по причине тяжелой жизненной ситуации \n(реструктуризация возможна по\
|
| 26 |
-
\ причинам: потеря работы, смена места работы, снижение дохода, болезнь, смерть\
|
| 27 |
-
\ близких родственников, болезнь близких родственников, развод, декрет, отпуск\
|
| 28 |
-
\ по уходу за ребенком, призыв в армию, чрезвычайная ситуация в регионе). \n\n\
|
| 29 |
-
Обратите внимание клиента на следующее:\n- более простым способом является подача\
|
| 30 |
-
\ заявки в Сбербанк онлайн;\n- кредитная карта может быть заблокирована для расходных\
|
| 31 |
-
\ операций на 180 дней после подачи заявления на реструктуризацию и вне зависимости\
|
| 32 |
-
\ от принятого банком решения по заявке.\n\n Если после подачи заявления в Сбол.про\
|
| 33 |
-
\ сервис не доступен для прикрепления пакета документов, предоставленных клиентом,\
|
| 34 |
-
\ маршрутизируем в Мобильное приложение Сбербанк Онлайна для оформления заявления\
|
| 35 |
-
\ или прикрепления документов.\n При возникновении вопросов просим обращаться\
|
| 36 |
-
\ по телефону: 8-800-200-8-200(звонок по России бесплатный), график работы: ежедневно\
|
| 37 |
-
\ с 04:00 до 20:00 (мск).\n\nВажно!!! Если при оформлении заявки в Сбол.про\
|
| 38 |
-
\ приходит отказ, то не нужно оформлять обращение по ветке «Решить проблему».\
|
| 39 |
-
\ \n\nВажно!!! РС постадавшим от мошенничества предоставлется по ветке \"Решить\
|
| 40 |
-
\ проблему\", только по потребительским кредитам выданным после 08.07.2024\n\n\
|
| 41 |
-
Действия, необходимые по запросу клиента:\n\n\nконсультация по реструктуризации\
|
| 42 |
-
\ кредита\n\nКонсультацию по вопросам реструктуризации можно получить:\n\n- на\
|
| 43 |
-
\ сайте Банка: www.sberbank.ru в разделе \"Программы поддержки\"\n\n- по номеру\
|
| 44 |
-
\ горячей линии: 8-800-200-8-200, график работы: ежедневно с 04:00 до 20:00 (мск).\n\
|
| 45 |
-
\nобращайте внимание клиента, что для iOS загрузка документов возможна в приложении\
|
| 46 |
-
\ версии 14.3 или через ВЕБ версию СБОЛ"
|
| 47 |
- 'passage: Возможные ошибки:
|
| 48 |
|
| 49 |
|
| 50 |
-
|
| 51 |
|
| 52 |
|
| 53 |
-
|
| 54 |
-
-
|
| 55 |
-
|
| 56 |
-
|
| 57 |
-
|
| 58 |
-
|
| 59 |
-
|
| 60 |
-
|
| 61 |
-
|
| 62 |
-
Сколько бонусов СберСпасибо можно получать по Детской СберКарте ?
|
| 63 |
-
|
| 64 |
-
|
| 65 |
-
За каждую покупку начисляется 0,5% бонусами. Чтобы проверить баланс Ребёнку нужно
|
| 66 |
-
зайти приложение СберKids или отправьте СМС на номер 900 с текстом: Спасибо пробел
|
| 67 |
-
и последние 4 цифры номера карты.'
|
| 68 |
-
- 'query: Что нужно сделать, чтобы банкрот открыл новый счет или карту с разрешения
|
| 69 |
-
финансового управляющего?'
|
| 70 |
-
- source_sentence: 'query: Как изменить ПИН-код на Детской сберкате через МП СБОЛ?'
|
| 71 |
-
sentences:
|
| 72 |
-
- 'query: Когда клиент считается включееным в реестр банкротов?'
|
| 73 |
-
- 'passage: Выберите операцию, которую необходимо выполнить банкроту
|
| 74 |
|
| 75 |
|
| 76 |
-
|
|
|
|
| 77 |
|
| 78 |
|
|
|
|
|
|
|
| 79 |
|
| 80 |
-
Проведение перевода:
|
| 81 |
|
|
|
|
|
|
|
|
|
|
| 82 |
|
| 83 |
-
Клиентам банкротам в стадии Реализация имущества - разрешенно при наличии разрешения
|
| 84 |
-
финансового управляющего
|
| 85 |
|
| 86 |
-
|
| 87 |
-
финансового управляющего'
|
| 88 |
-
- 'passage: Выберите интересующий вопрос
|
| 89 |
|
| 90 |
-
|
| 91 |
-
|
| 92 |
-
|
| 93 |
-
|
| 94 |
-
|
| 95 |
-
|
| 96 |
-
|
| 97 |
-
|
| 98 |
-
Ребёнок НЕ может совершать переводы в банкоматах Банка и в ВСП.'
|
| 99 |
-
- source_sentence: 'query: Как законный представитель получает доступ к списку желаний
|
| 100 |
-
ребенка в МП СБОЛ?'
|
| 101 |
sentences:
|
| 102 |
-
- 'query:
|
| 103 |
-
- '
|
| 104 |
-
|
| 105 |
-
|
| 106 |
-
|
| 107 |
-
|
| 108 |
-
|
| 109 |
-
|
| 110 |
-
|
| 111 |
-
|
| 112 |
-
|
| 113 |
-
|
| 114 |
-
|
| 115 |
-
|
| 116 |
-
|
| 117 |
-
|
| 118 |
-
|
| 119 |
-
|
| 120 |
-
|
| 121 |
-
|
| 122 |
-
|
| 123 |
-
Если у Вас есть подозрения, что целью проведения операции является легализация
|
| 124 |
-
доходов, полученных преступным путем, действуйте в соответствии с порядком по
|
| 125 |
-
ветке "Да".
|
| 126 |
-
|
| 127 |
-
|
| 128 |
-
Если подозрения отсутствуют, то проведите операцию. Согласование с ПЦП Центр комплаенс/комплаенс
|
| 129 |
-
Московского Банка не требуется.'
|
| 130 |
pipeline_tag: sentence-similarity
|
| 131 |
library_name: sentence-transformers
|
| 132 |
---
|
| 133 |
|
| 134 |
# SentenceTransformer based on intfloat/multilingual-e5-large
|
| 135 |
|
| 136 |
-
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
|
| 137 |
|
| 138 |
## Model Details
|
| 139 |
|
|
@@ -143,7 +125,9 @@ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [i
|
|
| 143 |
- **Maximum Sequence Length:** 512 tokens
|
| 144 |
- **Output Dimensionality:** 1024 dimensions
|
| 145 |
- **Similarity Function:** Cosine Similarity
|
| 146 |
-
|
|
|
|
|
|
|
| 147 |
<!-- - **Language:** Unknown -->
|
| 148 |
<!-- - **License:** Unknown -->
|
| 149 |
|
|
@@ -178,12 +162,12 @@ Then you can load this model and run inference.
|
|
| 178 |
from sentence_transformers import SentenceTransformer
|
| 179 |
|
| 180 |
# Download from the 🤗 Hub
|
| 181 |
-
model = SentenceTransformer("George2002/
|
| 182 |
# Run inference
|
| 183 |
sentences = [
|
| 184 |
-
'query:
|
| 185 |
-
'
|
| 186 |
-
'
|
| 187 |
]
|
| 188 |
embeddings = model.encode(sentences)
|
| 189 |
print(embeddings.shape)
|
|
@@ -233,23 +217,24 @@ You can finetune this model on your own dataset.
|
|
| 233 |
|
| 234 |
## Training Details
|
| 235 |
|
| 236 |
-
### Training
|
| 237 |
|
| 238 |
-
####
|
| 239 |
|
| 240 |
-
*
|
| 241 |
-
*
|
|
|
|
| 242 |
* Approximate statistics based on the first 1000 samples:
|
| 243 |
-
| |
|
| 244 |
-
|:--------|:----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------
|
| 245 |
-
| type | string
|
| 246 |
-
| details | <ul><li>min:
|
| 247 |
* Samples:
|
| 248 |
-
|
|
| 249 |
-
|:--------------------------------------------------------------------------------------------------
|
| 250 |
-
| <code>query:
|
| 251 |
-
| <code>query: Как
|
| 252 |
-
| <code>query:
|
| 253 |
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
|
| 254 |
```json
|
| 255 |
{
|
|
@@ -258,23 +243,72 @@ You can finetune this model on your own dataset.
|
|
| 258 |
}
|
| 259 |
```
|
| 260 |
|
| 261 |
-
###
|
| 262 |
|
| 263 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 264 |
|
| 265 |
-
*
|
| 266 |
-
*
|
| 267 |
-
*
|
| 268 |
-
|
| 269 |
-
|
|
| 270 |
-
|
|
| 271 |
-
|
|
|
|
|
| 272 |
* Samples:
|
| 273 |
-
|
|
| 274 |
-
|:--------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------|
|
| 275 |
-
| <code>query: Что
|
| 276 |
-
| <code>query: Какие документ
|
| 277 |
-
| <code>query: Како
|
| 278 |
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
|
| 279 |
```json
|
| 280 |
{
|
|
@@ -290,13 +324,11 @@ You can finetune this model on your own dataset.
|
|
| 290 |
- `per_device_train_batch_size`: 64
|
| 291 |
- `learning_rate`: 1e-05
|
| 292 |
- `weight_decay`: 0.01
|
| 293 |
-
- `num_train_epochs`: 10
|
| 294 |
- `warmup_ratio`: 0.1
|
| 295 |
- `load_best_model_at_end`: True
|
| 296 |
- `push_to_hub`: True
|
| 297 |
-
- `hub_model_id`: George2002/
|
| 298 |
- `hub_strategy`: end
|
| 299 |
-
- `batch_sampler`: no_duplicates
|
| 300 |
|
| 301 |
#### All Hyperparameters
|
| 302 |
<details><summary>Click to expand</summary>
|
|
@@ -318,7 +350,7 @@ You can finetune this model on your own dataset.
|
|
| 318 |
- `adam_beta2`: 0.999
|
| 319 |
- `adam_epsilon`: 1e-08
|
| 320 |
- `max_grad_norm`: 1.0
|
| 321 |
-
- `num_train_epochs`:
|
| 322 |
- `max_steps`: -1
|
| 323 |
- `lr_scheduler_type`: linear
|
| 324 |
- `lr_scheduler_kwargs`: {}
|
|
@@ -382,7 +414,7 @@ You can finetune this model on your own dataset.
|
|
| 382 |
- `use_legacy_prediction_loop`: False
|
| 383 |
- `push_to_hub`: True
|
| 384 |
- `resume_from_checkpoint`: None
|
| 385 |
-
- `hub_model_id`: George2002/
|
| 386 |
- `hub_strategy`: end
|
| 387 |
- `hub_private_repo`: None
|
| 388 |
- `hub_always_push`: False
|
|
@@ -413,160 +445,33 @@ You can finetune this model on your own dataset.
|
|
| 413 |
- `eval_use_gather_object`: False
|
| 414 |
- `average_tokens_across_devices`: False
|
| 415 |
- `prompts`: None
|
| 416 |
-
- `batch_sampler`:
|
| 417 |
- `multi_dataset_batch_sampler`: proportional
|
| 418 |
|
| 419 |
</details>
|
| 420 |
|
| 421 |
### Training Logs
|
| 422 |
-
|
| 423 |
-
|
| 424 |
-
|
|
| 425 |
-
|
|
| 426 |
-
| 0.
|
| 427 |
-
| 0.
|
| 428 |
-
| 0.
|
| 429 |
-
| 0.
|
| 430 |
-
|
|
| 431 |
-
|
|
| 432 |
-
|
|
| 433 |
-
|
|
| 434 |
-
|
|
| 435 |
-
|
|
| 436 |
-
|
|
| 437 |
-
|
|
| 438 |
-
|
|
| 439 |
-
|
|
| 440 |
-
|
|
| 441 |
-
|
|
| 442 |
-
| 1.1972 | 170 | 3.3756 | - |
|
| 443 |
-
| 1.2676 | 180 | 3.3302 | - |
|
| 444 |
-
| 1.3380 | 190 | 3.2841 | - |
|
| 445 |
-
| 1.4085 | 200 | 3.14 | 1.5555 |
|
| 446 |
-
| 1.4789 | 210 | 3.2447 | - |
|
| 447 |
-
| 1.5493 | 220 | 3.301 | - |
|
| 448 |
-
| 1.6197 | 230 | 3.2738 | - |
|
| 449 |
-
| 1.6901 | 240 | 3.1474 | - |
|
| 450 |
-
| 1.7606 | 250 | 3.1417 | 1.5091 |
|
| 451 |
-
| 1.8310 | 260 | 3.1931 | - |
|
| 452 |
-
| 1.9014 | 270 | 3.1649 | - |
|
| 453 |
-
| 1.9718 | 280 | 3.2231 | - |
|
| 454 |
-
| 2.0423 | 290 | 3.1172 | - |
|
| 455 |
-
| 2.1127 | 300 | 3.0193 | 1.4375 |
|
| 456 |
-
| 2.1831 | 310 | 2.9451 | - |
|
| 457 |
-
| 2.2535 | 320 | 2.9669 | - |
|
| 458 |
-
| 2.3239 | 330 | 2.9739 | - |
|
| 459 |
-
| 2.3944 | 340 | 2.8988 | - |
|
| 460 |
-
| 2.4648 | 350 | 2.9009 | 1.3773 |
|
| 461 |
-
| 2.5352 | 360 | 2.8597 | - |
|
| 462 |
-
| 2.6056 | 370 | 2.8603 | - |
|
| 463 |
-
| 2.6761 | 380 | 2.9262 | - |
|
| 464 |
-
| 2.7465 | 390 | 2.9301 | - |
|
| 465 |
-
| 2.8169 | 400 | 2.9446 | 1.3113 |
|
| 466 |
-
| 2.8873 | 410 | 2.9103 | - |
|
| 467 |
-
| 2.9577 | 420 | 2.88 | - |
|
| 468 |
-
| 3.0282 | 430 | 2.7008 | - |
|
| 469 |
-
| 3.0986 | 440 | 2.669 | - |
|
| 470 |
-
| 3.1690 | 450 | 2.6466 | 1.2236 |
|
| 471 |
-
| 3.2394 | 460 | 2.6583 | - |
|
| 472 |
-
| 3.3099 | 470 | 2.5912 | - |
|
| 473 |
-
| 3.3803 | 480 | 2.5551 | - |
|
| 474 |
-
| 3.4507 | 490 | 2.5759 | - |
|
| 475 |
-
| 3.5211 | 500 | 2.6059 | 1.1634 |
|
| 476 |
-
| 3.5915 | 510 | 2.5128 | - |
|
| 477 |
-
| 3.6620 | 520 | 2.5397 | - |
|
| 478 |
-
| 3.7324 | 530 | 2.5198 | - |
|
| 479 |
-
| 3.8028 | 540 | 2.4605 | - |
|
| 480 |
-
| 3.8732 | 550 | 2.4911 | 1.0877 |
|
| 481 |
-
| 3.9437 | 560 | 2.445 | - |
|
| 482 |
-
| 4.0141 | 570 | 2.4261 | - |
|
| 483 |
-
| 4.0845 | 580 | 2.2965 | - |
|
| 484 |
-
| 4.1549 | 590 | 2.1889 | - |
|
| 485 |
-
| 4.2254 | 600 | 2.2193 | 1.0498 |
|
| 486 |
-
| 4.2958 | 610 | 2.2024 | - |
|
| 487 |
-
| 4.3662 | 620 | 2.2096 | - |
|
| 488 |
-
| 4.4366 | 630 | 2.2598 | - |
|
| 489 |
-
| 4.5070 | 640 | 2.2322 | - |
|
| 490 |
-
| 4.5775 | 650 | 2.1822 | 0.9610 |
|
| 491 |
-
| 4.6479 | 660 | 2.1621 | - |
|
| 492 |
-
| 4.7183 | 670 | 2.1543 | - |
|
| 493 |
-
| 4.7887 | 680 | 2.2376 | - |
|
| 494 |
-
| 4.8592 | 690 | 2.1652 | - |
|
| 495 |
-
| 4.9296 | 700 | 2.1194 | 0.8909 |
|
| 496 |
-
| 5.0 | 710 | 2.0919 | - |
|
| 497 |
-
| 5.0704 | 720 | 1.9779 | - |
|
| 498 |
-
| 5.1408 | 730 | 1.8619 | - |
|
| 499 |
-
| 5.2113 | 740 | 1.9172 | - |
|
| 500 |
-
| 5.2817 | 750 | 1.9355 | 0.8482 |
|
| 501 |
-
| 5.3521 | 760 | 1.9393 | - |
|
| 502 |
-
| 5.4225 | 770 | 1.8727 | - |
|
| 503 |
-
| 5.4930 | 780 | 1.9599 | - |
|
| 504 |
-
| 5.5634 | 790 | 1.8271 | - |
|
| 505 |
-
| 5.6338 | 800 | 1.9065 | 0.8195 |
|
| 506 |
-
| 5.7042 | 810 | 1.8742 | - |
|
| 507 |
-
| 5.7746 | 820 | 1.8754 | - |
|
| 508 |
-
| 5.8451 | 830 | 1.8412 | - |
|
| 509 |
-
| 5.9155 | 840 | 1.845 | - |
|
| 510 |
-
| 5.9859 | 850 | 1.8035 | 0.7713 |
|
| 511 |
-
| 6.0563 | 860 | 1.7062 | - |
|
| 512 |
-
| 6.1268 | 870 | 1.6908 | - |
|
| 513 |
-
| 6.1972 | 880 | 1.6868 | - |
|
| 514 |
-
| 6.2676 | 890 | 1.686 | - |
|
| 515 |
-
| 6.3380 | 900 | 1.564 | 0.7355 |
|
| 516 |
-
| 6.4085 | 910 | 1.7135 | - |
|
| 517 |
-
| 6.4789 | 920 | 1.6614 | - |
|
| 518 |
-
| 6.5493 | 930 | 1.6442 | - |
|
| 519 |
-
| 6.6197 | 940 | 1.6117 | - |
|
| 520 |
-
| 6.6901 | 950 | 1.6317 | 0.7008 |
|
| 521 |
-
| 6.7606 | 960 | 1.6589 | - |
|
| 522 |
-
| 6.8310 | 970 | 1.673 | - |
|
| 523 |
-
| 6.9014 | 980 | 1.6018 | - |
|
| 524 |
-
| 6.9718 | 990 | 1.6291 | - |
|
| 525 |
-
| 7.0423 | 1000 | 1.5407 | 0.6680 |
|
| 526 |
-
| 7.1127 | 1010 | 1.4842 | - |
|
| 527 |
-
| 7.1831 | 1020 | 1.5063 | - |
|
| 528 |
-
| 7.2535 | 1030 | 1.5052 | - |
|
| 529 |
-
| 7.3239 | 1040 | 1.42 | - |
|
| 530 |
-
| 7.3944 | 1050 | 1.4671 | 0.6451 |
|
| 531 |
-
| 7.4648 | 1060 | 1.4879 | - |
|
| 532 |
-
| 7.5352 | 1070 | 1.5012 | - |
|
| 533 |
-
| 7.6056 | 1080 | 1.4386 | - |
|
| 534 |
-
| 7.6761 | 1090 | 1.4544 | - |
|
| 535 |
-
| 7.7465 | 1100 | 1.4076 | 0.6195 |
|
| 536 |
-
| 7.8169 | 1110 | 1.4838 | - |
|
| 537 |
-
| 7.8873 | 1120 | 1.4745 | - |
|
| 538 |
-
| 7.9577 | 1130 | 1.3781 | - |
|
| 539 |
-
| 8.0282 | 1140 | 1.422 | - |
|
| 540 |
-
| 8.0986 | 1150 | 1.345 | 0.6033 |
|
| 541 |
-
| 8.1690 | 1160 | 1.4478 | - |
|
| 542 |
-
| 8.2394 | 1170 | 1.3111 | - |
|
| 543 |
-
| 8.3099 | 1180 | 1.3754 | - |
|
| 544 |
-
| 8.3803 | 1190 | 1.3996 | - |
|
| 545 |
-
| 8.4507 | 1200 | 1.3818 | 0.5862 |
|
| 546 |
-
| 8.5211 | 1210 | 1.348 | - |
|
| 547 |
-
| 8.5915 | 1220 | 1.3567 | - |
|
| 548 |
-
| 8.6620 | 1230 | 1.331 | - |
|
| 549 |
-
| 8.7324 | 1240 | 1.2977 | - |
|
| 550 |
-
| 8.8028 | 1250 | 1.2578 | 0.5742 |
|
| 551 |
-
| 8.8732 | 1260 | 1.2807 | - |
|
| 552 |
-
| 8.9437 | 1270 | 1.3597 | - |
|
| 553 |
-
| 9.0141 | 1280 | 1.3292 | - |
|
| 554 |
-
| 9.0845 | 1290 | 1.2585 | - |
|
| 555 |
-
| 9.1549 | 1300 | 1.2552 | 0.5647 |
|
| 556 |
-
| 9.2254 | 1310 | 1.3339 | - |
|
| 557 |
-
| 9.2958 | 1320 | 1.2872 | - |
|
| 558 |
-
| 9.3662 | 1330 | 1.276 | - |
|
| 559 |
-
| 9.4366 | 1340 | 1.2846 | - |
|
| 560 |
-
| 9.5070 | 1350 | 1.2782 | 0.5621 |
|
| 561 |
-
| 9.5775 | 1360 | 1.2883 | - |
|
| 562 |
-
| 9.6479 | 1370 | 1.2515 | - |
|
| 563 |
-
| 9.7183 | 1380 | 1.3023 | - |
|
| 564 |
-
| 9.7887 | 1390 | 1.3053 | - |
|
| 565 |
-
| 9.8592 | 1400 | 1.2556 | 0.5562 |
|
| 566 |
-
| 9.9296 | 1410 | 1.2926 | - |
|
| 567 |
-
| 10.0 | 1420 | 1.2199 | - |
|
| 568 |
|
| 569 |
-
</details>
|
| 570 |
|
| 571 |
### Framework Versions
|
| 572 |
- Python: 3.10.12
|
|
|
|
| 4 |
- sentence-similarity
|
| 5 |
- feature-extraction
|
| 6 |
- generated_from_trainer
|
| 7 |
+
- dataset_size:6680
|
| 8 |
- loss:MultipleNegativesRankingLoss
|
| 9 |
base_model: intfloat/multilingual-e5-large
|
| 10 |
widget:
|
| 11 |
+
- source_sentence: 'query: Каковы последствия для банка при кредитовании клиентов-банкротов?'
|
|
|
|
| 12 |
sentences:
|
| 13 |
+
- 'passage: Существуют следующие ограничения:
|
| 14 |
+
|
| 15 |
+
|
| 16 |
+
01. Расходный лимит на месяц:
|
| 17 |
+
|
| 18 |
+
|
| 19 |
+
Устанавливается лимит на все расходные операции по карте на месяц. Сумму лимита
|
| 20 |
+
можно изменить в любой момент. Уведомление об установлении лимита ребенку приходить
|
| 21 |
+
не будет. Ребенок в своем МП СБОЛ также может скорректировать сумму этого лимита
|
| 22 |
+
или полностью убрать установленный законным представителем лимит (если ребенку
|
| 23 |
+
доступно данное действие). В этом случае уведомление законному представителю также
|
| 24 |
+
не придет.'
|
| 25 |
+
- "passage: С каким вопросом обратился банкрот?\n\n11. Получение кредита/ кредитной\
|
| 26 |
+
\ карты, погашение задолженности по кредиту\n\n1. Банк не осуществляет:\n- кредитование\
|
| 27 |
+
\ Клиентов-банкротов; \n- выпуск, досрочный перевыпуск и выдачу личных дебетовых/кредитных\
|
| 28 |
+
\ карт Клиентам-банкротам, в т.ч. дебетовых карт с овердрафтом и дополнительных\
|
| 29 |
+
\ дебетовых и кредитных карт к счету Клиента-банкрота. \n\nКлиент -банкрот (в\
|
| 30 |
+
\ любой стадии) может погасить задолженность по своему кредиту только при наличии\
|
| 31 |
+
\ РАЗРЕШЕНИЯ ФУ на проведение данной операции с указанием номера кредитного договора\
|
| 32 |
+
\ и суммы гашения. Операция проводится в стандартном режиме.\n\n\nБезналичное\
|
| 33 |
+
\ гашение кредита банкротом при наличии РАЗРЕШЕНИЯ ФУ:\nВходит в АС ФС в подсистему\
|
| 34 |
+
\ «Переводы физических лиц» → \nвыбирает «Операции без идентификации» → \nоперация\
|
| 35 |
+
\ «1. Оформление переводов физических лиц» → \n«1. Переводы по системе Сбербанка»\
|
| 36 |
+
\ → \n«Переводы со счета для зачисления на счет» → \nуказывает № счета клиента-банкрота,\
|
| 37 |
+
\ с которого будет перевод, → \nвыбирает «Перевод целевых кредитов, полученных\
|
| 38 |
+
\ в Сбербанке России, а также собственных средств по назначению кредита» → \n\
|
| 39 |
+
выбирает Перевод с целью погашения кредита → \nуказывает Сумму → \nвводит реквизиты\
|
| 40 |
+
\ ОСБ/ВСП* → \nвводит ФИО получателя (клиента-банкрота) и № ссудного счета/№ счета\
|
| 41 |
+
\ кредитной карты → \nв реквизитах отправителя указывает данные ДУЛ Финансового\
|
| 42 |
+
\ управляющего и Информацию о кредитных обязательствах: Оплата задолженности по\
|
| 43 |
+
\ кредитному договору №____ от __.__.20__ г./ кредитной карте № _________; дело\
|
| 44 |
+
\ о банкротстве №_________, клиент: Иванов Иван Иванович."
|
| 45 |
+
- "passage: С каким вопросом обратился ФУ?\n\n04. Открытие счета на имя банкрота\
|
| 46 |
+
\ \n\nНа имя банкрота финансовый управляющий может открыть Специальный банковский\
|
| 47 |
+
\ счет, любой другой счет, в том числе ГЖС, эскроу\nКакой счет желает открыть\
|
| 48 |
+
\ ФУ"
|
| 49 |
+
- source_sentence: 'query: Что необходимо указать в обращении при информировании ПЦП
|
| 50 |
+
Центра комплаенс Московского Банка?'
|
| 51 |
sentences:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 52 |
- 'passage: Возможные ошибки:
|
| 53 |
|
| 54 |
|
| 55 |
+
Связь не создана
|
| 56 |
|
| 57 |
|
| 58 |
+
Техническая ошибка. Повторите операцию позже.'
|
| 59 |
+
- "passage: Выбрать возраст ребенка\n\nребенку от 14 до 18 лет\n\nЕсли представитель\
|
| 60 |
+
\ ребенку от 14 до 18 лет является приемным родителем\n\nЗапросите следующие документы\
|
| 61 |
+
\ удостоверяющую личность или нотариально заверенную копию и один из документов,\
|
| 62 |
+
\ подтверждающие полномочия:\n\nДоговор о приемной семье\n\nДокумент органов опеки\
|
| 63 |
+
\ и попечительства \n\nПроставить галочку \"Документы предъявлены\" и нажать кнопку\
|
| 64 |
+
\ \"Продолжить\""
|
| 65 |
+
- 'passage: Выберите вопрос:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 66 |
|
| 67 |
|
| 68 |
+
После завершения обслуживания и ухода клиента возникли подозрения, что операция
|
| 69 |
+
или выпуск/перевыпуск карт(ы) проводились с целью легализации преступных доходов?
|
| 70 |
|
| 71 |
|
| 72 |
+
Для информирования ПЦП Центр комплаенс/комплаенс Московского Банка незамедлительно
|
| 73 |
+
направьте сведения о выявленном факте через ДРУГ (см. картинку)
|
| 74 |
|
|
|
|
| 75 |
|
| 76 |
+
При заполнении обращения подробно опишите возникшие подозрения для сокращения
|
| 77 |
+
времени принятия решения в отношении клиента и инструментов удаленного доступа
|
| 78 |
+
к счету.
|
| 79 |
|
|
|
|
|
|
|
| 80 |
|
| 81 |
+
ВАЖНО!!!
|
|
|
|
|
|
|
| 82 |
|
| 83 |
+
Если Вы информируете ПЦП Центр комплаенс/комплаенс Московского Банка о свершившимся
|
| 84 |
+
факте массового открытия клиенту банковских карт, в т.ч. в составе организованной
|
| 85 |
+
группы, то дополнительно ознакомьтесь с признаками согласования выпуска/перевыпуска
|
| 86 |
+
карт(ы) при приеме от клиента заявления. Чтобы в следующий раз согласовать либо
|
| 87 |
+
отказать клие��ту в выпуске/перевыпуске карт(ы) на этапе приема заявления, а не
|
| 88 |
+
после окончания обслуживания.'
|
| 89 |
+
- source_sentence: 'query: Какая заявка требуется для исправления данных о ребёнке,
|
| 90 |
+
если он числится умершим?'
|
|
|
|
|
|
|
|
|
|
| 91 |
sentences:
|
| 92 |
+
- 'query: Что писать в теме электронного письма для смены маркера?'
|
| 93 |
+
- 'query: Что нужно подать для исправления информации о ребёнке, если он зарегистрирован
|
| 94 |
+
как умерший?'
|
| 95 |
+
- 'query: Какой статус подопечного следует указать при добавлении нового подопечного?'
|
| 96 |
+
- source_sentence: 'query: Какое свидетельство необходимо для подтверждения полномочий
|
| 97 |
+
родителя или усыновителя несовершеннолетнего?'
|
| 98 |
+
sentences:
|
| 99 |
+
- 'query: Что нужно сделать, чтобы разблокировать карту перед снятием наличных?'
|
| 100 |
+
- 'query: Какой документ требуется для подтверждения полномочий родителей или усыновителей
|
| 101 |
+
несовершеннолетних?'
|
| 102 |
+
- 'query: Что необходимо предоставить в АС СберДруг для вопроса о военной пенсии
|
| 103 |
+
банкрота?'
|
| 104 |
+
- source_sentence: 'query: Что нужно для подтверждения прав родителя или усыновителя
|
| 105 |
+
ребенка с 14 до 18 лет?'
|
| 106 |
+
sentences:
|
| 107 |
+
- 'query: Какие категории клиентов обслуживаются законными представителями по документу?'
|
| 108 |
+
- 'query: Какие справки нужны, чтобы подтвердить полномочия родителей или усыновителей
|
| 109 |
+
несовершеннолетних от 14 до 18 лет?'
|
| 110 |
+
- 'query: Кто имеет право переводить деньги на счет по правилам Гражданского Кодекса
|
| 111 |
+
РФ?'
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 112 |
pipeline_tag: sentence-similarity
|
| 113 |
library_name: sentence-transformers
|
| 114 |
---
|
| 115 |
|
| 116 |
# SentenceTransformer based on intfloat/multilingual-e5-large
|
| 117 |
|
| 118 |
+
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large) on the q2q_data and q2p_data datasets. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
|
| 119 |
|
| 120 |
## Model Details
|
| 121 |
|
|
|
|
| 125 |
- **Maximum Sequence Length:** 512 tokens
|
| 126 |
- **Output Dimensionality:** 1024 dimensions
|
| 127 |
- **Similarity Function:** Cosine Similarity
|
| 128 |
+
- **Training Datasets:**
|
| 129 |
+
- q2q_data
|
| 130 |
+
- q2p_data
|
| 131 |
<!-- - **Language:** Unknown -->
|
| 132 |
<!-- - **License:** Unknown -->
|
| 133 |
|
|
|
|
| 162 |
from sentence_transformers import SentenceTransformer
|
| 163 |
|
| 164 |
# Download from the 🤗 Hub
|
| 165 |
+
model = SentenceTransformer("George2002/sledopyt_embedder_v2")
|
| 166 |
# Run inference
|
| 167 |
sentences = [
|
| 168 |
+
'query: Что нужно для подтверждения прав родителя или усыновителя ребенка с 14 до 18 лет?',
|
| 169 |
+
'query: Какие справки нужны, чтобы подтвердить полномочия родителей или усыновителей несовершеннолетних от 14 до 18 лет?',
|
| 170 |
+
'query: Кто имеет право переводить деньги на счет по правилам Гражданского Кодекса РФ?',
|
| 171 |
]
|
| 172 |
embeddings = model.encode(sentences)
|
| 173 |
print(embeddings.shape)
|
|
|
|
| 217 |
|
| 218 |
## Training Details
|
| 219 |
|
| 220 |
+
### Training Datasets
|
| 221 |
|
| 222 |
+
#### q2q_data
|
| 223 |
|
| 224 |
+
* Dataset: q2q_data
|
| 225 |
+
* Size: 5,139 training samples
|
| 226 |
+
* Columns: <code>query_1</code> and <code>query_2</code>
|
| 227 |
* Approximate statistics based on the first 1000 samples:
|
| 228 |
+
| | query_1 | query_2 |
|
| 229 |
+
|:--------|:-----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|
|
| 230 |
+
| type | string | string |
|
| 231 |
+
| details | <ul><li>min: 12 tokens</li><li>mean: 21.67 tokens</li><li>max: 41 tokens</li></ul> | <ul><li>min: 11 tokens</li><li>mean: 21.56 tokens</li><li>max: 39 tokens</li></ul> |
|
| 232 |
* Samples:
|
| 233 |
+
| query_1 | query_2 |
|
| 234 |
+
|:------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------|
|
| 235 |
+
| <code>query: Какие категории подопечных можно выбрать на экране 'Запрос документов'?</code> | <code>query: Какие подопечные доступны для выбора на экране 'Запрос документов'?</code> |
|
| 236 |
+
| <code>query: Какие действия нужно предпринять при наличии ареста на счете для выдачи наличных?</code> | <code>query: Какие шаги нужно выполнить, чтобы снять деньги с арестованного счета?</code> |
|
| 237 |
+
| <code>query: Что необходимо сделать, если ваш счёт не был найден в системе?</code> | <code>query: Какие шаги предпринять, если счет не отображается в системе?</code> |
|
| 238 |
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
|
| 239 |
```json
|
| 240 |
{
|
|
|
|
| 243 |
}
|
| 244 |
```
|
| 245 |
|
| 246 |
+
#### q2p_data
|
| 247 |
|
| 248 |
+
* Dataset: q2p_data
|
| 249 |
+
* Size: 1,541 training samples
|
| 250 |
+
* Columns: <code>query</code> and <code>chunk</code>
|
| 251 |
+
* Approximate statistics based on the first 1000 samples:
|
| 252 |
+
| | query | chunk |
|
| 253 |
+
|:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
|
| 254 |
+
| type | string | string |
|
| 255 |
+
| details | <ul><li>min: 11 tokens</li><li>mean: 21.86 tokens</li><li>max: 37 tokens</li></ul> | <ul><li>min: 12 tokens</li><li>mean: 162.56 tokens</li><li>max: 512 tokens</li></ul> |
|
| 256 |
+
* Samples:
|
| 257 |
+
| query | chunk |
|
| 258 |
+
|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
| 259 |
+
| <code>query: Как ребенок узнает, что его карта была разблокирована законным представителем?</code> | <code>passage: Существуют следующие возможности:<br><br>08. Разблокировать карту:<br><br>Если ребенок заблокировал карту с причиной «Ее захватил банкомат» или «Я так хочу», то законный представитель сможет ее самостоятельно разблокировать, если с причиной «Украли или потерялось», то законный представитель сможет ее самостоятельно разблокировать только в случае, если с картой ничего не было утеряно (в остальных случаях не сможет разблокировать). Ребенок при разблокировке не получит уведомлений об этом, но увидит в своем МП СБОЛ, что карта разблокирована. При этом, ребенку также будет доступна возможность снова заблокировать карту.</code> |
|
| 260 |
+
| <code>query: Какое условие нужно выполнить, чтобы законный представитель мог видеть детскую СберКарту, если ребенку исполнилось 14 лет 17.11.2022 или позже?</code> | <code>passage: Описание функционала во вложении ниже.<br><br>Типичные вопросы по отображению молодёжных карт в МП СБОЛ родителя и ответы на них:<br><br>01. Кто может получить доступ к картам ребенка 14-17 лет ?<br><br>Установившие в Банке связь со своим ребенком 14-17 лет законные представители: Родитель/Усыновитель, Приемный родитель, Опекун (связь отображается в СБОЛ.Про - ФП «Подопечные и представители», а также в системе SmartCare. В CRM связь законного представителя и ребенка 14-17 лет НЕ отображается), по которым выполняется одно из следующих условий: <br><br>- СберКарта ребенка 14-17 лет была открыта и активирована до 16.11.2022 включительно, и ребенку исполнилось 14 лет до 16.11.2022 включительно.<br><br>- Законный представитель до пилота видел детскую СберКарту своего ребенка 13 лет в своем МП СберБанк Онлайн, и этому ребенку исполнилось 14 лет 17.11.2022 или позднее.</code> |
|
| 261 |
+
| <code>query: Что нужно указать в заявлении-анкете о личных данных клиента?</code> | <code>passage: Заявление-анкета<br>Заявление-анкета</code> |
|
| 262 |
+
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
|
| 263 |
+
```json
|
| 264 |
+
{
|
| 265 |
+
"scale": 20.0,
|
| 266 |
+
"similarity_fct": "cos_sim"
|
| 267 |
+
}
|
| 268 |
+
```
|
| 269 |
+
|
| 270 |
+
### Evaluation Datasets
|
| 271 |
+
|
| 272 |
+
#### q2q_data
|
| 273 |
+
|
| 274 |
+
* Dataset: q2q_data
|
| 275 |
+
* Size: 271 evaluation samples
|
| 276 |
+
* Columns: <code>query_1</code> and <code>query_2</code>
|
| 277 |
+
* Approximate statistics based on the first 271 samples:
|
| 278 |
+
| | query_1 | query_2 |
|
| 279 |
+
|:--------|:-----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|
|
| 280 |
+
| type | string | string |
|
| 281 |
+
| details | <ul><li>min: 12 tokens</li><li>mean: 22.01 tokens</li><li>max: 35 tokens</li></ul> | <ul><li>min: 12 tokens</li><li>mean: 21.86 tokens</li><li>max: 37 tokens</li></ul> |
|
| 282 |
+
* Samples:
|
| 283 |
+
| query_1 | query_2 |
|
| 284 |
+
|:--------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------|
|
| 285 |
+
| <code>query: Какие требования к документам при обращении социального работника в ВСП?</code> | <code>query: Какие документы нужны социальному работнику при подаче заявки в ВСП?</code> |
|
| 286 |
+
| <code>query: Что необходимо сделать перед тем, как снять наличные со счета подопечного?</code> | <code>query: Какие действия нужно предпринять, чтобы снять деньги со счета подопечного?</code> |
|
| 287 |
+
| <code>query: Когда банкрот может получить карту МИР без согласия Финансового управляющего?</code> | <code>query: В каких ситуациях можно оформить карту МИР банкроту без разрешения Финансового управляющего?</code> |
|
| 288 |
+
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
|
| 289 |
+
```json
|
| 290 |
+
{
|
| 291 |
+
"scale": 20.0,
|
| 292 |
+
"similarity_fct": "cos_sim"
|
| 293 |
+
}
|
| 294 |
+
```
|
| 295 |
+
|
| 296 |
+
#### q2p_data
|
| 297 |
|
| 298 |
+
* Dataset: q2p_data
|
| 299 |
+
* Size: 82 evaluation samples
|
| 300 |
+
* Columns: <code>query</code> and <code>chunk</code>
|
| 301 |
+
* Approximate statistics based on the first 82 samples:
|
| 302 |
+
| | query | chunk |
|
| 303 |
+
|:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
|
| 304 |
+
| type | string | string |
|
| 305 |
+
| details | <ul><li>min: 14 tokens</li><li>mean: 21.79 tokens</li><li>max: 38 tokens</li></ul> | <ul><li>min: 15 tokens</li><li>mean: 144.37 tokens</li><li>max: 512 tokens</li></ul> |
|
| 306 |
* Samples:
|
| 307 |
+
| query | chunk |
|
| 308 |
+
|:-------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
| 309 |
+
| <code>query: Что делать, если появляется техническая ошибка при работе с номинальным счетом?</code> | <code>passage: Возможные ошибки:<br><br>Связь не создана<br><br>Техническая ошибка. Повторите операцию позже.</code> |
|
| 310 |
+
| <code>query: Как клиент-банкрот может распорядиться наследством в стадии 'Реструктуризация долгов'?</code> | <code>passage: В случае, если Клиент, обратившийся за получением наследства при идентификации обнаружен в Стоп-Листе банкротов: <br>- сообщить клиенту, что у Банка есть информация о его банкротстве и он может получить только Выплату на достойные похороны<br>- выплату наследства Банк осуществляет в зависи��ости от стадии банкротства:<br><br>!!! Получить наследство и распоряжаться им самостоятельно клиент банкрот может только после завершения процедуры банкротства. <br><br>Наследством банкрота в стадии реализация имущества распоряжается утвержденный для проведения процедуры финансовый управляющий.<br> <br>В этом случае <br><br>Наследником в заявке на выплату через ОЦ заводим банкрота, выплата наследства перевеодится ему на счет. <br>После выплаты, ФУ уже в рамках своих полномочий сможет этими ДС распорядиться.<br>.<br><br>Стадия "Реструктуризация долгов"<br><br>В случае, если в отношении наследника умершего клиента - введена процедура "Реструктуризация долгов", клиент может распоряжаться наследством, только при предъявлении разрешения финан...</code> |
|
| 311 |
+
| <code>query: Какую роль играют органы опеки и попечительства в процессе выдачи разрешений на операции по счету ограниченно дееспособного?</code> | <code>passage: Право распоряжения средствами на счете согласно требованиям ГК РФ (п.2 ст. 26, п.1 ст.37)<br><br>суммы пенсии, пособий (за исключением пособий по безработице), алиментов, страховые, в том числе по потере кормильца, наследственные суммы и т.д., суммы, перечисленные третьими лицами, а также принятые наличными денежные средства от третьих лиц, в том числе от попечителя<br><br>Ограниченно дееспособный распоряжается только с:<br>письменного предварительного разрешения органа опеки и попечительства* и письменного согласия попечителя.<br>(ниже по тексту во вложении Памятка по первичной проверке и передаче на хранение предварительного письменного разрешения органов опеки и попечительства сотрудником ВСП)<br><br>*Предварительное письменное разрешение органов опеки и попечительства на совершение операций по счетам ограниченно дееспособных может быть выдано через МФЦ в виде бумажного документа, заверенного печатью и подписью уполномоченного сотрудника МФЦ, и являющегося экземпляром электронного документа, подп...</code> |
|
| 312 |
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
|
| 313 |
```json
|
| 314 |
{
|
|
|
|
| 324 |
- `per_device_train_batch_size`: 64
|
| 325 |
- `learning_rate`: 1e-05
|
| 326 |
- `weight_decay`: 0.01
|
|
|
|
| 327 |
- `warmup_ratio`: 0.1
|
| 328 |
- `load_best_model_at_end`: True
|
| 329 |
- `push_to_hub`: True
|
| 330 |
+
- `hub_model_id`: George2002/sledopyt_embedder_v2
|
| 331 |
- `hub_strategy`: end
|
|
|
|
| 332 |
|
| 333 |
#### All Hyperparameters
|
| 334 |
<details><summary>Click to expand</summary>
|
|
|
|
| 350 |
- `adam_beta2`: 0.999
|
| 351 |
- `adam_epsilon`: 1e-08
|
| 352 |
- `max_grad_norm`: 1.0
|
| 353 |
+
- `num_train_epochs`: 3
|
| 354 |
- `max_steps`: -1
|
| 355 |
- `lr_scheduler_type`: linear
|
| 356 |
- `lr_scheduler_kwargs`: {}
|
|
|
|
| 414 |
- `use_legacy_prediction_loop`: False
|
| 415 |
- `push_to_hub`: True
|
| 416 |
- `resume_from_checkpoint`: None
|
| 417 |
+
- `hub_model_id`: George2002/sledopyt_embedder_v2
|
| 418 |
- `hub_strategy`: end
|
| 419 |
- `hub_private_repo`: None
|
| 420 |
- `hub_always_push`: False
|
|
|
|
| 445 |
- `eval_use_gather_object`: False
|
| 446 |
- `average_tokens_across_devices`: False
|
| 447 |
- `prompts`: None
|
| 448 |
+
- `batch_sampler`: batch_sampler
|
| 449 |
- `multi_dataset_batch_sampler`: proportional
|
| 450 |
|
| 451 |
</details>
|
| 452 |
|
| 453 |
### Training Logs
|
| 454 |
+
| Epoch | Step | Training Loss | q2q data loss | q2p data loss |
|
| 455 |
+
|:------:|:----:|:-------------:|:-------------:|:-------------:|
|
| 456 |
+
| 0.1923 | 10 | 1.6931 | - | - |
|
| 457 |
+
| 0.3846 | 20 | 0.7742 | - | - |
|
| 458 |
+
| 0.4808 | 25 | - | 0.0053 | 0.0658 |
|
| 459 |
+
| 0.5769 | 30 | 0.2775 | - | - |
|
| 460 |
+
| 0.7692 | 40 | 0.2046 | - | - |
|
| 461 |
+
| 0.9615 | 50 | 0.229 | 0.0037 | 0.0302 |
|
| 462 |
+
| 1.1538 | 60 | 0.1043 | - | - |
|
| 463 |
+
| 1.3462 | 70 | 0.2127 | - | - |
|
| 464 |
+
| 1.4423 | 75 | - | 0.0035 | 0.0231 |
|
| 465 |
+
| 1.5385 | 80 | 0.1543 | - | - |
|
| 466 |
+
| 1.7308 | 90 | 0.1286 | - | - |
|
| 467 |
+
| 1.9231 | 100 | 0.1095 | 0.0029 | 0.0231 |
|
| 468 |
+
| 2.1154 | 110 | 0.0941 | - | - |
|
| 469 |
+
| 2.3077 | 120 | 0.1543 | - | - |
|
| 470 |
+
| 2.4038 | 125 | - | 0.0028 | 0.0230 |
|
| 471 |
+
| 2.5 | 130 | 0.0911 | - | - |
|
| 472 |
+
| 2.6923 | 140 | 0.1389 | - | - |
|
| 473 |
+
| 2.8846 | 150 | 0.0812 | 0.0027 | 0.0227 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 474 |
|
|
|
|
| 475 |
|
| 476 |
### Framework Versions
|
| 477 |
- Python: 3.10.12
|
all_results.json
ADDED
|
@@ -0,0 +1,8 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"epoch": 3.0,
|
| 3 |
+
"total_flos": 0.0,
|
| 4 |
+
"train_loss": 0.29127290004338974,
|
| 5 |
+
"train_runtime": 380.8998,
|
| 6 |
+
"train_samples_per_second": 52.612,
|
| 7 |
+
"train_steps_per_second": 0.41
|
| 8 |
+
}
|
logs/events.out.tfevents.1745227232.40da4c159cb3.2133.0
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:eb4d2c021f6fd25d29cacd1c19eff0dcdfeff37492b89004668e6cd5d4228c59
|
| 3 |
+
size 5328
|
logs/events.out.tfevents.1745227395.40da4c159cb3.4624.0
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:8a9b314e060b5d68b2aa758973e2a49822c5c2eea8b81b6a4ece4dbe9aeaa43d
|
| 3 |
+
size 12882
|
logs/events.out.tfevents.1745229938.40da4c159cb3.37561.0
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:e7a29d3836324dbe27d04be9c7d9af1d16a5ed034cdbb9056b783e26349dc5fb
|
| 3 |
+
size 11427
|
model.safetensors
CHANGED
|
@@ -1,3 +1,3 @@
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
-
oid sha256:
|
| 3 |
size 2239607176
|
|
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:c127a2fdcc588decdbadb7ea3ca9422881deeef6cb1d92319008fd8f87184deb
|
| 3 |
size 2239607176
|
train_results.json
ADDED
|
@@ -0,0 +1,8 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"epoch": 3.0,
|
| 3 |
+
"total_flos": 0.0,
|
| 4 |
+
"train_loss": 0.29127290004338974,
|
| 5 |
+
"train_runtime": 380.8998,
|
| 6 |
+
"train_samples_per_second": 52.612,
|
| 7 |
+
"train_steps_per_second": 0.41
|
| 8 |
+
}
|
training_args.bin
CHANGED
|
@@ -1,3 +1,3 @@
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
-
oid sha256:
|
| 3 |
size 5624
|
|
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:874ef51a1fe2dae554aeb0e22ce906d0c468973771c6463664429ea7d26b5749
|
| 3 |
size 5624
|