Chimalpopoka
/

CrossEncoderRanker

@@ -24,13 +24,13 @@ model-index:
       type: softmax_accuracy_eval
     metrics:
     - type: f1_macro
-      value: 0.9715485242270209
       name: F1 Macro
     - type: f1_micro
-      value: 0.9743012183884509
       name: F1 Micro
     - type: f1_weighted
-      value: 0.974262256621189
       name: F1 Weighted
 ---
@@ -74,11 +74,11 @@ from sentence_transformers import CrossEncoder
 model = CrossEncoder("Chimalpopoka/CrossEncoderRanker")
 # Get scores for pairs of texts
 pairs = [
-    ['Панель аллергенов пыли № 1 IgE (домашняя пыль (Greer), клещ-дерматофаг перинный, клещ-дерматофаг мучной, таракан)', 'Смесь аллергенов пыли - hm1, Состав: домашняя пыль, Dermatophagoides pteronyssinus, Dermatophagoides farinae, таракан-прусак, IgE. Метод: ИФА'],
-    ['Жидкостная цитология РШМ', 'Жидкостная цитология. Исследование соскоба шейки матки и цервикального канала (окрашивание по Папаниколау)'],
-    ['Посев на возбудителей кишечной инфекции (сальмонеллы, шигеллы) с определением чувствительности к основному спектру антибиотиков', 'Посев кала на патогенную флору (дизентерийная и тифопаратифозная группы): С определением чувствительности к антибиотикам. Метод: культуральный'],
-    ['Молекулярно-генетическое исследование мутации в гене V617F (замена 617-ой аминокислоты с валина на фенилаланин) JAK2 (янус тирозин-киназа второго типа / Качественная оценка наличия соматической мутации V617F в 14 экзоне гена JAK2 (Qualitative assessment of presence of gene JAK2 617F somatic mutation)', 'Анализ мутации V617F гена JAK2 (замена валин на фенилаланин). Метод: ПЦР'],
-    ['Водородно-метановый дыхательный тест с лактулозой (СИБРТЕСТ, синдром избыточного бактериального роста в тонкой кишке, СИБР) (самостоятельное взятие проб)', 'Дыхательный водородный тест на СИБР'],
 ]
 scores = model.predict(pairs)
 print(scores.shape)
@@ -120,9 +120,9 @@ You can finetune this model on your own dataset.
 | Metric       | Value      |
 |:-------------|:-----------|
-| **f1_macro** | **0.9715** |
-| f1_micro     | 0.9743     |
-| f1_weighted  | 0.9743     |
 <!--
 ## Bias, Risks and Limitations
@@ -148,13 +148,13 @@ You can finetune this model on your own dataset.
   |         | sentence_0                                                                                     | sentence_1                                                                                     | label                                           |
   |:--------|:-----------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------|:------------------------------------------------|
   | type    | string                                                                                         | string                                                                                         | int                                             |
-  | details | <ul><li>min: 5 characters</li><li>mean: 64.98 characters</li><li>max: 553 characters</li></ul> | <ul><li>min: 6 characters</li><li>mean: 63.31 characters</li><li>max: 477 characters</li></ul> | <ul><li>0: ~34.40%</li><li>1: ~65.60%</li></ul> |
 * Samples:
-  | sentence_0                                                                                                                                   | sentence_1                                                                                                                                                  | label          |
-  |:---------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
-  | <code>Панель аллергенов пыли № 1 IgE (домашняя пыль (Greer), клещ-дерматофаг перинный, клещ-дерматофаг мучной, таракан)</code>               | <code>Смесь аллергенов пыли - hm1, Состав: домашняя пыль, Dermatophagoides pteronyssinus, Dermatophagoides farinae, таракан-прусак, IgE. Метод: ИФА</code>  | <code>1</code> |
-  | <code>Жидкостная цитология РШМ</code>                                                                                                        | <code>Жидкостная цитология. Исследование соскоба шейки матки и цервикального канала (окрашивание по Папаниколау)</code>                                     | <code>1</code> |
-  | <code>Посев на возбудителей кишечной инфекции (сальмонеллы, шигеллы) с определением чувствительности к основному спектру антибиотиков</code> | <code>Посев кала на патогенную флору (дизентерийная и тифопаратифозная группы): С определением чувствительности к антибиотикам. Метод: культуральный</code> | <code>1</code> |
 * Loss: [<code>CrossEntropyLoss</code>](https://sbert.net/docs/package_reference/cross_encoder/losses.html#crossentropyloss)
 ### Training Hyperparameters
@@ -289,26 +289,26 @@ You can finetune this model on your own dataset.
 ### Training Logs
 | Epoch  | Step  | Training Loss | softmax_accuracy_eval_f1_macro |
 |:------:|:-----:|:-------------:|:------------------------------:|
-| 0.0458 | 500   | 0.5378        | -                              |
-| 0.0915 | 1000  | 0.2207        | -                              |
-| 0.1373 | 1500  | 0.2019        | -                              |
-| 0.1831 | 2000  | 0.1981        | 0.9654                         |
-| 0.2288 | 2500  | 0.19          | -                              |
-| 0.2746 | 3000  | 0.1703        | -                              |
-| 0.3204 | 3500  | 0.217         | -                              |
-| 0.3661 | 4000  | 0.1673        | 0.9627                         |
-| 0.4119 | 4500  | 0.1739        | -                              |
-| 0.4577 | 5000  | 0.143         | -                              |
-| 0.5034 | 5500  | 0.1522        | -                              |
-| 0.5492 | 6000  | 0.1545        | 0.9703                         |
-| 0.5950 | 6500  | 0.1353        | -                              |
-| 0.6407 | 7000  | 0.1438        | -                              |
 | 0.6865 | 7500  | 0.1339        | -                              |
-| 0.7323 | 8000  | 0.1355        | 0.9715                         |
-| 0.7780 | 8500  | 0.155         | -                              |
-| 0.8238 | 9000  | 0.1256        | -                              |
-| 0.8696 | 9500  | 0.1266        | -                              |
-| 0.9153 | 10000 | 0.1027        | 0.9715                         |
 ### Framework Versions

       type: softmax_accuracy_eval
     metrics:
     - type: f1_macro
+      value: 0.9726781946411447
       name: F1 Macro
     - type: f1_micro
+      value: 0.9753250742295485
       name: F1 Micro
     - type: f1_weighted
+      value: 0.9752858934461676
       name: F1 Weighted
 ---
 model = CrossEncoder("Chimalpopoka/CrossEncoderRanker")
 # Get scores for pairs of texts
 pairs = [
+    ['Свободный кортизол, суточная\xa0моча (Free Сortisol, Free Hydrocortisone, 24-Hour urine)', 'Кортизол в разовой порции мочи'],
+    ['Определение антител класса G (IgG) к RBD домену S белка вируса SARS-CoV-2 (COVID-19), количественное исследование', 'Антитела к миокарду, IgG'],
+    ['Прием (осмотр, консультация) врача-терапевта, первичный', 'Консультация врача, в клинике, терапевт'],
+    ['Вакцинация против гепатита В для взрослых', 'Вакцинация против гепатита А. Вакцина: Альгавак М (Россия)'],
+    ['АТ к миокарду', 'Антитела к миокарду, IgG'],
 ]
 scores = model.predict(pairs)
 print(scores.shape)
 | Metric       | Value      |
 |:-------------|:-----------|
+| **f1_macro** | **0.9727** |
+| f1_micro     | 0.9753     |
+| f1_weighted  | 0.9753     |
 <!--
 ## Bias, Risks and Limitations
   |         | sentence_0                                                                                     | sentence_1                                                                                     | label                                           |
   |:--------|:-----------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------|:------------------------------------------------|
   | type    | string                                                                                         | string                                                                                         | int                                             |
+  | details | <ul><li>min: 4 characters</li><li>mean: 68.59 characters</li><li>max: 747 characters</li></ul> | <ul><li>min: 3 characters</li><li>mean: 63.11 characters</li><li>max: 281 characters</li></ul> | <ul><li>0: ~34.30%</li><li>1: ~65.70%</li></ul> |
 * Samples:
+  | sentence_0                                                                                                                     | sentence_1                                           | label          |
+  |:-------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------|:---------------|
+  | <code>Свободный кортизол, суточная моча (Free Сortisol, Free Hydrocortisone, 24-Hour urine)</code>                             | <code>Кортизол в разовой порции мочи</code>          | <code>1</code> |
+  | <code>Определение антител класса G (IgG) к RBD домену S белка вируса SARS-CoV-2 (COVID-19), количественное исследование</code> | <code>Антитела к миокарду, IgG</code>                | <code>0</code> |
+  | <code>Прием (осмотр, консультация) врача-терапевта, первичный</code>                                                           | <code>Консультация врача, в клинике, терапевт</code> | <code>1</code> |
 * Loss: [<code>CrossEntropyLoss</code>](https://sbert.net/docs/package_reference/cross_encoder/losses.html#crossentropyloss)
 ### Training Hyperparameters
 ### Training Logs
 | Epoch  | Step  | Training Loss | softmax_accuracy_eval_f1_macro |
 |:------:|:-----:|:-------------:|:------------------------------:|
+| 0.0458 | 500   | 0.5651        | -                              |
+| 0.0915 | 1000  | 0.2182        | -                              |
+| 0.1373 | 1500  | 0.2239        | -                              |
+| 0.1831 | 2000  | 0.2015        | 0.9616                         |
+| 0.2288 | 2500  | 0.1617        | -                              |
+| 0.2746 | 3000  | 0.1942        | -                              |
+| 0.3204 | 3500  | 0.1888        | -                              |
+| 0.3661 | 4000  | 0.1772        | 0.9629                         |
+| 0.4119 | 4500  | 0.1635        | -                              |
+| 0.4577 | 5000  | 0.1596        | -                              |
+| 0.5034 | 5500  | 0.1709        | -                              |
+| 0.5492 | 6000  | 0.1566        | 0.9640                         |
+| 0.5950 | 6500  | 0.1278        | -                              |
+| 0.6407 | 7000  | 0.1276        | -                              |
 | 0.6865 | 7500  | 0.1339        | -                              |
+| 0.7323 | 8000  | 0.1422        | 0.9715                         |
+| 0.7780 | 8500  | 0.148         | -                              |
+| 0.8238 | 9000  | 0.1271        | -                              |
+| 0.8696 | 9500  | 0.125         | -                              |
+| 0.9153 | 10000 | 0.1103        | 0.9727                         |
 ### Framework Versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eaa9d42c7aee85075ba233436b79292b6c3d73124c723b567251112f5402373a
 size 1436163192

 version https://git-lfs.github.com/spec/v1
+oid sha256:e0a48779da0c723b69244f105bcfe6fbdd5f0dd684df10755a54771196015f8f
 size 1436163192