Update README.md
Browse files
README.md
CHANGED
|
@@ -18,13 +18,21 @@ MedTXTNormは、日本語の医療用語を正規化するためのモデルで
|
|
| 18 |
|
| 19 |
## How to use
|
| 20 |
|
| 21 |
-
The following script
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 22 |
|
| 23 |
[ja]
|
| 24 |
-
|
| 25 |
-
|
| 26 |
-
|
| 27 |
-
|
|
|
|
|
|
|
|
|
|
| 28 |
|
| 29 |
|
| 30 |
```python
|
|
|
|
| 18 |
|
| 19 |
## How to use
|
| 20 |
|
| 21 |
+
The following script takes a list of entity names (strings), converts them into embedding vectors using the MedTXTNorm model, and performs a similarity-based search.
|
| 22 |
+
|
| 23 |
+
In this example, jmed_dict_mini_demo contains sample normalization candidates extracted from JMED-DICT-mini.
|
| 24 |
+
The questions list holds surface forms (e.g., "脱水"), while answers contains the corresponding normalized forms (e.g., "脱水症").
|
| 25 |
+
|
| 26 |
+
This simple workflow allows you to check which candidate terms the model considers semantically closest to the input entity.
|
| 27 |
|
| 28 |
[ja]
|
| 29 |
+
以下のスクリプトは、日本語の医療用語を正規化するモデル MedTXTNorm を使用し、エンティティ名(文字列)のリストを埋め込みベクトルへ変換したうえで、類似度に基づく検索を実行するものです。
|
| 30 |
+
|
| 31 |
+
ここで扱う jmed_dict_mini_demo は JMED-DICT-mini に含まれる正規化候補のサンプルであり、
|
| 32 |
+
questions には入力となる出現形(例:「脱水」)、
|
| 33 |
+
answers には対応する正規形(例:「脱水症」)を設定しています。
|
| 34 |
+
|
| 35 |
+
この処理を通じて、出現形(entity)に対してモデルがどの候補を近い概念として返すかを簡易的に確認できます。
|
| 36 |
|
| 37 |
|
| 38 |
```python
|