Safetensors
Japanese
xlm-roberta
biomedical
text
YukiTashiro commited on
Commit
5746594
·
verified ·
1 Parent(s): 36f62ec

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +13 -5
README.md CHANGED
@@ -18,13 +18,21 @@ MedTXTNormは、日本語の医療用語を正規化するためのモデルで
18
 
19
  ## How to use
20
 
21
- The following script converts a list of strings (entity names) into embeddings and performs a similarity search.
 
 
 
 
 
22
 
23
  [ja]
24
- 以下のスクリプトは、文字列(エンティティ名)のリストを埋め込みベクトルに変換し、類似度検索を行います。
25
- jmed_dict_mini_demo: JMED-DICT-miniの一部の正規化候補
26
- questions: 出現形 (ex. '脱水')
27
- answers: 正規形 (ex. '脱水症')
 
 
 
28
 
29
 
30
  ```python
 
18
 
19
  ## How to use
20
 
21
+ The following script takes a list of entity names (strings), converts them into embedding vectors using the MedTXTNorm model, and performs a similarity-based search.
22
+
23
+ In this example, jmed_dict_mini_demo contains sample normalization candidates extracted from JMED-DICT-mini.
24
+ The questions list holds surface forms (e.g., "脱水"), while answers contains the corresponding normalized forms (e.g., "脱水症").
25
+
26
+ This simple workflow allows you to check which candidate terms the model considers semantically closest to the input entity.
27
 
28
  [ja]
29
+ 以下のスクリプトは、日本語の医療用語を正規化するモデル MedTXTNorm を使用し、エンティティ名(文字列)のリストを埋め込みベクトルへ変換したうえで、類似度に基づく検索を実行するものです。
30
+
31
+ ここで扱う jmed_dict_mini_demo JMED-DICT-mini に含まれる正規化候補のサンプルであり、
32
+ questions には入力となる出現形(例:「脱水」)、
33
+ answers には対応する正規形(例:「脱水症」)を設定しています。
34
+
35
+ この処理を通じて、出現形(entity)に対してモデルがどの候補を近い概念として返すかを簡易的に確認できます。
36
 
37
 
38
  ```python