snumin44
/

medical-biencoder-ko-bert-context

Feature Extraction

Model card Files Files and versions

snumin44 commited on Nov 22, 2024

Commit

203df2f

·

verified ·

1 Parent(s): 677d92b

Update README.md

Files changed (1) hide show

README.md +49 -0

README.md CHANGED Viewed

@@ -88,8 +88,57 @@ Fine-tuning에 활용한 베이스 모델 및 하이퍼 파라미터는 다음
 ## 4. Example
 이 모델은 Context를 인코딩하는 모델로, Question 모델과 함께 사용해야 합니다.
 동일한 질병에 관한 질문과 텍스트가 높은 유사도를 보인다는 사실을 확인할 수 있습니다.
 ```python
 ```

 ## 4. Example
 이 모델은 Context를 인코딩하는 모델로, Question 모델과 함께 사용해야 합니다.
 동일한 질병에 관한 질문과 텍스트가 높은 유사도를 보인다는 사실을 확인할 수 있습니다.
+학습 데이터의 특성 상, 예시 보다 정제된 의료 텍스트에 대해 더 잘 작동합니다.
 ```python
+import numpy as np
+from transformers import AutoModel, AutoTokenizer
+# Question Model
+q_model_path = 'snumin44/medical-biencoder-ko-bert-question'
+q_model = AutoModel.from_pretrained(q_model_path)
+q_tokenizer = AutoTokenizer.from_pretrained(q_model_path)
+# Context Model
+c_model_path = 'snumin44/medical-biencoder-ko-bert-context'
+c_model = AutoModel.from_pretrained(c_model_path)
+c_tokenizer = AutoTokenizer.from_pretrained(c_model_path)
+query = 'high blood pressure 처방 사례'
+targets = [
+    """고혈압 진단.
+    환자 상담 및 생활습관 교정 권고. 저염식, 규칙적인 운동, 금연, 금주 지시.
+    환자 재방문. 혈압: 150/95mmHg. 약물치료 시작. Amlodipine 5mg 1일 1회 처방.""",
+    """응급실 도착 후 위 내시경 진행.
+    소견: Gastric ulcer에서 Forrest IIb 관찰됨. 출혈은 소량의 삼출성 출혈 형태.
+    처치: 에피네프린 주사로 출혈 감소 확인. Hemoclip 2개로 출혈 부위 클리핑하여 지혈 완료.""",
+    """혈중 높은 지방 수치 및 지방간 소견.
+    다발성 gallstones 확인. 증상 없을 경우 경과 관찰 권장.
+    우측 renal cyst, 양성 가능성 높으며 추가적인 처치 불필요 함."""
+]
+query_feature = q_tokenizer(query, return_tensors='pt')
+query_outputs = q_model(**query_feature, return_dict=True)
+query_embeddings = query_outputs.pooler_output.detach().numpy().squeeze()
+def cos_sim(A, B):
+    return np.dot(A, B) / (np.linalg.norm(A) * np.linalg.norm(B))
+for idx, target in enumerate(targets):
+    target_feature = c_tokenizer(target, return_tensors='pt')
+    target_outputs = c_model(**target_feature, return_dict=True)
+    target_embeddings = target_outputs.pooler_output.detach().numpy().squeeze()
+    similarity = cos_sim(query_embeddings, target_embeddings)
+    print(f"Similarity between query and target {idx}: {similarity:.4f}")
+```
+```
+Similarity between query and target 0: 0.2674
+Similarity between query and target 1: 0.0416
+Similarity between query and target 2: 0.0476
 ```