Spaces:

LLDDWW
/

MedCard

Sleeping

App Files Files Community

LLDDWW commited on Sep 29

Commit

149f48c

1 Parent(s): 19edf2f

feat: explain meds in plain language

Browse files

Files changed (1) hide show

app.py +125 -26

app.py CHANGED Viewed

@@ -1,6 +1,6 @@
 import json
 import re
-from typing import Any, Dict, List, Optional
 import gradio as gr
 from PIL import Image, ImageDraw
@@ -23,6 +23,45 @@ TIME_KEYWORDS = [
     "기상",
 ]
 def _extract_time_slots(text: str) -> List[str]:
     slots = []
@@ -39,40 +78,54 @@ def _extract_time_slots(text: str) -> List[str]:
     return slots
 def parse_fields(raw: str) -> Dict[str, Any]:
     """Extract drug name and dosage information from OCR text."""
-    text = raw.replace("\n", " ")
-    text = re.sub(r"\s+", " ", text)
-    # 1) 약 이름: 단어 + 용량 패턴 주변에서 찾기
-    drug_name: Optional[str] = None
-    drug_match = re.search(r"([가-힣A-Za-z]+)\s*(\d+)\s*(mg|mL|ML|정)", text)
-    if drug_match:
-        drug_name = drug_match.group(1)
-    else:
-        fallback = re.search(r"([가-힣A-Za-z]{2,})", text)
-        drug_name = fallback.group(1) if fallback else None
-    # 2) 1회 용량: "1회 1정", "1정", "5 mL" 등
-    dose_per_intake: Optional[str] = None
-    dose_match = re.search(r"(1회\s*)?(\d+[\./]?\d*)\s*([가-힣A-Za-z]+|mL|ml|mg|정)", text)
-    if dose_match:
-        dose_per_intake = f"{dose_match.group(2)} {dose_match.group(3)}".strip()
-    # 3) 1일 복용 횟수: "1일 3회", "하루 2회"
     times_per_day: Optional[int] = None
-    times_match = re.search(r"(?:1일|하루)\s*(\d+)\s*회", text)
     if times_match:
         times_per_day = int(times_match.group(1))
-    # 4) 시간대 키워드/시각 추출
-    time_slots = _extract_time_slots(text)
     return {
         "drug_name": drug_name,
         "dose_per_intake": dose_per_intake,
         "times_per_day": times_per_day,
         "time_slots": time_slots or None,
     }
@@ -130,15 +183,60 @@ def to_csv_row(output: Dict[str, Any]) -> str:
     return ",".join(row)
 def run_pipeline(image: Optional[Image.Image]):
     if image is None:
-        return "이미지를 업로드하세요.", None, None
     output = ocr_and_parse(image)
     card = render_card(output["fields"])
     csv_row = to_csv_row(output)
     json_text = json.dumps(output, ensure_ascii=False, indent=2)
-    return json_text, card, csv_row
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
@@ -151,7 +249,8 @@ with gr.Blocks(theme=gr.themes.Soft()) as demo:
         with gr.Column():
             json_out = gr.Code(label="인식 결과(JSON)")
             card_out = gr.Image(type="pil", label="일정 카드(미리보기)")
-    btn.click(run_pipeline, inputs=img_in, outputs=[json_out, card_out, csv_box])
 if __name__ == "__main__":

 import json
 import re
+from typing import Any, Dict, List, Optional, Sequence
 import gradio as gr
 from PIL import Image, ImageDraw
     "기상",
 ]
+# Very small knowledge base for common Korean OTC medications.
+MED_KNOWLEDGE: Sequence[Dict[str, Any]] = [
+    {
+        "keywords": ["타이레놀", "아세트아미노펜", "acetaminophen"],
+        "category": "진통·해열제",
+        "what_it_does": "몸살이나 감기로 열이 나거나 머리가 아플 때 통증과 열을 낮춰 줍니다.",
+        "example": "예: 수학시험 준비로 긴장했는데 머리가 지끈거릴 때, 한 알 복용하면 통증이 줄어듭니다.",
+        "tip": "위에 부담을 줄이기 위해 간단한 간식과 함께 물과 복용하고, 하루 총 복용 횟수(일반적으로 4회 이하)를 넘기지 마세요.",
+    },
+    {
+        "keywords": ["이부프로펜", "부루펜", "ibuprofen"],
+        "category": "진통·소염제",
+        "what_it_does": "몸속 염증을 가라앉히고 통증을 완화해서 근육통이나 치통에 자주 사용됩니다.",
+        "example": "예: 체육 시간에 무릎을 살짝 삐었을 때 붓기와 아픔을 줄여 줍니다.",
+        "tip": "식후에 복용하면 속 쓰림을 줄일 수 있고, 다른 소염진통제와는 시간 간격을 두세요.",
+    },
+    {
+        "keywords": ["시잘", "세티리진", "cetirizine", "지르텍"],
+        "category": "알레르기 완화제",
+        "what_it_does": "코가 간질거리거나 피부가 가려울 때 알레르기 반응을 가라앉혀 줍니다.",
+        "example": "예: 봄철 꽃가루 때문에 기침과 콧물이 나올 때 증상을 줄여 줍니다.",
+        "tip": "졸릴 수 있으니 첫 복용 후에는 운전이나 집중이 필요한 활동은 피하세요.",
+    },
+    {
+        "keywords": ["훼스탈", "pancreatin", "위장", "소화제"],
+        "category": "소화제",
+        "what_it_does": "기름진 음식을 먹고 배가 더부룩할 때 소화를 도와 속을 편하게 해 줍니다.",
+        "example": "예: 치킨을 많이 먹어 속이 더부룩할 때 속을 가볍게 해 줍니다.",
+        "tip": "식후에 복용하면 효과가 좋으며, 복통이 계속되면 병원을 방문하세요.",
+    },
+    {
+        "keywords": ["비타민", "multivitamin", "vitamin"],
+        "category": "영양제",
+        "what_it_does": "몸에 필요한 비타민을 채워 피곤함을 줄이고 면역력을 돕습니다.",
+        "example": "예: 시험 준비로 잠을 줄였을 때 몸이 지치지 않도록 도와줍니다.",
+        "tip": "하루 권장량을 지켜 꾸준히 복용하면 더 효과적이며, 물과 함께 삼키세요.",
+    },
+]
 def _extract_time_slots(text: str) -> List[str]:
     slots = []
     return slots
+STOPWORDS = {"용법", "용량", "복용", "방법", "약", "정"}
+def _extract_medications(text: str) -> List[Dict[str, Optional[str]]]:
+    meds: List[Dict[str, Optional[str]]] = []
+    pattern = re.compile(
+        r"([가-힣A-Za-z]{2,})[\s·]*(\d+[\./]?\d*\s*(?:mg|mL|ML|ml|정|캡슐))?"
+    )
+    seen: set[str] = set()
+    for match in pattern.finditer(text):
+        name = match.group(1)
+        if name in STOPWORDS or len(name) <= 1:
+            continue
+        if any(sw in name for sw in STOPWORDS):
+            continue
+        name_norm = name.strip()
+        if name_norm in seen:
+            continue
+        seen.add(name_norm)
+        dose = match.group(2).strip() if match.group(2) else None
+        meds.append({"name": name_norm, "dose": dose})
+    return meds
 def parse_fields(raw: str) -> Dict[str, Any]:
     """Extract drug name and dosage information from OCR text."""
+    collapsed = raw.replace("\n", " ")
+    collapsed = re.sub(r"\s+", " ", collapsed)
+    medications = _extract_medications(collapsed)
+    first = medications[0] if medications else {"name": None, "dose": None}
+    drug_name = first.get("name")
+    dose_per_intake = first.get("dose")
     times_per_day: Optional[int] = None
+    times_match = re.search(r"(?:1일|하루)\s*(\d+)\s*회", collapsed)
     if times_match:
         times_per_day = int(times_match.group(1))
+    time_slots = _extract_time_slots(collapsed)
     return {
         "drug_name": drug_name,
         "dose_per_intake": dose_per_intake,
         "times_per_day": times_per_day,
         "time_slots": time_slots or None,
+        "medications": medications,
     }
     return ",".join(row)
+def _match_knowledge(name: str) -> Optional[Dict[str, Any]]:
+    lowered = name.lower()
+    for info in MED_KNOWLEDGE:
+        for kw in info["keywords"]:
+            if kw.lower() in lowered or lowered in kw.lower():
+                return info
+    return None
+def build_explanations(output: Dict[str, Any]) -> str:
+    meds = output["fields"].get("medications") or []
+    if not meds:
+        return (
+            "### 약 설명\n"
+            "- 약 이름을 정확히 인식하지 못했어요. 사진을 다시 찍거나 약사에게 직접 확인해 주세요.\n"
+            "\n> ⚠️ 의료진 처방과 복약 지시가 가장 우선입니다."
+        )
+    lines = ["### 쉽게 알아보는 약 설명"]
+    for med in meds:
+        name = med.get("name") or "이름 미확인"
+        info = _match_knowledge(name) if name else None
+        dose = med.get("dose")
+        if info:
+            lines.append(
+                f"- **{name}** ({info['category']})"
+            )
+            if dose:
+                lines.append(f"  - 약 봉투에 적힌 용량: `{dose}`")
+            lines.append(f"  - 하는 일: {info['what_it_does']}")
+            lines.append(f"  - 중학생 예시: {info['example']}")
+            lines.append(f"  - 복용 팁: {info['tip']}")
+        else:
+            lines.append(f"- **{name}**")
+            if dose:
+                lines.append(f"  - 약 봉투 용량: `{dose}`")
+            lines.append(
+                "  - 아직 데이터가 없어요. 약 이름을 다시 확인하거나 약사에게 물어보세요."
+            )
+    lines.append("\n> ⚠️ 실제 복약은 의사·약사의 지시에 반드시 따르세요.")
+    return "\n".join(lines)
 def run_pipeline(image: Optional[Image.Image]):
     if image is None:
+        return "이미지를 업로드하세요.", None, None, "이미지를 먼저 업로드해 주세요."
     output = ocr_and_parse(image)
     card = render_card(output["fields"])
     csv_row = to_csv_row(output)
     json_text = json.dumps(output, ensure_ascii=False, indent=2)
+    explanations = build_explanations(output)
+    return json_text, card, csv_row, explanations
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
         with gr.Column():
             json_out = gr.Code(label="인식 결과(JSON)")
             card_out = gr.Image(type="pil", label="일정 카드(미리보기)")
+            explain_md = gr.Markdown(label="쉽게 알아보는 약 설명")
+    btn.click(run_pipeline, inputs=img_in, outputs=[json_out, card_out, csv_box, explain_md])
 if __name__ == "__main__":