Spaces:

Fuzure
/

sheami

Sleeping

App Files Files Community

vikramvasudevan commited on Aug 24, 2025

Commit

094e0f4

verified ·

1 Parent(s): af357c2

Upload folder using huggingface_hub

Browse files

Files changed (2) hide show

graph.py +59 -30
ui.py +5 -1

graph.py CHANGED Viewed

@@ -94,14 +94,23 @@ testname_standardizer_chain = testname_standardizer_prompt | llm
 # -----------------------------
 async def fn_init_node(state: SheamiState):
     os.makedirs(SheamiConfig.get_output_dir(state["thread_id"]), exist_ok=True)
     if "messages" not in state:
         state["messages"] = []
-    state["messages"].append("Initializing ...")
-    state["messages"].append("Files received for processing  ...")
     for idx, report in enumerate(state["uploaded_reports"]):
-        state["messages"].append(f"{idx+1}. {report.report_file_name}")
     state["standardized_reports"] = []
     state["trends_json"] = {}
     state["pdf_path"] = ""
@@ -124,7 +133,7 @@ async def fn_init_node(state: SheamiState):
         ],
     )
     state["run_id"] = run_id
     return state
@@ -215,12 +224,14 @@ async def fn_standardize_current_report_node(state: SheamiState):
     logger.info(
         "%s| Standardizing report %s", state["thread_id"], report.report_file_name
     )
-    state["messages"].append(f"Standardizing report: {report.report_file_name}")
     result = await call_llm(report=report, ocr=False)
     if not result.lab_results:
-        state["messages"].append(
-            f"⛔ Could not extract any data from PDF : {report.report_file_name}. Trying OCR ... might take a while"
         )
         report.report_contents = pdf_to_text_ocr(
             pdf_path=report.report_file_name_with_path
@@ -236,13 +247,23 @@ async def fn_standardize_current_report_node(state: SheamiState):
         )
         result = await call_llm(report=report, ocr=True)
         if not result.lab_results:
-            state["messages"].append(
-                f"⛔ OCR couldn't extract : {report.report_file_name}."
             )
         else:
-            state["messages"].append(
-                f"✅ Extracted data for report : {report.report_file_name}."
             )
     state["standardized_reports"].append(result)
@@ -263,12 +284,13 @@ async def fn_standardize_current_report_node(state: SheamiState):
 def fn_is_report_available_to_process(state: SheamiState) -> str:
     if state["current_index"] < len(state["uploaded_reports"]):
         report = state["uploaded_reports"][state["current_index"]]
-        state["messages"].append(
-            f"Initiating report standardization for: {report.report_file_name}"
         )
         return "continue"
     else:
-        state["messages"].append("Standardizing reports: finished")
         return "done"
@@ -289,7 +311,7 @@ def get_unique_test_names(state: SheamiState):
 async def fn_testname_standardizer_node(state: SheamiState):
     logger.info("%s| Standardizing Test Names: started", state["thread_id"])
-    state["messages"].append("Standardizing Test Names: started")
     # collect unique names
     unique_names = get_unique_test_names(state)
@@ -321,14 +343,16 @@ async def fn_testname_standardizer_node(state: SheamiState):
                         )
     logger.info("%s| Standardizing Test Names: finished", state["thread_id"])
-    state["messages"].append(f"Processed {len(unique_names)} tests")
-    state["messages"].append("Standardizing Test Names: finished")
     return state
 async def fn_unit_normalizer_node(state: SheamiState):
     logger.info("%s| Standardizing Units : started", state["thread_id"])
-    state["messages"].append("Standardizing Units: started")
     """
     Normalize units for lab test values across all standardized reports.
     Example: 'gms/dL', 'gm%', 'G/DL' → 'g/dL'
@@ -355,7 +379,7 @@ async def fn_unit_normalizer_node(state: SheamiState):
                         sub.test_unit = unit_map.get(normalized, sub.test_unit)
     logger.info("%s| Standardizing Units : finished", state["thread_id"])
-    state["messages"].append("Standardizing Units: finished")
     return state
@@ -377,7 +401,7 @@ async def fn_db_update_node(state: SheamiState):
 async def fn_trends_aggregator_node(state: SheamiState):
     logger.info("%s| Aggregating Trends : started", state["thread_id"])
-    state["messages"].append("Aggregating Trends : started")
     import re
     import os
@@ -431,9 +455,14 @@ async def fn_trends_aggregator_node(state: SheamiState):
         if rr and key not in ref_ranges:
             ref_ranges[key] = {"min": rr.min, "max": rr.max}
     for idx, report in enumerate(state["standardized_reports"]):
         logger.info("%s| Aggregating Trends for report-%d", state["thread_id"], idx)
-        state["messages"].append(f"Aggregating Trends for report-{idx+1}...")
         for item in report.lab_results:
             # Case A: CompositeLabResult (e.g., CUE, LFT, etc.)
@@ -475,13 +504,13 @@ async def fn_trends_aggregator_node(state: SheamiState):
         json.dump(state["trends_json"], f, indent=1, ensure_ascii=False)
     logger.info("%s| Aggregating Trends : finished", state["thread_id"])
-    state["messages"].append("Aggregating Trends : finished")
     return state
 async def fn_interpreter_node(state: SheamiState):
     logger.info("%s| Interpreting Trends : started", state["thread_id"])
-    state["messages"].append("Interpreting Trends : started")
     uploaded_reports = await get_db().get_reports_by_patient(
         patient_id=state["patient_id"]
@@ -645,7 +674,7 @@ Formatting requirements:
     state["pdf_path"] = pdf_path
     state["interpretation_html"] = interpretation_html
     logger.info("%s| Interpreting Trends : finished", state["thread_id"])
-    state["messages"].append("Interpreting Trends : finished")
     return state
@@ -703,8 +732,8 @@ def schedule_cleanup(file_path, delay=300):  # 300 sec = 5 min
 async def fn_standardizer_node_notifier(state: SheamiState):
     state = await reset_process_desc(state, process_desc="Standardizing reports ...")
     state["units_total"] = len(state["uploaded_reports"])
-    state["messages"].append(
-        "Standardizing reports now ... this might take a while ..."
     )
     state["overall_units_processed"] += 1
     return state
@@ -712,28 +741,28 @@ async def fn_standardizer_node_notifier(state: SheamiState):
 async def fn_testname_standardizer_node_notifier(state: SheamiState):
     state = await reset_process_desc(state, process_desc="Standardizing test names ...")
-    state["messages"].append("Standardizing test names now ...")
     state["overall_units_processed"] += 1
     return state
 async def fn_unit_normalizer_node_notifier(state: SheamiState):
     state = await reset_process_desc(state, process_desc="Standardizing units ...")
-    state["messages"].append("Standardizing measurement units now ...")
     state["overall_units_processed"] += 1
     return state
 async def fn_trends_aggregator_node_notifier(state: SheamiState):
     state = await reset_process_desc(state, process_desc="Aggregating trends ...")
-    state["messages"].append("Aggregating trends now ...")
     state["overall_units_processed"] += 1
     return state
 async def fn_interpreter_node_notifier(state: SheamiState):
     state = await reset_process_desc(state, process_desc="Plotting trends ...")
-    state["messages"].append("Interpreting and plotting trends now ...")
     state["overall_units_processed"] += 1
     return state

 # -----------------------------
+def send_message(state: SheamiState, msg: str, append: bool = True):
+    if append:
+        # append message
+        state["messages"].append(msg)
+    else:
+        # replace last message
+        state["messages"][-1] = msg
 async def fn_init_node(state: SheamiState):
     os.makedirs(SheamiConfig.get_output_dir(state["thread_id"]), exist_ok=True)
     if "messages" not in state:
         state["messages"] = []
+    send_message(state=state, msg="Initializing ...")
+    send_message(state=state, msg="Files received for processing  ...", append=False)
     for idx, report in enumerate(state["uploaded_reports"]):
+        send_message(state=state, msg=f"{idx+1}. <span class='highlighted-text'>{report.report_file_name}</span>")
     state["standardized_reports"] = []
     state["trends_json"] = {}
     state["pdf_path"] = ""
         ],
     )
     state["run_id"] = run_id
+    send_message(state=state, msg=f"Initialized run [{run_id}]")
     return state
     logger.info(
         "%s| Standardizing report %s", state["thread_id"], report.report_file_name
     )
+    send_message(state=state, msg=f"Standardizing report: {report.report_file_name}", append=False)
     result = await call_llm(report=report, ocr=False)
     if not result.lab_results:
+        send_message(
+            state=state,
+            msg=f"⛔ Could not extract any data from PDF : {report.report_file_name}. Trying OCR ... might take a while",
+            append=False,
         )
         report.report_contents = pdf_to_text_ocr(
             pdf_path=report.report_file_name_with_path
         )
         result = await call_llm(report=report, ocr=True)
         if not result.lab_results:
+            send_message(
+                state=state,
+                msg=f"⛔ OCR couldn't extract : {report.report_file_name}.",
+                append=False,
             )
         else:
+            send_message(
+                state=state,
+                msg=f"✅ Extracted <span class='highlighted-text'>{len(result.lab_results)}</span> lab results using OCR for report : <span class='highlighted-text'>{report.report_file_name}</span>.",
+                append=False,
             )
+    else:
+        send_message(
+            state=state,
+            msg=f"✅ Extracted <span class='highlighted-text'>{len(result.lab_results)}</span> lab results from : <span class='highlighted-text'>{report.report_file_name}</span>.",
+            append=False,
+        )
     state["standardized_reports"].append(result)
 def fn_is_report_available_to_process(state: SheamiState) -> str:
     if state["current_index"] < len(state["uploaded_reports"]):
         report = state["uploaded_reports"][state["current_index"]]
+        send_message(
+            state=state,
+            msg=f"Initiating report standardization for: <span class='highlighted-text'>{report.report_file_name}</span>",
         )
         return "continue"
     else:
+        send_message(state=state, msg="Standardizing reports: finished")
         return "done"
 async def fn_testname_standardizer_node(state: SheamiState):
     logger.info("%s| Standardizing Test Names: started", state["thread_id"])
+    send_message(state=state, msg="Standardizing Test Names: started", append=False)
     # collect unique names
     unique_names = get_unique_test_names(state)
                         )
     logger.info("%s| Standardizing Test Names: finished", state["thread_id"])
+    send_message(
+        state=state, msg=f"Identified <span class='highlighted-text'>{len(unique_names)}</span> unique tests", append=False
+    )
+    # send_message(state=state, msg="Standardizing Test Names: finished")
     return state
 async def fn_unit_normalizer_node(state: SheamiState):
     logger.info("%s| Standardizing Units : started", state["thread_id"])
+    send_message(state=state, msg="Standardizing Units: started", append=False)
     """
     Normalize units for lab test values across all standardized reports.
     Example: 'gms/dL', 'gm%', 'G/DL' → 'g/dL'
                         sub.test_unit = unit_map.get(normalized, sub.test_unit)
     logger.info("%s| Standardizing Units : finished", state["thread_id"])
+    send_message(state=state, msg="Standardizing Units: finished", append=False)
     return state
 async def fn_trends_aggregator_node(state: SheamiState):
     logger.info("%s| Aggregating Trends : started", state["thread_id"])
+    send_message(state=state, msg="Aggregating Trends : started", append=False)
     import re
     import os
         if rr and key not in ref_ranges:
             ref_ranges[key] = {"min": rr.min, "max": rr.max}
+    total_reports = len(state["standardized_reports"])
     for idx, report in enumerate(state["standardized_reports"]):
         logger.info("%s| Aggregating Trends for report-%d", state["thread_id"], idx)
+        send_message(
+            state=state,
+            msg=f"Aggregating {idx+1}/{total_reports} trends : report-{idx+1}...",
+            append=False,
+        )
         for item in report.lab_results:
             # Case A: CompositeLabResult (e.g., CUE, LFT, etc.)
         json.dump(state["trends_json"], f, indent=1, ensure_ascii=False)
     logger.info("%s| Aggregating Trends : finished", state["thread_id"])
+    send_message(state=state, msg="Aggregating Trends : finished", append=False)
     return state
 async def fn_interpreter_node(state: SheamiState):
     logger.info("%s| Interpreting Trends : started", state["thread_id"])
+    send_message(state=state, msg="Interpreting Trends : started", append=False)
     uploaded_reports = await get_db().get_reports_by_patient(
         patient_id=state["patient_id"]
     state["pdf_path"] = pdf_path
     state["interpretation_html"] = interpretation_html
     logger.info("%s| Interpreting Trends : finished", state["thread_id"])
+    send_message(state=state, msg="Interpreting Trends : finished", append=False)
     return state
 async def fn_standardizer_node_notifier(state: SheamiState):
     state = await reset_process_desc(state, process_desc="Standardizing reports ...")
     state["units_total"] = len(state["uploaded_reports"])
+    send_message(
+        state=state, msg="Standardizing reports now ... this might take a while ..."
     )
     state["overall_units_processed"] += 1
     return state
 async def fn_testname_standardizer_node_notifier(state: SheamiState):
     state = await reset_process_desc(state, process_desc="Standardizing test names ...")
+    send_message(state=state, msg="Standardizing test names now ...")
     state["overall_units_processed"] += 1
     return state
 async def fn_unit_normalizer_node_notifier(state: SheamiState):
     state = await reset_process_desc(state, process_desc="Standardizing units ...")
+    send_message(state=state, msg="Standardizing measurement units now ...")
     state["overall_units_processed"] += 1
     return state
 async def fn_trends_aggregator_node_notifier(state: SheamiState):
     state = await reset_process_desc(state, process_desc="Aggregating trends ...")
+    send_message(state=state, msg="Aggregating trends now ...")
     state["overall_units_processed"] += 1
     return state
 async def fn_interpreter_node_notifier(state: SheamiState):
     state = await reset_process_desc(state, process_desc="Plotting trends ...")
+    send_message(state=state, msg="Interpreting and plotting trends now ...")
     state["overall_units_processed"] += 1
     return state

ui.py CHANGED Viewed

@@ -121,7 +121,7 @@ async def process_reports(user_email: str, patient_id: str, files: list):
         buffer += (
             "\n\n"
-            f"✅ Processed {len(files)} reports.\n"
             "Please download the output file from below within 5 min."
         )
     except Exception as e:
@@ -361,6 +361,10 @@ def handle_file_input_change(files):
 def get_css():
     return """
             #patient-card{
                 border: 1px solid rgba(0,0,0,0.06);
                 background: #fafafa;

         buffer += (
             "\n\n"
+            f"✅ Processed <span class='highlighted-text'>{len(files)}</span> reports.\n"
             "Please download the output file from below within 5 min."
         )
     except Exception as e:
 def get_css():
     return """
+            .highlighted-text {
+                color : lightgray;
+                font-style: italics;
+            }
             #patient-card{
                 border: 1px solid rgba(0,0,0,0.06);
                 background: #fafafa;