Spaces:

ShinyaJ
/

Ward_Assignment_System_Nursing_CMU

Sleeping

App Files Files Community

ShinyaJ commited on Sep 27, 2025

Commit

b682ac6

verified ·

1 Parent(s): 23f7e5a

Upload 3 files

Browse files

Files changed (3) hide show

README.md +19 -12
app.py +377 -0
requirements.txt +4 -0

README.md CHANGED Viewed

@@ -1,12 +1,19 @@
----
-title: Gradio 2025 Ward Assignment System CMU
-emoji: 📊
-colorFrom: green
-colorTo: indigo
-sdk: gradio
-sdk_version: 5.47.2
-app_file: app.py
-pinned: false
----
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

+# Ward Ranking Cleaner & Random Assigner (Gradio)
+## วิธีใช้งานใน Hugging Face Spaces
+1. สร้าง Space ใหม่ เลือก SDK = **Gradio**
+2. อัปโหลดไฟล์เหล่านี้:
+   - `app.py`
+   - `requirements.txt`
+   - (ถ้ามีข้อมูลประกอบอื่น ๆ ให้ใส่เพิ่มได้)
+3. กด Commit → ระบบจะ build และให้ลิงก์ถาวร
+## ขั้นตอนใช้งาน
+1) อัปโหลดไฟล์ .csv หรือ .xlsx ที่มีข้อมูลนักศึกษา/ผู้เรียน
+2) เลือกวอร์ดที่จะใช้ แล้วกำหนด Capacity
+3) ใส่ชื่อคอลัมน์จริงในไฟล์ของคุณสำหรับ NAME, ID และคอลัมน์วอร์ดแต่ละอัน (ใส่ชื่อจริง หรือใช้ regex/คำบางส่วนร่วมกับโหมดยืดหยุ่น)
+4) กด **Clean data** เพื่อดูพรีวิว (ระบบจะ keep เฉพาะ NAME, ID, และคอลัมน์วอร์ดที่เลือก พร้อมแปลงอันดับให้เป็นตัวเลข)
+5) กด **Assign** เพื่อสุ่มจัดสรรทีละอันดับ 1,2,3,... ตาม Capacity
+> การดึง "อันดับ" จะใช้ตัวเลขที่พบในสตริง เช่น `1st`, `อันดับ 3`, `4th` เป็นต้น

app.py ADDED Viewed

	@@ -0,0 +1,377 @@

+import gradio as gr
+import pandas as pd
+import numpy as np
+import re
+from io import BytesIO
+from typing import List, Dict, Tuple, Optional
+APP_TITLE = "Ward Ranking Cleaner & Random Assigner (Flexible Columns)"
+DESCRIPTION = """
+1) เลือก **วอร์ด** ที่จะใช้ (จากรายการ 8 วอร์ดด้านล่าง) และใส่ **capacity** แต่ละวอร์ด
+2) ระบุ **หัวคอลัมน์ในไฟล์** ของคุณสำหรับ: NAME, ID และคอลัมน์คะแนน/อันดับของแต่ละวอร์ด (ชื่อคอลัมน์จริงในไฟล์)
+3) อัปโหลดไฟล์ .csv หรือ .xlsx แล้วกด **Clean data** เพื่อดูตารางที่เหลือเฉพาะ NAME, ID และคอลัมน์วอร์ดที่เลือก (คอลัมน์อื่นจะถูก drop)
+4) กด **Assign (สุ่มตามลำดับอันดับ)** เพื่อสุ่มจัดสรรทีละอันดับ 1 → 2 → 3 ... ตาม capacity ของแต่ละวอร์ด
+5) ดาวน์โหลด CSV ผลลัพธ์ได้
+- การอ่าน "อันดับ" จะดึง **ตัวเลข** จากสตริง (เช่น `1st`, `อันดับ 3`, `4th`) — ถ้าหาเลขไม่เจอจะถือว่าเป็นค่าว่าง
+- ถ้าคุณมีคอลัมน์ชื่อไม่แน่นอน สามารถใส่ชื่อที่แน่ใจลงไป หรือใช้ชื่อบางส่วนแล้วยกให้ **โหมดจับคู่ยืดหยุ่น** (regex) ช่วยค้นหา
+"""
+WARD_CHOICES = [
+    ("Medical", "อายุรศาสตร์ ภาคปกติ"),
+    ("Medical_1", "อายุรศาสตร์_1"),
+    ("Medical_2", "อายุรศาสตร์_2"),
+    ("Surgical", "ศัลยศาสตร์"),
+    ("Pediatric", "เด็ก"),
+    ("Community", "ชุมชน"),
+    ("Psychiatric", "จิตเวช"),
+    ("Obstetrics", "สูติศาสตร์"),
+]
+def read_table(file) -> Tuple[Optional[pd.DataFrame], str]:
+    if file is None:
+        return None, "กรุณาอัปโหลดไฟล์ก่อน (.csv หรือ .xlsx)"
+    name = file.name.lower() if hasattr(file, "name") else ""
+    try:
+        if name.endswith(".csv"):
+            df = pd.read_csv(file.name if hasattr(file, "name") else file)
+        elif name.endswith(".xlsx"):
+            df = pd.read_excel(file.name if hasattr(file, "name") else file)
+        else:
+            # ลองเดาว่าเป็น csv
+            try:
+                df = pd.read_csv(file)
+            except Exception:
+                return None, "รองรับเฉพาะ .csv หรือ .xlsx เท่านั้น"
+    except Exception as e:
+        return None, f"อ่านไฟล์ไม่สำเร็จ: {e}"
+    # ปรับชื่อคอลัมน์ (trim)
+    df.columns = [str(c).strip() for c in df.columns]
+    return df, ""
+def find_column(df: pd.DataFrame, key: str, flexible: bool) -> Optional[str]:
+    """
+    ค้นหาคอลัมน์ตามชื่อที่ผู้ใช้กรอก:
+    - ถ้า flexible=False → ค้นหาแบบตรงตัว (case-sensitive แบบเดิม แต่เราทำ trim แล้ว)
+    - ถ้า flexible=True → จับคู่แบบยืดหยุ่น: ถ้า key มีอักขระพิเศษ ถือเป็น regex; ถ้าไม่ ก็มองเป็นสตริงย่อยที่ต้องพบในชื่อคอลัมน์
+    คืนชื่อคอลัมน์จริงถ้าพบ (ตัวแรกที่พบ), ไม่งั้นคืน None
+    """
+    cols = list(df.columns)
+    if not flexible:
+        return key if key in cols else None
+    # โหมดยืดหยุ่น
+    # ถ้า key เป็นสตริงธรรมดา ให้ค้นหาแบบ "มี key เป็นส่วนหนึ่งของชื่อคอลัมน์" (case-insensitive)
+    try:
+        pattern = re.compile(key, flags=re.IGNORECASE)
+        for c in cols:
+            if re.search(pattern, c):
+                return c
+    except re.error:
+        # ถ้า regex ไม่ valid ให้ fallback เป็น contains (case-insensitive)
+        low = key.lower()
+        for c in cols:
+            if low in c.lower():
+                return c
+    return None
+def parse_rank(value) -> Optional[int]:
+    """
+    รับค่าจากคอลั��น์อันดับ เช่น '1st', 'อันดับ 3', '2', 'third' (จะไม่รองรับคำภาษาอังกฤษเต็ม)
+    คืนเป็น int ถ้าพบเลข, ถ้าไม่พบคืน None
+    """
+    if pd.isna(value):
+        return None
+    s = str(value)
+    m = re.search(r'(\d+)', s)
+    if m:
+        try:
+            return int(m.group(1))
+        except ValueError:
+            return None
+    return None
+def build_cleaned(df: pd.DataFrame,
+                  name_key: str,
+                  id_key: str,
+                  ward_to_key: Dict[str, str],
+                  flexible_match: bool) -> Tuple[pd.DataFrame, List[str]]:
+    """
+    สร้างตาราง cleaned: เก็บเฉพาะ NAME, ID, และคอลัมน์วอร์ดที่เลือก
+    แปลงค่าคอลัมน์วอร์ดเป็น int (ตัวเลขอันดับ) ถ้าทำไม่ได้จะเป็น NaN
+    """
+    messages = []
+    # หา NAME / ID
+    name_col = find_column(df, name_key.strip(), flexible_match)
+    id_col = find_column(df, id_key.strip(), flexible_match)
+    if name_col is None or id_col is None:
+        missing = []
+        if name_col is None: missing.append("NAME")
+        if id_col is None: missing.append("ID")
+        raise ValueError(f"หาไม่พบคอลัมน์บังคับ: {', '.join(missing)}")
+    keep_cols = [name_col, id_col]
+    renamed = {name_col: "NAME", id_col: "ID"}
+    # หาและแปลงคอลัมน์วอร์ด
+    for ward, key in ward_to_key.items():
+        key = key.strip()
+        if not key:
+            continue
+        col = find_column(df, key, flexible_match)
+        if col is None:
+            messages.append(f"⚠️ ไม่พบคอลัมน์ของวอร์ด '{ward}' จากคีย์ '{key}' (ข้ามวอร์ดนี้)")
+            continue
+        keep_cols.append(col)
+        renamed[col] = ward  # เปลี่ยนชื่อคอลัมน์เป็นชื่อวอร์ดมาตรฐาน
+    # unique และรักษาลำดับ
+    seen = set()
+    keep_unique = []
+    for c in keep_cols:
+        if c not in seen:
+            seen.add(c)
+            keep_unique.append(c)
+    cleaned = df[keep_unique].rename(columns=renamed).copy()
+    # แปลงอันดับเป็น int
+    ward_cols = [c for c in cleaned.columns if c not in ("NAME", "ID")]
+    for c in ward_cols:
+        cleaned[c] = cleaned[c].apply(parse_rank).astype("Int64")
+    # จัดเรียงคอลัมน์
+    cleaned = cleaned[["NAME", "ID"] + ward_cols]
+    return cleaned, messages
+def random_assign(cleaned: pd.DataFrame,
+                  capacities: Dict[str, int],
+                  seed: Optional[int] = None) -> Tuple[pd.DataFrame, pd.DataFrame, Dict[str, int]]:
+    """
+    สุ่มจัดสรรแบบรอบเลือกอันดับ: เริ่มจากอันดับ 1 → 2 → 3 → ...
+    - ในแต่ละอันดับและแต่ละวอร์ด: ถ้าเกิน capacity ที่เหลือ ให้สุ่มเลือก
+    - คืนผลลัพธ์: assignments, not_assigned, leftover_capacities
+    """
+    rng = np.random.default_rng(seed)
+    wards = [w for w in cleaned.columns if w not in ("NAME", "ID")]
+    # กำหนด capacity ที่ใช้จริง เฉพาะวอร์ดที่อยู่ในตาราง
+    cap = {w: int(capacities.get(w, 0)) for w in wards}
+    # เตรียมข้อมูลทำงาน
+    assigned = pd.Series(index=cleaned.index, data=pd.NA, dtype="object")   # ชื่อวอร์ดที่ได้
+    choice_no = pd.Series(index=cleaned.index, data=pd.NA, dtype="Int64")   # อันดับที่ได้
+    # หาค่า max rank ที่ปรากฏ (เช่น 1..6)
+    max_rank = 0
+    for w in wards:
+        max_w = cleaned[w].max(skipna=True)
+        if pd.notna(max_w):
+            max_rank = max(max_rank, int(max_w))
+    # วนทีละอันดับ
+    for r in range(1, max_rank + 1):
+        # ข้ามถ้าทุกวอร์ดเต็มแล้ว
+        if all(c <= 0 for c in cap.values()):
+            break
+        # สำหรับแต่ละวอร์ด
+        for w in wards:
+            if cap[w] <= 0:
+                continue
+            # ผู้สมัครที่ยังไม่ได้รับการจัดสรร และเลือกวอร์ดนี้ที่อันดับ r
+            mask = (assigned.isna()) & (cleaned[w] == r)
+            candidates = cleaned.index[mask].tolist()
+            if len(candidates) == 0:
+                continue
+            if len(candidates) <= cap[w]:
+                pick = candidates
+            else:
+                pick = list(rng.choice(candidates, size=cap[w], replace=False))
+            # ทำการจัดสรร
+            assigned.loc[pick] = w
+            choice_no.loc[pick] = r
+            cap[w] -= len(pick)
+    result = cleaned.copy()
+    result["AssignedWard"] = assigned
+    result["ChoiceNumber"] = choice_no
+    not_assigned = result[result["AssignedWard"].isna()].copy()
+    # แปลง NA ให้ดูง่ายขึ้นใน preview
+    result_preview = result.copy()
+    result_preview = result_preview.fillna("")
+    return result_preview, not_assigned.fillna(""), cap
+def update_capacity_table(selected_wards: List[str]) -> pd.DataFrame:
+    rows = []
+    for w, th in WARD_CHOICES:
+        if selected_wards and w in selected_wards:
+            rows.append([w, th, 0])
+    if not rows:
+        return pd.DataFrame(columns=["Ward", "Thai Name", "Capacity"])
+    return pd.DataFrame(rows, columns=["Ward", "Thai Name", "Capacity"])
+def update_mapping_table(selected_wards: List[str]) -> pd.DataFrame:
+    rows = [["NAME", ""], ["ID", ""]]
+    for w, th in WARD_CHOICES:
+        if selected_wards and w in selected_wards:
+            rows.append([w, ""])
+    return pd.DataFrame(rows, columns=["Field", "Your Column Header (exact or regex)"])
+def on_clean(file, selected_wards, capacity_df, mapping_df, flexible):
+    if not selected_wards:
+        return gr.update(value="กรุณาเลือกวอร์ดอย่างน้อย 1", visible=True), None, None
+    # อ่านไฟล์
+    df, msg = read_table(file)
+    if df is None:
+        return gr.update(value=msg, visible=True), None, None
+    # ดึงชื่อคอลัมน์ที่ผู้ใช้ระบุ
+    mapping_df = mapping_df.copy()
+    mapping_df.columns = ["Field", "Key"]
+    mapping = {row["Field"]: str(row["Key"]).strip() for _, row in mapping_df.iterrows() if str(row["Field"]).strip()}
+    name_key = mapping.get("NAME", "")
+    id_key = mapping.get("ID", "")
+    if not name_key or not id_key:
+        return gr.update(value="กรุณาใส่หัวคอลัมน์ของ NAME และ ID", visible=True), None, None
+    ward_to_key = {}
+    for w in selected_wards:
+        ward_to_key[w] = mapping.get(w, "")
+    try:
+        cleaned, messages = build_cleaned(df, name_key, id_key, ward_to_key, bool(flexible))
+    except Exception as e:
+        return gr.update(value=f"❌ เกิดข้อผิดพลาด: {e}", visible=True), None, None
+    info = "✓ Cleaning สำเร็จ"
+    if messages:
+        info += "\n" + "\n".join(messages)
+    # เตรียมไฟล์ดาวน์โหลด
+    buf = BytesIO()
+    cleaned.to_csv(buf, index=False, encoding="utf-8-sig")
+    buf.seek(0)
+    return gr.update(value=info, visible=True), cleaned.head(30), ("cleaned.csv", buf)
+def on_assign(file, selected_wards, capacity_df, mapping_df, flexible, seed):
+    # ต้อง clean ก่อน (เราอ่านไฟล์เดิมแล้ว clean ในฟังก์ชันนี้อีกครั้งเพื่อความแน่นอน)
+    status, cleaned_preview, cleaned_file = on_clean(file, selected_wards, capacity_df, mapping_df, flexible)
+    if cleaned_preview is None:
+        return status, None, None, None, None
+    # โหลด cleaned จากไฟล์ใน memory อีกครั้งเพื่อความแม่นยำ
+    # แต่เรามีเฉพาะ preview; จึง clean ซ้ำเพื่อได้ dataframe เต็ม
+    df, _ = read_table(file)
+    mapping_df = mapping_df.copy()
+    mapping_df.columns = ["Field", "Key"]
+    mapping = {row["Field"]: str(row["Key"]).strip() for _, row in mapping_df.iterrows() if str(row["Field"]).strip()}
+    name_key = mapping.get("NAME", "")
+    id_key = mapping.get("ID", "")
+    ward_to_key = {w: mapping.get(w, "") for w in selected_wards}
+    cleaned, _ = build_cleaned(df, name_key, id_key, ward_to_key, bool(flexible))
+    # capacities
+    if capacity_df is None or len(capacity_df) == 0:
+        return gr.update(value="กรุณากรอก capacity ก่อน", visible=True), None, None, None, None
+    # ทำให้แน่ใจว่ามีคอลัมน์ตามชื่อที่เราคาด
+    cap_df = capacity_df.copy()
+    cap_df.columns = ["Ward", "Thai Name", "Capacity"]
+    cap_df = cap_df[cap_df["Ward"].isin([c for c in cleaned.columns if c not in ("NAME", "ID")])]
+    cap_map = {}
+    for _, row in cap_df.iterrows():
+        try:
+            cap_map[str(row["Ward"])] = int(row["Capacity"])
+        except Exception:
+            cap_map[str(row["Ward"])] = 0
+    assigned, not_assigned, leftover = random_assign(cleaned, cap_map, seed=seed if seed not in (None, "") else None)
+    # สร้างไฟล์ด��วน์โหลด
+    out_all = BytesIO()
+    assigned.to_csv(out_all, index=False, encoding="utf-8-sig")
+    out_all.seek(0)
+    out_un = BytesIO()
+    not_assigned.to_csv(out_un, index=False, encoding="utf-8-sig")
+    out_un.seek(0)
+    leftover_text = "ความจุคงเหลือ:\n" + "\n".join([f"- {k}: {v}" for k, v in leftover.items()])
+    return status, assigned.head(30), ("assigned.csv", out_all), ("not_assigned.csv", out_un), leftover_text
+with gr.Blocks(title=APP_TITLE) as demo:
+    gr.Markdown(f"# {APP_TITLE}")
+    gr.Markdown(DESCRIPTION)
+    with gr.Row():
+        file = gr.File(file_count="single", file_types=[".csv", ".xlsx"], label="อัปโหลดข้อมูลนักศึกษา/ผู้เรียน (.csv / .xlsx)")
+    with gr.Accordion("1) เลือกวอร์ดที่ต้องใช้", open=True):
+        selected_wards = gr.CheckboxGroup(
+            choices=[w for w, _ in WARD_CHOICES],
+            label="เลือกวอร์ด (เลือกได้หลายข้อ)",
+            value=["Medical", "Surgical"]  # ค่าเริ่มต้นเล็กน้อย
+        )
+        gr.Markdown(
+            "คำแปล (อ้างอิง): " +
+            ", ".join([f"**{w}** = {th}" for w, th in WARD_CHOICES])
+        )
+    with gr.Accordion("2) กำหนด Capacity ต่อวอร์ด", open=True):
+        capacity_df = gr.Dataframe(
+            headers=["Ward", "Thai Name", "Capacity"],
+            value=[],
+            row_count=(0, "dynamic"),
+            col_count=3,
+            interactive=True,
+            wrap=True,
+            label="กรอกแค่แถวของวอร์ดที่เลือก"
+        )
+        selected_wards.change(fn=update_capacity_table, inputs=selected_wards, outputs=capacity_df)
+    with gr.Accordion("3) ระบุหัวคอลัมน์จริงในไฟล์ของคุณ", open=True):
+        gr.Markdown("ใส่ชื่อคอลัมน์ **จริง** ที่อยู่ในไฟล์ของคุณ (จะใช้แมตช์ตรงตัว หรือเปิดโหมดยืดหยุ่นก็ได้)")
+        mapping_df = gr.Dataframe(
+            headers=["Field", "Your Column Header (exact or regex)"],
+            value=[["NAME",""],["ID",""]],
+            row_count=(2, "dynamic"),
+            col_count=2,
+            interactive=True,
+            wrap=True
+        )
+        selected_wards.change(fn=update_mapping_table, inputs=selected_wards, outputs=mapping_df)
+        flexible = gr.Checkbox(label="เปิดโหมดจับคู่คอลัมน์แบบยืดหยุ่น (regex / contains)", value=True)
+    with gr.Row():
+        clean_btn = gr.Button("Clean data (ดูพรีวิว)")
+        assign_btn = gr.Button("Assign (สุ่มตามลำดับอันดับ)")
+    info = gr.Markdown(visible=False)
+    preview = gr.Dataframe(label="พรีวิวข้อมูลที่ผ่านการ clean (แสดงหัว 30 แถว)", visible=True)
+    cleaned_file = gr.File(label="ดาวน์โหลดไฟล์ cleaned.csv")
+    assigned_preview = gr.Dataframe(label="ตัวอย่างผลการจัดสรร (หัว 30 แถว)", visible=True)
+    assigned_file = gr.File(label="ดาวน์โหลดไฟล์ assigned.csv")
+    not_assigned_file = gr.File(label="ดาวน์โหลดไฟล์ not_assigned.csv")
+    leftover_text = gr.Textbox(label="สรุปความจุคงเหลือ", interactive=False)
+    seed = gr.Textbox(label="Random seed (เว้นว่างเพื่อให้สุ่มใหม่ทุกครั้ง)", value="")
+    clean_btn.click(
+        fn=on_clean,
+        inputs=[file, selected_wards, capacity_df, mapping_df, flexible],
+        outputs=[info, preview, cleaned_file]
+    )
+    assign_btn.click(
+        fn=on_assign,
+        inputs=[file, selected_wards, capacity_df, mapping_df, flexible, seed],
+        outputs=[info, assigned_preview, assigned_file, not_assigned_file, leftover_text]
+    )
+if __name__ == "__main__":
+    demo.launch()

requirements.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+gradio==4.44.0
+pandas==2.2.2
+openpyxl==3.1.5
+numpy==2.0.2