Spaces:

stat2025
/

ticket-parser

Running

App Files Files Community

stat2025 commited on Aug 22, 2025

Commit

c133f8a

verified ·

1 Parent(s): 421403c

Delete app.py

Browse files

Files changed (1) hide show

app.py +0 -247

app.py DELETED Viewed

@@ -1,247 +0,0 @@
-# app.py
-# -*- coding: utf-8 -*-
-"""
-HF Space — Arabic Ticket Parser & Excel Exporter
-------------------------------------------------
-- لصق عدة تذاكر نصياً (من واتساب/تلغرام…)
-- يجزّئها تلقائياً، يستخرج الحقول العربية المعروفة، ويصنّف نوع المشكلة بالكلمات المفتاحية.
-- يعرض جدولاً قابلاً للتعديل ثم يصدّره Excel مباشرة.
-المكتبات: gradio, pandas, openpyxl
-"""
-import re
-import io
-import json
-import gradio as gr
-import pandas as pd
-from datetime import datetime
-# ---------------------------- Utilities ----------------------------
-ARABIC_DIGITS = str.maketrans("٠١٢٣٤٥٦٧٨٩", "0123456789")
-FIELD_ALIASES = {
-    "نوع المشكلة": ["نوع المشكله", "نوع المشكله:", "نوع المشكلة:"],
-    "وقت حدوث المشكلة": ["وقت حدوث المشكله", "وقت حدوث المشكله:", "وقت حدوث المشكلة:"],
-    "اسم صاحب المشكلة": ["اسم صاحب المشكله", "اسم صاحب المشكله:", "اسم صاحب المشكلة:"],
-    "رقم الهوية": ["رقم الهويه", "رقم الهوية:"],
-    "رقم الجهاز": ["رقم الجهاز:"],
-    "رقم الجوال": ["رقم الجوال:"],
-    "المسح": ["المسح:"],
-    "المنطقة": ["المنطقه", "المنطقة:"],
-    "ملاحظات": ["ملاحظه", "ملاحظة", "ملاحظات", "ملاحظات:"]
-}
-# Precompile regex patterns that match: label : value
-LABEL_SEP = r"[:：]\s*"
-FIELD_PATTERNS = {
-    canonical: re.compile(rf"(?:^|\n)\s*(?:{'|'.join(map(re.escape, labels))})\s*{LABEL_SEP}(.+)")
-    for canonical, labels in FIELD_ALIASES.items()
-}
-# Recognized separators between tickets
-TICKET_SEP = re.compile(r"\n\s*(?:\n|—+|-{3,}|={3,}|🔴+)+\s*\n")
-# Default keyword -> category rules (editable from UI)
-DEFAULT_RULES = {
-    "معلق شاشة سوداء": ["معلق شاشة سوداء", "شاشة سوداء"],
-    "خارج نطاق المسح": ["خارج نطاق المسح"],
-    "Invalid user data": ["invalid user data", "invalid user"],
-    "رفض تسجيل الدخول": ["رفض تسجيل الدخول", "رفض الدخول"],
-    "تعليق مستمر": ["تعليق مستمر", "يعلق", "تهنيق"],
-    "مشكلة شبكة/نت": ["شبكة", "نت", "stc", "mobily"],
-    "بطء/توقف": ["بطئ", "بطء", "وقوفه", "يتوقف"],
-    "طلبات نظام": ["تحديث", "ترقية", "نسخة", "إصدار"],
-}
-# Columns order
-COLUMNS = [
-    "التصنيف",
-    "نوع المشكلة",
-    "وقت حدوث المشكلة",
-    "اسم صاحب المشكلة",
-    "رقم الهوية",
-    "رقم الجهاز",
-    "رقم الجوال",
-    "المسح",
-    "المنطقة",
-    "ملاحظات",
-    "نص خام",
-]
-def normalize_text(s: str) -> str:
-    if not isinstance(s, str):
-        return ""
-    s2 = s.translate(ARABIC_DIGITS)
-    s2 = re.sub(r"[\u200f\u200e\u2066\u2067\u2068\u2069\u00a0]", " ", s2)
-    return s2.strip()
-def split_tickets(raw: str):
-    raw = normalize_text(raw)
-    if not raw:
-        return []
-    parts = re.split(TICKET_SEP, raw)
-    if len(parts) == 1:
-        parts = [p for p in re.split(r"\n\s*\n+", raw) if p.strip()]
-    return [p.strip() for p in parts if p.strip()]
-def extract_fields(ticket_text: str) -> dict:
-    data = {k: "" for k in FIELD_PATTERNS.keys()}
-    text = normalize_text(ticket_text)
-    for fname, pat in FIELD_PATTERNS.items():
-        m = pat.search(text)
-        if m:
-            data[fname] = normalize_text(m.group(1).strip())
-    # Heuristics for phone and ID
-    if not data["رقم الجوال"]:
-        m = re.search(r"(05\d{8})", text)
-        if m:
-            data["رقم الجوال"] = m.group(1)
-    if not data["رقم الهوية"]:
-        m = re.search(r"(1\d{9})", text)
-        if m:
-            data["رقم الهوية"] = m.group(1)
-    data["نص خام"] = text
-    return data
-def compile_rules(user_rules_text: str):
-    """user_rules_text is lines: keyword => label  OR JSON dict."""
-    rules = DEFAULT_RULES.copy()
-    t = (user_rules_text or "").strip()
-    if not t:
-        return rules
-    # JSON first
-    try:
-        parsed = json.loads(t)
-        if isinstance(parsed, dict):
-            for label, kws in parsed.items():
-                if not isinstance(kws, list):
-                    kws = [str(kws)]
-                rules[label] = [normalize_text(k) for k in kws]
-            return rules
-    except Exception:
-        pass
-    # Fallback line-based form
-    for line in t.splitlines():
-        if "=>" in line:
-            kw, label = map(lambda x: normalize_text(x), line.split("=>", 1))
-            if kw and label:
-                rules.setdefault(label, []).append(kw)
-    return rules
-def classify_ticket(text: str, rules: dict) -> str:
-    t = normalize_text(text)
-    for label, kws in rules.items():
-        for kw in kws:
-            if kw and kw.lower() in t.lower():
-                return label
-    return "غير مصنّف"
-def parse_and_classify(raw_text: str, user_rules_text: str):
-    tickets = split_tickets(raw_text)
-    rules = compile_rules(user_rules_text)
-    rows = []
-    for tk in tickets:
-        fields = extract_fields(tk)
-        label = classify_ticket(tk + "\n" + fields.get("نوع المشكلة", ""), rules)
-        row = {
-            "التصنيف": label,
-            **fields,
-        }
-        rows.append(row)
-    if not rows:
-        df = pd.DataFrame(columns=COLUMNS)
-    else:
-        df = pd.DataFrame(rows)
-        for c in COLUMNS:
-            if c not in df.columns:
-                df[c] = ""
-        df = df[COLUMNS]
-    return df
-def export_excel(df: pd.DataFrame, filename_prefix: str = "tickets"):
-    buffer = io.BytesIO()
-    with pd.ExcelWriter(buffer, engine="openpyxl") as writer:
-        df.to_excel(writer, index=False, sheet_name="التذاكر")
-    buffer.seek(0)
-    ts = datetime.now().strftime("%Y%m%d_%H%M%S")
-    return (f"{filename_prefix}_{ts}.xlsx", buffer)
-# ---------------------------- UI ----------------------------
-with gr.Blocks(title="Arabic Ticket Parser — ISIC Helper", theme=gr.themes.Soft()) as demo:
-    gr.Markdown(
-        """
-        # معالج التذاكر — لصق ثم تصدير Excel
-        الصق التذاكر (حتى 20 أو أكثر) في المربع أدناه. سيتعرف التطبيق على الحقول الشائعة ويصنّفها بالكلمات المفتاحية.
-        **تلميح**: افصل بين التذاكر بسطر فارغ أو فواصل مثل `---` أو `🔴🔴🔴`.
-        """
-    )
-    with gr.Row():
-        raw = gr.Textbox(label="الصق التذاكر هنا", lines=18, placeholder="الصق نص التذاكر العربية كما هو…")
-    with gr.Accordion("قواعد التصنيف (اختياري)", open=False):
-        rules_tb = gr.Textbox(
-            label="أضف كلمات مفتاحية ومقابلها التصنيف — صيغة JSON {تصنيف: [كلمات…]} أو أسطر من الشكل (كلمة => تصنيف)",
-            lines=6,
-            placeholder='مثال JSON: {"انقطاع": ["انقطاع", "ما يفتح"], "صلاحيات": ["صلاحية", "غير مخول"]}'
-        )
-    with gr.Row():
-        parse_btn = gr.Button("تحليل التذاكر")
-        clear_btn = gr.Button("مسح")
-    df_out = gr.Dataframe(headers=COLUMNS, row_count=(1, "dynamic"), interactive=True, label="النتيجة")
-    with gr.Row():
-        fname = gr.Textbox(label="اسم الملف عند التصدير", value="tickets", scale=1)
-        export_btn = gr.Button("تصدير Excel", variant="primary", scale=1)
-        file_out = gr.File(label="تحميل ملف الإكسل بعد التصدير")
-    sample = (
-        """
-🔴🔴🔴
-نوع المشكلة : كل عينة ادخل عليها عشان انتقل للقسم الثاني لازم اسجل خروج وارجع مرة أخرى تعليق مستمر رغم أن في شريحة نت خاصة وقوفه وفي بطئ ملاحظات على الجهاز
-وقت حدوث المشكلة: 21/8/2025
-اسم صاحب المشكلة : منيرة الشراري
-رقم الهوية: 1037289194
-رقم الجهاز: 868190043822887
-رقم الجوال: 0542244234
-اسم المسح: الطاقة المنزلية
-المنطقة: الجوف
-        """.strip()
-    )
-    def on_parse(raw_text, rules_text):
-        df = parse_and_classify(raw_text or sample, rules_text)
-        return df
-    def on_export(df, prefix):
-        if df is None or (hasattr(df, "empty") and df.empty):
-            df = parse_and_classify(sample, "")
-        name, buff = export_excel(df, prefix or "tickets")
-        return gr.File.update(value=(name, buff), visible=True)
-    parse_btn.click(on_parse, inputs=[raw, rules_tb], outputs=[df_out])
-    export_btn.click(on_export, inputs=[df_out, fname], outputs=[file_out])
-    clear_btn.click(lambda: ("", ""), None, [raw, rules_tb])
-    gr.Examples(
-        examples=[[sample]],
-        inputs=[raw],
-        label="مثال سريع — اضغط للإدراج"
-    )
-if __name__ == "__main__":
-    demo.launch()