Spaces:

vat75
/

PhishGuard-AI

Running

App Files Files Community

vat75 commited on 14 days ago

Commit

bf3fd73

verified ·

1 Parent(s): 61cc9fd

Update app.py

Browse files

Files changed (1) hide show

app.py +53 -46

app.py CHANGED Viewed

@@ -3,70 +3,77 @@ import re
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForSequenceClassification
-# تحميل النموذج والـ Tokenizer
 MODEL_NAME = "vat75/PhishGuard-AI"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 model = AutoModelForSequenceClassification.from_pretrained(MODEL_NAME)
 model.eval()
-# كلمات مفتاحية ونطاقات مشبوهة
-SCAM_KEYWORDS = ["حدث بياناتك", "تحديث بياناتك", "حسابك البنكي", "بطاقتك الصراف", "ربحت", "جائزة", "مبروك", "فزت", "تجنب إيقاف", "حظر حسابك", "سارع", "اضغط الرابط", "اضغط هنا", "لديك طلب متوقف", "شحنتك متوقفة بسبب رسوم", "ادفع الان", "تم قبولك في وظيفة براتب عالي", "لديك هدية"]
-SUSPICIOUS_DOMAINS = ["bit.ly", "tinyurl.com", "t.co", "cutt.ly", "shorturl.at", "is.gd", "buff.ly", "ow.ly", "rebrand.ly"]
 def contains_scam_indicators(text):
-    url_pattern = r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\<LaTex>\(\\)</LaTex>,]|(?:%[0-9a-fA-F][0-9a-fA-F]))+'
-    urls = re.findall(url_pattern, text)
-    if urls:
-        for url in urls:
-            for domain in SUSPICIOUS_DOMAINS:
-                if domain in url.lower(): return True
-        if len(urls[0]) > 50 or re.search(r'\d{5,}', urls[0]): return True
     for word in SCAM_KEYWORDS:
-        if word in text: return True
     return False
 def analyze_text(text):
-    if not text.strip(): return "الرجاء إدخال نص للتحليل.", "0%"
-    inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True, max_length=128)
     with torch.no_grad():
         outputs = model(**inputs)
         probs = torch.nn.functional.softmax(outputs.logits, dim=-1)
     predicted_class = torch.argmax(probs, dim=-1).item()
     confidence = probs[0][predicted_class].item()
     is_scam = (predicted_class == 1) or contains_scam_indicators(text)
     if is_scam:
-        verdict = "🚨 محاولة احتيال مكتشفة!"
-        conf_val = f"{max(confidence * 100, 95.0):.2f}%"
     else:
-        verdict = "✅ هذا النص يبدو آمناً"
-        conf_val = f"{confidence * 100:.2f}%"
-    return verdict, conf_val
-# بناء واجهة التطبيق باستخدام Gradio
-with gr.Blocks(theme=gr.themes.Soft()) as demo:
-    gr.Markdown("# 🛡️ كاشف الاحتيال PhishGuard-AI")
-    gr.Markdown("أدخل نص الرسالة أو الرابط المشبوه أدناه للتحقق من سلامته.")
-    with gr.Row():
-        with gr.Column():
-            input_text = gr.Textbox(label="نص الرسالة", placeholder="أدخل النص هنا...", lines=5)
-            btn = gr.Button("تحليل النص الآن", variant="primary")
-        with gr.Column():
-            output_verdict = gr.Label(label="النتيجة النهائية")
-            output_conf = gr.Textbox(label="مستوى الثقة")
-    btn.click(fn=analyze_text, inputs=input_text, outputs=[output_verdict, output_conf])
-    gr.Examples(
-        examples=[["عزيزي العميل، تم حظر حسابك البنكي، يرجى تحديث بياناتك عبر الرابط: bit.ly/bank-update"], ["مرحباً، كيف حالك اليوم؟"]],
-        inputs=input_text
-    )
-if __name__ == "__main__":
-    demo.launch(server_name="0.0.0.0", server_port=7860)

 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForSequenceClassification
+# تحميل النموذج
 MODEL_NAME = "vat75/PhishGuard-AI"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 model = AutoModelForSequenceClassification.from_pretrained(MODEL_NAME)
 model.eval()
+# كلمات مشبوهة
+SCAM_KEYWORDS = [
+    "حدث بياناتك","تحديث بياناتك","حسابك البنكي","بطاقتك الصراف",
+    "ربحت","جائزة","مبروك","فزت","تجنب إيقاف","حظر حسابك",
+    "سارع","اضغط الرابط","اضغط هنا","لديك طلب متوقف",
+    "شحنتك متوقفة بسبب رسوم","ادفع الان",
+    "تم قبولك في وظيفة براتب عالي","لديك هدية"
+]
+SUSPICIOUS_DOMAINS = [
+    "bit.ly","tinyurl.com","t.co","cutt.ly","shorturl.at",
+    "is.gd","buff.ly","ow.ly","rebrand.ly"
+]
 def contains_scam_indicators(text):
+    urls = re.findall(r'https?://\S+', text)
+    for url in urls:
+        if any(domain in url.lower() for domain in SUSPICIOUS_DOMAINS):
+            return True
+        if len(url) > 50 or re.search(r'\d{5,}', url):
+            return True
     for word in SCAM_KEYWORDS:
+        if word in text:
+            return True
     return False
 def analyze_text(text):
+    if not text.strip():
+        return "الرجاء إدخال نص.", "0%"
+    inputs = tokenizer(
+        text,
+        return_tensors="pt",
+        truncation=True,
+        padding=True,
+        max_length=128
+    )
     with torch.no_grad():
         outputs = model(**inputs)
         probs = torch.nn.functional.softmax(outputs.logits, dim=-1)
     predicted_class = torch.argmax(probs, dim=-1).item()
     confidence = probs[0][predicted_class].item()
     is_scam = (predicted_class == 1) or contains_scam_indicators(text)
     if is_scam:
+        return "🚨 محاولة احتيال!", f"{max(confidence*100,95):.2f}%"
     else:
+        return "✅ آمن", f"{confidence*100:.2f}%"
+# واجهة Gradio (مبسطة عشان نتجنب أي مشاكل)
+demo = gr.Interface(
+    fn=analyze_text,
+    inputs=gr.Textbox(lines=5, placeholder="اكتب الرسالة هنا..."),
+    outputs=[
+        gr.Text(label="النتيجة"),
+        gr.Text(label="الثقة")
+    ],
+    title="🛡️ PhishGuard AI",
+    description="اكشف الرسائل الاحتيالية بسهولة"
+)
+demo.launch()