Spaces:

Titembaye
/

phiBert

Sleeping

App Files Files Community

Titembaye commited on Feb 17

Commit

d2a4487

verified ·

1 Parent(s): 288834c

Update app.py

Browse files

Files changed (1) hide show

app.py +22 -37

app.py CHANGED Viewed

@@ -14,21 +14,21 @@ MAX_LENGTH = 256
 DEVICE = torch.device("cpu")  # Force CPU pour Hugging Face Spaces gratuit
 print("="*60)
-print("🚀 Initialisation du Détecteur de Phishing")
 print("="*60)
 # Vérifier que le modèle existe
 if not os.path.exists(MODEL_PATH):
     raise FileNotFoundError(
-        f"❌ Modèle introuvable: {MODEL_PATH}\n"
         f"   Assurez-vous que le dossier existe et contient les fichiers du modèle."
     )
 # Charger le tokenizer et le modèle
-print(f"📥 Chargement du tokenizer depuis {MODEL_PATH}...")
 tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)
-print(f"📥 Chargement du modèle depuis {MODEL_PATH}...")
 # Charger en mode CPU avec optimisations mémoire
 model = AutoModelForSequenceClassification.from_pretrained(
     MODEL_PATH,
@@ -38,8 +38,8 @@ model = AutoModelForSequenceClassification.from_pretrained(
 model.to(DEVICE)
 model.eval()
-print(f"✅ Modèle chargé avec succès!")
-print(f"🖥️  Device: {DEVICE}")
 print("="*60 + "\n")
@@ -54,7 +54,7 @@ def predict_phishing(email_text):
         tuple: (verdict, probabilités, analyse détaillée)
     """
     if not email_text.strip():
-        return "⚠️ Veuillez entrer un email", {}, ""
     # Tokenization
     inputs = tokenizer(
@@ -77,7 +77,7 @@ def predict_phishing(email_text):
         confidence = probabilities[predicted_class].item()
     # Résultats
-    label = "🚨 Phishing Détecté" if predicted_class == 1 else "✅ Email Légitime"
     prob_dict = {
         "Légitime": float(probabilities[0]),
@@ -86,21 +86,21 @@ def predict_phishing(email_text):
     # Analyse détaillée
     analysis = f"""
-### 📊 Résultats de l'analyse
 **Verdict:** {label}
 **Confiance:** {confidence * 100:.1f}%
-### 🔍 Détails des probabilités
 - **Légitime:** {probabilities[0] * 100:.2f}%
 - **Phishing:** {probabilities[1] * 100:.2f}%
-### 📝 Informations
 - **Modèle:** BERT-base-uncased (adversarial training)
 - **Longueur du texte:** {len(email_text)} caractères
 - **Tokens:** {len(tokenizer.encode(email_text))} tokens
-### ⚠️ Avertissement
 Cette analyse est fournie à titre éducatif uniquement. En cas de doute sur un email réel,
 contactez votre service informatique ou l'expéditeur présumé par un canal sécurisé.
 """
@@ -153,14 +153,14 @@ Tracking ID: XYZ123456"""]
 # Interface Gradio
 with gr.Blocks(theme=gr.themes.Soft(), title="Détecteur de Phishing") as demo:
     gr.Markdown("""
-    # 🛡️ Détecteur de Phishing par Intelligence Artificielle
     Cette application utilise un modèle **BERT fine-tuné avec adversarial training**
     pour détecter les emails de phishing.
     **Axes d'évaluation:**
-    - 🎯 Robustesse face aux attaques adversariales générées par IA
-    - 🌐 Généralisation cross-linguale (EN/FR)
     ---
     """)
@@ -175,18 +175,18 @@ with gr.Blocks(theme=gr.themes.Soft(), title="Détecteur de Phishing") as demo:
             )
             with gr.Row():
-                analyze_btn = gr.Button("🔍 Analyser", variant="primary", size="lg")
                 clear_btn = gr.ClearButton([email_input], value="🗑️ Effacer")
         with gr.Column(scale=1):
             verdict_output = gr.Textbox(
-                label="🎯 Verdict",
                 interactive=False,
                 lines=2
             )
             prob_output = gr.Label(
-                label="📊 Probabilités",
                 num_top_classes=2
             )
@@ -194,7 +194,7 @@ with gr.Blocks(theme=gr.themes.Soft(), title="Détecteur de Phishing") as demo:
         analysis_output = gr.Markdown(label="📈 Analyse Détaillée")
     # Exemples
-    gr.Markdown("### 💡 Exemples à tester")
     gr.Examples(
         examples=examples,
         inputs=email_input,
@@ -204,21 +204,6 @@ with gr.Blocks(theme=gr.themes.Soft(), title="Détecteur de Phishing") as demo:
     # Footer
     gr.Markdown("""
     ---
-    ### 📚 À propos
-    **Projet:** Détection de Phishing par IA - Robustesse Adversariale et Généralisation Cross-Linguale
-    **Datasets utilisés:**
-    - Enron Email Dataset (500k emails)
-    - SMS Spam Collection (5,574 SMS)
-    - Phishing Email Dataset (18,650 emails)
-    - Phishing adversariaux générés par Ollama + Gemma3:1b
-    **Modèle:**
-    - BERT-base-uncased (110M paramètres)
-    - Fine-tuné avec adversarial training (50% baseline + 50% adversarial)
     ⚠️ **Disclaimer:** Cette application est fournie à des fins éducatives et de recherche uniquement.
     """)
@@ -232,10 +217,10 @@ with gr.Blocks(theme=gr.themes.Soft(), title="Détecteur de Phishing") as demo:
 if __name__ == "__main__":
     print("\n" + "="*60)
-    print("🚀 Lancement de l'application Gradio")
     print("="*60)
-    print(f"📱 Device: {DEVICE}")
-    print(f"🤖 Modèle: {MODEL_PATH}")
     print("="*60 + "\n")
     demo.launch(

 DEVICE = torch.device("cpu")  # Force CPU pour Hugging Face Spaces gratuit
 print("="*60)
+print("Initialisation du Détecteur de Phishing")
 print("="*60)
 # Vérifier que le modèle existe
 if not os.path.exists(MODEL_PATH):
     raise FileNotFoundError(
+        f"Modèle introuvable: {MODEL_PATH}\n"
         f"   Assurez-vous que le dossier existe et contient les fichiers du modèle."
     )
 # Charger le tokenizer et le modèle
+print(f"Chargement du tokenizer depuis {MODEL_PATH}...")
 tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)
+print(f"Chargement du modèle depuis {MODEL_PATH}...")
 # Charger en mode CPU avec optimisations mémoire
 model = AutoModelForSequenceClassification.from_pretrained(
     MODEL_PATH,
 model.to(DEVICE)
 model.eval()
+print(f"Modèle chargé avec succès!")
+print(f"Device: {DEVICE}")
 print("="*60 + "\n")
         tuple: (verdict, probabilités, analyse détaillée)
     """
     if not email_text.strip():
+        return "Veuillez entrer un email", {}, ""
     # Tokenization
     inputs = tokenizer(
         confidence = probabilities[predicted_class].item()
     # Résultats
+    label = "🚨Phishing Détecté" if predicted_class == 1 else "✅ Email Légitime"
     prob_dict = {
         "Légitime": float(probabilities[0]),
     # Analyse détaillée
     analysis = f"""
+### Résultats de l'analyse
 **Verdict:** {label}
 **Confiance:** {confidence * 100:.1f}%
+### Détails des probabilités
 - **Légitime:** {probabilities[0] * 100:.2f}%
 - **Phishing:** {probabilities[1] * 100:.2f}%
+### Informations
 - **Modèle:** BERT-base-uncased (adversarial training)
 - **Longueur du texte:** {len(email_text)} caractères
 - **Tokens:** {len(tokenizer.encode(email_text))} tokens
+### Avertissement
 Cette analyse est fournie à titre éducatif uniquement. En cas de doute sur un email réel,
 contactez votre service informatique ou l'expéditeur présumé par un canal sécurisé.
 """
 # Interface Gradio
 with gr.Blocks(theme=gr.themes.Soft(), title="Détecteur de Phishing") as demo:
     gr.Markdown("""
+    # Détecteur de Phishing par Intelligence Artificielle
     Cette application utilise un modèle **BERT fine-tuné avec adversarial training**
     pour détecter les emails de phishing.
     **Axes d'évaluation:**
+    - Robustesse face aux attaques adversariales générées par IA
+    - Généralisation cross-linguale (EN/FR)
     ---
     """)
             )
             with gr.Row():
+                analyze_btn = gr.Button("Analyser", variant="primary", size="lg")
                 clear_btn = gr.ClearButton([email_input], value="🗑️ Effacer")
         with gr.Column(scale=1):
             verdict_output = gr.Textbox(
+                label="Verdict",
                 interactive=False,
                 lines=2
             )
             prob_output = gr.Label(
+                label="Probabilités",
                 num_top_classes=2
             )
         analysis_output = gr.Markdown(label="📈 Analyse Détaillée")
     # Exemples
+    gr.Markdown("### Exemples à tester")
     gr.Examples(
         examples=examples,
         inputs=email_input,
     # Footer
     gr.Markdown("""
     ---
     ⚠️ **Disclaimer:** Cette application est fournie à des fins éducatives et de recherche uniquement.
     """)
 if __name__ == "__main__":
     print("\n" + "="*60)
+    print("Lancement de l'application Gradio")
     print("="*60)
+    print(f"Device: {DEVICE}")
+    print(f" Modèle: {MODEL_PATH}")
     print("="*60 + "\n")
     demo.launch(