Spaces:

siedysioes
/

Human-Firewall-Detector

Sleeping

App Files Files Community

siedysioes commited on Dec 26, 2025

Commit

a571e45

verified ·

1 Parent(s): ef3cc17

Create app.py

Browse files

Files changed (1) hide show

app.py +140 -0

app.py ADDED Viewed

	@@ -0,0 +1,140 @@

+import streamlit as st
+import pandas as pd
+import numpy as np
+import re
+from sklearn.feature_extraction.text import TfidfVectorizer
+from sklearn.ensemble import RandomForestClassifier
+from sklearn.naive_bayes import MultinomialNB
+from sklearn.pipeline import make_pipeline
+# --- KONFIGURASI HALAMAN ---
+st.set_page_config(
+    page_title="Human Firewall AI",
+    page_icon="🛡️",
+    layout="centered"
+)
+st.title("🛡️ AI Phishing & Scam Detector")
+st.markdown("### The Human Firewall Project | Edy Qineos Academy")
+st.info("Aplikasi ini menggunakan AI untuk mendeteksi anomali pada URL (Link) dan Pola Bahasa Penipuan (NLP) pada pesan teks.")
+# --- BAGIAN 1: OTAK AI (TRAINING OTOMATIS SAAT STARTUP) ---
+# Kita gunakan @st.cache_resource agar training hanya terjadi 1x saat aplikasi nyala
+# Jadi tidak berat loadingnya.
+@st.cache_resource
+def train_models():
+    # --- A. DATASET URL (SIMULASI) ---
+    data_url = {
+        'url': [
+            'google.com', 'facebook.com', 'klikbca.com', 'ugm.ac.id', 'microsoft.com', # Legit
+            'secure-login-bca.com', 'g00gle-security.xyz', 'free-iphone.net', 'klikbca-verify.info', # Phishing
+            'paypal-limited.com', 'dana-kaget.biz', 'brimo-undian.apk', 'netflix-payment.com'
+        ],
+        'label': [0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1] # 0=Aman, 1=Phishing
+    }
+    # Ekstraksi Fitur URL (Lexical)
+    def extract_features(url):
+        return [
+            len(url),                   # Panjang URL
+            url.count('.'),             # Jumlah titik
+            url.count('-'),             # Jumlah strip
+            1 if any(c.isdigit() for c in url) else 0, # Ada angka?
+            1 if "http" in url and "https" not in url else 0 # HTTP tidak aman
+        ]
+    X_url = [extract_features(u) for u in data_url['url']]
+    y_url = data_url['label']
+    # Train Model URL (Random Forest)
+    model_url = RandomForestClassifier(n_estimators=50, random_state=42)
+    model_url.fit(X_url, y_url)
+    # --- B. DATASET SMS (SIMULASI) ---
+    data_sms = [
+        ("Bro, nanti futsal jam berapa?", 0),
+        ("Selamat! Anda menang undian Rp 100jt. Klik bit.ly/klaim", 1),
+        ("Paket Anda tertahan. Bayar ongkir segera.", 1),
+        ("Rapat besok diundur ke jam 10 pagi ya.", 0),
+        ("Mama minta pulsa ke nomor ini dulu.", 1),
+        ("Kode OTP Anda 5820. JANGAN BERIKAN KE SIAPAPUN.", 0),
+        ("Butuh pinjaman cepat cair bunga rendah? Hubungi kami.", 1),
+        ("Terima kasih sudah belanja di Tokopedia.", 0)
+    ]
+    df_sms = pd.DataFrame(data_sms, columns=['text', 'label'])
+    # Train Model SMS (Naive Bayes)
+    model_sms = make_pipeline(TfidfVectorizer(), MultinomialNB())
+    model_sms.fit(df_sms['text'], df_sms['label'])
+    return model_url, model_sms
+# Load Models (Langsung dipanggil)
+model_url, model_sms = train_models()
+# --- FUNGSI EKSTRAKSI (Harus sama dengan saat training) ---
+def extract_features_realtime(url):
+    return [
+        len(url),
+        url.count('.'),
+        url.count('-'),
+        1 if any(c.isdigit() for c in url) else 0,
+        1 if "http" in url and "https" not in url else 0
+    ]
+# --- UI DISPLAY (TABS) ---
+tab1, tab2 = st.tabs(["🔗 Cek Link (URL)", "📩 Cek Pesan (SMS/WA)"])
+with tab1:
+    st.header("URL Phishing Hunter")
+    st.write("Menganalisa struktur tulisan link untuk mendeteksi penipuan.")
+    url_input = st.text_input("Masukkan Link / URL mencurigakan:", placeholder="Contoh: www.klikbca-promo-undian.com")
+    if st.button("🔍 Scan URL"):
+        if url_input:
+            # Prediksi
+            features = [extract_features_realtime(url_input)]
+            pred = model_url.predict(features)[0]
+            prob = model_url.predict_proba(features)[0]
+            confidence = max(prob) * 100
+            st.divider()
+            if pred == 1: # PHISHING
+                st.error(f"🚨 HASIL: BERBAHAYA (PHISHING)")
+                st.write(f"AI yakin **{confidence:.1f}%** link ini jahat.")
+                st.markdown("**Alasan Deteksi:**")
+                st.markdown(f"- Panjang Karakter: `{len(url_input)}` (Terlalu panjang/pendek)")
+                st.markdown(f"- Jumlah Simbol Titik/Strip: `{url_input.count('.') + url_input.count('-')}` (Indikasi obfuscation)")
+                if "http" in url_input and "https" not in url_input:
+                    st.markdown("- Protokol: `HTTP` (Tidak Aman)")
+            else: # AMAN
+                st.success(f"✅ HASIL: AMAN (LEGITIMATE)")
+                st.write(f"AI yakin **{confidence:.1f}%** link ini aman.")
+with tab2:
+    st.header("Scam Message Detector")
+    st.write("Menggunakan NLP untuk membaca niat jahat dalam teks pesan.")
+    sms_input = st.text_area("Copy-Paste isi pesan SMS/WhatsApp di sini:", placeholder="Contoh: Selamat Anda menang undian...")
+    if st.button("🧠 Analisa Bahasa"):
+        if sms_input:
+            # Prediksi
+            pred = model_sms.predict([sms_input])[0]
+            prob = model_sms.predict_proba([sms_input])[0]
+            confidence = max(prob) * 100
+            st.divider()
+            if pred == 1: # SCAM
+                st.error(f"🚨 HASIL: PENIPUAN (SCAM)")
+                st.write(f"AI yakin **{confidence:.1f}%** ini pesan penipuan.")
+                st.warning("⚠️ **Peringatan:** Pesan ini mengandung pola 'Urgensi' atau 'Iming-iming Hadiah'. Jangan klik link apapun!")
+            else: # NORMAL
+                st.success(f"✅ HASIL: PESAN NORMAL")
+                st.write(f"AI yakin **{confidence:.1f}%** ini percakapan biasa.")
+# --- FOOTER ---
+st.divider()
+st.caption("Disclaimer: Model ini dilatih dengan data simulasi untuk tujuan edukasi demonstrasi AI Security.")