Spaces:

thong0710
/

SAIF

Sleeping

App Files Files Community

thụt dòng

by vanhuudan - opened May 6, 2025

base: refs/heads/main

←

from: refs/pr/1

Discussion Files changed

+147

-15

Files changed (5) hide show

.github/workflows/deploy.yml +30 -0
app/app_ui.py +51 -5
app/gen_ai.py +12 -4
app/safety_check.py +50 -6
requirements.txt +4 -0

.github/workflows/deploy.yml ADDED Viewed

	@@ -0,0 +1,30 @@

+name: CI/CD for Python App
+on:
+  push:
+    branches: [main]  # hoặc 'master'
+jobs:
+  deploy:
+    runs-on: ubuntu-latest
+    steps:
+    - name: 📥 Lấy mã nguồn
+      uses: actions/checkout@v3
+    - name: 🐍 Cài Python
+      uses: actions/setup-python@v4
+      with:
+        python-version: "3.11"
+    - name: 📦 Cài dependencies
+      run: |
+        python -m pip install --upgrade pip
+        pip install -r requirements.txt
+    - name: ✅ Kiểm tra (test)
+      run: |
+        pytest || echo "⚠️ Bỏ qua test nếu chưa có"
+    - name: 🚀 Deploy lên Huggingface
+      run: curl -X POST ${{ secrets.DEPLOY_HOOK_URL }}

app/app_ui.py CHANGED Viewed

@@ -1,7 +1,45 @@
 import gradio as gr
 from app.gen_ai import generate_response
 from app.mlops_logger import log_prompt
-from app.safety_check import check_nsfw_image, check_violence_image, is_prompt_safe, check_url
 # === Kiểm duyệt Prompt ===
 def handle_prompt(prompt):
@@ -9,7 +47,7 @@ def handle_prompt(prompt):
     if not safe:
         log_prompt(prompt, info, False, "")
         return f"🚨 Prompt không an toàn! Phát hiện: {', '.join(info)}", ""
     response = generate_response(prompt)
     log_prompt(prompt, "OK", True, response)
     return "✅ Prompt an toàn", response
@@ -22,7 +60,7 @@ with gr.Blocks(title="SAIFGuard - HỆ THỐNG KIỂM DUYỆT THÔNG MINH", css=
 }
 """) as demo:
     gr.Markdown("## 🛡️ SAIFGuard: HỆ THỐNG KIỂM DUYỆT THÔNG MINH")
     with gr.Tab("📝 Kiểm duyệt Prompt"):
         with gr.Row():
             with gr.Column(scale=1):
@@ -32,7 +70,7 @@ with gr.Blocks(title="SAIFGuard - HỆ THỐNG KIỂM DUYỆT THÔNG MINH", css=
                 prompt_output = gr.Textbox(label="Kết quả GenAI")
                 prompt_button = gr.Button("Kiểm tra Prompt", elem_classes="yellow-btn")
         prompt_button.click(handle_prompt, inputs=prompt_input, outputs=[prompt_status, prompt_output])
     with gr.Tab("🖼️ Kiểm duyệt Hình ảnh"):
         gr.Markdown("### 📷 Tải ảnh và kiểm tra từng tiêu chí")
@@ -59,4 +97,12 @@ with gr.Blocks(title="SAIFGuard - HỆ THỐNG KIỂM DUYỆT THÔNG MINH", css=
                 url_button = gr.Button("Kiểm tra URL", elem_classes="yellow-btn")
         url_button.click(fn=check_url, inputs=url_input, outputs=url_output)

 import gradio as gr
+import numpy as np
+import whisper
+import torch
+import scipy.io.wavfile
+import cv2
+from app.safety_check import is_prompt_safe, check_nsfw_image, check_violence_image, check_url
 from app.gen_ai import generate_response
 from app.mlops_logger import log_prompt
+# Load Whisper model
+asr_model = whisper.load_model("tiny", device="cuda" if torch.cuda.is_available() else "cpu")
+# Hàm chuyển giọng nói thành văn bản
+def transcribe_and_check(audio):
+    if audio is None:
+        return "❌ Không có dữ liệu âm thanh", "", ""
+    sr, data = audio
+    # Chuyển dữ liệu âm thanh sang dạng float32
+    audio_fp32 = whisper.pad_or_trim(data.astype(np.float32) / 32768.0)
+    # Tạo spectrogram
+    mel = whisper.log_mel_spectrogram(audio_fp32).to(asr_model.device)
+    # Giải mã
+    result = asr_model.decode(mel)
+    text = result.text.strip()
+    if not text:
+        return "⚠️ Không nhận diện được giọng nói.", "", ""
+    # Kiểm tra prompt an toàn
+    is_safe, categories = is_prompt_safe(text)
+    if is_safe:
+        return "✅ Nội dung an toàn", text, ""
+    else:
+        cat_text = ", ".join(categories)
+        return f"🚨 Phát hiện nội dung không an toàn", text, f"❗ Các danh mục phát hiện: {cat_text}"
 # === Kiểm duyệt Prompt ===
 def handle_prompt(prompt):
     if not safe:
         log_prompt(prompt, info, False, "")
         return f"🚨 Prompt không an toàn! Phát hiện: {', '.join(info)}", ""
     response = generate_response(prompt)
     log_prompt(prompt, "OK", True, response)
     return "✅ Prompt an toàn", response
 }
 """) as demo:
     gr.Markdown("## 🛡️ SAIFGuard: HỆ THỐNG KIỂM DUYỆT THÔNG MINH")
     with gr.Tab("📝 Kiểm duyệt Prompt"):
         with gr.Row():
             with gr.Column(scale=1):
                 prompt_output = gr.Textbox(label="Kết quả GenAI")
                 prompt_button = gr.Button("Kiểm tra Prompt", elem_classes="yellow-btn")
         prompt_button.click(handle_prompt, inputs=prompt_input, outputs=[prompt_status, prompt_output])
     with gr.Tab("🖼️ Kiểm duyệt Hình ảnh"):
         gr.Markdown("### 📷 Tải ảnh và kiểm tra từng tiêu chí")
                 url_button = gr.Button("Kiểm tra URL", elem_classes="yellow-btn")
         url_button.click(fn=check_url, inputs=url_input, outputs=url_output)
+    with gr.Tab("🎙️Giọng Nói"):
+        audio_input = gr.Audio(type="numpy", label="Thu âm giọng nói")
+        btn2 = gr.Button("Chuyển đổi & Kiểm tra")
+        stt, trans, gen2 = (
+            gr.Textbox(label="Trạng thái kiểm duyệt"),
+            gr.Textbox(label="Văn bản chuyển đổi"),
+            gr.Textbox(label="Kết quả GenAI"),
+        )
+        btn2.click(fn=transcribe_and_check, inputs=audio_input, outputs=[stt, trans, gen2])

app/gen_ai.py CHANGED Viewed

@@ -1,7 +1,15 @@
-from transformers import pipeline
-generator = pipeline("text-generation", model="gpt2")
 def generate_response(prompt: str):
-    result = generator(prompt, max_length=100, do_sample=True, temperature=0.7)
-    return result[0]["generated_text"]

+# from transformers import pipeline
+# generator = pipeline("text-generation", model="gpt2")
+# def generate_response(prompt: str):
+#     result = generator(prompt, max_length=100, do_sample=True, temperature=0.7)
+#     return result[0]["generated_text"]
+from google import genai
+client = genai.Client(api_key="AIzaSyAYEaSiZq7lcT5eJaVwnZJJ_UMoUTtpjJk")
 def generate_response(prompt: str):
+    result = client.models.generate_content(model="gemini-2.0-flash", contents=prompt)
+    return result.text

app/safety_check.py CHANGED Viewed

@@ -1,3 +1,4 @@
 from detoxify import Detoxify
 from transformers import (
     AutoProcessor, AutoModelForImageClassification,
@@ -9,6 +10,43 @@ import torch
 import re
 from urllib.parse import urlparse, unquote
 # Load model phát hiện URL độc hại
 classifier = pipeline("zero-shot-classification")
@@ -43,7 +81,6 @@ def generate_caption(image: Image.Image):
         out = blip_model.generate(**inputs)
     caption = blip_processor.decode(out[0], skip_special_tokens=True)
     return caption
 def check_nsfw_image(image: Image.Image) -> str:
     """Kiểm tra và trả về kết quả NSFW của ảnh"""
     # Xử lý NSFW
@@ -106,6 +143,17 @@ def check_violence_image(image: Image.Image) -> str:
 - Độ chính xác: {violence_score:.2f}%
 - Mô tả: {caption}"""
 # ===Hàm check url===
 def check_url(url: str):
     try:
@@ -182,21 +230,17 @@ def format_report(report: dict, is_safe: bool):
 • URL gốc: {report['url']}
 • Domain: {report['domain']}
 • Đường dẫn: {report['path']}
 📢 CẢNH BÁO:
 {warning_text}
 🤖 Phân tích AI:
 - Kết quả: {report['ai_analysis']['label']}
 - Độ tin cậy: {report['ai_analysis']['confidence']:.2f}%
 🛡️ Khuyến nghị: KHÔNG TRUY CẬP!"""
     else:
         return f"""✅ URL AN TOÀN
 🔍 Phân tích chi tiết:
 • URL gốc: {report['url']}
 • Domain: {report['domain']}
 🤖 Phân tích AI:
 - Kết quả: {report['ai_analysis']['label']}
-- Độ tin cậy: {report['ai_analysis']['confidence']:.2f}%"""

+import speech_recognition as sr
 from detoxify import Detoxify
 from transformers import (
     AutoProcessor, AutoModelForImageClassification,
 import re
 from urllib.parse import urlparse, unquote
+# Khởi tạo Detoxify model
+detox_model = Detoxify('original')
+# Hàm chuyển đổi giọng nói thành văn bản
+def speech_to_text():
+    recognizer = sr.Recognizer()
+    with sr.Microphone() as source:
+        print("Đang nghe... Hãy nói điều gì đó")
+        recognizer.adjust_for_ambient_noise(source)
+        audio = recognizer.listen(source)
+    try:
+        print("Đang xử lý...")
+        text = recognizer.recognize_google(audio, language="vi-VN")
+        print(f"Bạn đã nói: {text}")
+        return text
+    except sr.UnknownValueError:
+        print("Không nhận dạng được giọng nói")
+        return ""
+    except sr.RequestError as e:
+        print(f"Lỗi kết nối đến dịch vụ nhận diện giọng nói: {e}")
+        return ""
+# Hàm chính thực hiện quy trình: speech -> text -> toxic detection
+def detect_toxic_speech():
+    text = speech_to_text()
+    if not text:
+        return "Không có văn bản để phân tích"
+    is_safe, toxic_categories = is_prompt_safe(text)
+    if is_safe:
+        return f"Văn bản an toàn: '{text}'"
+    else:
+        return f"Phát hiện nội dung không an toàn trong: '{text}'\nCác danh mục: {toxic_categories}"
 # Load model phát hiện URL độc hại
 classifier = pipeline("zero-shot-classification")
         out = blip_model.generate(**inputs)
     caption = blip_processor.decode(out[0], skip_special_tokens=True)
     return caption
 def check_nsfw_image(image: Image.Image) -> str:
     """Kiểm tra và trả về kết quả NSFW của ảnh"""
     # Xử lý NSFW
 - Độ chính xác: {violence_score:.2f}%
 - Mô tả: {caption}"""
+# ===Hàm check url===
+def check_url(url: str):
+    try:
+        # Chuẩn hóa URL (decode các ký tự đặc biệt)
+        decoded_url = unquote(url)
+        parsed = urlparse(decoded_url)
+        # Danh sách cảnh báo
+        warnings = []
+        # 1. Phát hiện IP thay vì domain (
 # ===Hàm check url===
 def check_url(url: str):
     try:
 • URL gốc: {report['url']}
 • Domain: {report['domain']}
 • Đường dẫn: {report['path']}
 📢 CẢNH BÁO:
 {warning_text}
 🤖 Phân tích AI:
 - Kết quả: {report['ai_analysis']['label']}
 - Độ tin cậy: {report['ai_analysis']['confidence']:.2f}%
 🛡️ Khuyến nghị: KHÔNG TRUY CẬP!"""
     else:
         return f"""✅ URL AN TOÀN
 🔍 Phân tích chi tiết:
 • URL gốc: {report['url']}
 • Domain: {report['domain']}
 🤖 Phân tích AI:
 - Kết quả: {report['ai_analysis']['label']}
+- Độ tin cậy: {report['ai_analysis']['confidence']:.2f}%"""

requirements.txt CHANGED Viewed

@@ -5,3 +5,7 @@ protobuf
 presidio-analyzer
 detoxify
 Pillow

 presidio-analyzer
 detoxify
 Pillow
+google-genai
+openai-whisper
+scipy
+SpeechRecognition