Spaces:

fallinluv8
/

nexore-toxic-api

Sleeping

fallinluv8 commited on Nov 27, 2025

Commit

7ff6bb3

verified ·

1 Parent(s): f8fabae

Update main.py

Files changed (1) hide show

main.py CHANGED Viewed

@@ -12,16 +12,19 @@ MODEL_PATH = "fallinluv8/nexore-toxic-model"
 # Bạn có thể thêm từ vào đây tùy ý
 HARD_BLACKLIST = [
-    "đéo"
 ]
 classifier = None
-startup_error = None  # Biến để lưu lỗi nếu có sự cố khi khởi động
 @app.on_event("startup")
 def load_model():
     global classifier, startup_error
-    print(f"🚀 [STARTUP] Đang tải Model từ Hub: {MODEL_PATH}...")
     try:
         # Load Tokenizer
         tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)
@@ -89,7 +92,7 @@ async def predict_toxicity(request: ToxicRequest):
     # Chỉ chạy AI nếu blacklist chưa bắt được hoặc để bổ sung thêm từ vi phạm
     try:
         results = classifier(request.text)
-        print(f"🤖 [AI SEE] {results}") # Log để debug
         for entity in results:
             score = float(entity['score'])
@@ -108,11 +111,11 @@ async def predict_toxicity(request: ToxicRequest):
                     max_score = score
         # Nếu AI tìm thấy từ có độ tin cậy cao
-        if max_score > 0.6:
             is_toxic = True
     except Exception as e:
-        print(f"❌ [AI ERROR] {e}")
         # Nếu blacklist đã bắt được thì bỏ qua lỗi AI, trả về kết quả blacklist
         if not is_toxic:
             raise HTTPException(status_code=500, detail=f"AI Error: {str(e)}")

 # Bạn có thể thêm từ vào đây tùy ý
 HARD_BLACKLIST = [
+    "đéo", "đ**", "dm", "dcm", "đm", "vcl", "vl",
+    "cc", "cmn", "cmm", "lồn", "l**", "đĩ", "đ**",
+    "cặc", "c**", "buồi", "bu**", "đụ", "đụ mẹ",
+    "đụ bố", "đụ con mẹ mày", "đụ con", "đụ mày"
 ]
 classifier = None
+startup_error = None
 @app.on_event("startup")
 def load_model():
     global classifier, startup_error
+    print(f" [STARTUP] Đang tải Model từ Hub: {MODEL_PATH}...")
     try:
         # Load Tokenizer
         tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)
     # Chỉ chạy AI nếu blacklist chưa bắt được hoặc để bổ sung thêm từ vi phạm
     try:
         results = classifier(request.text)
+        print(f" [AI SEE] {results}") # Log để debug
         for entity in results:
             score = float(entity['score'])
                     max_score = score
         # Nếu AI tìm thấy từ có độ tin cậy cao
+        if max_score > 0.9:
             is_toxic = True
     except Exception as e:
+        print(f" [AI ERROR] {e}")
         # Nếu blacklist đã bắt được thì bỏ qua lỗi AI, trả về kết quả blacklist
         if not is_toxic:
             raise HTTPException(status_code=500, detail=f"AI Error: {str(e)}")