Spaces:

yagnik12
/

AI_Text_Detecter_HanxiGuo_BiScope-Data

Running

yagnik12 commited on Sep 15

Commit

9525cff

verified ·

1 Parent(s): 93b7207

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,15 +2,15 @@ import gradio as gr
 from transformers import AutoTokenizer, AutoModelForSequenceClassification, GPT2LMHeadModel
 import torch
 import math
-import nltk
-# Download Punkt tokenizer if not already available
-try:
-    nltk.data.find("tokenizers/punkt")
-except LookupError:
-    nltk.download("punkt")
-from nltk.tokenize import sent_tokenize
 # -------------------------------
 # Load Models
@@ -60,7 +60,7 @@ def verdict(ai_prob):
         return "Likely AI-generated or heavily AI-assisted."
 def analyze_text(user_text):
-    sentences = sent_tokenize(user_text)
     if not sentences:
         return {"error": "Please enter some text."}

 from transformers import AutoTokenizer, AutoModelForSequenceClassification, GPT2LMHeadModel
 import torch
 import math
+import re
+# -------------------------------
+# Sentence splitter (no nltk)
+# -------------------------------
+def simple_sent_tokenize(text):
+    # Split by punctuation followed by space
+    sentences = re.split(r'(?<=[.!?]) +', text)
+    return [s for s in sentences if s.strip()]
 # -------------------------------
 # Load Models
         return "Likely AI-generated or heavily AI-assisted."
 def analyze_text(user_text):
+    sentences = simple_sent_tokenize(user_text)
     if not sentences:
         return {"error": "Please enter some text."}