Spaces:

vivv56
/

ayes

Sleeping

App Files Files Community

vivv56 commited on Jul 30, 2025

Commit

700c4d8

verified ·

1 Parent(s): 0ce0b4e

Update src/streamlit_app.py

Browse files

Files changed (1) hide show

src/streamlit_app.py +89 -34

src/streamlit_app.py CHANGED Viewed

@@ -4,41 +4,96 @@ import torch
 from transformers import GPT2LMHeadModel, GPT2TokenizerFast
 import numpy as np
-# Load models
 vectorizer = joblib.load('src/vectorizer.pkl')
-clf = joblib.load('src/logistic_model.pkl')
-tokenizer = GPT2TokenizerFast.from_pretrained("src/gpt2_local")
-gpt2 = GPT2LMHeadModel.from_pretrained("src/gpt2_local").eval()
-# Calculate perplexity
-def get_perplexity(text):
     inputs = tokenizer(text, return_tensors="pt", truncation=True, max_length=512)
     with torch.no_grad():
-        loss = gpt2(**inputs, labels=inputs["input_ids"]).loss
-    return torch.exp(loss).item()
-# Combine both scores
-def final_ai_score(text, w_perp=0.7):
-    perplexity = get_perplexity(text)
-    model_prob = clf.predict_proba(vectorizer.transform([text]))[0][1]
-    perp_score = np.clip(1 / (perplexity + 1), 0, 1)
-    final_score = w_perp * perp_score + (1 - w_perp) * model_prob
-    return final_score, perplexity
-# UI
-st.title("🤖 AI vs Human Text Detector")
-text = st.text_area("Enter your sentence here:", height=150)
-if st.button("Check") and text.strip():
-    ai_score, perplexity = final_ai_score(text)
-    is_ai = ai_score > 0.5
-    st.subheader("🔍 Result:")
-    st.error("❗ This text is likely **AI-generated**." if is_ai else "✅ This text is likely **Human-written**.")
-    st.markdown(f"**Final AI Score:** {ai_score:.3f}")
-    st.markdown(f"**Perplexity Score:** {perplexity:.2f}")
-    if perplexity < 30:
-        st.info("🧠 Low perplexity suggests the text is highly predictable—possibly AI-generated.")
-    elif perplexity > 100:
-        st.info("🧠 High perplexity suggests human-like variation or complexity.")

 from transformers import GPT2LMHeadModel, GPT2TokenizerFast
 import numpy as np
+# -------------------------------
+# Load Logistic Regression model
+# -------------------------------
 vectorizer = joblib.load('src/vectorizer.pkl')
+model = joblib.load('src/logistic_model.pkl')
+# -------------------------------
+# Load GPT-2 model and tokenizer
+# -------------------------------
+@st.cache_resource
+def load_gpt2():
+    tokenizer = GPT2TokenizerFast.from_pretrained("src/gpt2_local")
+    gpt2_model = GPT2LMHeadModel.from_pretrained(
+        "src/gpt2_local",
+        trust_remote_code=True,
+        local_files_only=True  # Use only local files in HF Spaces
+    )
+    gpt2_model.to(torch.device("cpu"))  # Use "cuda" if on GPU space
+    gpt2_model.eval()
+    return tokenizer, gpt2_model
+tokenizer, gpt2_model = load_gpt2()
+# -------------------------------
+# Calculate Perplexity
+# -------------------------------
+def calculate_perplexity(text):
     inputs = tokenizer(text, return_tensors="pt", truncation=True, max_length=512)
     with torch.no_grad():
+        outputs = gpt2_model(**inputs, labels=inputs["input_ids"])
+        loss = outputs.loss
+        perplexity = torch.exp(loss).item()
+    return perplexity
+# -------------------------------
+# Combine Scores
+# -------------------------------
+def final_score(ai_prob, perplexity):
+    if perplexity > 300:
+        perp_score = 0.0
+    elif perplexity < 10:
+        perp_score = 1.0
+    else:
+        perp_score = 1.0 - ((perplexity - 10) / (300 - 10))
+        perp_score = max(0.0, min(1.0, perp_score))
+    final_ai_score = (0.7 * perp_score) + (0.3 * ai_prob)
+    return final_ai_score, perp_score
+# -------------------------------
+# Streamlit UI
+# -------------------------------
+st.set_page_config(page_title="AI Text Detector", page_icon="🤖", layout="centered")
+st.markdown("""
+<h2 style='text-align: center; color: #4CAF50;'>🤖 AI vs Human Text Detector</h2>
+<p style='text-align: center;'>Enter a sentence to check if it was written by a human or generated by AI.</p>
+""", unsafe_allow_html=True)
+user_input = st.text_area("Enter your sentence here:", height=150)
+if st.button("Check"):
+    if user_input.strip() == "":
+        st.warning("Please enter a sentence before submitting.")
+    else:
+        # Logistic Regression Prediction
+        transformed_input = vectorizer.transform([user_input])
+        prediction = model.predict_proba(transformed_input)
+        ai_prob = prediction[0][1]
+        human_prob = prediction[0][0]
+        # Perplexity Score
+        perplexity_score = calculate_perplexity(user_input)
+        # Combined Score
+        final_ai_score, perp_score = final_score(ai_prob, perplexity_score)
+        # # Result Display
+        # st.subheader("🔍 Result:")
+        # if final_ai_score > 0.5:
+        #     st.error("❗ This text is likely **AI-generated**.")
+        # else:
+        #     st.success("✅ This text is likely **Human-written**.")
+        # st.markdown(f"**Logistic Model Confidence:** {ai_prob:.3f} AI vs {human_prob:.3f} Human")
+        # st.markdown(f"**Perplexity Score:** {perplexity_score:.2f}")
+        # st.markdown(f"**Combined AI Score:** {final_ai_score:.3f} (Weighted)")
+        # Interpretation
+        if perplexity_score < 30:
+            st.info("🧠 Low perplexity suggests the text is highly predictable—possibly AI-generated.")
+        elif perplexity_score > 100:
+            st.info("🧠 High perplexity suggests human-like variation or complexity.")