Spaces:

AlyanAkram
/

StealthWriter

Runtime error

App Files Files Community

AlyanAkram commited on Jul 9, 2025

Commit

7c4688e

verified ·

1 Parent(s): d090749

Update detector/custom_model.py

Browse files

Files changed (1) hide show

detector/custom_model.py +9 -10

detector/custom_model.py CHANGED Viewed

@@ -8,36 +8,34 @@ from reportlab.pdfgen import canvas
 from reportlab.lib import colors
 import nltk
-# === Environment (no runtime directory creation) ===
 os.environ["HF_HOME"] = "/tmp/hf_home"
 os.environ["TRANSFORMERS_CACHE"] = "/tmp/hf_home"
 os.environ["NLTK_DATA"] = "/tmp/nltk_data"
-# Append pre-installed punkt path (you must ensure it's there)
 nltk.data.path.append("/tmp/nltk_data")
-# === Model loading: Hugging Face (Remote) vs Local ===
 USE_HF_MODEL = os.getenv("USE_HF_MODEL") == "1"
 if USE_HF_MODEL:
-    hf_token = os.getenv("HF_TOKEN")
-    MODEL_PATH = "AlyanAkram/stealth-roberta"
     tokenizer = RobertaTokenizer.from_pretrained(MODEL_PATH, token=hf_token)
     model = RobertaForSequenceClassification.from_pretrained(MODEL_PATH, token=hf_token)
 else:
-    MODEL_PATH = "./detector/models/roberta-detector"
     tokenizer = RobertaTokenizer.from_pretrained(MODEL_PATH, local_files_only=True)
     model = RobertaForSequenceClassification.from_pretrained(MODEL_PATH, local_files_only=True)
 model.eval().to("cuda" if torch.cuda.is_available() else "cpu")
 device = next(model.parameters()).device
-# === AI classification threshold ===
 AI_THRESHOLD = 0.5
-# === Output reports location (this must already be writable in /tmp) ===
 REPORT_DIR = Path("/tmp/reports")
 def analyze_text(text: str):
     results = []
     paragraphs = [p.strip() for p in text.split("\n") if p.strip()]
@@ -67,6 +65,7 @@ def analyze_text(text: str):
         "results": results
     }
 def generate_pdf_report(results: dict, filename: str) -> str:
     REPORT_DIR.mkdir(exist_ok=True)
     pdf_path = REPORT_DIR / f"{filename}.pdf"

 from reportlab.lib import colors
 import nltk
+# === Environment Setup ===
 os.environ["HF_HOME"] = "/tmp/hf_home"
 os.environ["TRANSFORMERS_CACHE"] = "/tmp/hf_home"
 os.environ["NLTK_DATA"] = "/tmp/nltk_data"
 nltk.data.path.append("/tmp/nltk_data")
+# === Model Source (Hugging Face or Local) ===
 USE_HF_MODEL = os.getenv("USE_HF_MODEL") == "1"
+hf_token = os.getenv("HF_TOKEN")
+MODEL_PATH = "AlyanAkram/stealth-roberta" if USE_HF_MODEL else "./detector/models/roberta-detector"
 if USE_HF_MODEL:
+    print("🔐 Loading model from Hugging Face Hub...")
     tokenizer = RobertaTokenizer.from_pretrained(MODEL_PATH, token=hf_token)
     model = RobertaForSequenceClassification.from_pretrained(MODEL_PATH, token=hf_token)
 else:
+    print("📁 Loading model from local files...")
     tokenizer = RobertaTokenizer.from_pretrained(MODEL_PATH, local_files_only=True)
     model = RobertaForSequenceClassification.from_pretrained(MODEL_PATH, local_files_only=True)
 model.eval().to("cuda" if torch.cuda.is_available() else "cpu")
 device = next(model.parameters()).device
+# === Constants ===
 AI_THRESHOLD = 0.5
 REPORT_DIR = Path("/tmp/reports")
+# === Main Analysis Function ===
 def analyze_text(text: str):
     results = []
     paragraphs = [p.strip() for p in text.split("\n") if p.strip()]
         "results": results
     }
+# === PDF Report Generator ===
 def generate_pdf_report(results: dict, filename: str) -> str:
     REPORT_DIR.mkdir(exist_ok=True)
     pdf_path = REPORT_DIR / f"{filename}.pdf"