Spaces:

marvin-cusm-chatbot
/

champ-chatbot

Paused

qyle commited on Feb 18

Commit

e9e1684

verified ·

1 Parent(s): e346a35

disabling language detection

Files changed (1) hide show

classes/prompt_sanitizer.py CHANGED Viewed

@@ -102,20 +102,23 @@ class PromptSanitizer:
             return text
         # 1. Automatic Language Detection
-        try:
-            detected_lang = detect(text)
-            # Presidio needs to know if we are using 'en' or 'fr'
-            # If it detects something else, we default to 'en'
-            lang = detected_lang if detected_lang in ["en", "fr"] else "en"
-        except Exception:
-            lang = "en"
-        # 1. Detect PII
         results = self.analyzer.analyze(
             text=text, entities=self.target_entities, language=lang
         )
-        # 2. Redact PII
         anonymized_result = self.anonymizer.anonymize(
             text=text,
             analyzer_results=results,  # pyright: ignore[reportArgumentType]

             return text
         # 1. Automatic Language Detection
+        # This step would add a lot of overhead to the LLM calls (almost 1s).
+        # try:
+        #     detected_lang = detect(text)
+        #     # Presidio needs to know if we are using 'en' or 'fr'
+        #     # If it detects something else, we default to 'en'
+        #     lang = detected_lang if detected_lang in ["en", "fr"] else "en"
+        # except Exception:
+        #     lang = "en"
+        lang = "en"
+        # 2. Detect PII
         results = self.analyzer.analyze(
             text=text, entities=self.target_entities, language=lang
         )
+        # 3. Redact PII
         anonymized_result = self.anonymizer.anonymize(
             text=text,
             analyzer_results=results,  # pyright: ignore[reportArgumentType]