Spaces:

martinbrahm
/

Call_Agent_API

Paused

App Files Files Community

martinbrahm commited on Dec 22, 2025

Commit

a0a7178

verified ·

1 Parent(s): 45abf5d

Upload main.py

Browse files

Files changed (1) hide show

main.py +51 -70

main.py CHANGED Viewed

@@ -46,7 +46,7 @@ async def startup():
 # --- HELPER: STEMMING & TOKENIZING ---
 def get_stem(word):
-    # Einfaches Stemming (Wortstamm finden)
     w = word.lower().strip()
     suffixes = ["ungen", "innen", "keit", "sch", "ern", "en", "er", "es", "st", "te", "e", "s", "t"]
     for end in suffixes:
@@ -55,7 +55,7 @@ def get_stem(word):
     return w
 def tokenize(text):
-    # Zerlegt Text in saubere Wort-Liste (ohne Punkt/Komma)
     clean_text = re.sub(r'[^\w\s]', '', text.lower())
     return [get_stem(w) for w in clean_text.split() if w]
@@ -82,39 +82,7 @@ def parse_vapi_request(data):
     return tool_call_id, args
 # ==========================================
-# TOOL 1: VERFÜGBARKEIT
-# ==========================================
-@app.post("/check_availability")
-async def check_availability(request: Request):
-    data = await request.json()
-    tool_call_id, _ = parse_vapi_request(data)
-    today = datetime.now().strftime("%Y-%m-%d")
-    status = "available"
-    instruction = "Normal arbeiten"
-    try:
-        if db:
-            rules = db.collection(COLLECTION_RULES).where("active", "==", True).stream()
-            for r in rules:
-                rd = r.to_dict()
-                if rd.get('start_date') <= today <= rd.get('end_date'):
-                    print(f"🛑 REGEL AKTIV: {rd.get('name')}")
-                    if "ferien" in rd.get('name', '').lower():
-                        status = "limited"
-                    else:
-                        status = "unavailable"
-                    instruction = rd.get('instruction_text')
-                    break
-    except Exception as e:
-        print(f"❌ ERROR CHECK: {e}")
-    return {
-        "results": [{"toolCallId": tool_call_id, "result": {"status": status, "instruction": instruction}}]
-    }
-# ==========================================
-# TOOL 2: SUCHE (KEYWORD ROUTING)
 # ==========================================
 @app.post("/search")
 async def search(request: Request):
@@ -123,20 +91,27 @@ async def search(request: Request):
     query = args.get("search_query") or args.get("query") or data.get("search_query")
     print(f"🔎 QUERY: '{query}'")
     answer_text = "Dazu habe ich leider keine Informationen in meiner Datenbank."
     if query:
-        # Stop-Wörter: Diese ignorieren wir komplett, damit sie keine falschen Hits erzeugen
         STOP_WORDS = [
-            "hallo", "guten", "tag", "moin", "bitte", "danke", "frage", "sagen",
-            "kannst", "du", "mir", "was", "ist", "wer", "wie", "wo", "wann",
-            "anbieten", "machen", "tun", "geben", "helfen", "möchte", "will", "haben"
         ]
-        # 1. Query zerlegen
         query_stems = [w for w in tokenize(query) if w not in STOP_WORDS and len(w) > 2]
-        print(f"🧐 Tokens: {query_stems}")
         found = False
@@ -148,47 +123,41 @@ async def search(request: Request):
                 score = 0
                 hits = []
-                # Dokument zerlegen
-                title_stems = tokenize(doc.get("question", ""))
-                keyword_stems = tokenize(", ".join(doc.get("keywords", [])))
-                content_stems = tokenize(doc.get("answer", "")) # Inhalt ist jetzt unwichtig
                 for q_stem in query_stems:
                     # 1. KEYWORD MATCH (Der "Router") -> 100 Punkte!
-                    if q_stem in keyword_stems:
                         score += 100
                         hits.append(f"KEYWORD '{q_stem}'")
                     # 2. TITEL MATCH -> 50 Punkte
-                    elif q_stem in title_stems:
                         score += 50
                         hits.append(f"TITLE '{q_stem}'")
-                    # 3. CONTENT MATCH -> Nur 5 Punkte (reicht alleine nicht)
-                    elif q_stem in content_stems:
-                        score += 5
-                        # hits.append("content") # Loggen wir nicht, spammt sonst
                 if score > best_score:
                     best_score = score
                     best_doc = doc
-                    if score > 10:
-                        print(f"   Kandidat: {score} Pkt ({hits}) -> {doc.get('question')[:40]}...")
-            # SCHWELLE: 40 PUNKTE
-            # Ein Keyword-Treffer (100) gewinnt immer.
-            # Ein Titel-Treffer (50) gewinnt immer.
-            # Nur Fließtext (5 Pkt pro Wort) braucht mind. 8 Treffer -> Unwahrscheinlich bei falschen Dokus.
-            if best_doc and best_score >= 40:
                 print(f"🏆 GEWINNER ({best_score} Pkt): {best_doc.get('question')}")
                 answer_text = best_doc.get("answer")
                 found = True
             else:
-                 print(f"⚠️ Kein eindeutiger Treffer (Max Score: {best_score})")
-        # --- INBOX LOGIK ---
         if not found and db:
             print("📥 Ab in die Inbox.")
             db.collection(COLLECTION_INBOX).add({
@@ -197,14 +166,26 @@ async def search(request: Request):
                 "status": "open"
             })
-    return {
-        "results": [{"toolCallId": tool_call_id, "result": answer_text}]
-    }
-@app.post("/vapi-incoming")
-async def dummy_incoming(request: Request):
-    return {"status": "ok"}
 @app.get("/")
-def home():
-    return {"status": "Online", "docs": len(KNOWLEDGE_CACHE)}

 # --- HELPER: STEMMING & TOKENIZING ---
 def get_stem(word):
+    # Einfaches Stemming
     w = word.lower().strip()
     suffixes = ["ungen", "innen", "keit", "sch", "ern", "en", "er", "es", "st", "te", "e", "s", "t"]
     for end in suffixes:
     return w
 def tokenize(text):
+    # Entfernt Sonderzeichen und zerlegt in Stämme
     clean_text = re.sub(r'[^\w\s]', '', text.lower())
     return [get_stem(w) for w in clean_text.split() if w]
     return tool_call_id, args
 # ==========================================
+# TOOL: SUCHE (OPTIMIERT)
 # ==========================================
 @app.post("/search")
 async def search(request: Request):
     query = args.get("search_query") or args.get("query") or data.get("search_query")
     print(f"🔎 QUERY: '{query}'")
     answer_text = "Dazu habe ich leider keine Informationen in meiner Datenbank."
     if query:
+        # --- STOP WÖRTER LISTE (MASSIV ERWEITERT) ---
+        # Diese Wörter werden komplett ignoriert und geben 0 Punkte.
         STOP_WORDS = [
+            # Kommunikation
+            "hallo", "guten", "tag", "moin", "bitte", "danke", "frage", "sagen", "kannst", "du", "mir",
+            "was", "ist", "wer", "wie", "wo", "wann", "erzähl", "über", "möchte", "will", "haben",
+            # Artikel & Füllwörter (DIE KILLER!)
+            "der", "die", "das", "dem", "den", "des", "ein", "eine", "einer", "eines",
+            "im", "in", "von", "zu", "bei", "mit", "für", "auf", "aus", "um", "und", "oder",
+            # Generische Business-Wörter (die alles matchen würden)
+            "anbieten", "machen", "tun", "geben", "helfen", "unterstützen", "bieten",
+            "firma", "unternehmen", "gmbh", "produkt", "system", "plattform"
+            # "plattform" ist hier Stop-Wort, damit "Kosten der Plattform" nicht beim "Plattform-Feature" landet!
         ]
+        # 1. Query bereinigen
         query_stems = [w for w in tokenize(query) if w not in STOP_WORDS and len(w) > 2]
+        print(f"🧐 Relevante Tokens: {query_stems}")
         found = False
                 score = 0
                 hits = []
+                # Dokument Inhalte tokenizen
+                # WICHTIG: Keywords zählen wir doppelt so stark, wenn sie exakt passen
+                doc_keywords = [get_stem(k) for k in doc.get("keywords", [])]
+                doc_title_stems = tokenize(doc.get("question", ""))
                 for q_stem in query_stems:
                     # 1. KEYWORD MATCH (Der "Router") -> 100 Punkte!
+                    if q_stem in doc_keywords:
                         score += 100
                         hits.append(f"KEYWORD '{q_stem}'")
                     # 2. TITEL MATCH -> 50 Punkte
+                    elif q_stem in doc_title_stems:
                         score += 50
                         hits.append(f"TITLE '{q_stem}'")
+                    # (Wir ignorieren den Fließtext für das Scoring, um Zufallstreffer zu vermeiden)
                 if score > best_score:
                     best_score = score
                     best_doc = doc
+                    if score > 0:
+                        print(f"   Kandidat: {score} Pkt ({hits}) -> {doc.get('question')[:30]}...")
+            # SCHWELLE: 50 PUNKTE
+            # Es muss mindestens ein Titel-Treffer (50) oder Keyword (100) sein.
+            if best_doc and best_score >= 50:
                 print(f"🏆 GEWINNER ({best_score} Pkt): {best_doc.get('question')}")
                 answer_text = best_doc.get("answer")
                 found = True
             else:
+                 print(f"⚠️ Kein Treffer (Max Score: {best_score})")
+        # --- INBOX ---
         if not found and db:
             print("📥 Ab in die Inbox.")
             db.collection(COLLECTION_INBOX).add({
                 "status": "open"
             })
+    return {"results": [{"toolCallId": tool_call_id, "result": answer_text}]}
+# --- ANDERE ENDPOINTS ---
+@app.post("/check_availability")
+async def check_availability(request: Request):
+    data = await request.json()
+    tool_call_id, _ = parse_vapi_request(data)
+    today = datetime.now().strftime("%Y-%m-%d")
+    status, instruction = "available", "Normal arbeiten"
+    if db:
+        rules = db.collection(COLLECTION_RULES).where("active", "==", True).stream()
+        for r in rules:
+            rd = r.to_dict()
+            if rd.get('start_date') <= today <= rd.get('end_date'):
+                status = "limited" if "ferien" in rd.get('name', '').lower() else "unavailable"
+                instruction = rd.get('instruction_text')
+                break
+    return {"results": [{"toolCallId": tool_call_id, "result": {"status": status, "instruction": instruction}}]}
+@app.post("/vapi-incoming")
+async def dummy_incoming(request: Request): return {"status": "ok"}
 @app.get("/")
+def home(): return {"status": "Online"}