Spaces:

RedJul2110
/

MyfirstAI

Running

App Files Files Community

RedJul2110 commited on 3 days ago

Commit

2b756ba

verified ·

1 Parent(s): 49f91a2

Update app.py

Browse files

Files changed (1) hide show

app.py +55 -48

app.py CHANGED Viewed

@@ -40,12 +40,12 @@ WISSEN_FILE = os.path.join(DATA_DIR, "wissen.json")
 CHAT_FILE = os.path.join(DATA_DIR, "chat_history.json")
 LOG_FILE = os.path.join(DATA_DIR, "ai_log.txt")
-FALLBACK_NO_INFO = "Dazu habe ich nichts in meiner Datenbank."
 USE_QWEN_POLISH = True
 DB_DIRECT_MATCH_THRESHOLD = 0.88
-DB_FACT_MATCH_THRESHOLD = 0.58
 # =========================================================
 # GLOBALE VARIABLEN
@@ -194,6 +194,16 @@ def looks_like_factual_question(text):
         "welche", "welcher", "welches", "nenn", "nenne", "erklaer", "erklär"
     ))
 # =========================================================
 # KNOWLEDGE / DATENBANK
 # =========================================================
@@ -593,8 +603,8 @@ def save_link_as_knowledge(url, thema="", kategorie="web"):
         log_error("extract_webpage_text", e)
         return False, f"❌ Link konnte nicht gelesen werden: {e}"
-    if not raw_text:
-        return False, "❌ Auf der Seite konnte kein Text gefunden werden."
     summary = summarize_web_text(title, raw_text)
     if not summary or len(summary.strip()) < 30:
@@ -669,7 +679,7 @@ def init_model_if_needed():
     dtype = torch.float16 if device.type == "cuda" else torch.float32
     model = AutoModelForCausalLM.from_pretrained(
         MODEL_NAME,
-        dtype=dtype,
         low_cpu_mem_usage=True
     )
     model.to(device)
@@ -755,20 +765,20 @@ def compose_draft_from_facts(facts):
     if not facts:
         return ""
-    answers = []
-    for item in facts:
-        ans = item.get("antwort", "").strip()
-        if ans and ans not in answers:
-            answers.append(ans)
-    if not answers:
         return ""
-    random.shuffle(answers)
-    take = min(len(answers), random.randint(1, 3))
-    if take == 1:
-        return answers[0]
-    return " ".join(answers[:take])
 def polish_with_model(user_message, draft, facts, history_context=""):
     if not USE_QWEN_POLISH:
@@ -781,18 +791,20 @@ def polish_with_model(user_message, draft, facts, history_context=""):
     for idx, item in enumerate(facts, 1):
         fact_lines.append(
             f"{idx}. Thema: {item.get('frage', '')}\n"
-            f"   Text: {item.get('antwort', '')}"
         )
-    fact_block = "\n".join(fact_lines)
     messages = [
         {
             "role": "system",
             "content": (
-                "Du bist nur ein Grammatik-, Formulierungs- und Antwortassistent. "
-                "Du darfst die gespeicherten Fakten als Grundlage nehmen und sie natürlich umformulieren. "
-                "Wenn es passt, darfst du auch passende allgemeine Informationen ergänzen, "
-                "aber du darfst keine gegenteiligen oder erfundenen Fakten einbauen."
             )
         },
         {
@@ -800,17 +812,23 @@ def polish_with_model(user_message, draft, facts, history_context=""):
             "content": (
                 f"Frage: {user_message}\n\n"
                 f"Kontext: {history_context}\n\n"
-                f"Gespeicherte Fakten:\n{fact_block}\n\n"
-                f"Rohentwurf:\n{draft}\n\n"
-                "Aufgabe: Formuliere den Rohentwurf natürlich, kurz und fehlerfrei auf Deutsch um. "
-                "Die Antwort soll zur Nutzerfrage passen und nicht immer gleich klingen. "
-                "Füge nur passende zusätzliche Hinweise hinzu."
             )
         }
     ]
     try:
-        out = model_generate(messages, max_new_tokens=150, temperature=0.6, do_sample=True)
         if not out:
             return draft
         return out.strip()
@@ -842,7 +860,7 @@ def general_chat_reply(user_message, history_context=""):
     ]
     try:
-        out = model_generate(messages, max_new_tokens=140, temperature=0.75, do_sample=True)
         out = (out or "").strip()
         return out if out else "Dazu habe ich gerade keine sichere Antwort."
     except Exception as e:
@@ -852,27 +870,16 @@ def general_chat_reply(user_message, history_context=""):
 def generate_reply(user_message, history_context=""):
     query = f"{user_message} {history_context}".strip()
-    exact = exact_db_answer(user_message)
-    if exact:
-        facts = find_relevant_facts(query, max_items=6)
-        reply = polish_with_model(user_message, exact, facts, history_context)
-        return reply if reply else exact
-    fuzzy_direct = best_db_answer(user_message, threshold=DB_DIRECT_MATCH_THRESHOLD)
-    if fuzzy_direct:
-        facts = find_relevant_facts(query, max_items=6)
-        reply = polish_with_model(user_message, fuzzy_direct, facts, history_context)
-        return reply if reply else fuzzy_direct
     facts = find_relevant_facts(query, max_items=6)
-    if facts:
-        draft = compose_draft_from_facts(facts)
-        if not draft:
-            return general_chat_reply(user_message, history_context)
-        reply = polish_with_model(user_message, draft, facts, history_context)
-        return reply if reply else draft
     return general_chat_reply(user_message, history_context)
 # =========================================================
@@ -1020,7 +1027,7 @@ def erzeuge_gradio_app():
         )
         gr.Markdown("# 🤖 Privates KI Kontrollzentrum")
-        gr.Markdown("Die KI nutzt zuerst die Datenbank. Qwen darf auch ohne Datenbank antworten.")
         with gr.Tab("📊 Status"):
             status_text = gr.Textbox(label="Systembericht", lines=16, interactive=False)

 CHAT_FILE = os.path.join(DATA_DIR, "chat_history.json")
 LOG_FILE = os.path.join(DATA_DIR, "ai_log.txt")
+FALLBACK_NO_INFO = "Dazu habe ich gerade keine sichere Antwort."
 USE_QWEN_POLISH = True
 DB_DIRECT_MATCH_THRESHOLD = 0.88
+DB_FACT_MATCH_THRESHOLD = 0.62
 # =========================================================
 # GLOBALE VARIABLEN
         "welche", "welcher", "welches", "nenn", "nenne", "erklaer", "erklär"
     ))
+def compress_text(text, max_chars=220):
+    text = (text or "").strip()
+    if not text:
+        return ""
+    text = re.sub(r"\s+", " ", text)
+    if len(text) <= max_chars:
+        return text
+    cut = text[:max_chars].rsplit(" ", 1)[0].strip()
+    return cut + "..."
 # =========================================================
 # KNOWLEDGE / DATENBANK
 # =========================================================
         log_error("extract_webpage_text", e)
         return False, f"❌ Link konnte nicht gelesen werden: {e}"
+    if not raw_text or len(raw_text) < 50:
+        return False, "❌ Auf der Seite konnte kein ausreichender Text gefunden werden."
     summary = summarize_web_text(title, raw_text)
     if not summary or len(summary.strip()) < 30:
     dtype = torch.float16 if device.type == "cuda" else torch.float32
     model = AutoModelForCausalLM.from_pretrained(
         MODEL_NAME,
+        torch_dtype=dtype,
         low_cpu_mem_usage=True
     )
     model.to(device)
     if not facts:
         return ""
+    pieces = []
+    for item in facts[:4]:
+        topic = (item.get("frage", "") or "").strip()
+        ans = compress_text(item.get("antwort", ""), 220)
+        if topic and ans:
+            pieces.append(f"{topic}: {ans}")
+        elif ans:
+            pieces.append(ans)
+    if not pieces:
         return ""
+    random.shuffle(pieces)
+    return "\n".join(pieces)
 def polish_with_model(user_message, draft, facts, history_context=""):
     if not USE_QWEN_POLISH:
     for idx, item in enumerate(facts, 1):
         fact_lines.append(
             f"{idx}. Thema: {item.get('frage', '')}\n"
+            f"   Zusatzwissen: {compress_text(item.get('antwort', ''), 260)}"
         )
+    fact_block = "\n".join(fact_lines) if fact_lines else "Keine zusätzlichen Fakten."
     messages = [
         {
             "role": "system",
             "content": (
+                "Du bist ein intelligenter KI-Assistent. "
+                "Beantworte die Frage hauptsächlich mit deinem eigenen Wissen. "
+                "Nutze die gespeicherten Fakten nur als zusätzliche Information, wenn sie passen. "
+                "Baue diese sinnvoll in deine Antwort ein, aber kopiere sie nicht. "
+                "Schreibe alles in eigenen Worten. "
+                "Die Antwort muss direkt zur Frage passen, natürlich klingen und hilfreich sein."
             )
         },
         {
             "content": (
                 f"Frage: {user_message}\n\n"
                 f"Kontext: {history_context}\n\n"
+                f"Zusätzliche Fakten (optional):\n{fact_block}\n\n"
+                f"Notizen / Ausgangspunkt:\n{draft if draft else 'Keine festen Vorgaben. Antworte frei, aber passend zur Frage.'}\n\n"
+                "Aufgabe:\n"
+                "- Beantworte die Frage vollständig\n"
+                "- Nutze dein eigenes Wissen als Hauptquelle\n"
+                "- Nutze die Fakten nur, wenn sie wirklich passen\n"
+                "- Ergänze Informationen sinnvoll\n"
+                "- Schreibe alles neu und verständlich\n"
+                "- Kein Copy-Paste\n"
+                "- Keine irrelevanten Infos\n"
+                "- Keine Rohdaten, sondern eine natürliche Antwort"
             )
         }
     ]
     try:
+        out = model_generate(messages, max_new_tokens=160, temperature=0.65, do_sample=True)
         if not out:
             return draft
         return out.strip()
     ]
     try:
+        out = model_generate(messages, max_new_tokens=140, temperature=0.78, do_sample=True)
         out = (out or "").strip()
         return out if out else "Dazu habe ich gerade keine sichere Antwort."
     except Exception as e:
 def generate_reply(user_message, history_context=""):
     query = f"{user_message} {history_context}".strip()
     facts = find_relevant_facts(query, max_items=6)
+    # Qwen bleibt Hauptdenker; DB ist nur Zusatzwissen.
+    draft = compose_draft_from_facts(facts)
+    reply = polish_with_model(user_message, draft, facts, history_context)
+    if reply:
+        return reply
+    # Wenn Modell nicht verfügbar oder leer antwortet, trotzdem nicht stumpf DB ausgeben
     return general_chat_reply(user_message, history_context)
 # =========================================================
         )
         gr.Markdown("# 🤖 Privates KI Kontrollzentrum")
+        gr.Markdown("Die KI nutzt zuerst die Datenbank. Qwen bleibt der Hauptdenker und ergänzt Fakten passend.")
         with gr.Tab("📊 Status"):
             status_text = gr.Textbox(label="Systembericht", lines=16, interactive=False)