Spaces:

PraneshJs
/

Redis-AzureAI

Sleeping

App Files Files Community

PraneshJs commited on Sep 18, 2025

Commit

142282b

verified ·

1 Parent(s): cc33aed

improved the embedding for languages

Browse files

Files changed (1) hide show

app.py +169 -72

app.py CHANGED Viewed

@@ -1,4 +1,5 @@
 import os
 import gradio as gr
 import redis
 import numpy as np
@@ -7,122 +8,215 @@ from datetime import timedelta
 from openai import AzureOpenAI
 from sentence_transformers import SentenceTransformer
-# Redis Cloud connection
 redis_client = redis.Redis(
-    host="redis-12628.c14.us-east-1-2.ec2.redns.redis-cloud.com",
-    port=12628,
     decode_responses=True,
-    username="default",
-    password=os.getenv("REDIS_PASSWORD")
 )
-# Azure OpenAI client
 client = AzureOpenAI(
-    api_key=os.getenv("AZURE_OPENAI_API_KEY").strip(),
-    api_version="2025-01-01-preview",
-    azure_endpoint=os.getenv("AZURE_OPENAI_ENDPOINT").strip()
 )
-CHAT_DEPLOYMENT = "gpt-4.1"
-# 🚀 Super lightweight multilingual embedding model
 embedder = SentenceTransformer("intfloat/multilingual-e5-small")
-# Cache expiration: 2 days (in seconds)
-CACHE_TTL = int(timedelta(days=2).total_seconds())
-# Helper: get embedding
-def get_embedding(text):
-    return embedder.encode(text, convert_to_numpy=True).astype(np.float32)
-# Helper: cosine similarity
-def cosine_similarity(vec1, vec2):
-    return float(np.dot(vec1, vec2) / (np.linalg.norm(vec1) * np.linalg.norm(vec2)))
-def search_cache(user_id, user_input, threshold=0.9):  # stricter threshold
-    query_vec = get_embedding(user_input)
-    best_key, best_score, best_val = None, -1, None
     cache_key = f"cache:{user_id}"
-    for key, val in redis_client.hgetall(cache_key).items():
         entry = json.loads(val)
         vec = np.array(entry["embedding"], dtype=np.float32)
         score = cosine_similarity(query_vec, vec)
         if score > best_score:
-            best_score, best_key, best_val = score, key, entry["output"]
-    if best_score >= threshold:
-        return best_val
     return None
-def store_cache(user_id, user_input, output):
-    vec = get_embedding(user_input).tolist()
-    cache_key = f"cache:{user_id}"
-    # Store extra context: include language keyword if present
-    context_input = user_input.lower()
-    if "java" in context_input:
-        context_input = "JAVA: " + context_input
-    elif "python" in context_input:
-        context_input = "PYTHON: " + context_input
-    elif "c++" in context_input or "cpp" in context_input:
-        context_input = "CPP: " + context_input
-    elif "c " in context_input:
-        context_input = "C: " + context_input
-    redis_client.hset(cache_key, context_input, json.dumps({
-        "embedding": vec,
-        "output": output
-    }))
-    redis_client.expire(cache_key, CACHE_TTL)
-def clear_user_cache(user_id):
-    cache_key = f"cache:{user_id}"
-    redis_client.delete(cache_key)
-def view_user_cache(user_id):
     cache_key = f"cache:{user_id}"
     entries = redis_client.hgetall(cache_key)
     if not entries:
         return "⚠️ No cache stored."
     lines = []
-    for q, val in entries.items():
-        entry = json.loads(val)
-        lines.append(f"**Q:** {q}\n**A:** {entry['output']}")
     return "\n\n---\n\n".join(lines)
-def chat_with_ai(user_id, user_input):
-    if not user_input:
-        return "Please type something."
-    # 🔍 Check Redis semantic cache
     cached = search_cache(user_id, user_input)
     if cached:
         return f"[From Redis] {cached}"
-    # Otherwise query Azure OpenAI
     response = client.chat.completions.create(
         model=CHAT_DEPLOYMENT,
         messages=[{"role": "user", "content": user_input}],
         temperature=0.8,
-        max_tokens=700
     )
     output = response.choices[0].message.content.strip()
-    # 💾 Save with embedding in Redis
     store_cache(user_id, user_input, output)
     return f"[From OpenAI] {output}"
 # Gradio UI
-with gr.Blocks(title="Azure OpenAI + Redis Cloud Chat") as demo:
-    gr.Markdown("# 💬 Azure OpenAI + Redis Cloud (Semantic Cache, Multi-User, Auto Clean)")
     user_id_state = gr.State("")
     with gr.Row():
         user_id_input = gr.Textbox(label="Enter Username (only once)", placeholder="Your username")
         save_user = gr.Button("✅ Save Username")
     with gr.Row():
         chatbot = gr.Chatbot(type="messages")
@@ -132,11 +226,14 @@ with gr.Blocks(title="Azure OpenAI + Redis Cloud Chat") as demo:
         send = gr.Button("Send")
     with gr.Row():
-        clear = gr.Button("🧹 Clear Cache")
-        view = gr.Button("👀 View Cache")
         cache_output = gr.Markdown("")
-    def set_user_id(uid):
         return uid, f"✅ Username set as **{uid}**"
     def respond(message, history, user_id):
@@ -158,11 +255,11 @@ with gr.Blocks(title="Azure OpenAI + Redis Cloud Chat") as demo:
             return "⚠️ Please set username first!"
         return view_user_cache(user_id)
-    save_user.click(set_user_id, user_id_input, [user_id_state, cache_output])
     send.click(respond, [msg, chatbot, user_id_state], [chatbot, msg])
     msg.submit(respond, [msg, chatbot, user_id_state], [chatbot, msg])
     clear.click(clear_cache_ui, [user_id_state, chatbot], [chatbot, cache_output])
     view.click(view_cache_ui, user_id_state, cache_output)
 if __name__ == "__main__":
-    demo.launch(server_name="0.0.0.0", server_port=7860, debug=True, pwa=True)

 import os
+import re
 import gradio as gr
 import redis
 import numpy as np
 from openai import AzureOpenAI
 from sentence_transformers import SentenceTransformer
+# -----------------------
+# Configuration
+# -----------------------
+REDIS_HOST = "redis-12628.c14.us-east-1-2.ec2.redns.redis-cloud.com"
+REDIS_PORT = 12628
+REDIS_USER = "default"
+REDIS_PASSWORD = os.getenv("REDIS_PASSWORD")
+AZURE_API_KEY = os.getenv("AZURE_OPENAI_API_KEY", "").strip()
+AZURE_ENDPOINT = os.getenv("AZURE_OPENAI_ENDPOINT", "").strip()
+AZURE_API_VERSION = "2025-01-01-preview"
+CHAT_DEPLOYMENT = "gpt-4.1"
+# Cache TTL (2 days)
+CACHE_TTL = int(timedelta(days=2).total_seconds())
+# Matching thresholds
+PRIMARY_THRESHOLD = 0.90   # for same-language matches
+FALLBACK_THRESHOLD = 0.95  # for language-agnostic fallback (very strict)
+# -----------------------
+# Clients / Models
+# -----------------------
 redis_client = redis.Redis(
+    host=REDIS_HOST,
+    port=REDIS_PORT,
     decode_responses=True,
+    username=REDIS_USER,
+    password=REDIS_PASSWORD,
 )
 client = AzureOpenAI(
+    api_key=AZURE_API_KEY,
+    api_version=AZURE_API_VERSION,
+    azure_endpoint=AZURE_ENDPOINT,
 )
+# Embedding model (multilingual, small & strong)
 embedder = SentenceTransformer("intfloat/multilingual-e5-small")
+# -----------------------
+# Helpers
+# -----------------------
+def detect_language_tag(text: str):
+    """Return a language tag string (lowercase) or None."""
+    t = text.lower()
+    patterns = [
+        (r'\bjava\b', "java"),
+        (r'\bpython\b', "python"),
+        (r'\b(c\+\+|cpp)\b', "cpp"),
+        (r'\bc#\b|\bcsharp\b', "csharp"),
+        (r'\bjavascript\b|\bjs\b', "javascript"),
+        (r'\b(go|golang)\b', "go"),
+        (r'\bruby\b', "ruby"),
+        (r'\bphp\b', "php"),
+        (r'\bscala\b', "scala"),
+        (r'\br\b', "r"),
+        # C detection is tricky; look for " in c", " c language", or standalone " c "
+        (r'\b in c\b|\bc language\b|\b c \b', "c"),
+    ]
+    for pat, tag in patterns:
+        if re.search(pat, t):
+            return tag
+    return None
+def build_embedding_input(text: str, lang_tag: str | None):
+    """Create the text to embed: include language tag prefix if present."""
+    if lang_tag:
+        return f"{lang_tag.upper()}: {text}"
+    return text
+def get_embedding(text: str) -> np.ndarray:
+    vec = embedder.encode(text, convert_to_numpy=True)
+    return vec.astype(np.float32)
+def cosine_similarity(vec1: np.ndarray, vec2: np.ndarray) -> float:
+    # safe guard against zero vectors
+    n1 = np.linalg.norm(vec1)
+    n2 = np.linalg.norm(vec2)
+    if n1 == 0 or n2 == 0:
+        return 0.0
+    return float(np.dot(vec1, vec2) / (n1 * n2))
+# -----------------------
+# Cache functions
+# -----------------------
+def store_cache(user_id: str, user_input: str, output: str):
+    lang = detect_language_tag(user_input)
+    embed_text = build_embedding_input(user_input, lang)
+    vec = get_embedding(embed_text).tolist()
     cache_key = f"cache:{user_id}"
+    store_key = (f"{lang}:" + user_input) if lang else user_input
+    payload = {
+        "orig": user_input,
+        "embedding": vec,
+        "output": output,
+        "lang": lang,
+    }
+    redis_client.hset(cache_key, store_key, json.dumps(payload))
+    redis_client.expire(cache_key, CACHE_TTL)
+def search_cache(user_id: str, user_input: str, primary_threshold=PRIMARY_THRESHOLD, fallback_threshold=FALLBACK_THRESHOLD):
+    cache_key = f"cache:{user_id}"
+    entries = redis_client.hgetall(cache_key)
+    if not entries:
+        return None
+    # detect language and make embedding with same prefix logic
+    detected_lang = detect_language_tag(user_input)
+    query_embed_text = build_embedding_input(user_input, detected_lang)
+    query_vec = get_embedding(query_embed_text)
+    # 1) Try same-language matches (if language detected)
+    best_score = -1.0
+    best_output = None
+    if detected_lang:
+        for _, val in entries.items():
+            entry = json.loads(val)
+            if entry.get("lang") != detected_lang:
+                continue
+            vec = np.array(entry["embedding"], dtype=np.float32)
+            score = cosine_similarity(query_vec, vec)
+            if score > best_score:
+                best_score, best_output = score, entry["output"]
+        if best_score >= primary_threshold:
+            return best_output
+    # 2) Try language-agnostic entries (lang == None)
+    best_score = -1.0
+    best_output = None
+    for _, val in entries.items():
         entry = json.loads(val)
+        if entry.get("lang") is not None:
+            continue
         vec = np.array(entry["embedding"], dtype=np.float32)
         score = cosine_similarity(query_vec, vec)
         if score > best_score:
+            best_score, best_output = score, entry["output"]
+    if best_score >= fallback_threshold:
+        return best_output
+    # 3) Final fallback: search any language but require very high similarity
+    best_score = -1.0
+    best_output = None
+    for _, val in entries.items():
+        entry = json.loads(val)
+        vec = np.array(entry["embedding"], dtype=np.float32)
+        score = cosine_similarity(query_vec, vec)
+        if score > best_score:
+            best_score, best_output = score, entry["output"]
+    if best_score >= fallback_threshold:
+        return best_output
     return None
+def clear_user_cache(user_id: str):
+    redis_client.delete(f"cache:{user_id}")
+def view_user_cache(user_id: str):
     cache_key = f"cache:{user_id}"
     entries = redis_client.hgetall(cache_key)
     if not entries:
         return "⚠️ No cache stored."
     lines = []
+    for k, v in entries.items():
+        entry = json.loads(v)
+        lang = entry.get("lang") or "general"
+        q = entry.get("orig", k)
+        a = entry.get("output", "")
+        lines.append(f"**Lang:** {lang}\n**Q:** {q}\n**A:** {a}")
     return "\n\n---\n\n".join(lines)
+# -----------------------
+# Chat logic
+# -----------------------
+def chat_with_ai(user_id: str, user_input: str):
+    if not user_input or not user_id:
+        return "Please set a username and type something."
+    # 1) semantic cache search (language-aware)
     cached = search_cache(user_id, user_input)
     if cached:
         return f"[From Redis] {cached}"
+    # 2) fallback to Azure OpenAI
     response = client.chat.completions.create(
         model=CHAT_DEPLOYMENT,
         messages=[{"role": "user", "content": user_input}],
         temperature=0.8,
+        max_tokens=700,
     )
     output = response.choices[0].message.content.strip()
+    # store with language-aware embedding
     store_cache(user_id, user_input, output)
     return f"[From OpenAI] {output}"
+# -----------------------
 # Gradio UI
+# -----------------------
+with gr.Blocks(title="Azure OpenAI + Redis Cloud Chat (Lang-aware)") as demo:
+    gr.Markdown("# 💬 Azure OpenAI + Redis Cloud (Language-aware Semantic Cache)")
     user_id_state = gr.State("")
     with gr.Row():
         user_id_input = gr.Textbox(label="Enter Username (only once)", placeholder="Your username")
         save_user = gr.Button("✅ Save Username")
+        user_status = gr.Markdown("")
     with gr.Row():
         chatbot = gr.Chatbot(type="messages")
         send = gr.Button("Send")
     with gr.Row():
+        clear = gr.Button("🧹 Clear My Cache")
+        view = gr.Button("👀 View My Cache")
         cache_output = gr.Markdown("")
+    def set_user_id(uid: str):
+        uid = uid.strip()
+        if not uid:
+            return "", "⚠️ Please enter a non-empty username."
         return uid, f"✅ Username set as **{uid}**"
     def respond(message, history, user_id):
             return "⚠️ Please set username first!"
         return view_user_cache(user_id)
+    save_user.click(set_user_id, user_id_input, [user_id_state, user_status])
     send.click(respond, [msg, chatbot, user_id_state], [chatbot, msg])
     msg.submit(respond, [msg, chatbot, user_id_state], [chatbot, msg])
     clear.click(clear_cache_ui, [user_id_state, chatbot], [chatbot, cache_output])
     view.click(view_cache_ui, user_id_state, cache_output)
 if __name__ == "__main__":
+    demo.launch(server_name="0.0.0.0", server_port=7860, debug=True, pwa=True)