Spaces:

nyxionlabs
/

nyxion-rag

Sleeping

App Files Files Community

nyxionlabs commited on Oct 3

Commit

8769b06

verified ·

1 Parent(s): feafe1e

Update app.py

Browse files

Files changed (1) hide show

app.py +68 -17

app.py CHANGED Viewed

@@ -7,14 +7,20 @@ from sentence_transformers import SentenceTransformer
 # Optional LLM step (still works without it)
 OPENAI_API_KEY = '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'
 USE_OPENAI = bool(OPENAI_API_KEY)
 if USE_OPENAI:
     try:
         from openai import OpenAI
         oai = OpenAI(api_key=OPENAI_API_KEY)
         OPENAI_MODEL = os.getenv("OPENAI_MODEL", "gpt-4o-mini")
     except Exception as e:
         print("[RAG] OpenAI import failed:", e)
         USE_OPENAI = False
 # Tunables (can override in Space → Settings → Variables)
 MODEL_NAME   = os.getenv("EMBED_MODEL", "all-MiniLM-L6-v2")
@@ -32,6 +38,10 @@ def _fallback_corpus():
         "Mount Everest is Earth's highest mountain above sea level.",
         "Photosynthesis converts light energy into chemical energy in plants.",
         "The Nile is a major north-flowing river in northeastern Africa.",
     ]
 def build_index():
@@ -105,55 +115,96 @@ def answer(question: str, k: int):
         build_index()
     if not question.strip():
-        return "Please enter a question.", [], {"status": "idle"}
     pairs = retrieve(question, k)
     if not pairs:
-        return "No results in index.", [], {"status": "empty"}
     cites = [{"rank": p["rank"], "faiss_dist": round(p["faiss_dist"], 4), "snippet": p["snippet"]} for p in pairs]
     if USE_OPENAI:
         prompt = build_prompt(question, pairs)
         try:
             resp = oai.chat.completions.create(
                 model=OPENAI_MODEL,
                 messages=[{"role": "user", "content": prompt}],
-                temperature=0.2
             )
             ans = resp.choices[0].message.content
         except Exception as e:
-            ans = f"LLM call failed: {e}\n\nTop result shown below:\n\n{pairs[0]['full'][:MAX_CTX_CHAR]}"
     else:
-        ans = ("(No OPENAI_API_KEY set — showing most relevant context instead.)\n\n"
                + pairs[0]["full"][:MAX_CTX_CHAR])
-    return ans, cites, {"status": "ok", "ntotal": STATE['index'].ntotal, "model": MODEL_NAME}
 # ------------------- UI -------------------
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
-    gr.Markdown("## Nyxion Labs · Grounded Q&A (no uploads — builds at startup)")
     with gr.Row():
-        q = gr.Textbox(label="Ask a question", placeholder="e.g., What is the capital of France?")
-        k = gr.Slider(1, 10, value=3, step=1, label="Citations (top-k)")
-    btn   = gr.Button("Ask")
     ans   = gr.Markdown(label="Answer")
-    cites = gr.Dataframe(headers=["rank", "faiss_dist", "snippet"], datatype=["number","number","str"],
-                         row_count=(0, "dynamic"), label="Retrieved contexts")
-    meta  = gr.JSON(label="Status")
     def _startup():
         try:
             msg = build_index()
         except Exception as e:
-            msg = f"Startup build failed: {e}"
-        return {"status": msg}
     demo.load(_startup, inputs=None, outputs=meta)
     btn.click(answer, [q, k], [ans, cites, meta])
 if __name__ == "__main__":
     build_index()
-    demo.launch()

 # Optional LLM step (still works without it)
 OPENAI_API_KEY = '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'
 USE_OPENAI = bool(OPENAI_API_KEY)
+print(f"[RAG] OPENAI_API_KEY found: {bool(OPENAI_API_KEY)}")
 if USE_OPENAI:
     try:
         from openai import OpenAI
         oai = OpenAI(api_key=OPENAI_API_KEY)
         OPENAI_MODEL = os.getenv("OPENAI_MODEL", "gpt-4o-mini")
+        print(f"[RAG] OpenAI initialized with model: {OPENAI_MODEL}")
     except Exception as e:
         print("[RAG] OpenAI import failed:", e)
         USE_OPENAI = False
+else:
+    print("[RAG] No OpenAI API key detected. Set OPENAI_API_KEY in Space Settings.")
 # Tunables (can override in Space → Settings → Variables)
 MODEL_NAME   = os.getenv("EMBED_MODEL", "all-MiniLM-L6-v2")
         "Mount Everest is Earth's highest mountain above sea level.",
         "Photosynthesis converts light energy into chemical energy in plants.",
         "The Nile is a major north-flowing river in northeastern Africa.",
+        "Berlin is the capital and largest city of Germany.",
+        "Tokyo is the capital of Japan and one of the world's most populous cities.",
+        "The Great Wall of China is one of the most famous landmarks in the world.",
+        "DNA contains the genetic instructions for all living organisms.",
     ]
 def build_index():
         build_index()
     if not question.strip():
+        return "Please enter a question.", [], {"status": "idle", "openai_enabled": USE_OPENAI}
     pairs = retrieve(question, k)
     if not pairs:
+        return "No results in index.", [], {"status": "empty", "openai_enabled": USE_OPENAI}
     cites = [{"rank": p["rank"], "faiss_dist": round(p["faiss_dist"], 4), "snippet": p["snippet"]} for p in pairs]
     if USE_OPENAI:
         prompt = build_prompt(question, pairs)
         try:
+            print(f"[RAG] Calling OpenAI with model: {OPENAI_MODEL}")
             resp = oai.chat.completions.create(
                 model=OPENAI_MODEL,
                 messages=[{"role": "user", "content": prompt}],
+                temperature=0.2,
+                max_tokens=500
             )
             ans = resp.choices[0].message.content
+            print(f"[RAG] OpenAI response received successfully")
         except Exception as e:
+            print(f"[RAG] LLM call failed: {e}")
+            ans = f"❌ LLM call failed: {e}\n\n**Top result shown below:**\n\n{pairs[0]['full'][:MAX_CTX_CHAR]}"
     else:
+        ans = ("⚠️ **No OPENAI_API_KEY set** — Add it in Space Settings → Repository secrets\n\n"
+               "**Showing most relevant context instead:**\n\n"
                + pairs[0]["full"][:MAX_CTX_CHAR])
+    return ans, cites, {
+        "status": "ok",
+        "ntotal": STATE['index'].ntotal,
+        "model": MODEL_NAME,
+        "openai_enabled": USE_OPENAI,
+        "openai_model": OPENAI_MODEL if USE_OPENAI else None
+    }
 # ------------------- UI -------------------
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
+    gr.Markdown("""
+    ## Nyxion Labs · Grounded Q&A (RAG Demo)
+    Ask questions and get answers grounded in context with citations.
+    """)
+    if not USE_OPENAI:
+        gr.Markdown("""
+        ⚠️ **OpenAI API Key Not Detected**
+        To enable AI-generated answers:
+        1. Go to Space Settings
+        2. Add `OPENAI_API_KEY` as a repository secret
+        3. Restart the Space
+        Currently showing raw context retrieval only.
+        """)
     with gr.Row():
+        q = gr.Textbox(
+            label="Ask a question",
+            placeholder="e.g., What is the capital of Germany?",
+            lines=2
+        )
+        k = gr.Slider(1, 10, value=3, step=1, label="Number of Citations (top-k)")
+    btn   = gr.Button("🔍 Ask", variant="primary")
     ans   = gr.Markdown(label="Answer")
+    cites = gr.Dataframe(
+        headers=["rank", "faiss_dist", "snippet"],
+        datatype=["number","number","str"],
+        row_count=(0, "dynamic"),
+        label="Retrieved Contexts"
+    )
+    meta  = gr.JSON(label="System Status")
     def _startup():
         try:
             msg = build_index()
+            return {
+                "status": msg,
+                "openai_enabled": USE_OPENAI,
+                "openai_model": OPENAI_MODEL if USE_OPENAI else None,
+                "embed_model": MODEL_NAME
+            }
         except Exception as e:
+            return {"status": f"Startup build failed: {e}", "openai_enabled": False}
     demo.load(_startup, inputs=None, outputs=meta)
     btn.click(answer, [q, k], [ans, cites, meta])
+    q.submit(answer, [q, k], [ans, cites, meta])  # Allow Enter key to submit
 if __name__ == "__main__":
     build_index()
+    demo.launch()