Spaces:

amasood
/

test_RAG

Sleeping

App Files Files Community

amasood commited on Apr 9, 2025

Commit

8b835fd

verified ·

1 Parent(s): 576a1d5

Update app.py

Browse files

Files changed (1) hide show

app.py +48 -16

app.py CHANGED Viewed

@@ -1,11 +1,16 @@
 import streamlit as st
 import pandas as pd
 from datasets import load_dataset
 from sentence_transformers import SentenceTransformer
-import faiss
-import numpy as np
 from groq import Groq
 # Load dataset
 @st.cache_data
 def load_data():
@@ -13,26 +18,51 @@ def load_data():
     df = pd.DataFrame(dataset)
     return df[["question", "answer"]]
-# Generate embeddings and index
 @st.cache_resource
 def setup_faiss(data):
     model = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
-    embeddings = model.encode(data["question"].tolist())
-    index = faiss.IndexFlatL2(embeddings.shape[1])
-    index.add(np.array(embeddings))
-    return model, index, embeddings
 # Retrieve relevant context
-def retrieve_context(query, model, index, data, top_k=1):
     query_vec = model.encode([query])
     distances, indices = index.search(np.array(query_vec), top_k)
-    results = [data.iloc[i]["question"] + "\n\n" + data.iloc[i]["answer"] for i in indices[0]]
     return "\n\n".join(results)
 # Call Groq LLM
 def query_groq(context, query):
     prompt = f"Context:\n{context}\n\nQuestion: {query}\n\nAnswer:"
-    #client = Groq(api_key=st.secrets[GROQ_API_KEY])
     client = Groq(api_key=GROQ_API_KEY)
     response = client.chat.completions.create(
         messages=[{"role": "user", "content": prompt}],
@@ -41,11 +71,12 @@ def query_groq(context, query):
     return response.choices[0].message.content
 # Streamlit UI
-st.set_page_config(page_title="RAG Demo with Groq", layout="wide")
-st.title("🧠 RAG App using Groq API + RAG-Instruct Dataset")
 data = load_data()
-model, index, _ = setup_faiss(data)
 st.markdown("Ask a question based on the QA knowledge base.")
@@ -61,12 +92,13 @@ optional_queries = [
 query = st.text_input("Enter your question:", value=optional_queries[0])
 if st.button("Ask"):
     with st.spinner("Retrieving and generating response..."):
-        context = retrieve_context(query, model, index, data)
         answer = query_groq(context, query)
     st.subheader("📄 Retrieved Context")
     st.write(context)
     st.subheader("💬 Answer from Groq LLM")
     st.write(answer)
-st.markdown("### Optional Queries to Try:")
-st.write(", ".join(optional_queries))

+import os
 import streamlit as st
 import pandas as pd
+import numpy as np
+import faiss
 from datasets import load_dataset
 from sentence_transformers import SentenceTransformer
 from groq import Groq
+# Constants for saving/loading index
+INDEX_FILE = "faiss_index.index"
+QUESTIONS_FILE = "questions.npy"
 # Load dataset
 @st.cache_data
 def load_data():
     df = pd.DataFrame(dataset)
     return df[["question", "answer"]]
+# Build or load FAISS index
 @st.cache_resource
 def setup_faiss(data):
     model = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
+    if os.path.exists(INDEX_FILE) and os.path.exists(QUESTIONS_FILE):
+        st.info("🔁 Loading FAISS index from disk...")
+        index = faiss.read_index(INDEX_FILE)
+        questions = np.load(QUESTIONS_FILE, allow_pickle=True)
+    else:
+        st.info("⚙️ FAISS index not found. Building new index...")
+        questions = data["question"].tolist()
+        embeddings = []
+        progress_bar = st.progress(0, text="Embedding questions...")
+        total = len(questions)
+        for i, chunk in enumerate(np.array_split(questions, 10)):
+            emb = model.encode(chunk)
+            embeddings.extend(emb)
+            progress_bar.progress((i + 1) / 10, text=f"Embedding... {int((i + 1) * 10)}%")
+        embeddings = np.array(embeddings)
+        index = faiss.IndexFlatL2(embeddings.shape[1])
+        index.add(embeddings)
+        faiss.write_index(index, INDEX_FILE)
+        np.save(QUESTIONS_FILE, np.array(questions, dtype=object))
+        progress_bar.empty()
+        st.success("✅ FAISS index built and saved!")
+    return model, index, questions
 # Retrieve relevant context
+def retrieve_context(query, model, index, questions, data, top_k=1):
     query_vec = model.encode([query])
     distances, indices = index.search(np.array(query_vec), top_k)
+    results = [questions[i] + "\n\n" + data.iloc[i]["answer"] for i in indices[0]]
     return "\n\n".join(results)
 # Call Groq LLM
 def query_groq(context, query):
     prompt = f"Context:\n{context}\n\nQuestion: {query}\n\nAnswer:"
     client = Groq(api_key=GROQ_API_KEY)
     response = client.chat.completions.create(
         messages=[{"role": "user", "content": prompt}],
     return response.choices[0].message.content
 # Streamlit UI
+st.set_page_config(page_title="RAG App with Groq", layout="wide")
+st.title("🔍 RAG App using Groq API + RAG-Instruct Dataset")
+# Load data and setup
 data = load_data()
+model, index, questions = setup_faiss(data)
 st.markdown("Ask a question based on the QA knowledge base.")
 query = st.text_input("Enter your question:", value=optional_queries[0])
 if st.button("Ask"):
     with st.spinner("Retrieving and generating response..."):
+        context = retrieve_context(query, model, index, questions, data)
         answer = query_groq(context, query)
     st.subheader("📄 Retrieved Context")
     st.write(context)
     st.subheader("💬 Answer from Groq LLM")
     st.write(answer)
+st.markdown("### 💡 Optional Queries to Try:")
+for q in optional_queries:
+    st.markdown(f"- {q}")