Spaces:

NHZ
/

First_Aid_Kit

Sleeping

App Files Files Community

NHZ commited on Jan 4, 2025

Commit

b5bd81f

verified ·

1 Parent(s): fd7e05e

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -17

app.py CHANGED Viewed

@@ -2,7 +2,7 @@ import os
 import streamlit as st
 import PyPDF2
 import requests
-import numpy as np
 import faiss
 from groq import Groq
@@ -36,21 +36,13 @@ def chunk_text(text, max_length=500):
         chunks.append(chunk.strip())
     return chunks
-# Function to compute embeddings using NumPy
-def compute_embeddings(chunks):
-    embeddings = []
-    for chunk in chunks:
-        vector = np.array([ord(char) for char in chunk[:300]], dtype=np.float32)  # Truncate to 300 characters
-        padded_vector = np.pad(vector, (0, 300 - len(vector)), mode="constant")
-        embeddings.append(padded_vector)
-    return np.vstack(embeddings)
 # Function to create FAISS index
-def create_faiss_index(embeddings):
-    dimension = embeddings.shape[1]
     index = faiss.IndexFlatL2(dimension)
     index.add(embeddings)
-    return index
 # Function to query Groq API
 def query_groq(question, model_name="llama-3.3-70b-versatile"):
@@ -70,17 +62,17 @@ def main():
     st.write("Document text extracted successfully!")
     st.write("Chunking and embedding text...")
     chunks = chunk_text(text)
-    embeddings = compute_embeddings(chunks)
-    index = create_faiss_index(embeddings)
     st.write(f"Created FAISS index with {len(chunks)} chunks.")
     # Query input
     question = st.text_input("Ask a question based on the document:")
     if question:
         st.write("Searching for relevant chunks...")
-        question_embedding = compute_embeddings([question])[0].reshape(1, -1)
-        distances, indices = index.search(question_embedding, k=1)
         relevant_chunk = chunks[indices[0][0]]
         st.write("Generating answer using Groq API...")
@@ -92,3 +84,4 @@ if __name__ == "__main__":
     main()

 import streamlit as st
 import PyPDF2
 import requests
+from sentence_transformers import SentenceTransformer
 import faiss
 from groq import Groq
         chunks.append(chunk.strip())
     return chunks
 # Function to create FAISS index
+def create_faiss_index(chunks, model):
+    embeddings = model.encode(chunks)
+    dimension = len(embeddings[0])
     index = faiss.IndexFlatL2(dimension)
     index.add(embeddings)
+    return index, chunks
 # Function to query Groq API
 def query_groq(question, model_name="llama-3.3-70b-versatile"):
     st.write("Document text extracted successfully!")
     st.write("Chunking and embedding text...")
+    model = SentenceTransformer("all-MiniLM-L6-v2")
     chunks = chunk_text(text)
+    index, chunks = create_faiss_index(chunks, model)
     st.write(f"Created FAISS index with {len(chunks)} chunks.")
     # Query input
     question = st.text_input("Ask a question based on the document:")
     if question:
         st.write("Searching for relevant chunks...")
+        question_embedding = model.encode([question])
+        _, indices = index.search(question_embedding, k=1)
         relevant_chunk = chunks[indices[0][0]]
         st.write("Generating answer using Groq API...")
     main()