Spaces:

ahmedumeraziz
/

PDFs_chat_bots

Sleeping

ahmedumeraziz commited on Jun 14, 2025

Commit

7acb521

verified ·

1 Parent(s): 1aaebe8

Update utils/rag_utils.py

Files changed (1) hide show

utils/rag_utils.py CHANGED Viewed

@@ -2,11 +2,9 @@ from PyPDF2 import PdfReader
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain_groq import ChatGroq
 from langchain.chains import RetrievalQA
-import io
-def process_pdf(uploaded_file):
-    pdf_bytes = uploaded_file.read()
-    reader = PdfReader(io.BytesIO(pdf_bytes))
     text = "\n".join([page.extract_text() or "" for page in reader.pages])
     splitter = RecursiveCharacterTextSplitter(
@@ -20,12 +18,12 @@ def get_groq_response(query, vector_db, model_name="mixtral-8x7b-32768"):
     llm = ChatGroq(
         temperature=0.1,
         model_name=model_name,
-        max_tokens=1024
     )
     qa = RetrievalQA.from_chain_type(
         llm=llm,
         chain_type="stuff",
-        retriever=vector_db.as_retriever(search_kwargs={"k": 3})
     )
     return qa.run(query)

 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain_groq import ChatGroq
 from langchain.chains import RetrievalQA
+def process_pdf(file_path: str):
+    reader = PdfReader(file_path)
     text = "\n".join([page.extract_text() or "" for page in reader.pages])
     splitter = RecursiveCharacterTextSplitter(
     llm = ChatGroq(
         temperature=0.1,
         model_name=model_name,
+        max_tokens=2048
     )
     qa = RetrievalQA.from_chain_type(
         llm=llm,
         chain_type="stuff",
+        retriever=vector_db.as_retriever(search_kwargs={"k": 4})
     )
     return qa.run(query)