Spaces:

Bofandra
/

ChatMe

Sleeping

Bofandra commited on Sep 18, 2025

Commit

7f8ff79

verified ·

1 Parent(s): 9f83f75

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,6 +5,7 @@ from langchain.vectorstores import FAISS
 from langchain.embeddings import HuggingFaceEmbeddings
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.document_loaders import PyPDFLoader
 import tempfile
 # Initialize global variables
@@ -15,29 +16,26 @@ retrieval_chain = None
 def process_pdf(file):
     global vectorstore, retrieval_chain
-    # `file` is a gradio.NamedString → use file.name to get the path
-    tmp_path = file.name
-    # Load PDF
     loader = PyPDFLoader(tmp_path)
     documents = loader.load()
-    # Split into chunks
     text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
     docs = text_splitter.split_documents(documents)
-    # Create embeddings and FAISS vectorstore
-    embeddings = HuggingFaceEmbeddings()
     vectorstore = FAISS.from_documents(docs, embeddings)
-    # Setup retrieval chain
-    retriever = vectorstore.as_retriever()
-    retriever.search_kwargs["k"] = 4
-    client = InferenceClient(model="deepseek-ai/DeepSeek-R1-0528")
     retrieval_chain = ConversationalRetrievalChain.from_llm(
-        llm=client,
         retriever=retriever,
         return_source_documents=True
     )

 from langchain.embeddings import HuggingFaceEmbeddings
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.document_loaders import PyPDFLoader
+from langchain_community.llms import HuggingFaceHub
 import tempfile
 # Initialize global variables
 def process_pdf(file):
     global vectorstore, retrieval_chain
+    tmp_path = file.name
     loader = PyPDFLoader(tmp_path)
     documents = loader.load()
     text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
     docs = text_splitter.split_documents(documents)
+    embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
     vectorstore = FAISS.from_documents(docs, embeddings)
+    retriever = vectorstore.as_retriever(search_kwargs={"k": 4})
+    # ✅ Wrap DeepSeek model properly
+    llm = HuggingFaceHub(
+        repo_id="deepseek-ai/DeepSeek-R1-0528",
+        model_kwargs={"temperature": 0.7, "max_new_tokens": 512}
+    )
     retrieval_chain = ConversationalRetrievalChain.from_llm(
+        llm=llm,
         retriever=retriever,
         return_source_documents=True
     )