Spaces:

Samarth991
/

RAG-PDF_With_LLAMA-3B

Sleeping

Samarth991 commited on Dec 24, 2024

Commit

d45c8e8

verified ·

1 Parent(s): 1d73ddf

Update PDF_Reader.py

Files changed (1) hide show

PDF_Reader.py CHANGED Viewed

@@ -2,6 +2,7 @@ from langchain_experimental.text_splitter import SemanticChunker
 from langchain_chroma import Chroma
 from langchain_community.document_loaders import PyPDFLoader
 from langchain.embeddings import HuggingFaceEmbeddings
 embedding_modelPath = "sentence-transformers/all-MiniLM-l6-v2"
 embeddings = HuggingFaceEmbeddings(model_name=embedding_modelPath,model_kwargs = {'device':'cpu'},encode_kwargs = {'normalize_embeddings': False})
@@ -20,7 +21,7 @@ def replace_t_with_space(list_of_documents):
         doc.page_content = doc.page_content.replace('\t', ' ')  # Replace tabs with spaces
     return list_of_documents
-def read_pdf(uploaded_file):
     loader = PyPDFLoader(pdf_path)
     docs = loader.load()
     print("Total Documents :",len(docs))

 from langchain_chroma import Chroma
 from langchain_community.document_loaders import PyPDFLoader
 from langchain.embeddings import HuggingFaceEmbeddings
 embedding_modelPath = "sentence-transformers/all-MiniLM-l6-v2"
 embeddings = HuggingFaceEmbeddings(model_name=embedding_modelPath,model_kwargs = {'device':'cpu'},encode_kwargs = {'normalize_embeddings': False})
         doc.page_content = doc.page_content.replace('\t', ' ')  # Replace tabs with spaces
     return list_of_documents
+def read_pdf(pdf_path):
     loader = PyPDFLoader(pdf_path)
     docs = loader.load()
     print("Total Documents :",len(docs))