Spaces:

Kathirsci
/

Report_summarizer

Sleeping

Kathirsci commited on Sep 23, 2024

Commit

895f085

verified ·

1 Parent(s): 620a8a5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,7 +3,8 @@ import tempfile
 import logging
 from typing import List
 from langchain_community.document_loaders import PyPDFLoader
-from langchain_community.embeddings import HuggingFaceEmbeddings
 from langchain_community.vectorstores import FAISS
 from langchain_community.llms import HuggingFacePipeline
 from langchain.chains.summarize import load_summarize_chain
@@ -18,7 +19,7 @@ logger = logging.getLogger(__name__)
 # Constants
 EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
-DEFAULT_MODEL = "llava-v1.6-mistral-7b"
 @st.cache_resource
 def load_embeddings():
@@ -50,7 +51,7 @@ def process_pdf(file) -> List[Document]:
         loader = PyPDFLoader(file_path=temp_file_path)
         pages = loader.load()
-        text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
         documents = text_splitter.split_documents(pages)
         return documents
     except Exception as e:

 import logging
 from typing import List
 from langchain_community.document_loaders import PyPDFLoader
+#from langchain_community.embeddings import HuggingFaceEmbeddings
+from langchain_huggingface import HuggingFaceEmbeddings
 from langchain_community.vectorstores import FAISS
 from langchain_community.llms import HuggingFacePipeline
 from langchain.chains.summarize import load_summarize_chain
 # Constants
 EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
+DEFAULT_MODEL = "llava-v1.6-mistral-7b-hf"
 @st.cache_resource
 def load_embeddings():
         loader = PyPDFLoader(file_path=temp_file_path)
         pages = loader.load()
+        text_splitter = RecursiveCharacterTextSplitter(chunk_size=4000, chunk_overlap=200)
         documents = text_splitter.split_documents(pages)
         return documents
     except Exception as e: