Spaces:

productions
/

Data_Conversion

Sleeping

robertselvam commited on Apr 16, 2024

Commit

95a02ef

verified ·

1 Parent(s): 85a2286

Update summary_extractor.py

Files changed (1) hide show

summary_extractor.py CHANGED Viewed

@@ -8,8 +8,8 @@ from langchain.chains.mapreduce import MapReduceChain
 from langchain.text_splitter import CharacterTextSplitter
 from langchain.chains.summarize import load_summarize_chain
 from langchain.prompts import PromptTemplate
-from langchain_community.document_loaders import UnstructuredFileLoader
 class Extractor:
@@ -35,7 +35,7 @@ class Extractor:
             List[str]: List of text content from each page.
         """
         try:
-            loader = UnstructuredFileLoader(pdf_file_path.name)
             pages = loader.load_and_split()
             return pages

 from langchain.text_splitter import CharacterTextSplitter
 from langchain.chains.summarize import load_summarize_chain
 from langchain.prompts import PromptTemplate
+# from langchain_community.document_loaders import UnstructuredFileLoader
+from langchain_community.document_loaders import PyPDFLoader
 class Extractor:
             List[str]: List of text content from each page.
         """
         try:
+            loader = PyPDFLoader(pdf_file_path.name)
             pages = loader.load_and_split()
             return pages