Spaces:

IsmaeelPandey
/

CodeWarsV2

Sleeping

IsmaeelPandey commited on Oct 12, 2023

Commit

d2a7723

1 Parent(s): 7cd66f5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -25,14 +25,22 @@ os.environ["HUGGINGFACEHUB_API_TOKEN"] = "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"
 embedding = HuggingFaceHubEmbeddings()
 loader = PyPDFLoader("1.pdf")
-pages = loader.load_and_split()
 text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
 docs = text_splitter.split_documents(pages)
-loader2 = PyPDFLoader("2.pdf")
 pages2 = loader2.load_and_split()
-docs.append(text_splitter.split_documents(pages2))
 vectorstore = Chroma.from_documents(documents=docs, embedding=embedding)

 embedding = HuggingFaceHubEmbeddings()
 loader = PyPDFLoader("1.pdf")
+loader2 = PyPDFLoader("2.pdf")
+loaders = []
+loaders.append(loader)
+loaders.append(loader2)
+loaderdocs = []
+for l in loaders:
+   loaderdocs.extend(l.load_and_split())
+text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)
+docs = text_splitter.split_documents(loaderdocs)
 text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
 docs = text_splitter.split_documents(pages)
 pages2 = loader2.load_and_split()
 vectorstore = Chroma.from_documents(documents=docs, embedding=embedding)