Spaces:

dammy
/

chatPDF

Runtime error

dammy commited on Nov 16, 2023

Commit

b88b1f3

1 Parent(s): 9a664f0

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -45,7 +45,7 @@ def local_query(query, context):
 def run_query(history, query):
     loader = PDFMinerLoader(pdf_filename)
     doc = loader.load()
@@ -76,32 +76,32 @@ def run_query(history, query):
     return history, result
-def load_document(pdf_filename):
-    loader = PDFMinerLoader(pdf_filename)
-    doc = loader.load()
-    text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
-    texts = text_splitter.split_documents(doc)
-    texts = [i.page_content for i in texts]
-    doc_emb = st_model.encode(texts)
-    doc_emb = doc_emb.tolist()
-    ids = [str(uuid.uuid1()) for _ in doc_emb]
-    client = chromadb.Client()
-    collection = client.create_collection("test_db")
-    collection.add(
-        embeddings=doc_emb,
-        documents=texts,
-        ids=ids
-    )
-    return 'Success'

 def run_query(history, query):
+    # pdf file name input olarak verip, buraya upload event olarak gondermem gereki rmi
     loader = PDFMinerLoader(pdf_filename)
     doc = loader.load()
     return history, result
+# def load_document(pdf_filename):
+#     loader = PDFMinerLoader(pdf_filename)
+#     doc = loader.load()
+#     text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
+#     texts = text_splitter.split_documents(doc)
+#     texts = [i.page_content for i in texts]
+#     doc_emb = st_model.encode(texts)
+#     doc_emb = doc_emb.tolist()
+#     ids = [str(uuid.uuid1()) for _ in doc_emb]
+#     client = chromadb.Client()
+#     collection = client.create_collection("test_db")
+#     collection.add(
+#         embeddings=doc_emb,
+#         documents=texts,
+#         ids=ids
+#     )
+#     return 'Success'