PDF

Runtime error

App Files Files Community

Raghav001 commited on Nov 30, 2023

Commit

f97427e

1 Parent(s): 06eae13

Update app.py

Browse files

Files changed (1) hide show

app.py +4 -40

app.py CHANGED Viewed

@@ -40,8 +40,8 @@ all_max_len = 3000
 # Initialize Pinecone client and create an index
-pinecone.init(api_key="ffb1f594-0915-4ebf-835f-c1eaa62fdcdc",environment = "us-west4-gcp-free")
-index = pinecone.Index(index_name="test")
 def get_emb(text):
@@ -192,40 +192,6 @@ def up_file(fls):
                 doc_text_list += res_list
-        #pptx Extracting
-    for i in pptx:
-        loader = UnstructuredPowerPointLoader(i)
-        data = loader.load()
-        # content = str(data).split("'")
-        # cnt = content[1]
-        # # c = cnt.split('\\n\\n')
-        # # final = "".join(c)
-        # c = cnt.replace('\\n\\n',"").replace("<PAGE BREAK>","").replace("\t","")
-        doc_text_list.append(data)
-    #Doc Extracting
-    for i in docs:
-        loader = UnstructuredWordDocumentLoader(i)
-        data = loader.load()
-        # content = str(data).split("'")
-        # cnt = content[1]
-        # # c = cnt.split('\\n\\n')
-        # # final = "".join(c)
-        # c = cnt.replace('\\n\\n',"").replace("<PAGE BREAK>","").replace("\t","")
-        doc_text_list.append(data)
-    # #Image Extraction
-    # for i in jpg:
-    #     loader = UnstructuredImageLoader(i)
-    #     data = loader.load()
-    #     # content = str(data).split("'")
-    #     # cnt = content[1]
-    #     # # c = cnt.split('\\n\\n')
-    #     # # final = "".join(c)
-    #     # c = cnt.replace('\\n\\n',"").replace("<PAGE BREAK>","").replace("\t","")
-    #     doc_text_list.append(data)
     doc_text_list = [str(text).strip() for text in doc_text_list if len(str(text).strip()) > 0]
     # print(doc_text_list)
@@ -257,7 +223,7 @@ def pine(data):
     Embedding_model = "text-embedding-ada-002"
-    embeddings = OpenAIEmbeddings(openai_api_key="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")
     print(requests.post(url = chat_emd))
@@ -266,9 +232,7 @@ def pine(data):
     #                        headers=headers
     #                        )
-    pinecone.init(api_key = "ffb1f594-0915-4ebf-835f-c1eaa62fdcdc",
-              environment = "us-west4-gcp-free"
-              )
     index_name = "test"
     docstore = Pinecone.from_texts([d for d in doc_spilt],embeddings,index_name = index_name,namespace='a1')

 # Initialize Pinecone client and create an index
+pinecone.init(api_key='d0a5b89b-b901-4b47-bc99-38b93695390d',environment = 'asia-southeast1-gcp')
+index = pinecone.Index(index_name='test')
 def get_emb(text):
                 doc_text_list += res_list
     doc_text_list = [str(text).strip() for text in doc_text_list if len(str(text).strip()) > 0]
     # print(doc_text_list)
     Embedding_model = "text-embedding-ada-002"
+    embeddings = OpenAIEmbeddings(openai_api_key="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")
     print(requests.post(url = chat_emd))
     #                        headers=headers
     #                        )
+    pinecone.init(api_key = "ffb1f594-0915-4ebf-835f-c1eaa62fdcdc",environment = "us-west4-gcp-free")
     index_name = "test"
     docstore = Pinecone.from_texts([d for d in doc_spilt],embeddings,index_name = index_name,namespace='a1')