Spaces:

jozzy
/

langchain

Build error

App Files Files Community

jozzy commited on May 12, 2023

Commit

14ffe48

1 Parent(s): c57d2c4

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -20

app.py CHANGED Viewed

@@ -50,7 +50,7 @@ def process_file(index_name, dir):
     #using openai embedding hence dim = 1536
     pinecone.create_index(index_name, dimension=1536, metric="cosine")
-    time.sleep(5)
     embeddings = OpenAIEmbeddings(openai_api_key=os.environ['OPENAI_API_KEY'])
     splter = SpacyTextSplitter(chunk_size=1000,chunk_overlap=200)
@@ -122,25 +122,15 @@ def textGPT(text):
     return chats
-def fileGPT(prompt, file_obj):
-    global messages
-    file_text = extract_text(file_obj.name)
-    text = prompt + "\n\n" + file_text
-    messages.append({"role": "user", "content": text})
-    response = openai.ChatCompletion.create(model="gpt-4", messages=messages)
-    system_message = response["choices"][0]["message"]
-    messages.append(system_message)
-    chats = ""
-    for msg in messages:
-        if msg['role'] != 'system':
-            chats += msg['role'] + ": " + msg['content'] + "\n\n"
-    return chats
@@ -198,8 +188,8 @@ vector_server = gr.Interface(fn=process_file, inputs=["text", gr.inputs.File(fil
 #audio = gr.Interface(fn=audioGPT, inputs=gr.Audio(source="microphone", type="filepath"), outputs="text")
 #siri = gr.Interface(fn=siriGPT, inputs=gr.Audio(source="microphone", type="filepath"), outputs = "audio")
-file = gr.Interface(fn=fileGPT, inputs=["text", "file"], outputs=None, description = "Enter prompt sentences and your PDF. e.g. lets think step by step, summarize this following text:  或者 让我们一步一步地思考，总结以下的内容:")
-demo = gr.TabbedInterface([role, text, file, chatHistory, vector_server, pinecone_tools], [ "roleChoice", "chatGPT", "fileGPT", "ChatHistory", "VectorServer", "PineconeTools"])
 if __name__ == "__main__":
     demo.launch(enable_queue=False, auth=lambda u, p: user_db.get(u) == p,

     #using openai embedding hence dim = 1536
     pinecone.create_index(index_name, dimension=1536, metric="cosine")
+    #time.sleep(5)
     embeddings = OpenAIEmbeddings(openai_api_key=os.environ['OPENAI_API_KEY'])
     splter = SpacyTextSplitter(chunk_size=1000,chunk_overlap=200)
     return chats
+def fileSearch(index_name, prompt):
+    global messages
+    init_pinecone()
+    embeddings = OpenAIEmbeddings(openai_api_key=os.environ['OPENAI_API_KEY'])
+    docsearch = Pinecone.from_existing_index(index_name, embeddings)
+    docs = docsearch.similarity_search(prompt)
+    return "Top 5 findings are:\n\n" + "1. " + docs[0].page_content + "\n\n" + "2. " + docs[1].page_content + "\n\n" +  "3. " + docs[2].page_content + "\n\n" + "4. " + docs[3].page_content + "\n\n" + "5. " + docs[4].page_content + "\n\n"
 #audio = gr.Interface(fn=audioGPT, inputs=gr.Audio(source="microphone", type="filepath"), outputs="text")
 #siri = gr.Interface(fn=siriGPT, inputs=gr.Audio(source="microphone", type="filepath"), outputs = "audio")
+file = gr.Interface(fn=fileSearch, inputs=["text", "text"], outputs=None, description = "Enter file name and prompt")
+demo = gr.TabbedInterface([role, text, file, chatHistory, vector_server, pinecone_tools], [ "roleChoice", "chatGPT", "FileSearch", "ChatHistory", "VectorServer", "PineconeTools"])
 if __name__ == "__main__":
     demo.launch(enable_queue=False, auth=lambda u, p: user_db.get(u) == p,