Spaces:

DataWizard9742
/

ChatWIthPdf

Sleeping

App Files Files Community

DataWizard9742 commited on Jan 10, 2024

Commit

4b1d9d3

verified ·

1 Parent(s): abe6038

Update app.py

Browse files

Files changed (1) hide show

app.py +5 -24

app.py CHANGED Viewed

@@ -1,6 +1,5 @@
 import streamlit as st
 from dotenv import load_dotenv
-import pickle
 from PyPDF2 import PdfReader
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.embeddings.openai import OpenAIEmbeddings
@@ -8,24 +7,19 @@ from langchain.vectorstores import FAISS
 from langchain.llms import OpenAI
 from langchain.chains.question_answering import load_qa_chain
 from langchain.callbacks import get_openai_callback
-import os
-# Sidebar contents
-with st.sidebar:
-    st.title('LLM Chat App')
-    st.write('Made at FULL STACK ACADEMY')
 load_dotenv()
 def main():
-    st.header("Chat with PDF 💬")
     pdf = st.file_uploader("Upload your PDF", type='pdf')
     if pdf is not None:
         pdf_reader = PdfReader(pdf)
         text = ""
         for page in pdf_reader.pages:
             text += page.extract_text()
         text_splitter = RecursiveCharacterTextSplitter(
             chunk_size=1000,
             chunk_overlap=200,
@@ -33,21 +27,9 @@ def main():
         )
         chunks = text_splitter.split_text(text=text)
-        # # embeddings
-        store_name = pdf.name[:-4]
-        st.write(f'{store_name}')
-        if os.path.exists(f"{store_name}.pkl"):
-            with open(f"{store_name}.pkl", "rb") as f:
-                VectorStore = pickle.load(f)
-        else:
-            embeddings = OpenAIEmbeddings()
-            VectorStore = FAISS.from_texts(chunks, embedding=embeddings)
-            with open(f"{store_name}.pkl", "wb") as f:
-                pickle.dump(VectorStore, f)
         query = st.text_input("Ask questions about your PDF file:")
         if query:
             docs = VectorStore.similarity_search(query=query, k=3)
             llm = OpenAI()
@@ -57,6 +39,5 @@ def main():
                 print(cb)
             st.write(response)
 if __name__ == '__main__':
     main()

 import streamlit as st
 from dotenv import load_dotenv
 from PyPDF2 import PdfReader
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.embeddings.openai import OpenAIEmbeddings
 from langchain.llms import OpenAI
 from langchain.chains.question_answering import load_qa_chain
 from langchain.callbacks import get_openai_callback
 load_dotenv()
 def main():
+    st.title("Chat with PDF 💬")
+    st.header("Made at Full Stack Academy")
     pdf = st.file_uploader("Upload your PDF", type='pdf')
     if pdf is not None:
         pdf_reader = PdfReader(pdf)
         text = ""
         for page in pdf_reader.pages:
             text += page.extract_text()
         text_splitter = RecursiveCharacterTextSplitter(
             chunk_size=1000,
             chunk_overlap=200,
         )
         chunks = text_splitter.split_text(text=text)
+        embeddings = OpenAIEmbeddings()
+        VectorStore = FAISS.from_texts(chunks, embedding=embeddings)
         query = st.text_input("Ask questions about your PDF file:")
         if query:
             docs = VectorStore.similarity_search(query=query, k=3)
             llm = OpenAI()
                 print(cb)
             st.write(response)
 if __name__ == '__main__':
     main()