Spaces:

Writo
/

crypto_guru

Sleeping

Writo commited on Dec 30, 2023

Commit

474a5bc

1 Parent(s): 3b3afbd

Create app.py

Files changed (1) hide show

app.py ADDED Viewed

+from dotenv import load_dotenv
+import streamlit as st
+from PyPDF2 import PdfReader
+from langchain.text_splitter import CharacterTextSplitter
+from langchain.embeddings.openai import OpenAIEmbeddings
+from langchain.vectorstores import FAISS
+from langchain.chains.question_answering import load_qa_chain
+from langchain.llms import OpenAI
+def main():
+    load_dotenv()
+    st.set_page_config(page_title="Chat PDF")
+    st.header("Chat PDF 💬")
+    # upload file
+    pdf = st.file_uploader("Upload your PDF file", type="pdf")
+    # extract the text
+    if pdf is not None:
+      pdf_reader = PdfReader(pdf)
+      text = ""
+      for page in pdf_reader.pages:
+        text += page.extract_text()
+      # split into chunks
+      char_text_splitter = CharacterTextSplitter(separator="\n", chunk_size=1000,
+                                                 chunk_overlap=200,length_function=len)
+      text_chunks = char_text_splitter.split_text(text)
+      # create embeddings
+      embeddings = OpenAIEmbeddings()
+      docsearch = FAISS.from_texts(text_chunks, embeddings)
+      llm = OpenAI()
+      chain = load_qa_chain(llm, chain_type="stuff")
+      # show user input
+      query = st.text_input("Type your question:")
+      if query:
+        docs = docsearch.similarity_search(query)
+        response = chain.run(input_documents=docs, question=query)
+        st.write(response)
+if __name__ == '__main__':
+    main()