Spaces:

mery22
/

testing

Sleeping

mery22 commited on May 24, 2024

Commit

6a7d03a

verified ·

1 Parent(s): 100db0c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -32,8 +32,25 @@ from transformers import AutoTokenizer, AutoModelForCausalLM
 tokenizer = AutoTokenizer.from_pretrained("mistralai/Mistral-7B-Instruct-v0.3")
 model = AutoModelForCausalLM.from_pretrained("mistralai/Mistral-7B-Instruct-v0.3")
-ectorstore=FAISS.load_local(folder_path="index.faiss", embeddings=HuggingFaceEmbeddings(model_name='sentence-transformers/all-MiniLM-L12-v2'), allow_dangerous_deserialization=True)# Connect query to FAISS index using a retriever
 retriever = db.as_retriever(
     search_type="mmr",
     search_kwargs={'k': 1}

 tokenizer = AutoTokenizer.from_pretrained("mistralai/Mistral-7B-Instruct-v0.3")
 model = AutoModelForCausalLM.from_pretrained("mistralai/Mistral-7B-Instruct-v0.3")
+from langchain_community.document_loaders import TextLoader
+from langchain_text_splitters import CharacterTextSplitter
+from google.colab import drive
+from langchain.document_loaders import PyPDFLoader, OnlinePDFLoader
+# Montez Google Drive
+loader = PyPDFLoader("test-1.pdf")
+data = loader.load()
+# split the documents into chunks
+text_splitter1 = CharacterTextSplitter(chunk_size=512, chunk_overlap=0,separator="\n\n")
+texts = text_splitter1.split_documents(data)
+db = FAISS.from_documents(texts,
+                          HuggingFaceEmbeddings(model_name='sentence-transformers/all-MiniLM-L12-v2'))
+# Connect query to FAISS index using a retriever
+retriever = db.as_retriever(
+    search_type="mmr",
+    search_kwargs={'k': 1}
 retriever = db.as_retriever(
     search_type="mmr",
     search_kwargs={'k': 1}