Spaces:

mery22
/

testing

Sleeping

mery22 commited on May 24, 2024

Commit

663e8a7

verified ·

1 Parent(s): 7633195

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -33,15 +33,7 @@ from transformers import AutoTokenizer, AutoModelForCausalLM
 tokenizer = AutoTokenizer.from_pretrained("mistralai/Mistral-7B-Instruct-v0.3")
 model = AutoModelForCausalLM.from_pretrained("mistralai/Mistral-7B-Instruct-v0.3")
-dataset= load_dataset("test-1.pdf")
-loader = PyPDFLoader(dataset)
-data = loader.load()
-text_splitter1 = CharacterTextSplitter(chunk_size=512, chunk_overlap=0,separator="\n\n")
-texts = text_splitter1.split_documents(data)
-db = FAISS.from_documents(texts,
-                          HuggingFaceEmbeddings(model_name='sentence-transformers/all-MiniLM-L12-v2'))
 # Connect query to FAISS index using a retriever
 retriever = db.as_retriever(
     search_type="mmr",

 tokenizer = AutoTokenizer.from_pretrained("mistralai/Mistral-7B-Instruct-v0.3")
 model = AutoModelForCausalLM.from_pretrained("mistralai/Mistral-7B-Instruct-v0.3")
+load_dataset("pandas", data_files="index.pkl")
 # Connect query to FAISS index using a retriever
 retriever = db.as_retriever(
     search_type="mmr",