Spaces:

tdecae
/

chatbot

Sleeping

tdecae commited on May 23, 2024

Commit

089299b

verified ·

1 Parent(s): 20e0c60

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -112,12 +112,14 @@ for f in os.listdir("multiple_docs"):
 splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=10)
 docs = splitter.split_documents(docs)
-# Convert the document chunks to embeddings
 embedding_model = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
-embeddings = [embedding_model.encode(doc.page_content) for doc in docs]
-# Save the embeddings to the vector store
-vectorstore = Chroma.from_embeddings(embeddings=embeddings, documents=docs, persist_directory="./data")
 vectorstore.persist()
 # Load the Hugging Face model for text generation
@@ -172,3 +174,4 @@ demo.launch(debug=True)

 splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=10)
 docs = splitter.split_documents(docs)
+# Extract the content from documents and create embeddings
 embedding_model = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
+texts = [doc.page_content for doc in docs]
+embeddings = embedding_model.encode(texts)
+# Create a Chroma vector store and add documents and their embeddings
+vectorstore = Chroma(persist_directory="./data")
+vectorstore.add_texts(texts, embeddings)
 vectorstore.persist()
 # Load the Hugging Face model for text generation