SucheRAG

Sleeping

alexkueck commited on Jul 6, 2024

Commit

1fac396

verified ·

1 Parent(s): 30ffe0e

Update utils.py

Files changed (1) hide show

utils.py CHANGED Viewed

@@ -386,26 +386,8 @@ def document_storage_chroma(splits):
     # Vectorstore initialisieren und Dokumente hinzufügen
     vectorstore = Chroma.from_documents(documents=splits, embedding=embedding_fn) #, persist_directory = PATH_WORK + CHROMA_DIR)
-    retriever = vectorstore.as_retriever(search_kwargs = {"k": ANZAHL_DOCS})
-    # Persist the vectorstore to disk
-    #vectorstore.persist()
-    return vectorstore, retriever
-############################################
-#dokumente in chroma db vektorisiert ablegen können - die Db vorbereiten daüfur
-"""
-def document_retrieval_chroma(llm, prompt):
-    #HF embeddings -----------------------------------
-    #Alternative Embedding - für Vektorstore, um Ähnlichkeitsvektoren zu erzeugen - die ...InstructEmbedding ist sehr rechenaufwendig
-    #embeddings = HuggingFaceInstructEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2", model_kwargs={"device": "cpu"})
-    #etwas weniger rechenaufwendig:
-    embeddings = HuggingFaceEmbeddings(model_name=EMBEDDING_MODELL, model_kwargs={"device": "cpu"}, encode_kwargs={'normalize_embeddings': False})
-    #ChromaDb um die embedings zu speichern
-    db = Chroma(embedding_function = embeddings, persist_directory = PATH_WORK + CHROMA_DIR)
-    return db
-"""

     # Vectorstore initialisieren und Dokumente hinzufügen
     vectorstore = Chroma.from_documents(documents=splits, embedding=embedding_fn) #, persist_directory = PATH_WORK + CHROMA_DIR)
+    return vectorstore