RAGDEV

Runtime error

App Files Files Community

alexkueck commited on Dec 29, 2023

Commit

ede8c32

1 Parent(s): ea6ffec

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -4

app.py CHANGED Viewed

@@ -329,6 +329,28 @@ def document_retrieval_chroma(llm, prompt):
     #ChromaDb um die embedings zu speichern
     db = Chroma(embedding_function = embeddings, persist_directory = PATH_WORK + CHROMA_DIR)
     return db
 ###########################################
 #dokumente in mongo db vektorisiert ablegen können - die Db vorbereiten daüfür
 def document_retrieval_mongodb(llm, prompt):
@@ -368,7 +390,6 @@ def rag_chain2(prompt, db, k=3):
     neu_prompt = rag_template
     for i, chunk in enumerate(retrieved_chunks):
         neu_prompt += f"{i+1}. {chunk}\n"
-    print("neu_prompt:.................")
     print(neu_prompt)
     return neu_prompt
@@ -492,14 +513,12 @@ def generate_text_zu_bild(file, prompt, k, rag_option):
             document_storage_chroma(splits)
         db = document_retrieval_chroma()
         #mit RAG:
-        print("hier!!!!!!!!!!!!!!!!!!!!")
         neu_text_mit_chunks = rag_chain2(prompt, db, k)
         #für Chat LLM:
         #prompt = generate_prompt_with_history_openai(neu_text_mit_chunks, history)
         #als reiner prompt:
         prompt_neu = generate_prompt_with_history(neu_text_mit_chunks, history)
-    print("prompt hier:.......................")
-    print(prompt_neu)
     headers, payload = process_image(file, prompt_neu)
     response = requests.post("https://api.openai.com/v1/chat/completions", headers=headers, json=payload)
     #als json ausgeben

     #ChromaDb um die embedings zu speichern
     db = Chroma(embedding_function = embeddings, persist_directory = PATH_WORK + CHROMA_DIR)
     return db
+############################################
+#dokumente in chroma db vektorisiert ablegen können - die Db vorbereiten daüfur
+#zweite Variante, passend zu rag_chain2 für generate_text_mit_bild- ohne llm vorher festlegen zu müssen
+def document_retrieval_chroma2():
+    #OpenAI embeddings -------------------------------
+    embeddings = OpenAIEmbeddings()
+    #HF embeddings -----------------------------------
+    #Alternative Embedding - für Vektorstore, um Ähnlichkeitsvektoren zu erzeugen - die ...InstructEmbedding ist sehr rechenaufwendig
+    #embeddings = HuggingFaceInstructEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2", model_kwargs={"device": "cpu"})
+    #etwas weniger rechenaufwendig:
+    #embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-mpnet-base-v2", model_kwargs={"device": "cpu"}, encode_kwargs={'normalize_embeddings': False})
+    #oder einfach ohne Langchain:
+    #embeddings = SentenceTransformerEmbeddings(model_name="all-MiniLM-L6-v2")
+    #ChromaDb um die embedings zu speichern
+    db = Chroma(embedding_function = embeddings, persist_directory = PATH_WORK + CHROMA_DIR)
+    print ("Chroma DB bereit ...................")
+    return db
 ###########################################
 #dokumente in mongo db vektorisiert ablegen können - die Db vorbereiten daüfür
 def document_retrieval_mongodb(llm, prompt):
     neu_prompt = rag_template
     for i, chunk in enumerate(retrieved_chunks):
         neu_prompt += f"{i+1}. {chunk}\n"
     print(neu_prompt)
     return neu_prompt
             document_storage_chroma(splits)
         db = document_retrieval_chroma()
         #mit RAG:
         neu_text_mit_chunks = rag_chain2(prompt, db, k)
         #für Chat LLM:
         #prompt = generate_prompt_with_history_openai(neu_text_mit_chunks, history)
         #als reiner prompt:
         prompt_neu = generate_prompt_with_history(neu_text_mit_chunks, history)
     headers, payload = process_image(file, prompt_neu)
     response = requests.post("https://api.openai.com/v1/chat/completions", headers=headers, json=payload)
     #als json ausgeben