RAGDEV

Runtime error

App Files Files Community

alexkueck commited on Feb 16, 2024

Commit

dbef68c

verified ·

1 Parent(s): ce0c292

Update utils.py

Browse files

Files changed (1) hide show

utils.py +27 -16

utils.py CHANGED Viewed

@@ -280,7 +280,7 @@ def document_storage_chroma(splits):
     return vectorstore, retriever
 #Dokumente, die vom Retriever rausgesucht wurden auf Relevanz untersuchen
-def grade_documents_direct(state):
     print("---CHECK RELEVANCE---")
     # Data model
     class grade(BaseModel):
@@ -317,33 +317,21 @@ def grade_documents_direct(state):
     # Score
     filtered_docs = []
-    anzahl_relevant = 0
-    search = "nein"  # Default do not opt for re-questioning to supplement retrieval
     for d in documents:
         score = chain.invoke({"question": question, "context": d.page_content})
         grade = score[0].binary_score
         if grade == "ja":
-            #search = "nein"  # mind. ein relevantes Dokument -> keine Websuche nötig
             print("---Bewertung: Dokument ist relevant---")
-            anzahl_relevant = anzahl_relevant +1
             filtered_docs.append(d)
         else:
             print("---Bewertung: Dokument irrelevant---")
-            search = "ja"  # mind ein Dokument irrelevant -> Frage umformulieren
             continue
-    #wenn mehrheit der Dokumente relevant -> generieren starten damit
-    if (anzahl_relevant>= len(documents)/2):
-        search = "nein"
-    print("second trial grade_docs:.....................")
-    print(second_trial)
     return filtered_docs
 def transform_query_direct(query):
     print("---TRANSFORM QUERY---")
-    state_dict = state["keys"]
-    question = state_dict["question"]
-    documents = state_dict["documents"]
     # Create a prompt template with format instructions and the query
     prompt = PromptTemplate(
@@ -365,7 +353,7 @@ def transform_query_direct(query):
     better_question = chain.invoke({"question": question})
     second_trial="ja"
-    return {"keys": {"documents": documents, "question": better_question, "second_trial" : second_trial}}
 ###############################################
@@ -384,8 +372,30 @@ def llm_chain2(llm, prompt):
     return result
 #############################################
 #langchain nutzen, um prompt an llm zu leiten, aber vorher in der VektorDB suchen, um passende splits zum Prompt hinzuzufügen
-def rag_chain(llm, prompt, vectorstore, retriever):
     #Langgraph nutzen für ein wenig mehr Intelligenz beim Dokumente suchen
     workflow = StateGraph(GraphState)
     # Define the nodes
@@ -431,6 +441,7 @@ def rag_chain(llm, prompt, vectorstore, retriever):
     # Final generation
     return value['keys']['generation']
 ############################################
 # rag_chain Alternative für RAg mit Bild-Upload, da hier das llm so nicht genutzt werden kann und der prompt mit den RAG Erweiterungen anders übergeben wird

     return vectorstore, retriever
 #Dokumente, die vom Retriever rausgesucht wurden auf Relevanz untersuchen
+def grade_documents_direct(documents):
     print("---CHECK RELEVANCE---")
     # Data model
     class grade(BaseModel):
     # Score
     filtered_docs = []
     for d in documents:
         score = chain.invoke({"question": question, "context": d.page_content})
         grade = score[0].binary_score
         if grade == "ja":
             print("---Bewertung: Dokument ist relevant---")
             filtered_docs.append(d)
         else:
             print("---Bewertung: Dokument irrelevant---")
             continue
     return filtered_docs
 def transform_query_direct(query):
     print("---TRANSFORM QUERY---")
     # Create a prompt template with format instructions and the query
     prompt = PromptTemplate(
     better_question = chain.invoke({"question": question})
     second_trial="ja"
+    return better_question
 ###############################################
     return result
 #############################################
 #langchain nutzen, um prompt an llm zu leiten, aber vorher in der VektorDB suchen, um passende splits zum Prompt hinzuzufügen
+def rag_chain(llm, prompt,  retriever):
     #Langgraph nutzen für ein wenig mehr Intelligenz beim Dokumente suchen
+    relevant_docs = retriever.get_relevant_documents(prompt)
+    filtered_docs = grade_documents_direct(relevant_docs)
+    neu_prompt=prompt
+    if (len(filtered_docs)<2): #frage neu formulieren
+        neu_prompt = transform_query_direct(prompt)
+        relevant_docs = retriever.get_relevant_documents(neu_prompt)
+        filtered_docs = grade_documents_direct(relevant_docs)
+    if (len(filtered_docs)>0):
+        # Chain
+        rag_chain = prompt | llm | StrOutputParser()
+        # Run
+        result = rag_chain.invoke({"context": documents, "question": neu_prompt})
+    else:
+        #Normale Abfrage, da keine relevanten Dokumente gefunden
+        llm_chain = LLMChain(llm = llm, prompt = LLM_CHAIN_PROMPT)
+        result = llm_chain.run({"question": neu_prompt})
+    return result
+    """
     workflow = StateGraph(GraphState)
     # Define the nodes
     # Final generation
     return value['keys']['generation']
+    """
 ############################################
 # rag_chain Alternative für RAg mit Bild-Upload, da hier das llm so nicht genutzt werden kann und der prompt mit den RAG Erweiterungen anders übergeben wird