Spaces:

RCaz
/

Avatar_bot

Sleeping

solving AttributeError: 'dict' object has no attribute 'page_content'

#18

by RCaz - opened Apr 21

←

Files changed (1) hide show

app.py CHANGED Viewed

@@ -109,6 +109,7 @@ def format_source(doc):
 # reranker
 from ragatouille import RAGPretrainedModel
 reranker = RAGPretrainedModel.from_pretrained("colbert-ir/colbertv2.0")
@@ -164,19 +165,33 @@ def predict(message, history, request: gr.Request):
     relevant_docs = vectorstore.similarity_search(message,k=20)  #  retriever
     # Rerank using ColBERT through RAGatouille
-    relevant_docs = reranker.rerank(
         query=message,
         documents=[doc.page_content for doc in relevant_docs],
         k=10
     )
-    # Build context from retrieved documents
     context = "\nExtracted documents:\n" + "\n".join([
         f"Content document {i+1}: {doc.page_content}\n\n---"
         for i, doc in enumerate(relevant_docs)
     ])
     # RAG tool
     RAG_PROMPT_TEMPLATE="""You will be asked information related to Rémi Cazelles's specific projects, work and education.

 # reranker
 from ragatouille import RAGPretrainedModel
+from langchain.schema import Document
 reranker = RAGPretrainedModel.from_pretrained("colbert-ir/colbertv2.0")
     relevant_docs = vectorstore.similarity_search(message,k=20)  #  retriever
     # Rerank using ColBERT through RAGatouille
+    reranked_results = reranker.rerank(
         query=message,
         documents=[doc.page_content for doc in relevant_docs],
         k=10
     )
+    context = "\nExtracted documents:\n" + "\n".join([
+        f"Content document {i+1}: {doc.page_content}\n\n---"
+        for i, doc in enumerate(relevant_docs)
+    ])
+    # Convert back to LangChain Document objects
+    relevant_docs = [
+        Document(
+            page_content=doc['content'],
+            metadata={'rerank_score': doc['score'], 'rerank_rank': doc['rank']}
+        )
+        for doc in reranked_results
+    ]
+     # Build context from retrieved documents
     context = "\nExtracted documents:\n" + "\n".join([
         f"Content document {i+1}: {doc.page_content}\n\n---"
         for i, doc in enumerate(relevant_docs)
     ])
     # RAG tool
     RAG_PROMPT_TEMPLATE="""You will be asked information related to Rémi Cazelles's specific projects, work and education.