Spaces:

rosvend
/

UPB-chatbot-rag

Runtime error

App Files Files Community

UPB-chatbot-rag / src /rag /chain.py

rosvend

feat: added rag chain with conversation memory

3849d4d 4 months ago

raw

history blame contribute delete

8.44 kB

	"""
	RAG Chain with Conversation Memory
	Implements conversational RAG with GPT-4o-mini and source citations.
	"""

	import os
	from pathlib import Path
	import sys
	from typing import List, Dict
	from operator import itemgetter

	sys.path.insert(0, str(Path(__file__).parent.parent))

	from langchain_openai import AzureChatOpenAI
	from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
	from langchain_core.output_parsers import StrOutputParser
	from langchain_core.runnables import RunnablePassthrough, RunnableLambda
	from langchain_core.messages import HumanMessage, AIMessage
	from langchain_core.documents import Document


	class UPBRAGChain:
	"""
	Conversational RAG chain for UPB career exploration.
	Features: GPT-4o-mini, conversation memory, source citations.
	"""

	def __init__(self, retriever, retrieval_method: str = "hybrid"):
	"""
	Initialize RAG chain with retriever.

	Args:
	retriever: UPBRetriever instance
	retrieval_method: Method for retrieval (bm25, similarity, mmr, hybrid)
	"""
	self.retriever = retriever
	self.retrieval_method = retrieval_method
	self.chat_history = []

	# Initialize LLM
	self.llm = AzureChatOpenAI(
	azure_deployment=os.getenv("AZURE_OPENAI_LLM_DEPLOYMENT", "gpt-4o-mini"),
	openai_api_version="2024-02-01",
	azure_endpoint=os.getenv("AZURE_OPENAI_ENDPOINT"),
	api_key=os.getenv("AZURE_OPENAI_API_KEY"),
	temperature=0.7,
	)

	# Create prompt template with conversation memory
	self.prompt = ChatPromptTemplate.from_messages([
	("system", """Eres un asistente virtual de la Universidad Pontificia Bolivariana (UPB) especializado en orientación académica.
	Tu rol es ayudar a estudiantes prospecto a explorar y comprender los programas de ingeniería ofrecidos por la UPB.

	Características de tus respuestas:
	- Usa un tono amigable, cercano y profesional
	- Responde en español de manera clara y concisa
	- Basa tus respuestas ÚNICAMENTE en el contexto proporcionado
	- Si no encuentras información relevante en el contexto, indícalo honestamente
	- Menciona las fuentes de información cuando sea relevante (ej: "Según el programa de Ingeniería de Sistemas...")
	- Si es apropiado, sugiere programas relacionados que puedan interesar al estudiante

	Contexto relevante:
	{context}"""),
	MessagesPlaceholder("chat_history"),
	("human", "{question}")
	])

	# Build the RAG chain
	self.chain = (
	RunnablePassthrough.assign(
	context=itemgetter("question") \| RunnableLambda(self._retrieve_and_format)
	)
	\| self.prompt
	\| self.llm
	\| StrOutputParser()
	)

	def _retrieve_and_format(self, question: str) -> str:
	"""
	Retrieve relevant documents and format them as context.

	Args:
	question: User question

	Returns:
	Formatted context string
	"""
	docs = self.retriever.retrieve(
	question,
	method=self.retrieval_method,
	k=4
	)

	# Store retrieved docs for source citations
	self.last_retrieved_docs = docs

	# Format documents with metadata
	formatted_docs = []
	for i, doc in enumerate(docs, 1):
	category = doc.metadata.get('category', 'general')
	source = doc.metadata.get('source', 'N/A')
	content = doc.page_content.strip()

	formatted_docs.append(
	f"[Documento {i} - {category}]\n{content}"
	)

	return "\n\n---\n\n".join(formatted_docs)

	def invoke(self, question: str, include_sources: bool = True) -> Dict:
	"""
	Invoke the RAG chain with a question.

	Args:
	question: User question
	include_sources: Whether to include source citations in response

	Returns:
	Dict with 'answer' and optionally 'sources'
	"""
	# Invoke chain with question and chat history
	answer = self.chain.invoke({
	"question": question,
	"chat_history": self.chat_history
	})

	# Update chat history
	self.chat_history.extend([
	HumanMessage(content=question),
	AIMessage(content=answer)
	])

	# Prepare response
	response = {"answer": answer}

	if include_sources and hasattr(self, 'last_retrieved_docs'):
	sources = []
	for doc in self.last_retrieved_docs:
	source_info = {
	"content": doc.page_content[:200] + "...",
	"category": doc.metadata.get('category', 'N/A'),
	"source": doc.metadata.get('source', 'N/A')
	}
	sources.append(source_info)
	response["sources"] = sources

	return response

	def clear_history(self):
	"""Clear conversation history."""
	self.chat_history = []

	def get_history_summary(self) -> str:
	"""Get a summary of conversation history."""
	if not self.chat_history:
	return "No hay historial de conversación."

	summary = []
	for i, msg in enumerate(self.chat_history):
	role = "Usuario" if isinstance(msg, HumanMessage) else "Asistente"
	content = msg.content[:100] + "..." if len(msg.content) > 100 else msg.content
	summary.append(f"{i+1}. {role}: {content}")

	return "\n".join(summary)


	if __name__ == "__main__":
	from setup_retrieval import setup_retrieval_system

	print("=" * 70)
	print("UPB RAG CHAIN - CONVERSATIONAL TEST")
	print("=" * 70)

	# Setup retrieval system
	print("\nInitializing retrieval system...")
	retriever, vectorstore_manager, chunks = setup_retrieval_system(
	vectorstore_path="vectorstore/faiss_index",
	use_existing=True
	)

	# Create RAG chain
	print("\nCreating RAG chain with GPT-4o-mini...")
	rag_chain = UPBRAGChain(retriever, retrieval_method="hybrid")
	print("RAG chain ready!")

	# Test conversation flow
	print("\n" + "=" * 70)
	print("CONVERSATION TEST")
	print("=" * 70)

	# Question 1
	question1 = "¿Qué carrera debo estudiar si me gusta la inteligencia artificial?"
	print(f"\nUsuario: {question1}")
	print("-" * 70)

	response1 = rag_chain.invoke(question1, include_sources=True)
	print(f"Asistente: {response1['answer']}")

	if 'sources' in response1:
	print("\n[Fuentes utilizadas]")
	for i, source in enumerate(response1['sources'], 1):
	print(f"{i}. Categoría: {source['category']}")
	print(f" Archivo: {source['source']}")
	print(f" Contenido: {source['content']}\n")

	# Question 2 (with context from previous question)
	print("\n" + "=" * 70)
	question2 = "¿Qué requisitos necesito para inscribirme?"
	print(f"Usuario: {question2}")
	print("-" * 70)

	response2 = rag_chain.invoke(question2, include_sources=True)
	print(f"Asistente: {response2['answer']}")

	if 'sources' in response2:
	print("\n[Fuentes utilizadas]")
	for i, source in enumerate(response2['sources'], 1):
	print(f"{i}. Categoría: {source['category']}")
	print(f" Archivo: {source['source']}")

	# Question 3 (memory test)
	print("\n" + "=" * 70)
	question3 = "¿Hay becas disponibles para ese programa?"
	print(f"Usuario: {question3}")
	print("-" * 70)

	response3 = rag_chain.invoke(question3, include_sources=True)
	print(f"Asistente: {response3['answer']}")

	# Show conversation history
	print("\n" + "=" * 70)
	print("HISTORIAL DE CONVERSACIÓN")
	print("=" * 70)
	print(rag_chain.get_history_summary())

	print("\n" + "=" * 70)
	print("RAG CHAIN TEST COMPLETE")
	print("=" * 70)
	print("\nFeatures tested:")
	print("- GPT-4o-mini integration")
	print("- Hybrid retrieval (BM25 + Vector with RRF)")
	print("- Conversation memory")
	print("- Source citations")
	print("- Multi-turn dialogue")