Spaces:

APPONTE
/

AgentPDF

Sleeping

App Files Files Community

AgentPDF / nodes /llm_agent.py

rwayz

Deploy

6b29104 8 months ago

raw

history blame contribute delete

10.4 kB

	"""
	Nó do agente LLM para o AgentPDF.

	Este nó é responsável por gerar respostas inteligentes usando GPT-4o-mini
	baseadas no contexto recuperado do PDF e na pergunta do usuário.
	"""

	from typing import Dict, Any
	from langchain_openai import ChatOpenAI
	from langchain_core.messages import AIMessage, SystemMessage, HumanMessage
	from langchain_core.runnables import RunnableConfig
	from langchain_core.prompts import ChatPromptTemplate

	from agents.state import PDFState, ProcessingStatus
	from utils.config import Config, get_openai_api_key
	from utils.logger import log_node_execution, main_logger


	def llm_agent_node(state: PDFState, config: RunnableConfig) -> Dict[str, Any]:
	"""
	Nó responsável por gerar respostas usando o LLM.

	Este nó:
	1. Recebe a pergunta e o contexto recuperado
	2. Constrói um prompt otimizado
	3. Chama o GPT-4o-mini para gerar a resposta
	4. Processa e valida a resposta
	5. Atualiza o estado com a resposta final

	Args:
	state: Estado atual do grafo
	config: Configuração do LangGraph

	Returns:
	Dict[str, Any]: Atualizações para o estado
	"""
	log_node_execution("LLM_AGENT", "START", "Iniciando geração de resposta")

	try:
	# Verifica se há pergunta e contexto
	user_question = state.get("user_question")
	retrieved_context = state.get("retrieved_context", [])

	if not user_question:
	error_msg = "Pergunta do usuário não encontrada"
	log_node_execution("LLM_AGENT", "ERROR", error_msg)
	return {
	"processing_status": ProcessingStatus.ERROR,
	"error_message": error_msg
	}

	# Verifica API key
	api_key = get_openai_api_key()
	if not api_key:
	error_msg = "Chave da API OpenAI não configurada"
	log_node_execution("LLM_AGENT", "ERROR", error_msg)
	return {
	"processing_status": ProcessingStatus.ERROR,
	"error_message": error_msg
	}

	log_node_execution(
	"LLM_AGENT",
	"PROCESSING",
	f"Gerando resposta para: '{user_question[:100]}...'"
	)

	# Cria o modelo LLM
	llm = create_llm_model()

	# Constrói o prompt
	prompt = build_prompt(user_question, retrieved_context)

	# Gera a resposta
	response = generate_response(llm, prompt)

	# Processa a resposta
	final_answer = process_response(response, user_question)

	# Cria mensagem de resposta
	ai_message = AIMessage(content=final_answer)

	log_node_execution(
	"LLM_AGENT",
	"SUCCESS",
	f"Resposta gerada: {len(final_answer)} caracteres"
	)

	return {
	"final_answer": final_answer,
	"messages": [ai_message],
	"processing_status": ProcessingStatus.COMPLETED,
	"error_message": None
	}

	except Exception as e:
	error_msg = f"Erro na geração de resposta: {str(e)}"
	log_node_execution("LLM_AGENT", "ERROR", error_msg)
	main_logger.exception("Erro detalhado na geração de resposta:")

	return {
	"processing_status": ProcessingStatus.ERROR,
	"error_message": error_msg
	}


	def create_llm_model() -> ChatOpenAI:
	"""
	Cria e configura o modelo LLM GPT-4o-mini.

	Returns:
	ChatOpenAI: Modelo LLM configurado
	"""
	model_config = Config.get_model_config()

	llm = ChatOpenAI(
	openai_api_key=get_openai_api_key(),
	model_name=model_config["model"],
	temperature=model_config["temperature"],
	max_tokens=model_config["max_tokens"],
	timeout=60,
	max_retries=3
	)

	main_logger.debug(f"Modelo LLM criado: {model_config['model']}")
	return llm


	def build_prompt(question: str, context_chunks: list) -> ChatPromptTemplate:
	"""
	Constrói um prompt otimizado para o LLM.

	Args:
	question: Pergunta do usuário
	context_chunks: Lista de chunks de contexto

	Returns:
	ChatPromptTemplate: Prompt construído
	"""
	# Combina o contexto
	context_text = "\n\n".join(context_chunks) if context_chunks else ""

	# Sistema de prompt em português
	system_prompt = """Você é um assistente especializado em análise de documentos PDF. Sua função é responder perguntas baseadas exclusivamente no conteúdo fornecido.

	INSTRUÇÕES IMPORTANTES:
	1. Use APENAS as informações do contexto fornecido para responder
	2. Se a informação não estiver no contexto, diga claramente que não encontrou a informação no documento
	3. Seja preciso, claro e objetivo em suas respostas
	4. Cite trechos relevantes do documento quando apropriado
	5. Mantenha um tom profissional e educativo
	6. Se a pergunta for ambígua, peça esclarecimentos
	7. Organize sua resposta de forma estruturada quando necessário

	FORMATO DA RESPOSTA:
	- Responda diretamente à pergunta
	- Use parágrafos para organizar ideias complexas
	- Inclua citações do documento quando relevante
	- Termine com um resumo se a resposta for longa"""

	# Template do prompt
	prompt_template = ChatPromptTemplate.from_messages([
	("system", system_prompt),
	("human", """CONTEXTO DO DOCUMENTO:
	{context}

	PERGUNTA DO USUÁRIO:
	{question}

	Por favor, responda à pergunta baseando-se exclusivamente no contexto fornecido.""")
	])

	return prompt_template.partial(context=context_text, question=question)


	def generate_response(llm: ChatOpenAI, prompt: ChatPromptTemplate) -> str:
	"""
	Gera a resposta usando o LLM.

	Args:
	llm: Modelo LLM
	prompt: Prompt construído

	Returns:
	str: Resposta gerada
	"""
	try:
	# Cria a chain
	chain = prompt \| llm

	# Gera a resposta
	response = chain.invoke({})

	# Extrai o conteúdo da resposta
	if hasattr(response, 'content'):
	return response.content
	else:
	return str(response)

	except Exception as e:
	main_logger.error(f"Erro na geração da resposta: {e}")
	raise


	def process_response(response: str, original_question: str) -> str:
	"""
	Processa e valida a resposta gerada.

	Args:
	response: Resposta bruta do LLM
	original_question: Pergunta original do usuário

	Returns:
	str: Resposta processada e validada
	"""
	if not response or not response.strip():
	return "Desculpe, não consegui gerar uma resposta adequada para sua pergunta."

	# Limpa a resposta
	cleaned_response = response.strip()

	# Valida se a resposta é adequada
	if len(cleaned_response) < 20:
	return f"Resposta muito curta gerada. Pergunta original: {original_question}\n\nResposta: {cleaned_response}"

	# Adiciona informações contextuais se necessário
	if "não encontrei" in cleaned_response.lower() or "não há informação" in cleaned_response.lower():
	cleaned_response += "\n\n💡 Dica: Tente reformular sua pergunta ou verificar se o PDF contém a informação desejada."

	return cleaned_response


	def create_fallback_response(question: str, error_msg: str = None) -> str:
	"""
	Cria uma resposta de fallback quando há erro.

	Args:
	question: Pergunta original
	error_msg: Mensagem de erro opcional

	Returns:
	str: Resposta de fallback
	"""
	base_response = f"""Desculpe, encontrei dificuldades para processar sua pergunta: "{question}"

	Isso pode ter acontecido por alguns motivos:
	1. O documento PDF pode não conter informações relacionadas à sua pergunta
	2. Pode haver um problema temporário com o processamento
	3. A pergunta pode precisar ser mais específica

	Sugestões:
	- Tente reformular sua pergunta de forma mais específica
	- Verifique se o PDF foi carregado corretamente
	- Certifique-se de que o documento contém a informação desejada"""

	if error_msg:
	base_response += f"\n\nDetalhes técnicos: {error_msg}"

	return base_response


	def validate_response_quality(response: str, question: str) -> tuple[bool, str]:
	"""
	Valida a qualidade da resposta gerada.

	Args:
	response: Resposta gerada
	question: Pergunta original

	Returns:
	tuple[bool, str]: (é_válida, motivo_se_inválida)
	"""
	if not response or len(response.strip()) < 10:
	return False, "Resposta muito curta ou vazia"

	# Verifica se a resposta é apenas uma repetição da pergunta
	if question.lower() in response.lower() and len(response) < len(question) * 2:
	return False, "Resposta parece ser apenas repetição da pergunta"

	# Verifica se há conteúdo substantivo
	words = response.split()
	if len(words) < 5:
	return False, "Resposta com muito poucas palavras"

	# Verifica padrões de resposta inadequada
	inadequate_patterns = [
	"não posso responder",
	"não tenho informação",
	"desculpe, mas não",
	"não é possível"
	]

	response_lower = response.lower()
	inadequate_count = sum(1 for pattern in inadequate_patterns if pattern in response_lower)

	if inadequate_count > 1:
	return False, "Resposta contém muitos padrões de inadequação"

	return True, "Resposta válida"


	def enhance_response_with_metadata(response: str, context_used: bool, num_sources: int) -> str:
	"""
	Melhora a resposta adicionando metadados úteis.

	Args:
	response: Resposta original
	context_used: Se contexto foi usado
	num_sources: Número de fontes consultadas

	Returns:
	str: Resposta melhorada
	"""
	enhanced_response = response

	# Adiciona informação sobre as fontes
	if context_used and num_sources > 0:
	enhanced_response += f"\n\n---\n📚 Resposta baseada em {num_sources} seção(ões) do documento."
	elif not context_used:
	enhanced_response += "\n\n---\n⚠️ Resposta gerada sem contexto específico do documento."

	return enhanced_response