Spaces:

akra35567
/

akira-index

Running

App Files Files Community

akira-index / modules /reply_context_handler.py

akra35567

Upload 20 files

d3a1a58 verified 18 days ago

raw

history blame contribute delete

25.3 kB

	# type: ignore
	"""
	================================================================================
	AKIRA V21 ULTIMATE - REPLY CONTEXT HANDLER MODULE
	================================================================================
	Sistema dedicado para processar e priorizar contexto de replies.
	Garante que replies tenham prioridade ligeiramente maior que o contexto geral,
	especialmente em perguntas curtas.

	Features:
	- Extração e processamento de metadados de reply
	- 3 níveis de prioridade (1=normal, 2=reply, 3=reply-to-bot+pergunta-curta)
	- Construção de prompt sections otimizadas para replies
	- Integração com ShortTermMemory
	- Context hint extraction para melhor compreensão
	================================================================================
	"""

	import os
	import sys
	import time
	import json
	import re
	import logging
	from typing import Optional, Dict, Any, List, Tuple
	from dataclasses import dataclass, field

	# Imports robustos com fallback - CORRIGIDO para usar modules.
	try:
	import modules.config as config
	from .short_term_memory import ShortTermMemory, MessageWithContext, IMPORTANCIA_REPLY, IMPORTANCIA_REPLY_TO_BOT, IMPORTANCIA_PERGUNTA_CURTA_REPLY
	REPLY_HANDLER_AVAILABLE = True
	except ImportError:
	try:
	from . import config
	from .short_term_memory import ShortTermMemory, MessageWithContext
	REPLY_HANDLER_AVAILABLE = True
	except ImportError:
	REPLY_HANDLER_AVAILABLE = False
	config = None

	logger = logging.getLogger(__name__)

	# ============================================================
	# NÍVEIS DE PRIORIDADE
	# ============================================================

	PRIORITY_NORMAL = 1
	PRIORITY_REPLY = 2
	PRIORITY_REPLY_TO_BOT = 3
	PRIORITY_REPLY_TO_BOT_SHORT_QUESTION = 4 # Prioridade máxima!

	# Limite de palavras para "pergunta curta"
	PERGUNTA_CURTA_LIMITE: int = 5


	@dataclass
	class ProcessedReplyContext:
	"""
	Contexto de reply processado e pronto para uso.

	Attributes:
	is_reply: Se é um reply
	reply_to_bot: Se é reply direcionado ao bot
	priority_level: Nível de prioridade (1-4)
	quoted_author_name: Nome do autor da mensagem citada
	quoted_author_numero: Número do autor
	quoted_text_original: Texto original citado
	mensagem_citada: Texto da mensagem citada
	context_hint: Hint de contexto extraído
	importancia: Peso de importância calculado
	prompt_section: Section formatada para o prompt
	should_prioritize_reply: Se deve priorizar no prompt
	adaptive_multiplier: Multiplicador adaptativo baseado no tamanho
	"""
	is_reply: bool = False
	reply_to_bot: bool = False
	priority_level: int = PRIORITY_NORMAL
	quoted_author_name: str = ""
	quoted_author_numero: str = ""
	quoted_text_original: str = ""
	mensagem_citada: str = ""
	context_hint: str = ""
	importancia: float = 1.0
	prompt_section: str = ""
	should_prioritize_reply: bool = False
	adaptive_multiplier: float = 1.0

	def to_dict(self) -> Dict[str, Any]:
	"""Converte para dicionário."""
	return {
	"is_reply": self.is_reply,
	"reply_to_bot": self.reply_to_bot,
	"priority_level": self.priority_level,
	"quoted_author_name": self.quoted_author_name,
	"quoted_author_numero": self.quoted_author_numero,
	"quoted_text_original": self.quoted_text_original,
	"mensagem_citada": self.mensagem_citada,
	"context_hint": self.context_hint,
	"importancia": self.importancia,
	"prompt_section": self.prompt_section,
	"should_prioritize_reply": self.should_prioritize_reply,
	"adaptive_multiplier": self.adaptive_multiplier
	}

	@classmethod
	def from_dict(cls, data: Dict[str, Any]) -> 'ProcessedReplyContext':
	"""Cria instância a partir de dicionário."""
	return cls(**{k: v for k, v in data.items() if k in cls.__dataclass_fields__})


	# ============================================================
	# FUNÇÕES AUXILIARES
	# ============================================================

	def contar_palavras(texto: str) -> int:
	"""Conta palavras em um texto."""
	if not texto:
	return 0
	return len(texto.split())


	def is_pergunta_curta(texto: str) -> bool:
	"""
	Verifica se o texto é uma pergunta curta.

	Args:
	texto: Texto a verificar

	Returns:
	True se for pergunta com pocas palavras
	"""
	if not texto:
	return False

	texto_lower = texto.strip().lower()
	word_count = contar_palavras(texto)

	# Deve ter marcador de pergunta ou palavras interrogativas
	has_question_marker = '?' in texto
	has_interrogative = any(w in texto_lower for w in [
	'qual', 'quais', 'quem', 'como', 'onde', 'quando', 'por que',
	'porque', 'para que', 'o que', 'que', 'é o que', 'vc', 'você',
	'tu', 'meu', 'minha', 'oq', 'oq', 'n'
	])

	return word_count <= PERGUNTA_CURTA_LIMITE and (has_question_marker or has_interrogative)


	def extrair_context_hint(quoted_text: str, mensagem_atual: str) -> str:
	"""
	Extrai hint de contexto baseado no texto citado e mensagem atual.

	Args:
	quoted_text: Texto original citado
	mensagem_atual: Mensagem atual do usuário

	Returns:
	String de hint de contexto
	"""
	hints = []

	# Detecta tipo de reply
	quoted_lower = quoted_text.lower() if quoted_text else ""

	# Pergunta sobre o bot
	if any(w in quoted_lower for w in ['akira', 'bot', 'você', 'vc', 'tu']):
	hints.append("pergunta_sobre_akira")

	# Pergunta factual
	if any(w in quoted_lower for w in ['oq', 'o que', 'qual', 'quanto', 'onde', 'quando']):
	hints.append("pergunta_factual")

	# Ironia/deboche detectado
	if any(w in quoted_lower for w in ['kkk', 'haha', '😂', '🤣', 'eita']):
	hints.append("tom_irreverente")

	# Expressão de opinião
	if any(w in quoted_lower for w in ['acho', 'penso', 'creio', 'imagino']):
	hints.append("expressao_opiniao")

	return " \| ".join(hints) if hints else "contexto_geral"


	def calcular_prioridade(
	is_reply: bool,
	reply_to_bot: bool,
	mensagem: str,
	quoted_text: str = ""
	) -> Tuple[int, float]:
	"""
	Calcula nível de prioridade e importância.

	Args:
	is_reply: Se é um reply
	reply_to_bot: Se é reply para o bot
	mensagem: Mensagem atual
	quoted_text: Texto citado

	Returns:
	Tupla (priority_level, importancia)
	"""
	if not is_reply:
	return PRIORITY_NORMAL, 1.0

	# Reply para o bot
	if reply_to_bot:
	# Pergunta curta = prioridade máxima
	if is_pergunta_curta(mensagem):
	return PRIORITY_REPLY_TO_BOT_SHORT_QUESTION, IMPORTANCIA_PERGUNTA_CURTA_REPLY
	# Reply normal ao bot
	return PRIORITY_REPLY_TO_BOT, IMPORTANCIA_REPLY_TO_BOT

	# Reply para outro usuário
	return PRIORITY_REPLY, IMPORTANCIA_REPLY


	# ============================================================
	# CLASSE PRINCIPAL
	# ============================================================

	class ReplyContextHandler:
	"""
	Handler dedicado para processar e priorizar contexto de replies.

	Funcionalidades:
	- Extração de metadados de reply do payload
	- Cálculo automático de prioridade
	- Construção de seções de prompt otimizadas
	- Integração com ShortTermMemory
	- Ajuste adaptativo baseado em tamanho da pergunta
	"""

	def __init__(self, short_term_memory: Optional[ShortTermMemory] = None):
	"""
	Inicializa o handler.

	Args:
	short_term_memory: Instância de ShortTermMemory (opcional)
	"""
	self.short_term_memory = short_term_memory
	logger.debug("✅ ReplyContextHandler inicializado")

	def process_reply(
	self,
	mensagem: str,
	reply_metadata: Dict[str, Any],
	historico_geral: Optional[List[Dict[str, Any]]] = None
	) -> ProcessedReplyContext:
	"""
	Processa metadados de reply e gera contexto processado.

	Args:
	mensagem: Mensagem atual do usuário
	reply_metadata: Metadados do reply do payload
	historico_geral: Histórico geral (opcional)

	Returns:
	ProcessedReplyContext pronto para uso
	"""
	# Extrai dados do metadata
	is_reply = reply_metadata.get('is_reply', False)
	reply_to_bot = reply_metadata.get('reply_to_bot', False)
	quoted_author_name = reply_metadata.get('quoted_author_name', '')
	quoted_author_numero = reply_metadata.get('quoted_author_numero', '')
	quoted_text_original = reply_metadata.get('quoted_text_original', '')
	mensagem_citada = reply_metadata.get('mensagem_citada', '') or quoted_text_original

	# 🔧 CORREÇÃO: Se autor é desconhecido, tenta detectar pelo contexto
	if not quoted_author_name or quoted_author_name.lower() in ['desconhecido', 'unknown', '']:
	# Detecta pelo conteúdo da mensagem citada
	quoted_lower = quoted_text_original.lower() if quoted_text_original else ""

	# Se a mensagem citada contém padrões de resposta do bot
	bot_patterns = ['akira:', 'eu sou', 'eu sou a akira', 'sou um bot', 'oi!', 'eae!']
	if any(p in quoted_lower for p in bot_patterns):
	quoted_author_name = "Akira (você mesmo)"
	quoted_author_numero = "BOT"
	reply_to_bot = True
	elif mensagem_citada:
	# Se há histórico, busca última mensagem
	if historico_geral:
	# Assumir que é reply para a última mensagem do bot
	quoted_author_name = "mensagem_anterior"
	quoted_author_numero = "unknown"

	# Se ainda não tem autor mas tem mensagem citada e é reply
	if is_reply and (not quoted_author_name or quoted_author_name == 'desconhecido'):
	# Se é reply_to_bot=True mas autor desconhecido, assume que é reply para o bot
	if reply_to_bot:
	quoted_author_name = "Akira (você mesmo)"
	quoted_author_numero = "BOT"
	else:
	# Tenta extrair do conteúdo
	quoted_author_name = "participante_desconhecido"

	# Calcula prioridade e importância
	priority_level, importancia = calcular_prioridade(
	is_reply=is_reply,
	reply_to_bot=reply_to_bot,
	mensagem=mensagem,
	quoted_text=quoted_text_original
	)

	# Extrai context hint
	context_hint = extrair_context_hint(quoted_text_original, mensagem)

	# Calcula multiplicador adaptativo
	adaptive_multiplier = self._calculate_adaptive_multiplier(
	mensagem=mensagem,
	is_reply=is_reply,
	priority_level=priority_level
	)

	# Determina se deve priorizar no prompt
	should_prioritize = is_reply and priority_level >= PRIORITY_REPLY

	# Constrói section do prompt
	prompt_section = self._build_reply_prompt_section(
	mensagem=mensagem,
	mensagem_citada=mensagem_citada,
	quoted_author_name=quoted_author_name,
	reply_to_bot=reply_to_bot,
	context_hint=context_hint,
	priority_level=priority_level
	)

	# Cria contexto processado
	reply_context = ProcessedReplyContext(
	is_reply=is_reply,
	reply_to_bot=reply_to_bot,
	priority_level=priority_level,
	quoted_author_name=quoted_author_name,
	quoted_author_numero=quoted_author_numero,
	quoted_text_original=quoted_text_original,
	mensagem_citada=mensagem_citada,
	context_hint=context_hint,
	importancia=importancia * adaptive_multiplier,
	prompt_section=prompt_section,
	should_prioritize_reply=should_prioritize,
	adaptive_multiplier=adaptive_multiplier
	)

	# Adiciona à memória de curto prazo se disponível
	if self.short_term_memory and is_reply:
	self.short_term_memory.add_message(
	role="user",
	content=mensagem,
	importancia=reply_context.importancia,
	reply_info={
	"is_reply": True,
	"reply_to_bot": reply_to_bot,
	"quoted_text_original": quoted_text_original,
	"priority_level": priority_level
	}
	)

	return reply_context

	def _calculate_adaptive_multiplier(
	self,
	mensagem: str,
	is_reply: bool,
	priority_level: int
	) -> float:
	"""
	Calcula multiplicador adaptativo baseado no tamanho da pergunta.

	Para perguntas curtas com reply, aumenta a importância do contexto do reply
	para garantir que o LLM tenha contexto suficiente.

	Args:
	mensagem: Mensagem atual
	is_reply: Se é reply
	priority_level: Nível de prioridade

	Returns:
	Multiplicador entre 1.0 e 2.0
	"""
	if not is_reply:
	return 1.0

	word_count = contar_palavras(mensagem)

	# Pergunta muito curta (< 3 palavras) = contexto crítico
	if word_count <= 2:
	return 1.5

	# Pergunta curta (3-5 palavras) = contexto importante
	if word_count <= PERGUNTA_CURTA_LIMITE:
	return 1.3

	# Pergunta normal = multiplicador padrão baseado em prioridade
	if priority_level == PRIORITY_REPLY_TO_BOT_SHORT_QUESTION:
	return 1.2
	elif priority_level == PRIORITY_REPLY_TO_BOT:
	return 1.1

	return 1.0

	def _build_reply_prompt_section(
	self,
	mensagem: str,
	mensagem_citada: str,
	quoted_author_name: str,
	reply_to_bot: bool,
	context_hint: str,
	priority_level: int
	) -> str:
	"""
	Constrói seção formatada do prompt para replies.

	Args:
	mensagem: Mensagem atual
	mensagem_citada: Texto citado
	quoted_author_name: Nome do autor
	reply_to_bot: Se é reply para o bot
	context_hint: Hint de contexto
	priority_level: Nível de prioridade

	Returns:
	String formatada para inserção no prompt
	"""
	if not mensagem_citada:
	return ""

	sections = []

	# Cabeçalho com nível de prioridade
	if priority_level >= PRIORITY_REPLY_TO_BOT_SHORT_QUESTION:
	sections.append("[🔴 REPLY CRÍTICO - PERGUNTA CURTA]")
	elif priority_level == PRIORITY_REPLY_TO_BOT:
	sections.append("[🟡 REPLY AO BOT]")
	elif priority_level == PRIORITY_REPLY:
	sections.append("[🟢 REPLY]")

	# Contexto do autor
	if reply_to_bot:
	sections.append(f"⚠️ VOCÊ ESTÁ SENDO DIRETAMENTE RESPONDIDO!")
	else:
	sections.append(f"Respondendo a: {quoted_author_name}")

	# Texto citado
	quoted_preview = mensagem_citada[:150] + ("..." if len(mensagem_citada) > 150 else "")
	sections.append(f"Msg citada: \"{quoted_preview}\"")

	# Hint de contexto
	if context_hint and context_hint != "contexto_geral":
	sections.append(f"Contexto: {context_hint}")

	# Instrução de resposta
	if priority_level >= PRIORITY_REPLY_TO_BOT_SHORT_QUESTION:
	sections.append("💡 RESPONSE: Contextualize sua resposta usando a mensagem citada!")
	elif reply_to_bot:
	sections.append("💡 RESPONSE: Você foi diretamente mencionado.")

	return "\n".join(sections)

	def prioritize_reply_context(
	self,
	prompt: str,
	reply_context: ProcessedReplyContext,
	historico_geral: Optional[List[Dict[str, Any]]] = None
	) -> str:
	"""
	Injeta contexto de reply no prompt com alta prioridade.

	Args:
	prompt: Prompt original
	reply_context: Contexto de reply processado
	historico_geral: Histórico geral (opcional)

	Returns:
	Prompt enriquecido com contexto de reply
	"""
	if not reply_context.is_reply or not reply_context.prompt_section:
	return prompt

	# Insere contexto de reply no início do prompt
	reply_block = f"""
	{'='*60}
	{reply_context.prompt_section}
	{'='*60}
	"""

	# Determina posição de inserção
	# Se há seção [SYSTEM], insere após ela
	if "[SYSTEM]" in prompt:
	# Encontra final da seção SYSTEM
	system_end = prompt.find("[/SYSTEM]")
	if system_end != -1:
	return prompt[:system_end + 10] + reply_block + prompt[system_end + 10:]

	# Caso contrário, insere no início
	return reply_block + "\n" + prompt

	def get_reply_summary_for_llm(self, reply_context: ProcessedReplyContext) -> str:
	"""
	Retorna resumo formatado do reply para contexto do LLM.

	Args:
	reply_context: Contexto de reply processado

	Returns:
	String resumida para uso no contexto
	"""
	if not reply_context.is_reply:
	return ""

	parts = []

	if reply_context.reply_to_bot:
	parts.append("REPLY DIRETO AO BOT")
	else:
	parts.append(f"REPLY a {reply_context.quoted_author_name}")

	if reply_context.mensagem_citada:
	cited = reply_context.mensagem_citada[:100]
	parts.append(f"Citando: \"{cited}\"")

	if reply_context.priority_level >= PRIORITY_REPLY_TO_BOT_SHORT_QUESTION:
	parts.append("PERGUNTA CURTA - Prioridade Alta")

	return " \| ".join(parts)

	def merge_reply_into_history(
	self,
	reply_context: ProcessedReplyContext,
	history: List[Dict[str, str]]
	) -> List[Dict[str, str]]:
	"""
	Mescla contexto de reply no histórico para o LLM.

	Args:
	reply_context: Contexto de reply processado
	history: Histórico formatado para LLM

	Returns:
	Histórico com reply injetado no início
	"""
	if not reply_context.is_reply:
	return history

	# Cria entry para o reply
	reply_entry = {
	"role": "user",
	"content": f"[REPLY] {reply_context.get_reply_summary_for_llm(reply_context)}"
	}

	# Adiciona texto citado se disponível
	if reply_context.mensagem_citada:
	reply_entry["content"] += f"\n\nMensagem citada:\n{reply_context.mensagem_citada}"

	# Insere no início do histórico
	return [reply_entry] + history

	def calculate_token_budget(
	self,
	reply_context: ProcessedReplyContext,
	total_budget: int = 8000
	) -> Tuple[int, int]:
	"""
	Calcula alocação de tokens entre reply e contexto geral.

	Args:
	reply_context: Contexto de reply
	total_budget: Total de tokens disponíveis

	Returns:
	Tupla (tokens_para_reply, tokens_para_contexto)
	"""
	if not reply_context.is_reply:
	return 0, total_budget

	# Pergunta curta com reply = mais tokens para reply
	if reply_context.priority_level >= PRIORITY_REPLY_TO_BOT_SHORT_QUESTION:
	reply_tokens = min(1500, int(total_budget * 0.25))
	elif reply_context.reply_to_bot:
	reply_tokens = min(1000, int(total_budget * 0.15))
	else:
	reply_tokens = min(800, int(total_budget * 0.10))

	return reply_tokens, total_budget - reply_tokens

	# ============================================================
	# HELPERS PARA API
	# ============================================================

	@staticmethod
	def extract_reply_metadata_from_request(data: Dict[str, Any]) -> Dict[str, Any]:
	"""
	Extrai metadados de reply de um request da API.

	Args:
	data: Payload do request

	Returns:
	Dict com metadados de reply
	"""
	reply_metadata = data.get('reply_metadata', {})

	# Se não há reply_metadata, tenta extrair de campos individuais
	if not reply_metadata:
	mensagem_citada = data.get('mensagem_citada', '')
	if mensagem_citada:
	reply_metadata = {
	'is_reply': True,
	'quoted_text_original': mensagem_citada,
	'mensagem_citada': mensagem_citada
	}
	else:
	return {'is_reply': False}

	# Garante campos obrigatórios
	return {
	'is_reply': reply_metadata.get('is_reply', False),
	'reply_to_bot': reply_metadata.get('reply_to_bot', False),
	'quoted_author_name': reply_metadata.get('quoted_author_name', ''),
	'quoted_author_numero': reply_metadata.get('quoted_author_numero', ''),
	'quoted_type': reply_metadata.get('quoted_type', 'texto'),
	'quoted_text_original': reply_metadata.get('quoted_text_original', ''),
	'context_hint': reply_metadata.get('context_hint', ''),
	'mensagem_citada': reply_metadata.get('mensagem_citada', '')
	}

	def validate_reply_priority(self, reply_context: ProcessedReplyContext) -> bool:
	"""
	Valida se a prioridade calculada está correta.

	Args:
	reply_context: Contexto a validar

	Returns:
	True se válido
	"""
	if not reply_context.is_reply:
	return reply_context.priority_level == PRIORITY_NORMAL

	# Reply para bot + pergunta curta deve ter prioridade máxima
	if reply_context.reply_to_bot and is_pergunta_curta(reply_context.mensagem_citada):
	return reply_context.priority_level == PRIORITY_REPLY_TO_BOT_SHORT_QUESTION

	# Reply para bot deve ter alta prioridade
	if reply_context.reply_to_bot:
	return reply_context.priority_level >= PRIORITY_REPLY_TO_BOT

	# Reply normal deve ter prioridade >= 2
	return reply_context.priority_level >= PRIORITY_REPLY

	def __repr__(self) -> str:
	"""Representação textual."""
	mem_status = "com STM" if self.short_term_memory else "sem STM"
	return f"ReplyContextHandler({mem_status})"


	# ============================================================
	# FUNÇÕES DE FÁBRICA
	# ============================================================

	def criar_reply_handler(
	short_term_memory: Optional[ShortTermMemory] = None
	) -> ReplyContextHandler:
	"""
	Factory function para criar ReplyContextHandler.

	Args:
	short_term_memory: Instância de ShortTermMemory (opcional)

	Returns:
	ReplyContextHandler instance
	"""
	return ReplyContextHandler(short_term_memory=short_term_memory)


	def processar_reply_request(
	mensagem: str,
	request_data: Dict[str, Any],
	short_term_memory: Optional[ShortTermMemory] = None
	) -> ProcessedReplyContext:
	"""
	Função helper para processar reply de request.

	Args:
	mensagem: Mensagem atual
	request_data: Payload do request
	short_term_memory: Instância de ShortTermMemory (opcional)

	Returns:
	ProcessedReplyContext
	"""
	handler = criar_reply_handler(short_term_memory)
	reply_metadata = handler.extract_reply_metadata_from_request(request_data)
	return handler.process_reply(mensagem, reply_metadata)


	# type: ignore