Spaces:

caarleexx
/

PARA.AI

Runtime error

App Files Files Community

PARA.AI / core /base_specialist.py

Carlex22

ParaAIV3.6

2b9d72c 28 days ago

raw

history blame contribute delete

8.24 kB

	##PARA.AI/core/base_specialist.py
	"""
	Base Specialist - Classe base refatorada para todos os especialistas V13.6
	"""
	import logging
	import json
	import yaml
	from typing import Dict, Any, Optional
	from datetime import datetime
	from abc import ABC, abstractmethod

	logger = logging.getLogger(__name__)


	class BaseSpecialist(ABC):
	"""Classe base para todos os especialistas V13.6"""

	def __init__(
	self,
	specialist_id: int,
	config_path: str,
	llm_manager,
	schema_validator=None
	):
	self.id = specialist_id
	self.llm_manager = llm_manager
	self.schema_validator = schema_validator

	self.config = self._load_config(specialist_id, config_path)
	self.name = self.config.get('name', f'Specialist_{specialist_id}')
	self.prompt_template = self._load_prompt_template()
	self.llm_config = self.config.get('llm_config', {})
	self.max_retries = self.config.get('max_retries', 3)
	self.retry_delay = self.config.get('retry_delay', 2)

	logger.info(f"✅ {self.name} (ID {self.id}) inicializado")

	def _load_config(self, specialist_id: int, config_path: str) -> Dict[str, Any]:
	"""Carrega configuração do especialista do YAML"""
	try:
	with open(config_path, 'r', encoding='utf-8') as f:
	full_config = yaml.safe_load(f)

	specialist_config = full_config.get('specialists', {}).get(specialist_id, {})
	if not specialist_config:
	raise ValueError(f"Configuração não encontrada para especialista {specialist_id}")

	return specialist_config
	except Exception as e:
	logger.error(f"❌ Erro ao carregar config: {e}")
	raise

	def _load_prompt_template(self) -> str:
	"""Carrega template de prompt do arquivo .txt"""
	prompt_file = self.config.get('prompt_file', '')
	if not prompt_file:
	return ""

	try:
	with open(prompt_file, 'r', encoding='utf-8') as f:
	return f.read()
	except Exception as e:
	logger.error(f"❌ Erro ao carregar prompt: {e}")
	return ""

	async def process(
	self,
	input_data: Dict[str, Any],
	context: Optional[Dict[str, Any]] = None
	) -> Dict[str, Any]:
	"""Processa input com context injection e retry logic"""
	logger.info(f"🤖 {self.name} processando...")

	for attempt in range(self.max_retries):
	try:
	prompt = self._build_prompt(input_data, context)
	response = await self._call_llm(prompt)
	result = self._parse_response(response)

	if self.schema_validator:
	is_valid, errors = self._validate_output(result)
	if not is_valid and attempt < self.max_retries - 1:
	continue

	logger.info(f" ✅ {self.name} completou: {len(result)} campos")
	return result

	except Exception as e:
	logger.error(f" ❌ Tentativa {attempt + 1}/{self.max_retries} falhou: {e}")
	if attempt == self.max_retries - 1:
	return self._get_empty_structure()

	return self._get_empty_structure()

	def _build_prompt(
	self,
	input_data: Dict[str, Any],
	context: Optional[Dict[str, Any]] = None
	) -> str:
	"""Constrói prompt final com substituição de variáveis e context injection"""
	prompt = self.prompt_template

	# Substituir variáveis básicas
	prompt = prompt.replace('{ementa}', input_data.get('ementa', ''))
	prompt = prompt.replace('{inteiro_teor}', input_data.get('inteiro_teor', '')[:10000])

	# Substituir seções específicas
	if context:
	secoes = context.get('secoes_originais', {})
	prompt = prompt.replace('{RELATORIO_texto}', secoes.get('RELATORIO_texto_completo', '')[:5000])
	prompt = prompt.replace('{FUNDAMENTACAO_texto}', secoes.get('FUNDAMENTACAO_texto_completo', '')[:5000])
	prompt = prompt.replace('{DISPOSITIVO_texto}', secoes.get('DISPOSITIVO_texto_completo', '')[:3000])

	if 'metadados' in context:
	metadados_str = json.dumps(context['metadados'], indent=2, ensure_ascii=False)
	prompt = prompt.replace('{metadados}', metadados_str[:1000])

	# CONTEXT INJECTION
	if context:
	context_compact = self._compact_context(context)
	context_str = json.dumps(context_compact, indent=2, ensure_ascii=False)

	prompt += f"""

	━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
	JSON JÁ PREENCHIDO (contexto dos especialistas anteriores):
	━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

	{context_str}

	━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
	IMPORTANTE:
	- NÃO repita os campos acima
	- Complete APENAS os campos NOVOS da sua responsabilidade
	- Retorne SOMENTE JSON válido
	━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
	"""

	return prompt

	def _compact_context(self, context: Dict[str, Any]) -> Dict[str, Any]:
	"""Remove campos muito grandes do contexto"""
	compact = {}
	for key, value in context.items():
	if key in ['secoes_originais']:
	continue
	if isinstance(value, str) and len(value) > 500:
	compact[key] = value[:500] + "..."
	else:
	compact[key] = value
	return compact

	async def _call_llm(self, prompt: str) -> str:
	"""Chama LLM via LLMManager"""
	try:
	response = await self.llm_manager.generate(
	system_prompt=self.config.get('system_prompt', ''),
	user_prompt=prompt,
	temperature=self.llm_config.get('temperature', 0.3),
	max_tokens=self.llm_config.get('max_tokens', 2000),
	model=self.llm_config.get('model', 'groq/llama-3-70b')
	)
	return response
	except Exception as e:
	logger.error(f"❌ Erro ao chamar LLM: {e}")
	raise

	def _parse_response(self, response: str) -> Dict[str, Any]:
	"""Parse da resposta JSON do LLM"""
	try:
	response_clean = response.strip()
	if response_clean.startswith('```'):
	lines = response_clean.split('\n')
	response_clean = '\n'.join(lines[1:-1])

	result = json.loads(response_clean)
	return result
	except json.JSONDecodeError as e:
	logger.error(f"❌ Erro ao parsear JSON: {e}")
	raise

	def _validate_output(self, result: Dict[str, Any]) -> tuple[bool, list]:
	"""Valida output contra schema parcial"""
	if not self.schema_validator:
	return True, []

	schema_file = self.config.get('schema_file', '')
	if not schema_file:
	return True, []

	try:
	return self.schema_validator.validate_partial(result, schema_file)
	except Exception as e:
	return False, [str(e)]

	@abstractmethod
	def _get_empty_structure(self) -> Dict[str, Any]:
	"""Retorna estrutura vazia em caso de falha"""
	pass

	def get_info(self) -> Dict[str, Any]:
	"""Retorna informações sobre o especialista"""
	return {
	'id': self.id,
	'name': self.name,
	'enabled': self.config.get('enabled', True),
	'llm_model': self.llm_config.get('model', 'unknown'),
	'max_retries': self.max_retries
	}