Spaces:

caarleexx
/

ToM

Sleeping

App Files Files Community

caarleexx commited on Dec 3, 2025

Commit

cb7613c

verified ·

1 Parent(s): 3d33243

Delete app.py

Browse files

Files changed (1) hide show

app.py +0 -523

app.py DELETED Viewed

@@ -1,523 +0,0 @@
-# -*- coding: utf-8 -*-
-"""
-Pipeline v10 Refatorada e Comentada - Chatbot com Metacognição Pura.
-Este arquivo implementa um chatbot avançado utilizando a API Google Gemini.
-A arquitetura se baseia em uma pipeline de múltiplos passos (P0-P8, X1-X2)
-que analisa, raciocina, gera cenários e verifica as respostas antes de
-entregá-las ao usuário.
-Esta versão inclui:
-- A lógica completa da pipeline com todos os passos.
-- Correções para a compatibilidade com o componente gr.Chatbot.
-- Logs de depuração detalhados para as chamadas da API Gemini.
-- Comentários extensivos em todo o código para fins didáticos.
-"""
-# ============================================================================
-# 1. IMPORTAÇÕES E CONFIGURAÇÃO INICIAL
-# ============================================================================
-# Módulos padrão do Python
-import json
-import os
-import base64
-import re
-import warnings
-from datetime import datetime
-from typing import Dict, List, Tuple, Any
-# Bibliotecas de terceiros
-import gradio as gr  # Para a criação da interface web
-import google.generativeai as genai  # SDK oficial do Google para a API Gemini
-# Ignora avisos de "FutureWarning" que podem ser gerados por dependências
-# da API do Google, mantendo o console mais limpo.
-warnings.filterwarnings("ignore", category=FutureWarning, module="google.api_core")
-# --- Configuração da API Gemini ---
-# Carrega a chave da API a partir de uma variável de ambiente chamada "GOOGLE_API_KEY".
-# Esta é uma prática de segurança essencial para não expor chaves secretas no código.
-API_KEY = os.getenv("GOOGLE_API_KEY")
-if not API_KEY:
-    # Se a chave não for encontrada, levanta um erro claro para o usuário.
-    raise ValueError("A variável de ambiente GOOGLE_API_KEY não foi configurada.")
-# Configura o SDK do Google com a chave de API fornecida.
-genai.configure(api_key=API_KEY)
-# --- Definição dos Modelos ---
-# Define os modelos a serem usados na pipeline.
-# O "Counselor" é responsável pela maior parte do raciocínio e geração.
-COUNSELOR_MODEL = genai.GenerativeModel("gemini-1.5-flash")
-# O "Supervisor" é um modelo focado na verificação final e garantia de qualidade.
-SUPERVISOR_MODEL = genai.GenerativeModel("gemini-1.5-flash")
-# Título que será exibido na interface do Gradio.
-TITLE = "# 🚀 Pipeline v10 REATORADA E COMENTADA\n**P0-P1 → X1-X2 → P2-P8 (com Metacognição Pura e Verificação)**"
-# ============================================================================
-# 2. PROMPTS CENTRALIZADOS
-# ============================================================================
-# Centralizar os prompts em um dicionário torna o código mais limpo, fácil de ler
-# e de manter. Cada chave corresponde a um passo da pipeline.
-PROMPTS = {
-    "P0_ALUNO": """
-Você é um METACOGNITIVO (pensamento interno, NÃO comunicação).
-TURNO ANTERIOR:
-User: {turno_anterior_user}
-Assistant: {turno_anterior_assistant}
-NOVA MENSAGEM: {pergunta}
-CONTEXTO VAGO: {historico_compacto}
----
-Responda EM METACOGNIÇÃO PURA - TELEGRÁFICO
-NÃO use frases completas. APENAS essência semântica com conectores mínimos.
-EXEMPLO CERTO: entendeu-sim | pergunta-nova | avança-tópico | não-reformulou
-RETORNE JSON:
-{{
-  "usuario_entendeu": "sim|não",
-  "evidencias": ["entendeu-pergunta", "pediu-clarificação"],
-  "usuario_corrigiu": "sim|não",
-  "correcao_detectada": null|"texto-correção",
-  "correcao_valida": "sim|não|null",
-  "o_que_melhorar": null|"explicar-X-melhor",
-  "decisao": "prosseguir-passo1|reexplicar-passo6|atualizar-resposta-anterior",
-  "motivo": "texto-curtíssimo"
-}}
-""",
-    "P1_TRIAGEM": """
-METACOGNIÇÃO - TRIAGEM INICIAL.
-CONTEXTO VAGO: {contexto_vago}
-HISTÓRICO RECENTE (últimas 3): {historico_recente}
-P0: {p0}
-PERGUNTA: {pergunta}
----
-CLASSIFIQUE EM TELEGRÁFICO (sem frases).
-RETORNE JSON:
-{{
-  "tipo": "objetiva|factual|subjetiva|aberta",
-  "sinais": ["tem-resposta-única-verificável", "sem-contexto-pessoal"],
-  "confianca": "alta|média|baixa",
-  "decisao": "responder-direto|analisar-profundamente",
-  "razao": "curtíssima",
-  "dados_fatuais": ["fato1", "fato2"],
-  "divergencias_fatuais": ["possível-ambiguidade-1"],
-  "objetivo_principal": "objetivo-primário-identificado",
-  "objetivo_secundario": ["objetivo-secundário-1"]
-}}
-""",
-    "X1_PERGUNTAS_NECESSARIAS": """
-X1-PERGUNTAS CRÍTICAS - TELEGRÁFICO
-P1: {p1}
-CONTEXTO: {historico_compacto}
-PERGUNTA PRINCIPAL: {pergunta}
----
-Analise as lacunas factuais e subjetivas na pergunta do usuário e no contexto.
-Liste as perguntas essenciais que você precisa responder internamente antes de formular a resposta final.
-RETORNE JSON:
-{{"perguntas": [
-  {{"texto": "pergunta-curta-e-essencial", "necessidade": "alta|média|baixa", "relevancia": "alta|média"}}
-]}}
-""",
-    "X2_RESOLVER_PERGUNTAS": """
-X2-RESOLUÇÃO INTERNA - TELEGRÁFICO
-P1: {p1}
-PERGUNTAS CRÍTICAS (X1): {perguntas_x1}
-CONTEXTO: {historico_compacto}
----
-Para cada pergunta crítica levantada no passo anterior, forneça uma resposta curta e direta baseada no seu conhecimento.
-Avalie sua confiança e o potencial de conflito ou ambiguidade em cada resposta.
-RETORNE JSON:
-{{"respostas": [
-  {{"pergunta": "texto-original-da-pergunta-x1",
-    "resposta": "resposta-curta-e-direta",
-    "confianca": "alta|média|baixa",
-    "conflito": "alto|médio|baixo",
-    "razao": "explicação-em-1-2-palavras"}}
-]}}
-""",
-    "P2_CENARIOS": """
-METACOGNIÇÃO - GERAÇÃO DE CENÁRIOS.
-CONTEXTO VAGO: {historico_compacto}
-TRIAGEM P1: {p1}
-X1-PERGUNTAS: {x1}
-X2-RESPOSTAS: {x2}
-PERGUNTA ORIGINAL: {pergunta}
----
-Mapeie cenários possíveis onde a resposta à pergunta original mudaria significativamente. Pense nas diferentes perspectivas, contextos ou premissas que alteram a conclusão. Use formato telegráfico.
-RETORNE JSON:
-{{
-  "cenarios": {{
-    "provaveis": [{{"id": "C1", "desc": "cenário-provável-1-comprimido", "contexto-relevante": "descreva-o-contexto"}}]
-  }},
-  "total": 1,
-  "tipo_resposta": "múltipla|unívoca",
-  "confianca": "alta|média|baixa",
-  "decisao": "prosseguir|pedir-esclarecimento",
-  "pergunta_esclarecimento": null|"texto-da-pergunta-para-o-usuario"
-}}
-""",
-    "P3_ISOLAR_CENARIOS": """
-METACOGNIÇÃO - EXPLORAÇÃO DE CENÁRIO ISOLADO.
-CENÁRIO P2: {cenario}
----
-Para este cenário específico, defina a essência da resposta em formato telegráfico. Qual seria a conclusão principal e quais as lacunas de informação restantes?
-RETORNE JSON:
-{{"id": "{cenario_id}",
-  "resposta_essencia": "conclusão-principal-e-razoes-em-palavras-chave",
-  "confianca": "alta|média|baixa",
-  "lacunas": "contexto-ainda-ausente|null"
-}}
-""",
-    "P4_CRUZAR_VALIDACOES": """
-METACOGNIÇÃO - ABSTRAÇÃO DE CONHECIMENTO.
-P1 (Triagem): {p1}
-P2 (Cenários): {p2}
-P3 (Exploração): {p3}
-X2 (Respostas Internas): {x2}
----
-Identifique os princípios fundamentais, teorias ou símbolos arquetípicos que sustentam as respostas nos cenários explorados. Abstraia o conhecimento para um nível mais alto. Use formato telegráfico.
-RETORNE JSON:
-{{"principios": [{{"nome": "Custo-Oportunidade", "essencia": "escolher-X-implica-renunciar-Y"}}],
-  "simbolos": [{{"nome": "Jornada-do-Herói", "essencia": "transformação-ocorre-através-de-desafios"}}],
-  "principio_central": "nome-do-principio-mais-importante",
-  "simbolo_dominante": "nome-do-simbolo-mais-relevante"
-}}
-""",
-    "P5_LACUNAS_FINAIS": """
-METACOGNIÇÃO - ANÁLISE DE INCERTEZA.
-P1 (Triagem): {p1}
-P4 (Princípios): {p4}
----
-Avalie o balanço entre certezas e dúvidas com base em toda a análise feita até agora. A informação disponível é suficiente para dar uma resposta confiante? Use formato telegráfico.
-RETORNE JSON:
-{{"analise_cenarios": [{{"cenario": "C1", "certezas": ["certeza1"], "duvidas": ["dúvida1"]}}],
-  "confianca_global": "alta|média|baixa",
-  "balanco": "certezas-superam|equilibrado|duvidas-superam",
-  "decisao": "responder|questionar",
-  "questionamento": null|"texto-da-pergunta-para-o-usuario-se-a-confianca-for-baixa"
-}}
-""",
-    "P6_PONDERAR": """
-METACOGNIÇÃO - JULGAMENTO FINAL (JUIZ DA VERDADE).
-P2 (Cenários): {p2}
-P4 (Princípios): {p4}
-P5 (Lacunas): {p5}
----
-Aja como um árbitro socrático. Com base em toda a metacognição, valide as "verdades" encontradas e decida o nível de consciência sobre a complexidade da resposta. Use formato telegráfico.
-RETORNE JSON:
-{{"verdade_principal": "a-conclusao-mais-provavel-e-confiavel",
-  "nuances_importantes": ["nuance1", "nuance2"],
-  "confianca_final": "alta|média|baixa",
-  "decisao": "exibir-resposta-completa|exibir-resposta-com-ressalvas|reprocessar",
-  "nivel_consciencia": "alto|médio|baixo"
-}}
-""",
-    "P7_SINTETIZAR": """
-Você é um SINTETIZADOR especialista em transformar METACOGNIÇÃO CRUA em PROSA HUMANIZADA e empática.
-DADOS DO JULGAMENTO (P6): {p6}
----
-TAREFA: Converta a análise telegráfica do 'Juiz da Verdade' em uma resposta textual fluida, natural e útil para o usuário.
-INSTRUÇÕES:
-1.  Use conectores naturais (ex: "porque", "portanto", "isso significa que").
-2.  Expanda abreviações e jargões para uma linguagem clara.
-3.  Estruture a resposta em parágrafos lógicos (introdução, desenvolvimento, nuances/conclusão).
-4.  Incorpore os princípios e nuances de forma natural na explicação.
-5.  Adote um tom de conselheiro: amigável, empático e empoderador.
-6.  NÃO invente informações. Baseie-se estritamente nos dados do P6.
-RETORNE A RESPOSTA EM PROSA DENTRO DE UM JSON:
-{{"resposta": "Aqui vai o texto fluido, natural e humano..."}}
-""",
-    "P8_VERIFICAR": """
-Você é um VERIFICADOR FINAL, um guardião rigoroso da qualidade da resposta.
-RESPOSTA SINTETIZADA (P7):
-{resposta_sintetizada}
-ANÁLISE DO JUIZ (P6):
-{p6}
----
-Realize uma verificação tripla na resposta sintetizada. Seja crítico.
-1.  **VERIFICAÇÃO FACTUAL**: A resposta contém fatos incorretos ou não sustentados pela análise do P6?
-2.  **VERIFICAÇÃO LÓGICA**: Existem falácias, saltos de lógica ou contradições? A conclusão segue a linha de raciocínio?
-3.  **VERIFICAÇÃO ÉTICA**: A resposta é apropriada, segura e imparcial? Inclui os avisos ou ressalvas necessários?
-RETORNE SEU VEREDITO EM JSON:
-{{"verificacao_factual": {{"aprovada": true|false, "problemas": ["descrição do problema se houver"]}},
-  "verificacao_logica": {{"aprovada": true|false, "problemas": []}},
-  "verificacao_etica": {{"aprovada": true|false, "problemas": []}},
-  "todas_aprovadas": true|false,
-  "decisao": "exibir-resposta-original|corrigir-e-exibir",
-  "resposta_corrigida": null|"texto da versão corrigida e melhorada da resposta"
-}}
-"""
-}
-# ============================================================================
-# 3. CLASSES E FUNÇÕES HELPERS (UTILITÁRIOS)
-# ============================================================================
-class Logger:
-    """
-    Uma classe simples para registrar logs formatados no console.
-    Ajuda a visualizar o fluxo de execução e a depurar problemas.
-    """
-    def __init__(self, verbose: bool = True):
-        self.verbose = verbose
-        self.logs = []
-    def log(self, msg: str, level: str = "INFO"):
-        """Registra uma mensagem de log com timestamp, nível e formatação."""
-        timestamp = datetime.now().strftime("%H:%M:%S")
-        log_msg = f"[{timestamp}] [{level.upper()}] {msg}"
-        self.logs.append(log_msg)
-        if self.verbose:
-            print(log_msg)
-            # Imprime uma linha divisória para logs importantes, melhorando a visualização.
-            if level.upper() in ["TASK", "START", "SUCCESS", "ERROR"]:
-                 print("=" * 70)
-# Instância global do Logger para ser usada em todo o script.
-logger = Logger(verbose=True)
-def processar_anexo(arquivo: Any) -> Tuple[str, str]:
-    """
-    Processa um arquivo enviado pela interface do Gradio.
-    Atualmente, a lógica de extração está simplificada, mas a estrutura
-    permite a implementação de leitores de PDF, imagens, etc.
-    Args:
-        arquivo: O objeto de arquivo vindo do Gradio.
-    Returns:
-        Uma tupla contendo (conteúdo_processado, tipo_do_arquivo).
-    """
-    if arquivo is None:
-        return "", "nenhum"
-    # O objeto 'arquivo' do Gradio tem um atributo '.name' que contém o caminho temporário do arquivo.
-    caminho_arquivo = arquivo.name
-    try:
-        if caminho_arquivo.lower().endswith('.pdf'):
-            # A lógica real de leitura de PDF (com PyPDF2, por exemplo) iria aqui.
-            logger.log("Arquivo PDF detectado.", "INFO")
-            return "[Conteúdo do PDF iria aqui]", "pdf"
-        elif any(caminho_arquivo.lower().endswith(ext) for ext in ['.png', '.jpg', '.jpeg', '.gif']):
-            # A lógica real de processamento de imagem (com Pillow, por exemplo) iria aqui.
-            logger.log("Arquivo de imagem detectado.", "INFO")
-            return "[Dados da imagem iriam aqui]", "imagem"
-        return "", "nao_suportado"
-    except Exception as e:
-        logger.log(f"Erro ao processar anexo: {e}", "ERROR")
-        return "", "erro"
-def construir_prompt_com_anexo(pergunta: str, anexo_conteudo: str, tipo_anexo: str) -> str:
-    """
-    Adiciona o conteúdo do anexo ao prompt da pergunta inicial para dar contexto ao modelo.
-    Args:
-        pergunta: A pergunta original do usuário.
-        anexo_conteudo: O conteúdo extraído do anexo.
-        tipo_anexo: O tipo do anexo ('pdf', 'imagem', etc.).
-    Returns:
-        O prompt final combinado.
-    """
-    if not anexo_conteudo or tipo_anexo in ["nenhum", "erro", "nao_suportado"]:
-        return pergunta
-    # Formata o prompt de maneira diferente dependendo do tipo de arquivo.
-    if tipo_anexo == "pdf":
-        return f"Com base no documento PDF abaixo, responda à pergunta.\n\nDOCUMENTO:\n---\n{anexo_conteudo}\n---\n\nPERGUNTA: {pergunta}"
-    if tipo_anexo == "imagem":
-        return f"Com base na imagem anexada, responda à pergunta: {pergunta}"
-    return pergunta
-def parse_json_ultra_robusto(texto: str) -> Dict:
-    """
-    Extrai um objeto JSON de uma string, mesmo que ela contenha texto adicional
-    ou formatação incorreta (como os marcadores ```json).
-    Args:
-        texto: A string retornada pela API que pode conter um JSON.
-    Returns:
-        Um dicionário Python com o JSON extraído ou um dicionário de erro.
-    """
-    if not texto:
-        return {"erro": "Texto de entrada vazio"}
-    # 1. Tenta extrair JSON de blocos de código (```json ... ```), que é comum em modelos de linguagem.
-    match = re.search(r'```(?:json)?\s*(\{.*?\})\s*```', texto, re.DOTALL)
-    if match:
-        json_str = match.group(1)
-    else:
-        json_str = texto
-    # 2. Tenta carregar a string extraída como JSON.
-    try:
-        return json.loads(json_str)
-    except json.JSONDecodeError:
-        # 3. Se falhar, tenta um método de "fallback": encontrar o primeiro '{' e o último '}'
-        # e tentar fazer o parse do conteúdo entre eles. Isso ajuda a limpar lixo no início/fim.
-        try:
-            inicio = json_str.find('{')
-            fim = json_str.rfind('}') + 1
-            if inicio != -1 and fim != 0:
-                return json.loads(json_str[inicio:fim])
-        except json.JSONDecodeError:
-            logger.log("Falha na extração robusta de JSON.", "WARN")
-            return {"erro": "parse_falhou", "fallback_text": texto[:500]}
-def chamar_gemini_json(modelo: genai.GenerativeModel, prompt: str, temperatura: float = 0.5, max_tokens: int = 2000) -> Dict:
-    """
-    Envia um prompt para o modelo Gemini, solicita uma saída JSON, analisa a resposta
-    e inclui logs detalhados para depuração.
-    Args:
-        modelo: A instância do modelo Gemini a ser usada.
-        prompt: O prompt formatado para a tarefa específica.
-        temperatura: Controla a criatividade da resposta (valores mais altos = mais criativo).
-        max_tokens: O número máximo de tokens na resposta.
-    Returns:
-        Um dicionário Python com a resposta do modelo ou um dicionário de erro.
-    """
-    # Adiciona uma instrução final e explícita ao prompt para garantir que o modelo retorne JSON.
-    prompt_completo = f"{prompt}\n\n---\n\n**INSTRUÇÃO OBRIGATÓRIA: Sua resposta DEVE ser um único e válido objeto JSON. Não inclua texto antes ou depois do JSON.**"
-    # === INÍCIO DO LOG DE DEPURAÇÃO (INPUT) ===
-    # Imprime o prompt exato que está sendo enviado para a API.
-    # Essencial para depurar o comportamento do modelo.
-    print("\n" + "="*25 + f" 💬 API INPUT PARA [{modelo.model_name}] " + "="*25)
-    print(prompt_completo)
-    print("="*78 + "\n")
-    logger.log(f"Enviando prompt ({len(prompt_completo)} chars) para {modelo.model_name}", "DEBUG")
-    # === FIM DO LOG DE DEPURAÇÃO (INPUT) ===
-    try:
-        # Realiza a chamada para a API Gemini.
-        response = modelo.generate_content(
-            prompt_completo,
-            generation_config=genai.types.GenerationConfig(
-                temperature=temperatura,
-                max_output_tokens=max_tokens,
-            )
-        )
-        # Extrai o texto da resposta.
-        resposta_bruta = response.text or ""
-        # === INÍCIO DO LOG DE DEPURAÇÃO (OUTPUT) ===
-        # Imprime a resposta bruta recebida da API antes de qualquer processamento.
-        # Crucial para ver o que o modelo realmente retornou.
-        print("\n" + "="*25 + f" 📥 API RAW OUTPUT DE [{modelo.model_name}] " + "="*25)
-        print(resposta_bruta)
-        print("="*78 + "\n")
-        logger.log(f"Gemini RAW ({len(resposta_bruta)} chars): {resposta_bruta[:400]}...", "DEBUG")
-        # === FIM DO LOG DE DEPURAÇÃO (OUTPUT) ===
-        # Usa o parser robusto para converter a resposta de texto em um dicionário Python.
-        resultado_json = parse_json_ultra_robusto(resposta_bruta)
-        return resultado_json
-    except Exception as e:
-        # Captura qualquer erro durante a chamada da API (ex: problemas de conexão, erros de permissão).
-        logger.log(f"Erro na chamada da API Gemini: {e}", "ERROR")
-        return {"erro": f"API_ERROR: {str(e)}"}
-def historico_compacto(historico: List[Dict]) -> str:
-    """
-    Gera uma string curta com as últimas interações do chat para usar como contexto nos prompts.
-    Args:
-        historico: O histórico de conversa no formato interno.
-    Returns:
-        Uma string resumida da conversa recente.
-    """
-    if not historico:
-        return "Nenhuma conversa anterior."
-    # Pega as últimas 4 mensagens, formata e junta em uma única string.
-    compacto = []
-    for msg in historico[-4:]:
-        role = "Usuário" if msg["role"] == "user" else "Assistente"
-        content = msg["content"].split('\n')[:80] # Pega só a primeira linha, até 80 caracteres.
-        compacto.append(f"{role}: {content}")
-    return "\n".join(compacto)
-def criar_dna() -> Dict:
-    """
-    Inicializa a estrutura de dados 'DNA' que armazena o estado e metadados da conversa.
-    Returns:
-        Um dicionário com a estrutura inicial do DNA.
-    """
-    return {
-        "historico_chat": [],
-        "meta": {"total_turnos": 0}
-    }
-# ============================================================================
-# 4. PASSOS DA PIPELINE (P0-P8, X1-X2)
-# ============================================================================
-# Cada função representa um passo de raciocínio da pipeline. Elas preparam
-# um prompt, chamam a API e retornam o resultado processado.
-def passo_0_aluno(pergunta: str, historico: List[Dict]) -> Dict:
-    """P0: Analisa a pergunta atual em relação à resposta anterior (metacognição)."""
-    logger.log("🧠 P0-ALUNO - Analisando feedback do usuário", "TASK")
-    turno_anterior_user = historico[-2]['content'] if len(historico) >= 2 else 'N/A'
-    turno_anterior_assistant = historico[-1]['content'] if len(historico) >= 1 else 'N/A'
-    prompt = PROMPTS["P0_ALUNO"].format(
-        turno_anterior_user=turno_anterior_user,
-        turno_anterior_assistant=turno_anterior_assistant,
-        pergunta=pergunta,
-        historico_compacto=historico_compacto(historico)
-    )
-    return chamar_gemini_json(COUNSELOR_MODEL, prompt, temperatura=0.3)
-def passo_1_triagem(pergunta: str, p0: Dict, hi