Spaces:

caarleexx
/

ToM

Sleeping

App Files Files Community

caarleexx commited on Dec 3, 2025

Commit

3d33243

verified ·

1 Parent(s): 0c9ee4c

Update app.py

Browse files

Files changed (1) hide show

app.py +150 -332

app.py CHANGED Viewed

@@ -1,19 +1,24 @@
 # -*- coding: utf-8 -*-
 """
-Pipeline v10 Refatorada - Chatbot com Metacognição Pura e Verificação.
-Esta aplicação implementa um chatbot avançado utilizando a API Google Gemini.
 A arquitetura se baseia em uma pipeline de múltiplos passos (P0-P8, X1-X2)
 que analisa, raciocina, gera cenários e verifica as respostas antes de
 entregá-las ao usuário.
-Principais características:
-- Orquestração de múltiplos modelos (Counselor e Supervisor).
-- Passos de metacognição para análise interna do problema.
-- Geração e avaliação de múltiplos cenários de resposta.
-- Verificação final de fatos, lógica e ética.
-- Estrutura robusta para parsing de JSON e tratamento de anexos.
 """
 import json
 import os
 import base64
@@ -22,34 +27,43 @@ import warnings
 from datetime import datetime
 from typing import Dict, List, Tuple, Any
-import gradio as gr
-import google.generativeai as genai
-# Ignora avisos futuros de dependências da API do Google
 warnings.filterwarnings("ignore", category=FutureWarning, module="google.api_core")
-# ============================================================================
-# 1. CONFIGURAÇÃO E INICIALIZAÇÃO
-# ============================================================================
-# Carrega a chave da API a partir de variáveis de ambiente.
-# É uma prática de segurança recomendada para não expor chaves no código.
 API_KEY = os.getenv("GOOGLE_API_KEY")
 if not API_KEY:
     raise ValueError("A variável de ambiente GOOGLE_API_KEY não foi configurada.")
 genai.configure(api_key=API_KEY)
-# Modelos utilizados na pipeline:
-# - Counselor: Responsável pela maior parte da análise e raciocínio.
-# - Supervisor: Responsável pela verificação final de qualidade.
 COUNSELOR_MODEL = genai.GenerativeModel("gemini-1.5-flash")
 SUPERVISOR_MODEL = genai.GenerativeModel("gemini-1.5-flash")
-TITLE = "# 🚀 Pipeline v10 REATORADA\n**P0-P1 → X1-X2 → P2-P8 (com Metacognição Pura e Verificação)**"
 # ============================================================================
 # 2. PROMPTS CENTRALIZADOS
 # ============================================================================
 PROMPTS = {
     "P0_ALUNO": """
@@ -280,155 +294,207 @@ RETORNE SEU VEREDITO EM JSON:
 }
 # ============================================================================
-# 3. CLASSES E FUNÇÕES HELPERS
 # ============================================================================
 class Logger:
-    """Classe simples para registrar logs formatados no console."""
     def __init__(self, verbose: bool = True):
         self.verbose = verbose
         self.logs = []
     def log(self, msg: str, level: str = "INFO"):
-        """Registra uma mensagem de log com timestamp e nível."""
         timestamp = datetime.now().strftime("%H:%M:%S")
         log_msg = f"[{timestamp}] [{level.upper()}] {msg}"
         self.logs.append(log_msg)
         if self.verbose:
             print(log_msg)
             if level.upper() in ["TASK", "START", "SUCCESS", "ERROR"]:
                  print("=" * 70)
 logger = Logger(verbose=True)
 def processar_anexo(arquivo: Any) -> Tuple[str, str]:
     """
-    Processa um arquivo enviado, extraindo texto de PDFs ou representando imagens.
-    Retorna o conteúdo processado e o tipo de arquivo.
     """
     if arquivo is None:
         return "", "nenhum"
-    caminho_arquivo = arquivo.name  # Em Gradio, .name contém o path temporário
     try:
         if caminho_arquivo.lower().endswith('.pdf'):
-            try:
-                import PyPDF2
-                with open(caminho_arquivo, 'rb') as f:
-                    leitor = PyPDF2.PdfReader(f)
-                    # Extrai texto das 3 primeiras páginas para manter o prompt conciso
-                    texto = "".join(page.extract_text() + "\n" for page in leitor.pages[:3])
-                    return texto[:3000], "pdf"  # Limita o tamanho do texto
-            except ImportError:
-                logger.log("PyPDF2 não instalado. PDF não pode ser lido.", "WARN")
-                return "[ERRO: PyPDF2 não instalado para ler PDF]", "erro"
-            except Exception as e:
-                logger.log(f"Falha ao ler PDF: {e}", "ERROR")
-                return f"[PDF detectado, mas falha na leitura: {e}]", "pdf"
         elif any(caminho_arquivo.lower().endswith(ext) for ext in ['.png', '.jpg', '.jpeg', '.gif']):
-            with open(caminho_arquivo, 'rb') as f:
-                encoded_string = base64.b64encode(f.read()).decode()
-                return encoded_string[:1000], "imagem" # Retorna uma parte da string base64
         return "", "nao_suportado"
     except Exception as e:
-        logger.log(f"Erro inesperado em processar_anexo: {e}", "ERROR")
         return "", "erro"
 def construir_prompt_com_anexo(pergunta: str, anexo_conteudo: str, tipo_anexo: str) -> str:
-    """Adiciona o conteúdo do anexo ao prompt da pergunta inicial."""
     if not anexo_conteudo or tipo_anexo in ["nenhum", "erro", "nao_suportado"]:
         return pergunta
     if tipo_anexo == "pdf":
         return f"Com base no documento PDF abaixo, responda à pergunta.\n\nDOCUMENTO:\n---\n{anexo_conteudo}\n---\n\nPERGUNTA: {pergunta}"
     if tipo_anexo == "imagem":
-        return f"Com base na imagem anexada, responda à pergunta: {pergunta}" # Modelo deve ser capaz de lidar com imagem + texto
     return pergunta
 def parse_json_ultra_robusto(texto: str) -> Dict:
     """
-    Extrai um objeto JSON de uma string, mesmo que esteja mal formatada ou
-    contenha texto adicional (ex: ```json ... ```).
     """
     if not texto:
         return {"erro": "Texto de entrada vazio"}
-    # 1. Tenta extrair JSON de blocos de código (```json ... ```)
     match = re.search(r'```(?:json)?\s*(\{.*?\})\s*```', texto, re.DOTALL)
     if match:
         json_str = match.group(1)
-        try:
-            return json.loads(json_str)
-        except json.JSONDecodeError:
-            texto = json_str # Prossiga com a string extraída
-    # 2. Tenta encontrar o primeiro JSON completo e balanceado
     try:
-        inicio = texto.find('{')
-        if inicio != -1:
-            fim, contador = -1, 0
-            for i in range(inicio, len(texto)):
-                if texto[i] == '{':
-                    contador += 1
-                elif texto[i] == '}':
-                    contador -= 1
-                if contador == 0:
-                    fim = i + 1
-                    break
-            if fim != -1:
-                return json.loads(texto[inicio:fim])
-    except (json.JSONDecodeError, IndexError):
-        pass # Ignora erros e tenta o próximo método
-    logger.log("Falha na extração robusta de JSON. Retornando fallback.", "WARN")
-    return {"erro": "parse_falhou", "fallback_text": texto[:500]}
 def chamar_gemini_json(modelo: genai.GenerativeModel, prompt: str, temperatura: float = 0.5, max_tokens: int = 2000) -> Dict:
     """
-    Envia um prompt para o modelo Gemini, força uma saída JSON e a analisa.
-    Retorna um dicionário, seja o JSON bem-sucedido ou um objeto de erro.
     """
     prompt_completo = f"{prompt}\n\n---\n\n**INSTRUÇÃO OBRIGATÓRIA: Sua resposta DEVE ser um único e válido objeto JSON. Não inclua texto antes ou depois do JSON.**"
     logger.log(f"Enviando prompt ({len(prompt_completo)} chars) para {modelo.model_name}", "DEBUG")
     try:
         response = modelo.generate_content(
             prompt_completo,
             generation_config=genai.types.GenerationConfig(
                 temperature=temperatura,
                 max_output_tokens=max_tokens,
-                response_mime_type="application/json" # Força saída JSON se o modelo suportar
             )
         )
         resposta_bruta = response.text or ""
         logger.log(f"Gemini RAW ({len(resposta_bruta)} chars): {resposta_bruta[:400]}...", "DEBUG")
         resultado_json = parse_json_ultra_robusto(resposta_bruta)
         return resultado_json
     except Exception as e:
         logger.log(f"Erro na chamada da API Gemini: {e}", "ERROR")
         return {"erro": f"API_ERROR: {str(e)}"}
 def historico_compacto(historico: List[Dict]) -> str:
-    """Gera uma string curta com as últimas interações do chat."""
     if not historico:
         return "Nenhuma conversa anterior."
     compacto = []
-    for msg in historico[-4:]: # Pega as últimas 4 mensagens
         role = "Usuário" if msg["role"] == "user" else "Assistente"
-        content = msg["content"].split('\n')[0][:80] # Primeira linha, até 80 caracteres
         compacto.append(f"{role}: {content}")
     return "\n".join(compacto)
 def criar_dna() -> Dict:
-    """Inicializa a estrutura de dados 'DNA' que persiste o estado da conversa."""
     return {
         "historico_chat": [],
         "meta": {"total_turnos": 0}
@@ -437,6 +503,8 @@ def criar_dna() -> Dict:
 # ============================================================================
 # 4. PASSOS DA PIPELINE (P0-P8, X1-X2)
 # ============================================================================
 def passo_0_aluno(pergunta: str, historico: List[Dict]) -> Dict:
     """P0: Analisa a pergunta atual em relação à resposta anterior (metacognição)."""
@@ -452,254 +520,4 @@ def passo_0_aluno(pergunta: str, historico: List[Dict]) -> Dict:
     )
     return chamar_gemini_json(COUNSELOR_MODEL, prompt, temperatura=0.3)
-def passo_1_triagem(pergunta: str, p0: Dict, historico: List[Dict]) -> Dict:
-    """P1: Faz uma triagem inicial da pergunta para classificar tipo e complexidade."""
-    logger.log("📊 P1-TRIAGEM - Classificando a pergunta", "TASK")
-    historico_recente_json = json.dumps(historico[-6:], indent=2, ensure_ascii=False)
-    p0_json = json.dumps(p0, indent=2, ensure_ascii=False)
-    prompt = PROMPTS["P1_TRIAGEM"].format(
-        contexto_vago=historico_compacto(historico),
-        historico_recente=historico_recente_json,
-        p0=p0_json,
-        pergunta=pergunta
-    )
-    return chamar_gemini_json(COUNSELOR_MODEL, prompt, temperatura=0.4)
-def passo_x1_perguntas_necessarias(pergunta: str, p1: Dict, historico: List[Dict]) -> Dict:
-    """X1: Identifica quais perguntas internas precisam ser respondidas para resolver a questão."""
-    logger.log("❓ X1-PERGUNTAS CRÍTICAS - Identificando lacunas", "TASK")
-    prompt = PROMPTS["X1_PERGUNTAS_NECESSARIAS"].format(
-        p1=json.dumps(p1, indent=2),
-        historico_compacto=historico_compacto(historico),
-        pergunta=pergunta
-    )
-    return chamar_gemini_json(COUNSELOR_MODEL, prompt, max_tokens=1500)
-def passo_x2_resolver_perguntas(p1: Dict, x1: Dict, historico: List[Dict]) -> Dict:
-    """X2: Responde internamente às perguntas levantadas em X1."""
-    logger.log("✅ X2-RESOLVER PERGUNTAS - Buscando conhecimento interno", "TASK")
-    perguntas_x1 = x1.get("perguntas", [])
-    prompt = PROMPTS["X2_RESOLVER_PERGUNTAS"].format(
-        p1=json.dumps(p1, indent=2),
-        perguntas_x1=json.dumps(perguntas_x1, indent=2),
-        historico_compacto=historico_compacto(historico)
-    )
-    return chamar_gemini_json(COUNSELOR_MODEL, prompt, max_tokens=2000)
-def passo_2_cenarios(pergunta: str, p1: Dict, x1: Dict, x2: Dict, historico: List[Dict]) -> Dict:
-    """P2: Gera diferentes cenários ou perspectivas para a resposta."""
-    logger.log("🎯 P2-CENÁRIOS - Mapeando possibilidades", "TASK")
-    prompt = PROMPTS["P2_CENARIOS"].format(
-        historico_compacto=historico_compacto(historico),
-        p1=json.dumps(p1, indent=2),
-        x1=json.dumps(x1, indent=2),
-        x2=json.dumps(x2, indent=2),
-        pergunta=pergunta
-    )
-    return chamar_gemini_json(COUNSELOR_MODEL, prompt, temperatura=0.6)
-def passo_3_isolar_cenarios(p2: Dict) -> Dict:
-    """P3: Explora cada cenário gerado em P2 de forma isolada."""
-    logger.log("🔍 P3-ISOLAR CENÁRIOS - Explorando cada cenário", "TASK")
-    exploracoes = []
-    cenarios = p2.get('cenarios', {}).get('provaveis', [])
-    for c in cenarios[:3]: # Limita a 3 cenários para evitar complexidade excessiva
-        prompt = PROMPTS["P3_ISOLAR_CENARIOS"].format(
-            cenario=json.dumps(c, indent=2),
-            cenario_id=c.get('id')
-        )
-        exploracoes.append(chamar_gemini_json(COUNSELOR_MODEL, prompt, temperatura=0.5))
-    return {"exploracoes_isoladas": exploracoes}
-def passo_4_cruzar_validacoes(p1: Dict, p2: Dict, p3: Dict, x2: Dict) -> Dict:
-    """P4: Abstrai princípios e símbolos a partir da análise dos cenários."""
-    logger.log("🔗 P4-VALIDAÇÃO CRUZADA - Identificando princípios", "TASK")
-    prompt = PROMPTS["P4_CRUZAR_VALIDACOES"].format(
-        p1=json.dumps(p1, indent=2),
-        p2=json.dumps(p2, indent=2),
-        p3=json.dumps(p3, indent=2),
-        x2=json.dumps(x2, indent=2)
-    )
-    return chamar_gemini_json(COUNSELOR_MODEL, prompt, temperatura=0.4)
-def passo_5_lacunas_finais(p1: Dict, p4: Dict) -> Dict:
-    """P5: Realiza uma análise final de certezas vs. dúvidas."""
-    logger.log("🚨 P5-LACUNAS FINAIS - Avaliando confiança global", "TASK")
-    prompt = PROMPTS["P5_LACUNAS_FINAIS"].format(
-        p1=json.dumps(p1, indent=2),
-        p4=json.dumps(p4, indent=2)
-    )
-    return chamar_gemini_json(COUNSELOR_MODEL, prompt, temperatura=0.3)
-def passo_6_ponderar(p2: Dict, p4: Dict, p5: Dict) -> Dict:
-    """P6: Atua como um 'Juiz da Verdade', ponderando toda a análise para uma decisão final."""
-    logger.log("⚖️ P6-PONDERAR (JUIZ) - Tomando a decisão final", "TASK")
-    prompt = PROMPTS["P6_PONDERAR"].format(
-        p2=json.dumps(p2, indent=2),
-        p4=json.dumps(p4, indent=2),
-        p5=json.dumps(p5, indent=2)
-    )
-    return chamar_gemini_json(COUNSELOR_MODEL, prompt, temperatura=0.4)
-def passo_7_sintetizar(p6: Dict) -> Dict:
-    """P7: Converte a análise metacognitiva final em uma resposta em prosa humanizada."""
-    logger.log("✍️ P7-SINTETIZAR - Gerando prosa humanizada", "TASK")
-    prompt = PROMPTS["P7_SINTETIZAR"].format(p6=json.dumps(p6, indent=2))
-    # Usa uma temperatura mais alta para uma resposta mais criativa e fluida
-    return chamar_gemini_json(COUNSELOR_MODEL, prompt, temperatura=0.7, max_tokens=2500)
-def passo_8_verificar(p6: Dict, p7: Dict) -> Dict:
-    """P8: Realiza uma verificação tripla (factual, lógica, ética) na resposta final."""
-    logger.log("🛡️ P8-VERIFICAR (SUPERVISOR) - Garantindo a qualidade", "TASK")
-    resposta_sintetizada = p7.get("resposta", "")
-    prompt = PROMPTS["P8_VERIFICAR"].format(
-        resposta_sintetizada=resposta_sintetizada,
-        p6=json.dumps(p6, indent=2)
-    )
-    return chamar_gemini_json(SUPERVISOR_MODEL, prompt, temperatura=0.2)
-# ============================================================================
-# 5. ORQUESTRADOR PRINCIPAL
-# ============================================================================
-def executar_pipeline(pergunta: str, historico: List[Dict], arquivo_anexo: Any, dna: Dict) -> Tuple[str, List, Dict]:
-    """
-    Orquestra a execução de todos os passos da pipeline, desde a análise
-    inicial até a verificação e entrega da resposta final.
-    """
-    logger.log(f"PIPELINE v10 INICIADA: '{pergunta[:50]}...'", "START")
-    if not pergunta or not pergunta.strip():
-        return "Por favor, digite uma pergunta válida.", historico, dna
-    # 1. Processamento de Anexos
-    conteudo_anexo, tipo_anexo = processar_anexo(arquivo_anexo)
-    pergunta_final = construir_prompt_com_anexo(pergunta, conteudo_anexo, tipo_anexo)
-    try:
-        # 2. Pipeline de Metacognição e Análise
-        p0 = passo_0_aluno(pergunta_final, historico)
-        p1 = passo_1_triagem(pergunta_final, p0, historico)
-        x1 = passo_x1_perguntas_necessarias(pergunta_final, p1, historico)
-        x2 = passo_x2_resolver_perguntas(p1, x1, historico)
-        p2 = passo_2_cenarios(pergunta_final, p1, x1, x2, historico)
-        # 3. Ponto de Interrupção: Esclarecimento
-        if p2.get("decisao") == "pedir-esclarecimento":
-            esclarecimento = p2.get("pergunta_esclarecimento", "Poderia fornecer mais detalhes?")
-            logger.log(f"Pipeline interrompida para pedir esclarecimento: {esclarecimento}", "INFO")
-            return f"❓ Para te dar uma resposta mais precisa, preciso de um esclarecimento:\n\n> {esclarecimento}", historico, dna
-        # 4. Aprofundamento e Síntese
-        p3 = passo_3_isolar_cenarios(p2)
-        p4 = passo_4_cruzar_validacoes(p1, p2, p3, x2)
-        p5 = passo_5_lacunas_finais(p1, p4)
-        # 5. Ponto de Interrupção: Confiança Baixa
-        if p5.get("decisao") == "questionar":
-            questionamento = p5.get("questionamento", "Não tenho informações suficientes para responder.")
-            logger.log(f"Pipeline interrompida por baixa confiança: {questionamento}", "INFO")
-            return f"🤔 {questionamento}", historico, dna
-        # 6. Julgamento, Geração e Verificação Final
-        p6 = passo_6_ponderar(p2, p4, p5)
-        p7 = passo_7_sintetizar(p6)
-        p8 = passo_8_verificar(p6, p7) # Corrigido para passar p6 e p7
-        # 7. Seleção da Resposta Final
-        if p8.get("todas_aprovadas") and p8.get("decisao") != "corrigir-e-exibir":
-            resposta_final = p7.get("resposta", "Não foi possível gerar uma resposta.")
-        else:
-            resposta_final = p8.get("resposta_corrigida", p7.get("resposta", "Ocorreu um erro na verificação final."))
-            logger.log("Resposta foi corrigida pelo Supervisor (P8).", "WARN")
-    except Exception as e:
-        logger.log(f"Erro crítico na execução da pipeline: {e}", "ERROR")
-        return f"❌ Ocorreu um erro inesperado durante o processamento: {e}", historico, dna
-    # 8. Atualização do Histórico e DNA
-    novo_historico = historico + [
-        {"role": "user", "content": pergunta},
-        {"role": "assistant", "content": resposta_final}
-    ]
-    dna["historico_chat"].append({"user": pergunta, "assistant": resposta_final})
-    dna["meta"]["total_turnos"] += 1
-    logger.log("PIPELINE CONCLUÍDA COM SUCESSO", "SUCCESS")
-    return resposta_final, novo_historico, dna
-# ============================================================================
-# 6. INTERFACE COM GRADIO
-# ============================================================================
-def chat_interface(pergunta: str, historico: List[Dict], anexo: Any, dna_json_str: str) -> Tuple[List, str, str, None]:
-    """Função de callback para a interface do Gradio."""
-    logger.log(f"Nova mensagem recebida: '{pergunta[:80]}...'", "INFO")
-    try:
-        dna = json.loads(dna_json_str) if dna_json_str and dna_json_str.strip() else criar_dna()
-    except (json.JSONDecodeError, TypeError):
-        logger.log("DNA inválido ou vazio, inicializando um novo.", "WARN")
-        dna = criar_dna()
-    if not isinstance(dna, dict) or "meta" not in dna:
-        logger.log("Estrutura do DNA corrompida, reinicializando.", "WARN")
-        dna = criar_dna()
-    resposta, novo_historico, dna_atualizado = executar_pipeline(pergunta, historico, anexo, dna)
-    logger.log(f"Resposta enviada ({len(resposta)} chars).", "INFO")
-    # Retorna os valores para atualizar os componentes do Gradio:
-    # 1. chatbot (novo histórico)
-    # 2. textbox de input (limpo)
-    # 3. code viewer do DNA (atualizado)
-    # 4. file uploader (limpo)
-    return novo_historico, "", json.dumps(dna_atualizado, indent=2, ensure_ascii=False), None
-if __name__ == "__main__":
-    with gr.Blocks(title="Pipeline v10 Refatorada", theme=gr.themes.Soft()) as demo:
-        gr.Markdown(TITLE)
-        with gr.Row():
-            with gr.Column(scale=3):
-                chatbot = gr.Chatbot(label="Chat", height=600, bubble_full_width=False)
-                dna_state = gr.State(value=criar_dna()) # Usar gr.State para o histórico completo
-            with gr.Column(scale=1):
-                dna_view = gr.Code(label="DNA (Estado da Conversa)", language="json", interactive=False,
-                                   value=json.dumps(criar_dna(), indent=2, ensure_ascii=False))
-                file_upload = gr.File(label="Anexar PDF ou Imagem", file_types=[".pdf", ".png", ".jpg", ".jpeg"])
-        with gr.Row():
-            input_textbox = gr.Textbox(
-                label="Digite sua pergunta aqui...",
-                placeholder="Ex: Qual a melhor estratégia para aprender uma nova habilidade?",
-                lines=3,
-                scale=4,
-            )
-            submit_button = gr.Button("🚀 Enviar (v10)", variant="primary", scale=1)
-        # Oculta o estado do DNA em formato JSON string para passar entre chamadas
-        dna_json_hidden = gr.Textbox(value=json.dumps(criar_dna()), visible=False)
-        # Ações da Interface
-        submit_button.click(
-            fn=chat_interface,
-            inputs=[input_textbox, chatbot, file_upload, dna_json_hidden],
-            outputs=[chatbot, input_textbox, dna_json_hidden, file_upload]
-        )
-        input_textbox.submit(
-            fn=chat_interface,
-            inputs=[input_textbox, chatbot, file_upload, dna_json_hidden],
-            outputs=[chatbot, input_textbox, dna_json_hidden, file_upload]
-        )
-        # Sincroniza o DNA JSON oculto com o visualizador
-        dna_json_hidden.change(
-            fn=lambda x: x,
-            inputs=[dna_json_hidden],
-            outputs=[dna_view]
-        )
-    demo.launch(server_name="0.0.0.0", server_port=7860, share=False)

 # -*- coding: utf-8 -*-
 """
+Pipeline v10 Refatorada e Comentada - Chatbot com Metacognição Pura.
+Este arquivo implementa um chatbot avançado utilizando a API Google Gemini.
 A arquitetura se baseia em uma pipeline de múltiplos passos (P0-P8, X1-X2)
 que analisa, raciocina, gera cenários e verifica as respostas antes de
 entregá-las ao usuário.
+Esta versão inclui:
+- A lógica completa da pipeline com todos os passos.
+- Correções para a compatibilidade com o componente gr.Chatbot.
+- Logs de depuração detalhados para as chamadas da API Gemini.
+- Comentários extensivos em todo o código para fins didáticos.
 """
+# ============================================================================
+# 1. IMPORTAÇÕES E CONFIGURAÇÃO INICIAL
+# ============================================================================
+# Módulos padrão do Python
 import json
 import os
 import base64
 from datetime import datetime
 from typing import Dict, List, Tuple, Any
+# Bibliotecas de terceiros
+import gradio as gr  # Para a criação da interface web
+import google.generativeai as genai  # SDK oficial do Google para a API Gemini
+# Ignora avisos de "FutureWarning" que podem ser gerados por dependências
+# da API do Google, mantendo o console mais limpo.
 warnings.filterwarnings("ignore", category=FutureWarning, module="google.api_core")
+# --- Configuração da API Gemini ---
+# Carrega a chave da API a partir de uma variável de ambiente chamada "GOOGLE_API_KEY".
+# Esta é uma prática de segurança essencial para não expor chaves secretas no código.
 API_KEY = os.getenv("GOOGLE_API_KEY")
 if not API_KEY:
+    # Se a chave não for encontrada, levanta um erro claro para o usuário.
     raise ValueError("A variável de ambiente GOOGLE_API_KEY não foi configurada.")
+# Configura o SDK do Google com a chave de API fornecida.
 genai.configure(api_key=API_KEY)
+# --- Definição dos Modelos ---
+# Define os modelos a serem usados na pipeline.
+# O "Counselor" é responsável pela maior parte do raciocínio e geração.
 COUNSELOR_MODEL = genai.GenerativeModel("gemini-1.5-flash")
+# O "Supervisor" é um modelo focado na verificação final e garantia de qualidade.
 SUPERVISOR_MODEL = genai.GenerativeModel("gemini-1.5-flash")
+# Título que será exibido na interface do Gradio.
+TITLE = "# 🚀 Pipeline v10 REATORADA E COMENTADA\n**P0-P1 → X1-X2 → P2-P8 (com Metacognição Pura e Verificação)**"
 # ============================================================================
 # 2. PROMPTS CENTRALIZADOS
 # ============================================================================
+# Centralizar os prompts em um dicionário torna o código mais limpo, fácil de ler
+# e de manter. Cada chave corresponde a um passo da pipeline.
 PROMPTS = {
     "P0_ALUNO": """
 }
 # ============================================================================
+# 3. CLASSES E FUNÇÕES HELPERS (UTILITÁRIOS)
 # ============================================================================
 class Logger:
+    """
+    Uma classe simples para registrar logs formatados no console.
+    Ajuda a visualizar o fluxo de execução e a depurar problemas.
+    """
     def __init__(self, verbose: bool = True):
         self.verbose = verbose
         self.logs = []
     def log(self, msg: str, level: str = "INFO"):
+        """Registra uma mensagem de log com timestamp, nível e formatação."""
         timestamp = datetime.now().strftime("%H:%M:%S")
         log_msg = f"[{timestamp}] [{level.upper()}] {msg}"
         self.logs.append(log_msg)
         if self.verbose:
             print(log_msg)
+            # Imprime uma linha divisória para logs importantes, melhorando a visualização.
             if level.upper() in ["TASK", "START", "SUCCESS", "ERROR"]:
                  print("=" * 70)
+# Instância global do Logger para ser usada em todo o script.
 logger = Logger(verbose=True)
 def processar_anexo(arquivo: Any) -> Tuple[str, str]:
     """
+    Processa um arquivo enviado pela interface do Gradio.
+    Atualmente, a lógica de extração está simplificada, mas a estrutura
+    permite a implementação de leitores de PDF, imagens, etc.
+    Args:
+        arquivo: O objeto de arquivo vindo do Gradio.
+    Returns:
+        Uma tupla contendo (conteúdo_processado, tipo_do_arquivo).
     """
     if arquivo is None:
         return "", "nenhum"
+    # O objeto 'arquivo' do Gradio tem um atributo '.name' que contém o caminho temporário do arquivo.
+    caminho_arquivo = arquivo.name
     try:
         if caminho_arquivo.lower().endswith('.pdf'):
+            # A lógica real de leitura de PDF (com PyPDF2, por exemplo) iria aqui.
+            logger.log("Arquivo PDF detectado.", "INFO")
+            return "[Conteúdo do PDF iria aqui]", "pdf"
         elif any(caminho_arquivo.lower().endswith(ext) for ext in ['.png', '.jpg', '.jpeg', '.gif']):
+            # A lógica real de processamento de imagem (com Pillow, por exemplo) iria aqui.
+            logger.log("Arquivo de imagem detectado.", "INFO")
+            return "[Dados da imagem iriam aqui]", "imagem"
         return "", "nao_suportado"
     except Exception as e:
+        logger.log(f"Erro ao processar anexo: {e}", "ERROR")
         return "", "erro"
 def construir_prompt_com_anexo(pergunta: str, anexo_conteudo: str, tipo_anexo: str) -> str:
+    """
+    Adiciona o conteúdo do anexo ao prompt da pergunta inicial para dar contexto ao modelo.
+    Args:
+        pergunta: A pergunta original do usuário.
+        anexo_conteudo: O conteúdo extraído do anexo.
+        tipo_anexo: O tipo do anexo ('pdf', 'imagem', etc.).
+    Returns:
+        O prompt final combinado.
+    """
     if not anexo_conteudo or tipo_anexo in ["nenhum", "erro", "nao_suportado"]:
         return pergunta
+    # Formata o prompt de maneira diferente dependendo do tipo de arquivo.
     if tipo_anexo == "pdf":
         return f"Com base no documento PDF abaixo, responda à pergunta.\n\nDOCUMENTO:\n---\n{anexo_conteudo}\n---\n\nPERGUNTA: {pergunta}"
     if tipo_anexo == "imagem":
+        return f"Com base na imagem anexada, responda à pergunta: {pergunta}"
     return pergunta
 def parse_json_ultra_robusto(texto: str) -> Dict:
     """
+    Extrai um objeto JSON de uma string, mesmo que ela contenha texto adicional
+    ou formatação incorreta (como os marcadores ```json).
+    Args:
+        texto: A string retornada pela API que pode conter um JSON.
+    Returns:
+        Um dicionário Python com o JSON extraído ou um dicionário de erro.
     """
     if not texto:
         return {"erro": "Texto de entrada vazio"}
+    # 1. Tenta extrair JSON de blocos de código (```json ... ```), que é comum em modelos de linguagem.
     match = re.search(r'```(?:json)?\s*(\{.*?\})\s*```', texto, re.DOTALL)
     if match:
         json_str = match.group(1)
+    else:
+        json_str = texto
+    # 2. Tenta carregar a string extraída como JSON.
     try:
+        return json.loads(json_str)
+    except json.JSONDecodeError:
+        # 3. Se falhar, tenta um método de "fallback": encontrar o primeiro '{' e o último '}'
+        # e tentar fazer o parse do conteúdo entre eles. Isso ajuda a limpar lixo no início/fim.
+        try:
+            inicio = json_str.find('{')
+            fim = json_str.rfind('}') + 1
+            if inicio != -1 and fim != 0:
+                return json.loads(json_str[inicio:fim])
+        except json.JSONDecodeError:
+            logger.log("Falha na extração robusta de JSON.", "WARN")
+            return {"erro": "parse_falhou", "fallback_text": texto[:500]}
 def chamar_gemini_json(modelo: genai.GenerativeModel, prompt: str, temperatura: float = 0.5, max_tokens: int = 2000) -> Dict:
     """
+    Envia um prompt para o modelo Gemini, solicita uma saída JSON, analisa a resposta
+    e inclui logs detalhados para depuração.
+    Args:
+        modelo: A instância do modelo Gemini a ser usada.
+        prompt: O prompt formatado para a tarefa específica.
+        temperatura: Controla a criatividade da resposta (valores mais altos = mais criativo).
+        max_tokens: O número máximo de tokens na resposta.
+    Returns:
+        Um dicionário Python com a resposta do modelo ou um dicionário de erro.
     """
+    # Adiciona uma instrução final e explícita ao prompt para garantir que o modelo retorne JSON.
     prompt_completo = f"{prompt}\n\n---\n\n**INSTRUÇÃO OBRIGATÓRIA: Sua resposta DEVE ser um único e válido objeto JSON. Não inclua texto antes ou depois do JSON.**"
+    # === INÍCIO DO LOG DE DEPURAÇÃO (INPUT) ===
+    # Imprime o prompt exato que está sendo enviado para a API.
+    # Essencial para depurar o comportamento do modelo.
+    print("\n" + "="*25 + f" 💬 API INPUT PARA [{modelo.model_name}] " + "="*25)
+    print(prompt_completo)
+    print("="*78 + "\n")
     logger.log(f"Enviando prompt ({len(prompt_completo)} chars) para {modelo.model_name}", "DEBUG")
+    # === FIM DO LOG DE DEPURAÇÃO (INPUT) ===
     try:
+        # Realiza a chamada para a API Gemini.
         response = modelo.generate_content(
             prompt_completo,
             generation_config=genai.types.GenerationConfig(
                 temperature=temperatura,
                 max_output_tokens=max_tokens,
             )
         )
+        # Extrai o texto da resposta.
         resposta_bruta = response.text or ""
+        # === INÍCIO DO LOG DE DEPURAÇÃO (OUTPUT) ===
+        # Imprime a resposta bruta recebida da API antes de qualquer processamento.
+        # Crucial para ver o que o modelo realmente retornou.
+        print("\n" + "="*25 + f" 📥 API RAW OUTPUT DE [{modelo.model_name}] " + "="*25)
+        print(resposta_bruta)
+        print("="*78 + "\n")
         logger.log(f"Gemini RAW ({len(resposta_bruta)} chars): {resposta_bruta[:400]}...", "DEBUG")
+        # === FIM DO LOG DE DEPURAÇÃO (OUTPUT) ===
+        # Usa o parser robusto para converter a resposta de texto em um dicionário Python.
         resultado_json = parse_json_ultra_robusto(resposta_bruta)
         return resultado_json
     except Exception as e:
+        # Captura qualquer erro durante a chamada da API (ex: problemas de conexão, erros de permissão).
         logger.log(f"Erro na chamada da API Gemini: {e}", "ERROR")
         return {"erro": f"API_ERROR: {str(e)}"}
 def historico_compacto(historico: List[Dict]) -> str:
+    """
+    Gera uma string curta com as últimas interações do chat para usar como contexto nos prompts.
+    Args:
+        historico: O histórico de conversa no formato interno.
+    Returns:
+        Uma string resumida da conversa recente.
+    """
     if not historico:
         return "Nenhuma conversa anterior."
+    # Pega as últimas 4 mensagens, formata e junta em uma única string.
     compacto = []
+    for msg in historico[-4:]:
         role = "Usuário" if msg["role"] == "user" else "Assistente"
+        content = msg["content"].split('\n')[:80] # Pega só a primeira linha, até 80 caracteres.
         compacto.append(f"{role}: {content}")
     return "\n".join(compacto)
 def criar_dna() -> Dict:
+    """
+    Inicializa a estrutura de dados 'DNA' que armazena o estado e metadados da conversa.
+    Returns:
+        Um dicionário com a estrutura inicial do DNA.
+    """
     return {
         "historico_chat": [],
         "meta": {"total_turnos": 0}
 # ============================================================================
 # 4. PASSOS DA PIPELINE (P0-P8, X1-X2)
 # ============================================================================
+# Cada função representa um passo de raciocínio da pipeline. Elas preparam
+# um prompt, chamam a API e retornam o resultado processado.
 def passo_0_aluno(pergunta: str, historico: List[Dict]) -> Dict:
     """P0: Analisa a pergunta atual em relação à resposta anterior (metacognição)."""
     )
     return chamar_gemini_json(COUNSELOR_MODEL, prompt, temperatura=0.3)
+def passo_1_triagem(pergunta: str, p0: Dict, hi