Spaces:

Lhama2GFMU
/

ChatBot

Sleeping

App Files Files Community

Malleficarum commited on Jun 3, 2025

Commit

654f05a

verified ·

1 Parent(s): 9f686d3

Update app.py

Browse files

Files changed (1) hide show

app.py +63 -2

app.py CHANGED Viewed

@@ -127,6 +127,66 @@ def chatbot(pergunta):
         f"Modelo 2 (secundário): {resposta2}"
     ]
 # Interface Gradio
 interface = gr.Interface(
     fn=chatbot,
@@ -137,8 +197,9 @@ interface = gr.Interface(
         gr.Textbox(label="Resposta do Modelo 2")
     ],
     title="🗺️ Especialista em Capitais (Cascata com Correção Automática)",
-    description="Sistema com três modelos em cascata. Pergunte sobre a capital de qualquer país. Exemplos: Brasil, Alemanha, França..."
 )
 if __name__ == "__main__":
-    interface.launch()

         f"Modelo 2 (secundário): {resposta2}"
     ]
+# Markdown content for the article section
+article_markdown = """
+Gustavo Henrique Xavier da Silva 1758309
+Mateus Teixeira Maciel 1650601
+Laís Aranda de Souza 1656007
+Gustavo Queiroz Fonseca 1771365
+### 1. Modelo Primário (google/flan-t5-small)
+**Função**: Primeira linha de resposta
+**Características**:
+- Modelo menor e mais rápido (80M parâmetros)
+- Responsável por gerar a resposta inicial
+- Ideal para casos simples e óbvios (como capitais bem conhecidas)
+**Fluxo no código**:
+- Chamado primeiro através da função `gerar_resposta("primario", pergunta)`
+- Se sua resposta for validada como confiável (`esta_confiante()` retorna `True`), o sistema retorna imediatamente sem consultar outros modelos
+- Caso contrário, o sistema prossegue para o modelo secundário
+### 2. Modelo Secundário (google/flan-t5-base)
+**Função**: Segunda opinião para casos mais complexos
+**Características**:
+- Modelo médio (250M parâmetros)
+- Maior capacidade que o primário
+- Usado quando o primário não tem confiança suficiente
+**Fluxo no código**:
+- Chamado apenas se o primário não for confiável
+- Se sua resposta for validada como confiável, o sistema retorna aqui
+- Caso ambos (primário e secundário) não sejam confiáveis, o sistema chama o árbitro
+### 3. Modelo Árbitro (google/flan-t5-large)
+**Função**: Decisor final em casos de discordância
+**Características**:
+- Modelo maior e mais capaz (800M parâmetros)
+- Atua como "juiz" entre as respostas do primário e secundário
+- Só é acionado quando os dois primeiros modelos dão respostas diferentes e não confiáveis
+**Fluxo no código**:
+- Chamado através da função `arbitrar()`
+- Recebe a pergunta original e as duas respostas corrigidas
+- Decide qual das duas respostas é mais provavelmente correta
+- Pode também corrigir ambas as respostas se necessário
+## Sistema de Validação e Correção
+Além dos modelos, o sistema possui:
+- **Base de Conhecimento**: `BASE_CAPITAIS` com respostas corretas e erros comuns
+- **Função `validar_corrigir()`**: Compara respostas com a base de conhecimento
+- **Função `esta_confiante()`**: Determina se uma resposta pode ser aceita sem arbitragem
+## Fluxo de Decisão
+1. Tenta primeiro com o modelo pequeno (rápido)
+2. Se não confiável, tenta com o modelo médio
+3. Se ainda não resolvido, usa o modelo grande como árbitro
+4. Sempre aplica validação/correção baseada na base de conhecimento
+Essa abordagem em cascata equilibra velocidade e precisão, usando modelos maiores apenas quando necessário.
+"""
 # Interface Gradio
 interface = gr.Interface(
     fn=chatbot,
         gr.Textbox(label="Resposta do Modelo 2")
     ],
     title="🗺️ Especialista em Capitais (Cascata com Correção Automática)",
+    description="Sistema com três modelos em cascata. Pergunte sobre a capital de qualquer país. Exemplos: Brasil, Alemanha, França...",
+    article=article_markdown
 )
 if __name__ == "__main__":
+    interface.launch()