Spaces:

Prosodia
/

Atlas

Sleeping

Victor Dieguez commited on Nov 24, 2025

Commit

b23d29d

1 Parent(s): c1a0a25

Editing texts

Files changed (1) hide show

src/about.py CHANGED Viewed

@@ -34,7 +34,9 @@ TITLE = """<h1 align="center" id="space-title">Atlas Diagnóstico de Modelos de
 INTRODUCTION_TEXT = """
 Bem-vindo ao Atlas, uma avaliação de LLMs em português que prioriza conteúdo correto sobre formatação rígida, sendo ideal para modelos pequenos que possuem conhecimento mas não produzem templates perfeitos.
 Nossa abordagem usa parseamento heurístico tolerante, calibração automática e métricas desacopladas: o macro_score (0-1) mede capacidade semântica, enquanto a nonparse_rate avalia obediência às instruções separadamente.
-Isso permite diagnosticar claramente se um modelo falha por conhecimento insuficiente ou por dificuldades de formatação, oferecendo um diagnóstico robusto e prático de usabilidade real. Inspirado no EleutherAI Benchmark [lm-evaluation-harness](https://github.com/EleutherAI/lm-evaluation-harness)
 """
 # Which evaluations are you running? how can people reproduce what you have?

 INTRODUCTION_TEXT = """
 Bem-vindo ao Atlas, uma avaliação de LLMs em português que prioriza conteúdo correto sobre formatação rígida, sendo ideal para modelos pequenos que possuem conhecimento mas não produzem templates perfeitos.
 Nossa abordagem usa parseamento heurístico tolerante, calibração automática e métricas desacopladas: o macro_score (0-1) mede capacidade semântica, enquanto a nonparse_rate avalia obediência às instruções separadamente.
+Isso permite diagnosticar claramente se um modelo falha por conhecimento insuficiente ou por dificuldades de formatação, oferecendo um diagnóstico robusto e prático de usabilidade real. Inspirado no EleutherAI Benchmark [lm-evaluation-harness](https://github.com/EleutherAI/lm-evaluation-harness).
+Versão Atual: Pre-alpha
 """
 # Which evaluations are you running? how can people reproduce what you have?