Spaces:

histlearn
/

communitynotesbr

Sleeping

histlearn commited on Apr 24

Commit

e836a67

verified ·

1 Parent(s): 1c84192

refactor: single-fold fold_04 + Platt scaling (remove ensemble)

Files changed (1) hide show

app.py CHANGED Viewed

@@ -270,7 +270,7 @@ INTRO_MD = """
 # Notinhas — endpoint de utilidade (FT-Solo)
 Classificador de utilidade para **community notes em português**, baseado em
-**bge-m3 (568M params) + LoRA + cabeça linear** (Ensemble de 5 folds calibrados).
 - **Prever** — score + label + faixa de confiança.
 - **Explicar** — o mesmo + contribuição de cada palavra via leave-one-out.
@@ -349,7 +349,9 @@ with gr.Blocks(
 - **Modelo base**: `BAAI/bge-m3` (embedding, 1.024 dims, mean pooling, 568M params).
 - **Adaptação**: LoRA treinado com alvo `label_binary_strict` (recorte A do projeto).
 - **Cabeça**: `nn.Linear(1024, 1)` → sigmoid.
 - **Prompt de instrução**: nenhum — texto cru (bge-m3 não usa prefix de instrução).
 - **max_length**: 256 tokens.
 - **Dispositivo atual**: `{DEVICE}`.

 # Notinhas — endpoint de utilidade (FT-Solo)
 Classificador de utilidade para **community notes em português**, baseado em
+**bge-m3 (568M params) + LoRA + cabeça linear** (FT-Solo · fold_04 · calibrado via Platt scaling).
 - **Prever** — score + label + faixa de confiança.
 - **Explicar** — o mesmo + contribuição de cada palavra via leave-one-out.
 - **Modelo base**: `BAAI/bge-m3` (embedding, 1.024 dims, mean pooling, 568M params).
 - **Adaptação**: LoRA treinado com alvo `label_binary_strict` (recorte A do projeto).
+- **Fold servido**: `fold_04` (melhor fold segundo o manifesto do pipeline).
 - **Cabeça**: `nn.Linear(1024, 1)` → sigmoid.
+- **Calibração**: Platt scaling pós-treino — `P_calib = sigmoid(CALIB_A × logit(P_raw) + CALIB_B)`. Com os defaults `CALIB_A=1.0, CALIB_B=0.0` equivale a identidade; ajuste em `config.py` com base num conjunto de validação.
 - **Prompt de instrução**: nenhum — texto cru (bge-m3 não usa prefix de instrução).
 - **max_length**: 256 tokens.
 - **Dispositivo atual**: `{DEVICE}`.