Spaces:
Running
Running
refactor: single-fold fold_04 + Platt scaling (remove ensemble)
Browse files
app.py
CHANGED
|
@@ -270,7 +270,7 @@ INTRO_MD = """
|
|
| 270 |
# Notinhas — endpoint de utilidade (FT-Solo)
|
| 271 |
|
| 272 |
Classificador de utilidade para **community notes em português**, baseado em
|
| 273 |
-
**bge-m3 (568M params) + LoRA + cabeça linear** (
|
| 274 |
|
| 275 |
- **Prever** — score + label + faixa de confiança.
|
| 276 |
- **Explicar** — o mesmo + contribuição de cada palavra via leave-one-out.
|
|
@@ -349,7 +349,9 @@ with gr.Blocks(
|
|
| 349 |
|
| 350 |
- **Modelo base**: `BAAI/bge-m3` (embedding, 1.024 dims, mean pooling, 568M params).
|
| 351 |
- **Adaptação**: LoRA treinado com alvo `label_binary_strict` (recorte A do projeto).
|
|
|
|
| 352 |
- **Cabeça**: `nn.Linear(1024, 1)` → sigmoid.
|
|
|
|
| 353 |
- **Prompt de instrução**: nenhum — texto cru (bge-m3 não usa prefix de instrução).
|
| 354 |
- **max_length**: 256 tokens.
|
| 355 |
- **Dispositivo atual**: `{DEVICE}`.
|
|
|
|
| 270 |
# Notinhas — endpoint de utilidade (FT-Solo)
|
| 271 |
|
| 272 |
Classificador de utilidade para **community notes em português**, baseado em
|
| 273 |
+
**bge-m3 (568M params) + LoRA + cabeça linear** (FT-Solo · fold_04 · calibrado via Platt scaling).
|
| 274 |
|
| 275 |
- **Prever** — score + label + faixa de confiança.
|
| 276 |
- **Explicar** — o mesmo + contribuição de cada palavra via leave-one-out.
|
|
|
|
| 349 |
|
| 350 |
- **Modelo base**: `BAAI/bge-m3` (embedding, 1.024 dims, mean pooling, 568M params).
|
| 351 |
- **Adaptação**: LoRA treinado com alvo `label_binary_strict` (recorte A do projeto).
|
| 352 |
+
- **Fold servido**: `fold_04` (melhor fold segundo o manifesto do pipeline).
|
| 353 |
- **Cabeça**: `nn.Linear(1024, 1)` → sigmoid.
|
| 354 |
+
- **Calibração**: Platt scaling pós-treino — `P_calib = sigmoid(CALIB_A × logit(P_raw) + CALIB_B)`. Com os defaults `CALIB_A=1.0, CALIB_B=0.0` equivale a identidade; ajuste em `config.py` com base num conjunto de validação.
|
| 355 |
- **Prompt de instrução**: nenhum — texto cru (bge-m3 não usa prefix de instrução).
|
| 356 |
- **max_length**: 256 tokens.
|
| 357 |
- **Dispositivo atual**: `{DEVICE}`.
|