histlearn commited on
Commit
e836a67
·
verified ·
1 Parent(s): 1c84192

refactor: single-fold fold_04 + Platt scaling (remove ensemble)

Browse files
Files changed (1) hide show
  1. app.py +3 -1
app.py CHANGED
@@ -270,7 +270,7 @@ INTRO_MD = """
270
  # Notinhas — endpoint de utilidade (FT-Solo)
271
 
272
  Classificador de utilidade para **community notes em português**, baseado em
273
- **bge-m3 (568M params) + LoRA + cabeça linear** (Ensemble de 5 folds calibrados).
274
 
275
  - **Prever** — score + label + faixa de confiança.
276
  - **Explicar** — o mesmo + contribuição de cada palavra via leave-one-out.
@@ -349,7 +349,9 @@ with gr.Blocks(
349
 
350
  - **Modelo base**: `BAAI/bge-m3` (embedding, 1.024 dims, mean pooling, 568M params).
351
  - **Adaptação**: LoRA treinado com alvo `label_binary_strict` (recorte A do projeto).
 
352
  - **Cabeça**: `nn.Linear(1024, 1)` → sigmoid.
 
353
  - **Prompt de instrução**: nenhum — texto cru (bge-m3 não usa prefix de instrução).
354
  - **max_length**: 256 tokens.
355
  - **Dispositivo atual**: `{DEVICE}`.
 
270
  # Notinhas — endpoint de utilidade (FT-Solo)
271
 
272
  Classificador de utilidade para **community notes em português**, baseado em
273
+ **bge-m3 (568M params) + LoRA + cabeça linear** (FT-Solo · fold_04 · calibrado via Platt scaling).
274
 
275
  - **Prever** — score + label + faixa de confiança.
276
  - **Explicar** — o mesmo + contribuição de cada palavra via leave-one-out.
 
349
 
350
  - **Modelo base**: `BAAI/bge-m3` (embedding, 1.024 dims, mean pooling, 568M params).
351
  - **Adaptação**: LoRA treinado com alvo `label_binary_strict` (recorte A do projeto).
352
+ - **Fold servido**: `fold_04` (melhor fold segundo o manifesto do pipeline).
353
  - **Cabeça**: `nn.Linear(1024, 1)` → sigmoid.
354
+ - **Calibração**: Platt scaling pós-treino — `P_calib = sigmoid(CALIB_A × logit(P_raw) + CALIB_B)`. Com os defaults `CALIB_A=1.0, CALIB_B=0.0` equivale a identidade; ajuste em `config.py` com base num conjunto de validação.
355
  - **Prompt de instrução**: nenhum — texto cru (bge-m3 não usa prefix de instrução).
356
  - **max_length**: 256 tokens.
357
  - **Dispositivo atual**: `{DEVICE}`.