histlearn commited on
Commit
10e2a71
·
verified ·
1 Parent(s): e3258a2

refactor: single-fold fold_04 + Platt scaling (remove ensemble)

Browse files
Files changed (1) hide show
  1. config.py +8 -28
config.py CHANGED
@@ -1,48 +1,28 @@
1
- """Constantes compartilhadas pelo Space (bge-m3 Ensemble calibrado)."""
2
  from __future__ import annotations
3
 
4
  import os
5
  from pathlib import Path
6
 
7
- # Modelo base — bge-m3 (568M params, ~7x menor que Qwen3-4B)
8
  MODEL_NAME = "BAAI/bge-m3"
9
 
10
- # Inferência
11
  MAX_LENGTH = 256
12
  BATCH_SIZE = 8
13
-
14
- # bge-m3 NÃO usa prompt de instrução. None mantém compatibilidade.
15
  TASK_PROMPT = None
16
 
17
- # Paths
18
- ROOT = Path(__file__).resolve().parent
19
  ARTIFACTS_DIR = ROOT / "artifacts"
 
 
20
 
21
- # Lista de TODOS os folds disponíveis para ensemble.
22
- MODEL_FOLDS = [
23
- "fold_01",
24
- "fold_02",
25
- "fold_03",
26
- "fold_04",
27
- "fold_05"
28
- ]
29
-
30
- # Nome do arquivo de cabeça para cada fold. Pode ser ajustado se o padrão mudar.
31
- HEAD_FILENAME = "{fold}_head.pt"
32
- ADAPTER_DIRNAME = "{fold}_adapter"
33
-
34
- # Classificação
35
- THRESHOLD_UTIL = 0.5
36
  CONFIDENCE_BOUNDS_ALTA = (0.10, 0.90)
37
  CONFIDENCE_BOUNDS_MEDIA = (0.30, 0.70)
38
 
39
- # Parâmetros de calibração para Platt Scaling: P_calib = 1/(1 + exp(a * logit + b)).
40
- # Ajuste estes valores com base em um conjunto de calibração.
 
41
  CALIB_A = 1.0
42
  CALIB_B = 0.0
43
 
44
- # Parâmetro de temperature scaling. Defina TEMPERATURE != 1.0 para aplicar scaling.
45
- TEMPERATURE = 1.0
46
-
47
- # Secret opcional
48
  HF_TOKEN = os.environ.get("HF_TOKEN")
 
1
+ """Constantes compartilhadas pelo Space (bge-m3 FT-Solo, single-fold calibrado)."""
2
  from __future__ import annotations
3
 
4
  import os
5
  from pathlib import Path
6
 
 
7
  MODEL_NAME = "BAAI/bge-m3"
8
 
 
9
  MAX_LENGTH = 256
10
  BATCH_SIZE = 8
 
 
11
  TASK_PROMPT = None
12
 
13
+ ROOT = Path(__file__).resolve().parent
 
14
  ARTIFACTS_DIR = ROOT / "artifacts"
15
+ ADAPTER_PATH = ARTIFACTS_DIR / "fold_04_adapter"
16
+ HEAD_PATH = ARTIFACTS_DIR / "fold_04_head.pt"
17
 
18
+ THRESHOLD_UTIL = 0.5
 
 
 
 
 
 
 
 
 
 
 
 
 
 
19
  CONFIDENCE_BOUNDS_ALTA = (0.10, 0.90)
20
  CONFIDENCE_BOUNDS_MEDIA = (0.30, 0.70)
21
 
22
+ # Platt scaling: P_calib = sigmoid(CALIB_A * logit(P_raw) + CALIB_B)
23
+ # Com defaults (1.0, 0.0) = identidade (sem ajuste).
24
+ # Para calibrar: ajuste esses valores com um conjunto de validação.
25
  CALIB_A = 1.0
26
  CALIB_B = 0.0
27
 
 
 
 
 
28
  HF_TOKEN = os.environ.get("HF_TOKEN")