Colombian SER Model - SVM v1 (placeholder)
Status: Repo creado y reservado para el artefacto del modelo SER colombiano. El
.joblibaun no se ha entrenado. Se publicara automaticamente al ejecutarser/scripts/publish_model.pydespues detrain_classifier.py.
Arquitectura prevista
Pipeline de dos etapas:
- Embedding:
iic/emotion2vec_plus_large(768-dim, frozen, via FunASR/Transformers) - Clasificador:
sklearn.pipeline.Pipeline-StandardScaler->SVC(kernel="rbf", class_weight="balanced")
Contrato de archivos
| Archivo | Descripcion |
|---|---|
emotion_classifier_svm.joblib |
Pipeline SVM RBF (produccion) |
emotion_classifier_lr.joblib |
Pipeline Logistic Regression (baseline) |
Clases
["angry", "happy", "neutral", "sad"]
Orden alfabetico - sklearn lo impone via pipeline.classes_. El consumidor debe respetar este orden al leer predict_proba.
Dataset
ainterviewer/colombian-ser-dataset
Consumido por
ainterviewer/ser-analyzer carga este .joblib en cold start via hf_hub_download(repo_id="ainterviewer/colombian-ser-model", filename="emotion_classifier_svm.joblib"). Mientras este archivo no exista, el Space cae al fallback directo iic/emotion2vec_plus_large (modo fallback en /health).
Validacion
Metricas reportadas con protocolo Leave-One-Speaker-Out (LOSO) sobre la totalidad del dataset (>=15 hablantes colombianos). Metricas pobladas por publish_model.py al subir el modelo entrenado.
Licencia
CC-BY-4.0 - ver dataset asociado.