Colombian SER Model - SVM v1 (placeholder)

Status: Repo creado y reservado para el artefacto del modelo SER colombiano. El .joblib aun no se ha entrenado. Se publicara automaticamente al ejecutar ser/scripts/publish_model.py despues de train_classifier.py.

Arquitectura prevista

Pipeline de dos etapas:

Embedding: iic/emotion2vec_plus_large (768-dim, frozen, via FunASR/Transformers)
Clasificador: sklearn.pipeline.Pipeline - StandardScaler -> SVC(kernel="rbf", class_weight="balanced")

Contrato de archivos

Archivo	Descripcion
`emotion_classifier_svm.joblib`	Pipeline SVM RBF (produccion)
`emotion_classifier_lr.joblib`	Pipeline Logistic Regression (baseline)

Clases

["angry", "happy", "neutral", "sad"]

Orden alfabetico - sklearn lo impone via pipeline.classes_. El consumidor debe respetar este orden al leer predict_proba.

Dataset

ainterviewer/colombian-ser-dataset

Consumido por

ainterviewer/ser-analyzer carga este .joblib en cold start via hf_hub_download(repo_id="ainterviewer/colombian-ser-model", filename="emotion_classifier_svm.joblib"). Mientras este archivo no exista, el Space cae al fallback directo iic/emotion2vec_plus_large (modo fallback en /health).

Validacion

Metricas reportadas con protocolo Leave-One-Speaker-Out (LOSO) sobre la totalidad del dataset (>=15 hablantes colombianos). Metricas pobladas por publish_model.py al subir el modelo entrenado.

Licencia

CC-BY-4.0 - ver dataset asociado.

Downloads last month: -; Downloads are not tracked for this model. How to track

ainterviewer
/

colombian-ser-model