Detector de Hate Speech en Español

Descripción

Modelo de clasificación binaria que detecta si un tweet contiene hate speech (Hateful) o no (No hateful).

Fine-tuning de dccuchile/bert-base-spanish-wwm-cased sobre el dataset piuba-bigdata/contextualized_hate_speech, que contiene tweets en español publicados durante la pandemia de COVID-19 en Argentina.

Uso

from transformers import pipeline

clasificador = pipeline("text-classification", model="raul-jimenez8-uclm/bert-hate-speech-es")
resultado = clasificador("Estos inmigrantes son los culpables de todo.")
print(resultado)

Etiquetas

Etiqueta Descripción
No hateful El texto no contiene hate speech
Hateful El texto contiene hate speech

Métricas (conjunto de test)

Métrica Valor
Accuracy 0.8500
F1 0.4079
Precision 0.5536
Recall 0.3229

F1 es la métrica principal dado el desbalanceo natural del dataset (mayoría de tweets no son hate speech).

Limitaciones

  • Entrenado con un subconjunto del dataset (3.000 ejemplos de entrenamiento).
  • El dominio es específico: tweets en español del contexto COVID-19 en Argentina. Puede no generalizar bien a otros registros o países.
  • No distingue entre categorías de hate speech (racismo, sexismo, etc.); solo detecta presencia/ausencia.
Downloads last month
10
Safetensors
Model size
0.1B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Dataset used to train raul-jimenez8-uclm/bert-hate-speech-es

Space using raul-jimenez8-uclm/bert-hate-speech-es 1