Detector de Hate Speech en Español

Descripción

Modelo de clasificación binaria que detecta si un tweet contiene hate speech (Hateful) o no (No hateful).

Fine-tuning de dccuchile/bert-base-spanish-wwm-cased sobre el dataset piuba-bigdata/contextualized_hate_speech, que contiene tweets en español publicados durante la pandemia de COVID-19 en Argentina.

Uso

from transformers import pipeline

clasificador = pipeline("text-classification", model="raul-jimenez8-uclm/bert-hate-speech-es")
resultado = clasificador("Estos inmigrantes son los culpables de todo.")
print(resultado)

Etiquetas

Etiqueta	Descripción
`No hateful`	El texto no contiene hate speech
`Hateful`	El texto contiene hate speech

Métricas (conjunto de test)

Métrica	Valor
Accuracy	0.8500
F1	0.4079
Precision	0.5536
Recall	0.3229

F1 es la métrica principal dado el desbalanceo natural del dataset (mayoría de tweets no son hate speech).

Limitaciones

Entrenado con un subconjunto del dataset (3.000 ejemplos de entrenamiento).
El dominio es específico: tweets en español del contexto COVID-19 en Argentina. Puede no generalizar bien a otros registros o países.
No distingue entre categorías de hate speech (racismo, sexismo, etc.); solo detecta presencia/ausencia.

Downloads last month: 10

Safetensors

Model size

0.1B params

Tensor type

F32

raul-jimenez8-uclm
/

bert-hate-speech-es

Detector de Hate Speech en Español

Descripción

Uso

Etiquetas

Métricas (conjunto de test)

Limitaciones

Dataset used to train raul-jimenez8-uclm/bert-hate-speech-es

Space using raul-jimenez8-uclm/bert-hate-speech-es 1