piuba-bigdata/contextualized_hate_speech
Viewer • Updated • 56.9k • 253 • 8
Modelo de clasificación binaria que detecta si un tweet contiene hate speech (Hateful) o no (No hateful).
Fine-tuning de dccuchile/bert-base-spanish-wwm-cased
sobre el dataset piuba-bigdata/contextualized_hate_speech,
que contiene tweets en español publicados durante la pandemia de COVID-19 en Argentina.
from transformers import pipeline
clasificador = pipeline("text-classification", model="raul-jimenez8-uclm/bert-hate-speech-es")
resultado = clasificador("Estos inmigrantes son los culpables de todo.")
print(resultado)
| Etiqueta | Descripción |
|---|---|
No hateful |
El texto no contiene hate speech |
Hateful |
El texto contiene hate speech |
| Métrica | Valor |
|---|---|
| Accuracy | 0.8500 |
| F1 | 0.4079 |
| Precision | 0.5536 |
| Recall | 0.3229 |
F1 es la métrica principal dado el desbalanceo natural del dataset (mayoría de tweets no son hate speech).