manueltonneau/spanish-hate-speech-superset
Viewer • Updated • 29.9k • 83 • 3
InclusioCheck es un modelo de clasificación de texto fine-tuned desde BETO para detectar lenguaje de odio (hate speech) en textos en español.
from transformers import pipeline
# Cargar el clasificador
classifier = pipeline("text-classification", model="antonn-dromundo/InclusioCheck-BETO-HateSpeech")
# Predecir
resultado = classifier("Texto a analizar")
print(resultado)
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
# Cargar modelo y tokenizer
tokenizer = AutoTokenizer.from_pretrained("antonn-dromundo/InclusioCheck-BETO-HateSpeech")
model = AutoModelForSequenceClassification.from_pretrained("antonn-dromundo/InclusioCheck-BETO-HateSpeech")
# Función de predicción
def predecir(texto):
inputs = tokenizer(texto, return_tensors="pt", truncation=True, max_length=128)
with torch.no_grad():
outputs = model(**inputs)
prediccion = outputs.logits.argmax(-1).item()
probabilidad = torch.softmax(outputs.logits, dim=-1)[0][prediccion].item()
label = "Hate Speech" if prediccion == 1 else "No Hate Speech"
return {"label": label, "confidence": probabilidad}
# Ejemplo
print(predecir("Los inmigrantes son bienvenidos"))
| Métrica | Valor |
|---|---|
| Accuracy | 0.816 |
| F1 Score | 0.827 |
| Precision | 0.777 |
| Recall | 0.884 |
Antonio Dromundo.
Creado como parte del proyecto InclusioCheck para promover la detección de lenguaje excluyente.
De Mexico para el mundo
Apache 2.0