Modelo XLM-RoBERTa para Reconocimiento de Entidades Nombradas en Cáncer de Próstata

Este modelo se basa en xlm-roberta-large y ha sido ajustado para la tarea de NER (Reconocimiento de Entidades Nombradas) sobre un dataset en español con etiquetas BIO enfocadas en cáncer de próstata.

🧠 Tarea

Reconocimiento de entidades biomédicas relacionadas con el diagnóstico, pruebas y condiciones clínicas del cáncer de próstata.

📊 Rendimiento en conjunto de prueba

Métrica	Valor
F1-score	0.9660
Precision	0.9640
Recall	0.9680
Accuracy	0.9943

⚙️ Uso rápido

from transformers import AutoTokenizer, AutoModelForTokenClassification

model = AutoModelForTokenClassification.from_pretrained("FernandoValencia/XLM-RoBERTa_prostata_bs8")
tokenizer = AutoTokenizer.from_pretrained("FernandoValencia/XLM-RoBERTa_prostata_bs8")

text = "El paciente fue diagnosticado con cáncer de próstata"
tokens = tokenizer(text, return_tensors="pt", truncation=True)
outputs = model(**tokens)

Downloads last month: 2

Safetensors

Model size

0.6B params

Tensor type

F32

Evaluation results

F1 on Custom dataset - formato BIO
self-reported

0.966
Precision on Custom dataset - formato BIO
self-reported

0.964
Recall on Custom dataset - formato BIO
self-reported

0.968
Accuracy on Custom dataset - formato BIO
self-reported

0.994