Token Classification
Transformers
Safetensors
Spanish
xlm-roberta
ner
named-entity-recognition
cancer
salud
huggingface
Eval Results (legacy)
Instructions to use FernandoValencia/XLM-RoBERTa_prostata_bs8 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use FernandoValencia/XLM-RoBERTa_prostata_bs8 with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("token-classification", model="FernandoValencia/XLM-RoBERTa_prostata_bs8")# Load model directly from transformers import AutoTokenizer, AutoModelForTokenClassification tokenizer = AutoTokenizer.from_pretrained("FernandoValencia/XLM-RoBERTa_prostata_bs8") model = AutoModelForTokenClassification.from_pretrained("FernandoValencia/XLM-RoBERTa_prostata_bs8") - Notebooks
- Google Colab
- Kaggle
Modelo XLM-RoBERTa para Reconocimiento de Entidades Nombradas en Cáncer de Próstata
Este modelo se basa en xlm-roberta-large y ha sido ajustado para la tarea de NER (Reconocimiento de Entidades Nombradas) sobre un dataset en español con etiquetas BIO enfocadas en cáncer de próstata.
🧠 Tarea
Reconocimiento de entidades biomédicas relacionadas con el diagnóstico, pruebas y condiciones clínicas del cáncer de próstata.
📊 Rendimiento en conjunto de prueba
| Métrica | Valor |
|---|---|
| F1-score | 0.9660 |
| Precision | 0.9640 |
| Recall | 0.9680 |
| Accuracy | 0.9943 |
⚙️ Uso rápido
from transformers import AutoTokenizer, AutoModelForTokenClassification
model = AutoModelForTokenClassification.from_pretrained("FernandoValencia/XLM-RoBERTa_prostata_bs8")
tokenizer = AutoTokenizer.from_pretrained("FernandoValencia/XLM-RoBERTa_prostata_bs8")
text = "El paciente fue diagnosticado con cáncer de próstata"
tokens = tokenizer(text, return_tensors="pt", truncation=True)
outputs = model(**tokens)
- Downloads last month
- 1
Evaluation results
- F1 on Custom dataset - formato BIOself-reported0.966
- Precision on Custom dataset - formato BIOself-reported0.964
- Recall on Custom dataset - formato BIOself-reported0.968
- Accuracy on Custom dataset - formato BIOself-reported0.994