File size: 2,064 Bytes

5d65aca
465a9f1
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
5d65aca
 
465a9f1
5d65aca
465a9f1
5d65aca
465a9f1
5d65aca
465a9f1
5d65aca
465a9f1
5d65aca
465a9f1
 
 
 
 
 
5d65aca
465a9f1
5d65aca
465a9f1
 
5d65aca
465a9f1
 
5d65aca
465a9f1

---
language: es
datasets: custom
metrics:
  - f1
  - precision
  - recall
  - accuracy
tags:
  - ner
  - named-entity-recognition
  - xlm-roberta
  - transformers
  - cancer
  - salud
  - huggingface
model-index:
  - name: XLM-RoBERTa NER - Cáncer de Próstata (batch_size=8)
    results:
      - task:
          name: Named Entity Recognition
          type: token-classification
        dataset:
          name: Custom dataset - formato BIO
          type: medical
          description: |
            Dataset especializado en anotaciones BIO sobre cáncer de próstata en español.
        metrics:
          - name: F1
            type: f1
            value: 0.9660
          - name: Precision
            type: precision
            value: 0.9640
          - name: Recall
            type: recall
            value: 0.9680
          - name: Accuracy
            type: accuracy
            value: 0.9943
---

# Modelo XLM-RoBERTa para Reconocimiento de Entidades Nombradas en Cáncer de Próstata

Este modelo se basa en [xlm-roberta-large](https://huggingface.co/xlm-roberta-large) y ha sido ajustado para la tarea de NER (Reconocimiento de Entidades Nombradas) sobre un dataset en español con etiquetas BIO enfocadas en cáncer de próstata.

## 🧠 Tarea

Reconocimiento de entidades biomédicas relacionadas con el diagnóstico, pruebas y condiciones clínicas del cáncer de próstata.

## 📊 Rendimiento en conjunto de prueba

| Métrica     | Valor     |
|-------------|-----------|
| F1-score    | 0.9660    |
| Precision   | 0.9640    |
| Recall      | 0.9680    |
| Accuracy    | 0.9943    |

## ⚙️ Uso rápido

```python
from transformers import AutoTokenizer, AutoModelForTokenClassification

model = AutoModelForTokenClassification.from_pretrained("FernandoValencia/XLM-RoBERTa_prostata_bs8")
tokenizer = AutoTokenizer.from_pretrained("FernandoValencia/XLM-RoBERTa_prostata_bs8")

text = "El paciente fue diagnosticado con cáncer de próstata"
tokens = tokenizer(text, return_tensors="pt", truncation=True)
outputs = model(**tokens)
```