XLM-RoBERTa_prostata_bs8 / README.md

FernandoValencia

📝 Añadir README para modelo XLM-RoBERTa

465a9f1 verified 8 months ago

preview code

raw

history blame contribute delete

2.06 kB

metadata

language: es
datasets: custom
metrics:
  - f1
  - precision
  - recall
  - accuracy
tags:
  - ner
  - named-entity-recognition
  - xlm-roberta
  - transformers
  - cancer
  - salud
  - huggingface
model-index:
  - name: XLM-RoBERTa NER - Cáncer de Próstata (batch_size=8)
    results:
      - task:
          name: Named Entity Recognition
          type: token-classification
        dataset:
          name: Custom dataset - formato BIO
          type: medical
          description: >
            Dataset especializado en anotaciones BIO sobre cáncer de próstata en
            español.
        metrics:
          - name: F1
            type: f1
            value: 0.966
          - name: Precision
            type: precision
            value: 0.964
          - name: Recall
            type: recall
            value: 0.968
          - name: Accuracy
            type: accuracy
            value: 0.9943

Modelo XLM-RoBERTa para Reconocimiento de Entidades Nombradas en Cáncer de Próstata

Este modelo se basa en xlm-roberta-large y ha sido ajustado para la tarea de NER (Reconocimiento de Entidades Nombradas) sobre un dataset en español con etiquetas BIO enfocadas en cáncer de próstata.

🧠 Tarea

Reconocimiento de entidades biomédicas relacionadas con el diagnóstico, pruebas y condiciones clínicas del cáncer de próstata.

📊 Rendimiento en conjunto de prueba

Métrica	Valor
F1-score	0.9660
Precision	0.9640
Recall	0.9680
Accuracy	0.9943

⚙️ Uso rápido

from transformers import AutoTokenizer, AutoModelForTokenClassification

model = AutoModelForTokenClassification.from_pretrained("FernandoValencia/XLM-RoBERTa_prostata_bs8")
tokenizer = AutoTokenizer.from_pretrained("FernandoValencia/XLM-RoBERTa_prostata_bs8")

text = "El paciente fue diagnosticado con cáncer de próstata"
tokens = tokenizer(text, return_tensors="pt", truncation=True)
outputs = model(**tokens)