Token Classification
Transformers
Safetensors
Spanish
bert
ner
named-entity-recognition
beto
cancer
salud
huggingface
Eval Results (legacy)
Instructions to use FernandoValencia/BETO_prostata_bs4 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use FernandoValencia/BETO_prostata_bs4 with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("token-classification", model="FernandoValencia/BETO_prostata_bs4")# Load model directly from transformers import AutoTokenizer, AutoModelForTokenClassification tokenizer = AutoTokenizer.from_pretrained("FernandoValencia/BETO_prostata_bs4") model = AutoModelForTokenClassification.from_pretrained("FernandoValencia/BETO_prostata_bs4") - Notebooks
- Google Colab
- Kaggle
Modelo BETO para Reconocimiento de Entidades Nombradas en Cáncer de Próstata
Este modelo se basa en dccuchile/bert-base-spanish-wwm-cased y ha sido ajustado para la tarea de NER (Reconocimiento de Entidades Nombradas) sobre un dataset en español con etiquetas BIO enfocadas en cáncer de próstata.
🧠 Tarea
Reconocimiento de entidades biomédicas relacionadas con el diagnóstico, pruebas y condiciones clínicas del cáncer de próstata.
📊 Rendimiento en conjunto de prueba
| Métrica | Valor |
|---|---|
| F1-score | 0.9685 |
| Precision | 0.9671 |
| Recall | 0.9700 |
| Accuracy | 0.9942 |
⚙️ Uso rápido
from transformers import AutoTokenizer, AutoModelForTokenClassification
model = AutoModelForTokenClassification.from_pretrained("FernandoValencia/BETO_prostata_bs4")
tokenizer = AutoTokenizer.from_pretrained("FernandoValencia/BETO_prostata_bs4")
text = "El paciente fue diagnosticado con cáncer de próstata"
tokens = tokenizer(text, return_tensors="pt")
outputs = model(**tokens)
- Downloads last month
- 2
Evaluation results
- F1 on Custom dataset - formato BIOself-reported0.969
- Precision on Custom dataset - formato BIOself-reported0.967
- Recall on Custom dataset - formato BIOself-reported0.970
- Accuracy on Custom dataset - formato BIOself-reported0.994