--- language: es datasets: custom metrics: - f1 - precision - recall - accuracy tags: - ner - named-entity-recognition - xlm-roberta - transformers - cancer - salud - huggingface model-index: - name: XLM-RoBERTa NER - Cáncer de Próstata (batch_size=8) results: - task: name: Named Entity Recognition type: token-classification dataset: name: Custom dataset - formato BIO type: medical description: | Dataset especializado en anotaciones BIO sobre cáncer de próstata en español. metrics: - name: F1 type: f1 value: 0.9660 - name: Precision type: precision value: 0.9640 - name: Recall type: recall value: 0.9680 - name: Accuracy type: accuracy value: 0.9943 --- # Modelo XLM-RoBERTa para Reconocimiento de Entidades Nombradas en Cáncer de Próstata Este modelo se basa en [xlm-roberta-large](https://huggingface.co/xlm-roberta-large) y ha sido ajustado para la tarea de NER (Reconocimiento de Entidades Nombradas) sobre un dataset en español con etiquetas BIO enfocadas en cáncer de próstata. ## 🧠 Tarea Reconocimiento de entidades biomédicas relacionadas con el diagnóstico, pruebas y condiciones clínicas del cáncer de próstata. ## 📊 Rendimiento en conjunto de prueba | Métrica | Valor | |-------------|-----------| | F1-score | 0.9660 | | Precision | 0.9640 | | Recall | 0.9680 | | Accuracy | 0.9943 | ## ⚙️ Uso rápido ```python from transformers import AutoTokenizer, AutoModelForTokenClassification model = AutoModelForTokenClassification.from_pretrained("FernandoValencia/XLM-RoBERTa_prostata_bs8") tokenizer = AutoTokenizer.from_pretrained("FernandoValencia/XLM-RoBERTa_prostata_bs8") text = "El paciente fue diagnosticado con cáncer de próstata" tokens = tokenizer(text, return_tensors="pt", truncation=True) outputs = model(**tokens) ```