File size: 4,649 Bytes
e22aaac
 
a5813d5
 
 
5d5a87d
 
 
 
 
 
 
 
 
 
e22aaac
 
3457d26
bce803d
3457d26
 
3e47245
 
e8cb2f5
3e47245
7a83bac
3e47245
 
 
 
 
501b4e6
3e47245
501b4e6
48297c6
 
 
 
 
 
3e47245
 
0d2e1ad
a5813d5
 
f578576
e22aaac
3031ff9
9bfba95
f2b1255
9bfba95
 
0d2e1ad
f578576
 
a5813d5
e22aaac
a5813d5
 
 
 
e22aaac
0d2e1ad
a5813d5
 
 
3cb1df7
707c934
 
e52cf9b
 
707c934
 
0d53c05
 
 
 
 
 
3cb1df7
 
 
f955bae
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
---
library_name: transformers
language:
- es
- en
widget:
- text: |
        <bos><start_of_turn>system
        You are a helpful AI assistant.
        Responde en formato json.
        Eres un agente experto en medicina.
        Lista de codigos linguisticos disponibles: ["es", "es"]<end_of_turn>
        <start_of_turn>user
        Mujer de 83 años, completa y bien desarrollada, con varios años de pérdida de memoria.<end_of_turn>
        <start_of_turn>model
---

<div style="display: flex; justify-content: center;">
  <img src="https://cdn-uploads.huggingface.co/production/uploads/641b435ba5f876fe30c5ae0a/zYaRCrzeECYIYCHCb-2fc.png" style="width: 50%; max-height: 550px;">
</div>

## Explorando las Fronteras de la Inteligencia Artificial en el Ámbito Médico con Gemma-2B-IT

Un nuevo modelo de inteligencia artificial, Gemma-2B-IT, se destaca por su capacidad excepcional. Este modelo, perteneciente a la avanzada familia de IA, ha sido meticulosamente entrenado con un conjunto de datos enriquecido y depurado.

El proceso de desarrollo de Gemma-2B-IT comenzó con una rigurosa selección de transcripciones médicas en inglés extraidas de Kaggle. Antes de su entrenamiento, me enfrente al desafío de los datos faltantes, una barrera común en la inteligencia artificial. A través de una limpieza de datos meticulosa, se preparó el terreno para un modelo más robusto de su tipo y "confiable".

La barrera del idioma se superó utilizando tecnologías de IA como chatgpt para traducir el conjunto de datos al español, asegurando así su aplicabilidad en una variedad más amplia de contextos médicos. Este paso crucial no solo aumentó la versatilidad del modelo sino que también demostró la potencialidad de la IA para superar obstáculos lingüísticos en el campo médico.

Posteriormente, transforme las transcripciones en un formato ChatML, adaptando el dataset para entrenar eficientemente a Gemma-2B-IT. Esto permitió al modelo entender y procesar información médica.

La evaluación de Gemma-2B-IT: logró un 80% de precisión al interactuar con datos nuevos y un 95% de precisión al trabajar con las transcripciones utilizadas durante su entrenamiento (se modificaron parametros como temperature). Estos resultados no solo demuestran la capacidad de Gemma-2B-IT para aprender y adaptarse, ofreciendo respuestas precisas y relevantes en casi tiempo real.

como respuesta del modelo seria:
- **Descripción**: Un resumen detallado del caso del paciente, proporcionado en un lenguaje claro y conciso. Esto permite a los médicos obtener una comprensión rápida y completa de la situación sin necesidad de revisar extensos historiales médicos.

- **Especialidad Médica**: Basándose en el análisis de los síntomas y la historia clínica, Gemma-2B-IT identifica la especialidad médica más relevante para el caso. Esto asegura que los pacientes sean derivados al especialista adecuado sin demoras innecesarias.

- **Diagnóstico Principal**: Con un enfoque en la precisión diagnóstica, el modelo proporciona el diagnóstico principal, permitiendo a los médicos centrarse en las intervenciones y tratamientos más pertinentes.

La promesa de Gemma-2B-IT en el campo de la inteligencia artificial médica es enorme, abriendo puertas a diagnósticos más rápidos, una mayor personalización y una asistencia médica más accesible. A medida que avanzamos hacia un futuro donde la tecnología y la medicina se entrelazan cada vez más, modelos como Gemma-2B-IT marcarán la diferencia.

## Colab.
```
https://colab.research.google.com/drive/1gzTk-mdKefjZwzeiaHfkQ5Qnq3G10WCA?usp=sharing
```

## progreso del entrenamiento.
<div style="display: flex; justify-content: center;">
  <img src="https://cdn-uploads.huggingface.co/production/uploads/641b435ba5f876fe30c5ae0a/IQR4Ht9ewoPgVcYjU0IuV.png" style="width: 100%; max-height: 550px;">
</div>

## Space.
```
https://huggingface.co/spaces/somosnlp/Sam_Diagnostic
```

## conjunto de datos formato gemma.
```
https://huggingface.co/datasets/somosnlp/medical_en_es_formato_chatML_Gemma
```

## Limpieza de datos
```
https://huggingface.co/datasets/somosnlp/medical_bilingual_en_es
```

## Modelo inicial fine-tune.
```
1. https://huggingface.co/google/gemma-2b-it
2. NickyNicky/gemma-2b-it_oasst2_all_chatML_Unsloth_V1
```

## Nota.
```
La AI no te quitara el trabajo...
El trabajo te lo quitara otra persona que tenga conocimiento fundamental y avanzado de la AI.
```

## Hecho.
```
https://huggingface.co/NickyNicky
```

<!-- Codigo de entrenamiento: https://colab.research.google.com/drive/1UmG6X_vRqMCIWqoPrdMdDkUJCW5oxrGp#scrollTo=HvaM3RKiklXS&uniqifier=1 -->