OpScanIA / README.md
jorgeiv500's picture
Update README.md
f85f2f4 verified
---
title: OpScan.IA DeepSeek-OCR + Medical
emoji: 🩺
colorFrom: gray
colorTo: purple
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false
---
# 🩺 OpenScanIA: Inteligencia Artificial para Entender Recetas Médicas
**OpenScanIA** es una aplicación que convierte imágenes de recetas médicas en explicaciones comprensibles para pacientes, integrando reconocimiento óptico de caracteres (OCR) con modelos de lenguaje biomédico.
---
## ✨ ¿Qué hace?
1. 📸 **Captura o carga una receta médica** (foto o escaneo).
2. 🧠 **Extrae texto con DeepSeek-OCR** (modelo open-source de alto rendimiento).
3. 💬 **Interpreta los textos médicos con BioMedLM** (modelo de Stanford).
4. 🤖 **Te muestra una explicación clara y contextualizada**, como si hablaras con un profesional de salud.
---
## 🔧 Tecnologías usadas
| Componente | Descripción |
|-------------------|-------------|
| 🤖 `DeepSeek-OCR` | Precisión del 97% en OCR multimodal bajo compresión visual baja [(arXiv)](https://arxiv.org/abs/2510.18234) |
| 🧠 `BioMedLM` | Modelo biomédico entrenado por Stanford para comprensión y QA médica [(arXiv)](https://arxiv.org/abs/2403.18421) |
| 🎨 `Gradio 5` | Interfaz amigable para uso web, compatible con Spaces |
| 💾 `llama.cpp` (opcional) | Modo local usando GGUF para offline inference |
---
## 🚀 Cómo usarlo
1. Carga una imagen o toma una foto clara de la receta.
2. Espera unos segundos mientras la IA lee y entiende.
3. Recibe una explicación clara: dosis, advertencias y recomendaciones.
---
## 🧪 Ejemplo
📷 Receta cargada:
> *"Amoxicilina 500 mg cada 8 horas por 5 días"*
🧠 Interpretación:
> *“Debes tomar Amoxicilina tres veces al día, preferiblemente después de las comidas. No la combines con bebidas alcohólicas.”*
---
## 📌 Créditos
- Proyecto creado por **Jorge Iván Romero Gelvez**
- Universidad Jorge Tadeo Lozano | [@jorgeiv500](https://huggingface.co/jorgeiv500)
- Modelos usados:
- [`deepseek-ai/DeepSeek-OCR`](https://huggingface.co/deepseek-ai/DeepSeek-OCR)
- [`stanford-crfm/BioMedLM`](https://huggingface.co/stanford-crfm/BioMedLM)
---
## 🛡️ Advertencia
> ⚠️ Esta aplicación es solo con fines demostrativos. No reemplaza el consejo de un profesional de la salud.
---
## 📚 Referencias
- Wei, Sun, & Li (2025). *DeepSeek-VL: Efficient Vision-Language Models with Token Compression*. [arXiv:2510.18234](https://arxiv.org/abs/2510.18234)
- Bolton et al. (2024). *BioMedLM: A Biomedical Language Model Trained Exclusively on PubMed*. [arXiv:2403.18421](https://arxiv.org/abs/2403.18421)