Spaces:
Sleeping
Sleeping
| title: OpScan.IA — DeepSeek-OCR + Medical | |
| emoji: 🩺 | |
| colorFrom: gray | |
| colorTo: purple | |
| sdk: gradio | |
| sdk_version: 5.49.1 | |
| app_file: app.py | |
| pinned: false | |
| # 🩺 OpenScanIA: Inteligencia Artificial para Entender Recetas Médicas | |
| **OpenScanIA** es una aplicación que convierte imágenes de recetas médicas en explicaciones comprensibles para pacientes, integrando reconocimiento óptico de caracteres (OCR) con modelos de lenguaje biomédico. | |
| --- | |
| ## ✨ ¿Qué hace? | |
| 1. 📸 **Captura o carga una receta médica** (foto o escaneo). | |
| 2. 🧠 **Extrae texto con DeepSeek-OCR** (modelo open-source de alto rendimiento). | |
| 3. 💬 **Interpreta los textos médicos con BioMedLM** (modelo de Stanford). | |
| 4. 🤖 **Te muestra una explicación clara y contextualizada**, como si hablaras con un profesional de salud. | |
| --- | |
| ## 🔧 Tecnologías usadas | |
| | Componente | Descripción | | |
| |-------------------|-------------| | |
| | 🤖 `DeepSeek-OCR` | Precisión del 97% en OCR multimodal bajo compresión visual baja [(arXiv)](https://arxiv.org/abs/2510.18234) | | |
| | 🧠 `BioMedLM` | Modelo biomédico entrenado por Stanford para comprensión y QA médica [(arXiv)](https://arxiv.org/abs/2403.18421) | | |
| | 🎨 `Gradio 5` | Interfaz amigable para uso web, compatible con Spaces | | |
| | 💾 `llama.cpp` (opcional) | Modo local usando GGUF para offline inference | | |
| --- | |
| ## 🚀 Cómo usarlo | |
| 1. Carga una imagen o toma una foto clara de la receta. | |
| 2. Espera unos segundos mientras la IA lee y entiende. | |
| 3. Recibe una explicación clara: dosis, advertencias y recomendaciones. | |
| --- | |
| ## 🧪 Ejemplo | |
| 📷 Receta cargada: | |
| > *"Amoxicilina 500 mg cada 8 horas por 5 días"* | |
| 🧠 Interpretación: | |
| > *“Debes tomar Amoxicilina tres veces al día, preferiblemente después de las comidas. No la combines con bebidas alcohólicas.”* | |
| --- | |
| ## 📌 Créditos | |
| - Proyecto creado por **Jorge Iván Romero Gelvez** | |
| - Universidad Jorge Tadeo Lozano | [@jorgeiv500](https://huggingface.co/jorgeiv500) | |
| - Modelos usados: | |
| - [`deepseek-ai/DeepSeek-OCR`](https://huggingface.co/deepseek-ai/DeepSeek-OCR) | |
| - [`stanford-crfm/BioMedLM`](https://huggingface.co/stanford-crfm/BioMedLM) | |
| --- | |
| ## 🛡️ Advertencia | |
| > ⚠️ Esta aplicación es solo con fines demostrativos. No reemplaza el consejo de un profesional de la salud. | |
| --- | |
| ## 📚 Referencias | |
| - Wei, Sun, & Li (2025). *DeepSeek-VL: Efficient Vision-Language Models with Token Compression*. [arXiv:2510.18234](https://arxiv.org/abs/2510.18234) | |
| - Bolton et al. (2024). *BioMedLM: A Biomedical Language Model Trained Exclusively on PubMed*. [arXiv:2403.18421](https://arxiv.org/abs/2403.18421) | |