OpScanIA

Sleeping

App Files Files Community

OpScanIA / README.md

jorgeiv500

Update README.md

f85f2f4 verified 2 months ago

preview code

raw

history blame contribute delete

2.65 kB

	---
	title: OpScan.IA — DeepSeek-OCR + Medical
	emoji: 🩺
	colorFrom: gray
	colorTo: purple
	sdk: gradio
	sdk_version: 5.49.1
	app_file: app.py
	pinned: false
	---

	# 🩺 OpenScanIA: Inteligencia Artificial para Entender Recetas Médicas

	OpenScanIA es una aplicación que convierte imágenes de recetas médicas en explicaciones comprensibles para pacientes, integrando reconocimiento óptico de caracteres (OCR) con modelos de lenguaje biomédico.

	---

	## ✨ ¿Qué hace?

	1. 📸 Captura o carga una receta médica (foto o escaneo).
	2. 🧠 Extrae texto con DeepSeek-OCR (modelo open-source de alto rendimiento).
	3. 💬 Interpreta los textos médicos con BioMedLM (modelo de Stanford).
	4. 🤖 Te muestra una explicación clara y contextualizada, como si hablaras con un profesional de salud.

	---

	## 🔧 Tecnologías usadas

	\| Componente \| Descripción \|
	\|-------------------\|-------------\|
	\| 🤖 `DeepSeek-OCR` \| Precisión del 97% en OCR multimodal bajo compresión visual baja [(arXiv)](https://arxiv.org/abs/2510.18234) \|
	\| 🧠 `BioMedLM` \| Modelo biomédico entrenado por Stanford para comprensión y QA médica [(arXiv)](https://arxiv.org/abs/2403.18421) \|
	\| 🎨 `Gradio 5` \| Interfaz amigable para uso web, compatible con Spaces \|
	\| 💾 `llama.cpp` (opcional) \| Modo local usando GGUF para offline inference \|

	---

	## 🚀 Cómo usarlo

	1. Carga una imagen o toma una foto clara de la receta.
	2. Espera unos segundos mientras la IA lee y entiende.
	3. Recibe una explicación clara: dosis, advertencias y recomendaciones.

	---

	## 🧪 Ejemplo

	📷 Receta cargada:
	> "Amoxicilina 500 mg cada 8 horas por 5 días"

	🧠 Interpretación:
	> “Debes tomar Amoxicilina tres veces al día, preferiblemente después de las comidas. No la combines con bebidas alcohólicas.”

	---

	## 📌 Créditos

	- Proyecto creado por Jorge Iván Romero Gelvez
	- Universidad Jorge Tadeo Lozano \| [@jorgeiv500](https://huggingface.co/jorgeiv500)
	- Modelos usados:
	- [`deepseek-ai/DeepSeek-OCR`](https://huggingface.co/deepseek-ai/DeepSeek-OCR)
	- [`stanford-crfm/BioMedLM`](https://huggingface.co/stanford-crfm/BioMedLM)

	---

	## 🛡️ Advertencia

	> ⚠️ Esta aplicación es solo con fines demostrativos. No reemplaza el consejo de un profesional de la salud.

	---

	## 📚 Referencias

	- Wei, Sun, & Li (2025). DeepSeek-VL: Efficient Vision-Language Models with Token Compression. [arXiv:2510.18234](https://arxiv.org/abs/2510.18234)
	- Bolton et al. (2024). BioMedLM: A Biomedical Language Model Trained Exclusively on PubMed. [arXiv:2403.18421](https://arxiv.org/abs/2403.18421)