DeepSeek-OCR-Demo2

Sleeping

App Files Files Community

DeepSeek-OCR-Demo2 / README.md

jorgeiv500

2c7042c about 1 month ago

preview code

raw

history blame

1.5 kB

metadata

title: OpScan.IA — DeepSeek-OCR + DeepSeek-R1 Medical Mini
emoji: 🩺
colorFrom: gray
colorTo: purple
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false

OpScan.IA — DeepSeek-OCR + DeepSeek-R1 Medical Mini

Aplicación en Gradio que:

Extrae texto y marcas de un documento/imagen con DeepSeek-OCR.
Inyecta automáticamente ese OCR como contexto para chatear con DeepSeek-R1 Medical Mini (remoto o GGUF local).

Uso educativo. No sustituye criterio clínico ni diagnóstico profesional.

✨ Características

OCR: cajas, Markdown y/o texto plano a partir de imágenes (upload/clipboard/cámara).
Chat clínico: el LLM recibe el OCR como system context y responde con cautela.
Modos del chat:
- Remoto (HF Inference): R1_REMOTE=1 (sin token si el modelo es público).
- Local GGUF (CPU/Zero): R1_REMOTE=0 con llama.cpp.
Tolerante a entorno: si el OCR falla por FlashAttention2, cae a _attn_implementation="eager" automáticamente.

📦 Requisitos

requirements.txt:

gradio==5.49.1
spaces>=0.28.3
torch==2.6.0
torchvision==0.21.0
transformers==4.46.3
tokenizers==0.20.3
accelerate>=0.34.2
safetensors>=0.4.5
huggingface-hub>=0.30.0
hf-transfer>=0.1.6
pillow>=10.4.0
numpy>=1.26.0
tqdm>=4.66.4
requests>=2.31.0
einops>=0.7.0
addict>=2.4.0
easydict>=1.13
sentencepiece>=0.2.0
pydantic==2.10.6
protobuf<4
click<8.1
llama-cpp-python==0.2.90
# (Opcional GPU) flash-attn / xformers