DeepSeek-OCR-Demo2 / README.md
jorgeiv500's picture
xx
2c7042c
|
raw
history blame
1.5 kB
metadata
title: OpScan.IA  DeepSeek-OCR + DeepSeek-R1 Medical Mini
emoji: 🩺
colorFrom: gray
colorTo: purple
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false

OpScan.IA — DeepSeek-OCR + DeepSeek-R1 Medical Mini

Aplicación en Gradio que:

  1. Extrae texto y marcas de un documento/imagen con DeepSeek-OCR.
  2. Inyecta automáticamente ese OCR como contexto para chatear con DeepSeek-R1 Medical Mini (remoto o GGUF local).

Uso educativo. No sustituye criterio clínico ni diagnóstico profesional.


✨ Características

  • OCR: cajas, Markdown y/o texto plano a partir de imágenes (upload/clipboard/cámara).
  • Chat clínico: el LLM recibe el OCR como system context y responde con cautela.
  • Modos del chat:
    • Remoto (HF Inference): R1_REMOTE=1 (sin token si el modelo es público).
    • Local GGUF (CPU/Zero): R1_REMOTE=0 con llama.cpp.
  • Tolerante a entorno: si el OCR falla por FlashAttention2, cae a _attn_implementation="eager" automáticamente.

📦 Requisitos

requirements.txt:

gradio==5.49.1
spaces>=0.28.3
torch==2.6.0
torchvision==0.21.0
transformers==4.46.3
tokenizers==0.20.3
accelerate>=0.34.2
safetensors>=0.4.5
huggingface-hub>=0.30.0
hf-transfer>=0.1.6
pillow>=10.4.0
numpy>=1.26.0
tqdm>=4.66.4
requests>=2.31.0
einops>=0.7.0
addict>=2.4.0
easydict>=1.13
sentencepiece>=0.2.0
pydantic==2.10.6
protobuf<4
click<8.1
llama-cpp-python==0.2.90
# (Opcional GPU) flash-attn / xformers