DeepSeek-OCR-Demo2

Sleeping

App Files Files Community

DeepSeek-OCR-Demo2 / README.md

jorgeiv500

42632ea about 1 month ago

preview code

raw

history blame contribute delete

1.05 kB

A newer version of the Gradio SDK is available: 6.1.0

Upgrade

metadata

title: OpScan.IA — DeepSeek-OCR + R1 Medical Mini (GGUF rápido)
emoji: 🩺
colorFrom: gray
colorTo: purple
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false

OpScan.IA — DeepSeek-OCR + DeepSeek-R1 Medical Mini (GGUF local rápido)

Objetivo: máxima velocidad sin tokens en Spaces Zero/CPU.
El chat usa DeepSeek-R1 Medical Mini en GGUF (cuantizado Q4 si está disponible) con llama.cpp.
El OCR se hace con DeepSeek-OCR (con fallback automático a _attn_implementation="eager" si no hay FlashAttention2).

Requisitos

Ver requirements.txt.

Variables opcionales

GGUF_REPO (default: mradermacher/DeepSeek-r1-Medical-Mini-GGUF)
GGUF_FILE (si no se define, el app prueba en orden: Q4_K_M, Q4_0, Q5_0, Q8_0, f16)
N_CTX (2048), N_THREADS (auto), N_GPU_LAYERS (0), N_BATCH (96), WARMUP (0/1)
OCR_ATTN_IMPL: flash_attention_2 o eager

Ejecución local

python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
python app.py