Spaces:
Sleeping
Sleeping
A newer version of the Gradio SDK is available:
6.1.0
metadata
title: OpScan.IA — DeepSeek-OCR + R1 Medical Mini (GGUF rápido)
emoji: 🩺
colorFrom: gray
colorTo: purple
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false
OpScan.IA — DeepSeek-OCR + DeepSeek-R1 Medical Mini (GGUF local rápido)
Objetivo: máxima velocidad sin tokens en Spaces Zero/CPU.
El chat usa DeepSeek-R1 Medical Mini en GGUF (cuantizado Q4 si está disponible) con llama.cpp.
El OCR se hace con DeepSeek-OCR (con fallback automático a _attn_implementation="eager" si no hay FlashAttention2).
Requisitos
Ver requirements.txt.
Variables opcionales
GGUF_REPO(default:mradermacher/DeepSeek-r1-Medical-Mini-GGUF)GGUF_FILE(si no se define, el app prueba en orden:Q4_K_M,Q4_0,Q5_0,Q8_0,f16)N_CTX(2048),N_THREADS(auto),N_GPU_LAYERS(0),N_BATCH(96),WARMUP(0/1)OCR_ATTN_IMPL:flash_attention_2oeager
Ejecución local
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
python app.py