A newer version of the Gradio SDK is available: 6.13.0
metadata
title: Extrator de Imagens de PDF
emoji: 🧾
colorFrom: gray
colorTo: green
sdk: gradio
sdk_version: 5.44.1
app_file: app.py
pinned: false
license: mit
Extrator de Imagens de PDF (Gradio)
Converta um ou vários PDFs (inclusive dentro de .zip) em imagens por página. Interface simples, tema escuro e saída em galeria + ZIP.
Tecnologias: Python, Gradio 4, pdf2image (Poppler), Pillow.
Demonstração
- App online (HF Space): adicione o link do seu Space aqui
- Repositório (código): este repositório
Recursos
- ✅ Suporta PDF ou
.zipcom vários PDFs. - ✅ Dois modos: todas as páginas ou páginas específicas (ex.:
3 - 5 - 10). - ✅ Gera galeria para pré-visualizar e ZIP com todas as imagens.
- ✅ Formatos: JPEG, PNG, BMP, ICO.
Como funciona (resumo)
- Usa pdf2image (Poppler) para rasterizar cada página do PDF.
- Salva as imagens no formato escolhido e empacota tudo em ZIP.
- Mostra prévias na Gallery do Gradio.
Instalação local
Requisitos: Python 3.10+.
(Windows) Poppler
Baixe o Poppler (ex.:poppler-XX) e aponte para...\Library\bindentro doprocessador.py(constantePOPPLER_PATH).
No Linux/macOS, não precisa setar (usa do sistema).Instalar dependências
python -m venv .venv # Windows .venv\Scripts\activate # macOS/Linux # source .venv/bin/activate python -m pip install -U pip python -m pip install -r requirements.txtExecutar python app.py