extrator-pdf-web / README.md
WallaceBrasil's picture
Update README.md
e0bbe75 verified

A newer version of the Gradio SDK is available: 6.13.0

Upgrade
metadata
title: Extrator de Imagens de PDF
emoji: 🧾
colorFrom: gray
colorTo: green
sdk: gradio
sdk_version: 5.44.1
app_file: app.py
pinned: false
license: mit

Extrator de Imagens de PDF (Gradio)

Converta um ou vários PDFs (inclusive dentro de .zip) em imagens por página. Interface simples, tema escuro e saída em galeria + ZIP.

Tecnologias: Python, Gradio 4, pdf2image (Poppler), Pillow.

Demonstração

  • App online (HF Space): adicione o link do seu Space aqui
  • Repositório (código): este repositório

Recursos

  • ✅ Suporta PDF ou .zip com vários PDFs.
  • ✅ Dois modos: todas as páginas ou páginas específicas (ex.: 3 - 5 - 10).
  • ✅ Gera galeria para pré-visualizar e ZIP com todas as imagens.
  • ✅ Formatos: JPEG, PNG, BMP, ICO.

Como funciona (resumo)

  • Usa pdf2image (Poppler) para rasterizar cada página do PDF.
  • Salva as imagens no formato escolhido e empacota tudo em ZIP.
  • Mostra prévias na Gallery do Gradio.

Instalação local

Requisitos: Python 3.10+.

  1. (Windows) Poppler
    Baixe o Poppler (ex.: poppler-XX) e aponte para ...\Library\bin dentro do processador.py (constante POPPLER_PATH).
    No Linux/macOS, não precisa setar (usa do sistema).

  2. Instalar dependências

    python -m venv .venv
    # Windows
    .venv\Scripts\activate
    # macOS/Linux
    # source .venv/bin/activate
    
    python -m pip install -U pip
    python -m pip install -r requirements.txt
    
  3. Executar python app.py