balancete / README.md
vcollos's picture
Update README.md
4c10edf verified

A newer version of the Gradio SDK is available: 6.2.0

Upgrade
metadata
title: Balancete
emoji: 🏢
colorFrom: pink
colorTo: purple
sdk: gradio
sdk_version: 5.29.0
app_file: app.py
pinned: false
license: mit
short_description: Conversor de balancetes PDF para tabelas usando docling

🧾 TableFormer via Docling

Este Space utiliza o modelo TableFormer accurate da Docling para extrair tabelas de documentos PDF de balancetes.

✅ Como funciona

  • O usuário envia um PDF de balancete.
  • O modelo TableFormer identifica automaticamente as tabelas (mesmo em múltiplas páginas).
  • As tabelas são exibidas e podem ser copiadas ou exportadas.

🔧 Tecnologias usadas

  • Gradio (interface)
  • Docling Core (pipeline de extração)
  • TableFormer (modelo SOTA para estrutura de tabela)
  • Transformers + Torch (backend)
  • Pandas (estruturação de dados)

📝 Observações

  • O modelo tableformer/accurate é carregado automaticamente de:
    docling-models/model_artifacts
  • Processa até 2 tabelas por vez (ajustável no código).
  • Não requer GPU — roda em CPU/ZeroGPU.

▶️ Para rodar localmente

git clone https://github.com/sua-org/seu-repo.git
cd seu-repo
python3 -m venv .venv && source .venv/bin/activate
pip install -r requirements.txt
python app.py