A newer version of the Gradio SDK is available:
6.2.0
metadata
title: Balancete
emoji: 🏢
colorFrom: pink
colorTo: purple
sdk: gradio
sdk_version: 5.29.0
app_file: app.py
pinned: false
license: mit
short_description: Conversor de balancetes PDF para tabelas usando docling
🧾 TableFormer via Docling
Este Space utiliza o modelo TableFormer accurate da Docling para extrair tabelas de documentos PDF de balancetes.
✅ Como funciona
- O usuário envia um PDF de balancete.
- O modelo TableFormer identifica automaticamente as tabelas (mesmo em múltiplas páginas).
- As tabelas são exibidas e podem ser copiadas ou exportadas.
🔧 Tecnologias usadas
- Gradio (interface)
- Docling Core (pipeline de extração)
- TableFormer (modelo SOTA para estrutura de tabela)
- Transformers + Torch (backend)
- Pandas (estruturação de dados)
📝 Observações
- O modelo
tableformer/accurateé carregado automaticamente de:docling-models/model_artifacts - Processa até 2 tabelas por vez (ajustável no código).
- Não requer GPU — roda em CPU/ZeroGPU.
▶️ Para rodar localmente
git clone https://github.com/sua-org/seu-repo.git
cd seu-repo
python3 -m venv .venv && source .venv/bin/activate
pip install -r requirements.txt
python app.py