--- title: Balancete emoji: 🏢 colorFrom: pink colorTo: purple sdk: gradio sdk_version: 5.29.0 app_file: app.py pinned: false license: mit short_description: Conversor de balancetes PDF para tabelas usando docling --- # 🧾 TableFormer via Docling Este Space utiliza o modelo **TableFormer accurate** da Docling para extrair tabelas de documentos PDF de balancetes. ## ✅ Como funciona - O usuário envia um PDF de balancete. - O modelo TableFormer identifica automaticamente as tabelas (mesmo em múltiplas páginas). - As tabelas são exibidas e podem ser copiadas ou exportadas. ## 🔧 Tecnologias usadas - Gradio (interface) - Docling Core (pipeline de extração) - TableFormer (modelo SOTA para estrutura de tabela) - Transformers + Torch (backend) - Pandas (estruturação de dados) ## 📝 Observações - O modelo `tableformer/accurate` é carregado automaticamente de: [`docling-models/model_artifacts`](https://huggingface.co/docling-models/model_artifacts/tree/main/tableformer/accurate) - Processa até 2 tabelas por vez (ajustável no código). - Não requer GPU — roda em CPU/ZeroGPU. --- ## ▶️ Para rodar localmente ```bash git clone https://github.com/sua-org/seu-repo.git cd seu-repo python3 -m venv .venv && source .venv/bin/activate pip install -r requirements.txt python app.py