vcollos commited on
Commit
4c10edf
·
verified ·
1 Parent(s): 3e8163e

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +35 -1
README.md CHANGED
@@ -11,4 +11,38 @@ license: mit
11
  short_description: Conversor de balancetes PDF para tabelas usando docling
12
  ---
13
 
14
- Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
11
  short_description: Conversor de balancetes PDF para tabelas usando docling
12
  ---
13
 
14
+ # 🧾 TableFormer via Docling
15
+
16
+ Este Space utiliza o modelo **TableFormer accurate** da Docling para extrair tabelas de documentos PDF de balancetes.
17
+
18
+ ## ✅ Como funciona
19
+
20
+ - O usuário envia um PDF de balancete.
21
+ - O modelo TableFormer identifica automaticamente as tabelas (mesmo em múltiplas páginas).
22
+ - As tabelas são exibidas e podem ser copiadas ou exportadas.
23
+
24
+ ## 🔧 Tecnologias usadas
25
+
26
+ - Gradio (interface)
27
+ - Docling Core (pipeline de extração)
28
+ - TableFormer (modelo SOTA para estrutura de tabela)
29
+ - Transformers + Torch (backend)
30
+ - Pandas (estruturação de dados)
31
+
32
+ ## 📝 Observações
33
+
34
+ - O modelo `tableformer/accurate` é carregado automaticamente de:
35
+ [`docling-models/model_artifacts`](https://huggingface.co/docling-models/model_artifacts/tree/main/tableformer/accurate)
36
+ - Processa até 2 tabelas por vez (ajustável no código).
37
+ - Não requer GPU — roda em CPU/ZeroGPU.
38
+
39
+ ---
40
+
41
+ ## ▶️ Para rodar localmente
42
+
43
+ ```bash
44
+ git clone https://github.com/sua-org/seu-repo.git
45
+ cd seu-repo
46
+ python3 -m venv .venv && source .venv/bin/activate
47
+ pip install -r requirements.txt
48
+ python app.py