guifav commited on
Commit
837e13b
·
1 Parent(s): a97042a

add app file

Browse files
Files changed (2) hide show
  1. README.md +84 -3
  2. requirements.txt +54 -0
README.md CHANGED
@@ -1,8 +1,8 @@
1
  ---
2
  title: Pdftomd Mule
3
  emoji: 👁
4
- colorFrom: gray
5
- colorTo: green
6
  sdk: gradio
7
  sdk_version: 5.0.1
8
  app_file: app.py
@@ -11,4 +11,85 @@ license: mit
11
  short_description: Conversor de PDF para Markdown com OCR (compreensão de image
12
  ---
13
 
14
- Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
  title: Pdftomd Mule
3
  emoji: 👁
4
+ colorFrom: pink
5
+ colorTo: yellow
6
  sdk: gradio
7
  sdk_version: 5.0.1
8
  app_file: app.py
 
11
  short_description: Conversor de PDF para Markdown com OCR (compreensão de image
12
  ---
13
 
14
+ # PDFtoText Pro Mule: Conversor de PDF para Markdown com OCR
15
+
16
+ **Hospedado no Hugging Face Spaces: [PDFtoText Pro Mule](https://huggingface.co/spaces/guifav/pdftomd_mule)**
17
+
18
+ ## Descrição
19
+ PDFtoText Pro Mule é um aplicativo web robusto e eficiente que converte arquivos PDF em formato Markdown. Assim como uma mula é conhecida por sua força e persistência, este aplicativo trabalha incansavelmente para preservar a estrutura do documento, extrair imagens e realizar OCR (Reconhecimento Óptico de Caracteres) em texto contido em imagens. É a ferramenta ideal para quem precisa transformar conteúdo de PDFs em um formato mais flexível e editável.
20
+
21
+ ## Características Principais
22
+ - Conversão de PDF para Markdown
23
+ - Extração e preservação de imagens
24
+ - OCR para texto em imagens
25
+ - Detecção e formatação de blocos de código
26
+ - Geração de arquivo ZIP contendo Markdown e imagens extraídas
27
+
28
+ ## Tecnologias Utilizadas
29
+ - Python
30
+ - Gradio (interface web)
31
+ - PyMuPDF (processamento de PDF)
32
+ - Tesseract OCR (reconhecimento de texto em imagens)
33
+ - Pillow (manipulação de imagens)
34
+
35
+ ## Acesso ao Aplicativo
36
+ Você pode acessar e usar o PDFtoText Pro Mule diretamente através do Hugging Face Spaces:
37
+ [https://huggingface.co/spaces/guifav/pdftomd_mule](https://huggingface.co/spaces/guifav/pdftomd_mule)
38
+
39
+ ## Uso
40
+ 1. Acesse o link do Hugging Face Spaces fornecido acima.
41
+ 2. Faça upload de um arquivo PDF usando a interface.
42
+ 3. Clique no botão para iniciar a conversão.
43
+ 4. Faça o download do arquivo ZIP resultante contendo o Markdown e as imagens extraídas.
44
+
45
+ ## Instalação Local (para desenvolvimento)
46
+
47
+ Se você deseja executar ou desenvolver o aplicativo localmente:
48
+
49
+ 1. Clone o repositório:
50
+ ```
51
+ git clone https://huggingface.co/spaces/guifav/pdftomd_mule
52
+ cd pdftomd_mule
53
+ ```
54
+
55
+ 2. Crie um ambiente virtual e ative-o:
56
+ ```
57
+ python -m venv venv
58
+ source venv/bin/activate # No Windows use `venv\Scripts\activate`
59
+ ```
60
+
61
+ 3. Instale as dependências:
62
+ ```
63
+ pip install -r requirements.txt
64
+ ```
65
+
66
+ 4. Instale o Tesseract OCR:
67
+ - Para macOS: `brew install tesseract`
68
+ - Para Linux: `sudo apt-get install tesseract-ocr`
69
+ - Para Windows: Baixe o instalador do [site oficial do Tesseract](https://github.com/UB-Mannheim/tesseract/wiki)
70
+
71
+ 5. Ajuste o caminho do Tesseract no arquivo `app.py` se necessário:
72
+ ```python
73
+ pytesseract.pytesseract.tesseract_cmd = r'/caminho/para/tesseract'
74
+ ```
75
+
76
+ 6. Execute o aplicativo localmente:
77
+ ```
78
+ python app.py
79
+ ```
80
+
81
+ ## Contribuindo
82
+ Contribuições são bem-vindas! Se você tem sugestões para melhorar este aplicativo, sinta-se à vontade para fazer um fork do repositório, fazer suas alterações e submeter um pull request.
83
+
84
+ ## Feedback e Suporte
85
+ Se você encontrar algum problema ou tiver sugestões de melhoria, por favor, abra uma issue no repositório do Hugging Face Spaces ou entre em contato através do Guilherme Favaron no [LinkedIn](https://www.linkedin.com/in/guilhermefavaron/).
86
+
87
+ ## Licença
88
+ Este projeto está licenciado sob a Licença MIT - veja o arquivo [LICENSE](LICENSE) para detalhes.
89
+
90
+ ## Autor
91
+ [Guilherme Favaron](https://www.guilhermefavaron.com.br)
92
+
93
+ ---
94
+
95
+ Desenvolvido com ❤️ e a persistência de uma "mula" 🐴
requirements.txt ADDED
@@ -0,0 +1,54 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ aiofiles==23.2.1
2
+ annotated-types==0.7.0
3
+ anyio==4.6.0
4
+ certifi==2024.8.30
5
+ charset-normalizer==3.4.0
6
+ click==8.1.7
7
+ fastapi==0.115.0
8
+ ffmpy==0.4.0
9
+ filelock==3.16.1
10
+ fsspec==2024.9.0
11
+ gradio==5.0.1
12
+ gradio_client==1.4.0
13
+ h11==0.14.0
14
+ httpcore==1.0.6
15
+ httpx==0.27.2
16
+ huggingface-hub==0.25.2
17
+ idna==3.10
18
+ Jinja2==3.1.4
19
+ Markdown==3.7
20
+ markdown-it-py==3.0.0
21
+ MarkupSafe==2.1.5
22
+ mdurl==0.1.2
23
+ numpy==2.1.2
24
+ orjson==3.10.7
25
+ packaging==24.1
26
+ pandas==2.2.3
27
+ pdf2image==1.17.0
28
+ pillow==10.4.0
29
+ pydantic==2.9.2
30
+ pydantic_core==2.23.4
31
+ pydub==0.25.1
32
+ Pygments==2.18.0
33
+ PyMuPDF==1.24.11
34
+ pytesseract==0.3.13
35
+ python-dateutil==2.9.0.post0
36
+ python-multipart==0.0.12
37
+ pytz==2024.2
38
+ PyYAML==6.0.2
39
+ requests==2.32.3
40
+ rich==13.9.2
41
+ ruff==0.6.9
42
+ semantic-version==2.10.0
43
+ shellingham==1.5.4
44
+ six==1.16.0
45
+ sniffio==1.3.1
46
+ starlette==0.38.6
47
+ tomlkit==0.12.0
48
+ tqdm==4.66.5
49
+ typer==0.12.5
50
+ typing_extensions==4.12.2
51
+ tzdata==2024.2
52
+ urllib3==2.2.3
53
+ uvicorn==0.31.1
54
+ websockets==12.0