File size: 2,767 Bytes
c528658
 
 
 
 
 
 
 
 
 
c1b16e4
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
---
title: Watsonx AI-Intelligent Document Analysis
emoji: 
colorFrom: blue
colorTo: gray
sdk: docker
pinned: false
license: mit
---

# 📑 Watsonx AI - Análise Inteligente de Documentos

Este projeto é uma aplicação web construída com **Gradio** que utiliza os serviços da **IBM Watson** e **Watsonx AI** para analisar documentos (PDF, DOCX, TXT), extrair informações relevantes, gerar resumos e permitir um chat inteligente baseado no conteúdo do documento (RAG - Retrieval-Augmented Generation).

## 🚀 Funcionalidades

- **Extração de Texto:** Suporte para arquivos PDF, DOCX e TXT.
- **Análise de NLU:** Geração de resumos automáticos, extração de tópicos-chave e classificação temática usando IBM Watson Natural Language Understanding.
- **Localizador de Trechos:** Busca inteligente de parágrafos relevantes baseada em termos da pergunta.
- **Chat Inteligente (RAG):** Diálogo interativo com o modelo **Llama-3-70B** via Watsonx AI, focado exclusivamente no conteúdo do documento enviado.

## 🛠️ Tecnologias Utilizadas

- [Gradio](https://gradio.app/) - Interface Web
- [IBM Watson NLU](https://www.ibm.com/cloud/watson-natural-language-understanding) - Processamento de Linguagem Natural
- [IBM Watsonx AI](https://www.ibm.com/watsonx) - Modelos de Fundação (Llama-3)
- [Python 3.10](https://www.python.org/)
- [Docker](https://www.docker.com/)

## 📋 Pré-requisitos

Antes de começar, você precisará de:

1. Uma conta na [IBM Cloud](https://cloud.ibm.com/).
2. Instâncias dos serviços **Natural Language Understanding** e **Watsonx.ai**.
3. Suas chaves de API e URLs dos serviços.

## ⚙️ Instalação e Configuração

### Localmente

1. Clone o repositório:
   ```bash
   git clone https://huggingface.co/spaces/seu-usuario/Watsonx_AI-Intelligent_Document_Analysis
   cd Watsonx_AI-Intelligent_Document_Analysis
   ```

2. Crie um ambiente virtual e instale as dependências:
   ```bash
   python -m venv venv
   source venv/bin/activate  # No Windows: venv\Scripts\activate
   pip install -r requirements.txt
   ```

3. Configure as variáveis de ambiente:
   - Copie o arquivo `.env.example` para `.env`.
   - Preencha com suas credenciais da IBM Cloud.

4. Execute a aplicação:
   ```bash
   python app.py
   ```

### Via Docker

1. Construa a imagem:
   ```bash
   docker build -t watson-doc-analysis .
   ```

2. Execute o container:
   ```bash
   docker run -p 7860:7860 --env-file .env watson-doc-analysis
   ```

## 🧪 Testes

Para executar os testes unitários e de integração:

```bash
pytest
```

## 📄 Licença

Este projeto está sob a licença MIT. Veja o arquivo [LICENSE](LICENSE) para mais detalhes.

---
Desenvolvido para demonstração de capacidades de IA com Watsonx e Gradio.