Spaces:
Sleeping
Sleeping
File size: 7,328 Bytes
b95e73a 3c8ed07 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 |
---
title: Cidadão.AI Models
emoji: 🤖
colorFrom: blue
colorTo: green
sdk: docker
app_port: 8001
pinned: false
license: mit
tags:
- transparency
- government
- brazil
- anomaly-detection
- fastapi
---
# 🤖 Cidadão.AI Models
> **Modelos especializados de Machine Learning para análise de transparência pública brasileira**
[](https://www.python.org/downloads/)
[](https://pytorch.org/)
[](https://huggingface.co/transformers/)
[](LICENSE)
## 🎯 Visão Geral
**Cidadão.AI Models** é o repositório especializado em modelos de machine learning para o ecossistema Cidadão.AI. Contém modelos customizados, pipeline de treinamento MLOps e infraestrutura de inferência para análise avançada de dados de transparência pública.
### 🚀 Capacidades Principais
- 🔍 **Detecção de Anomalias** - Identificação automática de padrões suspeitos em contratos públicos
- 📊 **Análise de Padrões** - Reconhecimento de correlações e tendências em dados governamentais
- 🌊 **Análise Espectral** - Detecção de padrões temporais e sazonais via FFT
- 🤖 **Modelos Customizados** - Arquiteturas especializadas para transparência brasileira
- 🔄 **Pipeline MLOps** - Treinamento, versionamento e deploy automatizados
## 🏗️ Arquitetura
```
src/
├── models/ # Modelos de ML especializados
│ ├── anomaly_detection/ # Detecção de anomalias
│ ├── pattern_analysis/ # Análise de padrões
│ ├── spectral_analysis/ # Análise espectral
│ └── core/ # Classes base e utilitários
├── training/ # Pipeline de treinamento
│ ├── pipelines/ # Pipelines de treinamento
│ ├── configs/ # Configurações de modelos
│ └── utils/ # Utilitários de treinamento
├── inference/ # Servidor de inferência
│ ├── api_server.py # FastAPI server
│ ├── batch_processor.py # Processamento em lote
│ └── streaming.py # Inferência em tempo real
└── deployment/ # Ferramentas de deploy
├── huggingface/ # Integração HuggingFace Hub
├── docker/ # Containerização
└── monitoring/ # Monitoramento de modelos
```
## 🚀 Quick Start
### Instalação
```bash
# Clone o repositório
git clone https://github.com/anderson-ufrj/cidadao.ai-models
cd cidadao.ai-models
# Instale as dependências
pip install -r requirements.txt
# Instale o pacote em modo desenvolvimento
pip install -e .
```
### Uso Básico
```python
from cidadao_models.models.anomaly_detection import AnomalyDetector
from cidadao_models.models.pattern_analysis import PatternAnalyzer
# Inicializar modelos
anomaly_detector = AnomalyDetector()
pattern_analyzer = PatternAnalyzer()
# Analisar contratos para anomalias
contracts = [...] # Lista de contratos
anomalies = anomaly_detector.analyze(contracts)
# Analisar padrões temporais
patterns = pattern_analyzer.analyze_temporal_patterns(data)
```
### Servidor de Inferência
```bash
# Iniciar servidor API
uvicorn src.inference.api_server:app --host 0.0.0.0 --port 8001
# Testar endpoint
curl -X POST "http://localhost:8001/v1/detect-anomalies" \
-H "Content-Type: application/json" \
-d '{"contracts": [...]}'
```
## 🧠 Modelos Disponíveis
### 🔍 Detector de Anomalias
- **Algoritmos**: Isolation Forest, One-Class SVM, Local Outlier Factor
- **Especialização**: Contratos públicos brasileiros
- **Métricas**: Precisão >90% para anomalias críticas
### 📊 Analisador de Padrões
- **Capacidades**: Time series, correlações, clustering
- **Técnicas**: Prophet, FFT, decomposição sazonal
- **Output**: Padrões temporais e insights explicáveis
### 🌊 Analisador Espectral
- **Método**: Transformada rápida de Fourier (FFT)
- **Detecção**: Padrões periódicos suspeitos
- **Aplicação**: Irregularidades sazonais em gastos
## 🛠️ Desenvolvimento
### Estrutura de Testes
```bash
# Executar todos os testes
pytest tests/
# Testes específicos
pytest tests/unit/models/
pytest tests/integration/
pytest tests/e2e/
```
### Treinamento de Modelos
```bash
# Treinar modelo de detecção de corrupção
python src/training/pipelines/train_corruption_detector.py --config configs/corruption_bert.yaml
# Avaliar performance
python src/training/evaluate.py --model corruption_detector --test_data data/test.json
```
### Deploy HuggingFace
```bash
# Upload para HuggingFace Hub
python src/deployment/huggingface/upload.py --model_path models/anomaly_detector --repo_name cidadao-ai/anomaly-detector
```
## 🔄 Integração com Backend
Este repositório se integra com o [cidadao.ai-backend](https://github.com/anderson-ufrj/cidadao.ai-backend) através de:
- **API REST**: Servidor de inferência FastAPI
- **Package Integration**: Importação direta como dependência
- **Fallback Local**: Processamento local se API indisponível
```python
# No backend
from src.tools.models_client import ModelsClient
client = ModelsClient("http://models-api:8001")
results = await client.detect_anomalies(contracts)
```
## 📊 MLOps Pipeline
### Treinamento Automatizado
- ⚡ **CI/CD**: Pipeline automatizado GitHub Actions
- 📈 **Experiment Tracking**: MLflow + Weights & Biases
- 🔄 **Model Versioning**: HuggingFace Hub integration
- 📊 **Performance Monitoring**: Drift detection + alerting
### Deployment
- 🐳 **Containerização**: Docker para produção
- 🤗 **HuggingFace Spaces**: Demo models deployment
- 🚀 **Kubernetes**: Orquestração escalável
- 📡 **Monitoring**: Prometheus metrics + Grafana dashboards
## 🔗 Links Relacionados
- 🏛️ **Backend**: [cidadao.ai-backend](https://github.com/anderson-ufrj/cidadao.ai-backend)
- 🎨 **Frontend**: [cidadao.ai-frontend](https://github.com/anderson-ufrj/cidadao.ai-frontend)
- 📚 **Documentação**: [cidadao.ai-docs](https://github.com/anderson-ufrj/cidadao.ai-docs)
- 🤗 **HuggingFace**: [cidadao-ai organization](https://huggingface.co/cidadao-ai)
## 📈 Status do Projeto
- ✅ **Estrutura Base**: Completa
- 🔄 **Migração ML**: Em andamento
- ⏳ **API Server**: Planejado
- ⏳ **HF Integration**: Próximo
## 👨💻 Contribuição
1. Fork o projeto
2. Crie uma branch para sua feature (`git checkout -b feature/AmazingFeature`)
3. Commit suas mudanças (`git commit -m 'feat: add amazing feature'`)
4. Push para a branch (`git push origin feature/AmazingFeature`)
5. Abra um Pull Request
## 📄 Licença
Distribuído sob a licença MIT. Veja `LICENSE` para mais informações.
## 👨💻 Autor
**Anderson Henrique da Silva**
📧 andersonhs27@gmail.com | 💻 [GitHub](https://github.com/anderson-ufrj)
---
<div align="center">
<h3>🧠 Democratizando Análise de Transparência com IA Avançada 🧠</h3>
<p><em>Modelos • MLOps • Explicável • Brasileira</em></p>
</div>
|