Spaces:

neural-thinker
/

cidadao.ai-models

Sleeping

File size: 21,137 Bytes

b95e73a

# 🏛️ CIDADÃO.AI - CONTEXTO GERAL DO PROJETO

**⚠️ HEADER UNIVERSAL - NÃO REMOVER - Atualizado: Janeiro 2025**

## 🎯 VISÃO GERAL DO ECOSSISTEMA

O **Cidadão.AI** é um ecossistema de **4 repositórios especializados** que trabalham em conjunto para democratizar a transparência pública brasileira através de IA avançada:

### 📦 REPOSITÓRIOS DO ECOSSISTEMA
- **cidadao.ai-backend** → API + Sistema Multi-Agente + ML Pipeline
- **cidadao.ai-frontend** → Interface Web + Internacionalização
- **cidadao.ai-docs** → Hub de Documentação + Landing Page
- **cidadao.ai-models** → Modelos IA + Pipeline MLOps (ESTE REPOSITÓRIO)

### 🤖 SISTEMA MULTI-AGENTE (17 Agentes)
1. **MasterAgent (Abaporu)** - Orquestração central com auto-reflexão
2. **InvestigatorAgent** - Detecção de anomalias em dados públicos
3. **AnalystAgent** - Análise de padrões e correlações
4. **ReporterAgent** - Geração inteligente de relatórios
5. **SecurityAuditorAgent** - Auditoria e compliance
6. **CommunicationAgent** - Comunicação inter-agentes
7. **CorruptionDetectorAgent** - Detecção de corrupção
8. **PredictiveAgent** - Análise preditiva
9. **VisualizationAgent** - Visualizações de dados
10. **BonifacioAgent** - Contratos públicos
11. **DandaraAgent** - Diversidade e inclusão
12. **MachadoAgent** - Processamento de linguagem natural
13. **SemanticRouter** - Roteamento inteligente
14. **ContextMemoryAgent** - Sistema de memória
15. **ETLExecutorAgent** - Processamento de dados
16. **ObserverAgent** - Monitoramento
17. **ValidatorAgent** - Validação de qualidade

### 🏗️ ARQUITETURA TÉCNICA
- **Score Geral**: 9.3/10 (Classe Enterprise)
- **Backend**: FastAPI + Python 3.11+ + PostgreSQL + Redis + ChromaDB
- **Frontend**: Next.js 15 + React 19 + TypeScript + Tailwind CSS 4
- **Deploy**: Docker + Kubernetes + SSL + Monitoring
- **IA**: LangChain + Transformers + OpenAI/Groq + Vector DBs

### 🛡️ SEGURANÇA E AUDITORIA
- **Multi-layer security** com middleware especializado
- **JWT + OAuth2 + API Key** authentication
- **Audit trail** completo com severity levels
- **Rate limiting** + **CORS** + **SSL termination**

### 🎯 MISSÃO E IMPACTO
- **Democratizar** acesso a análises de dados públicos
- **Detectar anomalias** e irregularidades automaticamente
- **Empoderar cidadãos** com informação clara e auditável
- **Fortalecer transparência** governamental via IA ética

### 📊 STATUS DO PROJETO
- **Versão**: 1.0.0 (Production-Ready)
- **Score Técnico**: 9.3/10
- **Cobertura de Testes**: 23.6% (Target: >80%)
- **Deploy**: Kubernetes + Vercel + HuggingFace Spaces

---

# CLAUDE.md - MODELOS IA

Este arquivo fornece orientações para o Claude Code ao trabalhar com os modelos de IA e pipeline MLOps do Cidadão.AI.

## 🤖 Visão Geral dos Modelos IA

**Cidadão.AI Models** é o repositório responsável pelos modelos de machine learning, pipeline MLOps e infraestrutura de IA que alimenta o sistema multi-agente. Este repositório gerencia treinamento, versionamento, deploy e monitoramento dos modelos especializados em transparência pública.

**Status Atual**: **Pipeline MLOps em Desenvolvimento** - Infraestrutura para modelos personalizados, integração com HuggingFace Hub e pipeline de treinamento automatizado.

## 🏗️ Análise Arquitetural Modelos IA

### **Score Geral dos Modelos: 7.8/10** (Pipeline em Construção)

O **Repositório de Modelos Cidadão.AI** representa uma **base sólida para MLOps** especializado em análise de transparência pública. O sistema está preparado para hospedar modelos customizados e integrar-se com o ecossistema de agentes.

### 📊 Métricas Técnicas Modelos
- **Framework**: PyTorch + Transformers + HuggingFace
- **MLOps**: MLflow + DVC + Weights & Biases
- **Deploy**: HuggingFace Spaces + Docker containers
- **Monitoring**: Model performance tracking + drift detection
- **Storage**: HuggingFace Hub + cloud storage integration
- **CI/CD**: Automated training + testing + deployment

### 🚀 Componentes Planejados (Score 7-8/10)
- **Model Registry**: 7.8/10 - HuggingFace Hub integration
- **Training Pipeline**: 7.5/10 - Automated training workflow
- **Model Serving**: 7.7/10 - FastAPI + HuggingFace Spaces
- **Monitoring**: 7.3/10 - Performance tracking system
- **Version Control**: 8.0/10 - Git + DVC + HuggingFace

### 🎯 Componentes em Desenvolvimento (Score 6-7/10)
- **Custom Models**: 6.8/10 - Domain-specific fine-tuning
- **Data Pipeline**: 6.5/10 - ETL for training data
- **Evaluation**: 6.7/10 - Automated model evaluation
- **A/B Testing**: 6.3/10 - Model comparison framework

## 🧠 Arquitetura de Modelos

### **Modelos Especializados Planejados**
```python
# Taxonomy dos Modelos Cidadão.AI
models_taxonomy = {
    "corruption_detection": {
        "type": "classification",
        "base_model": "bert-base-multilingual-cased",
        "specialization": "Brazilian Portuguese + government documents",
        "use_case": "Detect corruption indicators in contracts"
    },
    "anomaly_detection": {
        "type": "regression + classification", 
        "base_model": "Custom ensemble",
        "specialization": "Financial data patterns",
        "use_case": "Identify unusual spending patterns"
    },
    "entity_extraction": {
        "type": "NER",
        "base_model": "roberta-large",
        "specialization": "Government entities + Brazilian names",
        "use_case": "Extract companies, people, organizations"
    },
    "sentiment_analysis": {
        "type": "classification",
        "base_model": "distilbert-base-uncased",
        "specialization": "Public opinion on transparency",
        "use_case": "Analyze citizen feedback sentiment"
    },
    "summarization": {
        "type": "seq2seq",
        "base_model": "t5-base",
        "specialization": "Government reports + legal documents",
        "use_case": "Generate executive summaries"
    }
}
```

### **Pipeline MLOps Architecture**
```yaml
# MLOps Workflow
stages:
  data_collection:
    - Portal da Transparência APIs
    - Government databases
    - Public procurement data
    - Historical investigations
    
  data_preprocessing:
    - Data cleaning & validation
    - Privacy anonymization
    - Feature engineering
    - Data augmentation
    
  model_training:
    - Hyperparameter optimization
    - Cross-validation
    - Ensemble methods
    - Transfer learning
    
  model_evaluation:
    - Performance metrics
    - Fairness evaluation
    - Bias detection
    - Interpretability analysis
    
  model_deployment:
    - HuggingFace Spaces
    - Container deployment
    - API endpoints
    - Model serving
    
  monitoring:
    - Model drift detection
    - Performance degradation
    - Data quality monitoring
    - Usage analytics
```

## 🔬 Modelos de IA Especializados

### **1. Corruption Detection Model**
```python
# Modelo especializado em detecção de corrupção
class CorruptionDetector:
    base_model: "bert-base-multilingual-cased"
    fine_tuned_on: "Brazilian government contracts + known corruption cases"
    
    features:
        - Contract language analysis
        - Pricing anomaly detection
        - Vendor relationship patterns
        - Temporal irregularities
    
    metrics:
        - Precision: >85%
        - Recall: >80% 
        - F1-Score: >82%
        - False Positive Rate: <5%
```

### **2. Anomaly Detection Ensemble**
```python
# Ensemble para detecção de anomalias financeiras
class AnomalyDetector:
    models:
        - IsolationForest: "Outlier detection"
        - LSTM: "Temporal pattern analysis"
        - Autoencoder: "Reconstruction error"
        - Random Forest: "Feature importance"
    
    features:
        - Amount deviation from median
        - Vendor concentration
        - Seasonal patterns
        - Geographic distribution
    
    output:
        - Anomaly score (0-1)
        - Confidence interval
        - Explanation vector
        - Risk category
```

### **3. Entity Recognition (NER)**
```python
# NER especializado para entidades governamentais
class GovernmentNER:
    base_model: "roberta-large"
    entities:
        - ORGANIZATION: "Ministérios, órgãos, empresas"
        - PERSON: "Servidores, políticos, empresários"
        - LOCATION: "Estados, municípios, endereços"
        - CONTRACT: "Números de contratos, licitações"
        - MONEY: "Valores monetários, moedas"
        - DATE: "Datas de contratos, vigências"
    
    brazilian_specialization:
        - CPF/CNPJ recognition
        - Brazilian address patterns
        - Government terminology
        - Legal document structure
```

## 🚀 HuggingFace Integration

### **Model Hub Strategy**
```python
# HuggingFace Hub Organization
organization: "cidadao-ai"
models:
    - "cidadao-ai/corruption-detector-pt"
    - "cidadao-ai/anomaly-detector-financial"
    - "cidadao-ai/ner-government-entities"
    - "cidadao-ai/sentiment-transparency"
    - "cidadao-ai/summarization-reports"

spaces:
    - "cidadao-ai/corruption-demo"
    - "cidadao-ai/anomaly-dashboard"
    - "cidadao-ai/transparency-analyzer"
```

### **Model Cards Template**
```markdown
# Model Card: Cidadão.AI Corruption Detector

## Model Description
- **Developed by**: Cidadão.AI Team
- **Model type**: BERT-based binary classifier
- **Language**: Portuguese (Brazil)
- **License**: MIT

## Training Data
- **Sources**: Portal da Transparência + curated corruption cases
- **Size**: 100K+ government contracts
- **Preprocessing**: Anonymization + cleaning + augmentation

## Evaluation
- **Test Set**: 10K held-out contracts
- **Metrics**: Precision: 87%, Recall: 83%, F1: 85%
- **Bias Analysis**: Evaluated across regions + contract types

## Ethical Considerations
- **Intended Use**: Transparency analysis, not legal evidence
- **Limitations**: May have bias toward certain contract types
- **Risks**: False positives could damage reputations
```

## 🛠️ MLOps Pipeline

### **Training Infrastructure**
```yaml
# training-pipeline.yml
name: Model Training Pipeline
on:
  schedule:
    - cron: '0 2 * * 0'  # Weekly retraining
  workflow_dispatch:

jobs:
  data_preparation:
    runs-on: ubuntu-latest
    steps:
      - name: Fetch latest data
      - name: Validate data quality
      - name: Preprocess & augment
      
  model_training:
    runs-on: gpu-runner
    steps:
      - name: Hyperparameter optimization
      - name: Train model
      - name: Evaluate performance
      
  model_deployment:
    runs-on: ubuntu-latest
    if: model_performance > threshold
    steps:
      - name: Upload to HuggingFace Hub
      - name: Update model registry
      - name: Deploy to production
```

### **Model Monitoring Dashboard**
```python
# Métricas de monitoramento
monitoring_metrics = {
    "performance": {
        "accuracy": "Real-time accuracy tracking",
        "latency": "Response time monitoring", 
        "throughput": "Requests per second",
        "error_rate": "Failed prediction rate"
    },
    "data_drift": {
        "feature_drift": "Input distribution changes",
        "label_drift": "Output distribution changes",
        "concept_drift": "Relationship changes"
    },
    "business": {
        "investigations_triggered": "Anomalies detected",
        "false_positive_rate": "User feedback tracking",
        "citizen_satisfaction": "User experience metrics"
    }
}
```

## 🧪 Experimentação e Avaliação

### **Experiment Tracking**
```python
# MLflow + Weights & Biases integration
import mlflow
import wandb

def train_model(config):
    with mlflow.start_run():
        wandb.init(project="cidadao-ai", config=config)
        
        # Log hyperparameters
        mlflow.log_params(config)
        wandb.config.update(config)
        
        # Training loop
        for epoch in range(config.epochs):
            metrics = train_epoch(model, train_loader)
            
            # Log metrics
            mlflow.log_metrics(metrics, step=epoch)
            wandb.log(metrics)
        
        # Log model artifacts
        mlflow.pytorch.log_model(model, "model")
        wandb.save("model.pt")
```

### **A/B Testing Framework**
```python
# Framework para testes A/B de modelos
class ModelABTest:
    def __init__(self, model_a, model_b, traffic_split=0.5):
        self.model_a = model_a
        self.model_b = model_b
        self.traffic_split = traffic_split
        
    def predict(self, input_data, user_id):
        # Route traffic based on user_id hash
        if hash(user_id) % 100 < self.traffic_split * 100:
            result = self.model_a.predict(input_data)
            self.log_prediction("model_a", result, user_id)
        else:
            result = self.model_b.predict(input_data)
            self.log_prediction("model_b", result, user_id)
        
        return result
```

## 📊 Datasets e Treinamento

### **Datasets Especializados**
```python
# Datasets para treinamento
datasets = {
    "transparency_contracts": {
        "source": "Portal da Transparência API",
        "size": "500K+ contracts",
        "format": "JSON + PDF text extraction",
        "labels": "Manual annotation + expert review"
    },
    "corruption_cases": {
        "source": "Historical investigations + court records",
        "size": "10K+ labeled cases",
        "format": "Structured data + documents",
        "labels": "Binary classification + severity"
    },
    "financial_anomalies": {
        "source": "Government spending data",
        "size": "1M+ transactions", 
        "format": "Tabular data",
        "labels": "Statistical outliers + domain expert"
    }
}
```

### **Data Preprocessing Pipeline**
```python
# Pipeline de preprocessamento
class DataPreprocessor:
    def __init__(self):
        self.tokenizer = AutoTokenizer.from_pretrained("bert-base-multilingual-cased")
        self.anonymizer = GovernmentDataAnonymizer()
        
    def preprocess_contract(self, contract_text):
        # 1. Anonymize sensitive information
        anonymized = self.anonymizer.anonymize(contract_text)
        
        # 2. Clean and normalize text
        cleaned = self.clean_text(anonymized)
        
        # 3. Tokenize for model input
        tokens = self.tokenizer(
            cleaned,
            max_length=512,
            truncation=True,
            padding=True,
            return_tensors="pt"
        )
        
        return tokens
```

## 🔄 Integração com Backend

### **Model Serving API**
```python
# FastAPI endpoints para servir modelos
from fastapi import FastAPI
from transformers import pipeline

app = FastAPI()

# Load models
corruption_detector = pipeline(
    "text-classification",
    model="cidadao-ai/corruption-detector-pt"
)

anomaly_detector = joblib.load("models/anomaly_detector.pkl")

@app.post("/analyze/corruption")
async def detect_corruption(contract_text: str):
    result = corruption_detector(contract_text)
    return {
        "prediction": result[0]["label"],
        "confidence": result[0]["score"],
        "model_version": "v1.0.0"
    }

@app.post("/analyze/anomaly")
async def detect_anomaly(financial_data: dict):
    features = extract_features(financial_data)
    anomaly_score = anomaly_detector.predict(features)
    return {
        "anomaly_score": float(anomaly_score),
        "is_anomaly": anomaly_score > 0.7,
        "explanation": generate_explanation(features)
    }
```

### **Agent Integration**
```python
# Integração com sistema multi-agente
class ModelService:
    def __init__(self):
        self.models = {
            "corruption": self.load_corruption_model(),
            "anomaly": self.load_anomaly_model(),
            "ner": self.load_ner_model()
        }
    
    async def analyze_for_agent(self, agent_name: str, data: dict):
        if agent_name == "InvestigatorAgent":
            return await self.detect_anomalies(data)
        elif agent_name == "CorruptionDetectorAgent":
            return await self.detect_corruption(data)
        elif agent_name == "AnalystAgent":
            return await self.extract_entities(data)
```

## 🔒 Ética e Governança

### **Responsible AI Principles**
```python
# Princípios de IA Responsável
class ResponsibleAI:
    principles = {
        "transparency": "Explicabilidade em todas as decisões",
        "fairness": "Avaliação de viés em grupos demográficos",
        "privacy": "Anonimização de dados pessoais",
        "accountability": "Auditoria e rastreabilidade",
        "robustness": "Teste contra adversarial attacks"
    }
    
    def evaluate_bias(self, model, test_data, protected_attributes):
        """Avalia viés do modelo em grupos protegidos"""
        bias_metrics = {}
        for attr in protected_attributes:
            group_metrics = self.compute_group_metrics(model, test_data, attr)
            bias_metrics[attr] = group_metrics
        return bias_metrics
```

### **Model Interpretability**
```python
# Ferramentas de interpretabilidade
from lime.lime_text import LimeTextExplainer
from shap import Explainer

class ModelExplainer:
    def __init__(self, model):
        self.model = model
        self.lime_explainer = LimeTextExplainer()
        self.shap_explainer = Explainer(model)
    
    def explain_prediction(self, text, method="lime"):
        if method == "lime":
            explanation = self.lime_explainer.explain_instance(
                text, self.model.predict_proba
            )
        elif method == "shap":
            explanation = self.shap_explainer(text)
        
        return explanation
```

## 📋 Roadmap Modelos IA

### **Curto Prazo (1-2 meses)**
1. **Setup MLOps Pipeline**: MLflow + DVC + CI/CD
2. **Corruption Detection Model**: Fine-tune BERT para português
3. **HuggingFace Integration**: Upload initial models
4. **Basic Monitoring**: Performance tracking dashboard

### **Médio Prazo (3-6 meses)**
1. **Anomaly Detection Ensemble**: Multiple algorithms
2. **NER Government Entities**: Custom entity recognition
3. **Model A/B Testing**: Production experimentation
4. **Advanced Monitoring**: Drift detection + alerting

### **Longo Prazo (6+ meses)**
1. **Custom Architecture**: Domain-specific model architectures
2. **Federated Learning**: Privacy-preserving training
3. **AutoML Pipeline**: Automated model selection
4. **Edge Deployment**: Local model inference

## ⚠️ Áreas para Melhoria

### **Priority 1: Data Pipeline**
- **Data Collection**: Automated data ingestion
- **Data Quality**: Validation + cleaning pipelines
- **Labeling**: Active learning + human-in-the-loop
- **Privacy**: Advanced anonymization techniques

### **Priority 2: Model Development**
- **Custom Models**: Domain-specific architectures
- **Transfer Learning**: Portuguese government domain
- **Ensemble Methods**: Model combination strategies
- **Optimization**: Model compression + acceleration

### **Priority 3: MLOps Maturity**
- **CI/CD**: Automated testing + deployment
- **Monitoring**: Comprehensive drift detection
- **Experimentation**: A/B testing framework
- **Governance**: Model audit + compliance

## 🎯 Métricas de Sucesso

### **Technical Metrics**
- **Model Performance**: F1 > 85% for all models
- **Inference Latency**: <200ms response time
- **Deployment Success**: >99% uptime
- **Data Pipeline**: <1% data quality issues

### **Business Metrics**
- **Anomalies Detected**: 100+ monthly
- **False Positive Rate**: <5%
- **User Satisfaction**: >80% positive feedback
- **Investigation Success**: >70% actionable insights

## 🔧 Comandos de Desenvolvimento

### **Model Training**
```bash
# Train corruption detection model
python train_corruption_detector.py --config configs/corruption_bert.yaml

# Evaluate model performance  
python evaluate_model.py --model corruption_detector --test_data data/test.json

# Upload to HuggingFace Hub
python upload_to_hub.py --model_path models/corruption_detector --repo_name cidadao-ai/corruption-detector-pt
```

### **Monitoring**
```bash
# Check model drift
python monitor_drift.py --model corruption_detector --window 7d

# Generate performance report
python generate_report.py --models all --period monthly
```

## 📝 Considerações Técnicas

### **Compute Requirements**
- **Training**: GPU-enabled instances (V100/A100)
- **Inference**: CPU instances sufficient for most models
- **Storage**: Cloud storage for datasets + model artifacts
- **Monitoring**: Real-time metrics collection

### **Security**
- **Model Protection**: Encrypted model artifacts
- **API Security**: Authentication + rate limiting
- **Data Privacy**: LGPD compliance + anonymization
- **Audit Trail**: Complete lineage tracking

### **Scalability**
- **Horizontal Scaling**: Load balancer + multiple instances
- **Model Versioning**: Backward compatibility
- **Cache Strategy**: Redis for frequent predictions
- **Batch Processing**: Async inference for large datasets

---

**Models Status**: Pipeline em desenvolvimento com infraestrutura sólida para modelos especializados.
**Next Update**: Implementação do primeiro modelo de detecção de corrupção e pipeline MLOps completo.