para.AI_ASSUNTOS_CNJ / docs /ROADMAP.md
Carlexxx
para.AI beta
8a646ad
# 🗺️ ROADMAP.md — Para.AI Assuntos Jurídicos
**Mapa de Desenvolvimento — Estado Atual e Plano Futuro**
---
## 📍 v1.0.0 — Fevereiro 2026 (ATUAL)
### Entregue
- [x] API REST completa (FastAPI 0.115)
- [x] Elasticsearch 8.12 — índice `assuntos_juridicos`
- [x] 5.184 assuntos jurídicos indexados (CNJ)
- [x] Analyzer customizado `juridico_pt` (stemmer PT + ASCII fold)
- [x] Edge n-gram tokenizer para autocomplete
- [x] 7 endpoints: `/busca`, `/busca-q`, `/autocomplete`,
`/hierarquia`, `/grafo/filhos`, `/assuntos/{id}`, `/health`
- [x] Busca full-text com BM25 ponderado
- [x] Faceted search (agregações por ramo/nível/lei)
- [x] `/busca-q` com payload compacto para LLMs
- [x] Docker Compose (ES + API)
- [x] Entrypoint com auto-indexação
- [x] 13 testes HTTP (scripts/test_api.py)
- [x] **FIX #1**: `builders.py` — `retornar=['texto']` agora retorna
`texto_completo` corretamente (**79/79 testes**)
### Métricas v1.0
| Métrica | Valor |
|---------|-------|
| Assuntos indexados | 5.184 |
| Ramos do Direito | 22 |
| Profundidade máxima | 5 níveis |
| Campos por documento | ~20 |
| Latência p50 `/busca` | ~800ms |
| Latência p50 `/busca-q` | ~74ms |
| Latência p50 `/autocomplete` | ~45ms |
| Testes passando | **79/79** |
---
## 🚀 v1.1 — Março 2026 — Otimização
### Prioridade Alta
- [ ] **Cache Redis** — query cache para `/busca` e `/busca-q`
- TTL: 1h para queries, 24h para autocomplete
- Target: p95 < 200ms
- [ ] **Rate limiting** — 1000 req/min por IP (sem auth)
- [ ] **Logs JSON estruturados** — request_id, latência por fase
- [ ] **Health check detalhado** — ES ping, contagem, latência
### Prioridade Média
- [ ] Export `/busca/export?fmt=csv` — CSV/JSON paginado
- [ ] Endpoint `/stats` — distribuição por ramo, top queries
- [ ] Testes de carga (Locust) — target 100 req/s estável
- [ ] CI/CD GitHub Actions — testes em PRs + deploy staging
### Prioridade Baixa
- [ ] Versionamento de API (`/v1/busca`)
- [ ] Changelog automático por commit
- [ ] Warm-up query no startup (eliminar cold start 2s)
**Meta v1.1:** p95 < 200ms · 99.5% uptime · 1.000 usuários/mês
---
## 🧠 v1.2 — Q2 2026 — Inteligência
- [ ] **Busca semântica** — embeddings + cosine similarity
- Modelo: `neuralmind/bert-base-portuguese-cased` (candidato)
- Hybrid search: BM25 + vector (RRF)
- [ ] **Dicionário de sinônimos jurídicos**
- `BPC` ↔ `Benefício de Prestação Continuada`
- `INSS` ↔ `Previdência Social`
- `HC` ↔ `Habeas Corpus`
- [ ] **Endpoint `/classificar`**
- Input: texto livre (petição, sentença)
- Output: top-3 assuntos CNJ com score de confiança
- [ ] **Endpoint `/similar/{id}`** — "veja também"
**Meta v1.2:** 80% precisão na classificação automática · 5.000 usuários/mês
---
## 📈 v1.3 — Q3 2026 — Escala e Integração
- [ ] Cluster Elasticsearch 3 nós (HA)
- [ ] Integração com base de jurisprudência (acórdãos TJPR)
- Endpoint `/jurisprudencia?assunto_id=...`
- [ ] Webhooks de atualização CNJ (quando taxonomia mudar)
- [ ] Admin endpoints com autenticação (JWT + API keys)
- [ ] Prometheus exporter + dashboard Grafana
**Meta v1.3:** 1.000 req/s · 10.000 usuários/mês · SLA 99.9%
---
## 🌍 v2.0 — 2027 — Expansão
- [ ] Multilíngue (EN, ES)
- [ ] Graph API — relações entre assuntos
- [ ] SDK oficial Python e TypeScript
- [ ] Mobile SDKs (React Native)
- [ ] Marketplace de integrações
- [ ] Plugin VS Code / Cursor
---
## 📋 Débitos Técnicos
| Item | Impacto | Sprint |
|------|---------|--------|
| Rate limiting ausente | ALTO (risco abuse) | v1.1 |
| Sem autenticação | ALTO (produção) | v1.1 |
| Logs não estruturados | MÉDIO | v1.1 |
| Sem métricas | MÉDIO | v1.1 |
| Cold start 2s | BAIXO | v1.1 |
| Sem testes unitários | MÉDIO | v1.2 |
---
## 📞 Feedback
Discussões: https://github.com/para-ai/discussions
Email: roadmap@para-ai.com