🗺️ ROADMAP.md — Para.AI Assuntos Jurídicos
Mapa de Desenvolvimento — Estado Atual e Plano Futuro
📍 v1.0.0 — Fevereiro 2026 (ATUAL)
Entregue
- API REST completa (FastAPI 0.115)
- Elasticsearch 8.12 — índice
assuntos_juridicos - 5.184 assuntos jurídicos indexados (CNJ)
- Analyzer customizado
juridico_pt(stemmer PT + ASCII fold) - Edge n-gram tokenizer para autocomplete
- 7 endpoints:
/busca,/busca-q,/autocomplete,/hierarquia,/grafo/filhos,/assuntos/{id},/health - Busca full-text com BM25 ponderado
- Faceted search (agregações por ramo/nível/lei)
-
/busca-qcom payload compacto para LLMs - Docker Compose (ES + API)
- Entrypoint com auto-indexação
- 13 testes HTTP (scripts/test_api.py)
- FIX #1:
builders.py—retornar=['texto']agora retornatexto_completocorretamente (79/79 testes)
Métricas v1.0
| Métrica | Valor |
|---|---|
| Assuntos indexados | 5.184 |
| Ramos do Direito | 22 |
| Profundidade máxima | 5 níveis |
| Campos por documento | ~20 |
Latência p50 /busca |
~800ms |
Latência p50 /busca-q |
~74ms |
Latência p50 /autocomplete |
~45ms |
| Testes passando | 79/79 |
🚀 v1.1 — Março 2026 — Otimização
Prioridade Alta
- Cache Redis — query cache para
/buscae/busca-q- TTL: 1h para queries, 24h para autocomplete
- Target: p95 < 200ms
- Rate limiting — 1000 req/min por IP (sem auth)
- Logs JSON estruturados — request_id, latência por fase
- Health check detalhado — ES ping, contagem, latência
Prioridade Média
- Export
/busca/export?fmt=csv— CSV/JSON paginado - Endpoint
/stats— distribuição por ramo, top queries - Testes de carga (Locust) — target 100 req/s estável
- CI/CD GitHub Actions — testes em PRs + deploy staging
Prioridade Baixa
- Versionamento de API (
/v1/busca) - Changelog automático por commit
- Warm-up query no startup (eliminar cold start 2s)
Meta v1.1: p95 < 200ms · 99.5% uptime · 1.000 usuários/mês
🧠 v1.2 — Q2 2026 — Inteligência
- Busca semântica — embeddings + cosine similarity
- Modelo:
neuralmind/bert-base-portuguese-cased(candidato) - Hybrid search: BM25 + vector (RRF)
- Modelo:
- Dicionário de sinônimos jurídicos
BPC↔Benefício de Prestação ContinuadaINSS↔Previdência SocialHC↔Habeas Corpus
- Endpoint
/classificar- Input: texto livre (petição, sentença)
- Output: top-3 assuntos CNJ com score de confiança
- Endpoint
/similar/{id}— "veja também"
Meta v1.2: 80% precisão na classificação automática · 5.000 usuários/mês
📈 v1.3 — Q3 2026 — Escala e Integração
- Cluster Elasticsearch 3 nós (HA)
- Integração com base de jurisprudência (acórdãos TJPR)
- Endpoint
/jurisprudencia?assunto_id=...
- Endpoint
- Webhooks de atualização CNJ (quando taxonomia mudar)
- Admin endpoints com autenticação (JWT + API keys)
- Prometheus exporter + dashboard Grafana
Meta v1.3: 1.000 req/s · 10.000 usuários/mês · SLA 99.9%
🌍 v2.0 — 2027 — Expansão
- Multilíngue (EN, ES)
- Graph API — relações entre assuntos
- SDK oficial Python e TypeScript
- Mobile SDKs (React Native)
- Marketplace de integrações
- Plugin VS Code / Cursor
📋 Débitos Técnicos
| Item | Impacto | Sprint |
|---|---|---|
| Rate limiting ausente | ALTO (risco abuse) | v1.1 |
| Sem autenticação | ALTO (produção) | v1.1 |
| Logs não estruturados | MÉDIO | v1.1 |
| Sem métricas | MÉDIO | v1.1 |
| Cold start 2s | BAIXO | v1.1 |
| Sem testes unitários | MÉDIO | v1.2 |
📞 Feedback
Discussões: https://github.com/para-ai/discussions
Email: roadmap@para-ai.com