Spaces:

caarleexx
/

para.AI_ASSUNTOS_CNJ

Paused

File size: 3,978 Bytes

aec8693

# 🗺️ ROADMAP.md — Para.AI Assuntos Jurídicos
**Mapa de Desenvolvimento — Estado Atual e Plano Futuro**

---

## 📍 v1.0.0 — Fevereiro 2026 (ATUAL)

### Entregue

- [x] API REST completa (FastAPI 0.115)
- [x] Elasticsearch 8.12 — índice `assuntos_juridicos`
- [x] 5.184 assuntos jurídicos indexados (CNJ)
- [x] Analyzer customizado `juridico_pt` (stemmer PT + ASCII fold)
- [x] Edge n-gram tokenizer para autocomplete
- [x] 7 endpoints: `/busca`, `/busca-q`, `/autocomplete`,
      `/hierarquia`, `/grafo/filhos`, `/assuntos/{id}`, `/health`
- [x] Busca full-text com BM25 ponderado
- [x] Faceted search (agregações por ramo/nível/lei)
- [x] `/busca-q` com payload compacto para LLMs
- [x] Docker Compose (ES + API)
- [x] Entrypoint com auto-indexação
- [x] 13 testes HTTP (scripts/test_api.py)
- [x] **FIX #1**: `builders.py` — `retornar=['texto']` agora retorna
      `texto_completo` corretamente (**79/79 testes**)

### Métricas v1.0

| Métrica | Valor |
|---------|-------|
| Assuntos indexados | 5.184 |
| Ramos do Direito | 22 |
| Profundidade máxima | 5 níveis |
| Campos por documento | ~20 |
| Latência p50 `/busca` | ~800ms |
| Latência p50 `/busca-q` | ~74ms |
| Latência p50 `/autocomplete` | ~45ms |
| Testes passando | **79/79** |

---

## 🚀 v1.1 — Março 2026 — Otimização

### Prioridade Alta

- [ ] **Cache Redis** — query cache para `/busca` e `/busca-q`
  - TTL: 1h para queries, 24h para autocomplete
  - Target: p95 < 200ms
- [ ] **Rate limiting** — 1000 req/min por IP (sem auth)
- [ ] **Logs JSON estruturados** — request_id, latência por fase
- [ ] **Health check detalhado** — ES ping, contagem, latência

### Prioridade Média

- [ ] Export `/busca/export?fmt=csv` — CSV/JSON paginado
- [ ] Endpoint `/stats` — distribuição por ramo, top queries
- [ ] Testes de carga (Locust) — target 100 req/s estável
- [ ] CI/CD GitHub Actions — testes em PRs + deploy staging

### Prioridade Baixa

- [ ] Versionamento de API (`/v1/busca`)
- [ ] Changelog automático por commit
- [ ] Warm-up query no startup (eliminar cold start 2s)

**Meta v1.1:** p95 < 200ms · 99.5% uptime · 1.000 usuários/mês

---

## 🧠 v1.2 — Q2 2026 — Inteligência

- [ ] **Busca semântica** — embeddings + cosine similarity
  - Modelo: `neuralmind/bert-base-portuguese-cased` (candidato)
  - Hybrid search: BM25 + vector (RRF)
- [ ] **Dicionário de sinônimos jurídicos**
  - `BPC` ↔ `Benefício de Prestação Continuada`
  - `INSS` ↔ `Previdência Social`
  - `HC` ↔ `Habeas Corpus`
- [ ] **Endpoint `/classificar`**
  - Input: texto livre (petição, sentença)
  - Output: top-3 assuntos CNJ com score de confiança
- [ ] **Endpoint `/similar/{id}`** — "veja também"

**Meta v1.2:** 80% precisão na classificação automática · 5.000 usuários/mês

---

## 📈 v1.3 — Q3 2026 — Escala e Integração

- [ ] Cluster Elasticsearch 3 nós (HA)
- [ ] Integração com base de jurisprudência (acórdãos TJPR)
  - Endpoint `/jurisprudencia?assunto_id=...`
- [ ] Webhooks de atualização CNJ (quando taxonomia mudar)
- [ ] Admin endpoints com autenticação (JWT + API keys)
- [ ] Prometheus exporter + dashboard Grafana

**Meta v1.3:** 1.000 req/s · 10.000 usuários/mês · SLA 99.9%

---

## 🌍 v2.0 — 2027 — Expansão

- [ ] Multilíngue (EN, ES)
- [ ] Graph API — relações entre assuntos
- [ ] SDK oficial Python e TypeScript
- [ ] Mobile SDKs (React Native)
- [ ] Marketplace de integrações
- [ ] Plugin VS Code / Cursor

---

## 📋 Débitos Técnicos

| Item | Impacto | Sprint |
|------|---------|--------|
| Rate limiting ausente | ALTO (risco abuse) | v1.1 |
| Sem autenticação | ALTO (produção) | v1.1 |
| Logs não estruturados | MÉDIO | v1.1 |
| Sem métricas | MÉDIO | v1.1 |
| Cold start 2s | BAIXO | v1.1 |
| Sem testes unitários | MÉDIO | v1.2 |

---

## 📞 Feedback

Discussões: https://github.com/para-ai/discussions  
Email: roadmap@para-ai.com