para.AI_ASSUNTOS_CNJ / docs /ROADMAP.md
Carlexxx
para.AI beta
8a646ad

🗺️ ROADMAP.md — Para.AI Assuntos Jurídicos

Mapa de Desenvolvimento — Estado Atual e Plano Futuro


📍 v1.0.0 — Fevereiro 2026 (ATUAL)

Entregue

  • API REST completa (FastAPI 0.115)
  • Elasticsearch 8.12 — índice assuntos_juridicos
  • 5.184 assuntos jurídicos indexados (CNJ)
  • Analyzer customizado juridico_pt (stemmer PT + ASCII fold)
  • Edge n-gram tokenizer para autocomplete
  • 7 endpoints: /busca, /busca-q, /autocomplete, /hierarquia, /grafo/filhos, /assuntos/{id}, /health
  • Busca full-text com BM25 ponderado
  • Faceted search (agregações por ramo/nível/lei)
  • /busca-q com payload compacto para LLMs
  • Docker Compose (ES + API)
  • Entrypoint com auto-indexação
  • 13 testes HTTP (scripts/test_api.py)
  • FIX #1: builders.pyretornar=['texto'] agora retorna texto_completo corretamente (79/79 testes)

Métricas v1.0

Métrica Valor
Assuntos indexados 5.184
Ramos do Direito 22
Profundidade máxima 5 níveis
Campos por documento ~20
Latência p50 /busca ~800ms
Latência p50 /busca-q ~74ms
Latência p50 /autocomplete ~45ms
Testes passando 79/79

🚀 v1.1 — Março 2026 — Otimização

Prioridade Alta

  • Cache Redis — query cache para /busca e /busca-q
    • TTL: 1h para queries, 24h para autocomplete
    • Target: p95 < 200ms
  • Rate limiting — 1000 req/min por IP (sem auth)
  • Logs JSON estruturados — request_id, latência por fase
  • Health check detalhado — ES ping, contagem, latência

Prioridade Média

  • Export /busca/export?fmt=csv — CSV/JSON paginado
  • Endpoint /stats — distribuição por ramo, top queries
  • Testes de carga (Locust) — target 100 req/s estável
  • CI/CD GitHub Actions — testes em PRs + deploy staging

Prioridade Baixa

  • Versionamento de API (/v1/busca)
  • Changelog automático por commit
  • Warm-up query no startup (eliminar cold start 2s)

Meta v1.1: p95 < 200ms · 99.5% uptime · 1.000 usuários/mês


🧠 v1.2 — Q2 2026 — Inteligência

  • Busca semântica — embeddings + cosine similarity
    • Modelo: neuralmind/bert-base-portuguese-cased (candidato)
    • Hybrid search: BM25 + vector (RRF)
  • Dicionário de sinônimos jurídicos
    • BPCBenefício de Prestação Continuada
    • INSSPrevidência Social
    • HCHabeas Corpus
  • Endpoint /classificar
    • Input: texto livre (petição, sentença)
    • Output: top-3 assuntos CNJ com score de confiança
  • Endpoint /similar/{id} — "veja também"

Meta v1.2: 80% precisão na classificação automática · 5.000 usuários/mês


📈 v1.3 — Q3 2026 — Escala e Integração

  • Cluster Elasticsearch 3 nós (HA)
  • Integração com base de jurisprudência (acórdãos TJPR)
    • Endpoint /jurisprudencia?assunto_id=...
  • Webhooks de atualização CNJ (quando taxonomia mudar)
  • Admin endpoints com autenticação (JWT + API keys)
  • Prometheus exporter + dashboard Grafana

Meta v1.3: 1.000 req/s · 10.000 usuários/mês · SLA 99.9%


🌍 v2.0 — 2027 — Expansão

  • Multilíngue (EN, ES)
  • Graph API — relações entre assuntos
  • SDK oficial Python e TypeScript
  • Mobile SDKs (React Native)
  • Marketplace de integrações
  • Plugin VS Code / Cursor

📋 Débitos Técnicos

Item Impacto Sprint
Rate limiting ausente ALTO (risco abuse) v1.1
Sem autenticação ALTO (produção) v1.1
Logs não estruturados MÉDIO v1.1
Sem métricas MÉDIO v1.1
Cold start 2s BAIXO v1.1
Sem testes unitários MÉDIO v1.2

📞 Feedback

Discussões: https://github.com/para-ai/discussions
Email: roadmap@para-ai.com