Carlexxx
para.AI beta
8a646ad

ℹ️ INFO.md — Para.AI Assuntos Jurídicos API

Para potenciais clientes e usuários


O que é?

API REST pública que provê acesso estruturado aos 5.184 assuntos jurídicos catalogados oficialmente pelo Conselho Nacional de Justiça (CNJ).

Projetada para advogados, legaltechs, sistemas de gestão processual e desenvolvedores que integram LLMs com contexto jurídico confiável.


Propósito e Objetivo

Problema

Profissionais do Direito perdem horas navegando manualmente a taxonomia do CNJ para classificar processos. Chatbots jurídicos carecem de fonte estruturada e confiável. Sistemas de triagem automática erram por falta de contexto oficial.

Solução

A Para.AI API entrega em milissegundos:

  • Busca fuzzy tolerante a erros ("aposen""Aposentadoria")
  • Filtros por ramo, legislação e hierarquia
  • Autocomplete em tempo real
  • Ficha unificada para tool calling de LLMs (GPT-4, Claude, Gemini)
  • Árvore hierárquica completa (22 ramos, até 5 níveis)

Arquitetura

Cliente / LLM
     │  HTTP/JSON
     ▼
FastAPI 0.115  ←── Pydantic 2 (validação + serialização ORJSON)
     │
     ▼
Elasticsearch 8.12
  • Índice: assuntos_juridicos  (5.184 docs, ~18 MB)
  • Analyzer: juridico_pt  (lowercase + ASCII fold + stemmer PT + stopwords)
  • Edge n-gram tokenizer para autocomplete
  • BM25 com pesos: nome_assunto^4, titulo_curto^3, breve_sintese^2 …
     │
     ▼
Base CNJ  (dados públicos, bulk_assuntos.ndjson)

Endpoints Disponíveis

Endpoint Método Latência p50 Descrição
/busca GET/POST ~800ms Full-text + filtros + facets
/busca-q GET/POST ~74ms Estruturada para LLMs
/autocomplete GET ~45ms Sugestões por prefixo
/hierarquia GET ~250ms Árvore 22 ramos
/assuntos/{id} GET ~20ms Documento completo
/grafo/filhos GET ~100ms Drill-down por ancestral
/health GET ~10ms Status e métricas

Documentação interativa: http://localhost:8000/docs


Desafios e Soluções

Desafio Solução
Soft hyphens \xad nos textos CNJ Strip no pipeline de indexação
Termos jurídicos longos com acentos ASCII folding + stemmer português
LLMs precisam de payload compacto /busca-q com retornar=[] seletivo
Hierarquia de 5 níveis aninhados Agregações ES nested + classes_path
Autocompletar prefixos rápido Edge n-gram (min 2, max 20 chars)

Próximos Passos

Q2 2026 — Otimização

  • Cache Redis (p95 < 200ms)
  • Rate limiting e API keys
  • Métricas Prometheus + Grafana

Q3 2026 — Inteligência

  • Busca semântica (embeddings)
  • Dicionário de sinônimos jurídicos
  • /classificar — inferência de assunto por texto livre

Q4 2026 — Escala

  • Cluster ES 3 nós
  • Integração com jurisprudência (acórdãos TJPR)
  • Webhooks de atualização CNJ

Open Source

Código: https://github.com/para-ai/assuntos-juridicos
Licença: MIT
Dados: CNJ (domínio público)