naveMae2

Paused

App Files Files Community

naveMae2 / queue_api.py

Aduc-sdr

Update queue_api.py

b230340 verified 9 days ago

raw

history blame contribute delete

81.8 kB

	#!/usr/bin/env python3
	"""
	ParaAI - Queue Director API (v5.0 — batch)
	============================================

	MUDANÇAS v5.0 — Comunicação em lote para reduzir 429:
	- [NEW] GET /queue/work/batch?worker_id=X&batch_size=N
	Entrega até N tasks em 1 única request (register_id + chunk_id incluídos).
	- [NEW] POST /queue/result/batch
	Recebe um lote de resultados em 1 única request.
	- [CHANGED] KEEPALIVE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_TIMEOUT_SEC: 900 → 550 s
	Worker considerado morto após 550 s sem keepalive.
	- [CHANGED] _requeue_timed_out(): requeue de tasks expiradas agora é por
	LOTE (agrupa por worker_id), não task por task.

	Herda de v4.0 (HTTP-only, sem clone Git):
	- GET CSV de bordo no startup
	- Topup/Reaproveitamento via HTTP
	- Upload HTTP direto (sem git push)
	"""

	import io as _io
	import json
	import logging
	import os
	import re
	import tarfile as _tarfile
	import threading
	import time
	from collections import deque as _deque
	from datetime import datetime, timedelta
	from pathlib import Path
	from typing import Any, Dict, List, Optional

	import pandas as pd
	from fastapi import Depends, FastAPI, Header, HTTPException, Query
	from fastapi.responses import HTMLResponse, JSONResponse
	from pydantic import BaseModel

	logging.basicConfig(
	level=logging.INFO,
	format="%(asctime)s [%(levelname)-5s] %(name)s: %(message)s",
	datefmt="%H:%M:%S",
	)
	logger = logging.getLogger("queue_director")

	from workers_tools import StateManager, ResultCollector
	from http_director_manager import HttpDirectorManager


	# ══════════════════════════════════════════════════════════════════════
	# CONFIGURAÇÃO
	# ══════════════════════════════════════════════════════════════════════

	def _env_int(name: str, default: int) -> int:
	try:
	return int(os.getenv(name, str(default)))
	except (TypeError, ValueError):
	return default

	def _env_float(name: str, default: float) -> float:
	try:
	return float(os.getenv(name, str(default)))
	except (TypeError, ValueError):
	return default

	QUEUE_API_TOKEN = os.getenv("QUEUE_API_TOKEN", "paraai-secret-token")
	GIT_TOKEN = os.getenv("GIT_TOKEN", "")
	GITHUB_REPO_SLUG = os.getenv("GITHUB_REPO_SLUG", "")
	GITHUB_BRANCH = os.getenv("GITHUB_BRANCH", "main")

	WORK_DIR = Path(os.getenv("WORK_DIR", "/data"))
	PROTOCOL_FILE = Path(os.getenv("PROTOCOL_FILE", "system_role.md"))
	STATE_CSV_NAME = os.getenv("STATE_CSV_NAME", "new_tracking_processamento_up.csv")

	SYNC_INTERVAL = _env_int("SYNC_INTERVAL_SEC", 320)
	PUSH_INTERVAL = _env_int("PUSH_INTERVAL_SEC", 30)
	TASK_TIMEOUT_MIN = _env_int("TASK_TIMEOUT_MIN", 320)
	ID_MINIMO_CHUNK = _env_int("ID_MINIMO_CHUNK", 1)

	MIN_CHUNKS_ATIVOS = _env_int("MIN_CHUNKS_ATIVOS", 40)
	MAX_CHUNKS_ATIVOS = _env_int("MAX_CHUNKS_ATIVOS", 45)
	BUFFER_MONITOR_INTERVAL = _env_int("BUFFER_MONITOR_INTERVAL", 20)
	MAX_RETRIES_PER_TASK = _env_int("MAX_RETRIES_PER_TASK", 3)
	KEEPALIVE_TIMEOUT_SEC = 320 # ← v5.0: era 900 — worker morto após 550 s sem KA

	# Registros cujo orgao_julgador bater neste padrão são ignorados (skip) silenciosamente.
	_ORGAO_IGNORADO_RE = re.compile(r".?Vice.?Presidência.*?", re.IGNORECASE \| re.DOTALL)

	WORK_DIR.mkdir(parents=True, exist_ok=True)
	(WORK_DIR / "dados_llm_v3").mkdir(exist_ok=True)


	# ══════════════════════════════════════════════════════════════════════
	# ESTADO GLOBAL (thread-safe)
	# ══════════════════════════════════════════════════════════════════════

	_lock = threading.Lock()
	_task_queue: List[dict] = []
	_in_progress: Dict[str, dict] = {}
	_chunk_collectors: Dict[str, object] = {}
	_chunk_counters: Dict[str, dict] = {}
	_pending_push: List[dict] = []

	_chunk_payload_logs: Dict[str, List[dict]] = {}
	_chunk_error_logs: Dict[str, List[dict]] = {}

	_http_manager: Optional[HttpDirectorManager] = None
	_system_prompt: str = ""
	_initialized: bool = False
	_init_error: str = ""
	_start_time: Optional[datetime] = None

	_stats = {
	"tasks_entregues": 0,
	"tasks_ok": 0,
	"tasks_erro": 0,
	"tasks_skip": 0,
	"tasks_aceitas_sem_reserva": 0,
	"chunks_concluidos": 0,
	"tokens_total": 0,
	}

	_pressure_429: int = 0
	_pressure_498: int = 0

	_rpm_window: "_deque[float]" = _deque()
	_tpm_window: "_deque[tuple]" = _deque()
	_WINDOW_SEC = 60
	_topup_trigger = threading.Event()


	# ══════════════════════════════════════════════════════════════════════
	# MÉTRICAS DESLIZANTES
	# ══════════════════════════════════════════════════════════════════════

	def _record_task_ok(tokens: int):
	now = datetime.utcnow().timestamp()
	_rpm_window.append(now)
	_tpm_window.append((now, tokens))

	def _sliding_metrics() -> tuple:
	now = datetime.utcnow().timestamp()
	cutoff = now - _WINDOW_SEC
	while _rpm_window and _rpm_window[0] < cutoff:
	_rpm_window.popleft()
	while _tpm_window and _tpm_window[0][0] < cutoff:
	_tpm_window.popleft()
	rpm = round(len(_rpm_window) / (_WINDOW_SEC / 60), 1)
	tpm = sum(t for _, t in _tpm_window)
	return rpm, tpm


	# ══════════════════════════════════════════════════════════════════════
	# HELPERS INTERNOS
	# ══════════════════════════════════════════════════════════════════════

	def _load_system_prompt() -> str:
	if PROTOCOL_FILE.exists():
	return PROTOCOL_FILE.read_text(encoding="utf-8")
	logger.warning("⚠️ system_role.md não encontrado — usando prompt padrão.")
	return "Você é um assistente jurídico especializado em análise de decisões."


	def _publish_chunk_llm(chunk_id: str, gz_path: Path, msg: str) -> bool:
	try:
	return _http_manager.upload_chunk_llm(chunk_id, gz_path.read_bytes(), msg)
	except Exception as e:
	logger.error(f"❌ [publish] chunk_llm {chunk_id}: {e}")
	return False


	def _publish_diario(msg: str = "update tracking") -> bool:
	csv_path = WORK_DIR / STATE_CSV_NAME
	if not csv_path.exists():
	logger.error("❌ [publish] CSV não existe ainda")
	return False
	df = pd.read_csv(csv_path)
	return _http_manager.salvar_diario(df, msg)


	def _ler_jsonl_de_tar(tar_path: Path) -> list:
	registros = []
	linhas_validas = [] # texto cru das linhas OK (para reescrita se necessário)
	n_corrompidas = 0

	if not tar_path.exists():
	return registros
	try:
	with _tarfile.open(tar_path, "r:gz") as tar:
	member = next(
	(m for m in tar.getmembers() if m.name.endswith("jurisprudencias.jsonl")), None
	)
	if not member:
	return registros
	for raw_line in tar.extractfile(member):
	line = raw_line.decode("utf-8").strip()
	if not line:
	continue
	try:
	r = json.loads(line)
	except Exception:
	n_corrompidas += 1
	logger.warning(f"⚠️ [tar] {tar_path.name}: JSON inválido — linha removida.")
	continue
	if not isinstance(r, dict):
	n_corrompidas += 1
	logger.warning(
	f"⚠️ [tar] {tar_path.name}: tipo inesperado {type(r).__name__} "
	f"(esperado dict) — linha removida."
	)
	continue
	registros.append(r)
	linhas_validas.append(line)
	except Exception as e:
	logger.warning(f"⚠️ [tar] {tar_path.name}: {e}")
	return registros

	if n_corrompidas > 0:
	logger.warning(
	f"🧹 [tar] {tar_path.name}: {n_corrompidas} linha(s) corrompida(s) removida(s). "
	f"Reescrevendo tar local com {len(linhas_validas)} linhas válidas."
	)
	_reescrever_tar_jsonl(tar_path, linhas_validas)

	return registros


	def _reescrever_tar_jsonl(tar_path: Path, linhas_validas: list):
	"""Reconstrói o tar.gz preservando todos os membros exceto jurisprudencias.jsonl,
	que é substituído pelas linhas saudáveis."""
	try:
	outros_membros: dict = {}
	with _tarfile.open(tar_path, "r:gz") as tar:
	for m in tar.getmembers():
	if not m.name.endswith("jurisprudencias.jsonl"):
	f = tar.extractfile(m)
	if f:
	outros_membros[m.name] = f.read()

	novo_jsonl = "\n".join(linhas_validas).encode("utf-8")
	tmp_path = tar_path.with_suffix(".tmp.gz")

	with _tarfile.open(tmp_path, "w:gz") as tar:
	info = _tarfile.TarInfo(name="jurisprudencias.jsonl")
	info.size = len(novo_jsonl)
	tar.addfile(info, _io.BytesIO(novo_jsonl))
	for name, data in outros_membros.items():
	info = _tarfile.TarInfo(name=name)
	info.size = len(data)
	tar.addfile(info, _io.BytesIO(data))

	tmp_path.replace(tar_path)
	logger.info(f"✅ [tar] {tar_path.name}: reescrito sem linhas corrompidas.")
	except Exception as e:
	logger.error(f"❌ [tar] Falha ao reescrever {tar_path.name}: {e}")


	def _ler_jsonl_de_bytes(gz_bytes: bytes) -> tuple:
	"""Retorna (registros: list[dict], linhas_validas: list[str], n_corrompidas: int).
	Linhas que não são dict válido são descartadas e contadas."""
	registros = []
	linhas_validas = []
	n_corrompidas = 0
	try:
	with _tarfile.open(fileobj=_io.BytesIO(gz_bytes), mode="r:gz") as tar:
	member = next(
	(m for m in tar.getmembers() if m.name.endswith("jurisprudencias.jsonl")), None
	)
	if not member:
	return registros, linhas_validas, n_corrompidas
	for raw_line in tar.extractfile(member):
	line = raw_line.decode("utf-8").strip()
	if not line:
	continue
	try:
	r = json.loads(line)
	except Exception:
	n_corrompidas += 1
	logger.warning("⚠️ [tar/mem]: JSON inválido — linha removida.")
	continue
	if not isinstance(r, dict):
	n_corrompidas += 1
	logger.warning(
	f"⚠️ [tar/mem]: tipo inesperado {type(r).__name__} "
	f"(esperado dict) — linha removida."
	)
	continue
	registros.append(r)
	linhas_validas.append(line)
	except Exception as e:
	logger.warning(f"⚠️ [tar/mem] {e}")
	return registros, linhas_validas, n_corrompidas


	def _reuplodar_chunk_llm_limpo(chunk_id: str, gz_bytes_original: bytes, linhas_validas: list):
	"""Reconstrói o tar.gz do chunk_llm sem linhas corrompidas e faz re-upload para o GitHub."""
	try:
	outros_membros: dict = {}
	with _tarfile.open(fileobj=_io.BytesIO(gz_bytes_original), mode="r:gz") as tar:
	for m in tar.getmembers():
	if not m.name.endswith("jurisprudencias.jsonl"):
	f = tar.extractfile(m)
	if f:
	outros_membros[m.name] = f.read()

	novo_jsonl = "\n".join(linhas_validas).encode("utf-8")
	buf = _io.BytesIO()
	with _tarfile.open(fileobj=buf, mode="w:gz") as tar:
	info = _tarfile.TarInfo(name="jurisprudencias.jsonl")
	info.size = len(novo_jsonl)
	tar.addfile(info, _io.BytesIO(novo_jsonl))
	for name, data in outros_membros.items():
	info = _tarfile.TarInfo(name=name)
	info.size = len(data)
	tar.addfile(info, _io.BytesIO(data))

	gz_limpo = buf.getvalue()
	ok = _http_manager.upload_chunk_llm(
	chunk_id, gz_limpo, f"🧹 limpeza linhas corrompidas chunk {chunk_id}"
	)
	if ok:
	logger.info(f"✅ [limpeza] chunk_llm {chunk_id}: re-upload limpo OK.")
	else:
	logger.error(f"❌ [limpeza] Falha no re-upload do chunk_llm {chunk_id}.")
	except Exception as e:
	logger.error(f"❌ [limpeza] Erro ao reconstruir chunk_llm {chunk_id}: {e}")


	def _ler_raw_md_de_tar(tar_path: Path) -> dict:
	resultado = {}
	if not tar_path.exists():
	return resultado
	try:
	with _tarfile.open(tar_path, "r:gz") as tar:
	for member in tar.getmembers():
	if member.name.startswith("raw/") and member.name.endswith(".md"):
	f = tar.extractfile(member)
	if f:
	resultado[member.name[4:-3]] = f.read().decode("utf-8")
	except Exception as e:
	logger.warning(f"⚠️ [raw/md] {tar_path.name}: {e}")
	return resultado


	def _ler_raw_md_de_bytes(gz_bytes: bytes) -> dict:
	resultado = {}
	try:
	with _tarfile.open(fileobj=_io.BytesIO(gz_bytes), mode="r:gz") as tar:
	for member in tar.getmembers():
	if member.name.startswith("raw/") and member.name.endswith(".md"):
	f = tar.extractfile(member)
	if f:
	resultado[member.name[4:-3]] = f.read().decode("utf-8")
	except Exception as e:
	logger.warning(f"⚠️ [raw/md/mem] {e}")
	return resultado


	def _carregar_registros_existentes_llm(chunk_id: str):
	work_tar = WORK_DIR / f"dados_llm_v3/chunk_llm_{chunk_id}.tar.gz"
	registros = _ler_jsonl_de_tar(work_tar) # já limpa e reescreve local se necessário

	if not registros:
	gz_bytes = _http_manager.baixar_chunk_llm(chunk_id)
	if gz_bytes:
	registros, linhas_validas, n_corrompidas = _ler_jsonl_de_bytes(gz_bytes)
	if registros:
	logger.info(f"📂 [reaprov] Chunk {chunk_id}: {len(registros)} registros do GitHub.")
	if n_corrompidas > 0:
	logger.warning(
	f"🧹 [reaprov] Chunk {chunk_id}: {n_corrompidas} linha(s) corrompida(s) "
	f"no GitHub — iniciando re-upload limpo."
	)
	_reuplodar_chunk_llm_limpo(chunk_id, gz_bytes, linhas_validas)

	ids_existentes: set = set()
	por_id: dict = {}
	for r in registros:
	mj = r.get("manifestacao_juridica", {})
	mid = None
	if isinstance(mj, dict):
	mid = mj.get("id_manifestacao")
	if mid is None:
	# fallback: id_manifestacao no nível raiz
	mid = r.get("id_manifestacao")
	if mid is not None:
	key = str(mid)
	ids_existentes.add(key)
	por_id[key] = r

	return registros, ids_existentes, por_id


	def _tem_referencias_pedidos(registro: dict) -> bool:
	"""Retorna True somente se o registro está completo e sem campos placeholder '...'.

	Verifica três caminhos críticos dentro de manifestacao_juridica:
	1. referencias_pedidos_canonicos[0].identificador_unico_pedido_atomico
	2. fundamentacao.teses_relator[0].identificador_unico_fundamento_atomico
	3. fatos_pedidos_nexos_causa.pedidos[0].causalidade_futura_positiva_pedido.cordas[0]

	Se qualquer um desses campos existir e for "..." (equivalente a null/vazio),
	o registro é considerado incompleto e será recolocado na fila para atualização.
	"""
	_PLACEHOLDER = "..."

	mj = registro.get("manifestacao_juridica")

	# ── campo raiz deve existir ──────────────────────────────────────────────
	if not isinstance(mj, dict):
	return False

	# ── 1. referencias_pedios_canonicos ────────────────────────────────────
	metadados = mj.get("metadados")
	if isinstance(metadados, dict):
	relator_ou_juiz = metadados.get("relator_ou_juiz")
	if relator_ou_juiz is not None and relator_ou_juiz != _PLACEHOLDER:
	pass
	else:
	logger.debug("[tem_refs] registro incompleto — metadados.relator_ou_juiz é None ou placeholder")
	return False
	else:
	logger.debug("[tem_refs] metadados não é um dicionário")
	return False



	# ── 2. fundamentacao.teses_relator ──────────────────────────────────────
	fundamentacao = mj.get("fundamentacao")
	if isinstance(fundamentacao, dict):
	teses = fundamentacao.get("teses_relator")
	if isinstance(teses, list) and len(teses) > 0:
	id_fund = teses[0].get("identificador_unico_fundamento_atomico") if isinstance(teses[0], dict) else None
	if id_fund == _PLACEHOLDER:
	logger.debug(
	f"[tem_refs] registro incompleto — teses_relator[0] é placeholder"
	)
	return False


	# ── 3. fatos_pedidos_nexos_causa.pedidos[0].causalidade_futura_positiva_pedido.cordas[0] ──
	fpnc = mj.get("fatos_pedidos_nexos_causa")
	if isinstance(fpnc, dict):
	pedidos = fpnc.get("pedidos")
	if isinstance(pedidos, list) and len(pedidos) > 0:
	pedido0 = pedidos[0] if isinstance(pedidos[0], dict) else {}
	cfpp = pedido0.get("causalidade_futura_positiva_pedido")
	if isinstance(cfpp, dict):
	cordas = cfpp.get("cordas")
	if isinstance(cordas, list) and len(cordas) > 0:
	if cordas[0] == _PLACEHOLDER:
	logger.debug(
	f"[tem_refs] registro incompleto — cordas[0] é placeholder"
	)
	return False

	return True


	def _tem_referencias_pedidos1(registro: dict) -> bool:
	"""Retorna True somente se o registro está completo e sem campos placeholder '...'.

	Verifica três caminhos críticos dentro de manifestacao_juridica:
	1. referencias_pedidos_canonicos[0].identificador_unico_pedido_atomico
	2. fundamentacao.teses_relator[0].identificador_unico_fundamento_atomico
	3. fatos_pedidos_nexos_causa.pedidos[0].causalidade_futura_positiva_pedido.cordas[0]

	Se qualquer um desses campos existir e for "..." (equivalente a null/vazio),
	o registro é considerado incompleto e será recolocado na fila para atualização.
	"""
	_PLACEHOLDER = "..."

	mj = registro.get("manifestacao_juridica")

	# ── campo raiz deve existir ──────────────────────────────────────────────
	if not isinstance(mj, dict):
	return False







	# ── 3. fatos_pedidos_nexos_causa.pedidos[0].causalidade_futura_positiva_pedido.cordas[0] ──
	fpnc = mj.get("fatos_pedidos_nexos_causa")
	if isinstance(fpnc, dict):
	pedidos = fpnc.get("pedidos")
	if isinstance(pedidos, list) and len(pedidos) > 0:
	pedido0 = pedidos[0] if isinstance(pedidos[0], dict) else {}
	cfpp = pedido0.get("causalidade_futura_positiva_pedido")
	if isinstance(cfpp, dict):
	cordas = cfpp.get("cordas")
	if isinstance(cordas, list) and len(cordas) > 0:
	if cordas[0] == _PLACEHOLDER:
	logger.debug(
	f"[tem_refs] registro incompleto — cordas[0] é placeholder"
	)
	return False

	return True


	# ══════════════════════════════════════════════════════════════════════
	# CARREGAMENTO DE CHUNKS
	# ══════════════════════════════════════════════════════════════════════

	def _carregar_chunk_na_fila(chunk_id: str) -> int:
	chunk_id = str(int(chunk_id)).zfill(6)

	dados_bytes = _http_manager.baixar_chunk_dados(chunk_id)
	if not dados_bytes:
	logger.warning(f"⚠️ [carregar] Chunk {chunk_id}: não encontrado no GitHub.")
	return 0

	tarefas = _http_manager.extrair_tarefas_de_chunk_dados(chunk_id, dados_bytes)
	if not tarefas:
	logger.warning(f"⚠️ [carregar] Chunk {chunk_id}: sem tarefas válidas.")
	return 0

	_, ids_existentes, existentes_por_id = _carregar_registros_existentes_llm(chunk_id)

	# ── Filtro: orgao_julgador bloqueado ─────────────────────────────────────
	tarefas_ignoradas: List[dict] = []
	tarefas_permitidas: List[dict] = []
	for t in tarefas:
	orgao = str(t.get("dados_originais", {}).get("orgao_julgador") or "")
	if _ORGAO_IGNORADO_RE.fullmatch(orgao):
	tarefas_ignoradas.append(t)
	else:
	tarefas_permitidas.append(t)

	if tarefas_ignoradas:
	logger.info(
	f"🚫 [filtro] Chunk {chunk_id}: {len(tarefas_ignoradas)} registro(s) ignorado(s) "
	f"por orgao_julgador bloqueado (Vice-Presidência)."
	)
	tarefas = tarefas_permitidas
	# ─────────────────────────────────────────────────────────────────────────

	tarefas_faltantes: List[dict] = []
	tarefas_pre_existentes: List[dict] = []

	for t in tarefas:
	if str(t["id"]) in ids_existentes:
	registro = existentes_por_id[str(t["id"])]
	if _tem_referencias_pedidos(registro):
	tarefas_pre_existentes.append(t)
	else:
	t_upd = dict(t)
	t_upd["dados_llm_existente"] = registro
	tarefas_faltantes.append(t_upd)
	else:
	tarefas_faltantes.append(t)

	total_original = len(tarefas) + len(tarefas_ignoradas) # mantém contagem real do chunk
	n_ignoradas = len(tarefas_ignoradas)
	n_existentes = len(tarefas_pre_existentes)
	n_faltantes = len(tarefas_faltantes)

	if n_existentes:
	logger.info(
	f"♻️ [reaprov] Chunk {chunk_id}: "
	f"{n_existentes}/{total_original} pré-existentes \| "
	f"{n_ignoradas} ignoradas \| {n_faltantes} novas."
	)
	else:
	logger.info(
	f"🆕 [carregar] Chunk {chunk_id}: {total_original} tarefas "
	f"({n_ignoradas} ignoradas)."
	)

	if not tarefas_faltantes:
	logger.info(f"✅ [reaprov] Chunk {chunk_id}: completo. Marcando finalizado.")
	sm = StateManager(WORK_DIR, WORK_DIR)
	sm.marcar_chunk_como_finalizado(chunk_id, {"total_ok": n_existentes, "erros": []})
	_publish_diario(f"✅ Chunk {chunk_id} já completo (reaproveitado)")
	return 0

	collector = ResultCollector(WORK_DIR)

	# Registros ignorados por orgao_julgador bloqueado → contabilizados como skip
	for t in tarefas_ignoradas:
	mid_str = str(t["id"])
	collector.adicionar_resultado(
	t,
	{
	"status": "skip",
	"resultado": {},
	"tokens": 0,
	"motivo": "orgao_julgador_bloqueado",
	"_raw_markdown": "",
	"_id_manifestacao": mid_str,
	},
	)

	for t in tarefas_pre_existentes:
	mid_str = str(t["id"])
	record = existentes_por_id.get(mid_str, {})
	eh_erro = (
	isinstance(record.get("manifestacao_juridica"), dict)
	and record["manifestacao_juridica"].get("error")
	)
	collector.adicionar_resultado(
	t,
	{
	"status": "falha" if eh_erro else "sucesso",
	"resultado": record,
	"tokens": 0,
	"motivo": "preexistente_reaproveitado",
	"_raw_markdown": "", #_build_raw_markdown(t.get("dados_originais", {}), mid_str),
	"_id_manifestacao": mid_str,
	},
	)

	with _lock:
	_task_queue.extend(tarefas_faltantes)
	_chunk_collectors[chunk_id] = collector
	_chunk_counters[chunk_id] = {
	"total": total_original,
	"done": n_existentes + n_ignoradas, # ignoradas já contam como concluídas
	"tokens": 0,
	}
	_stats["tasks_skip"] += n_ignoradas

	logger.info(
	f"📥 Chunk {chunk_id}: {n_faltantes} novas \| "
	f"{n_existentes} reaproveitadas \| {n_ignoradas} ignoradas \| {total_original} total"
	)
	return n_faltantes


	def _topup_chunks_se_necessario():
	with _lock:
	ativos = len(_chunk_counters)
	if ativos >= MAX_CHUNKS_ATIVOS:
	return 0
	faltam = MIN_CHUNKS_ATIVOS - ativos
	if faltam <= 0:
	return 0

	logger.info(f"📊 [buffer] {ativos} ativos — carregando {faltam} chunk(s)...")

	sm = StateManager(WORK_DIR, WORK_DIR)
	sm.id_minimo = ID_MINIMO_CHUNK

	carregados = 0
	for _ in range(faltam):
	chunk_id = sm.selecionar_proximo_chunk()
	if not chunk_id:
	logger.info("⏸️ [buffer] Sem chunks pendentes para topup.")
	break
	sm.marcar_chunk_como_iniciado(chunk_id)
	n = _carregar_chunk_na_fila(chunk_id)
	if n > 0:
	carregados += 1
	_publish_diario(f"🔒 LOCK chunk {chunk_id}")
	logger.info(f"✅ [topup] Chunk {chunk_id}: {n} tasks enfileiradas.")
	else:
	sm.marcar_chunk_como_finalizado(chunk_id, {"total_ok": 0, "erros": ["sem_tarefas"]})
	_publish_diario(f"⚠️ Chunk {chunk_id} sem tarefas")

	return carregados


	def _sync_e_carregar_proximos_chunks():
	with _lock:
	if len(_chunk_counters) >= MAX_CHUNKS_ATIVOS:
	logger.info(f"⏸️ [sync] {len(_chunk_counters)} chunks ativos — máximo atingido.")
	return

	logger.info("📥 [sync] Baixando CSV de bordo do GitHub...")
	df = _http_manager.baixar_diario()
	if df is not None:
	df.to_csv(WORK_DIR / STATE_CSV_NAME, index=False)
	logger.info(f"✅ [sync] CSV atualizado: {len(df)} registros.")
	else:
	logger.error("❌ [sync] Falha ao baixar CSV — usando local se disponível.")

	sm = StateManager(WORK_DIR, WORK_DIR)
	sm.id_minimo = ID_MINIMO_CHUNK

	with _lock:
	faltam = max(MIN_CHUNKS_ATIVOS - len(_chunk_counters), 1)

	carregados = 0
	for _ in range(faltam):
	chunk_id = sm.selecionar_proximo_chunk()
	if not chunk_id:
	break
	sm.marcar_chunk_como_iniciado(chunk_id)
	n = _carregar_chunk_na_fila(chunk_id)
	if n > 0:
	carregados += 1
	_publish_diario(f"🔒 LOCK chunk {chunk_id}")
	else:
	sm.marcar_chunk_como_finalizado(chunk_id, {"total_ok": 0, "erros": ["sem_tarefas"]})

	if carregados:
	logger.info(f"✅ [sync] {carregados} chunk(s) carregados via HTTP.")
	else:
	logger.info("⏸️ [sync] Nenhum chunk novo disponível.")


	# ══════════════════════════════════════════════════════════════════════
	# FINALIZAÇÃO DE CHUNK
	# ══════════════════════════════════════════════════════════════════════

	def _finalizar_chunk_se_completo(chunk_id: str):
	with _lock:
	counter = _chunk_counters.get(chunk_id)
	if not counter or counter["done"] < counter["total"]:
	return
	collector = _chunk_collectors.pop(chunk_id, None)
	del _chunk_counters[chunk_id]

	if not collector:
	return

	logger.info(f"🎉 Chunk {chunk_id} completo ({counter['done']}/{counter['total']})!")
	collector.finalizar_chunk_parcial(chunk_id)
	_pos_processar_jsonl_chunk(chunk_id)
	stats = collector.get_chunk_stats_and_reset()

	sm = StateManager(WORK_DIR, WORK_DIR)
	sm.marcar_chunk_como_finalizado(chunk_id, stats)

	msg = f"✅ Chunk {chunk_id} \| {stats['total_ok']} OK \| {len(stats['erros'])} erros"
	with _lock:
	_stats["chunks_concluidos"] += 1

	# ── Push síncrono em thread própria — não confia no disco efêmero ──
	# Se falhar, cai no _pending_push como fallback pro bg-push.
	def _tentar_push():
	ok = _push_chunk_agora(chunk_id, msg)
	if not ok:
	with _lock:
	_pending_push.append({"chunk_id": chunk_id, "msg": msg})
	logger.warning(f"⚠️ [push] Chunk {chunk_id} falhou — delegado ao BG-push.")

	threading.Thread(target=_tentar_push, daemon=True, name=f"push-{chunk_id}").start()
	logger.info(f"🚀 Chunk {chunk_id} disparando push síncrono.")
	_topup_trigger.set()


	def _pos_processar_jsonl_chunk(chunk_id: str):
	work_tar = WORK_DIR / f"dados_llm_v3/chunk_llm_{chunk_id}.tar.gz"
	if not work_tar.exists():
	logger.warning(f"⚠️ [merge] {work_tar} não encontrado.")
	return

	def _sort_key(obj):
	mid = obj.get("manifestacao_juridica", {}).get("id_manifestacao") \
	if isinstance(obj.get("manifestacao_juridica"), dict) else None
	try:
	return int(mid) if mid is not None else 0
	except (TypeError, ValueError):
	return 0

	try:
	existentes_bytes = _http_manager.baixar_chunk_llm(chunk_id)
	existentes, _, _n = _ler_jsonl_de_bytes(existentes_bytes) if existentes_bytes else ([], [], 0)
	raw_md_existentes = _ler_raw_md_de_bytes(existentes_bytes) if existentes_bytes else {}

	existentes_por_id = {
	str(r["manifestacao_juridica"]["id_manifestacao"]): r
	for r in existentes
	if isinstance(r.get("manifestacao_juridica"), dict)
	and r["manifestacao_juridica"].get("id_manifestacao")
	}

	novos = _ler_jsonl_de_tar(work_tar)
	novos_por_id = {
	str(r["manifestacao_juridica"]["id_manifestacao"]): r
	for r in novos
	if isinstance(r.get("manifestacao_juridica"), dict)
	and r["manifestacao_juridica"].get("id_manifestacao")
	}

	merged = {existentes_por_id, novos_por_id}
	linhas = sorted(merged.values(), key=_sort_key)

	# raw_md desativado — não puxa do GitHub nem escreve no tar
	# (evita tar.gz > 100 MB e falha permanente na GitHub API)

	logger.info(
	f"🔀 [merge] Chunk {chunk_id}: "
	f"{len(existentes_por_id)} existentes + {len(novos_por_id)} novos "
	f"→ {len(linhas)} registros"
	)

	dados_bytes = "\n".join(json.dumps(r, ensure_ascii=False) for r in linhas).encode("utf-8")

	with _lock:
	payload_logs = _chunk_payload_logs.pop(chunk_id, [])
	error_logs = _chunk_error_logs.pop(chunk_id, [])

	payloads_bytes = (
	"\n".join(json.dumps(e, ensure_ascii=False) for e in payload_logs).encode("utf-8")
	if payload_logs else b""
	)
	erros_bytes = (
	"\n".join(json.dumps(e, ensure_ascii=False) for e in error_logs).encode("utf-8")
	if error_logs else b""
	)

	# ── Escreve em arquivo temporário e só substitui se tiver ok ──
	# Evita perda de dados se algo explodir durante a escrita.
	tmp_tar = work_tar.with_suffix(".tmp.gz")
	with _tarfile.open(tmp_tar, "w:gz") as tar:
	for name, data in [
	("jurisprudencias.jsonl", dados_bytes),
	("payloads.jsonl", payloads_bytes),
	("erros.jsonl", erros_bytes),
	]:
	if data:
	info = _tarfile.TarInfo(name=name)
	info.size = len(data)
	tar.addfile(info, _io.BytesIO(data))

	# Atomic replace — só deleta o original depois que o tmp está pronto
	tmp_tar.replace(work_tar)

	logger.info(
	f"📦 [merge] chunk_llm_{chunk_id}.tar.gz: {len(linhas)} registros "
	f"\| {len(payload_logs)} payloads \| {len(error_logs)} erros"
	)

	except Exception as e:
	logger.error(f"❌ [merge] Chunk {chunk_id}: {e}", exc_info=True)


	# ══════════════════════════════════════════════════════════════════════
	# TIMEOUT / REQUEUE — v5.0: requeue em LOTE por worker_id
	# ══════════════════════════════════════════════════════════════════════

	def _requeue_timed_out():
	"""
	Verifica tasks em _in_progress que ultrapassaram KEEPALIVE_TIMEOUT_SEC (550 s).

	v5.0 — comportamento em lote:
	• Agrupa tasks expiradas por worker_id.
	• Workers com tentativas restantes: devolve o LOTE inteiro ao início da
	fila de uma vez (não task por task), mantendo a ordem interna.
	• Workers que atingiram MAX_RETRIES: falha o lote inteiro de uma vez.
	"""
	now = datetime.utcnow()
	deadline = now - timedelta(seconds=KEEPALIVE_TIMEOUT_SEC)

	# Agrupa por worker_id
	by_worker_requeue: Dict[str, List] = {}
	by_worker_fail: Dict[str, List] = {}

	with _lock:
	for tid, info in list(_in_progress.items()):
	referencia = info.get("last_keepalive") or info["claimed_at"]
	if referencia >= deadline:
	continue

	retries = info.get("retries", 0)
	elapsed = int((now - referencia).total_seconds())
	wid = info["worker_id"]

	if retries + 1 >= MAX_RETRIES_PER_TASK:
	logger.error(
	f"⏱️❌ [timeout-batch] Task {tid} \| worker={wid} \| "
	f"{elapsed}s sem KA \| {retries+1}/{MAX_RETRIES_PER_TASK} → FALHA DEFINITIVA"
	)
	by_worker_fail.setdefault(wid, []).append((tid, info))
	else:
	new_r = retries + 1
	logger.warning(
	f"⏱️♻️ [timeout-batch] Task {tid} \| worker={wid} \| "
	f"{elapsed}s sem KA \| tentativa {new_r}/{MAX_RETRIES_PER_TASK} → requeue"
	)
	info["retries"] = new_r
	by_worker_requeue.setdefault(wid, []).append((tid, info))

	# Remove todas as expiradas de _in_progress
	for wid, items in {by_worker_requeue, by_worker_fail}.items():
	for tid, _ in items:
	_in_progress.pop(tid, None)

	# ── Requeue em lote: insere o grupo inteiro no início da fila ──
	for wid, items in by_worker_requeue.items():
	lote = []
	for tid, info in items:
	task = info["task"]
	task["_retries"] = info["retries"]
	lote.append(task)
	for t in reversed(lote):
	_task_queue.insert(0, t)
	logger.info(
	f"♻️ [timeout-batch] worker={wid}: {len(lote)} task(s) "
	f"devolvidas à fila como lote."
	)

	# ── Falhas definitivas (fora do lock) ────────────────────────────
	chunks_afetados = set()
	for wid, items in by_worker_fail.items():
	for tid, info in items:
	chunk_id = info["chunk_id"]
	task = info["task"]
	chunks_afetados.add(chunk_id)

	with _lock:
	collector = _chunk_collectors.get(chunk_id)
	if collector:
	collector.adicionar_resultado(
	task,
	{
	"status": "falha",
	"resultado": _normalizar_resultado(task, "falha", {}),
	"tokens": 0,
	"motivo": "timeout_keepalive_batch_max_retries",
	},
	)
	with _lock:
	_stats["tasks_erro"] += 1
	if chunk_id in _chunk_counters:
	_chunk_counters[chunk_id]["done"] += 1

	logger.error(
	f"💀 [timeout-batch] worker={wid}: {len(items)} task(s) "
	f"falharam definitivamente (max retries)."
	)

	for cid in chunks_afetados:
	_finalizar_chunk_se_completo(cid)


	# ══════════════════════════════════════════════════════════════════════
	# NORMALIZAÇÃO / SANITIZAÇÃO
	# ══════════════════════════════════════════════════════════════════════

	def _limpar_resultado_llm(resultado: dict) -> dict:
	_SCHEMA_KEYS = {"type", "required", "$schema", "$defs", "definitions", "additionalProperties"}

	def _is_schema_wrapper(obj):
	return isinstance(obj, dict) and "properties" in obj and set(obj.keys()) <= _SCHEMA_KEYS \| {"properties"}

	def _strip(obj):
	if isinstance(obj, dict):
	return {k: _strip(v) for k, v in obj.items() if k not in _SCHEMA_KEYS}
	if isinstance(obj, list):
	return [_strip(i) for i in obj]
	return obj

	resultado.pop("$schema", None)
	if _is_schema_wrapper(resultado):
	resultado = resultado.get("properties", resultado)
	if "properties" in resultado and "manifestacao_juridica" not in resultado:
	inner = resultado["properties"]
	if isinstance(inner, dict) and "manifestacao_juridica" in inner:
	resultado = inner
	mj = resultado.get("manifestacao_juridica")
	if isinstance(mj, dict) and list(mj.keys()) == ["properties"] and isinstance(mj.get("properties"), dict):
	resultado["manifestacao_juridica"] = mj["properties"]
	return _strip(resultado)


	def _normalizar_resultado(task: dict, status: str, resultado: dict) -> dict:
	id_manifestacao = (
	task.get("dados_originais", {})
	.get("manifestacao_juridica", {})
	.get("id_manifestacao")
	)
	if status in ("falha", "skip"):
	return {"manifestacao_juridica": {"id_manifestacao": id_manifestacao, ("error" if status == "falha" else "skip"): True}}
	if id_manifestacao:
	mj = resultado.get("manifestacao_juridica")
	if isinstance(mj, dict):
	if not mj.get("id_manifestacao"):
	mj["id_manifestacao"] = id_manifestacao
	else:
	resultado.setdefault("manifestacao_juridica", {"id_manifestacao": id_manifestacao})
	return resultado


	def _build_raw_markdown(dados_originais: dict, id_manifestacao) -> str:
	d = dados_originais or {}
	num_proc = d.get("numero_processo") or d.get("Id") or str(id_manifestacao)
	linhas = [
	f"# Acórdão TJPR — id_manifestacao: {id_manifestacao}",
	"",
	f"Número do processo: {num_proc}",
	]
	for label, keys in [
	("Data do julgamento", ["data_julgamento", "data"]),
	("Relator", ["relator", "relator_ou_juiz"]),
	("Órgão julgador", ["orgao_julgador", "tribunal"]),
	]:
	v = next((d.get(k) for k in keys if d.get(k)), None)
	if v:
	linhas.append(f"{label}: {v}")
	linhas.append("")
	for section, keys in [
	("Ementa", ["ementa"]),
	("Decisão", ["decisao"]),
	("Íntegra do Acórdão", ["integra_do_acordao", "integra"]),
	]:
	v = next((d.get(k) for k in keys if d.get(k)), None)
	if v:
	linhas += [f"## {section}", "", v.strip(), ""]
	return "\n".join(linhas)


	def _contar_chunks_pendentes() -> int:
	try:
	sm = StateManager(WORK_DIR, WORK_DIR)
	sm.id_minimo = ID_MINIMO_CHUNK
	return sm.contar_chunks_pendentes() if hasattr(sm, "contar_chunks_pendentes") else 0
	except Exception:
	return 0


	# ══════════════════════════════════════════════════════════════════════
	# BACKGROUND THREADS
	# ══════════════════════════════════════════════════════════════════════

	def _bg_sync():
	while True:
	time.sleep(SYNC_INTERVAL)
	logger.info("🔄 [BG-sync] Verificando novos chunks via HTTP...")
	try:
	_sync_e_carregar_proximos_chunks()
	except Exception as e:
	logger.error(f"❌ [BG-sync] {e}", exc_info=True)


	def _bg_buffer_monitor():
	while True:
	triggered = _topup_trigger.wait(timeout=BUFFER_MONITOR_INTERVAL)
	_topup_trigger.clear()
	try:
	with _lock:
	ativos = len(_chunk_counters)
	if ativos < MIN_CHUNKS_ATIVOS:
	motivo = "sinalizado" if triggered else "periódico"
	logger.info(f"🔔 [buffer] Topup ({motivo}): {ativos}/{MIN_CHUNKS_ATIVOS} ativos.")
	_topup_chunks_se_necessario()
	except Exception as e:
	logger.error(f"❌ [buffer-monitor] {e}", exc_info=True)


	def _bg_requeue():
	while True:
	time.sleep(30)
	try:
	_requeue_timed_out()
	except Exception as e:
	logger.error(f"❌ [BG-requeue] {e}", exc_info=True)


	def _push_chunk_agora(chunk_id: str, msg: str) -> bool:
	"""
	Publica um chunk_llm no GitHub imediatamente.
	Retorna True se ok_llm + ok_csv. Thread-safe (pode ser chamado de qualquer lugar).
	"""
	gz_path = WORK_DIR / f"dados_llm_v3/chunk_llm_{chunk_id}.tar.gz"
	if not gz_path.exists():
	logger.error(f"❌ [push] {gz_path} não existe — chunk {chunk_id} perdido.")
	return False
	try:
	ok_llm = _publish_chunk_llm(chunk_id, gz_path, msg)
	ok_csv = _publish_diario(msg) if ok_llm else False
	if ok_llm and ok_csv:
	logger.info(f"✅ [push] Chunk {chunk_id} publicado no GitHub.")
	try:
	gz_path.unlink(missing_ok=True) # limpa disco após push confirmado
	except Exception:
	pass
	return True
	else:
	logger.error(f"❌ [push] Chunk {chunk_id} falhou (llm={ok_llm} csv={ok_csv}).")
	return False
	except Exception as e:
	logger.error(f"❌ [push] Exceção no chunk {chunk_id}: {e}", exc_info=True)
	return False


	def _bg_push():
	while True:
	try:
	time.sleep(PUSH_INTERVAL)
	with _lock:
	pending = list(_pending_push)
	_pending_push.clear()

	if not pending:
	continue

	logger.info(f"🚀 [BG-push] Publicando {len(pending)} chunk(s) via HTTP...")
	for item in pending:
	try:
	ok = _push_chunk_agora(item["chunk_id"], item["msg"])
	if not ok:
	with _lock:
	_pending_push.append(item) # re-enfileira se falhou
	except Exception as e_item:
	logger.error(f"❌ [BG-push] chunk {item.get('chunk_id','?')}: {e_item}", exc_info=True)
	with _lock:
	_pending_push.append(item) # nunca perde

	except Exception as e_outer:
	logger.error(f"❌ [BG-push] loop externo: {e_outer}", exc_info=True)
	# NÃO deixa a thread morrer — volta no próximo ciclo


	# ══════════════════════════════════════════════════════════════════════
	# APP FASTAPI
	# ══════════════════════════════════════════════════════════════════════

	app = FastAPI(title="ParaAI Queue Director", version="5.0.0")


	@app.on_event("startup")
	async def startup():
	global _http_manager, _system_prompt, _initialized, _init_error, _start_time
	logger.info("=" * 60)
	logger.info("🚀 ParaAI Queue Director v5.0 (batch) iniciando...")
	logger.info("=" * 60)
	try:
	if not GIT_TOKEN or not GITHUB_REPO_SLUG:
	raise ValueError("GIT_TOKEN e GITHUB_REPO_SLUG são obrigatórios.")

	_http_manager = HttpDirectorManager(GIT_TOKEN, GITHUB_REPO_SLUG, GITHUB_BRANCH)
	_system_prompt = _load_system_prompt()

	_sync_e_carregar_proximos_chunks()

	for target, name in [
	(_bg_sync, "bg-sync"),
	(_bg_push, "bg-push"),
	(_bg_requeue, "bg-requeue"),
	(_bg_buffer_monitor, "bg-buffer"),
	]:
	threading.Thread(target=target, daemon=True, name=name).start()

	_initialized = True
	_start_time = datetime.utcnow()
	with _lock:
	fila = len(_task_queue)
	logger.info(f"✅ Queue Director v5.0 pronto. {fila} tasks na fila inicial.")
	except Exception as e:
	_init_error = str(e)
	logger.critical(f"❌ Falha na inicialização: {e}", exc_info=True)


	# ══════════════════════════════════════════════════════════════════════
	# AUTH
	# ══════════════════════════════════════════════════════════════════════

	def _require_auth(authorization: str = Header(None)):
	if not authorization or authorization != f"Bearer {QUEUE_API_TOKEN}":
	raise HTTPException(status_code=401, detail="Não autorizado.")


	# ══════════════════════════════════════════════════════════════════════
	# MODELS
	# ══════════════════════════════════════════════════════════════════════

	class TaskResult(BaseModel):
	worker_id: str = "unknown"
	chunk_id: Optional[str] = None
	status: str = "falha"
	resultado: Optional[Any] = None
	tokens: Optional[Any] = 0
	motivo: Optional[str] = ""

	class Config:
	extra = "allow"

	@property
	def resultado_safe(self) -> dict:
	return self.resultado if isinstance(self.resultado, dict) else {}

	@property
	def tokens_safe(self) -> int:
	try:
	return int(self.tokens or 0)
	except (TypeError, ValueError):
	return 0


	class BatchTaskResult(BaseModel):
	"""Um item dentro de um lote de resultados."""
	task_id: str
	chunk_id: Optional[str] = None
	register_id: Optional[str] = None
	status: str = "falha"
	resultado: Optional[Any] = None
	tokens: Optional[Any] = 0
	motivo: Optional[str] = ""
	worker_id: str = "unknown"

	class Config:
	extra = "allow"

	@property
	def resultado_safe(self) -> dict:
	return self.resultado if isinstance(self.resultado, dict) else {}

	@property
	def tokens_safe(self) -> int:
	try:
	return int(self.tokens or 0)
	except (TypeError, ValueError):
	return 0


	class BatchResultPayload(BaseModel):
	"""Lote completo de resultados enviado pelo worker."""
	worker_id: str = "unknown"
	results: List[BatchTaskResult]


	# ══════════════════════════════════════════════════════════════════════
	# ROTAS
	# ══════════════════════════════════════════════════════════════════════

	@app.get("/health")
	def health():
	with _lock:
	fila = len(_task_queue)
	em_proc = len(_in_progress)
	return {
	"status": "ok" if _initialized else "initializing",
	"error": _init_error or None,
	"queue_size": fila,
	"in_progress": em_proc,
	"timestamp": datetime.utcnow().isoformat(),
	}


	@app.get("/queue/status", dependencies=[Depends(_require_auth)])
	def queue_status():
	with _lock:
	p429 = _pressure_429
	p498 = _pressure_498
	return {
	"queue_size": len(_task_queue),
	"in_progress": len(_in_progress),
	"chunks_ativos": {
	cid: {"total": c["total"], "done": c["done"], "tokens": c.get("tokens", 0)}
	for cid, c in _chunk_counters.items()
	},
	"stats": dict(_stats),
	"pending_push": len(_pending_push),
	"pressure": {"429": p429, "498": p498, "total": p429 * 2 + p498},
	"timestamp": datetime.utcnow().isoformat(),
	}


	# ── GET individual (mantido para compatibilidade) ─────────────────────

	@app.get("/queue/work", dependencies=[Depends(_require_auth)])
	def get_work(worker_id: str = "unknown"):
	if not _initialized:
	raise HTTPException(status_code=503, detail="Queue Director inicializando.")

	with _lock:
	tarefas_pendentes = [
	(tid, info)
	for tid, info in list(_in_progress.items())
	if info["worker_id"] == worker_id
	]

	chunks_afetados: set = set()
	requeue_tasks: List[dict] = []

	for tid, info in tarefas_pendentes:
	retries = info.get("retries", 0) + 1
	chunks_afetados.add(info["chunk_id"])
	if retries >= MAX_RETRIES_PER_TASK:
	logger.error(
	f"⏱️❌ [get_work] Task {tid} \| worker={worker_id} \| "
	f"{retries}/{MAX_RETRIES_PER_TASK} tentativas → FALHA."
	)
	collector = _chunk_collectors.get(info["chunk_id"])
	if collector:
	collector.adicionar_resultado(
	info["task"],
	{
	"status": "falha",
	"resultado": _normalizar_resultado(info["task"], "falha", {}),
	"tokens": 0,
	"motivo": "worker_abandonou_max_retries",
	},
	)
	_stats["tasks_erro"] += 1
	if info["chunk_id"] in _chunk_counters:
	_chunk_counters[info["chunk_id"]]["done"] += 1
	else:
	old_task = info["task"]
	old_task["_retries"] = retries
	requeue_tasks.append(old_task)
	logger.warning(f"♻️ [get_work] Worker {worker_id} pediu nova task sem devolver {tid}. Requeue.")
	del _in_progress[tid]

	if _task_queue:
	task = _task_queue.pop(0)
	for t in reversed(requeue_tasks):
	_task_queue.insert(0, t)
	elif requeue_tasks:
	task = requeue_tasks.pop(0)
	for t in reversed(requeue_tasks):
	_task_queue.insert(0, t)
	else:
	return JSONResponse({"task_id": None, "message": "Fila vazia."})

	task_id = task["id"]
	chunk_id = task["chunk_id"]
	now = datetime.utcnow()

	_in_progress[task_id] = {
	"claimed_at": now,
	"last_keepalive": now,
	"worker_id": worker_id,
	"chunk_id": chunk_id,
	"task": task,
	"retries": task.pop("_retries", 0),
	}
	_stats["tasks_entregues"] += 1
	logger.info(f"❇️ [get_work] Task {task_id} (chunk {chunk_id}) → worker {worker_id}")

	for cid in chunks_afetados:
	_finalizar_chunk_se_completo(cid)

	return {
	"task_id": task_id,
	"chunk_id": chunk_id,
	"dados_originais": task["dados_originais"],
	"dados_llm_existente": task.get("dados_llm_existente"), # null se task nova
	"system_prompt": _system_prompt,
	}


	# ── GET em lote — novo v5.0 ───────────────────────────────────────────

	@app.get("/queue/work/batch", dependencies=[Depends(_require_auth)])
	def get_work_batch(
	worker_id: str = "unknown",
	batch_size: int = Query(default=10, ge=1, le=50),
	):
	"""
	Entrega até `batch_size` tasks em UMA única request.

	Cada item do retorno inclui:
	• task_id, chunk_id, register_id (id_manifestacao), dados_originais

	Comportamento de requeue idêntico ao endpoint individual:
	• Se o mesmo worker_id já tinha tasks reservadas sem devolução,
	faz requeue delas (ou falha definitivamente se MAX_RETRIES atingido)
	antes de entregar o novo lote.
	"""
	if not _initialized:
	raise HTTPException(status_code=503, detail="Queue Director inicializando.")

	tasks_out: List[dict] = []
	chunks_afetados: set = set()

	with _lock:
	# Requeue das tasks antigas deste worker
	tarefas_pendentes = [
	(tid, info)
	for tid, info in list(_in_progress.items())
	if info["worker_id"] == worker_id
	]
	requeue_tasks: List[dict] = []

	for tid, info in tarefas_pendentes:
	retries = info.get("retries", 0) + 1
	chunks_afetados.add(info["chunk_id"])

	if retries >= MAX_RETRIES_PER_TASK:
	logger.error(
	f"⏱️❌ [batch/get] Task {tid} \| worker={worker_id} \| "
	f"{retries}/{MAX_RETRIES_PER_TASK} → FALHA DEFINITIVA"
	)
	collector = _chunk_collectors.get(info["chunk_id"])
	if collector:
	collector.adicionar_resultado(
	info["task"],
	{
	"status": "falha",
	"resultado": _normalizar_resultado(info["task"], "falha", {}),
	"tokens": 0,
	"motivo": "worker_abandonou_max_retries_batch",
	},
	)
	_stats["tasks_erro"] += 1
	if info["chunk_id"] in _chunk_counters:
	_chunk_counters[info["chunk_id"]]["done"] += 1
	else:
	old_task = info["task"]
	old_task["_retries"] = retries
	requeue_tasks.append(old_task)
	logger.warning(
	f"♻️ [batch/get] Worker {worker_id} pediu novo lote sem devolver "
	f"{tid}. Requeue (tentativa {retries})."
	)
	del _in_progress[tid]

	# Reinsere no início da fila (preserva ordem interna)
	for t in reversed(requeue_tasks):
	_task_queue.insert(0, t)

	# Pega até batch_size tasks da fila
	now = datetime.utcnow()
	count = min(batch_size, len(_task_queue))

	for _ in range(count):
	if not _task_queue:
	break
	task = _task_queue.pop(0)
	task_id = task["id"]
	chunk_id = task["chunk_id"]

	dados_orig = task.get("dados_originais") or {}
	mj = dados_orig.get("manifestacao_juridica") or {}
	register_id = str(
	mj.get("id_manifestacao")
	or dados_orig.get("Id")
	or dados_orig.get("id_manifestacao")
	or task_id
	)

	_in_progress[task_id] = {
	"claimed_at": now,
	"last_keepalive": now,
	"worker_id": worker_id,
	"chunk_id": chunk_id,
	"task": task,
	"retries": task.pop("_retries", 0),
	"batch": True,
	}
	_stats["tasks_entregues"] += 1

	item_out = {
	"task_id": task_id,
	"chunk_id": chunk_id,
	"register_id": register_id,
	"dados_originais": dados_orig,
	"dados_llm_existente": task.get("dados_llm_existente"), # null se nova
	}
	tasks_out.append(item_out)

	logger.info(
	f"❇️ [batch/get] {len(tasks_out)} task(s) → worker={worker_id} "
	f"(pediu={batch_size}, fila tinha={count})"
	)

	for cid in chunks_afetados:
	_finalizar_chunk_se_completo(cid)

	return {"tasks": tasks_out, "count": len(tasks_out)}


	# ── POST resultado individual (mantido para compatibilidade) ──────────
	#
	# ATENÇÃO: a função post_result é definida SEM decorator aqui para que
	# post_result_batch (que a chama) possa ser REGISTRADA primeiro no router.
	# A rota paramétrica /queue/result/{task_id} é registrada via
	# app.add_api_route() DEPOIS de /queue/result/batch, garantindo que o
	# FastAPI nunca capture "batch" como task_id.

	def post_result(task_id: str, payload: TaskResult):
	if not _initialized:
	raise HTTPException(status_code=503, detail="Queue Director inicializando.")

	wid = payload.worker_id or "unknown"
	resultado_normalizado = payload.resultado_safe
	if isinstance(resultado_normalizado, dict):
	resultado_normalizado["instance_id"] = wid

	with _lock:
	info = _in_progress.pop(task_id, None)

	sem_reserva = (info is None)
	if sem_reserva:
	chunk_id = payload.chunk_id
	if chunk_id:
	try:
	chunk_id = str(int(chunk_id)).zfill(6)
	except (ValueError, TypeError):
	pass
	if not chunk_id:
	logger.warning(f"⚠️ [result] Task {task_id} sem reserva e sem chunk_id — descartado.")
	with _lock:
	_stats["tasks_aceitas_sem_reserva"] += 1
	return {"status": "aceito_sem_reserva", "task_id": task_id, "aviso": "chunk_id ausente"}
	logger.warning(f"⚠️ [result] Task {task_id} sem reserva (chunk={chunk_id}) — aceitando.")
	task_stub = {"id": task_id, "chunk_id": chunk_id, "dados_originais": {}}
	with _lock:
	_stats["tasks_aceitas_sem_reserva"] += 1
	else:
	chunk_id = info["chunk_id"]
	task_stub = info["task"]

	if payload.status == "sucesso" and isinstance(resultado_normalizado, dict):
	resultado_normalizado = _limpar_resultado_llm(resultado_normalizado)

	resultado_final = _normalizar_resultado(task_stub, payload.status, resultado_normalizado)
	if isinstance(resultado_final, dict):
	resultado_final["instance_id"] = wid

	motivo_lower = (payload.motivo or "").lower()
	with _lock:
	global _pressure_429, _pressure_498
	if "429" in motivo_lower or "rate" in motivo_lower or "too many" in motivo_lower:
	_pressure_429 += 1
	if "498" in motivo_lower:
	_pressure_498 += 1

	extra = payload.model_extra or {}
	if chunk_id:
	wpl = extra.get("_log_payloads") or []
	wel = extra.get("_log_erros") or []
	with _lock:
	_chunk_payload_logs.setdefault(chunk_id, []).extend(wpl if isinstance(wpl, list) else [])
	_chunk_error_logs.setdefault(chunk_id, []).extend(wel if isinstance(wel, list) else [])

	with _lock:
	collector = _chunk_collectors.get(chunk_id)

	if collector:
	dados_orig = task_stub.get("dados_originais") or {}
	id_man_raw = (
	dados_orig.get("manifestacao_juridica", {}).get("id_manifestacao")
	if isinstance(dados_orig.get("manifestacao_juridica"), dict)
	else dados_orig.get("Id") or dados_orig.get("id_manifestacao")
	) or task_id
	worker_raw_md = "" #extra.get("_raw_markdown") or ""
	worker_id_man = extra.get("_id_manifestacao")
	if worker_id_man:
	id_man_raw = str(worker_id_man)
	raw_md = "" #worker_raw_md or (_build_raw_markdown(dados_orig, id_man_raw) if dados_orig else None)

	collector.adicionar_resultado(
	task_stub,
	{
	"status": payload.status,
	"resultado": resultado_final,
	"tokens": payload.tokens_safe,
	"motivo": payload.motivo,
	"_raw_markdown": raw_md,
	"_id_manifestacao": str(id_man_raw),
	},
	)
	else:
	logger.warning(f"⚠️ [result] Collector não encontrado para chunk {chunk_id}.")

	with _lock:
	if payload.status == "sucesso":
	_stats["tasks_ok"] += 1
	_record_task_ok(payload.tokens_safe)
	elif payload.status == "skip":
	_stats["tasks_skip"] += 1
	else:
	_stats["tasks_erro"] += 1
	_stats["tokens_total"] += payload.tokens_safe

	if chunk_id in _chunk_counters:
	cnt = _chunk_counters[chunk_id]
	if not sem_reserva or cnt["done"] < cnt["total"]:
	cnt["done"] += 1
	cnt["tokens"] += payload.tokens_safe

	done = _chunk_counters.get(chunk_id, {}).get("done", "?")
	total = _chunk_counters.get(chunk_id, {}).get("total", "?")
	tokens = _chunk_counters.get(chunk_id, {}).get("tokens", 0)

	tag = " [sem-reserva]" if sem_reserva else ""
	logger.info(
	f"📥 [result{tag}] Task {task_id} \| {payload.status} \| "
	f"chunk {chunk_id} [{done}/{total}] \| tokens={payload.tokens_safe} "
	f"(chunk={tokens:,}) \| worker={wid}"
	)

	_finalizar_chunk_se_completo(chunk_id)
	return {"status": "aceito", "task_id": task_id}


	# ── POST resultado em lote — novo v5.0 ───────────────────────────────
	#
	# DEVE ser registrada ANTES de /queue/result/{task_id} para que o
	# FastAPI não capture POST /queue/result/batch como task_id="batch".

	@app.post("/queue/result/batch", dependencies=[Depends(_require_auth)])
	def post_result_batch(payload: BatchResultPayload):
	"""
	Recebe um lote de resultados do worker em UMA única request.

	Internamente chama post_result() para cada item, reutilizando toda
	a lógica existente de merge, collector e finalização de chunk.
	"""
	if not _initialized:
	raise HTTPException(status_code=503, detail="Queue Director inicializando.")

	accepted = 0
	errors = 0

	for item in payload.results:
	try:
	task_result = TaskResult(
	worker_id = item.worker_id or payload.worker_id,
	chunk_id = item.chunk_id,
	status = item.status,
	resultado = item.resultado,
	tokens = item.tokens,
	motivo = item.motivo,
	)
	# Preserva campos extras (_raw_markdown, _id_manifestacao) se presentes
	extra = item.model_extra or {}
	if extra:
	task_result.__pydantic_extra__.update(extra)
	post_result(item.task_id, task_result)
	accepted += 1
	except Exception as e:
	logger.error(f"❌ [batch/result] Task {item.task_id}: {e}")
	errors += 1

	logger.info(
	f"📥 [batch/result] worker={payload.worker_id} \| "
	f"{accepted} aceitos \| {errors} erros \| lote={len(payload.results)}"
	)
	return {"accepted": accepted, "errors": errors, "total": len(payload.results)}


	# Registro tardio da rota paramétrica — DEVE vir DEPOIS de /queue/result/batch
	app.add_api_route(
	"/queue/result/{task_id}",
	post_result,
	methods=["POST"],
	dependencies=[Depends(_require_auth)],
	)


	# ── Admin / keepalive ─────────────────────────────────────────────────

	@app.post("/queue/keepalive/{task_id}", dependencies=[Depends(_require_auth)])
	def keepalive(task_id: str, worker_id: str = "unknown"):
	with _lock:
	info = _in_progress.get(task_id)

	if not info:
	return JSONResponse(
	{"status": "not_found", "task_id": task_id, "message": "Task não reservada."},
	status_code=404,
	)

	with _lock:
	info["last_keepalive"] = datetime.utcnow()

	logger.debug(f"💓 [keepalive] Task {task_id} \| worker={worker_id}")
	return {"status": "ok", "task_id": task_id}


	@app.post("/queue/admin/reload", dependencies=[Depends(_require_auth)])
	def admin_reload():
	threading.Thread(target=_sync_e_carregar_proximos_chunks, daemon=True).start()
	return {"status": "reload iniciado"}


	@app.post("/queue/admin/force_push", dependencies=[Depends(_require_auth)])
	def admin_force_push(chunk_id: Optional[str] = None):
	"""
	Força push imediato.
	- sem chunk_id : drena _pending_push + escaneia disco por tar.gz órfãos
	- com chunk_id : força push daquele chunk específico do disco
	"""
	if chunk_id:
	cid = str(int(chunk_id)).zfill(6)
	msg = f"🔧 force_push manual chunk {cid}"
	ok = _push_chunk_agora(cid, msg)
	if not ok:
	gz = WORK_DIR / f"dados_llm_v3/chunk_llm_{cid}.tar.gz"
	raise HTTPException(
	status_code=404 if not gz.exists() else 502,
	detail=f"Push falhou para chunk {cid}."
	)
	return {"chunk_id": cid, "ok": True}

	# Escaneia disco por órfãos e injeta em _pending_push
	output_dir = WORK_DIR / "dados_llm_v3"
	with _lock:
	ja_pendentes = {item["chunk_id"] for item in _pending_push}
	recuperados = 0
	if output_dir.exists():
	for gz_path in sorted(output_dir.glob("chunk_llm_*.tar.gz")):
	cid = gz_path.stem.replace("chunk_llm_", "").replace(".tar", "").zfill(6)
	if cid not in ja_pendentes:
	with _lock:
	_pending_push.append({"chunk_id": cid, "msg": f"♻️ force_push disco {cid}"})
	recuperados += 1

	with _lock:
	pending = list(_pending_push)
	_pending_push.clear()

	results = []
	for item in pending:
	ok = _push_chunk_agora(item["chunk_id"], item["msg"])
	results.append({"chunk_id": item["chunk_id"], "ok": ok})
	if not ok:
	with _lock:
	_pending_push.append(item)

	ok_n = sum(1 for r in results if r["ok"])
	fail_n = len(results) - ok_n
	return {
	"total": len(results), "ok": ok_n, "falha": fail_n,
	"recuperados_disco": recuperados, "detalhes": results
	}


	@app.get("/queue/admin/push_status", dependencies=[Depends(_require_auth)])
	def admin_push_status():
	"""Quantos chunks estão esperando push + quais tar.gz existem no disco."""
	output_dir = WORK_DIR / "dados_llm_v3"
	disco = []
	if output_dir.exists():
	for gz in sorted(output_dir.glob("chunk_llm_*.tar.gz")):
	disco.append({"file": gz.name, "size_kb": round(gz.stat().st_size / 1024, 1)})
	with _lock:
	pendentes = list(_pending_push)
	return {
	"pending_push_ram": len(pendentes),
	"chunks_em_disco": len(disco),
	"disco": disco,
	"ram": pendentes,
	}


	@app.get("/queue/admin/disco", dependencies=[Depends(_require_auth)])
	def admin_disco():
	"""Lista todos os chunk_llm_*.tar.gz presentes no disco efêmero."""
	output_dir = WORK_DIR / "dados_llm_v3"
	arquivos = []
	if output_dir.exists():
	for gz in sorted(output_dir.glob("chunk_llm_*.tar.gz")):
	arquivos.append({
	"chunk_id": gz.stem.replace("chunk_llm_", "").replace(".tar", "").zfill(6),
	"file": gz.name,
	"size_kb": round(gz.stat().st_size / 1024, 1),
	})
	return {"total": len(arquivos), "chunks": arquivos}


	from fastapi.responses import FileResponse

	@app.get("/queue/admin/disco/{chunk_id}", dependencies=[Depends(_require_auth)])
	def admin_disco_download(chunk_id: str):
	"""
	Baixa o chunk_llm_{chunk_id}.tar.gz direto do disco efêmero.
	Útil para resgatar mel antes que o Space morra de novo 🍯
	"""
	cid = str(int(chunk_id)).zfill(6)
	gz_path = WORK_DIR / f"dados_llm_v3/chunk_llm_{cid}.tar.gz"
	if not gz_path.exists():
	raise HTTPException(status_code=404, detail=f"chunk_llm_{cid}.tar.gz não encontrado no disco.")
	return FileResponse(
	path = gz_path,
	filename = gz_path.name,
	media_type = "application/gzip",
	)


	@app.post("/queue/admin/requeue/{task_id}", dependencies=[Depends(_require_auth)])
	def admin_requeue_task(task_id: str):
	with _lock:
	info = _in_progress.pop(task_id, None)
	if not info:
	raise HTTPException(status_code=404, detail=f"Task {task_id} não está em processamento.")
	task = info["task"]
	retries = info.get("retries", 0) + 1
	task["retries"] = retries
	_task_queue.insert(0, task)
	logger.info(f"♻️ [admin] Task {task_id} devolvida à fila (retries={retries})")
	return {"status": "requeued", "task_id": task_id, "retries": retries}


	@app.post("/queue/admin/mark_error/{task_id}", dependencies=[Depends(_require_auth)])
	def admin_mark_error(task_id: str):
	with _lock:
	info = _in_progress.pop(task_id, None)
	if not info:
	raise HTTPException(status_code=404, detail=f"Task {task_id} não está em processamento.")
	chunk_id = info["chunk_id"]
	task_stub = info["task"]
	collector = _chunk_collectors.get(chunk_id)
	_stats["tasks_erro"] += 1
	if collector:
	collector.adicionar_resultado(
	task_stub, {"status": "erro", "resultado": {}, "tokens": 0, "motivo": "marcado_erro_manual"}
	)
	logger.warning(f"🚫 [admin] Task {task_id} marcada como erro (chunk={chunk_id})")
	_finalizar_chunk_se_completo(chunk_id)
	return {"status": "marked_error", "task_id": task_id, "chunk_id": chunk_id}


	# ══════════════════════════════════════════════════════════════════════
	# DASHBOARD HTML
	# ══════════════════════════════════════════════════════════════════════

	@app.get("/", response_class=HTMLResponse)
	def root():
	now = datetime.utcnow()
	with _lock:
	fila = len(_task_queue)
	em_proc = len(_in_progress)
	chunks_a = len(_chunk_counters)
	cnt_snap = dict(_chunk_counters)
	s = dict(_stats)
	in_prog_snap = dict(_in_progress)
	p429 = _pressure_429
	p498 = _pressure_498

	buffer_ok = chunks_a >= MIN_CHUNKS_ATIVOS
	buffer_cor = "#22c55e" if buffer_ok else "#f59e0b"
	buffer_label = f"{'✅' if buffer_ok else '⚠️'} {chunks_a}/{MIN_CHUNKS_ATIVOS} mín."
	chunks_pend = _contar_chunks_pendentes()

	rows = ""
	for cid, cnt in sorted(cnt_snap.items()):
	pct = int(cnt["done"] / cnt["total"] * 100) if cnt["total"] else 0
	bar_cor = "#f59e0b" if (100 - pct) <= 15 else "#38bdf8"
	alert = " ⚠️" if (100 - pct) <= 15 else ""
	rows += (
	f"<tr><td>{cid}{alert}</td>"
	f"<td>{cnt['done']} / {cnt['total']} ({pct}%)</td>"
	f"<td><div class='bar-bg'><div class='bar-fill' style='width:{pct}%;background:{bar_cor};'></div></div></td>"
	f"<td style='text-align:right;color:#a855f7;font-size:.8rem'>{cnt.get('tokens',0):,}</td>"
	f"</tr>"
	)
	if not rows:
	rows = "<tr><td colspan='4' style='text-align:center;color:#475569;padding:1.25rem;'>Nenhum chunk ativo</td></tr>"

	tasks_rows = ""
	for tid, info in in_prog_snap.items():
	claimed_at = info.get("claimed_at", now)
	last_kp = info.get("last_keepalive") or claimed_at
	elapsed_total = int((now - claimed_at).total_seconds())
	elapsed_kp = int((now - last_kp).total_seconds())
	retries = info.get("retries", 0)
	pct_kp = max(0, min(100, int(elapsed_kp / KEEPALIVE_TIMEOUT_SEC * 100)))
	color = "#22c55e" if retries == 0 else "#eab308" if retries == 1 else "#f97316" if retries == 2 else "#ef4444"
	bar_color = "#22c55e" if pct_kp < 60 else "#eab308" if pct_kp < 90 else "#ef4444"
	batch_tag = " 📦" if info.get("batch") else ""
	tasks_rows += (
	"<tr>"
	f"<td style='color:{color};font-family:monospace;font-size:.78rem'>{tid} / {info.get('chunk_id','?')}</td>"
	f"<td>{info.get('worker_id','?')}{batch_tag}</td>"
	f"<td style='color:{color};text-align:center'>{retries}</td>"
	f"<td style='color:#94a3b8;font-size:.75rem'>{elapsed_total}s total \| {elapsed_kp}s sem KA</td>"
	"<td><div class='bar-bg'>"
	f"<div class='bar-fill' style='width:{pct_kp}%;background:{bar_color};'></div>"
	"</div></td>"
	f"<td><button onclick=\"adminTask('requeue','{tid}')\" style='margin-right:4px;padding:2px 8px;border-radius:4px;border:none;background:#3b82f6;color:#fff;cursor:pointer;font-size:.75rem'>♻️</button>"
	f"<button onclick=\"adminTask('mark_error','{tid}')\" style='padding:2px 8px;border-radius:4px;border:none;background:#ef4444;color:#fff;cursor:pointer;font-size:.75rem'>🚫</button></td>"
	"</tr>"
	)
	if not tasks_rows:
	tasks_rows = "<tr><td colspan='6' style='text-align:center;color:#475569;padding:1rem;'>Nenhuma tarefa em processamento</td></tr>"

	uptime_sec = (now - _start_time).total_seconds() if _start_time else 0
	uptime_str = f"{int(uptime_sec//3600):02d}h {int((uptime_sec%3600)//60):02d}m {int(uptime_sec%60):02d}s"
	rpm, tpm = _sliding_metrics()
	pt = p429 * 2 + p498
	pt_color = "#22c55e" if pt == 0 else "#eab308" if pt < 20 else "#ef4444"

	html = f"""<!DOCTYPE html>
	<html lang="pt-BR">
	<head>
	<meta charset="UTF-8"/>
	<meta http-equiv="refresh" content="10"/>
	<title>ParaAI Queue Director v5</title>
	<style>
	*{{margin:0;padding:0;box-sizing:border-box}}
	body{{font-family:-apple-system,sans-serif;background:#0f172a;color:#e2e8f0;padding:2rem}}
	h1{{font-size:1.5rem;color:#f8fafc;margin-bottom:.2rem}}
	.sub{{color:#64748b;font-size:.82rem;margin-bottom:1.25rem}}
	.grid{{display:grid;grid-template-columns:repeat(auto-fit,minmax(130px,1fr));gap:.75rem;margin-bottom:1.5rem}}
	.card{{background:#1e293b;border-radius:.5rem;padding:.9rem;border:1px solid #334155}}
	.lbl{{font-size:.68rem;color:#64748b;text-transform:uppercase;letter-spacing:.04em}}
	.val{{font-size:1.7rem;font-weight:700;margin-top:.15rem}}
	h2{{color:#64748b;font-size:.85rem;margin:1.25rem 0 .5rem}}
	table{{width:100%;border-collapse:collapse;background:#1e293b;border-radius:.5rem;overflow:hidden;border:1px solid #334155}}
	th{{background:#0f172a;padding:.55rem .9rem;font-size:.7rem;color:#64748b;text-align:left}}
	td{{padding:.5rem .9rem;border-top:1px solid #334155;font-size:.84rem}}
	.bar-bg{{background:#1e293b;border-radius:99px;height:6px;width:100%;border:1px solid #334155}}
	.bar-fill{{height:6px;border-radius:99px;transition:width .3s}}
	.ts{{color:#334155;font-size:.72rem;margin-top:1rem}}
	.badge{{display:inline-block;padding:1px 6px;border-radius:4px;font-size:.7rem;background:#1e3a5f;color:#38bdf8;margin-left:4px}}
	</style>
	</head>
	<body>
	<h1>📋 ParaAI Queue Director <span style="color:#38bdf8;font-size:1rem">v5.0</span> <span class="badge">batch</span></h1>
	<p class="sub">Status: {'✅ Pronto' if _initialized else '⏳ Inicializando'} · HTTP-only · KA timeout={KEEPALIVE_TIMEOUT_SEC}s · auto-refresh 10s</p>
	<div class="grid">
	<div class="card"><div class="lbl">Fila</div><div class="val" style="color:#38bdf8">{fila}</div></div>
	<div class="card"><div class="lbl">Em processamento</div><div class="val" style="color:#a855f7">{em_proc}</div></div>
	<div class="card"><div class="lbl">Chunks ativos</div><div class="val" style="color:{buffer_cor}">{buffer_label}</div></div>
	<div class="card"><div class="lbl">Chunks pendentes</div><div class="val" style="color:#64748b">{chunks_pend}</div></div>
	<div class="card"><div class="lbl">Tasks OK</div><div class="val" style="color:#22c55e">{s['tasks_ok']}</div></div>
	<div class="card"><div class="lbl">Tasks erro</div><div class="val" style="color:#f87171">{s['tasks_erro']}</div></div>
	<div class="card"><div class="lbl">Tokens total</div><div class="val" style="color:#a855f7">{s['tokens_total']:,}</div></div>
	<div class="card"><div class="lbl">Reg/min</div><div class="val" style="color:#38bdf8">{rpm}</div></div>
	<div class="card"><div class="lbl">Tok/min</div><div class="val" style="color:#a855f7">{int(tpm):,}</div></div>
	{'<div class="card"><div class="lbl">Pressão 429</div><div class="val" style="color:'+pt_color+'">'+str(p429)+'</div></div>' if p429 else ''}
	{'<div class="card"><div class="lbl">Pressão 498</div><div class="val" style="color:'+pt_color+'">'+str(p498)+'</div></div>' if p498 else ''}
	<div class="card"><div class="lbl">Uptime</div><div class="val" style="color:#64748b;font-size:1.1rem">{uptime_str}</div></div>
	</div>
	<h2>📦 Chunks ativos</h2>
	<table>
	<thead><tr><th>Chunk ID</th><th>Progresso</th><th>Barra</th><th style="text-align:right">Tokens</th></tr></thead>
	<tbody>{rows}</tbody>
	</table>
	<h2>⚙️ Tarefas em processamento</h2>
	<table>
	<thead><tr><th>Task / Chunk</th><th>Worker</th><th>Retries</th><th>Tempo</th><th>KA timer ({KEEPALIVE_TIMEOUT_SEC}s)</th><th>Ação</th></tr></thead>
	<tbody>{tasks_rows}</tbody>
	</table>
	<p class="ts">🕐 {now.strftime('%Y-%m-%d %H:%M:%S')} UTC</p>
	<div id="admin-msg" style="position:fixed;bottom:1rem;right:1rem;padding:.6rem 1rem;border-radius:.4rem;background:#1e293b;border:1px solid #334155;font-size:.8rem;color:#94a3b8;display:none;"></div>
	<script>
	function adminTask(action,tid){{
	if(!confirm(action+'?\\n'+tid))return;
	fetch('/queue/admin/'+action+'/'+encodeURIComponent(tid),{{method:'POST',headers:{{'Authorization':'Bearer {QUEUE_API_TOKEN}'}}}})
	.then(r=>r.json()).then(d=>showAdminMsg(JSON.stringify(d))).catch(e=>showAdminMsg('❌'+e.message));
	}}
	function showAdminMsg(msg){{
	var el=document.getElementById('admin-msg');
	el.textContent=msg;el.style.display='block';
	setTimeout(()=>{{el.style.display='none';location.reload();}},2000);
	}}
	</script>
	</body>
	</html>"""
	return HTMLResponse(html)