# -*- coding: utf-8 -*-
# Db2 z/OS • RAG (NVIDIA NIM)
# Sidebar + Diagnóstico + Extração robusta (com OCR opcional) + Chunkização por caracteres
# Requisitos:
#   pip install openai gradio numpy pypdf pdfminer.six pymupdf
# (OCR opcional) + dependências de SO:
#   pip install pytesseract pdf2image pillow
#   Linux: apt-get install -y tesseract-ocr poppler-utils

import os
import re
import json
from pathlib import Path
from typing import List, Tuple, Dict, Optional

import numpy as np
import gradio as gr

# ==============================
# Config (Db2 + NVIDIA NIM)
# ==============================
BASE_DIR = Path(__file__).parent if "__file__" in globals() else Path.cwd()

# Altere se necessário; o app também aceita PDFs no diretório atual (*.pdf)
USER_PDF = Path("db2z_13_utilities.pdf")
PDFS = [USER_PDF] if USER_PDF.exists() else sorted([p for p in BASE_DIR.glob("*.pdf") if p.is_file() and p.suffix.lower()==".pdf"])

NVCF_BASE = os.getenv("NVCF_BASE", "https://integrate.api.nvidia.com/v1")
NVCF_API_KEY = os.getenv("NVCF_API_KEY", "")
EMBED_MODEL = os.getenv("EMBED_MODEL", "nvidia/nv-embed-v1")           # 4096-dim atualmente
CHAT_MODEL = os.getenv("CHAT_MODEL", "meta/llama-3.1-8b-instruct")

SAFE_IDX = f".db2_index_{EMBED_MODEL.replace('/','__')}"
INDEX_DIR = BASE_DIR / SAFE_IDX
INDEX_DIR.mkdir(exist_ok=True)
VEC_FILE = INDEX_DIR / "vectors.npy"
META_FILE = INDEX_DIR / "meta.json"

TOP_K_RETRIEVE = 3
TARGET_CONTEXT_CHARS = 1500

# ==============================
# NVIDIA (OpenAI-compatible)
# ==============================
try:
    from openai import OpenAI
except ImportError:
    raise RuntimeError("Instale: pip install openai gradio numpy pypdf pdfminer.six pymupdf")

def get_client():
    if not NVCF_API_KEY or NVCF_API_KEY == "xxxxxxxxxxxxxxxxxxx":
        raise RuntimeError("NVCF_API_KEY não definido. export/set NVCF_API_KEY='SUA_CHAVE'")
    return OpenAI(base_url=NVCF_BASE, api_key=NVCF_API_KEY)

# ==============================
# PDF utils (robusto + OCR opcional)
# ==============================
try:
    import fitz  # PyMuPDF
except Exception:
    fitz = None

try:
    from pdfminer.high_level import extract_text as pdfminer_extract_text
except Exception:
    pdfminer_extract_text = None

try:
    from pypdf import PdfReader
except Exception:
    PdfReader = None

NBSP = "\u00A0"
def _normalize_text(t: str) -> str:
    if not isinstance(t, str):
        t = str(t or "")
    t = t.replace(NBSP, " ")
    t = re.sub(r"[\u0000-\u001F]", " ", t)  # remove controles
    # mantém quebras simples e colapsa espaços longos
    t = re.sub(r"[ \t]{2,}", " ", t)
    t = re.sub(r"\n{3,}", "\n\n", t)
    return t.strip()

def _extract_with_pymupdf(path: Path) -> List[Tuple[int, str]]:
    out: List[Tuple[int, str]] = []
    with fitz.open(path) as doc:
        for i, page in enumerate(doc):
            text = page.get_text("text") or ""
            out.append((i + 1, _normalize_text(text)))
    return out

def _extract_with_pdfminer(path: Path) -> List[Tuple[int, str]]:
    text_all = pdfminer_extract_text(str(path)) or ""
    pages = re.split(r"\f", text_all)
    out: List[Tuple[int, str]] = []
    for i, tx in enumerate(pages):
        out.append((i + 1, _normalize_text(tx)))
    return out

def _extract_with_pypdf(path: Path) -> List[Tuple[int, str]]:
    if PdfReader is None:
        return []
    try:
        r = PdfReader(str(path), strict=False)
    except Exception as e:
        print(f"[WARN] pypdf: falha ao abrir {path.name}: {e}")
        return []
    out: List[Tuple[int, str]] = []
    for i in range(len(r.pages)):
        try:
            page = r.pages[i]
            t = page.extract_text() or ""
        except Exception as e:
            print(f"[WARN] pypdf: falha ao extrair pag {i+1}: {e}")
            t = ""
        out.append((i + 1, _normalize_text(t)))
    return out

def _maybe_ocr_images(path: Path) -> List[Tuple[int, str]]:
    try:
        import pytesseract
        from pdf2image import convert_from_path
    except Exception:
        return []
    out: List[Tuple[int, str]] = []
    try:
        images = convert_from_path(str(path))
        for i, img in enumerate(images):
            txt = pytesseract.image_to_string(img) or ""
            out.append((i + 1, _normalize_text(txt)))
    except Exception as e:
        print(f"[WARN] OCR: falha ao converter/ler {path.name}: {e}")
    return out

def read_pdf_pages(path: Path) -> List[Tuple[int, str]]:
    if not path.exists():
        return []
    # 1) PyMuPDF
    if fitz is not None:
        try:
            pages = _extract_with_pymupdf(path)
            if any((tx or "").strip() for _, tx in pages):
                return pages
        except Exception as e:
            print(f"[WARN] PyMuPDF falhou: {e}")
    # 2) pdfminer
    if pdfminer_extract_text is not None:
        try:
            pages = _extract_with_pdfminer(path)
            if any((tx or "").strip() for _, tx in pages):
                return pages
        except Exception as e:
            print(f"[WARN] pdfminer falhou: {e}")
    # 3) pypdf
    try:
        pages = _extract_with_pypdf(path)
        if any((tx or "").strip() for _, tx in pages):
            return pages
    except Exception as e:
        print(f"[WARN] pypdf falhou: {e}")
    # 4) OCR quando nada foi extraído
    ocr_pages = _maybe_ocr_images(path)
    if not any((tx or "").strip() for _, tx in ocr_pages):
        print("[ERRO] Nenhum texto extraído, nem com OCR.")
    return ocr_pages

# ==============================
# Segmentação (detecção de seções para metadados)
# ==============================
DB2_HEADER_RE = re.compile(
    r"^(Part\s+\d+\.|Chapter\s+\d+\.)|"
    r"\b(BACKUP SYSTEM|CATMAINT|CHECK DATA|CHECK INDEX|CHECK LOB|COPY|COPYTOCOPY|DIAGNOSE|LISTDEF|LOAD|"
    r"MERGECOPY|MODIFY RECOVERY|MODIFY STATISTICS|OPTIONS|QUIESCE|REBUILD INDEX|RECOVER|REORG INDEX|REORG TABLESPACE|"
    r"REPAIR|REPORT|RESTORE SYSTEM|RUNSTATS|STOSPACE|TEMPLATE|UNLOAD)\b",
    re.IGNORECASE
)

def split_db2_docs(pages: List[Tuple[int, str]], doc_label: str) -> List[Dict]:
    """Agrupa páginas por possíveis cabeçalhos (capítulos/utilities) para compor metadados de seção."""
    blocks: List[Dict] = []
    current = {"doc": doc_label, "section": "INTRO", "start_page": 1, "texts": []}
    for pg, tx in pages:
        head = (tx or "")[:300]
        if DB2_HEADER_RE.search(head):
            if current["texts"]:
                current["end_page"] = current["texts"][-1][0]
                blocks.append(current)
            m = re.search(r"(Chapter\s+\d+\.\s*[^\n]+|^[^\n]{1,200})", tx or "")
            title = (m.group(1).strip() if m else f"Section@{pg}")
            current = {"doc": doc_label, "section": title, "start_page": pg, "texts": []}
        current["texts"].append((pg, tx or ""))
    if current["texts"]:
        current["end_page"] = current["texts"][-1][0]
        blocks.append(current)
    return blocks

# ==============================
# Chunkização por caracteres (robusta)
# ==============================
def make_chunks_by_chars(blocks: List[Dict], max_chars: int = 1500, min_chars: int = 180) -> List[Dict]:
    """Concatena o texto das páginas de cada bloco e fatia por janelas de caracteres com overlap."""
    out: List[Dict] = []
    for b in blocks:
        pieces: List[str] = []
        pages: List[int] = []
        for pg, tx in b["texts"]:
            txn = _normalize_text(tx or "")
            if txn:
                pieces.append(txn)
                pages.append(pg)
        if not pieces:
            continue
        blob = "\n".join(pieces).strip()
        if not blob:
            continue
        start_page = min(pages) if pages else b.get("start_page", 0)
        end_page = max(pages) if pages else b.get("end_page", start_page)

        if len(blob) <= max_chars and len(blob) >= min_chars:
            out.append({
                "doc": b["doc"],
                "section": b["section"],
                "start_page": start_page,
                "end_page": end_page,
                "text": blob
            })
            continue

        overlap = 120
        i, n = 0, len(blob)
        while i < n:
            j = min(i + max_chars, n)
            chunk_text = blob[i:j].strip()
            if len(chunk_text) >= min_chars:
                out.append({
                    "doc": b["doc"],
                    "section": b["section"],
                    "start_page": start_page,
                    "end_page": end_page,
                    "text": chunk_text
                })
            new_i = j - overlap
            i = j if new_i <= i else new_i
    # filtro final
    out = [c for c in out if (c.get("text") or "").strip()]
    return out

# ==============================
# Embeddings
# ==============================
def embed_texts(texts: List[str], batch_size: int = 16) -> np.ndarray:
    client = get_client()
    clean = [(i, t) for i, t in enumerate(texts) if isinstance(t, str) and t.strip()]
    if not clean:
        return np.zeros((0, 0), dtype=np.float32)
    order, payload = zip(*clean)
    vecs: Dict[int, np.ndarray] = {}
    for i in range(0, len(payload), batch_size):
        batch = list(payload[i:i + batch_size])
        resp = client.embeddings.create(model=EMBED_MODEL, input=batch)
        for k, item in enumerate(resp.data):
            vecs[int(order[i + k])] = np.array(item.embedding, dtype=np.float32)
    rows: List[np.ndarray] = []
    for idx in range(len(texts)):
        if idx in vecs:
            rows.append(vecs[idx])
    if not rows:
        return np.zeros((0, 0), dtype=np.float32)
    mat = np.vstack(rows).astype(np.float32)
    norms = np.linalg.norm(mat, axis=1, keepdims=True)
    norms[norms == 0] = 1.0
    return mat / norms

def embed_query(q: str) -> np.ndarray:
    client = get_client()
    resp = client.embeddings.create(model=EMBED_MODEL, input=[q])
    v = np.array(resp.data[0].embedding, dtype=np.float32)
    n = np.linalg.norm(v)
    return (v / (n if n > 0 else 1.0)).astype(np.float32)

# ==============================
# Indexação
# ==============================
def build_index() -> Tuple[np.ndarray, List[Dict]]:
    all_blocks: List[Dict] = []
    for p in PDFS:
        pages = read_pdf_pages(p)
        if not pages or not any((tx or "").strip() for _, tx in pages):
            print(f"[WARN] Sem texto legível em {p.name}; ignorando.")
            continue
        blks = split_db2_docs(pages, p.name)
        all_blocks.extend(blks)

    all_chunks = make_chunks_by_chars(all_blocks, max_chars=1500, min_chars=180)
    all_chunks = [c for c in all_chunks if (c.get("text") or "").strip()]

    if not all_chunks:
        with open(META_FILE, "w", encoding="utf-8") as f:
            json.dump({"chunks": [], "embed_model": EMBED_MODEL, "embed_dim": 0, "total_chars": 0}, f, ensure_ascii=False, indent=2)
        np.save(VEC_FILE, np.zeros((0, 0), dtype=np.float32))
        raise RuntimeError("Nenhum chunk foi criado. Verifique extração/ OCR.")

    texts = [c["text"] for c in all_chunks]
    total_chars = sum(len(t) for t in texts)

    mat = embed_texts(texts) if texts else np.zeros((0, 0), dtype=np.float32)
    embed_dim = int(mat.shape[1]) if mat.size else 0

    np.save(VEC_FILE, mat)
    with open(META_FILE, "w", encoding="utf-8") as f:
        json.dump(
            {"chunks": all_chunks, "embed_model": EMBED_MODEL, "embed_dim": embed_dim, "total_chars": total_chars},
            f, ensure_ascii=False, indent=2
        )
    return mat, all_chunks

def load_index() -> Tuple[np.ndarray, List[Dict]]:
    if VEC_FILE.exists() and META_FILE.exists():
        mat = np.load(VEC_FILE)
        dd = json.loads(META_FILE.read_text(encoding="utf-8"))
        chunks = dd.get("chunks", [])
        return mat, chunks
    return build_index()

def wipe_index() -> str:
    try:
        if INDEX_DIR.exists():
            for p in INDEX_DIR.glob("*"):
                p.unlink()
            INDEX_DIR.rmdir()
        INDEX_DIR.mkdir(exist_ok=True)
        return "Índice limpo."
    except Exception as e:
        return f"Erro ao limpar índice: {e}"

# ==============================
# Recuperação + LLM
# ==============================
def _check_embed_dim(mat: np.ndarray) -> Optional[str]:
    try:
        dd = json.loads(META_FILE.read_text(encoding="utf-8"))
        idx_dim = int(dd.get("embed_dim", 0))
    except Exception:
        idx_dim = 0
    try:
        v = embed_query("dim_test")
        cur_dim = int(v.shape[0])
    except Exception as e:
        return f"Falha ao checar dimensão do embedding: {e}"
    if idx_dim and cur_dim and idx_dim != cur_dim:
        return (f"Incompatibilidade de dimensão do embedding: índice={idx_dim}, modelo atual={cur_dim}. "
                f"Reindexe com o mesmo EMBED_MODEL. (Atual EMBED_MODEL: {EMBED_MODEL})")
    return None

def retrieve_topk(query: str, doc_filter: Optional[str] = None, k: int = TOP_K_RETRIEVE) -> List[Dict]:
    mat, chunks = load_index()
    if mat.shape[0] == 0 or not chunks:
        return []
    qv = embed_query(query)
    if mat.shape[1] != qv.shape[0]:
        raise RuntimeError(
            f"Dimensão incompatível mat={mat.shape} vs query={qv.shape}. "
            f"Provável troca de EMBED_MODEL após criar o índice. Clique 'Reindexar'."
        )
    sims = (mat @ qv).astype(float)
    if doc_filter and doc_filter != "(Todos)":
        mask = np.array([1.0 if c["doc"] == doc_filter else 0.0 for c in chunks], dtype=float)
        sims *= mask
    idxs = np.argsort(-sims)[:k]
    out = []
    for i in idxs:
        c = chunks[int(i)]
        out.append({
            "doc": c["doc"],
            "section": c.get("section", ""),
            "start_page": c.get("start_page", "?"),
            "end_page": c.get("end_page", "?"),
            "text": c["text"],
            "score": float(sims[int(i)]),
            "idx": int(i)
        })
    return out

def expand_context(hits: List[Dict], all_chunks: List[Dict], target_chars: int = TARGET_CONTEXT_CHARS) -> Tuple[str, List[Tuple[str, str, str]]]:
    if not hits:
        return "", []
    best = max(hits, key=lambda x: x["score"])
    ctx = best["text"]
    srcs = {(best["doc"], best["section"], f"{best['start_page']}–{best['end_page']}")}
    doc, section, best_idx = best["doc"], best["section"], best["idx"]
    indices = [i for i, c in enumerate(all_chunks) if c["doc"] == doc and c.get("section", "") == section]
    if not indices:
        return ctx, sorted(list(srcs))
    indices.sort()
    if best_idx not in indices:
        return ctx, sorted(list(srcs))
    pos = indices.index(best_idx)
    left, right = pos - 1, pos + 1
    while len(ctx) < target_chars and (left >= 0 or right < len(indices)):
        if right < len(indices) and len(ctx) < target_chars:
            rch = all_chunks[indices[right]]
            ctx += "\n\n" + rch["text"]
            srcs.add((doc, section, f"{rch.get('start_page', '?')}–{rch.get('end_page', '?')}"))
            right += 1
        if left >= 0 and len(ctx) < target_chars:
            lch = all_chunks[indices[left]]
            ctx = lch["text"] + "\n\n" + ctx
            srcs.add((doc, section, f"{lch.get('start_page', '?')}–{lch.get('end_page', '?')}"))
            left -= 1
    return ctx, sorted(list(srcs))

def answer_with_llm(question: str, context: str) -> str:
    client = get_client()
    system = ("Você é um assistente especialista em IBM Db2 para z/OS. "
              "Responda em português, com exemplos de comandos SQL/JCL completos e corretos. "
              "Use apenas o contexto fornecido; se algo não estiver nele, diga que não está disponível.")
    user = (f"Pergunta:\n{question}\n\n"
            f"Contexto do(s) manual(is):\n{context}\n\n"
            "Regras de resposta:\n"
            "- Explique o necessário e como fazer.\n"
            "- Inclua pelo menos um exemplo de comando Db2 utilitário, SQL ou JCL (auto-contido), se aplicável.\n"
            "- Liste observações/pré-requisitos, se houver.\n"
            "- Cite as fontes (Documento e páginas) ao final.")
    chat = client.chat.completions.create(
        model=CHAT_MODEL,
        messages=[{"role": "system", "content": system}, {"role": "user", "content": user}],
        temperature=0.2,
    )
    return chat.choices[0].message.content.strip()

def format_sources_md(sources: List[Tuple[str, str, str]]) -> str:
    if not sources:
        return ""
    lines = [
        f"- **Documento:** {d}  \n  **Seção:** {s}  \n  **Páginas:** {p}"
        for (d, s, p) in sources
    ]
    return "\n".join(lines)

# ==============================
# Templates Db2 (exemplos)
# ==============================
DB2_TEMPLATES: Dict[str, str] = {
    "RUNSTATS_TABLESPACE": (
        "//RUNSTAT JOB (ACCT),'RUNSTATS',CLASS=A,MSGCLASS=X,NOTIFY=&SYSUID\n"
        "//STEP1   EXEC DSNUPROC,SYSTEM=DSN1,UID='RUNSTATS',UTPROC=''\n"
        "//SYSIN   DD *\n"
        "  RUNSTATS TABLESPACE(DBNAME.TSNAME) TABLE(ALL) INDEX(ALL)\n"
        "/*\n"
    ),
    "REORG_TABLESPACE": (
        "//REORG   JOB (ACCT),'REORG',CLASS=A,MSGCLASS=X,NOTIFY=&SYSUID\n"
        "//STEP1   EXEC DSNUPROC,SYSTEM=DSN1,UID='REORGTS',UTPROC=''\n"
        "//SYSIN   DD *\n"
        "  REORG TABLESPACE(DBNAME.TSNAME) SHRLEVEL CHANGE\n"
        "/*\n"
    ),
    "EXPLAIN_SQL": (
        "//EXPLAIN JOB (ACCT),'EXPLAIN',CLASS=A,MSGCLASS=X,NOTIFY=&SYSUID\n"
        "//STEP1   EXEC DSNTEP2,SYSTEM=DSN1\n"
        "//SYSIN   DD *\n"
        "  EXPLAIN PLAN FOR\n"
        "  SELECT COL1, COL2 FROM DBNAME.TBNAME WHERE COL3 = 'X';\n"
        "/*\n"
    ),
    "DISPLAY_BUFFERPOOL": (
        "//DISPBP  JOB (ACCT),'DISPLAY BP',CLASS=A,MSGCLASS=X,NOTIFY=&SYSUID\n"
        "//STEP1   EXEC PGM=IKJEFT01\n"
        "//SYSTSPRT DD SYSOUT=*\n"
        "//SYSIN    DD *\n"
        "  DSN SYSTEM(DSN1)\n"
        "  -DISPLAY BUFFERPOOL(BP0) DETAIL\n"
        "  END\n"
        "/*\n"
    ),
    "DSNTEP2_SELECT": (
        "//SELECT  JOB (ACCT),'DSNTEP2',CLASS=A,MSGCLASS=X,NOTIFY=&SYSUID\n"
        "//STEP1   EXEC DSNTEP2,SYSTEM=DSN1\n"
        "//SYSIN   DD *\n"
        "  SELECT FIRSTNME, LASTNAME FROM DSN8810.EMP\n"
        "  WHERE WORKDEPT = 'A00';\n"
        "/*\n"
    ),
    "COPY_TABLESPACE": (
        "//COPYTS  JOB (ACCT),'COPY',CLASS=A,MSGCLASS=X,NOTIFY=&SYSUID\n"
        "//STEP1   EXEC DSNUPROC,SYSTEM=DSN1,UID='COPYTS',UTPROC=''\n"
        "//SYSIN   DD *\n"
        "  COPY TABLESPACE(DBNAME.TSNAME) FULL YES SHRLEVEL CHANGE\n"
        "/*\n"
    ),
    "LOAD_TABLE": (
        "//LOADTBL JOB (ACCT),'LOAD',CLASS=A,MSGCLASS=X,NOTIFY=&SYSUID\n"
        "//STEP1   EXEC DSNUPROC,SYSTEM=DSN1,UID='LOADTBL',UTPROC=''\n"
        "//SYSIN   DD *\n"
        "  LOAD DATA INDDN SYSREC INTO TABLE DBNAME.TBNAME\n"
        "  REPLACE\n"
        "/*\n"
    ),
    "RECOVER_TABLESPACE": (
        "//RECOVTS JOB (ACCT),'RECOVER',CLASS=A,MSGCLASS=X,NOTIFY=&SYSUID\n"
        "//STEP1   EXEC DSNUPROC,SYSTEM=DSN1,UID='RECOVTS',UTPROC=''\n"
        "//SYSIN   DD *\n"
        "  RECOVER TABLESPACE(DBNAME.TSNAME)\n"
        "/*\n"
    ),
    "STATS_INDEX": (
        "//STATSIX JOB (ACCT),'STATS INDEX',CLASS=A,MSGCLASS=X,NOTIFY=&SYSUID\n"
        "//STEP1   EXEC DSNUPROC,SYSTEM=DSN1,UID='STATSIX',UTPROC=''\n"
        "//SYSIN   DD *\n"
        "  RUNSTATS INDEX(DBNAME.IXNAME) ALL\n"
        "/*\n"
    ),
    "MODIFY_RECOVERY": (
        "//MODREC  JOB (ACCT),'MODIFY RECOVERY',CLASS=A,MSGCLASS=X,NOTIFY=&SYSUID\n"
        "//STEP1   EXEC DSNUPROC,SYSTEM=DSN1,UID='MODREC',UTPROC=''\n"
        "//SYSIN   DD *\n"
        "  MODIFY RECOVERY TABLESPACE(DBNAME.TSNAME) AGE(30)\n"
        "/*\n"
    ),
    "CHECK_DATA": (
        "//CHKDATA JOB (ACCT),'CHECK DATA',CLASS=A,MSGCLASS=X,NOTIFY=&SYSUID\n"
        "//STEP1   EXEC DSNUPROC,SYSTEM=DSN1,UID='CHKDATA',UTPROC=''\n"
        "//SYSIN   DD *\n"
        "  CHECK DATA TABLESPACE(DBNAME.TSNAME) SCOPE ALL\n"
        "/*\n"
    ),
}

def template_for_db2(cmd: str) -> str:
    return DB2_TEMPLATES.get(cmd, "//GENERIC ...\n")

# ==============================
# UI — layout com SIDEBAR + diagnóstico
# ==============================
CUSTOM_CSS = """
:root{ --ink:#0f172a; --muted:#475569; }
.gradio-container { max-width: 1200px !important; margin: 0 auto !important; }
.section-card { background: #fff; border: 1px solid #e2e8f0; border-radius: 16px; padding: 16px; box-shadow: 0 10px 30px rgba(2,6,23,.05); }
.section-title { font-size: 1.05rem; font-weight: 800; color: var(--ink); display: flex; gap: .6rem; align-items: center; }
.subtitle { color:var(--muted); font-size:.95rem; margin-top:.25rem; }
.result-card { background:#fcfdff; border:1px solid #e2e8f0; border-radius:12px; padding:12px; }
hr.sep { border:none; border-top:1px dashed #e2e8f0; margin:10px 0 14px; }
.small { font-size:.9rem; color:var(--muted); }
"""

def build_app():
    doc_label = PDFS[0].name if PDFS else "(Nenhum PDF)"
    all_doc_names = [p.name for p in PDFS] or ["(Nenhum PDF encontrado)"]
    default_doc = all_doc_names[0] if all_doc_names else "(Todos)"

    with gr.Blocks(title="Db2 z/OS • RAG (NVIDIA NIM)", css=CUSTOM_CSS, fill_height=True) as demo:

        # ===== Sidebar =====
        with gr.Sidebar():
            gr.Markdown(
                f"""
<div class="section-title">💼 Db2 RAG</div>
<div class="small">Contexto: <code>{doc_label}</code></div>
"""
            )
            status_box = gr.Markdown("Pronto ✅" if PDFS else "⚠️ Nenhum PDF encontrado.")
            gr.Markdown("<hr class='sep'/>")

            with gr.Group():
                gr.Markdown("**Ações**")
                test_btn = gr.Button("🧪 Testar conexão NVIDIA", variant="secondary")
                rebuild_btn = gr.Button("🔁 Reindexar (NIM)")
                diag_btn = gr.Button("🛠️ Diagnóstico do Índice")

            gr.Markdown("<hr class='sep'/>")

            with gr.Accordion("Configuração", open=False):
                gr.Markdown(f"- **Embeddings:** `{EMBED_MODEL}`\n- **LLM:** `{CHAT_MODEL}`\n- **Índice:** `{INDEX_DIR.name}`")
                doc_choice = gr.Dropdown(
                    choices=(["(Todos)"] + all_doc_names),
                    value=default_doc if PDFS else "(Todos)",
                    label="Documento"
                )

        # ===== Main content =====
        gr.Markdown(
            f"""
<div class="section-card" style="padding:18px; display:flex; gap:16px; align-items:center;">
  <div style="font-size:26px;">🧭</div>
  <div style="flex:1">
    <div style="font-size:1.2rem; font-weight:800; color:#0f172a;">DB2 -Z/OS UTILITIES | RAG + NVIDIA NIM</div>
    <div class="subtitle">Pergunte sobre utilidades (COPY, LOAD, REORG, RUNSTATS, RECOVER, etc.). As respostas vêm do manual: <code>{doc_label}</code>.</div>
  </div>
</div>
            """
        )

        with gr.Row():
            q = gr.Textbox(
                label="Pergunta (Db2 Utilities)",
                placeholder="Ex.: Como usar COPY FULL com SHRLEVEL CHANGE? • Quando rodar RUNSTATS INDEX? • REORG TABLESPACE SHRLEVEL CHANGE • RECOVER PITR...",
                scale=8
            )
        with gr.Row():
            ask_btn = gr.Button("🔍 Buscar", variant="primary", scale=2)
            clear_btn = gr.Button("🧹 Limpar", scale=1)

        out = gr.Markdown(label="Resposta (Db2)")

        gr.Markdown("<hr class='sep'/>")

        with gr.Accordion("🧩 Templates Db2 executáveis", open=False):
            db2_choice = gr.Dropdown(
                choices=list(DB2_TEMPLATES.keys()),
                value="RUNSTATS_TABLESPACE",
                label="Comando / Padrão"
            )
            db2_btn = gr.Button("📄 Gerar exemplo")
            db2_out = gr.Textbox(label="Exemplo (copiar/ajustar)", lines=18, show_copy_button=True)

        with gr.Accordion("🧪 Log / Diagnóstico", open=False):
            diag_out = gr.Markdown()

        # ===== Callbacks =====
        def _test_conn():
            try:
                dim = len(get_client().embeddings.create(model=EMBED_MODEL, input=["ping"]).data[0].embedding)
                return f"Conexão ok ✅ — dimensão do embedding: **{dim}**"
            except Exception as e:
                return f"⚠️ Falha na conexão/credenciais NVIDIA: `{type(e).__name__}` — {e}"

        def _rebuild():
            try:
                msg = wipe_index()
                mat, chunks = build_index()
                return msg + f" Reindexação concluída ✅ PDFs: {len(PDFS)} • Chunks: {len(chunks)} • Vetores: {mat.shape}"
            except Exception as e:
                return f"⚠️ Erro ao reindexar: `{type(e).__name__}` — {e}"

        def _diagnose(dsel: str) -> str:
            try:
                if not (VEC_FILE.exists() and META_FILE.exists()):
                    return "❌ Nenhum índice encontrado. Clique **Reindexar (NIM)**."
                mat = np.load(VEC_FILE)
                meta = json.loads(META_FILE.read_text(encoding="utf-8"))
                chunks = meta.get("chunks", [])
                embed_dim = meta.get("embed_dim", 0)
                total_chars = int(meta.get("total_chars", 0))
                dim_msg = _check_embed_dim(mat)
                # primeiras seções
                first_secs = []
                for c in chunks[:12]:
                    if dsel == "(Todos)" or c["doc"] == dsel:
                        first_secs.append(f"- {c['doc']} • {c.get('section','?')} • p.{c.get('start_page','?')}-{c.get('end_page','?')}")
                if not first_secs:
                    first_secs = ["(Filtro de documento não encontra seções no índice.)"]
                # prévia do primeiro chunk
                preview = ""
                for c in chunks:
                    t = (c.get("text") or "").strip()
                    if t:
                        preview = t[:400].replace("\n", " ")
                        break
                if not preview:
                    preview = "(Nenhum chunk contém texto — verifique extração/OCR.)"
                msg = [
                    f"**Índice**: Vetores `{mat.shape}` • embed_dim(meta): `{embed_dim}` • Modelo atual: `{EMBED_MODEL}`",
                    f"**Chunks**: **{len(chunks)}** • **Total de caracteres**: {total_chars}",
                    f"**Documento selecionado**: `{dsel}`",
                    f"**Primeiras seções**:\n" + "\n".join(first_secs),
                    f"\n**Prévia (400 chars)**:\n```\n{preview}\n```"
                ]
                if dim_msg:
                    msg.append(f"\n⚠️ {dim_msg}")
                return "\n".join(msg)
            except Exception as e:
                return f"⚠️ Diagnóstico falhou: `{type(e).__name__}` — {e}"

        def _search_answer(qstr: str, d: str) -> str:
            try:
                if not qstr or qstr.strip() == "":
                    return "_Informe uma pergunta._"
                if not (VEC_FILE.exists() and META_FILE.exists()):
                    return "_Nenhum conteúdo indexado. Use **Reindexar**._"
                mat = np.load(VEC_FILE)
                meta = json.loads(META_FILE.read_text(encoding="utf-8"))
                chunks = meta.get("chunks", [])
                if mat.size == 0 or not chunks:
                    return "_Índice vazio. Reindexe (pode ser necessário OCR)._"
                dim_msg = _check_embed_dim(mat)
                if dim_msg:
                    return f"⚠️ {dim_msg}"
                # retrieve
                hits = retrieve_topk(qstr, None if d == "(Todos)" else d, k=TOP_K_RETRIEVE)
                hits = [h for h in hits if (h.get("text") or "").strip()]
                if not hits:
                    return "_Nada encontrado para a consulta (verifique o filtro de documento ou reindexe)._"
                context, sources = expand_context(hits, chunks, TARGET_CONTEXT_CHARS)
                if not context.strip():
                    return "_Contexto insuficiente encontrado._"
                answer = answer_with_llm(qstr, context)
                src_md = format_sources_md(sources)
                return f"<div class='result-card'>{answer}</div>\n\n### Fontes\n{src_md}"
            except Exception as e:
                return f"⚠️ Erro ao buscar: `{type(e).__name__}` — {e}"

        def _clear(doc_default: str) -> Tuple[str, str]:
            return "", (doc_default if PDFS else "(Todos)")

        def ui_db2_template(cmd_choice: str) -> str:
            return template_for_db2(cmd_choice)

        test_btn.click(_test_conn, outputs=[status_box])
        rebuild_btn.click(_rebuild, outputs=[status_box])
        diag_btn.click(_diagnose, inputs=[doc_choice], outputs=[diag_out])

        ask_btn.click(_search_answer, inputs=[q, doc_choice], outputs=[out])
        clear_btn.click(_clear, inputs=[gr.State(default_doc)], outputs=[q, doc_choice])
        db2_btn.click(ui_db2_template, inputs=[db2_choice], outputs=[db2_out])

    return demo

# ==============================
# Main (robusto: bind público, respeita $PORT, SSR off, queue opcional)
# ==============================
if __name__ == "__main__":
    try:
        _ = load_index()
    except Exception as e:
        print(f"[AVISO] Índice não carregado: {e}")
    app = build_app()
    app.launch(server_name="0.0.0.0", server_port=7860)