Spaces:

ForStream
/

ontology-prototype

Sleeping

ForStream commited on 4 days ago

Commit

2b50ae3

0 Parent(s):

Initial: LP출자 온톨로지 LLM 프로토타입

- FastAPI 백엔드 (rag_engine + KoSimCSE + 4구성 호출)
- React + Vite 프론트엔드 (3탭: 설명/테스트/데이터 관리)
- Gemma 4 E4B (HF Inference API) + Sonnet 4.6
- 데이터: 트리플 3,712개, RAG 청크 274개, KoSimCSE 임베딩 캐시
- Docker multi-stage 빌드

Files changed (23) hide show

.gitignore +33 -0
Dockerfile +68 -0
README.md +52 -0
api/llm_adapters.py +162 -0
api/main.py +235 -0
api/requirements.txt +20 -0
code/baseline_lib.py +792 -0
code/rag_engine.py +1265 -0
code/semantic_search.py +309 -0
data/alias_dictionary.json +81 -0
data/investment_ontology_v1_10.ttl +0 -0
data/regulations_chunks_v14.jsonl +0 -0
data/risk_weight_lookup.json +155 -0
prepare_data.sh +51 -0
web/index.html +17 -0
web/package.json +19 -0
web/src/App.jsx +56 -0
web/src/DataTab.jsx +319 -0
web/src/ExplainTab.jsx +124 -0
web/src/TestTab.jsx +287 -0
web/src/main.jsx +6 -0
web/src/styles.css +661 -0
web/vite.config.js +20 -0

.gitignore ADDED Viewed

	@@ -0,0 +1,33 @@

+# Python
+__pycache__/
+*.py[cod]
+*.so
+.Python
+*.egg-info/
+.pytest_cache/
+# Node
+node_modules/
+web/dist/
+.npm/
+# OS
+.DS_Store
+Thumbs.db
+# Editor
+.vscode/
+.idea/
+*.swp
+# Local env
+.env
+.env.local
+# Cache (HF Spaces에서 새로 빌드)
+.cache/
+# Binary assets (HF의 binary 거부 — 나중에 LFS/Xet로 추가 예정)
+assets/*.pdf
+assets/*.png
+data/_embeddings_cache/

Dockerfile ADDED Viewed

	@@ -0,0 +1,68 @@

+# =====================================================================
+# Stage 1: React (Vite) 빌드
+# =====================================================================
+FROM node:20-alpine AS web-build
+WORKDIR /web
+COPY web/package.json web/package-lock.json* ./
+RUN npm install --no-audit --no-fund
+COPY web/ ./
+RUN npm run build
+# =====================================================================
+# Stage 2: Python 런타임 (FastAPI + 데이터 + Web 빌드 결과)
+# =====================================================================
+FROM python:3.11-slim
+ENV PYTHONUNBUFFERED=1 \
+    PYTHONDONTWRITEBYTECODE=1 \
+    PIP_NO_CACHE_DIR=1 \
+    HF_HOME=/app/.cache/huggingface \
+    TRANSFORMERS_CACHE=/app/.cache/huggingface
+# HF Spaces 기본 포트
+ENV PORT=7860
+WORKDIR /app
+# 시스템 패키지 (rdflib + sentence-transformers 빌드 의존)
+RUN apt-get update && apt-get install -y --no-install-recommends \
+    build-essential git curl \
+    && rm -rf /var/lib/apt/lists/*
+# Python 의존성 (캐시 효율화: requirements 먼저)
+COPY api/requirements.txt /app/api/requirements.txt
+RUN pip install --upgrade pip && pip install -r /app/api/requirements.txt
+# 코드 (rag_engine·semantic_search 등 active/code의 핵심 모듈)
+COPY code/ /app/code/
+# 백엔드
+COPY api/ /app/api/
+# 데이터
+COPY data/ /app/active/ontology/
+COPY assets/ /app/active/
+# React 빌드 결과 (Stage 1)
+COPY --from=web-build /web/dist /app/hf_app/web/dist
+# 디렉토리 구조 맞춤 (main.py가 active/ontology 등 상대경로 사용)
+RUN mkdir -p /app/active/code && cp -r /app/code/* /app/active/code/
+# KoSimCSE 모델 사전 다운로드 (런타임 cold start 단축)
+RUN python -c "from transformers import AutoModel, AutoTokenizer; \
+    AutoTokenizer.from_pretrained('BM-K/KoSimCSE-roberta'); \
+    AutoModel.from_pretrained('BM-K/KoSimCSE-roberta')" || true
+# HF Space 사용자 권한 (필수 — 1000)
+RUN useradd -m -u 1000 user && chown -R user /app
+USER user
+EXPOSE 7860
+# FastAPI 시작 — Dockerfile WORKDIR이 /app, main.py는 api/main.py
+WORKDIR /app/hf_app
+RUN ln -sf /app/api ./api
+WORKDIR /app
+CMD ["uvicorn", "api.main:app", "--host", "0.0.0.0", "--port", "7860"]

README.md ADDED Viewed

	@@ -0,0 +1,52 @@

+---
+title: LP출자 온톨로지 LLM 프로토타입
+emoji: 📊
+colorFrom: purple
+colorTo: indigo
+sdk: docker
+app_port: 7860
+pinned: false
+license: mit
+short_description: 온톨로지 기반 폐쇄망 RAG 시스템 (LP 출자 도메인)
+---
+# LP출자 온톨로지 LLM 적용 프로토타입 테스트
+사내 AI 경진대회 출품작 · 온톨로지 기반 폐쇄망 RAG 시스템.
+## 구조
+- `api/` — FastAPI 백엔드 (rag_engine + KoSimCSE + 4구성 호출 + LLM 어댑터)
+- `web/` — React + Vite 프론트엔드 (3탭: 설명/테스트/데이터 관리)
+- `code/` — `rag_engine.py`·`semantic_search.py`·`baseline_lib.py` 등 핵심 모듈 (active/code 사본)
+- `data/` — `investment_ontology_v1_10.ttl`·`regulations_chunks_v14.jsonl`·alias·lookup
+- `assets/` — paper_v5.pdf·노드 그래프 png 등 다운로드용 정적 자산
+- `Dockerfile` — multi-stage (Node 빌드 → Python 런타임)
+## 환경변수 (HF Space Secrets에 설정)
+| Key | 설명 |
+|---|---|
+| `ANTHROPIC_API_KEY` | Sonnet 4.6 호출용 (필수) |
+| `HF_TOKEN` | HF Inference API용 (Gemma 호출) |
+| `LLM_BACKEND` | `hf_inference` 권장 (또는 `ollama`/`transformers_local`) |
+| `HF_GEMMA_MODEL` | 기본: `google/gemma-4-E4B-it` (Gemma 4 E4B, multimodal, 128K context) |
+| `ANTHROPIC_MODEL` | 기본: `claude-sonnet-4-6` |
+## 로컬 개발
+```bash
+# 백엔드
+cd api && pip install -r requirements.txt
+uvicorn main:app --reload --port 8000
+# 프론트엔드 (별도 터미널)
+cd web && npm install && npm run dev
+# Vite dev 서버가 /api 호출을 :8000으로 프록시
+```
+## 핵심 결과 (페이퍼 기준)
+- **패러프레이즈 정답률 (lenient)**: 키워드 33% → axisB (LLM파서+KoSimCSE) **93~100%**
+- **Sonnet ≒ Gemma 4 e4b** 패러프레이즈 lenient 동등 → 폐쇄망 4B 정당성 입증
+- 30문항 × 8구성 × 3회 = 720 응답 + Sonnet judge 평가 (`results_v5_axisB/`)

api/llm_adapters.py ADDED Viewed

	@@ -0,0 +1,162 @@

+"""LLM 호출 추상화 — 환경에 따라 백엔드 전환.
+LLM_BACKEND 환경변수:
+  - ollama (default, 로컬 개발)
+  - hf_inference (HF Inference API, gemma-3-4b-it)
+  - transformers_local (HF Spaces ZeroGPU + transformers 직접 로드)
+"""
+from __future__ import annotations
+import os
+import time
+from typing import Optional
+LLM_BACKEND = os.environ.get("LLM_BACKEND", "ollama")
+GEMMA_MODEL_OLLAMA = os.environ.get("OLLAMA_MODEL", "gemma4:e4b")
+GEMMA_MODEL_HF = os.environ.get("HF_GEMMA_MODEL", "google/gemma-4-E4B-it")
+HF_TOKEN = os.environ.get("HF_TOKEN", "")
+# transformers_local backend cache
+_tx_model = None
+_tx_tokenizer = None
+def call_gemma(question: str, context: str, system: Optional[str] = None,
+               max_tokens: int = 1500, temperature: float = 0.3) -> tuple[str | None, bool, str]:
+    """Gemma 호출. (answer, success, info) 반환."""
+    sys_prompt = system or (
+        "당신은 한국 LP출자 도메인 전문 금융회사 직원의 보조 AI입니다. "
+        "아래 컨텍스트의 사실을 그대로 유지하면서 자연스러운 한국어로 답변을 다듬어 주세요. "
+        "사실을 추가하거나 추측하지 마세요. 제공된 정보만 사용하세요."
+    )
+    full_prompt = f"[컨텍스트]\n{context}\n\n[질문]\n{question}\n\n[답변]"
+    if LLM_BACKEND == "ollama":
+        return _call_ollama(sys_prompt, full_prompt, max_tokens, temperature)
+    elif LLM_BACKEND == "hf_inference":
+        return _call_hf_inference(sys_prompt, full_prompt, max_tokens, temperature)
+    elif LLM_BACKEND == "transformers_local":
+        return _call_transformers_local(sys_prompt, full_prompt, max_tokens, temperature)
+    else:
+        return None, False, f"unknown LLM_BACKEND: {LLM_BACKEND}"
+def call_gemma_intent_parser(question: str, system: str) -> tuple[str | None, bool]:
+    """LLM 의도 파서 — JSON 응답. (raw_text, success)."""
+    if LLM_BACKEND == "ollama":
+        try:
+            import requests
+            r = requests.post("http://localhost:11434/api/generate",
+                json={"model": GEMMA_MODEL_OLLAMA, "system": system, "prompt": question,
+                      "format": "json", "stream": False, "options": {"temperature": 0}},
+                timeout=60)
+            return r.json().get("response", ""), True
+        except Exception as e:
+            return None, False
+    elif LLM_BACKEND == "hf_inference":
+        try:
+            from huggingface_hub import InferenceClient
+            client = InferenceClient(model=GEMMA_MODEL_HF, token=HF_TOKEN)
+            resp = client.chat_completion(
+                messages=[{"role": "system", "content": system},
+                          {"role": "user", "content": question}],
+                max_tokens=200, temperature=0, response_format={"type": "json_object"},
+            )
+            return resp.choices[0].message.content, True
+        except Exception as e:
+            return None, False
+    elif LLM_BACKEND == "transformers_local":
+        # transformers 로컬 호출 (Spaces ZeroGPU)
+        try:
+            _ensure_tx_loaded()
+            messages = [{"role": "system", "content": system},
+                        {"role": "user", "content": question}]
+            return _generate_tx(messages, max_tokens=200, temperature=0), True
+        except Exception as e:
+            return None, False
+    return None, False
+# ----------------------------------------------------------
+# 백엔드별 구현
+# ----------------------------------------------------------
+def _call_ollama(system, prompt, max_tokens, temperature):
+    try:
+        import ollama
+    except ImportError:
+        return None, False, "ollama 패키지 미설치"
+    try:
+        start = time.time()
+        resp = ollama.chat(
+            model=GEMMA_MODEL_OLLAMA,
+            messages=[{"role": "system", "content": system},
+                      {"role": "user", "content": prompt}],
+            options={"num_predict": max_tokens, "temperature": temperature, "repeat_penalty": 1.15},
+        )
+        return resp["message"]["content"], True, f"elapsed={time.time()-start:.2f}s"
+    except Exception as e:
+        return None, False, f"{type(e).__name__}: {str(e)[:200]}"
+def _call_hf_inference(system, prompt, max_tokens, temperature):
+    try:
+        from huggingface_hub import InferenceClient
+    except ImportError:
+        return None, False, "huggingface_hub 패키지 미설치"
+    if not HF_TOKEN:
+        return None, False, "HF_TOKEN 환경변수 미설정"
+    try:
+        start = time.time()
+        client = InferenceClient(model=GEMMA_MODEL_HF, token=HF_TOKEN)
+        resp = client.chat_completion(
+            messages=[{"role": "system", "content": system},
+                      {"role": "user", "content": prompt}],
+            max_tokens=max_tokens, temperature=temperature,
+        )
+        return resp.choices[0].message.content, True, f"elapsed={time.time()-start:.2f}s"
+    except Exception as e:
+        return None, False, f"{type(e).__name__}: {str(e)[:200]}"
+def _ensure_tx_loaded():
+    """transformers 모델 lazy 로드 (Spaces ZeroGPU용)."""
+    global _tx_model, _tx_tokenizer
+    if _tx_model is not None:
+        return
+    from transformers import AutoTokenizer, AutoModelForCausalLM
+    import torch
+    _tx_tokenizer = AutoTokenizer.from_pretrained(GEMMA_MODEL_HF, token=HF_TOKEN or None)
+    _tx_model = AutoModelForCausalLM.from_pretrained(
+        GEMMA_MODEL_HF, torch_dtype=torch.bfloat16,
+        device_map="auto", token=HF_TOKEN or None,
+    )
+def _generate_tx(messages, max_tokens=1500, temperature=0.3):
+    import torch
+    inputs = _tx_tokenizer.apply_chat_template(
+        messages, return_tensors="pt", add_generation_prompt=True,
+    ).to(_tx_model.device)
+    with torch.no_grad():
+        out = _tx_model.generate(
+            inputs,
+            max_new_tokens=max_tokens,
+            temperature=temperature if temperature > 0 else None,
+            do_sample=temperature > 0,
+            pad_token_id=_tx_tokenizer.eos_token_id,
+        )
+    response = _tx_tokenizer.decode(out[0][inputs.shape[1]:], skip_special_tokens=True)
+    return response
+def _call_transformers_local(system, prompt, max_tokens, temperature):
+    """Spaces ZeroGPU에서 transformers 직접 추론. @spaces.GPU 데코레이터는 main.py에서 적용."""
+    try:
+        _ensure_tx_loaded()
+        start = time.time()
+        messages = [{"role": "system", "content": system},
+                    {"role": "user", "content": prompt}]
+        answer = _generate_tx(messages, max_tokens, temperature)
+        return answer, True, f"elapsed={time.time()-start:.2f}s"
+    except Exception as e:
+        return None, False, f"{type(e).__name__}: {str(e)[:200]}"

api/main.py ADDED Viewed

	@@ -0,0 +1,235 @@

+"""FastAPI 백엔드 — /api/ask 4구성 호출.
+루트 구조:
+  GET  /api/health                — 헬스체크
+  GET  /api/dataset/summary       — 데이터셋 메타 (검토건 표, GP 표)
+  POST /api/ask                   — 질문 → 3개 답변(Python/Sonnet/Gemma) + route
+  POST /api/register              — 사용자 등록 검토건 → 세션 내 그래프 merge
+  GET  /api/download/{type}       — paper/graph/ttl 정적 파일
+환경변수:
+  - LLM_BACKEND (ollama|hf_inference|transformers_local)
+  - ANTHROPIC_API_KEY
+  - HF_TOKEN
+  - HF_GEMMA_MODEL (default: google/gemma-3-4b-it)
+  - OLLAMA_MODEL (default: gemma4:e4b)
+"""
+from __future__ import annotations
+import os
+import sys
+import time
+from pathlib import Path
+from typing import Any, Dict, List, Optional
+from fastapi import FastAPI, HTTPException
+from fastapi.middleware.cors import CORSMiddleware
+from fastapi.responses import FileResponse, JSONResponse
+from pydantic import BaseModel
+# active/code 디렉토리를 path에 추가 (rag_engine·semantic_search 재사용)
+API_DIR = Path(__file__).resolve().parent
+HF_APP_DIR = API_DIR.parent
+ACTIVE_DIR = HF_APP_DIR.parent
+CODE_DIR = ACTIVE_DIR / "code"
+sys.path.insert(0, str(CODE_DIR))
+import rag_engine
+import semantic_search as ss
+import llm_adapters
+# 데이터 경로 (Docker에서는 COPY로 같이 들어옴)
+ONTOLOGY_DIR = ACTIVE_DIR / "ontology"
+PAPER_PATH = ACTIVE_DIR / "paper_v5.pdf"
+ONT_GRAPH_PNG = ACTIVE_DIR.parent.parent / "온톨로지" / "v08_ontology_graph.png"
+TTL_PATH = ONTOLOGY_DIR / "investment_ontology_v1_10.ttl"
+JSONL_PATH = ONTOLOGY_DIR / "regulations_chunks_v14.jsonl"
+ALIAS_PATH = ONTOLOGY_DIR / "alias_dictionary.json"
+LOOKUP_PATH = ONTOLOGY_DIR / "risk_weight_lookup.json"
+# ============================================================
+# 앱 + 데이터 로드
+# ============================================================
+app = FastAPI(title="LP출자 온톨로지 LLM 프로토타입 API", version="1.0")
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=["*"],  # 개발 편의. 운영 시 도메인 제한.
+    allow_credentials=True, allow_methods=["*"], allow_headers=["*"],
+)
+# 전역 데이터 (앱 시작 시 1회 로드)
+print(f"[startup] LLM_BACKEND = {llm_adapters.LLM_BACKEND}")
+print(f"[startup] 데이터 로드: {TTL_PATH}")
+GRAPH = rag_engine.load_ttl(TTL_PATH)
+CHUNKS = rag_engine.load_chunks(JSONL_PATH)
+ALIAS = rag_engine.load_alias(ALIAS_PATH)
+LOOKUP = rag_engine.load_lookup(LOOKUP_PATH)
+print(f"[startup] 트리플 {len(GRAPH):,}, 청크 {len(CHUNKS)}")
+print(f"[startup] KoSimCSE warm-up...")
+ss.warm_up(CHUNKS)
+print(f"[startup] ready")
+# ============================================================
+# 스키마
+# ============================================================
+class AskRequest(BaseModel):
+    question: str
+    mode: str = "axisB"  # "axisB" | "keyword"
+class AnswerCol(BaseModel):
+    answer: str
+    route: str
+    elapsed_sec: float = 0.0
+class AskResponse(BaseModel):
+    question: str
+    mode: str
+    route: str
+    python: AnswerCol  # raw 컨텍스트 (LLM 호출 없음)
+    sonnet: AnswerCol
+    gemma: AnswerCol
+# ============================================================
+# 엔드포인트
+# ============================================================
+@app.get("/api/health")
+def health():
+    return {
+        "ok": True,
+        "triples": len(GRAPH),
+        "chunks": len(CHUNKS),
+        "llm_backend": llm_adapters.LLM_BACKEND,
+    }
+@app.get("/api/dataset/summary")
+def dataset_summary():
+    """데이터셋 요약 — 검토건 표, GP 표."""
+    from rag_engine import (
+        query_all_investments_with_label, query_investment_branches,
+        query_investment_meta,
+    )
+    invs = query_all_investments_with_label(GRAPH)
+    fund_rows, gp_set = [], set()
+    for inv in invs:
+        if inv.get("n_branches", 0) == 0:
+            continue
+        meta = query_investment_meta(GRAPH, inv["iri"])
+        branches = query_investment_branches(GRAPH, inv["iri"])
+        amt = sum(int(float(b.get("amount", 0))) for b in branches) // 100000000
+        first_stage = branches[0].get("stage_label", "-") if branches else "-"
+        fund_rows.append({
+            "id": str(inv["iri"]).split("_")[-1],
+            "fund": inv["fund_label"][:25],
+            "amount_eok": amt,
+            "stage": first_stage,
+            "branches": len(branches),
+        })
+        if meta.get("gp_label"):
+            gp_set.add(meta["gp_label"])
+    return {
+        "funds": fund_rows,
+        "gps": [{"name": n, "id": f"gp-{i+1:03d}"} for i, n in enumerate(sorted(gp_set))],
+    }
+@app.post("/api/ask", response_model=AskResponse)
+def ask(req: AskRequest):
+    q = req.question.strip()
+    if not q:
+        raise HTTPException(400, "question is empty")
+    mode = req.mode if req.mode in ("axisB", "keyword") else "axisB"
+    # Python column: LLM 답변 생성 없이 raw 컨텍스트
+    try:
+        if mode == "axisB":
+            r_py = rag_engine.answer_question_llm(
+                q, GRAPH, CHUNKS, ALIAS, LOOKUP,
+                use_anthropic=True, use_gemma_gen=False, use_semantic=True,
+            )
+        else:
+            r_py = rag_engine.answer_question(
+                q, GRAPH, CHUNKS, ALIAS, LOOKUP, use_gemma=False,
+            )
+    except Exception as e:
+        r_py = {"answer": f"오류: {e}", "route": "error"}
+    route_str = r_py.get("route", "")
+    # Sonnet column
+    if os.environ.get("ANTHROPIC_API_KEY"):
+        r_son = _call_sonnet(q, r_py.get("answer", ""))
+    else:
+        r_son = AnswerCol(answer="⚠️ ANTHROPIC_API_KEY 미설정", route="no_api", elapsed_sec=0)
+    # Gemma column
+    r_gem = _call_gemma_col(q, r_py.get("answer", ""))
+    return AskResponse(
+        question=q, mode=mode, route=route_str,
+        python=AnswerCol(answer=r_py.get("answer", ""), route=route_str, elapsed_sec=0.0),
+        sonnet=r_son,
+        gemma=r_gem,
+    )
+@app.get("/api/download/{kind}")
+def download(kind: str):
+    path_map = {
+        "paper": (PAPER_PATH, "LP출자_온톨로지_RAG_paper.pdf", "application/pdf"),
+        "graph": (ONT_GRAPH_PNG, "ontology_graph.png", "image/png"),
+        "ttl": (TTL_PATH, "investment_ontology_v1_10.ttl", "text/turtle"),
+    }
+    if kind not in path_map:
+        raise HTTPException(404, f"unknown kind: {kind}")
+    path, filename, media_type = path_map[kind]
+    if not path.exists():
+        raise HTTPException(404, f"file not found: {path}")
+    return FileResponse(str(path), filename=filename, media_type=media_type)
+# ============================================================
+# 내부 헬퍼
+# ============================================================
+def _call_sonnet(question: str, context: str) -> AnswerCol:
+    import anthropic
+    start = time.time()
+    try:
+        client = anthropic.Anthropic(api_key=os.environ["ANTHROPIC_API_KEY"])
+        system = (
+            "당신은 한국 LP출자 도메인 전문 금융회사 직원의 보조 AI입니다. "
+            "아래 컨텍스트의 사실을 그대로 유지하면서 자연스러운 한국어로 답변을 다듬어 주세요."
+        )
+        resp = client.messages.create(
+            model=os.environ.get("ANTHROPIC_MODEL", "claude-sonnet-4-6"),
+            max_tokens=1500, temperature=0.3, system=system,
+            messages=[{"role": "user", "content": f"[컨텍스트]\n{context}\n\n[질문]\n{question}\n\n[답변]"}],
+        )
+        text = "".join(b.text for b in resp.content if hasattr(b, "text"))
+        return AnswerCol(answer=text, route="sonnet", elapsed_sec=time.time() - start)
+    except Exception as e:
+        return AnswerCol(answer=f"Sonnet 오류: {e}", route="error", elapsed_sec=time.time() - start)
+def _call_gemma_col(question: str, context: str) -> AnswerCol:
+    start = time.time()
+    answer, ok, info = llm_adapters.call_gemma(question, context)
+    if ok:
+        return AnswerCol(answer=answer, route="gemma", elapsed_sec=time.time() - start)
+    return AnswerCol(answer=f"Gemma 오류: {info}", route="error", elapsed_sec=time.time() - start)
+# ============================================================
+# 정적 파일 — React 빌드 결과
+# ============================================================
+WEB_DIST = HF_APP_DIR / "web" / "dist"
+if WEB_DIST.exists():
+    from fastapi.staticfiles import StaticFiles
+    app.mount("/", StaticFiles(directory=str(WEB_DIST), html=True), name="web")

api/requirements.txt ADDED Viewed

	@@ -0,0 +1,20 @@

+fastapi==0.115.6
+uvicorn[standard]==0.32.1
+pydantic==2.10.4
+python-multipart==0.0.20
+# 기존 백엔드 의존성 (rag_engine, semantic_search)
+rdflib==7.1.1
+sentence-transformers==5.1.2
+transformers==4.57.6
+torch==2.8.0
+numpy
+# LLM 호출
+anthropic==0.40.0
+huggingface_hub==0.36.2
+requests
+ollama==0.4.4
+# Spaces ZeroGPU
+spaces

code/baseline_lib.py ADDED Viewed

	@@ -0,0 +1,792 @@

+"""
+baseline_lib.py
+================
+4가지 베이스라인 구성을 함수로 추상화한 라이브러리.
+구성:
+1. config_1_open_ontology_rag: Gemma 4 e4b + 온톨로지(SPARQL) + RAG + Lookup (= v5 시스템 그대로)
+2. config_2_open_rag_only:     Gemma 4 e4b + TTL 텍스트 + RAG (라우팅 X, lookup X)
+3. config_3_frontier_ontology_rag: Claude Sonnet 4.6 + 온톨로지(SPARQL) + RAG + Lookup
+4. config_4_frontier_rag_only: Claude Sonnet 4.6 + TTL 텍스트 + RAG
+모든 구성은 동일한 인터페이스 ask(question) → dict 를 가진다.
+"""
+import json
+import os
+import time
+from pathlib import Path
+from typing import Optional
+# ============================================
+# 환경변수 / 모델명
+# ============================================
+OLLAMA_MODEL = os.environ.get("OLLAMA_MODEL", "gemma4:e4b")
+ANTHROPIC_MODEL = os.environ.get("ANTHROPIC_MODEL", "claude-sonnet-4-6")
+ANTHROPIC_API_KEY = os.environ.get("ANTHROPIC_API_KEY", "")
+# ============================================
+# 데이터 로드 (캐시)
+# ============================================
+_data_cache = {}
+def load_data(data_dir):
+    """데이터 한 번만 로드해서 캐시"""
+    data_dir = Path(data_dir)
+    if str(data_dir) in _data_cache:
+        return _data_cache[str(data_dir)]
+    # rag_engine 모듈 활용 (같은 폴더에 있어야 함)
+    import sys
+    streamlit_app_dir = data_dir.parent
+    if str(streamlit_app_dir) not in sys.path:
+        sys.path.insert(0, str(streamlit_app_dir))
+    import rag_engine
+    g = rag_engine.load_ttl(data_dir / "investment_ontology_v1_10.ttl")
+    chunks = rag_engine.load_chunks(data_dir / "regulations_chunks_v14.jsonl")
+    alias = rag_engine.load_alias(data_dir / "alias_dictionary.json")
+    lookup = rag_engine.load_lookup(data_dir / "risk_weight_lookup.json")
+    _data_cache[str(data_dir)] = {
+        "g": g, "chunks": chunks, "alias": alias, "lookup": lookup,
+        "rag_engine": rag_engine,
+    }
+    return _data_cache[str(data_dir)]
+# ============================================
+# TTL → 자연어 텍스트 변환 (RAG only 구성용)
+# ============================================
+_ttl_text_cache = None
+def get_ttl_as_text(g):
+    """
+    TTL 그래프를 자연어 텍스트로 변환.
+    RAG only 구성에서 LLM 컨텍스트로 주입할 형태.
+    크기 제약: 약 8,000~12,000 토큰 (한국어 기준 ~16,000~24,000자) 이내.
+    """
+    global _ttl_text_cache
+    if _ttl_text_cache is not None:
+        return _ttl_text_cache
+    sections = []
+    # 섹션 1: 모든 검토건과 분기 (가장 중요)
+    sections.append("## 검토건 및 분기 정보\n")
+    sections.append("본 시스템에 등록된 가상 검토건은 다음과 같다:\n")
+    q = """
+    PREFIX inv: <http://company.com/investment-ontology#>
+    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
+    SELECT ?inv ?invLabel ?branchLabel ?productLabel ?amount ?stageLabel ?stateLabel ?stateOrder WHERE {
+      ?inv a inv:Investment ;
+           rdfs:label ?invLabel ;
+           inv:hasBranch ?branch .
+      ?branch rdfs:label ?branchLabel ;
+              inv:hasProductType ?product ;
+              inv:hasInvestmentAmount ?amount ;
+              inv:hasCurrentStage ?stage ;
+              inv:hasBranchState ?state .
+      ?product rdfs:label ?productLabel .
+      ?stage rdfs:label ?stageLabel .
+      ?state rdfs:label ?stateLabel ;
+             inv:hasStateOrder ?stateOrder .
+      FILTER(LANG(?invLabel)="ko")
+      FILTER(LANG(?branchLabel)="ko")
+      FILTER(LANG(?productLabel)="ko")
+      FILTER(LANG(?stageLabel)="ko")
+      FILTER(LANG(?stateLabel)="ko")
+    } ORDER BY ?inv ?branchLabel
+    """
+    current_inv = None
+    for row in g.query(q):
+        inv_id = str(row.inv).split("#")[-1]
+        if inv_id != current_inv:
+            current_inv = inv_id
+            sections.append(f"\n**{row.invLabel}** ({inv_id}):")
+        amount_eok = int(float(str(row.amount))) // 100000000
+        sections.append(
+            f"  - {row.branchLabel}: 상품={row.productLabel}, 금액={amount_eok}억, "
+            f"단계={row.stageLabel}, 상태={row.stateLabel} (state_order={row.stateOrder})"
+        )
+    # 섹션 2: 분류 원칙 (ClassificationPrinciple)
+    sections.append("\n## 도메인 분류 원칙 (ClassificationPrinciple)\n")
+    q2 = """
+    PREFIX inv: <http://company.com/investment-ontology#>
+    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
+    PREFIX owl: <http://www.w3.org/2002/07/owl#>
+    SELECT ?p ?label ?comment WHERE {
+      ?p a inv:ClassificationPrinciple ;
+         rdfs:label ?label .
+      OPTIONAL { ?p rdfs:comment ?comment . FILTER(LANG(?comment)="ko") }
+      FILTER(LANG(?label)="ko")
+    }
+    """
+    for row in g.query(q2):
+        sections.append(f"- **{row.label}**")
+        if row.comment:
+            sections.append(f"  - 설명: {row.comment}")
+    # 섹션 3: 주요 클래스 정의 (간단히)
+    sections.append("\n## 주요 클래스 정의\n")
+    important_classes = [
+        "Investment", "InvestmentBranch", "BusinessProcess", "BranchState",
+        "Counterparty", "GP", "RecipientFund", "PortfolioCompany",
+        "RegulatoryClause", "RegulatoryConcept", "ClassificationPrinciple",
+    ]
+    for cls in important_classes:
+        q3 = f"""
+        PREFIX inv: <http://company.com/investment-ontology#>
+        PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
+        SELECT ?label ?comment WHERE {{
+          inv:{cls} rdfs:label ?label .
+          OPTIONAL {{ inv:{cls} rdfs:comment ?comment . FILTER(LANG(?comment)="ko") }}
+          FILTER(LANG(?label)="ko")
+        }}
+        """
+        for row in g.query(q3):
+            line = f"- **{cls}** ({row.label})"
+            if row.comment:
+                line += f": {str(row.comment)[:200]}"
+            sections.append(line)
+    # 섹션 4: BranchState 인스턴스 (state_order 포함)
+    sections.append("\n## 브랜치 상태(BranchState) 정의 및 순서\n")
+    q4 = """
+    PREFIX inv: <http://company.com/investment-ontology#>
+    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
+    SELECT ?s ?label ?order WHERE {
+      ?s a inv:BranchState ;
+         rdfs:label ?label ;
+         inv:hasStateOrder ?order .
+      FILTER(LANG(?label)="ko")
+    } ORDER BY ?order
+    """
+    for row in g.query(q4):
+        s_id = str(row.s).split("#")[-1]
+        sections.append(f"- {s_id} ({row.label}): state_order={row.order}")
+    text = "\n".join(sections)
+    _ttl_text_cache = text
+    return text
+# ============================================
+# 정제된 RAG 청크 검색 (RAG only 구성용)
+# ============================================
+def search_chunks_for_rag_only(chunks, question, top_k=5):
+    """
+    RAG only 구성에서 사용할 청크 검색.
+    키워드 매칭 기반.
+    """
+    # 한국어 단어 추출 (2자 이상)
+    import re
+    keywords = re.findall(r'[가-힣A-Za-z0-9]{2,}', question)
+    keywords = [k for k in keywords if len(k) >= 2]
+    scored = []
+    for c in chunks:
+        text = c.get("text", "")
+        score = 0
+        for kw in keywords:
+            score += text.count(kw)
+        # concept 매칭도 가중치
+        meta = c.get("metadata", {})
+        concepts = meta.get("regulatory_concepts", [])
+        for concept_id in concepts:
+            if any(kw in concept_id for kw in keywords):
+                score += 5
+        if score > 0:
+            scored.append((score, c))
+    scored.sort(key=lambda x: x[0], reverse=True)
+    return [c for _, c in scored[:top_k]]
+# ============================================
+# LLM 호출 함수 (오픈/프론티어)
+# ============================================
+def call_open_llm(question, context, system_prompt=None, model_name=None, timeout=180):
+    """
+    Ollama (Gemma 4 e4b) 호출.
+    실패 시 (None, False, error_msg) 반환.
+    """
+    if model_name is None:
+        model_name = OLLAMA_MODEL
+    try:
+        import ollama
+    except ImportError:
+        return None, False, "ollama 패키지 미설치"
+    if system_prompt is None:
+        system_prompt = (
+            "당신은 한국 LP출자 도메인 전문 금융회사 직원의 보조 AI입니다. "
+            "아래 컨텍스트의 정보만 사용하여 답변하세요. "
+            "컨텍스트에 없는 내용은 추측하지 말고, 모르면 모른다고 답하세요. "
+            "한국어 격식체로 간결하게 답변하세요."
+        )
+    full_prompt = f"[컨텍스트]\n{context}\n\n[질문]\n{question}\n\n[답변]"
+    try:
+        start = time.time()
+        resp = ollama.chat(
+            model=model_name,
+            messages=[
+                {"role": "system", "content": system_prompt},
+                {"role": "user", "content": full_prompt},
+            ],
+            options={"num_predict": 1500, "temperature": 0.3, "repeat_penalty": 1.15},
+        )
+        elapsed = time.time() - start
+        return resp["message"]["content"], True, f"elapsed={elapsed:.2f}s"
+    except Exception as e:
+        return None, False, f"{type(e).__name__}: {str(e)[:200]}"
+def call_frontier_llm(question, context, system_prompt=None, model_name=None, timeout=120):
+    """
+    Anthropic Claude API (Sonnet 4.6) 호출.
+    실패 시 (None, False, error_msg) 반환.
+    """
+    if model_name is None:
+        model_name = ANTHROPIC_MODEL
+    if not ANTHROPIC_API_KEY:
+        return None, False, "ANTHROPIC_API_KEY 환경변수 미설정"
+    try:
+        import anthropic
+    except ImportError:
+        return None, False, "anthropic 패키지 미설치"
+    client = anthropic.Anthropic(api_key=ANTHROPIC_API_KEY)
+    if system_prompt is None:
+        system_prompt = (
+            "당신은 한국 LP출자 도메인 전문 금융회사 직원의 보조 AI입니다. "
+            "아래 컨텍스트의 정보만 사용하여 답변하세요. "
+            "컨텍스트에 없는 내용은 추측하지 말고, 모르면 모른다고 답하세요. "
+            "한국어 격식체로 간결하게 답변하세요."
+        )
+    full_prompt = f"[컨텍스트]\n{context}\n\n[질문]\n{question}\n\n[답변]"
+    try:
+        start = time.time()
+        resp = client.messages.create(
+            model=model_name,
+            max_tokens=1500,
+            temperature=0.3,
+            system=system_prompt,
+            messages=[
+                {"role": "user", "content": full_prompt},
+            ],
+        )
+        elapsed = time.time() - start
+        # Claude 응답은 content 배열
+        text = ""
+        for block in resp.content:
+            if hasattr(block, "text"):
+                text += block.text
+        return text, True, f"elapsed={elapsed:.2f}s"
+    except Exception as e:
+        return None, False, f"{type(e).__name__}: {str(e)[:200]}"
+# ============================================
+# 4가지 구성
+# ============================================
+def config_1_open_ontology_rag(question, data, **kwargs):
+    """
+    구성 1: Gemma 4 e4b + 온톨로지(SPARQL) + RAG + Lookup
+    = v5 시스템 그대로 활용 (rag_engine.answer_question)
+    """
+    rag_engine = data["rag_engine"]
+    g = data["g"]
+    chunks = data["chunks"]
+    alias = data["alias"]
+    lookup = data["lookup"]
+    start = time.time()
+    try:
+        result = rag_engine.answer_question(
+            question, g, chunks, alias, lookup,
+            user_instances=None,
+            use_gemma=True,
+            model_name=OLLAMA_MODEL,
+        )
+        elapsed = time.time() - start
+        return {
+            "answer": result["answer"],
+            "route": result["route"],
+            "context_summary": result["context_summary"],
+            "elapsed_sec": elapsed,
+            "success": True,
+            "error": "",
+        }
+    except Exception as e:
+        return {
+            "answer": "",
+            "route": "error",
+            "context_summary": "",
+            "elapsed_sec": time.time() - start,
+            "success": False,
+            "error": f"{type(e).__name__}: {str(e)[:300]}",
+        }
+def config_2_open_rag_only(question, data, **kwargs):
+    """
+    구성 2: Gemma 4 e4b + TTL 텍스트 + RAG (라우팅 X, lookup X)
+    """
+    g = data["g"]
+    chunks = data["chunks"]
+    # 컨텍스트 구성
+    ttl_text = get_ttl_as_text(g)
+    relevant_chunks = search_chunks_for_rag_only(chunks, question, top_k=5)
+    chunk_context = "\n\n".join([
+        f"[규제 청크 {i+1}] {c.get('id', '')}\n{c.get('text', '')[:1500]}"
+        for i, c in enumerate(relevant_chunks)
+    ])
+    full_context = (
+        f"# 도메인 온톨로지 (텍스트 형식)\n\n{ttl_text}\n\n"
+        f"---\n\n# 관련 규제 청크\n\n{chunk_context}"
+    )
+    start = time.time()
+    answer, ok, info = call_open_llm(question, full_context)
+    elapsed = time.time() - start
+    if ok:
+        return {
+            "answer": answer,
+            "route": "rag_only_open",
+            "context_summary": f"TTL 텍스트 + {len(relevant_chunks)}개 청크",
+            "elapsed_sec": elapsed,
+            "success": True,
+            "error": "",
+        }
+    else:
+        return {
+            "answer": "",
+            "route": "error",
+            "context_summary": "",
+            "elapsed_sec": elapsed,
+            "success": False,
+            "error": info,
+        }
+def config_3_frontier_ontology_rag(question, data, **kwargs):
+    """
+    구성 3: Claude Sonnet 4.6 + 온톨로지(SPARQL) + RAG + Lookup
+    v5 시스템의 라우팅·SPARQL·lookup은 그대로 사용하되,
+    Gemma 호출 부분만 Claude API로 교체.
+    """
+    rag_engine = data["rag_engine"]
+    g = data["g"]
+    chunks = data["chunks"]
+    alias = data["alias"]
+    lookup = data["lookup"]
+    start = time.time()
+    try:
+        # v5 라우팅을 그대로 따라가되, LLM 호출은 Claude로
+        # 라우팅 결정만 받기 위해 use_gemma=False로 호출 후, LLM 필요한 경우 직접 처리
+        # 단, Q9 (deterministic_lookup)이나 Q1~Q5 (template) 은 LLM 호출 없으므로 그대로 사용
+        # 먼저 use_gemma=False로 호출 → 라우팅 결과 + (LLM이 필요했다면) raw 컨텍스트 받기
+        result_no_llm = rag_engine.answer_question(
+            question, g, chunks, alias, lookup,
+            user_instances=None,
+            use_gemma=False,
+        )
+        route = result_no_llm["route"]
+        # 라우팅별 처리
+        # - investment_status, stage_threshold, review_stalled, deterministic_lookup, lookup_table_overview, guidance:
+        #   LLM 호출 없는 라우팅 → 그대로 반환
+        # - instance_with_concept, rag_concept:
+        #   LLM 호출 필요 → Claude로 다시 호출
+        no_llm_routes = ("investment_status", "stage_threshold", "review_stalled",
+                         "deterministic_lookup", "lookup_table_overview", "guidance",
+                         "rag_concept_no_match", "system_notification")
+        if any(r in route for r in no_llm_routes):
+            # LLM 안 쓰는 라우팅 → 결과 그대로
+            return {
+                "answer": result_no_llm["answer"],
+                "route": route + " (no_llm)",
+                "context_summary": result_no_llm["context_summary"],
+                "elapsed_sec": time.time() - start,
+                "success": True,
+                "error": "",
+            }
+        # LLM 필요한 라우팅 → 컨텍스트 재구성 후 Claude 호출
+        # rag_engine 내부 로직 일부 재현해야 함
+        # 인스턴스 매칭 시도 (instance_with_concept인 경우)
+        # 또는 단순 RAG 검색 (rag_concept인 경우)
+        concept_id = rag_engine.detect_concept_from_question(question)
+        if concept_id:
+            # 펀드명 매칭 시도
+            import re
+            GENERIC_WORDS = {
+                "검토", "검토건", "단계", "진행", "어디", "상태", "약정", "출자",
+                "어떻게", "지금", "현재", "이후", "정체", "관리", "신청", "등록",
+                "펀드", "투자", "금융", "규제", "조항", "법령",
+                "RWA", "rwa", "위험가중치", "익스포져", "lp출자", "LP출자",
+            }
+            matched_inv = None
+            all_invs = rag_engine.query_all_investments_with_label(g)
+            for inv in all_invs:
+                if inv.get("n_branches", 0) == 0:
+                    continue
+                label_words = re.findall(r"[가-힣A-Za-z0-9]{2,}", inv["label"] + " " + inv["fund_label"])
+                distinctive = [w for w in label_words if w not in GENERIC_WORDS]
+                for word in distinctive:
+                    if len(word) >= 2 and word in question:
+                        matched_inv = inv["iri"]
+                        break
+                if matched_inv:
+                    break
+            prefer_summary = (concept_id == "Concept_RWA_Calculation")
+            relevant_chunks = rag_engine.search_chunks_by_concept(
+                chunks, concept_id, top_k=3, prefer_summary=prefer_summary
+            )
+            if matched_inv:
+                meta = rag_engine.query_investment_meta(g, matched_inv)
+                branches = rag_engine.query_investment_branches(g, matched_inv)
+                instance_context = rag_engine.template_investment_status(meta, branches)
+                chunk_context = "\n\n".join([
+                    f"[규제 근거 {i+1}] {c.get('id', '')}\n{c.get('text', '')[:1500]}"
+                    for i, c in enumerate(relevant_chunks)
+                ])
+                full_context = f"{instance_context}\n\n---\n\n[관련 규제 근거]\n{chunk_context}"
+            else:
+                chunk_context = "\n\n".join([
+                    f"[근거 {i+1}] {c.get('id', '')}\n{c.get('text', '')[:1500]}"
+                    for i, c in enumerate(relevant_chunks)
+                ])
+                full_context = chunk_context
+            answer, ok, info = call_frontier_llm(question, full_context)
+            elapsed = time.time() - start
+            if ok:
+                return {
+                    "answer": answer,
+                    "route": route + " (frontier_llm)",
+                    "context_summary": f"{result_no_llm['context_summary']} + Frontier LLM 다듬기",
+                    "elapsed_sec": elapsed,
+                    "success": True,
+                    "error": "",
+                }
+            else:
+                return {
+                    "answer": "",
+                    "route": "error",
+                    "context_summary": "",
+                    "elapsed_sec": elapsed,
+                    "success": False,
+                    "error": info,
+                }
+        # concept 못 찾았는데 LLM 라우팅이었다면 — fallback
+        return {
+            "answer": result_no_llm["answer"],
+            "route": route + " (no_llm_fallback)",
+            "context_summary": result_no_llm["context_summary"],
+            "elapsed_sec": time.time() - start,
+            "success": True,
+            "error": "",
+        }
+    except Exception as e:
+        return {
+            "answer": "",
+            "route": "error",
+            "context_summary": "",
+            "elapsed_sec": time.time() - start,
+            "success": False,
+            "error": f"{type(e).__name__}: {str(e)[:300]}",
+        }
+def _axisB_rag_only_context(g, chunks, question, top_k=5):
+    """RAG-only 구성용 axisB 컨텍스트: TTL 텍스트 + KoSimCSE 청크 의미검색."""
+    ttl_text = get_ttl_as_text(g)
+    try:
+        import semantic_search as ss
+        sem_chunks = ss.search_chunks_semantic(chunks, question, top_k=top_k, min_score=0.30)
+    except Exception:
+        # 의미검색 실패(import 실패 등) 시 키워드 fallback
+        sem_chunks = search_chunks_for_rag_only(chunks, question, top_k=top_k)
+    chunk_context = "\n\n".join([
+        f"[규제 청크 {i+1}] {c.get('id', '')}\n{c.get('text', '')[:1500]}"
+        for i, c in enumerate(sem_chunks)
+    ])
+    return (
+        f"# 도메인 온톨로지 (텍스트 형식)\n\n{ttl_text}\n\n"
+        f"---\n\n# 관련 규제 청크 (KoSimCSE 의미검색)\n\n{chunk_context}"
+    ), len(sem_chunks)
+def config_1_axisB(question, data, **kwargs):
+    """구성 1 axisB: Gemma + 온톨로지 + LLM 의도파서 + KoSimCSE 의미검색.
+    answer_question_llm(use_anthropic=False, use_semantic=True) 호출.
+    """
+    rag_engine = data["rag_engine"]
+    g, chunks, alias, lookup = data["g"], data["chunks"], data["alias"], data["lookup"]
+    # 임베딩 캐시 미리 (첫 호출 지연 분산)
+    try:
+        import semantic_search as ss; ss.warm_up(chunks)
+    except Exception:
+        pass
+    start = time.time()
+    try:
+        result = rag_engine.answer_question_llm(
+            question, g, chunks, alias, lookup,
+            model_name=OLLAMA_MODEL,
+            use_anthropic=False, use_gemma_gen=True, use_semantic=True,
+        )
+        return {
+            "answer": result["answer"], "route": result["route"],
+            "context_summary": result["context_summary"],
+            "elapsed_sec": time.time() - start, "success": True, "error": "",
+        }
+    except Exception as e:
+        return {"answer": "", "route": "error", "context_summary": "",
+                "elapsed_sec": time.time() - start, "success": False,
+                "error": f"{type(e).__name__}: {str(e)[:300]}"}
+def config_2_axisB(question, data, **kwargs):
+    """구성 2 axisB: Gemma + RAG only + KoSimCSE 청크 의미검색 (LLM 파서는 라우팅 없으므로 미적용)."""
+    g, chunks = data["g"], data["chunks"]
+    full_context, n_chunks = _axisB_rag_only_context(g, chunks, question, top_k=5)
+    start = time.time()
+    answer, ok, info = call_open_llm(question, full_context)
+    elapsed = time.time() - start
+    if ok:
+        return {"answer": answer, "route": "rag_only_open_axisB",
+                "context_summary": f"TTL 텍스트 + {n_chunks}개 청크(KoSimCSE)",
+                "elapsed_sec": elapsed, "success": True, "error": ""}
+    return {"answer": "", "route": "error", "context_summary": "",
+            "elapsed_sec": elapsed, "success": False, "error": info}
+def config_3_axisB(question, data, **kwargs):
+    """구성 3 axisB: Sonnet + 온톨로지 + LLM 의도파서 + KoSimCSE.
+    answer_question_llm은 LLM 파서/생성 둘 다 같은 모델 가정 → use_anthropic=True로 Sonnet.
+    답변 생성도 Sonnet로 통일하기 위해, use_gemma_gen=False + 후처리로 Sonnet 호출.
+    """
+    rag_engine = data["rag_engine"]
+    g, chunks, alias, lookup = data["g"], data["chunks"], data["alias"], data["lookup"]
+    try:
+        import semantic_search as ss; ss.warm_up(chunks)
+    except Exception:
+        pass
+    start = time.time()
+    try:
+        # 파서·라우팅까지 Sonnet으로. answer_question_llm은 답변 생성이 use_gemma_gen 플래그.
+        # Sonnet 생성으로 통일하려면 use_gemma_gen=False로 raw 컨텍스트 받고 call_frontier_llm.
+        # 단 answer_question_llm는 use_gemma_gen=False 시 raw 텍스트 답변(템플릿 그대로) 반환 → 그걸 그대로 쓰거나 후처리.
+        # 여기선 단순화: use_gemma_gen=True 의미는 "온톨로지 라우트에서 LLM 다듬기"인데 Sonnet 통일을 위해
+        # 1차로 use_gemma_gen=False 호출, 2차로 rag_concept 류이면 컨텍스트만 잡아 Sonnet 호출.
+        result = rag_engine.answer_question_llm(
+            question, g, chunks, alias, lookup,
+            model_name=OLLAMA_MODEL,  # 안 쓰임(파서가 use_anthropic=True)
+            use_anthropic=True, use_gemma_gen=False, use_semantic=True,
+        )
+        route = result.get("route", "")
+        # Sonnet 답변 생성이 필요한 라우트 (LLM 다듬기 필요)
+        llm_needed_routes = ("rag_concept_semantic", "instance_with_concept", "rag_concept ")
+        if any(rt in route for rt in llm_needed_routes):
+            # raw 답변(=청크/컨텍스트 나열)을 Sonnet에게 다듬게 함
+            raw_ctx = result["answer"]
+            answer, ok, info = call_frontier_llm(question, raw_ctx)
+            if ok:
+                return {"answer": answer, "route": route + " (frontier_llm)",
+                        "context_summary": result["context_summary"] + " + Sonnet 다듬기",
+                        "elapsed_sec": time.time() - start, "success": True, "error": ""}
+            return {"answer": "", "route": "error", "context_summary": "",
+                    "elapsed_sec": time.time() - start, "success": False, "error": info}
+        # 그 외(템플릿 라우트, deterministic_lookup 등) — 답변이 이미 결정적이라 LLM 다듬기 불필요
+        return {"answer": result["answer"], "route": route + " (no_llm)",
+                "context_summary": result["context_summary"],
+                "elapsed_sec": time.time() - start, "success": True, "error": ""}
+    except Exception as e:
+        return {"answer": "", "route": "error", "context_summary": "",
+                "elapsed_sec": time.time() - start, "success": False,
+                "error": f"{type(e).__name__}: {str(e)[:300]}"}
+def config_4_axisB(question, data, **kwargs):
+    """구성 4 axisB: Sonnet + RAG only + KoSimCSE 청크 의미검색."""
+    g, chunks = data["g"], data["chunks"]
+    full_context, n_chunks = _axisB_rag_only_context(g, chunks, question, top_k=5)
+    start = time.time()
+    answer, ok, info = call_frontier_llm(question, full_context)
+    elapsed = time.time() - start
+    if ok:
+        return {"answer": answer, "route": "rag_only_frontier_axisB",
+                "context_summary": f"TTL 텍스트 + {n_chunks}개 청크(KoSimCSE)",
+                "elapsed_sec": elapsed, "success": True, "error": ""}
+    return {"answer": "", "route": "error", "context_summary": "",
+            "elapsed_sec": elapsed, "success": False, "error": info}
+def config_4_frontier_rag_only(question, data, **kwargs):
+    """
+    구성 4: Claude Sonnet 4.6 + TTL 텍스트 + RAG (라우팅 X, lookup X)
+    """
+    g = data["g"]
+    chunks = data["chunks"]
+    ttl_text = get_ttl_as_text(g)
+    relevant_chunks = search_chunks_for_rag_only(chunks, question, top_k=5)
+    chunk_context = "\n\n".join([
+        f"[규제 청크 {i+1}] {c.get('id', '')}\n{c.get('text', '')[:1500]}"
+        for i, c in enumerate(relevant_chunks)
+    ])
+    full_context = (
+        f"# 도메인 온톨로지 (텍스트 형식)\n\n{ttl_text}\n\n"
+        f"---\n\n# 관련 규제 청크\n\n{chunk_context}"
+    )
+    start = time.time()
+    answer, ok, info = call_frontier_llm(question, full_context)
+    elapsed = time.time() - start
+    if ok:
+        return {
+            "answer": answer,
+            "route": "rag_only_frontier",
+            "context_summary": f"TTL 텍스트 + {len(relevant_chunks)}개 청크",
+            "elapsed_sec": elapsed,
+            "success": True,
+            "error": "",
+        }
+    else:
+        return {
+            "answer": "",
+            "route": "error",
+            "context_summary": "",
+            "elapsed_sec": elapsed,
+            "success": False,
+            "error": info,
+        }
+# ============================================
+# 자동 측정 (응답 텍스트 분석)
+# ============================================
+def measure_response(answer):
+    """답변에서 자동 측정 가능한 지표 추출"""
+    if not answer:
+        return {
+            "answer_chars": 0,
+            "markdown_bold_count": 0,
+            "emoji_count": 0,
+            "has_disclaimer": False,
+        }
+    # 마크다운 강조 횟수 (** 쌍)
+    bold_count = answer.count("**") // 2
+    # 이모지 개수 (간단 추정 — 한국어/영문/숫자 외 비ASCII 문자)
+    emoji_count = sum(1 for c in answer if ord(c) > 0x2600 and ord(c) < 0x1FFFF)
+    # 면책/모름 표현
+    disclaimers = ["모르겠", "확실하지 않", "정보가 없", "찾을 수 없", "답변하기 어려",
+                   "추측", "가정", "정확한 정보가"]
+    has_disclaimer = any(d in answer for d in disclaimers)
+    return {
+        "answer_chars": len(answer),
+        "markdown_bold_count": bold_count,
+        "emoji_count": emoji_count,
+        "has_disclaimer": has_disclaimer,
+    }
+# ============================================
+# 구성 레지스트리
+# ============================================
+CONFIGS = {
+    "config_1_open_ontology_rag": {
+        "name": "오픈 LLM + 온톨로지 + RAG (키워드 라우터)",
+        "fn": config_1_open_ontology_rag, "llm": "open", "mode": "keyword",
+    },
+    "config_2_open_rag_only": {
+        "name": "오픈 LLM + RAG only (키워드 검색)",
+        "fn": config_2_open_rag_only, "llm": "open", "mode": "keyword",
+    },
+    "config_3_frontier_ontology_rag": {
+        "name": "프론티어 LLM + 온톨로지 + RAG (키워드 라우터)",
+        "fn": config_3_frontier_ontology_rag, "llm": "frontier", "mode": "keyword",
+    },
+    "config_4_frontier_rag_only": {
+        "name": "프론티어 LLM + RAG only (키워드 검색)",
+        "fn": config_4_frontier_rag_only, "llm": "frontier", "mode": "keyword",
+    },
+    # === 축 B: LLM 의도파서 + KoSimCSE 의미검색 ===
+    "config_1_axisB": {
+        "name": "오픈 LLM + 온톨로지 + LLM파서 + KoSimCSE",
+        "fn": config_1_axisB, "llm": "open", "mode": "axisB",
+    },
+    "config_2_axisB": {
+        "name": "오픈 LLM + RAG only + KoSimCSE 청크검색",
+        "fn": config_2_axisB, "llm": "open", "mode": "axisB",
+    },
+    "config_3_axisB": {
+        "name": "프론티어 LLM + 온톨로지 + LLM파서 + KoSimCSE",
+        "fn": config_3_axisB, "llm": "frontier", "mode": "axisB",
+    },
+    "config_4_axisB": {
+        "name": "프론티어 LLM + RAG only + KoSimCSE 청크검색",
+        "fn": config_4_axisB, "llm": "frontier", "mode": "axisB",
+    },
+}
+def run_single(config_id, question, data):
+    """단일 (구성, 질문) 호출"""
+    config = CONFIGS[config_id]
+    result = config["fn"](question, data)
+    # 자동 측정 추가
+    measures = measure_response(result.get("answer", ""))
+    result.update(measures)
+    return result

code/rag_engine.py ADDED Viewed

	@@ -0,0 +1,1265 @@

+"""
+rag_engine.py
+=============
+v5 RAG 데모 로직을 리팩토링한 엔진.
+핵심 차이:
+1. 하드코딩된 Q1~Q10 대신 자유 질문 라우팅
+2. 사용자 추가 인스턴스 인지 (instance_manager 연동)
+3. Streamlit 앱에서 호출 가능한 함수 형태
+라우팅 흐름:
+  사용자 질문
+    ↓
+  [route_question]
+    ├─ 펀드명 매칭 + 진행상태 키워드 → ontology_template (Q1~Q5 패턴)
+    ├─ 펀드명 매칭 + RWA/규제 키워드 → instance_with_concept (Q10 패턴 + 인스턴스 컨텍스트)
+    ├─ 위험가중치 키워드 → deterministic_lookup (Q9 패턴)
+    ├─ 일반 규제 키워드 → rag_concept (Q6~Q8 패턴)
+    └─ 매칭 안됨 → guidance (안내 메시지)
+"""
+import json
+import os
+import re
+from pathlib import Path
+from rdflib import Graph, Namespace, RDF, RDFS
+INV = Namespace("http://company.com/investment-ontology#")
+# ============================================
+# 모델 설정
+# ============================================
+# 환경변수 OLLAMA_MODEL 로 모델 변경 가능
+# - 페이퍼 실험 모델: gemma4:e4b (Gemma 4, ~4B effective params, edge device용)
+# - 시연 환경에 따라 더 작은 모델로 swap 가능 (예: gemma4:e2b, gemma3:4b 등)
+# - 환경변수 미설정 시 기본 gemma4:e4b
+DEFAULT_MODEL = os.environ.get("OLLAMA_MODEL", "gemma4:e4b")
+# ============================================
+# 설정
+# ============================================
+# Streamlit 앱 폴더에서 상대 경로로 데이터 로드
+DATA_DIR = Path(__file__).parent / "data"
+# ============================================
+# 1. 데이터 로드
+# ============================================
+def load_ttl(ttl_path):
+    g = Graph()
+    g.parse(str(ttl_path), format='turtle')
+    return g
+def load_chunks(jsonl_path):
+    chunks = []
+    with open(jsonl_path, 'r', encoding='utf-8') as f:
+        for line in f:
+            chunks.append(json.loads(line))
+    return chunks
+def load_alias(alias_path):
+    with open(alias_path, 'r', encoding='utf-8') as f:
+        return json.load(f)
+def load_lookup(lookup_path):
+    with open(lookup_path, 'r', encoding='utf-8') as f:
+        return json.load(f)
+# ============================================
+# 2. SPARQL 쿼리 (v5 로직 그대로)
+# ============================================
+def query_investment_branches(g, investment_iri):
+    """특정 Investment의 모든 브랜치와 상태 조회"""
+    q = f"""
+    PREFIX inv: <http://company.com/investment-ontology#>
+    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
+    SELECT ?branchLabel ?productLabel ?amount ?stageLabel ?stateLabel ?stateOrder WHERE {{
+      inv:{investment_iri} inv:hasBranch ?branch .
+      ?branch rdfs:label ?branchLabel ;
+              inv:hasProductType ?product ;
+              inv:hasInvestmentAmount ?amount ;
+              inv:hasCurrentStage ?stage ;
+              inv:hasBranchState ?state .
+      ?product rdfs:label ?productLabel .
+      ?stage rdfs:label ?stageLabel .
+      ?state rdfs:label ?stateLabel ;
+             inv:hasStateOrder ?stateOrder .
+      FILTER(LANG(?branchLabel)="ko")
+      FILTER(LANG(?productLabel)="ko")
+      FILTER(LANG(?stageLabel)="ko")
+      FILTER(LANG(?stateLabel)="ko")
+    }} ORDER BY ?branchLabel
+    """
+    branches = []
+    for row in g.query(q):
+        branches.append({
+            "label": str(row.branchLabel),
+            "product": str(row.productLabel),
+            "amount": int(float(str(row.amount))),
+            "stage": str(row.stageLabel),
+            "state": str(row.stateLabel),
+            "state_order": int(float(str(row.stateOrder))),
+        })
+    return branches
+def query_investment_meta(g, investment_iri):
+    """Investment 메타 정보 (펀드·운용사·최종투자대상·검토개요)"""
+    q = f"""
+    PREFIX inv: <http://company.com/investment-ontology#>
+    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
+    SELECT ?label ?comment ?gpLabel ?fundLabel WHERE {{
+      inv:{investment_iri} rdfs:label ?label .
+      OPTIONAL {{ inv:{investment_iri} rdfs:comment ?comment . FILTER(LANG(?comment)="ko") }}
+      OPTIONAL {{ inv:{investment_iri} inv:managedByGP ?gp . ?gp rdfs:label ?gpLabel . FILTER(LANG(?gpLabel)="ko") }}
+      OPTIONAL {{ ?fund inv:isDirectRecipient inv:{investment_iri} . ?fund rdfs:label ?fundLabel . FILTER(LANG(?fundLabel)="ko") }}
+      FILTER(LANG(?label)="ko")
+    }}
+    """
+    meta = {}
+    for row in g.query(q):
+        meta = {
+            "label": str(row.label),
+            "comment": str(row.comment) if row.comment else "",
+            "gp": str(row.gpLabel) if row.gpLabel else "",
+            "fund": str(row.fundLabel) if row.fundLabel else "",
+        }
+        break
+    if not meta:
+        return {}
+    # 최종 투자대상: 펀드(isDirectRecipient)의 간접투자대상(PortfolioCompany)
+    tq = f"""
+    PREFIX inv: <http://company.com/investment-ontology#>
+    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
+    SELECT ?targetLabel WHERE {{
+      ?fund inv:isDirectRecipient inv:{investment_iri} ;
+            inv:hasIndirectTarget ?t .
+      ?t rdfs:label ?targetLabel . FILTER(LANG(?targetLabel)="ko")
+    }}
+    """
+    meta["targets"] = sorted({str(r.targetLabel) for r in g.query(tq)})
+    return meta
+def query_all_investments_with_label(g):
+    """모든 Investment 인스턴스의 IRI와 label 조회 (펀드명 매칭용).
+    분기가 있는 인스턴스를 우선 정렬하여 매칭 시 빈 껍데기 인스턴스를 회피."""
+    q = """
+    PREFIX inv: <http://company.com/investment-ontology#>
+    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
+    SELECT ?inv ?label ?fundLabel (COUNT(?branch) AS ?nBranches) WHERE {
+      ?inv a inv:Investment ;
+           rdfs:label ?label .
+      OPTIONAL { ?inv inv:hasBranch ?branch }
+      OPTIONAL { ?fund inv:isDirectRecipient ?inv . ?fund rdfs:label ?fundLabel . FILTER(LANG(?fundLabel)="ko") }
+      FILTER(LANG(?label)="ko")
+    } GROUP BY ?inv ?label ?fundLabel
+    ORDER BY DESC(?nBranches)
+    """
+    results = []
+    for row in g.query(q):
+        results.append({
+            "iri": str(row.inv).split("#")[-1],
+            "label": str(row.label),
+            "fund_label": str(row.fundLabel) if row.fundLabel else "",
+            "n_branches": int(float(str(row.nBranches))),
+        })
+    return results
+# ============================================
+# 3. 답변 템플릿
+# ============================================
+def format_amount(amount):
+    if amount >= 100000000:
+        return f"{amount // 100000000}억 원"
+    return f"{amount:,}원"
+def template_investment_status(meta, branches):
+    """검토건 진행 상태 템플릿 (Q1~Q3 패턴)"""
+    if not branches:
+        return f"{meta.get('label', '해당 검토건')}의 분기 정보를 찾을 수 없습니다."
+    fund_name = meta.get('fund', meta.get('label', '해당 검토건'))
+    n_branches = len(branches)
+    lines = [f"**[{fund_name} 검토 현황]**", ""]
+    # 최종 투자대상 + 검토 개요 (Q1~3 핵심사실: 인수 목적·대상 기업)
+    targets = meta.get("targets", [])
+    if targets:
+        lines.append(f"- 최종 투자대상: {', '.join(targets)}")
+    if meta.get("comment"):
+        lines.append(f"- 검토 개요: {meta['comment']}")
+    if targets or meta.get("comment"):
+        lines.append("")
+    if n_branches == 1:
+        lines.append(f"이 검토 건은 단일 분기로 진행 중입니다.")
+    else:
+        lines.append(f"이 검토 건은 총 {n_branches}개의 분기로 진행 중입니다.")
+    lines.append("")
+    for idx, b in enumerate(branches, start=1):
+        amount_str = format_amount(b["amount"])
+        lines.append(
+            f"**분기 {idx}**: {b['product']} ({amount_str})"
+        )
+        lines.append(f"  - 현재 단계: {b['stage']}")
+        lines.append(f"  - 브랜치 상태: {b['state']}")
+        lines.append("")
+    return "\n".join(lines).strip()
+def template_stage_threshold(g, threshold_order=5):
+    """약정·실행 도달 검토건 추출 (Q4 패턴)"""
+    q = f"""
+    PREFIX inv: <http://company.com/investment-ontology#>
+    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
+    SELECT ?invLabel ?branchLabel ?stageLabel ?stateLabel ?stateOrder WHERE {{
+      ?inv a inv:Investment ;
+           rdfs:label ?invLabel ;
+           inv:hasBranch ?branch .
+      ?branch rdfs:label ?branchLabel ;
+              inv:hasCurrentStage ?stage ;
+              inv:hasBranchState ?state .
+      ?stage rdfs:label ?stageLabel .
+      ?state rdfs:label ?stateLabel ;
+             inv:hasStateOrder ?stateOrder .
+      FILTER(?stateOrder >= {threshold_order})
+      FILTER(LANG(?invLabel)="ko")
+      FILTER(LANG(?branchLabel)="ko")
+      FILTER(LANG(?stageLabel)="ko")
+      FILTER(LANG(?stateLabel)="ko")
+    }} ORDER BY ?invLabel
+    """
+    results = []
+    for row in g.query(q):
+        results.append({
+            "inv_label": str(row.invLabel),
+            "branch_label": str(row.branchLabel),
+            "stage": str(row.stageLabel),
+            "state": str(row.stateLabel),
+        })
+    if not results:
+        return "약정 단계 이후로 진행된 검토 건이 없습니다."
+    lines = [f"**약정 단계 이후로 진행된 검토 건 ({len(results)}건)**", ""]
+    for r in results:
+        lines.append(f"- **{r['inv_label']}** / {r['branch_label']}")
+        lines.append(f"  단계: {r['stage']}, 상태: {r['state']}")
+    return "\n".join(lines)
+def template_review_stalled(g):
+    """정체 상태 검토건 추출 (Q5 패턴)"""
+    q = """
+    PREFIX inv: <http://company.com/investment-ontology#>
+    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
+    SELECT ?invLabel ?branchLabel ?stageLabel WHERE {
+      ?inv a inv:Investment ;
+           rdfs:label ?invLabel ;
+           inv:hasBranch ?branch .
+      ?branch rdfs:label ?branchLabel ;
+              inv:hasCurrentStage ?stage ;
+              inv:hasBranchState inv:State_ReviewStalled .
+      ?stage rdfs:label ?stageLabel .
+      FILTER(LANG(?invLabel)="ko")
+      FILTER(LANG(?branchLabel)="ko")
+      FILTER(LANG(?stageLabel)="ko")
+    } ORDER BY ?invLabel
+    """
+    results = []
+    for row in g.query(q):
+        results.append({
+            "inv_label": str(row.invLabel),
+            "branch_label": str(row.branchLabel),
+            "stage": str(row.stageLabel),
+        })
+    if not results:
+        return "현재 정체 상태인 검토 건이 없습니다."
+    lines = [f"**예비검토 단계에서 정체된 검토 건 ({len(results)}건)**", ""]
+    for r in results:
+        lines.append(f"- **{r['inv_label']}** / {r['branch_label']}")
+        lines.append(f"  단계: {r['stage']}, 상태: 예비검토 정체")
+    return "\n".join(lines)
+# ============================================
+# 3-b. 축 A 신규 라우트 템플릿 (열린 질의 대응)
+# ============================================
+def template_list_active(g):
+    """진행 중(폐기 아님) 검토건 전체 목록 (Q11)"""
+    q = """PREFIX inv: <http://company.com/investment-ontology#>
+    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
+    SELECT DISTINCT ?inv ?label ?fundLabel WHERE {
+      ?inv a inv:Investment ; rdfs:label ?label .
+      FILTER NOT EXISTS { ?inv inv:isDeprecated true }
+      OPTIONAL { ?fund inv:isDirectRecipient ?inv ; rdfs:label ?fundLabel . FILTER(LANG(?fundLabel)="ko") }
+      FILTER(LANG(?label)="ko")
+    } ORDER BY ?inv"""
+    rows = list(g.query(q))
+    if not rows:
+        return "현재 진행 중인 검토 건이 없습니다."
+    lines = [f"**현재 검토 진행 중인 건 ({len(rows)}건)**", ""]
+    for row in rows:
+        iri = str(row.inv).split("#")[-1]
+        head = str(row.fundLabel) if row.fundLabel else str(row.label)
+        branches = query_investment_branches(g, iri)
+        bsum = ", ".join(f"{b['product']} {format_amount(b['amount'])}({b['state']})" for b in branches) or "(분기 정보 없음)"
+        lines.append(f"- **{head}**: {bsum}")
+    return "\n".join(lines)
+def template_max_amount(g):
+    """금액이 가장 큰 분기/검토건 (Q12)"""
+    q = """PREFIX inv: <http://company.com/investment-ontology#>
+    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
+    SELECT ?invLabel ?branchLabel ?amount ?prodLabel WHERE {
+      ?inv a inv:Investment ; rdfs:label ?invLabel ; inv:hasBranch ?b .
+      FILTER NOT EXISTS { ?inv inv:isDeprecated true }
+      ?b rdfs:label ?branchLabel ; inv:hasInvestmentAmount ?amount ; inv:hasProductType ?p .
+      ?p rdfs:label ?prodLabel .
+      FILTER(LANG(?invLabel)="ko") FILTER(LANG(?branchLabel)="ko") FILTER(LANG(?prodLabel)="ko")
+    } ORDER BY DESC(?amount) LIMIT 1"""
+    rows = list(g.query(q))
+    if not rows:
+        return "검토 건 금액 정보를 찾을 수 없습니다."
+    r = rows[0]
+    return ("**금액이 가장 큰 건**\n\n"
+            f"- {r.branchLabel} ({r.prodLabel})\n"
+            f"- 금액: **{format_amount(int(float(str(r.amount))))}**\n"
+            f"- 소속 검토건: {r.invLabel}")
+def template_multiplicity(g):
+    """다중 투자: 분기≥2 또는 피투자≥2 (Q13)"""
+    qb = """PREFIX inv: <http://company.com/investment-ontology#>
+    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
+    SELECT ?invLabel (COUNT(?b) AS ?n) WHERE {
+      ?inv a inv:Investment ; rdfs:label ?invLabel ; inv:hasBranch ?b .
+      FILTER NOT EXISTS { ?inv inv:isDeprecated true } FILTER(LANG(?invLabel)="ko")
+    } GROUP BY ?inv ?invLabel HAVING(COUNT(?b) > 1)"""
+    qf = """PREFIX inv: <http://company.com/investment-ontology#>
+    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
+    SELECT ?fundLabel (COUNT(?t) AS ?n) WHERE {
+      ?fund inv:hasIndirectTarget ?t ; rdfs:label ?fundLabel . FILTER(LANG(?fundLabel)="ko")
+    } GROUP BY ?fund ?fundLabel HAVING(COUNT(?t) > 1)"""
+    mb = list(g.query(qb)); mf = list(g.query(qf))
+    lines = ["**한 번에 여러 건/대상에 투자하는 경우**", ""]
+    if mb:
+        lines.append("▶ 한 검토건에서 복수 상품 동시 진행 (분기):")
+        for r in mb:
+            lines.append(f"  - {r.invLabel}: {int(r.n)}개 분기 (예: LP출자 + 인수금융)")
+    if mf:
+        lines.append("▶ 한 펀드가 복수 피투자사에 동시 투자:")
+        for r in mf:
+            lines.append(f"  - {r.fundLabel}: {int(r.n)}개 피투자사")
+    if not mb and not mf:
+        lines.append("해당 사례가 없습니다.")
+    return "\n".join(lines)
+def template_counterparty_overview(g, investment_iri=None):
+    """거래상대방 다층성 식별 (Q8)"""
+    lines = [
+        "**LP출자 검토 시 고려할 거래상대방 (다층 구조)**", "",
+        "LP출자의 거래상대방은 단일 주체가 아니라 다층적이며, 모두 Counterparty 메타 클래스 하위로 분류됩니다:",
+        "- **운��사(GP)**: 펀드를 운용하는 주체 — KYC·운용능력 검토",
+        "- **출자대상펀드(RecipientFund)**: 우리가 직접 출자하는 펀드 — 약정·RWA 산정",
+        "- **피투자기업(PortfolioCompany)**: 펀드가 최종 투자하는 기업 — 자산건전성·대체투자 분류",
+        "- **차주(SPC 등)**: 인수금융 시 자금을 빌리는 특수목적법인",
+        "각 주체별로 ConsumerType(전문/일반 금융소비자)을 확인합니다.",
+    ]
+    if investment_iri:
+        meta = query_investment_meta(g, investment_iri)
+        lines.append("")
+        lines.append(f"※ 본 검토건 기준 — 운용사: {meta.get('gp','')}, 펀드: {meta.get('fund','')}, 최종 투자대상: {', '.join(meta.get('targets', []))}")
+    return "\n".join(lines)
+def template_listing_count(g):
+    """피투자사 상장/비상장 카운트 (Q15)"""
+    from collections import defaultdict
+    q = """PREFIX inv: <http://company.com/investment-ontology#>
+    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
+    SELECT ?status ?label ?industry WHERE {
+      ?c inv:hasCounterpartyRole inv:Role_PortfolioTarget ;
+         inv:listingStatus ?status ; rdfs:label ?label .
+      OPTIONAL { ?c inv:industry ?industry }
+      FILTER(LANG(?label)="ko")
+    } ORDER BY ?status ?label"""
+    by = defaultdict(list)
+    for r in g.query(q):
+        ind = f"({r.industry})" if r.industry else ""
+        by[str(r.status)].append(f"{r.label}{ind}")
+    sang = by.get("상장", []); bee = by.get("비상장", [])
+    lines = [f"**최종 검토 대상 기업 — 상장 {len(sang)}개 / 비상장 {len(bee)}개**", ""]
+    if sang:
+        lines.append(f"- 상장사 ({len(sang)}개): {', '.join(sang)}")
+    if bee:
+        lines.append(f"- 비상장사 ({len(bee)}개): {', '.join(bee)}")
+    return "\n".join(lines)
+def template_approval(g, investment_iri=None):
+    """결재/전결권 순서 (Q14)"""
+    full_order = ["거래상대방등록", "투자상담", "사전검토", "예비검토", "실무심의(실무협의회)",
+                  "투자품의", "한도약정", "개별출자품의", "사후관리"]
+    order = ["사전검토", "예비검토", "실무심의", "투자품의", "한도약정", "개별출자"]
+    lines = ["**투자 검토 결재(전결권) 체계**", "",
+             "업무 진행 순서 (9단계): " + " → ".join(full_order), "",
+             "결재(전결권) 대상 단계 및 전결권자:"]
+    for i, st in enumerate(order, 1):
+        lines.append(f"  {i}. {st} → {STAGE_APPROVER[st]}")
+    lines += ["", "실무심의 전결권 (투자금액 × 상장여부, 복수 분기 시 최대 금액 기준):",
+              "| 금액 | 비상장사 | 상장사 |", "|---|---|---|"]
+    rowtxt = ["10억 이하", "20억 이하", "50억 이하", "100억 이하", "100억 초과"]
+    for (thr, ul, li), label in zip(WORKING_REVIEW_TABLE, rowtxt):
+        lines.append(f"| {label} | {ul} | {li} |")
+    if investment_iri:
+        branches = query_investment_branches(g, investment_iri)
+        if branches:
+            maxamt = max(b["amount"] for b in branches)
+            lsq = f"""PREFIX inv: <http://company.com/investment-ontology#>
+            SELECT ?ls WHERE {{ ?fund inv:isDirectRecipient inv:{investment_iri} ; inv:hasIndirectTarget ?t . ?t inv:listingStatus ?ls }} LIMIT 1"""
+            lss = [str(r[0]) for r in g.query(lsq)]
+            is_listed = bool(lss) and lss[0] == "상장"
+            auth = working_review_authority(maxamt, is_listed)
+            lines += ["", f"※ 본 검토건: 최대 {format_amount(maxamt)}, {'상장' if is_listed else '비상장'} → 실무심의 전결권 **{auth}**"]
+    return "\n".join(lines)
+# ============================================
+# 4. 결정론적 위험가중치 lookup (Q9 패턴)
+# ============================================
+def lookup_risk_weight(lookup, asset_class, credit_rating=None):
+    """
+    위험가중치 결정론적 조회 (Q9 패턴 — LLM 호출 없이 직접 표 조회).
+    실제 데이터 구조:
+        lookup = {
+          "asset_classes": {
+            "중앙정부": {
+              "asset_id": "CentralGov",
+              "clause_id": "BSER_App3_Asset_CentralGov",
+              "lookup_method": "신용등급",
+              "table": { "AAA~AA-": "0%", "A+~A-": "20%", ... },
+              "special_rules": { ... }
+            }, ...
+          }
+        }
+    Args:
+        lookup: 전체 lookup dict
+        asset_class: 자산 분류 (예: "중앙정부")
+        credit_rating: 신용등급 (예: "AAA~AA-", "AAA", "A+~A-")
+    Returns:
+        dict {
+            "weight": "0%",          # 위험가중치 문자열
+            "asset_class": "중앙정부",
+            "credit_rating": "AAA~AA-",
+            "matched_key": "AAA~AA-",
+            "clause_id": "BSER_App3_Asset_CentralGov",
+        }
+        또는 None (매칭 실패)
+    """
+    asset_classes = lookup.get("asset_classes", {})
+    asset_data = asset_classes.get(asset_class)
+    if not asset_data:
+        return None
+    table = asset_data.get("table", {})
+    # 1) 정확 매칭
+    if credit_rating and credit_rating in table:
+        return {
+            "weight": table[credit_rating],
+            "asset_class": asset_class,
+            "credit_rating": credit_rating,
+            "matched_key": credit_rating,
+            "clause_id": asset_data.get("clause_id", ""),
+        }
+    # 2) 부분 매칭 (예: "AAA" → "AAA~AA-" 키 찾기)
+    if credit_rating:
+        for key in table.keys():
+            # 사용자가 "AAA"라고 입력했고 키가 "AAA~AA-"라면 매칭
+            if credit_rating in key:
+                return {
+                    "weight": table[key],
+                    "asset_class": asset_class,
+                    "credit_rating": credit_rating,
+                    "matched_key": key,
+                    "clause_id": asset_data.get("clause_id", ""),
+                }
+            # 키가 "AAA"이고 사용자가 "AAA~AA-"라고 입력했다면 매칭 (역방향)
+            if key in credit_rating:
+                return {
+                    "weight": table[key],
+                    "asset_class": asset_class,
+                    "credit_rating": credit_rating,
+                    "matched_key": key,
+                    "clause_id": asset_data.get("clause_id", ""),
+                }
+    return None
+def template_risk_weight_answer(result):
+    """
+    위험가중치 lookup 결과를 한국어 답변으로 포맷.
+    Args:
+        result: lookup_risk_weight() 반환값 (dict)
+    """
+    if result is None:
+        return None
+    return (
+        f"**[위험가중치 조회 결과]**\n\n"
+        f"- 자산 분류: **{result['asset_class']}**\n"
+        f"- 신용등급: **{result['credit_rating']}** (매칭 키: `{result['matched_key']}`)\n"
+        f"- 위험가중치: **{result['weight']}**\n\n"
+        f"※ 출처: 은행업감독업무시행세칙 별표 3 (표준방법 기준)\n"
+        f"※ 본 답변은 LLM 호출 없이 정형 lookup table에서 직접 조회되었습니다."
+    )
+def render_supporting_chunks(chunks_list, max_n=2, max_text=300):
+    """위험가중치 답변에 보조로 붙일 RAG 청크 요약"""
+    if not chunks_list:
+        return ""
+    lines = ["\n\n---\n\n**📚 보조 근거 (관련 규제 청크):**\n"]
+    for c in chunks_list[:max_n]:
+        cid = c.get("id", "?")
+        text = c.get("text", "")[:max_text]
+        lines.append(f"- **{cid}**: {text}{'...' if len(c.get('text', '')) > max_text else ''}")
+    return "\n\n".join(lines)
+# ============================================
+# 5. RAG 청크 검색
+# ============================================
+def search_chunks_by_concept(chunks, concept_id, top_k=5, prefer_summary=False):
+    """Concept ID로 RAG 청크 검색"""
+    matched = []
+    for c in chunks:
+        meta = c.get("metadata", {})
+        concepts = meta.get("regulatory_concepts", [])
+        if concept_id in concepts:
+            matched.append(c)
+    # 요약 청크 우선 (Q10 패턴)
+    if prefer_summary:
+        summary = [c for c in matched if "Summary" in c.get("id", "") or c.get("metadata", {}).get("is_summary")]
+        non_summary = [c for c in matched if c not in summary]
+        matched = summary + non_summary
+    return matched[:top_k]
+def search_chunks_by_keyword(chunks, keywords, top_k=5):
+    """키워드 매칭으로 청크 검색 (concept ID 매칭 실패 시 fallback)"""
+    scored = []
+    for c in chunks:
+        text = c.get("text", "").lower()
+        score = sum(1 for kw in keywords if kw.lower() in text)
+        if score > 0:
+            scored.append((score, c))
+    scored.sort(key=lambda x: x[0], reverse=True)
+    return [c for _, c in scored[:top_k]]
+# ============================================
+# 6. Gemma 호출 (Streamlit 환경에서 지연 import)
+# ============================================
+def call_gemma(question, context, mode="standard", model_name=None):
+    """
+    Gemma 호출. ollama 패키지 + Ollama 서버 + 모델이 모두 준비되어야 함.
+    어느 단계에서 실패해도 예외를 던지지 않고 None 또는 안내 문자열을 반환.
+    Args:
+        question: 사용자 질문
+        context: 컨텍스트 (인스턴스 정보 + 청크)
+        mode: "standard" 또는 "polish"
+        model_name: 모델명. None이면 환경변수 OLLAMA_MODEL 또는 DEFAULT_MODEL 사용
+    Returns:
+        (answer_str, success_bool)
+        - 성공: (Gemma 답변, True)
+        - 실패: (None, False)  → 호출자가 fallback 처리해야 함
+    """
+    if model_name is None:
+        model_name = DEFAULT_MODEL
+    try:
+        import ollama
+    except ImportError:
+        return None, False
+    if mode == "polish":
+        # 다듬기 모드: 컨텍스트의 사실을 그대로 유지하며 자연스럽게 표현
+        system = (
+            "당신은 한국 LP출자 도메인 전문 금융회사 직원의 보조 AI입니다. "
+            "아래 컨텍스트의 사실을 그대로 유지하면서 자연스러운 한국어로 답변을 다듬어 주세요. "
+            "사실을 추가하거나 추측하지 마세요. 제공된 정보만 사용하세요."
+        )
+    else:
+        # 표준 모드: 컨텍스트 기반 답변
+        system = (
+            "당신은 한국 LP출자 도메인 전문 금융회사 직원의 보조 AI입니다. "
+            "아래 컨텍스트(온톨로지 + 규제 청크)의 정보만 사용하여 답변하세요. "
+            "컨텍스트에 없는 내용은 추측하지 말고, 모르면 모른다고 답하세요. "
+            "마크다운 강조(**)나 이모지를 과하게 사용하지 마세요. "
+            "한국어 격식체로 간결하게 답변하세요."
+        )
+    full_prompt = f"[컨텍스트]\n{context}\n\n[질문]\n{question}\n\n[답변]"
+    try:
+        resp = ollama.chat(
+            model=model_name,
+            messages=[
+                {"role": "system", "content": system},
+                {"role": "user", "content": full_prompt},
+            ],
+            options={"num_predict": 1500, "temperature": 0.3, "repeat_penalty": 1.15},
+        )
+        return resp['message']['content'], True
+    except Exception:
+        # 모델 미존재, 서버 미실행, 네트워크 오류 등 모두 여기서 처리
+        return None, False
+# ============================================
+# 7. 라우터 (자유 질문 분류)
+# ============================================
+# 키워드 사전
+PROGRESS_KEYWORDS = ["어디까지", "어떻게 진행", "현재", "진행 상태", "상태", "어디", "어느 단계", "단계가 어떻게"]
+RWA_KEYWORDS = ["RWA", "위험가중치", "rwa", "익스포져", "익스포저", "자산분류",
+                "자기자본 비율", "자기자본비율", "BIS", "경영지도비율", "리스크 가중치",
+                "자기자본 산정"]
+# 자산분류 별칭 — lookup의 asset_classes 키와 사용자 표현 매핑
+# (substring 매칭 실패 시 시도. 가장 도메인 한정된 표현부터 우선)
+ASSET_ALIASES = {
+    "정부 채권": "중앙정부", "정부채권": "중앙정부",
+    "국채": "중앙정부", "국공채": "중앙정부",
+    "지방채": "지방정부",
+    "회사채": "일반기업", "기업채권": "일반기업",
+    "은행채": "은행",
+    "주식": "주식",
+    "부동산": "상업용 부동산",
+    "모기지": "주거용 모기지", "주택담보": "주거용 모기지",
+}
+ALTERNATIVE_KEYWORDS = ["대체투자", "대체 투자"]
+SUITABILITY_KEYWORDS = ["적합성", "적합성 원칙"]
+EXPLANATION_KEYWORDS = ["설명의무", "설명 의무"]
+CONSUMER_KEYWORDS = ["전문금융소비자", "일반금융소비자", "금융소비자"]
+SCREENING_KEYWORDS = ["사전심사", "사전 심사", "사전협의", "사전 협의"]
+PRODUCT_KEYWORDS = ["펀드 형태", "펀드 종류", "어떤 펀드", "LP출자 대상"]
+THRESHOLD_KEYWORDS = ["약정 후", "약정 이후", "약정 단계 이후", "실행 단계", "약정 단계"]
+STALLED_KEYWORDS = ["정체", "결재 안", "막힌", "지체", "올렸는데"]
+# === 축 A 신규 라우트 키워드 (열린 질의 대응) ===
+LIST_ACTIVE_KEYWORDS = ["진행 중인 건", "진행중인 건", "검토 중인 건", "검토중인 건", "검토 진행 중", "어떤 건들", "전체 검토건", "건들 좀", "건들은", "목록", "리스트", "다 보여", "전부 보여"]
+MAXAMOUNT_KEYWORDS = ["가장 큰", "제일 큰", "최대 금액", "금액이 큰", "금액이 가장", "가장 많은 금액", "제일 많은"]
+MULTIPLICITY_KEYWORDS = ["여러개", "여러 개", "여러건", "여러 건", "한번에", "한 번에", "동시에", "동시 투자", "복수"]
+COUNTERPARTY_KEYWORDS = ["거래상대방", "거래 상대방", "상대방을 식별", "누구를 고려", "누구를 봐야", "상대방은 누구"]
+APPROVAL_KEYWORDS = ["결재", "전결", "승인 순서", "승인권", "결재권", "어떤 순서로 받"]
+LISTING_KEYWORDS = ["상장사", "비상장사", "상장 비상장", "상장여부", "상장 여부", "상장/비상장"]
+# 결재 전결권 (approval_authority_lookup.json 미러 — 복수 분기 시 최대 금액 기준)
+STAGE_APPROVER = {"사전검토": "부서장", "예비검토": "부서장", "실무심의": "금액·상장여부 따름",
+                  "투자품의": "부서장", "한도약정": "부서장", "개별출자": "부서장"}
+WORKING_REVIEW_TABLE = [  # (금액 억원 이하, 비상장 전결권, 상장 전결권)
+    (10, "본부장", "부서장"), (20, "본부장", "본부장"), (50, "그룹장", "그룹장"),
+    (100, "사장", "그룹장"), (None, "사장", "사장"),
+]
+def working_review_authority(max_amount_won, is_listed):
+    eok = max_amount_won / 100000000
+    for thr, unlisted, listed in WORKING_REVIEW_TABLE:
+        if thr is None or eok <= thr:
+            return listed if is_listed else unlisted
+    return "사장"
+def detect_concept_from_question(question):
+    """질문에서 RegulatoryConcept ID 추출"""
+    q = question.lower()
+    if any(kw in question for kw in RWA_KEYWORDS):
+        return "Concept_RWA_Calculation"
+    if any(kw in question for kw in ALTERNATIVE_KEYWORDS):
+        return "Concept_AlternativeInvestmentClassification"
+    if any(kw in question for kw in SUITABILITY_KEYWORDS):
+        return "Concept_SuitabilityCheck"
+    if any(kw in question for kw in EXPLANATION_KEYWORDS):
+        return "Concept_ExplanationDuty"
+    if any(kw in question for kw in CONSUMER_KEYWORDS):
+        return "Concept_ConsumerClassification"
+    if any(kw in question for kw in SCREENING_KEYWORDS):
+        return None  # 사전심사 단계는 stage_overview로 처리
+    if any(kw in question for kw in PRODUCT_KEYWORDS):
+        return "Concept_ProductDefinition"
+    return None
+def detect_risk_weight_query(question, lookup):
+    """
+    위험가중치 질의 자동 감지 + 자산분류·신용등급 추출.
+    Returns:
+        dict {"asset_class": str, "credit_rating": str|None} 또는 None
+    """
+    # RWA/위험가중치 키워드가 없으면 무관한 질문
+    if not any(kw in question for kw in RWA_KEYWORDS):
+        return None
+    # 자산분류 탐지 (lookup의 asset_classes 키 사용)
+    asset_classes = lookup.get("asset_classes", {})
+    asset_class = None
+    for asset_name in asset_classes.keys():
+        if asset_name in question:
+            asset_class = asset_name
+            break
+    # asset 직접 매칭 실패 시 alias 사전 시도 ("정부 채권"→"중앙정부" 등)
+    if not asset_class:
+        for alias_term, canonical in ASSET_ALIASES.items():
+            if alias_term in question and canonical in asset_classes:
+                asset_class = canonical
+                break
+    if not asset_class:
+        return None
+    # 신용등급 탐지 - 실제 lookup table 키와 사용자 표현을 모두 시도
+    table_keys = list(asset_classes[asset_class].get("table", {}).keys())
+    credit_rating = None
+    # 1) lookup table의 실제 키 직접 매칭
+    for key in table_keys:
+        if key in question:
+            credit_rating = key
+            break
+    # 2) 일반 신용등급 패턴 매칭 (사용자가 "AAA"만 입력한 경우 등)
+    if not credit_rating:
+        # 긴 패턴부터 매칭 (AAA가 AA보다 먼저)
+        rating_patterns = [
+            "AAA~AA-", "AAA", "AA-", "AA+", "AA",
+            "A+~A-", "A+", "A-", "A",
+            "BBB+~BBB-", "BBB+", "BBB-", "BBB",
+            "BB+~B-", "BB+", "BB-", "BB",
+            "B-미만", "B-이하", "B-",
+            "투자등급", "투기등급", "무등급",
+        ]
+        for pattern in rating_patterns:
+            if pattern in question:
+                credit_rating = pattern
+                break
+    return {"asset_class": asset_class, "credit_rating": credit_rating}
+# ============================================
+# 8. 메인 라우팅 함수
+# ============================================
+def answer_question(question, g, chunks, alias_dict, lookup, user_instances=None,
+                    use_gemma=True, model_name="gemma2:2b"):
+    """
+    자유 질문 처리 메인 함수.
+    Args:
+        question: 사용자 질문 (자연어)
+        g: rdflib Graph (TTL + 사용자 추가 인스턴스 포함)
+        chunks: RAG 청크 리스트
+        alias_dict: 동의어 사전
+        lookup: 위험가중치 lookup
+        user_instances: 사용자가 추가한 인스턴스 record 리스트 (instance_manager.add_user_investment 결과)
+        use_gemma: Gemma 호출 여부 (False면 템플릿/lookup만, 빠른 시연용)
+        model_name: Ollama 모델명
+    Returns:
+        dict: {
+            "answer": str,           # 최종 답변
+            "route": str,            # 라우팅 결과 (디버깅용)
+            "context_summary": str,  # 사용된 컨텍스트 요약
+        }
+    """
+    # ============================================
+    # 1. 펀드명 매칭 — 사용자 추가 인스턴스 우선
+    # ============================================
+    matched_investment = None
+    matched_source = None  # "user" 또는 "demo"
+    # 1-1. 사용자가 추가한 인스턴스 매칭
+    if user_instances:
+        from instance_manager import find_user_investment_by_keyword
+        # 질문에서 펀드명 후보 추출 (간단히 단어 단위로)
+        question_words = re.findall(r'[가-힣A-Za-z0-9]{2,}', question)
+        for word in question_words:
+            record = find_user_investment_by_keyword(user_instances, word)
+            if record:
+                matched_investment = record["investment_iri"]
+                matched_source = "user"
+                break
+    # 1-2. 데모 인스턴스 매칭
+    # 일반 단어 (질문 의도 키워드)는 매칭 후보에서 제외
+    GENERIC_WORDS = {
+        "검토", "검토건", "검토 건", "단계", "진행", "어디", "상태", "약정", "출자",
+        "어떻게", "지금", "현재", "상황", "처리", "이후", "올렸", "결재", "정체",
+        "관리", "신청", "등록", "승인", "산정", "분류", "원칙", "기준",
+        "펀드", "투자", "금융", "규제", "조항", "법령", "계약", "체결",
+        "예비", "사전", "협의", "실무", "품의", "대체", "적합성", "설명",
+        "그리고", "또는", "그래서", "하지만", "지금까지", "그동안",
+        "RWA", "rwa", "위험가중치", "익스포져", "익스포저", "자산", "자산분류",
+        "lp출자", "LP출자", "lp", "LP", "한도", "공여", "신용", "전문",
+        "가상", "기준", "조건", "방법",
+    }
+    if not matched_investment:
+        all_investments = query_all_investments_with_label(g)
+        for inv in all_investments:
+            # 빈 껍데기 인스턴스 (분기 0개) 스킵
+            if inv.get("n_branches", 0) == 0:
+                continue
+            # 이미 매칭된 사용자 인스턴스면 스킵
+            if user_instances and any(r["investment_iri"] == inv["iri"] for r in user_instances):
+                continue
+            # label/fund_label에서 단어 추출, 일반 단어 제거
+            label_words = re.findall(r"[가-힣A-Za-z0-9]{2,}", inv["label"] + " " + inv["fund_label"])
+            distinctive_words = [w for w in label_words if w not in GENERIC_WORDS]
+            for word in distinctive_words:
+                if len(word) >= 2 and word in question:
+                    matched_investment = inv["iri"]
+                    matched_source = "demo"
+                    break
+            if matched_investment:
+                break
+    # ============================================
+    # 2. 라우팅
+    # ============================================
+    # 2-1. 약정 단계 도달 검토건 (Q4 패턴) — 펀드명 매칭이 없을 때만
+    if not matched_investment and any(kw in question for kw in THRESHOLD_KEYWORDS):
+        answer = template_stage_threshold(g, threshold_order=1)
+        return {
+            "answer": answer,
+            "route": "stage_threshold",
+            "context_summary": "약정·실행 도달 검토건 SPARQL",
+        }
+    # 2-2. 정체 상태 (Q5 패턴) — 펀드명 매칭이 없을 때만
+    if not matched_investment and any(kw in question for kw in STALLED_KEYWORDS):
+        answer = template_review_stalled(g)
+        return {
+            "answer": answer,
+            "route": "review_stalled",
+            "context_summary": "정체 상태 검토건 SPARQL",
+        }
+    # 2-3. 위험가중치 (Q9 패턴) — Lookup 우선, RAG 청크는 보조 근거
+    # 페이퍼 §4.5의 핵심 메시지: "결정론적 사실은 코드가 보장, 자연어만 LLM"
+    # - asset_class 감지되면 무조건 lookup 시도 (LLM 호출 없음)
+    # - 매칭 성공: lookup 결과를 메인 답변으로, 관련 청크는 보조 근거로 첨부
+    # - 매칭 실패: 보조 안내 + 일반 RWA 청크로 fallback
+    rw_query = detect_risk_weight_query(question, lookup)
+    if rw_query:
+        result = lookup_risk_weight(lookup, rw_query["asset_class"], rw_query["credit_rating"])
+        if result is not None:
+            # 메인 답변: lookup 결과 (LLM 호출 없음)
+            main_answer = template_risk_weight_answer(result)
+            # 보조 근거: 관련 RAG 청크 1~2개
+            supporting = search_chunks_by_concept(chunks, "Concept_RWA_Calculation",
+                                                  top_k=2, prefer_summary=True)
+            supporting_text = render_supporting_chunks(supporting, max_n=2, max_text=300)
+            return {
+                "answer": main_answer + supporting_text,
+                "route": "deterministic_lookup",
+                "context_summary": (
+                    f"Lookup 직접 조회: {result['asset_class']} / {result['credit_rating']} "
+                    f"(매칭: {result['matched_key']}) "
+                    f"+ 보조 청크 {len(supporting)}개"
+                ),
+            }
+        else:
+            # 자산 분류는 감지됐으나 신용등급이 명확하지 않은 경우
+            # → asset_class 표 전체를 안내 + RAG 청크
+            asset_classes = lookup.get("asset_classes", {})
+            asset_data = asset_classes.get(rw_query["asset_class"], {})
+            table = asset_data.get("table", {})
+            table_lines = [f"**[{rw_query['asset_class']} 자산 분류 위험가중치 표]**", ""]
+            for k, v in table.items():
+                table_lines.append(f"- {k}: **{v}**")
+            supporting = search_chunks_by_concept(chunks, "Concept_RWA_Calculation",
+                                                  top_k=2, prefer_summary=True)
+            supporting_text = render_supporting_chunks(supporting, max_n=2, max_text=300)
+            note = "\n\n신용등급을 명확히 지정하시면 정확한 가중치를 조회할 수 있습니다 (예: 'AAA~AA-')."
+            return {
+                "answer": "\n".join(table_lines) + note + supporting_text,
+                "route": "lookup_table_overview",
+                "context_summary": f"Lookup 표 전체: {rw_query['asset_class']} + 보조 청크 {len(supporting)}개",
+            }
+    # 2-4. 펀드명 매칭 + 진행상태 (Q1~Q3 패턴)
+    if matched_investment and any(kw in question for kw in PROGRESS_KEYWORDS):
+        meta = query_investment_meta(g, matched_investment)
+        branches = query_investment_branches(g, matched_investment)
+        answer = template_investment_status(meta, branches)
+        return {
+            "answer": answer,
+            "route": f"investment_status ({matched_source})",
+            "context_summary": f"인스턴스 SPARQL: {matched_investment}",
+        }
+    # 2-5. 펀드명 매칭 + 규제 키워드 (인스턴스 + 청크 컨텍스트)
+    concept_id = detect_concept_from_question(question)
+    if matched_investment and concept_id:
+        # 인스턴스 컨텍스트 + 청크 컨텍스트 결합
+        meta = query_investment_meta(g, matched_investment)
+        branches = query_investment_branches(g, matched_investment)
+        instance_context = template_investment_status(meta, branches)
+        prefer_summary = (concept_id == "Concept_RWA_Calculation")
+        relevant_chunks = search_chunks_by_concept(chunks, concept_id, top_k=3, prefer_summary=prefer_summary)
+        chunk_context = "\n\n".join([
+            f"[규제 근거 {i+1}] {c.get('id', '')}\n{c.get('text', '')[:1500]}"
+            for i, c in enumerate(relevant_chunks)
+        ])
+        full_context = f"{instance_context}\n\n---\n\n[관련 규제 근거]\n{chunk_context}"
+        if use_gemma:
+            gemma_answer, gemma_ok = call_gemma(question, full_context, mode="standard", model_name=model_name)
+        else:
+            gemma_answer, gemma_ok = None, False
+        if gemma_ok:
+            answer = gemma_answer
+        else:
+            # Gemma 미사용/실패 시: 시연 모드 (구조화된 raw 컨텍스트 표시)
+            answer = (
+                f"{instance_context}\n\n"
+                f"---\n\n"
+                f"**관련 규제 근거 ({len(relevant_chunks)}개 청크 검색됨):**\n\n"
+                + "\n\n".join([f"📄 **{c.get('id', '')}**\n{c.get('text', '')[:500]}..." for c in relevant_chunks])
+            )
+        return {
+            "answer": answer,
+            "route": f"instance_with_concept ({matched_source}, {concept_id})",
+            "context_summary": f"인스턴스 + {len(relevant_chunks)}개 규제 청크",
+        }
+    # 2-6. 일반 규제 질문 (펀드명 없음, Q6~Q8 패턴)
+    if concept_id:
+        prefer_summary = (concept_id == "Concept_RWA_Calculation")
+        relevant_chunks = search_chunks_by_concept(chunks, concept_id, top_k=3, prefer_summary=prefer_summary)
+        if not relevant_chunks:
+            return {
+                "answer": "관련 규제 정보를 찾을 수 없습니다. 다른 키워드로 다시 질문해주세요.",
+                "route": "rag_concept_no_match",
+                "context_summary": f"concept {concept_id} 청크 0개",
+            }
+        chunk_context = "\n\n".join([
+            f"[근거 {i+1}] {c.get('id', '')}\n{c.get('text', '')[:1500]}"
+            for i, c in enumerate(relevant_chunks)
+        ])
+        if use_gemma:
+            gemma_answer, gemma_ok = call_gemma(question, chunk_context, mode="standard", model_name=model_name)
+        else:
+            gemma_answer, gemma_ok = None, False
+        if gemma_ok:
+            answer = gemma_answer
+        else:
+            answer = (
+                f"**관련 규제 근거 ({len(relevant_chunks)}개 청크 검색됨):**\n\n"
+                + "\n\n".join([f"📄 **{c.get('id', '')}**\n{c.get('text', '')[:500]}..." for c in relevant_chunks])
+            )
+        return {
+            "answer": answer,
+            "route": f"rag_concept ({concept_id})",
+            "context_summary": f"{len(relevant_chunks)}개 규제 청크",
+        }
+    # === 축 A 신규 라우트 (guidance 폴백 직전) — 열린 질의를 거부 대신 처리 ===
+    # Q15 상장/비상장 카운트
+    if any(kw in question for kw in LISTING_KEYWORDS):
+        return {"answer": template_listing_count(g), "route": "listing_count",
+                "context_summary": "피투자사 상장구분 SPARQL"}
+    # Q14 결재/전결권 순서
+    if any(kw in question for kw in APPROVAL_KEYWORDS):
+        return {"answer": template_approval(g, matched_investment), "route": "approval_order",
+                "context_summary": "전��권 lookup"}
+    # Q12 금액 최대
+    if any(kw in question for kw in MAXAMOUNT_KEYWORDS):
+        return {"answer": template_max_amount(g), "route": "aggregation_max",
+                "context_summary": "금액 MAX SPARQL"}
+    # Q13 다중 투자
+    if any(kw in question for kw in MULTIPLICITY_KEYWORDS):
+        return {"answer": template_multiplicity(g), "route": "multiplicity",
+                "context_summary": "분기/피투자 카운트 SPARQL"}
+    # Q11 진행 중 전체 목록
+    if any(kw in question for kw in LIST_ACTIVE_KEYWORDS):
+        return {"answer": template_list_active(g), "route": "list_active",
+                "context_summary": "활성 검토건 SPARQL"}
+    # Q8 거래상대방 식별
+    if any(kw in question for kw in COUNTERPARTY_KEYWORDS):
+        return {"answer": template_counterparty_overview(g, matched_investment), "route": "counterparty",
+                "context_summary": "거래상대방 다층 구조"}
+    # 2-7. 매칭 안 됨 — 안내
+    fallback = (
+        "이 시스템은 다음과 같은 질문에 답변할 수 있습니다:\n\n"
+        "**1. 검토건 진행 상태** (예시 검토건 또는 직접 등록한 검토건 대상)\n"
+        "  • \"ABC펀드 검토건은 어디까지 갔어?\"\n"
+        "  • \"방금 등록한 펀드는 단계가 어떻게 돼?\"\n\n"
+        "**2. 단계별 검토건 추출**\n"
+        "  • \"약정 단계 이후로 진행된 검토건은?\"\n"
+        "  • \"정체된 검토건 있어?\"\n\n"
+        "**3. 위험가중치 조회**\n"
+        "  • \"AAA 등급 중앙정부 익스포져 위험가중치는?\"\n\n"
+        "**4. 규제 설명**\n"
+        "  • \"LP출자한 펀드의 RWA는 어떻게 산정해?\"\n"
+        "  • \"적합성 원칙은 어떻게 확인해?\"\n"
+        "  • \"대체투자 분류 기준은?\"\n\n"
+        "📌 위 범위 외의 질문(일반 금융 상식, 회사 실제 데이터 등)에는 정확한 답변이 어렵습니다."
+    )
+    return {
+        "answer": fallback,
+        "route": "guidance",
+        "context_summary": "매칭 실패, 가이드 응답",
+    }
+# ============================================
+# 5. 축 B — LLM 의도 파싱 (KoSimCSE 의미검색은 다음 단계)
+# ============================================
+INTENT_SYSTEM = (
+    "너는 LP출자 검토 질의 분석기다. 질문을 읽고 아래 스키마의 JSON만 출력해라. 설명·코드블록·주석 금지.\n"
+    '스키마: {"intent":"...","fund":null,"operation":null,"concept":null}\n'
+    "\n"
+    "[intent 가이드 — 공식어/구어체 모두 포함]\n"
+    "- investment_status: 특정 펀드/검토건의 현재 단계 (예: \"ive 어디까지\", \"aespa 건 작업 상황\", \"twice 진행 단계\", \"ive 쪽은 지금 일 어디까지\")\n"
+    "- stage_threshold: 특정 단계 이후 진행된 검토건 (예: \"약정 이후\", \"사인 끝내고 다음 단계로 넘어간\", \"한도약정 통과한\")\n"
+    "- review_stalled: 정체·결재 안 난 검토건 (예: \"막힌\", \"지체\", \"결재 못 받고 멈춰있는\", \"올렸는데 답이 없는\")\n"
+    "- list_active: 진행 중인 검토건 전체 목록 (예: \"검토 진행 중인 건들\", \"회사가 들여다보는 딜\", \"전체 검토건\")\n"
+    "- aggregation: 금액 최대·최소·합계 (예: \"가장 큰\", \"제일 큰\", \"규모가 제일 센\", \"최대 금액\", \"한도가 가장 높은\")\n"
+    "- multiplicity: 한 건에 분기 다수 또는 한 펀드가 다수 투자 (예: \"한 방에 여러 군데 꽂는\", \"여러 개 동시\", \"복수 투자\", \"한번에 여러\")\n"
+    "- approval_order: 결재·전결권 순서 (예: \"결재 순서\", \"사인 누구한테 받아야\", \"승인권자\", \"전결 누구\")\n"
+    "- listing_count: 피투자사 상장/비상장 카운트 (예: \"상장사 몇 개\", \"비상장 몇 개\", \"코스피·코스닥 올라간 회사\", \"상장 여부 갯수\")\n"
+    "- counterparty: 거래상대방 식별·다층 구조 (예: \"거래상대방\", \"딜할 때 상대방\", \"누구를 봐야\", \"상대편 식별\")\n"
+    "- deterministic_lookup: 정형 수치 조회(자산분류+신용등급→%, BIS/위험가중치 표). 트리거: 신용등급(AAA/A+ 등) + 자산명 + 수치 질문 (예: \"AAA 정부채권 위험가중치\", \"BBB 회사채 자기자본 비율 몇 %\", \"중앙정부 가중치\")\n"
+    "- rag_concept: 규제 개념·원칙·산정 방법 설명 (예: \"적합성 원칙\", \"대체투자 분류 기준\", \"RWA 산정 방법\", \"고객한테 적합한 상품인지\")\n"
+    "- unknown: 위 어디에도 해당 없음\n"
+    "\n"
+    "[fund]: 검토건의 펀드/별칭. 비일상 영문 소문자 토큰(ive/aespa/twice/abc 등) 또는 한글 펀드명. 없으면 null.\n"
+    "[operation]: aggregation일 때만 max/min/sum/count, 아니면 null.\n"
+    "[concept]: rag_concept일 때만 RWA_Calculation/SuitabilityCheck/AlternativeInvestmentClassification/ExplanationDuty/ConsumerClassification/ProductDefinition/CustomerIdentification/TotalExposureLimit/PortfolioMonitoring/SoundnessGrading 등, 아니면 null.\n"
+    "\n"
+    "[예시]\n"
+    "Q: \"aespa 건 작업 상황 좀 알려줘.\"\n"
+    '{"intent":"investment_status","fund":"aespa","operation":null,"concept":null}\n'
+    "Q: \"딜할 때 상대방 쪽은 누구를 살펴야 해?\"\n"
+    '{"intent":"counterparty","fund":null,"operation":null,"concept":null}\n'
+    "Q: \"AAA 등급 정부 채권 자기자본 비율 산정할 때 몇 % 잡아?\"\n"
+    '{"intent":"deterministic_lookup","fund":null,"operation":null,"concept":null}\n'
+    "Q: \"코스피·코스닥 올라간 회사랑 안 올라간 회사 숫자 좀.\"\n"
+    '{"intent":"listing_count","fund":null,"operation":null,"concept":null}\n'
+    "Q: \"규모가 제일 센 투자가 뭐야?\"\n"
+    '{"intent":"aggregation","fund":null,"operation":"max","concept":null}\n'
+    "Q: \"한 방에 여러 군데 꽂는 거 있어?\"\n"
+    '{"intent":"multiplicity","fund":null,"operation":null,"concept":null}\n'
+    "Q: \"고객한테 적합한 상품인지 어떻게 보지?\"\n"
+    '{"intent":"rag_concept","fund":null,"operation":null,"concept":"SuitabilityCheck"}'
+)
+def llm_parse_intent(question, model_name="gemma4:e4b", use_anthropic=False):
+    """1차 LLM 호출 — 질의를 구조화 JSON으로 파싱. 실패 시 None (→ 키워드 라우터 fallback)."""
+    import json as _json
+    try:
+        if use_anthropic:
+            import os, anthropic
+            key = os.environ.get("ANTHROPIC_API_KEY", "")
+            if not key:
+                return None
+            cli = anthropic.Anthropic(api_key=key)
+            resp = cli.messages.create(
+                model=os.environ.get("ANTHROPIC_MODEL", "claude-sonnet-4-6"),
+                max_tokens=200, temperature=0, system=INTENT_SYSTEM,
+                messages=[{"role": "user", "content": question}])
+            txt = "".join(b.text for b in resp.content if hasattr(b, "text"))
+        else:
+            import requests
+            r = requests.post("http://localhost:11434/api/generate",
+                json={"model": model_name, "system": INTENT_SYSTEM, "prompt": question,
+                      "format": "json", "stream": False, "options": {"temperature": 0}}, timeout=60)
+            txt = r.json().get("response", "")
+        s, e = txt.find("{"), txt.rfind("}")
+        if s < 0 or e < 0:
+            return None
+        d = _json.loads(txt[s:e + 1])
+        return d if isinstance(d, dict) and d.get("intent") else None
+    except Exception:
+        return None
+def _resolve_fund(g, fund_name):
+    if not fund_name:
+        return None
+    for inv in query_all_investments_with_label(g):
+        if inv.get("n_branches", 0) == 0:
+            continue
+        blob = inv["label"] + " " + inv["fund_label"]
+        if str(fund_name) and str(fund_name).lower() in blob.lower():
+            return inv["iri"]
+    return None
+def _resolve_concept(question, parser_concept):
+    """rag_concept intent에서 concept_id를 확정.
+    우선순위: ① LLM 파서 명시값(유효 시) → ② 키워드 ID 매칭 → ③ KoSimCSE 의미검색.
+    """
+    valid = {
+        "RWA_Calculation", "SuitabilityCheck", "AlternativeInvestmentClassification",
+        "ExplanationDuty", "ConsumerClassification", "ProductDefinition",
+        "CustomerIdentification", "TotalExposureLimit", "CommitmentRegistration",
+        "PortfolioMonitoring", "SoundnessGrading", "OngoingReporting",
+    }
+    if parser_concept:
+        pc = parser_concept.replace("Concept_", "")
+        if pc in valid:
+            return f"Concept_{pc}"
+    kw = detect_concept_from_question(question)
+    if kw:
+        return kw
+    try:
+        from semantic_search import detect_concept_semantic
+        return detect_concept_semantic(question, top_k=1, min_score=0.40)
+    except Exception:
+        return None
+def _answer_rag_concept_semantic(question, g, chunks, lookup, concept_id,
+                                 use_gemma=True, model_name="gemma4:e4b"):
+    """rag_concept 라우트의 의미검색 버전. 청크는 항상 KoSimCSE top-k."""
+    from semantic_search import search_chunks_semantic
+    # 의미검색으로 top-5 → 점수 0.30 미만은 잘라 노이즈 컷
+    sem_chunks = search_chunks_semantic(chunks, question, top_k=5, min_score=0.30)
+    # concept이 잡혔으면 그 concept 메타 청크를 boost(앞으로): "의미 1위 + concept 매칭 청크 우선"
+    if concept_id:
+        meta_chunks = search_chunks_by_concept(chunks, concept_id, top_k=3)
+        meta_ids = {c.get("id") for c in meta_chunks}
+        sem_ids = {c.get("id") for c in sem_chunks}
+        boosted = meta_chunks + [c for c in sem_chunks if c.get("id") not in meta_ids]
+        relevant = boosted[:5]
+    else:
+        relevant = sem_chunks[:3]
+    if not relevant:
+        return {
+            "answer": "관련 규제 정보를 찾을 수 없습니다. 다른 표현으로 다시 질문해주세요.",
+            "route": "llm:rag_concept_semantic_no_match",
+            "context_summary": "의미검색 결과 없음",
+        }
+    chunk_context = "\n\n".join([
+        f"[근거 {i+1}] {c.get('id', '')}\n{c.get('text', '')[:1500]}"
+        for i, c in enumerate(relevant)
+    ])
+    if use_gemma:
+        gemma_answer, gemma_ok = call_gemma(question, chunk_context, mode="standard", model_name=model_name)
+    else:
+        gemma_answer, gemma_ok = None, False
+    if gemma_ok:
+        answer = gemma_answer
+    else:
+        answer = (
+            f"**관련 규제 근거 ({len(relevant)}개 청크 — KoSimCSE 의미검색):**\n\n"
+            + "\n\n".join([f"📄 **{c.get('id', '')}**\n{c.get('text', '')[:500]}..." for c in relevant])
+        )
+    return {
+        "answer": answer,
+        "route": f"llm:rag_concept_semantic ({concept_id or '의미만'})",
+        "context_summary": f"KoSimCSE {len(relevant)}개 청크 (concept={concept_id})",
+    }
+def answer_question_llm(question, g, chunks, alias, lookup, model_name="gemma4:e4b",
+                        use_anthropic=False, use_gemma_gen=True, use_semantic=False):
+    """축 B 진입점: LLM 의도파싱 → 라우팅.
+    use_semantic=True 면 rag_concept 라우트에 KoSimCSE 의미검색 활성화 (Q6·Q7 견고화).
+    파싱 실패/unknown → 키워드 answer_question로 fallback.
+    """
+    p = llm_parse_intent(question, model_name, use_anthropic)
+    if not p:
+        return answer_question(question, g, chunks, alias, lookup, use_gemma=use_gemma_gen, model_name=model_name)
+    intent = p.get("intent")
+    inv_iri = _resolve_fund(g, p.get("fund"))
+    R = lambda ans, rt: {"answer": ans, "route": f"llm:{rt}", "context_summary": f"LLM의도파싱 intent={intent}"}
+    if intent == "list_active":     return R(template_list_active(g), "list_active")
+    if intent == "aggregation":     return R(template_max_amount(g), "aggregation")
+    if intent == "multiplicity":    return R(template_multiplicity(g), "multiplicity")
+    if intent == "approval_order":  return R(template_approval(g, inv_iri), "approval_order")
+    if intent == "listing_count":   return R(template_listing_count(g), "listing_count")
+    if intent == "counterparty":    return R(template_counterparty_overview(g, inv_iri), "counterparty")
+    if intent == "stage_threshold": return R(template_stage_threshold(g, threshold_order=1), "stage_threshold")
+    if intent == "review_stalled":  return R(template_review_stalled(g), "review_stalled")
+    if intent == "investment_status" and inv_iri:
+        meta = query_investment_meta(g, inv_iri)
+        return R(template_investment_status(meta, query_investment_branches(g, inv_iri)), "investment_status")
+    if intent == "rag_concept" and use_semantic:
+        cid = _resolve_concept(question, p.get("concept"))
+        return _answer_rag_concept_semantic(question, g, chunks, lookup, cid,
+                                            use_gemma=use_gemma_gen, model_name=model_name)
+    # deterministic_lookup / rag_concept(키워드모드) / unknown / fund 미해결 → 키워드 라우터 재사용
+    return answer_question(question, g, chunks, alias, lookup, use_gemma=use_gemma_gen, model_name=model_name)

code/semantic_search.py ADDED Viewed

	@@ -0,0 +1,309 @@

+"""KoSimCSE 의미검색 — 축 B.
+청크 274개 + RegulatoryConcept 12개를 KoSimCSE 문장 임베딩으로 인코딩하고,
+질의 임베딩과 코사인 유사도 top-k 반환. 기존 키워드 매칭(search_chunks_by_concept/
+search_chunks_by_keyword, detect_concept_from_question)의 의미적 대체.
+캐시: ontology/_embeddings_cache/*.npz (소스 파일 mtime 동봉; 변경 시 재계산).
+모델: BM-K/KoSimCSE-roberta (~440MB, 폐쇄망에서는 사전 prebake 필요).
+"""
+from __future__ import annotations
+import os, json, hashlib
+from pathlib import Path
+from typing import Optional
+import numpy as np
+# 기본 경로 — rag_engine과 같은 'code/' 디렉토리에 위치한다고 가정
+_ROOT = Path(__file__).resolve().parent.parent  # active/
+_CACHE_DIR = _ROOT / "ontology" / "_embeddings_cache"
+_TTL_PATH = _ROOT / "ontology" / "investment_ontology_v1_10.ttl"
+_CHUNKS_PATH = _ROOT / "ontology" / "regulations_chunks_v14.jsonl"
+MODEL_NAME = os.environ.get("KOSIMCSE_MODEL", "BM-K/KoSimCSE-roberta")
+# 모듈 전역 — lazy 로드
+_tokenizer = None
+_hf_model = None
+_chunk_cache = None   # {"ids": [str], "vecs": ndarray, "chunks": [dict]}
+_concept_cache = None # {"ids": [str], "vecs": ndarray, "labels": [str], "comments": [str]}
+# ----------------------------------------------------------------------
+# 모델 로드 — KoSimCSE는 sentence-transformers 네이티브가 아니므로
+# transformers로 직접 로드해 CLS 토큰(=문장 임베딩)을 뽑는다.
+# (sentence-transformers로 감싸면 mean pooling이 자동 적용돼 품질이 떨어짐.)
+# ----------------------------------------------------------------------
+def _get_model():
+    global _tokenizer, _hf_model
+    if _hf_model is None:
+        from transformers import AutoModel, AutoTokenizer
+        import torch
+        _tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+        _hf_model = AutoModel.from_pretrained(MODEL_NAME)
+        _hf_model.eval()
+        # MPS는 짧은 시퀀스에서 간헐적 NaN/Inf 관측 → CPU 기본. 환경변수로 강제 가능.
+        force = os.environ.get("KOSIMCSE_DEVICE", "cpu")
+        device = force if force else "cpu"
+        _hf_model.to(device)
+    return _tokenizer, _hf_model
+def _embed(texts: list[str]) -> np.ndarray:
+    """문장 리스트 → (n, d) L2-normalized ndarray (KoSimCSE CLS token)."""
+    import torch
+    tok, model = _get_model()
+    device = next(model.parameters()).device
+    out = []
+    batch_size = 32
+    with torch.no_grad():
+        for i in range(0, len(texts), batch_size):
+            batch = texts[i:i + batch_size]
+            enc = tok(batch, padding=True, truncation=True,
+                      max_length=128, return_tensors="pt").to(device)
+            embeddings, _ = model(**enc, return_dict=False)
+            cls = embeddings[:, 0]  # [CLS] = 문장 표현
+            cls = torch.nn.functional.normalize(cls, p=2, dim=1, eps=1e-8)
+            arr = cls.cpu().numpy().astype(np.float32)
+            # 안전망: NaN/Inf → 0벡터 (검색 점수 0)
+            bad = ~np.isfinite(arr).all(axis=1)
+            if bad.any():
+                arr[bad] = 0.0
+            out.append(arr)
+    return np.vstack(out)
+# ----------------------------------------------------------------------
+# 캐시 헬퍼
+# ----------------------------------------------------------------------
+def _file_fingerprint(path: Path) -> str:
+    """파일 mtime+size로 간단한 fingerprint. 내용 hash까지 가면 느려서 보류."""
+    if not path.exists():
+        return "missing"
+    st = path.stat()
+    return f"{int(st.st_mtime)}-{st.st_size}"
+def _cache_path(name: str) -> Path:
+    _CACHE_DIR.mkdir(parents=True, exist_ok=True)
+    return _CACHE_DIR / name
+def _load_npz_cache(path: Path, expected_fp: str, expected_model: str):
+    """fingerprint·모델명이 일치하면 로드, 아니면 None."""
+    if not path.exists():
+        return None
+    try:
+        d = np.load(path, allow_pickle=True)
+        if str(d["fingerprint"]) != expected_fp or str(d["model"]) != expected_model:
+            return None
+        return d
+    except Exception:
+        return None
+# ----------------------------------------------------------------------
+# 청크 임베딩
+# ----------------------------------------------------------------------
+def _build_chunk_text(chunk: dict) -> str:
+    """임베딩용 텍스트 구성. 본문 + 법령명(있으면) — 메타 신호 강화."""
+    meta = chunk.get("metadata", {})
+    head = []
+    if meta.get("law_name"):
+        head.append(meta["law_name"])
+    if meta.get("article_label"):
+        head.append(meta["article_label"])
+    prefix = " ".join(head)
+    body = chunk.get("text", "")
+    # KoSimCSE roberta max_seq_length 보통 128. 너무 길면 잘림 — 짧게 유지.
+    return (prefix + " " + body).strip()[:512]
+def _load_or_build_chunk_cache(chunks: list[dict]):
+    global _chunk_cache
+    if _chunk_cache is not None:
+        return _chunk_cache
+    fp = _file_fingerprint(_CHUNKS_PATH)
+    cache_path = _cache_path("chunks_v14_kosimcse.npz")
+    cached = _load_npz_cache(cache_path, fp, MODEL_NAME)
+    if cached is not None:
+        _chunk_cache = {
+            "ids": list(cached["ids"]),
+            "vecs": cached["vecs"],
+            "chunks": chunks,
+        }
+        return _chunk_cache
+    texts = [_build_chunk_text(c) for c in chunks]
+    ids = [c.get("id", f"_idx_{i}") for i, c in enumerate(chunks)]
+    vecs = _embed(texts)
+    np.savez(cache_path,
+             ids=np.array(ids, dtype=object),
+             vecs=vecs,
+             fingerprint=fp,
+             model=MODEL_NAME)
+    _chunk_cache = {"ids": ids, "vecs": vecs, "chunks": chunks}
+    return _chunk_cache
+# ----------------------------------------------------------------------
+# RegulatoryConcept 임베딩
+# ----------------------------------------------------------------------
+def _load_concepts_from_ttl():
+    """TTL에서 RegulatoryConcept (id, label, comment) 추출."""
+    from rdflib import Graph
+    g = Graph()
+    g.parse(str(_TTL_PATH), format="turtle")
+    q = """
+    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
+    PREFIX rdf:  <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
+    PREFIX ex:   <http://company.com/investment-ontology#>
+    SELECT ?c ?label ?comment WHERE {
+      ?c rdf:type ex:RegulatoryConcept .
+      OPTIONAL { ?c rdfs:label   ?label }
+      OPTIONAL { ?c rdfs:comment ?comment }
+    } ORDER BY ?c
+    """
+    out = []
+    for row in g.query(q):
+        cid = str(row[0]).split("#")[-1]
+        lbl = str(row[1]) if row[1] is not None else ""
+        cmt = str(row[2]) if row[2] is not None else ""
+        out.append((cid, lbl, cmt))
+    return out
+def _load_or_build_concept_cache():
+    global _concept_cache
+    if _concept_cache is not None:
+        return _concept_cache
+    fp = _file_fingerprint(_TTL_PATH)
+    cache_path = _cache_path("concepts_v1_10_kosimcse.npz")
+    cached = _load_npz_cache(cache_path, fp, MODEL_NAME)
+    if cached is not None:
+        _concept_cache = {
+            "ids": list(cached["ids"]),
+            "labels": list(cached["labels"]),
+            "comments": list(cached["comments"]),
+            "vecs": cached["vecs"],
+        }
+        return _concept_cache
+    rows = _load_concepts_from_ttl()
+    ids = [r[0] for r in rows]
+    labels = [r[1] for r in rows]
+    comments = [r[2] for r in rows]
+    texts = [(lbl + " " + cmt).strip() or cid for cid, lbl, cmt in rows]
+    vecs = _embed(texts)
+    np.savez(cache_path,
+             ids=np.array(ids, dtype=object),
+             labels=np.array(labels, dtype=object),
+             comments=np.array(comments, dtype=object),
+             vecs=vecs,
+             fingerprint=fp,
+             model=MODEL_NAME)
+    _concept_cache = {"ids": ids, "labels": labels, "comments": comments, "vecs": vecs}
+    return _concept_cache
+# ----------------------------------------------------------------------
+# 공개 API
+# ----------------------------------------------------------------------
+def _cosine_scores(vecs: np.ndarray, qv: np.ndarray) -> np.ndarray:
+    """코사인 점수 — NaN/Inf 안전 (점수 -∞ 처리)."""
+    with np.errstate(divide="ignore", over="ignore", invalid="ignore"):
+        s = vecs @ qv
+    s = np.nan_to_num(s, nan=-np.inf, posinf=-np.inf, neginf=-np.inf)
+    return s
+def search_chunks_semantic(chunks: list[dict], query: str, top_k: int = 5,
+                           min_score: float = 0.0) -> list[dict]:
+    """질의 의미와 가장 가까운 청크 top_k. 각 청크에 _semantic_score 추가."""
+    cache = _load_or_build_chunk_cache(chunks)
+    qv = _embed([query])[0]
+    scores = _cosine_scores(cache["vecs"], qv)
+    order = np.argsort(-scores)[:top_k]
+    out = []
+    for idx in order:
+        s = float(scores[idx])
+        if not np.isfinite(s) or s < min_score:
+            continue
+        c = dict(cache["chunks"][idx])
+        c["_semantic_score"] = s
+        out.append(c)
+    return out
+def detect_concept_semantic(query: str, top_k: int = 1,
+                            min_score: float = 0.35) -> Optional[str]:
+    """질의 의미와 가장 가까운 RegulatoryConcept ID. min_score 미만이면 None."""
+    cache = _load_or_build_concept_cache()
+    qv = _embed([query])[0]
+    scores = _cosine_scores(cache["vecs"], qv)
+    order = np.argsort(-scores)[:top_k]
+    best_idx = int(order[0])
+    best_score = float(scores[best_idx])
+    if not np.isfinite(best_score) or best_score < min_score:
+        return None
+    return cache["ids"][best_idx]
+def detect_concept_semantic_topk(query: str, top_k: int = 3) -> list[tuple[str, float, str]]:
+    """디버깅용: (concept_id, score, label) top_k 반환."""
+    cache = _load_or_build_concept_cache()
+    qv = _embed([query])[0]
+    scores = _cosine_scores(cache["vecs"], qv)
+    order = np.argsort(-scores)[:top_k]
+    return [(cache["ids"][i], float(scores[i]), cache["labels"][i]) for i in order]
+def warm_up(chunks: list[dict]):
+    """모델·캐시를 미리 로드. 첫 질의 응답 지연 회피."""
+    _get_model()
+    _load_or_build_chunk_cache(chunks)
+    _load_or_build_concept_cache()
+# ----------------------------------------------------------------------
+# CLI: 캐시 빌드 단독 실행
+# ----------------------------------------------------------------------
+if __name__ == "__main__":
+    import argparse, sys
+    parser = argparse.ArgumentParser(description="KoSimCSE 임베딩 캐시 빌드 + 간단 테스트")
+    parser.add_argument("--query", help="테스트 질의")
+    parser.add_argument("--top-k", type=int, default=5)
+    parser.add_argument("--concepts-only", action="store_true",
+                        help="청크 임베딩 빌드 생략 (Concept만)")
+    args = parser.parse_args()
+    print(f"[load] 모델 = {MODEL_NAME}")
+    _get_model()
+    print("[load] 모델 OK")
+    print("[build] concept 캐시")
+    c_cache = _load_or_build_concept_cache()
+    print(f"  → {len(c_cache['ids'])} concept 임베딩")
+    chunks = []
+    if not args.concepts_only:
+        print("[build] 청크 캐시")
+        with open(_CHUNKS_PATH, encoding="utf-8") as f:
+            chunks = [json.loads(line) for line in f if line.strip()]
+        ch_cache = _load_or_build_chunk_cache(chunks)
+        print(f"  → {len(ch_cache['ids'])} 청크 임베딩")
+    if args.query:
+        print(f"\n[test] 질의 = {args.query!r}")
+        print("  concept top-3:")
+        for cid, sc, lbl in detect_concept_semantic_topk(args.query, top_k=3):
+            print(f"    {sc:.3f}  {cid}  ({lbl})")
+        if chunks:
+            print("  chunk top-k:")
+            for c in search_chunks_semantic(chunks, args.query, top_k=args.top_k):
+                meta = c.get("metadata", {})
+                print(f"    {c['_semantic_score']:.3f}  {c.get('id'):20}  "
+                      f"({meta.get('law_name','-')} {meta.get('article_label','-')})")

data/alias_dictionary.json ADDED Viewed

	@@ -0,0 +1,81 @@

+{
+  "_metadata": {
+    "version": "v1.0",
+    "purpose": "한국 LP출자 도메인 동의어·alias 사전. RAG query expansion 및 청크 검색에 사용.",
+    "perspective": "LP_조합원",
+    "note": "Gemma 4 e4b 등 영어 중심 LLM의 한국 금융 도메인 동의어 처리 한계 보완용"
+  },
+  "investment_actors": {
+    "LP출자": ["조합원 출자", "유한책임사원 출자", "펀드 출자", "간접 투자", "출자"],
+    "GP": ["업무집행조합원", "운용사", "자산운용사", "일반사원", "운용 GP", "Sponsor"],
+    "LP": ["유한책임사원", "조합원", "출자자", "Limited Partner"],
+    "출자대상펀드": ["피투자펀드", "투자대상펀드", "RecipientFund"],
+    "최종투자대상": ["피투자회사", "투자대상회사", "Portfolio Company", "최종 투자처"]
+  },
+  "fund_types": {
+    "PEF": ["사모투자합자회사", "사모펀드", "경영참여형 사모집합투자기구", "Private Equity Fund"],
+    "투자합자조합": ["투자합자조합", "PEF 투자합자조합"],
+    "벤처투자조합": ["벤처조합", "벤처투자펀드", "VC조합"],
+    "신기술사업투자조합": ["신기술조합", "신기술펀드", "NTF"],
+    "투자신탁": ["수익증권", "Investment Trust"],
+    "투자회사": ["뮤추얼펀드", "Investment Company"],
+    "사모집합투자기구": ["사모펀드", "Private Fund"],
+    "REITs": ["부동산투자회사", "리츠"]
+  },
+  "products": {
+    "LP출자": ["조합원 출자", "유한책임사원 출자", "펀드 출자"],
+    "인수금융": ["M&A 금융", "Acquisition Finance", "LBO 대출", "인수자금 대출"],
+    "메자닌": ["전환사채", "신주인수권부사채", "교환사채", "Mezzanine"],
+    "직접투자": ["직접 인수", "Direct Investment"]
+  },
+  "regulatory_concepts": {
+    "신용공여한도": ["동일차주 한도", "여신한도", "대주주 한도", "신용공여 한도", "Total Exposure Limit", "토탈 익스포져"],
+    "RWA": ["위험가중자산", "Risk Weighted Asset", "위험가중치"],
+    "위험가중치": ["RW", "Risk Weight", "리스크 웨이트"],
+    "익스포져": ["Exposure", "노출액", "익스포저"],
+    "표준방법": ["Standardised Approach", "SA", "표준 접근법"],
+    "내부등급법": ["IRB", "Internal Ratings-Based", "내부평가법"],
+    "자기자본비율": ["BIS 비율", "자본비율", "Capital Adequacy Ratio", "CAR"],
+    "대체투자": ["Alternative Investment", "AI", "대체자산투자"],
+    "자산건전성분류": ["건전성분류", "건전성 등급", "자산분류", "Asset Quality Classification"],
+    "적합성원칙": ["Suitability", "Suitability Rule"],
+    "설명의무": ["Disclosure", "설명 의무", "Explanation Duty"],
+    "고객확인": ["KYC", "Know Your Customer", "고객확인의무", "CDD"],
+    "자금세탁방지": ["AML", "Anti-Money Laundering", "자금세탁 방지"],
+    "내부통제": ["Internal Control", "내부 통제"]
+  },
+  "process_steps": {
+    "거래상대방 식별": ["고객등록", "거래상대방 등록", "Customer Registration"],
+    "투자상담": ["상담", "Investment Consultation", "사전 상담"],
+    "사전심사": ["사전협의", "Pre-screening", "Preliminary Screening", "사전 검토"],
+    "예비검토": ["Preliminary Review", "1차 검토"],
+    "실무협의회": ["실무협의", "Working Level Review", "실무 검토"],
+    "투자품의": ["품의", "Investment Proposal", "Proposal"],
+    "한도약정": ["약정", "Commitment", "약정 체결"],
+    "실행품의": ["개별품의", "Drawdown Proposal"],
+    "사후관리": ["Post Management", "사후 관리"]
+  },
+  "asset_classes_byulpyo3": {
+    "중앙정부 익스포져": ["국채", "국가 익스포져", "Sovereign", "Central Government"],
+    "은행 익스포져": ["은행 차주", "Bank Exposure"],
+    "기업 익스포져": ["회사 익스포져", "Corporate Exposure", "기업 차주"],
+    "주식 익스포져": ["Equity Exposure", "지분 익스포져"],
+    "집합투자증권 익스포져": ["펀드 익스포져", "수익증권", "집합투자기구 익스포져", "CIS Exposure", "LP출자 RWA"],
+    "소매 익스포져": ["Retail Exposure", "리테일", "개인 익스포져"],
+    "주거용주택담보 익스포져": ["주담대", "Residential Mortgage", "주택 담보"],
+    "상업용부동산 익스포져": ["CRE", "Commercial Real Estate"],
+    "부동산개발금융": ["부동산 PF", "PF", "Project Financing", "브릿지론"]
+  },
+  "laws": {
+    "자본시장법": ["자본시장과 금융투자업에 관한 법률", "CMFA", "Capital Markets Act"],
+    "여전법": ["여신전문금융업법", "SFA", "여전금융업법"],
+    "은행법": ["BA", "Banking Act"],
+    "은행업감독규정": ["감독규정", "BSR"],
+    "은행업감독업무시행세칙": ["시행세칙", "BSER", "은감세칙"],
+    "특금법": ["특정금융정보법", "AMLA", "자금세탁방지법"],
+    "신용정보법": ["CIA", "Credit Information Act"],
+    "금소법": ["금융소비자보호법", "FCPA"],
+    "벤처투자법": ["VIA", "벤처기업육성에 관한 특별조치법"],
+    "대체투자모범규준": ["여전사 대체투자 리스크관리 모범규준", "SFAAI", "AI Best Practices"]
+  }
+}

data/investment_ontology_v1_10.ttl ADDED Viewed

The diff for this file is too large to render. See raw diff

data/regulations_chunks_v14.jsonl ADDED Viewed

The diff for this file is too large to render. See raw diff

data/risk_weight_lookup.json ADDED Viewed

	@@ -0,0 +1,155 @@

+{
+  "_metadata": {
+    "version": "v1.0",
+    "purpose": "별표 3 자산분류별 위험가중치 deterministic lookup. LLM 생성 대신 코드에서 직접 조회.",
+    "source": "은행업감독업무시행세칙 별표 3 제2장 제3절 (위험가중치)",
+    "perspective": "표준방법(SA) 적용. LP출자(집합투자증권 익스포져)는 '집합투자증권' 항목 참조."
+  },
+  "asset_classes": {
+    "중앙정부": {
+      "asset_id": "CentralGov",
+      "clause_id": "BSER_App3_Asset_CentralGov",
+      "lookup_method": "신용등급",
+      "table": {
+        "AAA~AA-": "0%",
+        "A+~A-": "20%",
+        "BBB+~BBB-": "50%",
+        "BB+~B-": "100%",
+        "B-미만": "150%",
+        "무등급": "100%"
+      },
+      "special_rules": {
+        "대한민국 중앙정부 (원화 표시·조달)": "0%",
+        "OECD 국가신용도 0~1": "0%",
+        "OECD 국가신용도 2": "20%",
+        "OECD 국가신용도 3": "50%",
+        "OECD 국가신용도 4~6": "100%",
+        "OECD 국가신용도 7": "150%"
+      }
+    },
+    "국제결제은행등": {
+      "asset_id": "IntlSettlementBank",
+      "clause_id": "BSER_App3_Asset_CentralGov",
+      "lookup_method": "고정",
+      "fixed_weight": "0%",
+      "applicable_to": ["BIS", "IMF", "ECB", "EU", "ESM", "EFSF"]
+    },
+    "은행": {
+      "asset_id": "Bank",
+      "clause_id": "BSER_App3_Asset_Bank",
+      "lookup_method": "신용등급+만기",
+      "table_short_term": {
+        "AAA~AA-": "20%",
+        "A+~A-": "20%",
+        "BBB+~BBB-": "20%",
+        "BB+~B-": "50%",
+        "B-미만": "150%",
+        "무등급": "20%"
+      },
+      "table_long_term": {
+        "AAA~AA-": "20%",
+        "A+~A-": "30%",
+        "BBB+~BBB-": "50%",
+        "BB+~B-": "100%",
+        "B-미만": "150%",
+        "무등급": "40~75%"
+      },
+      "note": "단기(3개월 이하)와 장기 위험가중치 다름. 자세한 경우는 별표 3 본문 참조."
+    },
+    "기업": {
+      "asset_id": "Corporate",
+      "clause_id": "BSER_App3_Asset_Corporate",
+      "lookup_method": "신용등급",
+      "table": {
+        "AAA~AA-": "20%",
+        "A+~A-": "50%",
+        "BBB+~BBB-": "75%",
+        "BB+~B-": "100%",
+        "B-미만": "150%",
+        "무등급": "100%"
+      },
+      "note": "투자등급 외 기업의 무등급은 기업의 매출액 등에 따라 추가 분류 필요"
+    },
+    "주식": {
+      "asset_id": "Equity",
+      "clause_id": "BSER_App3_Asset_Equity",
+      "lookup_method": "구분",
+      "table": {
+        "거래소 상장주식": "250%",
+        "비상장주식 (적격투자)": "400%",
+        "비상장주식 (기타)": "400%",
+        "신종자본증권": "150%"
+      },
+      "note": "2024.1.31 개정 기준. 일부 항목은 본문 참조."
+    },
+    "집합투자증권": {
+      "asset_id": "CIS",
+      "clause_id": "BSER_App3_Asset_CIS",
+      "lookup_method": "산정방법별",
+      "is_lp_default_asset_class": true,
+      "lp_note": "LP출자는 펀드 형태(신기술사업투자조합·벤처투자조합·사모투자신탁·투자회사·사모집합투자기구) 무관하게 모두 본 분류 적용",
+      "calculation_methods": {
+        "기초자산접근법": {
+          "code": "LBA",
+          "english": "Look-Through Approach",
+          "description": "집합투자증권의 기초자산을 은행이 실제 보유한 것으로 가정하여 위험가중치 산출",
+          "conditions": [
+            "은행이 기초자산에 대한 충분히 상세한 정보를 적시 입수 가능",
+            "정보가 증권예탁기관·수탁은행·집합투자업자 등 독립적 제3자에 의해 검증"
+          ]
+        },
+        "위임접근법": {
+          "code": "MBA",
+          "english": "Mandate-Based Approach",
+          "description": "집합투자증권의 운용 위임 정보를 기반으로 위험가중치 산출",
+          "conditions": [
+            "기초자산접근법 요건 미충족 시 적용 가능",
+            "운용 정보(투자 가이드라인 등) 활용"
+          ]
+        },
+        "대체접근법": {
+          "code": "FBA",
+          "english": "Fall-Back Approach",
+          "description": "위 두 방법 모두 적용 불가 시 1250% 위험가중치 일률 적용",
+          "weight": "1250%"
+        }
+      },
+      "additional_notes": [
+        "미실행된 출자약정 금액에 신용환산율을 적용한 금액 포함",
+        "RW 산출방식 3가지 중 하나 이상 선택 적용",
+        "파생상품 거래 포함 시 거래상대방 신용위험 RWA도 별도 산출"
+      ]
+    },
+    "소매": {
+      "asset_id": "Retail",
+      "clause_id": "BSER_App3_Asset_Retail",
+      "table": {
+        "일반 소매": "75%",
+        "신용카드(거래자)": "45%",
+        "신용카드(기타)": "75%"
+      }
+    },
+    "주거용주택담보": {
+      "asset_id": "ResidentialMortgage",
+      "clause_id": "BSER_App3_Asset_ResidentialMortgage",
+      "lookup_method": "LTV",
+      "table": {
+        "LTV ≤ 50%": "20%",
+        "50% < LTV ≤ 60%": "25%",
+        "60% < LTV ≤ 80%": "30%",
+        "80% < LTV ≤ 90%": "40%",
+        "90% < LTV ≤ 100%": "50%",
+        "LTV > 100%": "70%"
+      }
+    },
+    "부도": {
+      "asset_id": "Defaulted",
+      "clause_id": "BSER_App3_Asset_Defaulted",
+      "table": {
+        "충당금 < 20%": "150%",
+        "충당금 ≥ 20%": "100%",
+        "주거용주택담보 부도": "100%"
+      }
+    }
+  }
+}

prepare_data.sh ADDED Viewed

	@@ -0,0 +1,51 @@

+#!/usr/bin/env bash
+# HF Space 배포 전 데이터·코드 동기화.
+# active/ontology + active/code + paper/graph 자산을 hf_app/ 안으로 복사.
+# HF Space 레포는 hf_app/ 폴더 통째를 푸시한다고 가정.
+set -e
+ROOT="$(cd "$(dirname "$0")/.." && pwd)"  # active/
+HF="$ROOT/hf_app"
+echo "[sync] $ROOT → $HF"
+# 데이터
+mkdir -p "$HF/data"
+cp "$ROOT/ontology/investment_ontology_v1_10.ttl" "$HF/data/"
+cp "$ROOT/ontology/regulations_chunks_v14.jsonl"  "$HF/data/"
+cp "$ROOT/ontology/alias_dictionary.json"          "$HF/data/"
+cp "$ROOT/ontology/risk_weight_lookup.json"        "$HF/data/"
+echo "  ✅ data/ — ontology 4종 복사"
+# 코드 (rag_engine·semantic_search·baseline_lib만 — 테스트 스크립트 제외)
+mkdir -p "$HF/code"
+cp "$ROOT/code/rag_engine.py"      "$HF/code/"
+cp "$ROOT/code/semantic_search.py" "$HF/code/"
+cp "$ROOT/code/baseline_lib.py"    "$HF/code/"
+echo "  ✅ code/ — 핵심 모듈 3종 복사"
+# 자산 (다운로드용)
+mkdir -p "$HF/assets"
+if [ -f "$ROOT/paper_v5.pdf" ]; then
+  cp "$ROOT/paper_v5.pdf" "$HF/assets/"
+  echo "  ✅ assets/paper_v5.pdf"
+fi
+if [ -f "$ROOT/../../온톨로지/v08_ontology_graph.png" ]; then
+  cp "$ROOT/../../온톨로지/v08_ontology_graph.png" "$HF/assets/"
+  echo "  ✅ assets/v08_ontology_graph.png"
+fi
+# 임베딩 캐시 (선택) — HF Space에서 첫 빌드 시 재생성 가능. 단축하려면 함께 푸시.
+if [ -d "$ROOT/ontology/_embeddings_cache" ]; then
+  mkdir -p "$HF/data/_embeddings_cache"
+  cp -r "$ROOT/ontology/_embeddings_cache/"* "$HF/data/_embeddings_cache/" 2>/dev/null || true
+  echo "  ✅ data/_embeddings_cache/ (KoSimCSE 캐시)"
+fi
+echo "[done] HF Space 푸시 준비 완료: $HF"
+echo ""
+echo "다음 단계:"
+echo "  cd $HF"
+echo "  git init (HF Space와 연결 시)"
+echo "  git remote add space https://huggingface.co/spaces/<user>/<space>"
+echo "  git push space main"

web/index.html ADDED Viewed

	@@ -0,0 +1,17 @@

+<!DOCTYPE html>
+<html lang="ko">
+<head>
+  <meta charset="UTF-8" />
+  <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+  <title>LP출자 온톨로지 LLM 프로토타입</title>
+  <link rel="preconnect" href="https://cdn.jsdelivr.net" />
+  <link rel="stylesheet" href="https://cdn.jsdelivr.net/gh/orioncactus/pretendard@v1.3.9/dist/web/variable/pretendardvariable.min.css" />
+  <link rel="preconnect" href="https://fonts.googleapis.com" />
+  <link rel="preconnect" href="https://fonts.gstatic.com" crossorigin />
+  <link rel="stylesheet" href="https://fonts.googleapis.com/css2?family=JetBrains+Mono:wght@400;500;600;700&display=swap" />
+</head>
+<body>
+  <div id="root"></div>
+  <script type="module" src="/src/main.jsx"></script>
+</body>
+</html>

web/package.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "name": "ontology-prototype-web",
+  "private": true,
+  "version": "1.0.0",
+  "type": "module",
+  "scripts": {
+    "dev": "vite",
+    "build": "vite build",
+    "preview": "vite preview"
+  },
+  "dependencies": {
+    "react": "^18.3.1",
+    "react-dom": "^18.3.1"
+  },
+  "devDependencies": {
+    "@vitejs/plugin-react": "^4.3.4",
+    "vite": "^6.0.7"
+  }
+}

web/src/App.jsx ADDED Viewed

	@@ -0,0 +1,56 @@

+import React, { useState } from 'react';
+import ExplainTab from './ExplainTab.jsx';
+import TestTab from './TestTab.jsx';
+import DataTab from './DataTab.jsx';
+const TABS = [
+  { id: 'explain', ico: '📖', label: '설명' },
+  { id: 'test', ico: '🔍', label: '테스트' },
+  { id: 'data', ico: '📋', label: '데이터 관리' },
+];
+export default function App() {
+  const [tab, setTab] = useState('test');
+  return (
+    <div className="shell">
+      <header className="appbar">
+        <div className="wrap appbar-inner">
+          <div className="brand-badge">IBK</div>
+          <div className="brand-text">
+            <h1>LP출자 온톨로지 LLM 적용 프로토타입 테스트</h1>
+            <p>
+              사내 AI 경진대회 출품 ·{' '}
+              <span className="accent">온톨로지 기반 폐쇄망 RAG 시스템</span>
+            </p>
+          </div>
+          <div className="env-pill">
+            <span className="dot"></span> HF Spaces · GPU 데모
+          </div>
+        </div>
+      </header>
+      <nav className="tabbar">
+        <div className="wrap tabbar-inner">
+          {TABS.map((t) => (
+            <button
+              key={t.id}
+              className={'tab' + (tab === t.id ? ' active' : '')}
+              onClick={() => setTab(t.id)}
+            >
+              <span className="tab-ico">{t.ico}</span> {t.label}
+            </button>
+          ))}
+        </div>
+      </nav>
+      <main>
+        <div className="wrap">
+          {tab === 'explain' && <ExplainTab />}
+          {tab === 'test' && <TestTab />}
+          {tab === 'data' && <DataTab />}
+        </div>
+      </main>
+    </div>
+  );
+}

web/src/DataTab.jsx ADDED Viewed

	@@ -0,0 +1,319 @@

+import React, { useState, useEffect } from 'react';
+const PRODUCT_OPTIONS = ['PEF', '벤처투자조합', '신기술사업투자조합', '투자합자조합', '인수금융'];
+const STAGE_OPTIONS = ['거래상대방 등록', '투자상담', '사전협의', '예비검토', '실무심의', '투자품의', '한도약정', '개별출자품의', '사후관리'];
+const STATUS_OPTIONS = ['진행중', '정체', '완료', '약정 진행 중', '약정체결 완료'];
+const SEC_OPTIONS = ['보통주', 'CPS', 'RCPS', 'CB', 'BW', '기타'];
+export default function DataTab() {
+  const [dataset, setDataset] = useState({ funds: [], gps: [] });
+  const [userRecords, setUserRecords] = useState([]); // 세션 추가분
+  // 폼 상태
+  const [label, setLabel] = useState('');
+  const [note, setNote] = useState('');
+  const [gpName, setGpName] = useState('');
+  const [gpNote, setGpNote] = useState('');
+  const [fundName, setFundName] = useState('');
+  const [fundProduct, setFundProduct] = useState('PEF');
+  const [invest, setInvest] = useState([{ name: '', listed: '상장', cps: '보통주', note: '' }]);
+  const [branch, setBranch] = useState([{ type: 'PEF', amt: '10억', stage: '예비검토', status: '진행중' }]);
+  useEffect(() => {
+    fetch('/api/dataset/summary')
+      .then((r) => r.json())
+      .then(setDataset)
+      .catch((e) => console.error(e));
+  }, []);
+  const setInv = (i, k, v) =>
+    setInvest(invest.map((r, j) => (j === i ? { ...r, [k]: v } : r)));
+  const setBr = (i, k, v) =>
+    setBranch(branch.map((r, j) => (j === i ? { ...r, [k]: v } : r)));
+  const addInvest = () => setInvest([...invest, { name: '', listed: '상장', cps: '보통주', note: '' }]);
+  const rmInvest = () => invest.length > 1 && setInvest(invest.slice(0, -1));
+  const addBranch = () => branch.length < 3 && setBranch([...branch, { type: 'PEF', amt: '', stage: '예비검토', status: '진행중' }]);
+  const rmBranch = () => branch.length > 1 && setBranch(branch.slice(0, -1));
+  function handleRegister() {
+    const errs = [];
+    if (!label.trim()) errs.push('검토건 라벨 비어있음');
+    if (!gpName.trim()) errs.push('GP명 비어있음');
+    if (!fundName.trim()) errs.push('펀드명 비어있음');
+    if (!invest.some((t) => t.name.trim())) errs.push('피투자 기업 최소 1개');
+    if (errs.length) {
+      alert('❌ ' + errs.join('\n'));
+      return;
+    }
+    const nextN = userRecords.length + 7;
+    const rec = {
+      id: `Demo_Investment_${String(nextN).padStart(3, '0')}`,
+      label, note, gpName, gpNote, fundName, fundProduct,
+      invest: invest.filter((t) => t.name.trim()),
+      branch,
+      registeredAt: new Date().toISOString(),
+    };
+    setUserRecords([...userRecords, rec]);
+    alert(`✅ 등록 완료: ${rec.id} (세션 한정)`);
+    // 폼 리셋
+    setLabel(''); setNote(''); setGpName(''); setGpNote(''); setFundName('');
+    setInvest([{ name: '', listed: '상장', cps: '보통주', note: '' }]);
+    setBranch([{ type: 'PEF', amt: '10억', stage: '예비검토', status: '진행중' }]);
+  }
+  const allFunds = [
+    ...dataset.funds.map((f) => ({ id: f.id, name: f.fund, amount: `${f.amount_eok}억` })),
+    ...userRecords.map((r) => ({
+      id: r.id.split('_').pop(),
+      name: r.fundName,
+      amount: r.branch.reduce((s, b) => s + (parseInt(b.amt) || 0), 0) + '억',
+    })),
+  ];
+  const allTargets = userRecords.flatMap((r) => r.invest.map((t) => ({ ...t, parent: r.id })));
+  const allGps = [
+    ...dataset.gps,
+    ...userRecords.map((r, i) => ({ name: r.gpName, id: `gp-u${i + 1}` })),
+  ];
+  return (
+    <div>
+      {/* 현재 등록 데이터 */}
+      <div className="sec-head">
+        <h2>📂 현재 등록된 데이터</h2>
+        <span className="sub">데모 적재분 + 세션 추가분</span>
+      </div>
+      <div className="data-mgmt-grid">
+        <div className="card data-table-card">
+          <div className="dtc-head">
+            <span className="ico">💰</span> 펀드 데이터
+            <span className="count">{allFunds.length}건</span>
+          </div>
+          <div className="dtc-body">
+            <table className="data-table">
+              <thead>
+                <tr><th>ID</th><th>펀드</th><th className="num">금액</th></tr>
+              </thead>
+              <tbody>
+                {allFunds.length ? allFunds.map((f) => (
+                  <tr key={f.id}>
+                    <td className="id mono">{f.id}</td>
+                    <td>{f.name}</td>
+                    <td className="amt">{f.amount}</td>
+                  </tr>
+                )) : (
+                  <tr><td colSpan="3" style={{ textAlign: 'center', color: 'var(--ink-faint)', padding: 24 }}>데이터 없음</td></tr>
+                )}
+              </tbody>
+            </table>
+          </div>
+        </div>
+        <div className="card data-table-card">
+          <div className="dtc-head">
+            <span className="ico">🏢</span> 간접투자대상 기업
+            <span className="count">{allTargets.length}건</span>
+          </div>
+          {allTargets.length ? (
+            <div className="dtc-body">
+              <table className="data-table">
+                <thead><tr><th>기업명</th><th>상장</th><th>증권</th></tr></thead>
+                <tbody>
+                  {allTargets.map((t, i) => (
+                    <tr key={i}>
+                      <td>{t.name}</td>
+                      <td>{t.listed}</td>
+                      <td>{t.cps}</td>
+                    </tr>
+                  ))}
+                </tbody>
+              </table>
+            </div>
+          ) : (
+            <div className="empty-box">
+              <span className="em-ico">📭</span>
+              아래 폼에서 등록하면 여기에 구조화되어 표시됩니다.
+              <div className="em-sub">기존 데모는 비고 텍스트로만 존재 — 구조화 X</div>
+            </div>
+          )}
+        </div>
+        <div className="card data-table-card">
+          <div className="dtc-head">
+            <span className="ico">🏛️</span> 운용사 GP
+            <span className="count">{allGps.length}건</span>
+          </div>
+          <div className="dtc-body">
+            <table className="data-table">
+              <thead><tr><th>GP명</th><th>ID</th></tr></thead>
+              <tbody>
+                {allGps.length ? allGps.map((g) => (
+                  <tr key={g.id}>
+                    <td>{g.name}</td>
+                    <td className="id mono">{g.id}</td>
+                  </tr>
+                )) : (
+                  <tr><td colSpan="2" style={{ textAlign: 'center', color: 'var(--ink-faint)', padding: 24 }}>GP 없음</td></tr>
+                )}
+              </tbody>
+            </table>
+          </div>
+        </div>
+      </div>
+      <hr className="divider" />
+      {/* 새 검토건 등록 */}
+      <div className="sec-head">
+        <h2>➕ 새 검토건 등록</h2>
+        <span className="sub">5개 섹션 · 자동 채번</span>
+      </div>
+      <div className="card form-card">
+        {/* [1] 검토건 기본 */}
+        <div className="form-section">
+          <div className="fs-head">
+            <div className="fs-num">1</div>
+            <div className="fs-title">검토건 기본</div>
+            <div className="fs-hint">ID 자동 채번 (007~)</div>
+          </div>
+          <div className="fs-body">
+            <div className="field-grid fg-1">
+              <div className="field">
+                <label>라벨</label>
+                <input className="inp" value={label} onChange={(e) => setLabel(e.target.value)} placeholder="예: newjeans 인수금융 검토" />
+              </div>
+              <div className="field">
+                <label>비고</label>
+                <input className="inp" value={note} onChange={(e) => setNote(e.target.value)} placeholder="검토건 개요·특이사항" />
+              </div>
+            </div>
+          </div>
+        </div>
+        {/* [2] GP */}
+        <div className="form-section">
+          <div className="fs-head"><div className="fs-num">2</div><div className="fs-title">운용사 (GP)</div></div>
+          <div className="fs-body">
+            <div className="field-grid fg-2">
+              <div className="field">
+                <label>GP명</label>
+                <input className="inp" value={gpName} onChange={(e) => setGpName(e.target.value)} placeholder="예: hybe" />
+              </div>
+              <div className="field">
+                <label>비고</label>
+                <input className="inp" value={gpNote} onChange={(e) => setGpNote(e.target.value)} placeholder="GP 관련 메모" />
+              </div>
+            </div>
+          </div>
+        </div>
+        {/* [3] 펀드 */}
+        <div className="form-section">
+          <div className="fs-head"><div className="fs-num">3</div><div className="fs-title">출자대상 펀드</div></div>
+          <div className="fs-body">
+            <div className="field-grid fg-2">
+              <div className="field">
+                <label>펀드명</label>
+                <input className="inp" value={fundName} onChange={(e) => setFundName(e.target.value)} placeholder="예: newjeans 1호" />
+              </div>
+              <div className="field">
+                <label>펀드 형태</label>
+                <select className="sel" value={fundProduct} onChange={(e) => setFundProduct(e.target.value)}>
+                  {PRODUCT_OPTIONS.map((o) => <option key={o}>{o}</option>)}
+                </select>
+              </div>
+            </div>
+          </div>
+        </div>
+        {/* [4] 피투자 */}
+        <div className="form-section">
+          <div className="fs-head">
+            <div className="fs-num">4</div>
+            <div className="fs-title">피투자 기업</div>
+            <div className="fs-hint">{invest.length}개 행</div>
+          </div>
+          <div className="fs-body">
+            {invest.map((row, i) => (
+              <div className="dyn-row invest" key={i}>
+                <div className="dyn-idx">#{i + 1}</div>
+                <div className="field">
+                  <label>기업명</label>
+                  <input className="inp" value={row.name} onChange={(e) => setInv(i, 'name', e.target.value)} placeholder="기업명" />
+                </div>
+                <div className="field">
+                  <label>상장 여부</label>
+                  <select className="sel" value={row.listed} onChange={(e) => setInv(i, 'listed', e.target.value)}>
+                    <option>상장</option><option>비상장</option>
+                  </select>
+                </div>
+                <div className="field">
+                  <label>증권 종류</label>
+                  <select className="sel" value={row.cps} onChange={(e) => setInv(i, 'cps', e.target.value)}>
+                    {SEC_OPTIONS.map((o) => <option key={o}>{o}</option>)}
+                  </select>
+                </div>
+                <div className="field">
+                  <label>비고</label>
+                  <input className="inp" value={row.note} onChange={(e) => setInv(i, 'note', e.target.value)} placeholder="비고" />
+                </div>
+              </div>
+            ))}
+            <div className="dyn-actions">
+              <button className="btn-ghost" onClick={addInvest}>＋ 행 추가</button>
+              <button className="btn-ghost danger" onClick={rmInvest}>－ 행 제거</button>
+            </div>
+          </div>
+        </div>
+        {/* [5] 브랜치 */}
+        <div className="form-section">
+          <div className="fs-head">
+            <div className="fs-num">5</div>
+            <div className="fs-title">브랜치 (분기)</div>
+            <div className="fs-hint">{branch.length}개 행 · 단계 자동 추적</div>
+          </div>
+          <div className="fs-body">
+            {branch.map((row, i) => (
+              <div className="dyn-row branch" key={i}>
+                <div className="dyn-idx">#{i + 1}</div>
+                <div className="field">
+                  <label>유형</label>
+                  <select className="sel" value={row.type} onChange={(e) => setBr(i, 'type', e.target.value)}>
+                    {PRODUCT_OPTIONS.map((o) => <option key={o}>{o}</option>)}
+                  </select>
+                </div>
+                <div className="field">
+                  <label>금액</label>
+                  <input className="inp" value={row.amt} onChange={(e) => setBr(i, 'amt', e.target.value)} placeholder="예: 10억" />
+                </div>
+                <div className="field">
+                  <label>단계</label>
+                  <select className="sel" value={row.stage} onChange={(e) => setBr(i, 'stage', e.target.value)}>
+                    {STAGE_OPTIONS.map((o) => <option key={o}>{o}</option>)}
+                  </select>
+                </div>
+                <div className="field">
+                  <label>상태</label>
+                  <select className="sel" value={row.status} onChange={(e) => setBr(i, 'status', e.target.value)}>
+                    {STATUS_OPTIONS.map((o) => <option key={o}>{o}</option>)}
+                  </select>
+                </div>
+              </div>
+            ))}
+            <div className="dyn-actions">
+              <button className="btn-ghost" onClick={addBranch}>＋ 행 추가</button>
+              <button className="btn-ghost danger" onClick={rmBranch}>－ 행 제거</button>
+            </div>
+          </div>
+        </div>
+        <div className="form-submit">
+          <button className="btn-submit" onClick={handleRegister}>✅ 검토건 등록</button>
+        </div>
+      </div>
+    </div>
+  );
+}

web/src/ExplainTab.jsx ADDED Viewed

	@@ -0,0 +1,124 @@

+import React from 'react';
+const DOWNLOADS = [
+  {
+    n: '①', title: 'PAPER', kind: 'PDF',
+    desc: '시스템 설계·실험 설계·통계 분석을 담은 연구 페이퍼.',
+    meta: '본문 + 부록 · 최신본',
+    href: '/api/download/paper',
+  },
+  {
+    n: '②', title: '노드 그래프', kind: 'PNG',
+    desc: '클래스·인스턴스 관계를 시각화한 온톨로지 노드 그래프.',
+    meta: 'v0.8 시점 스냅샷',
+    href: '/api/download/graph',
+  },
+  {
+    n: '③', title: '온톨로지', kind: 'TTL',
+    desc: 'Turtle 직렬화 온톨로지 정의 파일 (RDF/OWL).',
+    meta: 'v1.10 · 트리플 3,712개 · 64 클래스',
+    href: '/api/download/ttl',
+  },
+];
+const COLS = [
+  {
+    cls: 'h-purple', ico: '🎯', title: '구현 범위',
+    items: [
+      '<b>라우터</b> — 키워드 + LLM 의도파서 하이브리드',
+      '<b>온톨로지</b> — 64 클래스 / 트리플 3,712개',
+      '<b>SPARQL</b> 결정론적 조회 (Python)',
+      '<b>lookup 표 19종</b> (별표 3 포함)',
+      '<b>RAG</b> — 274 청크 인덱싱',
+      '<b>KoSimCSE</b> 의미검색 (축B)',
+      '<b>LLM 2종</b> — Sonnet · Gemma 4 e4b',
+      '데모 검토건 <b>3건</b> 적재',
+    ],
+  },
+  {
+    cls: 'h-teal', ico: '🧭', title: '구현 방향',
+    items: [
+      '온톨로지가 <b>LLM 자유해석을 제약</b>',
+      '폐쇄망 + 4B 로컬 모델 정당성 입증',
+      '<b>Sonnet ≒ Gemma</b> (패러프레이즈 lenient 100% 동등)',
+      '하이브리드 라우팅 — 키워드 × 의미검색',
+      '다층 거래상대(GP·펀드·피투자) 구조화',
+      '분기(branch) 구조로 단계 추적',
+      '9단계 자동 채번 체계',
+    ],
+  },
+  {
+    cls: 'h-green', ico: '🚀', title: '확장 가능성',
+    items: [
+      '인스턴스 ↔ 온톨로지 <b>분리</b> (Triplestore)',
+      '더 큰 폐쇄망 LLM (<b>9B / 27B</b>) 적용',
+      '검토건 데이터 확장',
+      '타 도메인 확장 (여신·심사 등)',
+      '메자닌·구조화 상품 정밀화',
+      '결재시스템 연동',
+      'few-shot 프롬프트 강화',
+    ],
+  },
+];
+export default function ExplainTab() {
+  return (
+    <div>
+      <div className="sec-head">
+        <h2>📥 자료 다운로드</h2>
+        <span className="sub">발표·심사용 첨부 자료</span>
+      </div>
+      <div className="grid-3">
+        {DOWNLOADS.map((d) => (
+          <div className="card dl-card" key={d.title}>
+            <div className="dl-head">
+              <div className="dl-num">{d.n}</div>
+              <div>
+                <div className="dl-title">{d.title}</div>
+                <div className="dl-kind mono">{d.kind}</div>
+              </div>
+            </div>
+            <div className="dl-desc">{d.desc}</div>
+            <div className="dl-meta">{d.meta}</div>
+            <a className="dl-btn" href={d.href} download>
+              <span className="ico">↓</span> 다운로드
+            </a>
+          </div>
+        ))}
+      </div>
+      <div className="sec-head spaced">
+        <h2>📝 시스템 설명</h2>
+        <span className="sub">구현 범위 · 방향 · 확장</span>
+      </div>
+      <div className="grid-3">
+        {COLS.map((c) => (
+          <div className={'card info-card ' + c.cls} key={c.title}>
+            <div className="info-card-head">
+              <span className="ico">{c.ico}</span>
+              {c.title}
+            </div>
+            <div className="info-card-body">
+              <ul className="info-list">
+                {c.items.map((it, i) => (
+                  <li key={i} dangerouslySetInnerHTML={{ __html: it }} />
+                ))}
+              </ul>
+            </div>
+          </div>
+        ))}
+      </div>
+      <hr className="divider" />
+      <div className="banner">
+        <span className="b-ico">ℹ️</span>
+        <div>
+          <b>운영 환경 안내</b> — 실제 운영은 폐쇄망 내 로컬 추론(M4 노트북 · 약 10초)으로
+          이루어집니다. 본 데모는 사용자 접근성을 위해 HF Spaces에서 동일 모델을 GPU로
+          호스팅하여 약 1초 내 응답합니다. <b>모델 · 로직 · 데이터는 운영 환경과 동일</b>합니다.
+        </div>
+      </div>
+    </div>
+  );
+}

web/src/TestTab.jsx ADDED Viewed

	@@ -0,0 +1,287 @@

+import React, { useState, useEffect } from 'react';
+const PRESETS = [
+  { chip: '검토건 상태', q: 'ive 펀드 검토건은 지금 어디까지 갔어?' },
+  { chip: '적합성 원칙', q: 'LP출자 검토 시 적합성 원칙은 어떻게 확인해?' },
+  { chip: '위험가중치 조회', q: 'AAA 등급 중앙정부 익스포져의 위험가중치는 얼마야?' },
+  { chip: '진행 중 전체', q: '지금 회사에서 검토 진행 중인 건들 좀 찾아서 설명해줘.' },
+  { chip: '결재 순서 (구어체)', q: '사인 누구한테 받아야 해?' },
+];
+function Expander({ icon, title, defaultOpen, children }) {
+  const [open, setOpen] = useState(!!defaultOpen);
+  return (
+    <div className={'expander' + (open ? ' open' : '')}>
+      <button className="expander-head" onClick={() => setOpen(!open)}>
+        <span className="e-ico">{icon}</span>
+        {title}
+        <span className="chev">▼</span>
+      </button>
+      {open && <div className="expander-body">{children}</div>}
+    </div>
+  );
+}
+function DatasetMini({ funds }) {
+  if (!funds || !funds.length) return <div>로딩 중...</div>;
+  return (
+    <table className="mini-table">
+      <thead>
+        <tr><th>ID</th><th>검토건</th><th>금액</th><th>단계</th></tr>
+      </thead>
+      <tbody>
+        {funds.map((f) => (
+          <tr key={f.id}>
+            <td className="mono">{f.id}</td>
+            <td>{f.fund}</td>
+            <td className="mono">{f.amount_eok}억</td>
+            <td>{f.stage}</td>
+          </tr>
+        ))}
+      </tbody>
+    </table>
+  );
+}
+function AnswerCard({ kind, badgeCls, title, subtitle, content, route, time, hostNote, loading }) {
+  return (
+    <div className={'ans t-' + kind}>
+      <div className="ans-head">
+        <div className={'ans-badge ' + badgeCls}>
+          {kind === 'py' ? '🐍' : kind === 'son' ? '✨' : '🤖'}
+        </div>
+        <div>
+          <div className="ans-title">{title}</div>
+          <div className="ans-kind">{subtitle}</div>
+        </div>
+      </div>
+      <div className="ans-body">
+        {loading ? <p style={{ color: 'var(--ink-faint)' }}>응답 생성 중...</p> : content}
+      </div>
+      <div className="ans-foot">
+        <div className="route-cap">
+          ↳ 라우트 <span className="mono">{route || '-'}</span>
+        </div>
+        <div className="foot-meta">
+          <span className="time-pill">
+            ⚡ <span className="mono">{time ?? '-'}</span>
+          </span>
+          {hostNote && <span className="host-note">{hostNote}</span>}
+        </div>
+      </div>
+    </div>
+  );
+}
+export default function TestTab() {
+  const [route, setRoute] = useState('b'); // 'b' = axisB, 'a' = keyword
+  const [active, setActive] = useState(0);
+  const [query, setQuery] = useState(PRESETS[0].q);
+  const [answer, setAnswer] = useState(null);
+  const [loading, setLoading] = useState(false);
+  const [error, setError] = useState(null);
+  const [dataset, setDataset] = useState(null);
+  useEffect(() => {
+    fetch('/api/dataset/summary')
+      .then((r) => r.json())
+      .then(setDataset)
+      .catch((e) => console.error('dataset load error', e));
+  }, []);
+  function runPreset(i) {
+    setActive(i);
+    setQuery(PRESETS[i].q);
+  }
+  async function runSearch() {
+    setLoading(true);
+    setError(null);
+    try {
+      const r = await fetch('/api/ask', {
+        method: 'POST',
+        headers: { 'Content-Type': 'application/json' },
+        body: JSON.stringify({ question: query, mode: route === 'b' ? 'axisB' : 'keyword' }),
+      });
+      if (!r.ok) throw new Error(`HTTP ${r.status}`);
+      const data = await r.json();
+      setAnswer(data);
+    } catch (e) {
+      setError(String(e));
+    } finally {
+      setLoading(false);
+    }
+  }
+  return (
+    <div>
+      {/* expander 2개 */}
+      <div className="expander-row">
+        <Expander icon="📋" title="질문 가능 범위">
+          <ul>
+            <li>검토건 <b>상태·단계·진행</b> 조회 (예: "ive 어디까지 됐어?")</li>
+            <li>적합성·위험가중치 등 <b>규정·원칙</b> 조회</li>
+            <li>진행 중 검토건 <b>목록·요약</b></li>
+            <li>결재 순서 등 <b>프로세스</b> 질의 (구어체 허용)</li>
+            <li>GP · 펀드 · 피투자 기업 <b>관계</b> 탐색</li>
+          </ul>
+        </Expander>
+        <Expander icon="📊" title="데이터셋 간략히 보기">
+          <DatasetMini funds={dataset?.funds} />
+        </Expander>
+      </div>
+      {/* 라우팅 모드 */}
+      <div className="route-block">
+        <div className="card route-card">
+          <div className="route-label">라우팅 모드</div>
+          <div
+            className={'radio-opt' + (route === 'b' ? ' sel' : '')}
+            onClick={() => setRoute('b')}
+          >
+            <div className="radio-dot" />
+            <div className="radio-main">
+              <div className="radio-title">
+                LLM 의도파서 + KoSimCSE <span className="tag-b">축 B</span>
+              </div>
+              <div className="radio-sub">의도 JSON 파싱 + 의미검색 (권장)</div>
+            </div>
+          </div>
+          <div
+            className={'radio-opt' + (route === 'a' ? ' sel' : '')}
+            onClick={() => setRoute('a')}
+          >
+            <div className="radio-dot" />
+            <div className="radio-main">
+              <div className="radio-title">
+                키워드 라우터 <span className="tag-base">베이스라인</span>
+              </div>
+              <div className="radio-sub">규칙 기반 키워드 매칭</div>
+            </div>
+          </div>
+        </div>
+        <div className="route-explain">
+          <div className="re-head">
+            <span>🧠</span>{' '}
+            {route === 'b' ? '축 B — 의미 기반 라우팅' : '베이스라인 — 키워드 라우팅'}
+          </div>
+          <p>
+            {route === 'b'
+              ? 'LLM이 질문 의도를 JSON으로 파싱하고 KoSimCSE 의미검색으로 라우팅합니다. 구어체·패러프레이즈에 강건합니다.'
+              : '사전 정의 키워드 규칙으로 라우팅합니다. 정형 질문엔 빠르지만 패러프레이즈에 취약합니다.'}
+          </p>
+          {route === 'b' && (
+            <div className="re-stats">
+              <div className="re-stat">
+                <span className="v">93%</span>
+                <span className="k">패러프레이즈 lenient (C1 axisB)</span>
+              </div>
+              <div className="re-stat">
+                <span className="v">100%</span>
+                <span className="k">C3 패러프레이즈 lenient</span>
+              </div>
+              <div className="re-stat">
+                <span className="v">+44%p</span>
+                <span className="k">strict 향상 (vs 키워드)</span>
+              </div>
+            </div>
+          )}
+        </div>
+      </div>
+      {/* 프리셋 chip */}
+      <div className="preset-label">프리셋 질문</div>
+      <div className="chip-row">
+        {PRESETS.map((p, i) => (
+          <button
+            key={p.chip}
+            className={'chip' + (active === i ? ' active' : '')}
+            onClick={() => runPreset(i)}
+          >
+            {p.chip}
+          </button>
+        ))}
+      </div>
+      {/* 질문 입력 */}
+      <div className="ask-row">
+        <input
+          className="ask-input"
+          value={query}
+          onChange={(e) => setQuery(e.target.value)}
+          onKeyDown={(e) => e.key === 'Enter' && !loading && runSearch()}
+          placeholder="질문을 입력하세요 — 예: ive 검토건 지금 어디까지 진행됐어?"
+        />
+        <button className="ask-btn" onClick={runSearch} disabled={loading}>
+          🔍 {loading ? '응답 중...' : '검색'}
+        </button>
+      </div>
+      {/* 3-col 답변 */}
+      {error && (
+        <div className="banner" style={{ borderColor: 'oklch(0.7 0.13 25)', background: 'oklch(0.96 0.02 25)' }}>
+          <span className="b-ico">⚠️</span>
+          <div><b>오류</b> — {error}</div>
+        </div>
+      )}
+      <div className="answers">
+        {!answer && !loading && (
+          <div className="empty-ans">
+            프리셋을 누르거나 질문을 입력하고 <b>검색</b> 버튼을 누르세요. Python · Sonnet ·
+            Gemma 세 방식의 답변을 한 번에 비교합니다.
+          </div>
+        )}
+        {(answer || loading) && (
+          <>
+            <AnswerCard
+              kind="py"
+              badgeCls="b-py"
+              title="Python"
+              subtitle="결정론적 · raw 컨텍스트"
+              content={
+                answer?.python && (
+                  <div style={{ whiteSpace: 'pre-wrap' }}>{answer.python.answer}</div>
+                )
+              }
+              route={answer?.route}
+              time={answer ? '0.0s' : null}
+              loading={loading}
+            />
+            <AnswerCard
+              kind="son"
+              badgeCls="b-son"
+              title="Sonnet"
+              subtitle="컨텍스트 다듬기"
+              content={
+                answer?.sonnet && (
+                  <div style={{ whiteSpace: 'pre-wrap' }}>{answer.sonnet.answer}</div>
+                )
+              }
+              route={answer?.route}
+              time={answer ? `${answer.sonnet.elapsed_sec.toFixed(1)}s` : null}
+              loading={loading}
+            />
+            <AnswerCard
+              kind="gem"
+              badgeCls="b-gem"
+              title="Gemma 4 e4b"
+              subtitle="컨텍스트 다듬기 · 로컬"
+              content={
+                answer?.gemma && (
+                  <div style={{ whiteSpace: 'pre-wrap' }}>{answer.gemma.answer}</div>
+                )
+              }
+              route={answer?.route}
+              time={answer ? `${answer.gemma.elapsed_sec.toFixed(1)}s` : null}
+              hostNote="📌 HF GPU 호스팅"
+              loading={loading}
+            />
+          </>
+        )}
+      </div>
+    </div>
+  );
+}

web/src/main.jsx ADDED Viewed

	@@ -0,0 +1,6 @@

+import React from 'react';
+import ReactDOM from 'react-dom/client';
+import App from './App.jsx';
+import './styles.css';
+ReactDOM.createRoot(document.getElementById('root')).render(<App />);

web/src/styles.css ADDED Viewed

	@@ -0,0 +1,661 @@

+/* =========================================================================
+   LP출자 온톨로지 LLM 프로토타입 — 디자인 시스템
+   크림 베이스 · IBK 퍼플 액센트(OKLCH) · Pretendard / JetBrains Mono
+   ========================================================================= */
+:root {
+  /* ---- 베이스 (크림, warm neutral) ---- */
+  --cream:        #F8F7F2;
+  --cream-deep:   #F2F0E9;
+  --surface:      #FFFFFF;
+  --surface-2:    #FCFBF7;
+  /* ---- 잉크 (warm near-black) ---- */
+  --ink:          oklch(0.26 0.008 70);
+  --ink-2:        oklch(0.42 0.010 70);
+  --ink-3:        oklch(0.58 0.012 75);
+  --ink-faint:    oklch(0.70 0.012 80);
+  /* ---- 보더 ---- */
+  --line:         oklch(0.90 0.006 85);
+  --line-soft:    oklch(0.93 0.005 85);
+  --line-strong:  oklch(0.84 0.008 85);
+  /* ---- IBK 퍼플 (OKLCH, 부드러운 색조) ---- */
+  --purple:       oklch(0.47 0.115 300);
+  --purple-deep:  oklch(0.40 0.120 300);
+  --purple-soft:  oklch(0.62 0.090 300);
+  --purple-tint:  oklch(0.955 0.018 300);
+  --purple-tint2: oklch(0.92 0.030 300);
+  --purple-line:  oklch(0.86 0.040 300);
+  /* ---- 보조 액센트 (동일 채도/명도, 색조만 변화) ---- */
+  --teal:         oklch(0.50 0.090 200);
+  --teal-tint:    oklch(0.955 0.020 200);
+  --teal-line:    oklch(0.86 0.040 200);
+  --green:        oklch(0.52 0.085 150);
+  --green-tint:   oklch(0.955 0.022 150);
+  --green-line:   oklch(0.86 0.045 150);
+  --amber:        oklch(0.58 0.090 75);
+  --amber-tint:   oklch(0.955 0.030 80);
+  /* ---- 그림자 ---- */
+  --shadow-sm: 0 1px 2px oklch(0.45 0.02 80 / 0.05), 0 1px 1px oklch(0.45 0.02 80 / 0.04);
+  --shadow:    0 1px 3px oklch(0.45 0.02 80 / 0.06), 0 4px 14px oklch(0.45 0.02 80 / 0.06);
+  --shadow-lg: 0 2px 6px oklch(0.45 0.02 80 / 0.07), 0 12px 32px oklch(0.45 0.02 80 / 0.09);
+  /* ---- 라운드 ---- */
+  --r-sm: 7px;
+  --r:    11px;
+  --r-lg: 16px;
+  --maxw: 1180px;
+}
+* { box-sizing: border-box; }
+html, body {
+  margin: 0;
+  padding: 0;
+  background: var(--cream);
+  color: var(--ink);
+  font-family: "Pretendard Variable", Pretendard, -apple-system, BlinkMacSystemFont, system-ui, sans-serif;
+  font-size: 15px;
+  line-height: 1.55;
+  -webkit-font-smoothing: antialiased;
+  text-rendering: optimizeLegibility;
+}
+.mono {
+  font-family: "JetBrains Mono", ui-monospace, SFMono-Regular, Menlo, monospace;
+  font-feature-settings: "calt" 0;
+}
+::selection { background: var(--purple-tint2); }
+button { font-family: inherit; cursor: pointer; }
+input, select, textarea { font-family: inherit; font-size: inherit; color: var(--ink); }
+/* =========================================================================
+   레이아웃
+   ========================================================================= */
+.shell { min-height: 100vh; }
+.wrap {
+  max-width: var(--maxw);
+  margin: 0 auto;
+  padding: 0 28px;
+}
+/* ---- 헤더 ---- */
+.appbar {
+  background: linear-gradient(180deg, var(--surface), var(--surface-2));
+  border-bottom: 1px solid var(--line);
+}
+.appbar-inner {
+  display: flex;
+  align-items: center;
+  gap: 18px;
+  padding: 20px 0 18px;
+}
+.brand-badge {
+  width: 52px; height: 52px;
+  border-radius: 13px;
+  flex: 0 0 auto;
+  overflow: hidden;
+  box-shadow: var(--shadow-sm);
+  border: 1px solid var(--line);
+  background: var(--surface);
+}
+.brand-badge image-slot { width: 100%; height: 100%; display: block; }
+.brand-text h1 {
+  margin: 0;
+  font-size: 20px;
+  font-weight: 700;
+  letter-spacing: -0.015em;
+  color: var(--ink);
+}
+.brand-text p {
+  margin: 3px 0 0;
+  font-size: 13px;
+  color: var(--ink-3);
+  letter-spacing: -0.005em;
+}
+.brand-text .accent { color: var(--purple); font-weight: 600; }
+.env-pill {
+  margin-left: auto;
+  display: inline-flex;
+  align-items: center;
+  gap: 7px;
+  padding: 7px 13px;
+  background: var(--purple-tint);
+  border: 1px solid var(--purple-line);
+  border-radius: 100px;
+  font-size: 12px;
+  font-weight: 600;
+  color: var(--purple-deep);
+  white-space: nowrap;
+}
+.env-pill .dot {
+  width: 7px; height: 7px; border-radius: 50%;
+  background: var(--purple);
+  box-shadow: 0 0 0 3px var(--purple-tint2);
+}
+/* ---- 탭바 ---- */
+.tabbar {
+  position: sticky;
+  top: 0;
+  z-index: 20;
+  background: oklch(0.985 0.004 85 / 0.9);
+  backdrop-filter: blur(10px);
+  border-bottom: 1px solid var(--line);
+}
+.tabbar-inner { display: flex; gap: 4px; }
+.tab {
+  appearance: none;
+  background: none;
+  border: none;
+  padding: 15px 18px 13px;
+  font-size: 14.5px;
+  font-weight: 600;
+  letter-spacing: -0.01em;
+  color: var(--ink-3);
+  border-bottom: 2.5px solid transparent;
+  margin-bottom: -1px;
+  display: inline-flex;
+  align-items: center;
+  gap: 8px;
+  white-space: nowrap;
+  transition: color .15s, border-color .15s;
+}
+.tab:hover { color: var(--ink); }
+.tab .tab-ico { font-size: 15px; opacity: .9; }
+.tab.active { color: var(--purple-deep); border-bottom-color: var(--purple); }
+main { padding: 30px 0 80px; }
+/* ---- 섹션 타이틀 ---- */
+.sec-head {
+  display: flex;
+  align-items: baseline;
+  gap: 10px;
+  margin: 6px 0 16px;
+}
+.sec-head h2 {
+  margin: 0;
+  font-size: 16px;
+  font-weight: 700;
+  letter-spacing: -0.01em;
+  color: var(--ink);
+}
+.sec-head .sub { font-size: 12.5px; color: var(--ink-faint); }
+.sec-head.spaced { margin-top: 34px; }
+.divider { height: 1px; background: var(--line-soft); margin: 30px 0; border: 0; }
+/* =========================================================================
+   카드
+   ========================================================================= */
+.card {
+  background: var(--surface);
+  border: 1px solid var(--line);
+  border-radius: var(--r);
+  box-shadow: var(--shadow-sm);
+}
+.grid-3 { display: grid; grid-template-columns: repeat(3, 1fr); gap: 16px; }
+.grid-2 { display: grid; grid-template-columns: repeat(2, 1fr); gap: 16px; }
+/* ---- 다운로드 카드 ---- */
+.dl-card {
+  padding: 20px;
+  display: flex;
+  flex-direction: column;
+  gap: 4px;
+  transition: box-shadow .16s, transform .16s, border-color .16s;
+}
+.dl-card:hover { box-shadow: var(--shadow); transform: translateY(-1px); border-color: var(--purple-line); }
+.dl-head { display: flex; align-items: center; gap: 11px; margin-bottom: 8px; }
+.dl-num {
+  width: 26px; height: 26px;
+  border-radius: 8px;
+  display: grid; place-items: center;
+  background: var(--purple-tint);
+  color: var(--purple-deep);
+  font-size: 13px; font-weight: 700;
+  flex: 0 0 auto;
+}
+.dl-title { font-weight: 700; font-size: 15px; letter-spacing: -0.01em; }
+.dl-kind {
+  font-size: 11px; font-weight: 600;
+  color: var(--ink-faint);
+  letter-spacing: 0.04em;
+}
+.dl-desc { font-size: 13px; color: var(--ink-2); line-height: 1.5; }
+.dl-meta { font-size: 12px; color: var(--ink-3); }
+.dl-btn {
+  margin-top: 14px;
+  display: inline-flex; align-items: center; justify-content: center; gap: 7px;
+  padding: 9px 14px;
+  background: var(--surface);
+  border: 1px solid var(--line-strong);
+  border-radius: var(--r-sm);
+  font-size: 13px; font-weight: 600;
+  color: var(--ink);
+  transition: background .15s, border-color .15s, color .15s;
+}
+.dl-btn:hover { background: var(--purple); border-color: var(--purple); color: #fff; }
+.dl-btn .ico { font-size: 13px; }
+/* ---- 시스템 설명 카드 ---- */
+.info-card { padding: 0; overflow: hidden; }
+.info-card-head {
+  padding: 14px 18px;
+  border-bottom: 1px solid var(--line-soft);
+  display: flex; align-items: center; gap: 9px;
+  font-weight: 700; font-size: 14.5px; letter-spacing: -0.01em;
+}
+.info-card-head .ico {
+  width: 24px; height: 24px; border-radius: 7px;
+  display: grid; place-items: center; font-size: 13px;
+  flex: 0 0 auto;
+}
+.info-card-body { padding: 16px 18px 18px; }
+.info-list { list-style: none; margin: 0; padding: 0; display: flex; flex-direction: column; gap: 9px; }
+.info-list li {
+  position: relative;
+  padding-left: 16px;
+  font-size: 13.5px;
+  color: var(--ink-2);
+  line-height: 1.5;
+}
+.info-list li::before {
+  content: "";
+  position: absolute; left: 2px; top: 8px;
+  width: 5px; height: 5px; border-radius: 50%;
+  background: var(--purple-soft);
+}
+.info-list li b { color: var(--ink); font-weight: 600; }
+/* tint variants for card heads */
+.h-purple .ico { background: var(--purple-tint); color: var(--purple-deep); }
+.h-teal   .ico { background: var(--teal-tint);   color: var(--teal); }
+.h-green  .ico { background: var(--green-tint);  color: var(--green); }
+.h-purple { border-top: 2.5px solid var(--purple); }
+.h-teal   { border-top: 2.5px solid var(--teal); }
+.h-green  { border-top: 2.5px solid var(--green); }
+/* =========================================================================
+   배너 / info 박스
+   ========================================================================= */
+.banner {
+  display: flex;
+  gap: 13px;
+  padding: 15px 18px;
+  border-radius: var(--r);
+  font-size: 13.5px;
+  line-height: 1.6;
+  border: 1px solid var(--purple-line);
+  background: var(--purple-tint);
+  color: var(--ink-2);
+}
+.banner .b-ico {
+  flex: 0 0 auto;
+  font-size: 16px;
+  line-height: 1.4;
+}
+.banner b { color: var(--purple-deep); font-weight: 700; }
+.banner.neutral { background: var(--surface-2); border-color: var(--line); }
+.banner.neutral b { color: var(--ink); }
+/* =========================================================================
+   테스트 탭
+   ========================================================================= */
+.expander-row { display: grid; grid-template-columns: 1fr 1fr; gap: 14px; margin-bottom: 22px; }
+.expander { border: 1px solid var(--line); border-radius: var(--r); background: var(--surface); overflow: hidden; }
+.expander-head {
+  width: 100%;
+  display: flex; align-items: center; gap: 9px;
+  padding: 13px 16px;
+  background: var(--surface-2);
+  border: none;
+  font-size: 13.5px; font-weight: 600; color: var(--ink);
+  text-align: left;
+}
+.expander-head .chev { margin-left: auto; color: var(--ink-faint); transition: transform .2s; font-size: 12px; }
+.expander.open .chev { transform: rotate(180deg); }
+.expander-head .e-ico { font-size: 14px; }
+.expander-body { padding: 14px 16px 16px; border-top: 1px solid var(--line-soft); font-size: 13px; color: var(--ink-2); }
+.expander-body ul { margin: 0; padding-left: 18px; display: flex; flex-direction: column; gap: 6px; }
+.expander-body ul li { line-height: 1.5; }
+/* 데이터셋 미니 표 */
+.mini-table { width: 100%; border-collapse: collapse; font-size: 12.5px; }
+.mini-table th, .mini-table td { text-align: left; padding: 7px 10px; border-bottom: 1px solid var(--line-soft); }
+.mini-table th { color: var(--ink-faint); font-weight: 600; font-size: 11px; letter-spacing: .03em; text-transform: uppercase; }
+.mini-table td { color: var(--ink-2); }
+.mini-table td.mono { color: var(--ink-3); }
+/* ---- 라우팅 모드 ---- */
+.route-block { display: grid; grid-template-columns: 1fr 1.15fr; gap: 16px; margin-bottom: 24px; align-items: stretch; }
+.route-card { padding: 16px 18px; }
+.route-label { font-size: 11.5px; font-weight: 700; letter-spacing: .05em; text-transform: uppercase; color: var(--ink-faint); margin-bottom: 12px; }
+.radio-opt {
+  display: flex; align-items: flex-start; gap: 11px;
+  padding: 12px 13px;
+  border: 1px solid var(--line);
+  border-radius: var(--r-sm);
+  cursor: pointer;
+  transition: border-color .15s, background .15s;
+  margin-bottom: 9px;
+}
+.radio-opt:last-child { margin-bottom: 0; }
+.radio-opt:hover { border-color: var(--purple-line); }
+.radio-opt.sel { border-color: var(--purple); background: var(--purple-tint); box-shadow: inset 0 0 0 1px var(--purple); }
+.radio-dot {
+  width: 18px; height: 18px; border-radius: 50%;
+  border: 2px solid var(--line-strong);
+  flex: 0 0 auto; margin-top: 1px;
+  display: grid; place-items: center;
+  transition: border-color .15s;
+}
+.radio-opt.sel .radio-dot { border-color: var(--purple); }
+.radio-opt.sel .radio-dot::after { content: ""; width: 9px; height: 9px; border-radius: 50%; background: var(--purple); }
+.radio-main { display: flex; flex-direction: column; gap: 2px; }
+.radio-title { font-size: 14px; font-weight: 600; color: var(--ink); display: flex; align-items: center; gap: 7px; }
+.radio-sub { font-size: 12px; color: var(--ink-3); }
+.tag-b {
+  font-size: 10.5px; font-weight: 700; letter-spacing: .03em;
+  padding: 2px 7px; border-radius: 5px;
+  background: var(--purple); color: #fff;
+}
+.tag-base {
+  font-size: 10.5px; font-weight: 700; letter-spacing: .03em;
+  padding: 2px 7px; border-radius: 5px;
+  background: var(--cream-deep); color: var(--ink-3); border: 1px solid var(--line);
+}
+.route-explain {
+  padding: 16px 18px;
+  background: linear-gradient(150deg, var(--purple-tint), var(--surface));
+  border: 1px solid var(--purple-line);
+  border-radius: var(--r);
+  display: flex; flex-direction: column; justify-content: center; gap: 8px;
+}
+.route-explain .re-head { display: flex; align-items: center; gap: 9px; font-weight: 700; font-size: 14px; color: var(--purple-deep); }
+.route-explain p { margin: 0; font-size: 13px; color: var(--ink-2); line-height: 1.6; }
+.re-stats { display: flex; gap: 10px; margin-top: 4px; flex-wrap: wrap; }
+.re-stat {
+  background: var(--surface); border: 1px solid var(--purple-line); border-radius: 8px;
+  padding: 7px 11px; display: flex; flex-direction: column; gap: 1px;
+}
+.re-stat .v { font-weight: 700; font-size: 15px; color: var(--purple-deep); font-family: "JetBrains Mono", monospace; }
+.re-stat .k { font-size: 10.5px; color: var(--ink-3); }
+/* ---- 프리셋 chip ---- */
+.preset-label { font-size: 12.5px; font-weight: 600; color: var(--ink-faint); margin-bottom: 9px; }
+.chip-row { display: flex; flex-wrap: wrap; gap: 8px; margin-bottom: 18px; }
+.chip {
+  appearance: none;
+  padding: 8px 14px;
+  border: 1px solid var(--line-strong);
+  border-radius: 100px;
+  background: var(--surface);
+  font-size: 13px; font-weight: 500;
+  color: var(--ink-2);
+  white-space: nowrap;
+  transition: all .14s;
+}
+.chip:hover { border-color: var(--purple-soft); color: var(--purple-deep); background: var(--purple-tint); }
+.chip.active { background: var(--purple); border-color: var(--purple); color: #fff; }
+/* ---- 질문 입력 ---- */
+.ask-row { display: flex; gap: 10px; margin-bottom: 26px; }
+.ask-input {
+  flex: 1;
+  padding: 13px 16px;
+  border: 1px solid var(--line-strong);
+  border-radius: var(--r);
+  background: var(--surface);
+  font-size: 14.5px;
+  outline: none;
+  transition: border-color .15s, box-shadow .15s;
+}
+.ask-input::placeholder { color: var(--ink-faint); }
+.ask-input:focus { border-color: var(--purple); box-shadow: 0 0 0 3px var(--purple-tint2); }
+.ask-btn {
+  display: inline-flex; align-items: center; gap: 8px;
+  padding: 0 26px;
+  background: var(--purple);
+  border: 1px solid var(--purple);
+  border-radius: var(--r);
+  color: #fff; font-size: 14.5px; font-weight: 600;
+  transition: background .15s;
+  white-space: nowrap;
+}
+.ask-btn:hover { background: var(--purple-deep); }
+.ask-btn:active { transform: translateY(1px); }
+/* ---- 답변 카드 3-col ---- */
+.answers { display: grid; grid-template-columns: repeat(3, 1fr); gap: 16px; align-items: start; }
+.ans {
+  background: var(--surface);
+  border: 1px solid var(--line);
+  border-radius: var(--r);
+  box-shadow: var(--shadow-sm);
+  overflow: hidden;
+  display: flex; flex-direction: column;
+}
+.ans-head {
+  display: flex; align-items: center; gap: 10px;
+  padding: 13px 16px;
+  border-bottom: 1px solid var(--line-soft);
+}
+.ans-badge {
+  width: 28px; height: 28px; border-radius: 8px;
+  display: grid; place-items: center; font-size: 15px;
+  flex: 0 0 auto;
+}
+.ans-title { font-weight: 700; font-size: 14.5px; letter-spacing: -0.01em; }
+.ans-kind { font-size: 11px; color: var(--ink-faint); margin-top: 1px; }
+.ans-body { padding: 16px; font-size: 13.5px; color: var(--ink-2); line-height: 1.62; flex: 1; }
+.ans-body p { margin: 0 0 9px; }
+.ans-body p:last-child { margin-bottom: 0; }
+.ans-body h4 { margin: 0 0 9px; font-size: 14px; font-weight: 700; color: var(--ink); }
+.ans-body ul { margin: 0; padding-left: 17px; display: flex; flex-direction: column; gap: 6px; }
+.ans-body ul li { line-height: 1.5; }
+.ans-body ul li b { color: var(--ink); font-weight: 600; }
+.ans-body .ctx-line { display: flex; gap: 8px; padding: 3px 0; border-bottom: 1px dashed var(--line-soft); }
+.ans-body .ctx-line:last-child { border-bottom: 0; }
+.ans-body .ctx-k { color: var(--ink-faint); min-width: 64px; font-size: 12.5px; }
+.ans-body .ctx-v { color: var(--ink); font-weight: 500; }
+.ans-foot {
+  padding: 11px 16px;
+  border-top: 1px solid var(--line-soft);
+  background: var(--surface-2);
+  display: flex; flex-direction: column; gap: 7px;
+}
+.route-cap { font-size: 11.5px; color: var(--ink-3); display: flex; align-items: center; gap: 6px; }
+.route-cap .mono { color: var(--purple-deep); font-size: 11px; }
+.foot-meta { display: flex; align-items: center; gap: 8px; flex-wrap: wrap; }
+.time-pill {
+  display: inline-flex; align-items: center; gap: 5px;
+  font-size: 11.5px; font-weight: 600;
+  padding: 3px 9px; border-radius: 100px;
+  background: var(--surface); border: 1px solid var(--line);
+  color: var(--ink-2);
+}
+.time-pill .mono { font-size: 11.5px; }
+.host-note {
+  font-size: 11px; color: var(--amber); font-weight: 600;
+  display: inline-flex; align-items: center; gap: 5px;
+}
+/* badge tints */
+.b-py   { background: var(--green-tint);  color: var(--green); }
+.b-son  { background: var(--purple-tint); color: var(--purple-deep); }
+.b-gem  { background: var(--teal-tint);   color: var(--teal); }
+.ans.t-py  { border-top: 2.5px solid var(--green); }
+.ans.t-son { border-top: 2.5px solid var(--purple); }
+.ans.t-gem { border-top: 2.5px solid var(--teal); }
+.empty-ans {
+  grid-column: 1 / -1;
+  border: 1.5px dashed var(--line-strong);
+  border-radius: var(--r);
+  padding: 38px;
+  text-align: center;
+  color: var(--ink-faint);
+  font-size: 13.5px;
+  background: var(--surface-2);
+}
+/* =========================================================================
+   데이터 관리 탭
+   ========================================================================= */
+.data-table-card { padding: 0; overflow: hidden; display: flex; flex-direction: column; }
+.dtc-head {
+  padding: 13px 16px;
+  border-bottom: 1px solid var(--line-soft);
+  font-weight: 700; font-size: 14px; letter-spacing: -0.01em;
+  display: flex; align-items: center; gap: 9px;
+  background: var(--surface-2);
+}
+.dtc-head .ico { font-size: 14px; }
+.dtc-head .count { margin-left: auto; font-size: 11px; font-weight: 600; color: var(--ink-faint); }
+.dtc-body { padding: 4px 0; }
+.data-table { width: 100%; border-collapse: collapse; font-size: 13px; }
+.data-table th, .data-table td { text-align: left; padding: 9px 16px; border-bottom: 1px solid var(--line-soft); }
+.data-table tr:last-child td { border-bottom: 0; }
+.data-table th { font-size: 11px; color: var(--ink-faint); font-weight: 600; letter-spacing: .03em; text-transform: uppercase; }
+.data-table td.id { color: var(--ink-3); }
+.data-table td.amt { font-weight: 600; color: var(--purple-deep); font-family: "JetBrains Mono", monospace; text-align: right; }
+.data-table .num { text-align: right; }
+.empty-box {
+  margin: 16px; padding: 24px 18px;
+  border: 1.5px dashed var(--line-strong);
+  border-radius: var(--r-sm);
+  text-align: center;
+  color: var(--ink-3);
+  font-size: 13px; line-height: 1.6;
+  background: var(--surface-2);
+}
+.empty-box .em-ico { font-size: 22px; display: block; margin-bottom: 8px; opacity: .8; }
+.empty-box .em-sub { font-size: 11.5px; color: var(--ink-faint); margin-top: 6px; }
+/* ---- 등록 폼 ---- */
+.form-card { padding: 0; overflow: hidden; }
+.form-section { border-bottom: 1px solid var(--line-soft); }
+.form-section:last-child { border-bottom: 0; }
+.fs-head {
+  display: flex; align-items: center; gap: 11px;
+  padding: 15px 20px 13px;
+}
+.fs-num {
+  width: 24px; height: 24px; border-radius: 7px;
+  display: grid; place-items: center;
+  background: var(--purple); color: #fff;
+  font-size: 12px; font-weight: 700; flex: 0 0 auto;
+}
+.fs-title { font-weight: 700; font-size: 14.5px; letter-spacing: -0.01em; }
+.fs-hint { font-size: 12px; color: var(--ink-faint); margin-left: auto; }
+.fs-body { padding: 2px 20px 18px; }
+.field-grid { display: grid; gap: 12px; }
+.fg-1 { grid-template-columns: 1fr; }
+.fg-2 { grid-template-columns: 1fr 1fr; }
+.fg-mix { grid-template-columns: 1fr 1fr; }
+.field { display: flex; flex-direction: column; gap: 6px; }
+.field label { font-size: 12px; font-weight: 600; color: var(--ink-3); }
+.inp, .sel {
+  padding: 10px 12px;
+  border: 1px solid var(--line-strong);
+  border-radius: var(--r-sm);
+  background: var(--surface);
+  font-size: 13.5px;
+  outline: none;
+  transition: border-color .15s, box-shadow .15s;
+}
+.inp:focus, .sel:focus { border-color: var(--purple); box-shadow: 0 0 0 3px var(--purple-tint2); }
+.sel { background-image: url("data:image/svg+xml,%3Csvg xmlns='http://www.w3.org/2000/svg' width='12' height='12' viewBox='0 0 12 12'%3E%3Cpath d='M2 4l4 4 4-4' stroke='%238a8580' stroke-width='1.5' fill='none' stroke-linecap='round'/%3E%3C/svg%3E"); background-repeat: no-repeat; background-position: right 11px center; padding-right: 30px; appearance: none; cursor: pointer; }
+/* 동적 행 */
+.dyn-row {
+  display: grid;
+  gap: 9px;
+  align-items: end;
+  padding: 11px;
+  border: 1px solid var(--line);
+  border-radius: var(--r-sm);
+  background: var(--surface-2);
+  margin-bottom: 9px;
+}
+.dyn-row.invest { grid-template-columns: 28px 1.4fr 0.9fr 0.9fr 1.4fr; }
+.dyn-row.branch { grid-template-columns: 28px 1.2fr 0.9fr 1.1fr 1fr; }
+.dyn-idx {
+  align-self: center;
+  width: 24px; height: 24px; border-radius: 6px;
+  display: grid; place-items: center;
+  background: var(--cream-deep); color: var(--ink-3);
+  font-size: 11.5px; font-weight: 700;
+  font-family: "JetBrains Mono", monospace;
+}
+.dyn-row .field label { font-size: 11px; }
+.dyn-actions { display: flex; gap: 8px; margin-top: 4px; }
+.btn-ghost {
+  display: inline-flex; align-items: center; gap: 6px;
+  padding: 7px 13px;
+  background: var(--surface);
+  border: 1px solid var(--line-strong);
+  border-radius: var(--r-sm);
+  font-size: 12.5px; font-weight: 600; color: var(--ink-2);
+  transition: all .14s;
+}
+.btn-ghost:hover { border-color: var(--purple-soft); color: var(--purple-deep); background: var(--purple-tint); }
+.btn-ghost.danger:hover { border-color: oklch(0.6 0.13 25); color: oklch(0.5 0.15 25); background: oklch(0.96 0.02 25); }
+.form-submit { padding: 20px; background: var(--surface-2); border-top: 1px solid var(--line-soft); }
+.btn-submit {
+  width: 100%;
+  display: inline-flex; align-items: center; justify-content: center; gap: 9px;
+  padding: 14px;
+  background: var(--purple);
+  border: 1px solid var(--purple);
+  border-radius: var(--r);
+  color: #fff; font-size: 15px; font-weight: 700;
+  transition: background .15s;
+}
+.btn-submit:hover { background: var(--purple-deep); }
+.btn-submit:active { transform: translateY(1px); }
+/* =========================================================================
+   반응형 — < 768px 세로 stack
+   ========================================================================= */
+@media (max-width: 980px) {
+  .grid-3, .answers { grid-template-columns: 1fr 1fr; }
+  .route-block { grid-template-columns: 1fr; }
+}
+@media (max-width: 768px) {
+  .wrap { padding: 0 16px; }
+  .appbar-inner { flex-wrap: wrap; gap: 14px; }
+  .env-pill { margin-left: 0; order: 3; width: 100%; justify-content: center; }
+  .tabbar-inner { overflow-x: auto; }
+  .tab { padding: 13px 13px 11px; font-size: 13.5px; white-space: nowrap; }
+  .grid-3, .grid-2, .answers, .expander-row { grid-template-columns: 1fr; gap: 12px; }
+  .ask-row { flex-direction: column; }
+  .ask-btn { padding: 12px; justify-content: center; }
+  .fg-2, .fg-mix { grid-template-columns: 1fr; }
+  .dyn-row.invest, .dyn-row.branch { grid-template-columns: 1fr; }
+  .dyn-idx { justify-self: start; }
+  .data-mgmt-grid { grid-template-columns: 1fr; }
+}
+.data-mgmt-grid { display: grid; grid-template-columns: 1fr 1fr 1fr; gap: 16px; align-items: start; }

web/vite.config.js ADDED Viewed

	@@ -0,0 +1,20 @@

+import { defineConfig } from 'vite';
+import react from '@vitejs/plugin-react';
+export default defineConfig({
+  plugins: [react()],
+  server: {
+    port: 5173,
+    proxy: {
+      // 개발 시 /api 호출을 FastAPI(8000)로 프록시
+      '/api': {
+        target: 'http://localhost:8000',
+        changeOrigin: true,
+      },
+    },
+  },
+  build: {
+    outDir: 'dist',
+    sourcemap: false,
+  },
+});