Spaces:

scvcoder
/

kpaa

Paused

App Files Files Community

scvcoder commited on May 2

Commit

18ad465

verified ·

1 Parent(s): 3630faa

ui: simplify references panel — drop 'adopted' tier, keep 'LLM 전달' + (근거N) chip

Browse files

Top-N excerpts are all LLM context candidates; semantic adoption tracking
is unreliable on small models. So:
- Remove the green 'cited' tier (was over-claiming since paraphrased uses had no green)
- Keep gray 'LLM 전달' for all top-N (true signal — model saw these)
- Keep '근거N' chip only on cards explicitly tagged in answer body (verifiable signal)
- Drop cited_citations from /api/last-references payload + clean unused CSS

Files changed (2) hide show

src/kpaa/server.py +32 -70
src/kpaa/ui/gradio.py +25 -71

src/kpaa/server.py CHANGED Viewed

@@ -95,10 +95,10 @@ def _excerpt_to_dict(e: Excerpt) -> dict[str, Any]:
 # 모듈 레벨 single-user 캐시 — `/v1/chat/completions` 호출 (Open WebUI에서 들어옴)
 # 시 retrieval 결과를 저장 → /api/last-references 에서 polling, `/` (분할) UI에서
-# 우측 패널이 갱신. cited_citations 는 답변 완료 시점에 final answer 와 매칭해
-# 채워짐 (검색 직후엔 빈 리스트). llm_excerpt_citations 는 retrieval 시점에
-# 상위 DEFAULT_MAX_EXCERPTS 건의 citation — 사용자가 "어느 게 LLM 입력으로
-# 갔는지" 패널에서 즉시 인지하도록. 멀티유저 가정 안 함 (로컬 단일 유저용).
 _last_refs: dict[str, Any] = {
     "ts": 0.0,
     "query": "",
@@ -106,35 +106,24 @@ _last_refs: dict[str, Any] = {
     "jo_targets": [],
     "elapsed_ms": 0,
     "excerpts": [],
-    "cited_citations": [],
     "llm_excerpt_citations": [],
-    # 답변 본문에서 추출된 (근거N) 의 N 들 — UI 가 카드 배지에 [근거N] 표시.
     "geungeo_indices_in_answer": [],
 }
 from kpaa.retrieval.citation_match import (
-    compute_cited as _compute_cited_helper,
     extract_geungeo_indices as _extract_geungeo_indices,
 )
-def _compute_cited(answer: str, excerpts: list[Excerpt]) -> list[str]:
-    """[backward-compat wrapper] excerpts → citations 추출 후 공통 헬퍼 호출."""
-    return _compute_cited_helper(answer, [e.citation for e in excerpts])
-def _mark_cited(answer: str) -> None:
-    """답변 완료 후 _last_refs 에 cited_citations + 인용 N 업데이트 + ts 갱신.
-    polling 측 (1초 주기) 이 ts 변경을 감지해 다시 그림. 매칭 정책은
-    `kpaa.retrieval.citation_match` 의 공통 헬퍼 사용 — Gradio UI 와 동일.
     """
-    excerpts_dicts = _last_refs.get("excerpts") or []
-    citations = [str(ed.get("citation") or "") for ed in excerpts_dicts]
-    cited = _compute_cited_helper(answer, citations)
-    _last_refs["cited_citations"] = cited
-    # UI 카드에 [근거N] 표시용 — answer 에 실제 등장한 N 만.
     _last_refs["geungeo_indices_in_answer"] = sorted(_extract_geungeo_indices(answer))
     _last_refs["ts"] = time.time()
@@ -175,11 +164,11 @@ def _update_last_refs(query: str, retrieval_result) -> None:
     _last_refs["elapsed_ms"] = retrieval_result.elapsed_ms
     _last_refs["excerpts"] = [_excerpt_to_dict(e) for e in retrieval_result.excerpts]
     # 상위 N건이 LLM 입력으로 — context_builder.build() 의 cap 과 동일 정책.
     _last_refs["llm_excerpt_citations"] = [
         e.citation for e in retrieval_result.excerpts[:DEFAULT_MAX_EXCERPTS]
     ]
-    # 검색 완료 시점엔 답변 아직 없음 — done 시점에 _mark_cited 가 채움.
-    _last_refs["cited_citations"] = []
     _last_refs["geungeo_indices_in_answer"] = []
@@ -528,9 +517,9 @@ async def _stream_chat(
                 yield _sse(_delta(evt["delta"]))
             elif evt["event"] == "done":
                 finish_reason = "stop"
-                # 답변 완료 — references 패널이 다음 polling 에서 채택 표시 그리도록 갱신.
                 if not _is_meta_query(query):
-                    _mark_cited(evt.get("answer") or "")
     finally:
         if ticker and not ticker.done():
             ticker.cancel()
@@ -654,7 +643,6 @@ def create_app() -> FastAPI:
                 "jo_targets": [],
                 "elapsed_ms": 0,
                 "excerpts": [],
-                "cited_citations": [],
                 "llm_excerpt_citations": [],
                 "geungeo_indices_in_answer": [],
             })
@@ -686,9 +674,9 @@ def create_app() -> FastAPI:
             elif evt["event"] == "done":
                 final_answer = evt["answer"]
         text = final_answer if final_answer is not None else "".join(chunks)
-        # 비스트리밍 분기도 답변 완료 후 cited 표�� 갱신.
         if text and not _is_meta_query(query):
-            _mark_cited(text)
         return ChatResponse(
             id=_new_id(),
             created=int(time.time()),
@@ -748,7 +736,6 @@ def create_app() -> FastAPI:
             "jo_targets": [],
             "elapsed_ms": 0,
             "excerpts": [],
-            "cited_citations": [],
             "llm_excerpt_citations": [],
             "geungeo_indices_in_answer": [],
         })
@@ -875,18 +862,14 @@ _SPLIT_HTML = """<!doctype html>
   .refs-empty { color: var(--muted); padding: 24px; text-align: center; font-size: 0.9em; }
   .ref { background: var(--card-bg); border: 1px solid var(--border); border-radius: 10px; padding: 12px 14px; margin-bottom: 12px; transition: all .2s; }
-  /* LLM 에 전달된 후보 (상위 N건) — 옅은 좌측 회색 표지 */
   .ref.llm-passed { border-left: 4px solid #9aa0a6; }
-  /* 답변에 채택된 카드 — 좌측 두꺼운 녹색 border + 옅은 녹색 배경 (.cited 가 .llm-passed 보다 우선) */
-  .ref.cited { border-color: #15833a; border-left: 4px solid #15833a; background: #f3fbf5; }
   .ref .head { display: flex; align-items: baseline; gap: 8px; flex-wrap: wrap; margin-bottom: 6px; }
   .ref .badge { display: inline-block; padding: 2px 8px; border-radius: 999px; font-size: 0.72em; font-weight: 600; color: #fff; }
-  .badge.cited-flag { background: #15833a; }
   .badge.llm-flag { background: #9aa0a6; }
-  /* "근거N" 인덱스 표시용 — 짝 배지(outline 스타일). 채택 색과 짝 매칭. */
-  .badge.cited-idx { background: #e6f4ea; color: #15833a; border: 1px solid #15833a; }
-  .badge.llm-idx { background: #f1f3f4; color: #5f6368; border: 1px solid #9aa0a6; }
-  .cited-summary { color: #15833a; font-weight: 600; }
   .llm-summary { color: #6c727b; }
   .badge.case { background: var(--case-bg); }
   .badge.law { background: var(--law-bg); }
@@ -907,12 +890,8 @@ _SPLIT_HTML = """<!doctype html>
   /* ─ 다크 컴포넌트 색 (라이트 룰들 *뒤* 에 두어야 source order 우선으로 적용) ─ */
   @media (prefers-color-scheme: dark) {
     .ref.llm-passed { border-left-color: #6b7280; }
-    .ref.cited { background: #11261a; border-color: #4ade80; border-left-color: #4ade80; }
-    .badge.cited-flag { background: #16a34a; }
     .badge.llm-flag { background: #6b7280; }
-    .badge.cited-idx { background: #11261a; color: #4ade80; border-color: #4ade80; }
-    .badge.llm-idx { background: #2a2a2a; color: #c4c7c5; border-color: #6b7280; }
-    .cited-summary { color: #4ade80; }
     .llm-summary { color: #9aa0a6; }
   }
@@ -960,34 +939,24 @@ function escapeHtml(s) {
 function render(payload) {
   const rawExcerpts = payload.excerpts || [];
-  const citedSet = new Set(payload.cited_citations || []);
   const llmSet = new Set(payload.llm_excerpt_citations || []);
-  const geungeoSet = new Set(payload.geungeo_indices_in_answer || []);  // 답변에 실제 등장한 N
-  const citedCount = rawExcerpts.filter(e => citedSet.has((e.citation || "").trim())).length;
   const llmCount = rawExcerpts.filter(e => llmSet.has((e.citation || "").trim())).length;
   // 카드별 *원본 LLM 입력 순서* (1-based) 보존 — 정렬 후에도 유지되도록 미리 부여.
   // 이 순서가 답변 본문의 (근거N) 의 N 과 일치 (context_builder 가 같은 순서로 [근거N] 박음).
   const indexed = rawExcerpts.map((e, i) => ({ ...e, _idx: i + 1 }));
-  // 3-tier 정렬: 채택(0) → LLM 후보(1) → 검색만(2). stable.
-  const tier = (e) => {
-    const c = (e.citation || "").trim();
-    if (citedSet.has(c)) return 0;
-    if (llmSet.has(c))   return 1;
-    return 2;
-  };
   const excerpts = [...indexed].sort((a, b) => tier(a) - tier(b));
-  // 헤더 — "6건 · LLM 전달 3건 · 답변에 채택 1건"
   if (rawExcerpts.length) {
     const parts = [`${rawExcerpts.length}건`];
     if (llmCount) {
       parts.push(`<span class="llm-summary">LLM 전달 ${llmCount}건</span>`);
     }
-    if (citedCount) {
-      parts.push(`<span class="cited-summary">답변에 채택 ${citedCount}건</span>`);
-    }
     refsCountEl.innerHTML = parts.join(" · ");
   } else {
     refsCountEl.textContent = "";
@@ -1004,27 +973,20 @@ function render(payload) {
   for (const e of excerpts) {
     const card = document.createElement("div");
     const cit = (e.citation || "").trim();
-    const isCited = citedSet.has(cit);
     const isLlmPassed = llmSet.has(cit);
-    // .cited 가 .llm-passed 보다 우선 시각화 (둘 다일 때 cited 만 부여 — 시각 redundancy 회피).
-    card.className = "ref" + (isCited ? " cited" : (isLlmPassed ? " llm-passed" : ""));
     const label = LABEL[e.source_type] || e.source_type;
     const link = e.url
       ? `<a class="orig" href="${escapeHtml(e.url)}" target="_blank" rel="noopener noreferrer">원문 페이지 열기 ↗</a>`
       : `<span class="nolink">원문 페이지 미제공 — 위 본문을 LLM이 직접 참조</span>`;
-    // 답변 본문에 (근거N) 으로 등장한 카드만 별도 "근거N" 짝 배지 표시.
     const showIdx = geungeoSet.has(e._idx);
     let stateBadge = "";
-    if (isCited) {
-      stateBadge = `<span class="badge cited-flag" title="AI 답변에 인용됨">✓ 답변에 채택</span>`;
-      if (showIdx) {
-        stateBadge += `<span class="badge cited-idx" title="답변의 (근거${e._idx}) 표기와 매칭">근거${e._idx}</span>`;
-      }
-    } else if (isLlmPassed) {
-      stateBadge = `<span class="badge llm-flag" title="LLM 입력으로 전달됨">LLM 전달</span>`;
-      if (showIdx) {
-        stateBadge += `<span class="badge llm-idx" title="답변의 (근거${e._idx}) 표기와 매칭">근거${e._idx}</span>`;
-      }
     }
     card.innerHTML = `
       <div class="head">

 # 모듈 레벨 single-user 캐시 — `/v1/chat/completions` 호출 (Open WebUI에서 들어옴)
 # 시 retrieval 결과를 저장 → /api/last-references 에서 polling, `/` (분할) UI에서
+# 우측 패널이 갱신. llm_excerpt_citations 는 retrieval 시점에 상위
+# DEFAULT_MAX_EXCERPTS 건의 citation — *그 7건 모두* LLM 이 컨텍스트로 참고한
+# 후보. geungeo_indices_in_answer 는 답변 본문에 LLM 이 명시적으로 (근거N) 으로
+# 적은 N 들 — UI 카드의 "근거N" chip 표시에만 사용. 멀티유저 가정 안 함.
 _last_refs: dict[str, Any] = {
     "ts": 0.0,
     "query": "",
     "jo_targets": [],
     "elapsed_ms": 0,
     "excerpts": [],
     "llm_excerpt_citations": [],
     "geungeo_indices_in_answer": [],
 }
 from kpaa.retrieval.citation_match import (
     extract_geungeo_indices as _extract_geungeo_indices,
 )
+def _mark_geungeo(answer: str) -> None:
+    """답변 완료 후 _last_refs 의 geungeo_indices_in_answer + ts 갱신.
+    답변 본문에 LLM 이 명시적으로 적은 (근거N) 의 N 만 추출 — UI 카드에 "근거N"
+    chip 표시용. polling 측 (1초 주기) 이 ts 변경을 감지해 다시 그림.
+    의미 매칭 (paraphrase 추적) 은 하지 않음 — top-N 모두 LLM 이 본 후보이고
+    그 외엔 *명시 인용* 만 신뢰 가능한 신호이기 때문.
     """
     _last_refs["geungeo_indices_in_answer"] = sorted(_extract_geungeo_indices(answer))
     _last_refs["ts"] = time.time()
     _last_refs["elapsed_ms"] = retrieval_result.elapsed_ms
     _last_refs["excerpts"] = [_excerpt_to_dict(e) for e in retrieval_result.excerpts]
     # 상위 N건이 LLM 입력으로 — context_builder.build() 의 cap 과 동일 정책.
+    # 이 N건 *전부* 가 LLM 이 컨텍스트로 본 후보. 별도 "채택" 표기 없음.
     _last_refs["llm_excerpt_citations"] = [
         e.citation for e in retrieval_result.excerpts[:DEFAULT_MAX_EXCERPTS]
     ]
+    # 답변 완료 시점에 _mark_geungeo 가 (근거N) 추출해 채움.
     _last_refs["geungeo_indices_in_answer"] = []
                 yield _sse(_delta(evt["delta"]))
             elif evt["event"] == "done":
                 finish_reason = "stop"
+                # 답변 완료 — (근거N) chip 인덱스만 추출해서 우측 패널 polling 갱신.
                 if not _is_meta_query(query):
+                    _mark_geungeo(evt.get("answer") or "")
     finally:
         if ticker and not ticker.done():
             ticker.cancel()
                 "jo_targets": [],
                 "elapsed_ms": 0,
                 "excerpts": [],
                 "llm_excerpt_citations": [],
                 "geungeo_indices_in_answer": [],
             })
             elif evt["event"] == "done":
                 final_answer = evt["answer"]
         text = final_answer if final_answer is not None else "".join(chunks)
+        # 비스트리밍 분기도 답변 완료 후 (근거N) chip 갱신.
         if text and not _is_meta_query(query):
+            _mark_geungeo(text)
         return ChatResponse(
             id=_new_id(),
             created=int(time.time()),
             "jo_targets": [],
             "elapsed_ms": 0,
             "excerpts": [],
             "llm_excerpt_citations": [],
             "geungeo_indices_in_answer": [],
         })
   .refs-empty { color: var(--muted); padding: 24px; text-align: center; font-size: 0.9em; }
   .ref { background: var(--card-bg); border: 1px solid var(--border); border-radius: 10px; padding: 12px 14px; margin-bottom: 12px; transition: all .2s; }
+  /* LLM 에 전달된 후보 (상위 N건) — 옅은 좌측 회색 표지. *그 N건 모두* 가
+     LLM 이 본 후보. 의미 매칭(paraphrase) 추적은 안 하므로 "채택" tier 없음. */
   .ref.llm-passed { border-left: 4px solid #9aa0a6; }
   .ref .head { display: flex; align-items: baseline; gap: 8px; flex-wrap: wrap; margin-bottom: 6px; }
   .ref .badge { display: inline-block; padding: 2px 8px; border-radius: 999px; font-size: 0.72em; font-weight: 600; color: #fff; }
   .badge.llm-flag { background: #9aa0a6; }
+  /* "근거N" chip — 답변 본문에 (근거N) 으로 *명시* 등장한 카드만. outline 스타일. */
+  .badge.geungeo-idx { background: #f1f3f4; color: #5f6368; border: 1px solid #9aa0a6; }
   .llm-summary { color: #6c727b; }
   .badge.case { background: var(--case-bg); }
   .badge.law { background: var(--law-bg); }
   /* ─ 다크 컴포넌트 색 (라이트 룰들 *뒤* 에 두어야 source order 우선으로 적용) ─ */
   @media (prefers-color-scheme: dark) {
     .ref.llm-passed { border-left-color: #6b7280; }
     .badge.llm-flag { background: #6b7280; }
+    .badge.geungeo-idx { background: #2a2a2a; color: #c4c7c5; border-color: #6b7280; }
     .llm-summary { color: #9aa0a6; }
   }
 function render(payload) {
   const rawExcerpts = payload.excerpts || [];
   const llmSet = new Set(payload.llm_excerpt_citations || []);
+  const geungeoSet = new Set(payload.geungeo_indices_in_answer || []);  // 답변 본문 (근거N) 의 N
   const llmCount = rawExcerpts.filter(e => llmSet.has((e.citation || "").trim())).length;
   // 카드별 *원본 LLM 입력 순서* (1-based) 보존 — 정렬 후에도 유지되도록 미리 부여.
   // 이 순서가 답변 본문의 (근거N) 의 N 과 일치 (context_builder 가 같은 순서로 [근거N] 박음).
   const indexed = rawExcerpts.map((e, i) => ({ ...e, _idx: i + 1 }));
+  // 2-tier 정렬: LLM 후보(0) → 검색만(1). stable.
+  const tier = (e) => llmSet.has((e.citation || "").trim()) ? 0 : 1;
   const excerpts = [...indexed].sort((a, b) => tier(a) - tier(b));
+  // 헤더 — "8건 · LLM 전달 7건"
   if (rawExcerpts.length) {
     const parts = [`${rawExcerpts.length}건`];
     if (llmCount) {
       parts.push(`<span class="llm-summary">LLM 전달 ${llmCount}건</span>`);
     }
     refsCountEl.innerHTML = parts.join(" · ");
   } else {
     refsCountEl.textContent = "";
   for (const e of excerpts) {
     const card = document.createElement("div");
     const cit = (e.citation || "").trim();
     const isLlmPassed = llmSet.has(cit);
+    card.className = "ref" + (isLlmPassed ? " llm-passed" : "");
     const label = LABEL[e.source_type] || e.source_type;
     const link = e.url
       ? `<a class="orig" href="${escapeHtml(e.url)}" target="_blank" rel="noopener noreferrer">원문 페이지 열기 ↗</a>`
       : `<span class="nolink">원문 페이지 미제공 — 위 본문을 LLM이 직접 참조</span>`;
+    // 답변 본문에 (근거N) 으로 *명시* 등장한 카드만 "근거N" chip — 순수 정보 표시.
     const showIdx = geungeoSet.has(e._idx);
     let stateBadge = "";
+    if (isLlmPassed) {
+      stateBadge = `<span class="badge llm-flag" title="LLM 입력으로 전달됨 — 모델이 이 카드를 컨텍스트로 봄">LLM 전달</span>`;
+    }
+    if (showIdx) {
+      stateBadge += `<span class="badge geungeo-idx" title="답변 본문의 (근거${e._idx}) 표기와 매칭">근거${e._idx}</span>`;
     }
     card.innerHTML = `
       <div class="head">

src/kpaa/ui/gradio.py CHANGED Viewed

@@ -29,10 +29,7 @@ from kpaa.llm import LLMOptions
 from kpaa.llm.manager import get_manager
 from kpaa.llm.presets import list_presets
 from kpaa.pipeline import generate
-from kpaa.retrieval.citation_match import (
-    compute_cited_with_indices,
-    extract_geungeo_indices,
-)
 from kpaa.retrieval.context_builder import DEFAULT_MAX_EXCERPTS
 from kpaa.retrieval.excerpts import Excerpt
@@ -74,35 +71,27 @@ _EXAMPLE_QUESTIONS = [
 ]
-def _cited_excerpts(answer: str, excerpts: list[Excerpt]) -> set[str]:
-    """[backward-compat] 답변에 인용된 excerpt citation 집합 — 공통 헬퍼 wrap."""
-    from kpaa.retrieval.citation_match import compute_cited
-    return set(compute_cited(answer, [e.citation for e in excerpts]))
 def _render_references_html(
     excerpts: list[Excerpt],
     elapsed_ms: int,
-    cited_citations: set[str] | None = None,
     llm_passed_citations: set[str] | None = None,
     geungeo_indices: set[int] | None = None,
 ) -> str:
     """우측 패널 HTML 카드 묶음 — server.py 분할 화면과 동일 정책.
-    표시 단계 (3-tier):
-      - 채택 (cited_citations): 좌측 녹색 border + 녹색 배경 + ✓ 배지 + [근거N]
-      - LLM 전달 (llm_passed_citations): 좌측 회색 표지 + 회색 배지 + [근거N]
-      - 검색만: 표시 없음 (회색 카드)
     Args:
         excerpts: 검색된 전체 (ranker 정렬 순서). 1-based 위치 = (근거N) N.
         elapsed_ms: 검색 시간.
-        cited_citations: 답변에 인용된 citation set. None 이면 강조 X.
         llm_passed_citations: LLM 입력으로 전달된 상위 N건 citation set.
-                              None 이면 그 표시 X.
-        geungeo_indices: 답변에 (근거N) 으로 등장한 N 들 (1-based). 카드 배지에
-                         [근거N] 태그 추가용. None 이면 태그 없음.
     """
     if not excerpts:
         return (
@@ -110,24 +99,17 @@ def _render_references_html(
             "근거가 검색되지 않았습니다."
             "</div>"
         )
-    cited_set = cited_citations or set()
     llm_set = llm_passed_citations or set()
     geungeo_set = geungeo_indices or set()
-    cited_count = sum(1 for e in excerpts if (e.citation or "").strip() in cited_set)
     llm_count = sum(1 for e in excerpts if (e.citation or "").strip() in llm_set)
-    # 카드별 원본 LLM 입력 순서(1-based) 보존 — 정렬 후에도 [근거N] 매핑 유지.
     indexed: list[tuple[int, Excerpt]] = list(enumerate(excerpts, 1))
-    # 3-tier 정렬 (stable): 채택 → LLM 후보 → 나머지.
     def _tier(item: tuple[int, Excerpt]) -> int:
-        c = (item[1].citation or "").strip()
-        if c in cited_set:
-            return 0
-        if c in llm_set:
-            return 1
-        return 2
     sorted_items = sorted(indexed, key=_tier)
@@ -137,10 +119,6 @@ def _render_references_html(
         summary_parts.append(
             f'<span style="color:#6c727b;">LLM 전달 {llm_count}건</span>'
         )
-    if cited_count:
-        summary_parts.append(
-            f'<span style="color:#15833a;font-weight:600;">답변에 채택 {cited_count}건</span>'
-        )
     summary = " · ".join(summary_parts)
     parts: list[str] = [
         f'<div style="padding:8px 12px;color:#888;font-size:0.82em;">{summary}</div>'
@@ -151,7 +129,6 @@ def _render_references_html(
         color = _BADGE_COLOR.get(e.source_type, "#666")
         url = (e.metadata or {}).get("url", "").strip()
         cit = (e.citation or "").strip()
-        is_cited = cit in cited_set
         is_llm_passed = cit in llm_set
         show_idx = idx in geungeo_set
@@ -169,34 +146,8 @@ def _render_references_html(
         content = html.escape(e.content or "")
         citation = html.escape(e.citation)
-        # 짝 배지 — 답변 본문에 (근거N) 표기로 등장한 카드만 인덱스 chip 추가.
-        # 채택/LLM 전달 색상에 맞춰 outline 톤으로.
-        def _idx_chip(scheme: str) -> str:
-            # scheme: "cited" (녹) 또는 "llm" (회)
-            if scheme == "cited":
-                bg, fg, bd = "#e6f4ea", "#15833a", "#15833a"
-            else:
-                bg, fg, bd = "#f1f3f4", "#5f6368", "#9aa0a6"
-            return (
-                '<span style="display:inline-block;padding:2px 8px;border-radius:999px;'
-                f'font-size:0.72em;font-weight:600;color:{fg};background:{bg};border:1px solid {bd};" '
-                f'title="답변의 (근거{idx}) 표기와 매칭">근거{idx}</span>'
-            )
-        # 카드 스타일 + 상태 배지 (cited > llm-passed > none)
-        if is_cited:
-            card_style = (
-                "background:#f3fbf5;border:1px solid #b9e3c5;border-left:4px solid #15833a;"
-                "border-radius:10px;padding:12px 14px;margin:8px 12px;"
-            )
-            state_badge = (
-                '<span style="display:inline-block;padding:2px 8px;border-radius:999px;'
-                'font-size:0.72em;font-weight:600;color:#fff;background:#15833a;" '
-                'title="AI 답변에 인용됨">✓ 답변에 채택</span>'
-            )
-            if show_idx:
-                state_badge += _idx_chip("cited")
-        elif is_llm_passed:
             card_style = (
                 "background:#fff;border:1px solid #e5e5e5;border-left:4px solid #9aa0a6;"
                 "border-radius:10px;padding:12px 14px;margin:8px 12px;"
@@ -204,10 +155,8 @@ def _render_references_html(
             state_badge = (
                 '<span style="display:inline-block;padding:2px 8px;border-radius:999px;'
                 'font-size:0.72em;font-weight:600;color:#fff;background:#9aa0a6;" '
-                'title="LLM 입력으로 전달됨 (답변 명시 인용은 안 됨)">LLM 전달</span>'
             )
-            if show_idx:
-                state_badge += _idx_chip("llm")
         else:
             card_style = (
                 "background:#fff;border:1px solid #e5e5e5;border-radius:10px;"
@@ -215,6 +164,15 @@ def _render_references_html(
             )
             state_badge = ""
         parts.append(
             f"""<div style="{card_style}">
               <div style="display:flex;align-items:baseline;gap:8px;flex-wrap:wrap;margin-bottom:6px;">
@@ -344,10 +302,7 @@ async def _stream_answer(
         elif kind == "done":
             final_answer = evt["answer"]
             chatbot[-1]["content"] = final_answer
-            # ★ 답변 완료 — 공통 매칭 헬퍼로 cited + (근거N) indices 추출 후 재렌더.
-            citations = [e.citation for e in retrieval_excerpts]
-            cited_list, _cited_idx = compute_cited_with_indices(final_answer, citations)
-            cited = set(cited_list)
             geungeo = extract_geungeo_indices(final_answer)
             llm_passed = {
                 e.citation for e in retrieval_excerpts[:DEFAULT_MAX_EXCERPTS] if e.citation
@@ -355,7 +310,6 @@ async def _stream_answer(
             refs_html = _render_references_html(
                 retrieval_excerpts,
                 retrieval_elapsed_ms,
-                cited_citations=cited,
                 llm_passed_citations=llm_passed,
                 geungeo_indices=geungeo,
             )

 from kpaa.llm.manager import get_manager
 from kpaa.llm.presets import list_presets
 from kpaa.pipeline import generate
+from kpaa.retrieval.citation_match import extract_geungeo_indices
 from kpaa.retrieval.context_builder import DEFAULT_MAX_EXCERPTS
 from kpaa.retrieval.excerpts import Excerpt
 ]
 def _render_references_html(
     excerpts: list[Excerpt],
     elapsed_ms: int,
     llm_passed_citations: set[str] | None = None,
     geungeo_indices: set[int] | None = None,
 ) -> str:
     """우측 패널 HTML 카드 묶음 — server.py 분할 화면과 동일 정책.
+    표시 단계 (2-tier):
+      - LLM 전달 (llm_passed_citations): 좌측 회색 표지 + 회색 "LLM 전달" 배지.
+        그 N건 *전부* 가 LLM 이 본 후보 (의미 매칭 추적은 안 함).
+      - 검색만: 표시 없음.
+    + 답변 본문에 (근거N) 으로 *명시* 등장한 카드는 추가로 "근거N" outline chip.
+      (LLM 이 명시적으로 라벨링한 신호이고, 명시 안 된 청크도 답변에 영향 줬을 수
+      있으므로 별도 "채택" 강조 색상은 두지 않음.)
     Args:
         excerpts: 검색된 전체 (ranker 정렬 순서). 1-based 위치 = (근거N) N.
         elapsed_ms: 검색 시간.
         llm_passed_citations: LLM 입력으로 전달된 상위 N건 citation set.
+        geungeo_indices: 답변에 (근거N) 으로 등장한 N 들 (1-based).
     """
     if not excerpts:
         return (
             "근거가 검색되지 않았습니다."
             "</div>"
         )
     llm_set = llm_passed_citations or set()
     geungeo_set = geungeo_indices or set()
     llm_count = sum(1 for e in excerpts if (e.citation or "").strip() in llm_set)
+    # 카드별 원본 LLM 입력 순서(1-based) 보존 — 정렬 후에도 (근거N) 매핑 유지.
     indexed: list[tuple[int, Excerpt]] = list(enumerate(excerpts, 1))
+    # 2-tier 정렬 (stable): LLM 후보 → 나머지.
     def _tier(item: tuple[int, Excerpt]) -> int:
+        return 0 if (item[1].citation or "").strip() in llm_set else 1
     sorted_items = sorted(indexed, key=_tier)
         summary_parts.append(
             f'<span style="color:#6c727b;">LLM 전달 {llm_count}건</span>'
         )
     summary = " · ".join(summary_parts)
     parts: list[str] = [
         f'<div style="padding:8px 12px;color:#888;font-size:0.82em;">{summary}</div>'
         color = _BADGE_COLOR.get(e.source_type, "#666")
         url = (e.metadata or {}).get("url", "").strip()
         cit = (e.citation or "").strip()
         is_llm_passed = cit in llm_set
         show_idx = idx in geungeo_set
         content = html.escape(e.content or "")
         citation = html.escape(e.citation)
+        # 카드 스타일 + 상태 배지
+        if is_llm_passed:
             card_style = (
                 "background:#fff;border:1px solid #e5e5e5;border-left:4px solid #9aa0a6;"
                 "border-radius:10px;padding:12px 14px;margin:8px 12px;"
             state_badge = (
                 '<span style="display:inline-block;padding:2px 8px;border-radius:999px;'
                 'font-size:0.72em;font-weight:600;color:#fff;background:#9aa0a6;" '
+                'title="LLM 입력으로 전달됨 — 모델이 이 카드를 컨텍스트로 봄">LLM 전달</span>'
             )
         else:
             card_style = (
                 "background:#fff;border:1px solid #e5e5e5;border-radius:10px;"
             )
             state_badge = ""
+        # (근거N) chip — 답변 본문에 명시 등장한 카드에만. outline 회색 톤 (정보 표시).
+        if show_idx:
+            state_badge += (
+                '<span style="display:inline-block;padding:2px 8px;border-radius:999px;'
+                'font-size:0.72em;font-weight:600;color:#5f6368;background:#f1f3f4;'
+                'border:1px solid #9aa0a6;" '
+                f'title="답변 본문의 (근거{idx}) 표기와 매칭">근거{idx}</span>'
+            )
         parts.append(
             f"""<div style="{card_style}">
               <div style="display:flex;align-items:baseline;gap:8px;flex-wrap:wrap;margin-bottom:6px;">
         elif kind == "done":
             final_answer = evt["answer"]
             chatbot[-1]["content"] = final_answer
+            # ★ 답변 완료 — (근거N) chip 인덱스만 추출 후 재렌더.
             geungeo = extract_geungeo_indices(final_answer)
             llm_passed = {
                 e.citation for e in retrieval_excerpts[:DEFAULT_MAX_EXCERPTS] if e.citation
             refs_html = _render_references_html(
                 retrieval_excerpts,
                 retrieval_elapsed_ms,
                 llm_passed_citations=llm_passed,
                 geungeo_indices=geungeo,
             )