Spaces:

ise0305
/

CodeWeaver

Sleeping

App Files Files Community

ㅅㅎㅇ commited on Dec 21, 2025

Commit

ea80cdc

0 Parent(s):

Initial commit for Hugging Face Spaces

Browse files

Files changed (7) hide show

.gitignore +34 -0
ARCHITECTURE.md +231 -0
CodeWeaver +1 -0
DYNAMIC_PARALLEL_SEARCH.md +553 -0
README.md +40 -0
app.py +41 -0
requirements.txt +7 -0

.gitignore ADDED Viewed

	@@ -0,0 +1,34 @@

+# Python
+__pycache__/
+*.py[cod]
+*$py.class
+*.so
+.Python
+*.egg-info/
+dist/
+build/
+# Environment
+.env
+.venv
+env/
+venv/
+ENV/
+# IDE
+.vscode/
+.idea/
+*.swp
+*.swo
+# OS
+.DS_Store
+Thumbs.db
+# Logs
+*.log
+# Lock files (HF Spaces will install from requirements.txt)
+uv.lock
+poetry.lock

ARCHITECTURE.md ADDED Viewed

	@@ -0,0 +1,231 @@

+# CodeWeaver 아키텍처 (실제 코드 기준)
+이 문서는 현재 저장소의 CodeWeaver가 **어떤 순서로 동작하는지**, 그리고 그 원리가 무엇인지(상태/라우팅/병렬화/캐시)를 **코드와 1:1로 정합**되게 설명합니다.
+## 전체 구성 요소
+- **UI**: Gradio 채팅 UI (`CodeWeaver/ui/app.py`)
+  - 사용자 입력을 `AgentState`로 포장한 뒤 `agent.ainvoke(..., config={"configurable": {"thread_id": ...}})`로 실행합니다.
+- **오케스트레이션(그래프)**: LangGraph `StateGraph` (`CodeWeaver/src/agent/graph.py`)
+  - `START → create_plan`로 진입 후, 질문 유형/개수에 따라 분기합니다.
+  - 체크포인팅: `MemorySaver` 사용(스레드/세션 단위 상태 유지).
+- **노드 구현**: (`CodeWeaver/src/agent/nodes.py`)
+  - 질문 분석, 캐시 조회, 의도 분류, 3소스 병렬 검색, 결과 평가/리파인, 필터링/요약, 답변 생성, 다중 질문 결합 등을 담당합니다.
+- **상태 모델(Reducer 포함)**: (`CodeWeaver/src/agent/state.py`)
+  - `search_results`는 `Annotated[List[SearchResult], add]`로 **병렬 검색 결과가 자동 병합**됩니다.
+  - `intermediate_steps`, `multi_answers`는 **리셋 토큰을 지원하는 커스텀 reducer**로, 체크포인팅/스레드 유지 시 이전 턴의 누적을 방지합니다.
+- **캐시(Vector DB)**: Qdrant Cloud (`CodeWeaver/src/vector_db/qdrant_client.py`)
+  - 임베딩은 로컬 `BAAI/bge-m3`(`sentence-transformers`)로 생성, Qdrant에 저장/검색합니다.
+- **검색 소스**: (`CodeWeaver/src/tools/search_tools.py`)
+  - Stack Overflow(공식 StackExchange API), GitHub Code Search API, Tavily(공식문서 도메인 제한) 사용.
+## 사용자 제공 그래프와의 정합성
+사용자께서 제공한 Mermaid 그래프는 이 프로젝트의 의도와 **대부분 일치**합니다.
+### 일치하는 부분(핵심 파이프라인)
+- `create_plan`에서 **single_topic / multiple_questions(2개) / too_many(3+)** 분기
+- 단일 질문(혹은 단일 주제)에서:
+  - `analyze_question → check_cache → (hit면 return_cached_answer) / (miss면 classify_intent)`
+  - `classify_intent` 이후 3소스 검색을 Send API로 병렬 실행(fan-out)하고 `collect_results`에서 fan-in
+  - `evaluate_results → (필요 시 refine_search 1회) → filter_and_score → summarize_results → generate_answer`
+- `evaluate_results`가 부족하면 `refine_search → classify_intent`로 **최대 1회 루프**
+### 실제 코드에서 추가/변형된 부분(중요)
+1) **clarification(보충 요청) 전용 경로가 존재**
+- `analyze_question` 결과가 `clarification`이면
+  - **캐시/검색을 수행하지 않고**
+  - `generate_with_history`로 바로 답변하고 종료합니다.
+2) **multiple_questions fan-out은 `analyze_question`로 직접 들어가지 않음**
+사용자 그래프는 “dynamic에서 Send로 analyze_question을 2번 호출” 형태에 가깝지만, 실제 구현은 다릅니다.
+- 실제 구현은 `fanout_multi_questions`가 `Send("run_single_question_worker", child_state)`를 생성합니다.
+- 이유: outer graph에서 질문 2개를 동시에 동일 파이프라인(analyze/cache/intent/…)으로 돌리면
+  - `question_type`, `cached_result` 같은 **scalar 채널(state 필드)**이 병렬 업데이트 충돌을 일으킬 수 있습니다.
+- 따라서 **worker 내부에서 별도의 ‘단일 질문 그래프’를 실행**하고,
+  - outer graph에는 reducer 채널인 `multi_answers`만 업데이트하여 충돌을 제거합니다.
+## 실제 실행 흐름(코드 기준)
+### 1) UI → Agent 실행(엔트리)
+`CodeWeaver/ui/app.py`에서:
+- 입력 문자열 `message`를 `AgentState(user_question=..., messages=[HumanMessage(...)], ...)`로 만들고
+- `thread_id`를 `config={"configurable":{"thread_id": thread_id}}`로 전달하여 `agent.ainvoke()` 실행
+  - `MemorySaver`가 `thread_id` 단위로 상태를 보존합니다.
+### 2) 메인 그래프(Top-level) 흐름
+`CodeWeaver/src/agent/graph.py` 기준 메인 흐름은 아래와 같습니다.
+```mermaid
+graph TD
+    startNode[START] --> createPlan[create_plan]
+    createPlan -->|single_topic| analyzeQuestion[analyze_question]
+    createPlan -->|multiple_questions_2| initiateDynamic[initiate_dynamic_search]
+    createPlan -->|too_many_3plus| tooMany[handle_too_many_questions]
+    tooMany --> endNode[END]
+    analyzeQuestion -->|clarification| withHistory[generate_with_history]
+    withHistory --> endNode
+    analyzeQuestion -->|new_topic_or_independent| checkCache[check_cache]
+    checkCache -->|hit| returnCached[return_cached_answer]
+    returnCached --> endNode
+    checkCache -->|miss| classifyIntent[classify_intent]
+    classifyIntent --> searchSO[search_stackoverflow]
+    classifyIntent --> searchGH[search_github]
+    classifyIntent --> searchDocs[search_official_docs]
+    searchSO --> collect[collect_results]
+    searchGH --> collect
+    searchDocs --> collect
+    collect --> evalNode[evaluate_results]
+    evalNode -->|needs_refinement_and_lt1| refine[refine_search]
+    refine --> classifyIntent
+    evalNode -->|sufficient_or_ge1| searchSubgraph[search_subgraph]
+    searchSubgraph --> generateAnswer[generate_answer]
+    generateAnswer --> routeAfterGen[route_after_generate]
+    routeAfterGen -->|single| endNode
+    routeAfterGen -->|multi| combine[combine_answers]
+    combine --> endNode
+    initiateDynamic --> fanout[fanout_multi_questions]
+    fanout --> worker[run_single_question_worker]
+    worker --> combine
+```
+### 3) `create_plan`: 질문 개수/형태 판별 + “3개 이상” 하드 가드
+`create_plan_node`는 입력을 아래 3가지로 분류합니다.
+- **single_topic**: 하나의 주제를 다양한 관점으로 묻는 형태
+- **multiple_questions**: 독립 질문 2개
+- **too_many**: 독립 질문 3개 이상
+추가로, LLM 분류와 무관하게 다음 조건이면 **결정론적으로 too_many**로 강제합니다.
+- 물음표가 3개 이상
+- 또는 “질문 후보”가 3개 이상(줄바꿈/번호/구분자 등으로 추정)
+또한 체크포인팅 상태 누적을 막기 위해, 매 실행 시작 시 `multi_answers`를 리셋 토큰으로 초기화합니다.
+### 4) `analyze_question`: 질문 타입(clarification/new_topic/independent) + 캐시 적격성 판단
+`analyze_question_node`가 LLM으로 아래 값을 생성합니다.
+- `question_type`: `clarification | new_topic | independent`
+- `should_cache`: 캐시 저장 여부
+- `canonical_question`: 캐시용 정규화 질문(should_cache=true일 때)
+라우팅은 `graph.py`의 `route_after_analysis`에서:
+- `clarification` → `generate_with_history` (검색/캐시 생략)
+- 나머지 → `check_cache`
+### 5) 캐시(`check_cache` / `return_cached_answer`)
+`check_cache_node`는 Qdrant에서 유사 질문을 검색합니다.
+- 임베딩: 로컬 `BAAI/bge-m3` (1024차원)
+- 임계값: cosine score **0.85 이상**이면 hit로 간주
+hit면 `return_cached_answer_node`가 저장된 답변을 즉시 반환합니다.
+### 6) 의도 분류(`classify_intent`)
+`classify_intent_node`가 질문을 `debugging | learning | code_review`로 분류합니다.
+이 값은 검색 개수 등 일부 정책에 반영됩니다(예: StackOverflow는 debugging이면 더 많이 가져옴).
+### 7) 병렬 검색(fan-out) → 수집(fan-in)
+`classify_intent` 이후 conditional edge 함수가 `Send(...)` 3개를 반환하여 병렬로 실행됩니다.
+- `search_stackoverflow_node`
+- `search_github_node`
+- `search_official_docs_node`
+각 노드는 `{"search_results": [..]}`를 반환하고, `AgentState.search_results`의 reducer(`add`)가 이를 자동 병합합니다.
+`collect_results_node`는 병합된 총 결과 개수만 집계합니다.
+### 8) 결과 평가(`evaluate_results`)와 쿼리 리파인(`refine_search`)
+`evaluate_results_node`는 다음 기준으로 “개선 필요”를 판단합니다.
+- 결과 개수 < 2 → 개선 필요
+- (relevance_score가 있다면) 평균 점수 < 0.5 → 개선 필요
+`refine_search_node`는 LLM이 `MORE_SPECIFIC | MORE_GENERAL | TRANSLATE` 전략을 선택해 쿼리를 개선합니다.
+- 무한 루프 방지: `refinement_count < 1`일 때만 1회 허용
+- 재검색을 위해 `search_results`를 빈 리스트로 초기화하고 `classify_intent`로 되돌아갑니다.
+### 9) `search_subgraph`: 필터링 + 요약
+메인 그래프에는 `search_subgraph`가 “하나의 노드”처럼 붙어 있습니다.
+- `filter_and_score`: 최소 길이/URL 조건으로 필터 후, 상위 일부에 대해 관련도 점수 부여
+- `summarize_results`: 각 결과를 2~3문장으로 요약
+### 10) `generate_answer`: 답변 생성 + (조건부) 캐시 저장
+`generate_answer_node`는 의도에 따라 템플릿을 바꿔 최종 답변을 생성합니다.
+캐시 저장 정책:
+- `question_type`가 `new_topic` 또는 `independent`이고 `should_cache`가 true이면 저장
+- `clarification`은 저장하지 않음(라우팅상 보통 여기로 오지 않지만 방어적으로 체크)
+### 11) 다중 질문(multiple_questions) 처리 원리
+다중 질문의 핵심은 “outer graph는 충돌 없이 orchestration만, 실제 파이프라인은 worker 내부에서 실행”입니다.
+#### 흐름
+- `create_plan(case=multiple_questions)` → `initiate_dynamic_search` (준비)
+- `fanout_multi_questions`(conditional edge)이 질문 2개를 각각 `run_single_question_worker`로 Send
+- `run_single_question_worker_node` 내부에서 **단일 질문용 그래프를 별도 compile/실행**
+- worker 결과는 `multi_answers`에 append(reducer로 병합)
+- 모든 worker가 끝나면 `combine_answers_node`가 Markdown으로 결합
+#### 왜 worker가 필요한가?
+outer graph에서 동일한 state를 복제해 `analyze_question`부터 동시에 돌리면,
+scalar 채널(`question_type`, `cached_result` 등)이 서로 덮어쓰일 수 있습니다.
+그래서 실제 구현은:
+- worker 내부에서 단일 질문 그래프를 돌리고
+- outer state에는 **reducer 채널인 `multi_answers`만** 업데이트
+이 방식으로 병렬 실행 안정성을 확보합니다.
+## 환경 변수(실행에 필요한 실제 값)
+필수:
+- `GOOGLE_API_KEY`: Gemini 호출(`langchain-google-genai`)
+- `QDRANT_URL`, `QDRANT_API_KEY`: Qdrant Cloud 캐시
+- `TAVILY_API_KEY`: 공식 문서 검색(Tavily)
+선택:
+- `GITHUB_TOKEN`: GitHub API rate limit 완화(없으면 60 req/hr 수준)
+- `LANGCHAIN_TRACING_V2`, `LANGCHAIN_API_KEY`: LangSmith 트레이싱(선택)

CodeWeaver ADDED Viewed

	@@ -0,0 +1 @@


1	+ Subproject commit fc4c811e94059981ae4ef7924c9aed6ccc9cbc44

DYNAMIC_PARALLEL_SEARCH.md ADDED Viewed

	@@ -0,0 +1,553 @@

+# Dynamic Parallel Search for Multiple Independent Questions
+## 개요
+CodeWeaver Phase 4는 **다중 독립 질문**을 Send API로 동적 병렬 처리하여, 각 질문마다 독립적인 검색 파이프라인을 실행합니다.
+### 핵심 철학
+> "기존 그래프를 100% 재사용하되, 질문 개수만큼 복제해서 병렬 실행한다"
+- **기존 코드 재사용률**: ~95%
+- **새로운 노드**: 5개 추가
+- **새로운 edge 함수**: 1개 추가 (fanout_multi_questions)
+- **수정된 노드**: 2개 수정 (create_plan, generate_answer)
+## 주요 기능
+### 1. 자동 질문 유형 감지
+**create_plan_node**가 질문을 분석하여 3가지 케이스로 분류:
+#### Case 1: single_topic
+- **정의**: 하나의 주제를 다각도로 묻는 경우
+- **예시**: "Spring Security JWT 인증 구현 방법"
+- **서브질문**: ["개념", "구현", "예제"] (답변 섹션 구조용)
+- **실행**: 기존 그래프 1회 (검색은 원본 질문으로)
+#### Case 2: multiple_questions
+- **정의**: 서로 무관한 독립 질문 (최대 2개)
+- **예시**: "JWT가 뭐야? CORS는?"
+- **서브질문**: ["JWT가 뭐야?", "CORS는?"] (각각 별도 검색)
+- **실행**: Send API로 기존 그래프 2회 병렬 실행
+#### Case 3: too_many
+- **정의**: 질문 3개 이상
+- **예시**: "JWT? CORS? Docker?"
+- **실행**: 친절한 에러 메시지 표시, 대화 계속 가능
+- **하드 가드**: LLM 분류와 무관하게 물음표 개수(3개 이상) 또는 질문 후보 개수(3개 이상)로 결정론적 차단
+### 2. 질문 개수 제한
+비용 및 품질 관리를 위해 **최대 2개 질문**으로 제한:
+```
+입력: "JWT? CORS? Docker? Redis?"
+처리: too_many 케이스 → 에러 메시지
+안내: "하나의 주제로 통합" 또는 "2개만 선택" 권장
+```
+### 3. Send API 동적 복제
+**중요**: LangGraph에서 `List[Send]`는 노드 반환값이 아니라 **conditional edge 함수 반환값**으로만 사용됩니다.
+```python
+# initiate_dynamic_search_node: state 준비만 (dict 반환)
+def initiate_dynamic_search_node(state: AgentState) -> dict:
+    return {"intermediate_steps": [...]}  # Send 반환 안 함!
+# fanout_multi_questions: conditional edge 함수 (List[Send] 반환)
+def fanout_multi_questions(state: AgentState) -> List[Send]:
+    sends = []
+    for i, question in enumerate(["JWT가 뭐야?", "CORS는?"]):
+        child_state = state.model_copy(deep=True)
+        child_state.user_question = question
+        child_state.is_multi_question = True
+        # ... 메타데이터 설정 ...
+        sends.append(Send("run_single_question_worker", child_state))
+    return sends
+# run_single_question_worker: 내부 서브그래프 실행
+# 각 Send는 독립적으로 내부 그래프를 실행:
+# analyze → cache → classify → search(×3) → collect → eval → subgraph → generate
+# → multi_answers에 결과 추가
+```
+### 4. Reducer 자동 Fan-in (Reset 기능 포함)
+```python
+# State 정의 (커스텀 reducer 사용)
+multi_answers: Annotated[List[Dict[str, Any]], merge_multi_answers] = []
+# merge_multi_answers reducer:
+# - 기본 동작: old + new (병렬 worker에서 답변을 동시에 append)
+# - 리셋 동작: new의 첫 원소가 {"__token__": "__RESET_MULTI_ANS__"}이면
+#   old를 버리고 new[1:]로 교체 (이전 턴 누적 방지)
+# run_single_question_worker 1이 리턴:
+{"multi_answers": [{"index": 0, "question": "JWT가 뭐야?", "answer": "..."}]}
+# run_single_question_worker 2가 리턴:
+{"multi_answers": [{"index": 1, "question": "CORS는?", "answer": "..."}]}
+# LangGraph Reducer가 자동 병합:
+state.multi_answers = [
+    {"index": 0, ...},
+    {"index": 1, ...}
+]
+# combine_answers_node가 이를 통합 Markdown으로 변환
+```
+## 그래프 흐름
+```mermaid
+graph TD
+    START[START] --> plan[create_plan]
+    plan -->|single_topic| analyze[analyze_question]
+    plan -->|multiple_questions 2개| dynamic[initiate_dynamic_search]
+    plan -->|too_many 3+| tooMany[handle_too_many_questions]
+    tooMany --> END
+    analyze --> cache[check_cache]
+    cache -->|hit| returnCache[return_cached_answer]
+    cache -->|miss| classify[classify_intent]
+    returnCache --> END
+    classify --> searchSO[search_stackoverflow]
+    classify --> searchGH[search_github]
+    classify --> searchDocs[search_official_docs]
+    searchSO --> collect[collect_results]
+    searchGH --> collect
+    searchDocs --> collect
+    collect --> eval[evaluate_results]
+    eval -->|needs_refinement| refine[refine_search]
+    eval -->|sufficient| filterNode[filter_and_score]
+    refine --> classify
+    filterNode --> summarize[summarize_results]
+    summarize --> generate[generate_answer]
+    generate -->|is_multi_question| combine[combine_answers]
+    generate -->|single_topic| END
+    combine --> END
+    dynamic --> fanout[fanout_multi_questions<br/>conditional edge]
+    fanout -.Send Q1.-> worker1[run_single_question_worker<br/>내부 서브그래프]
+    fanout -.Send Q2.-> worker2[run_single_question_worker<br/>내부 서브그래프]
+    worker1 --> combine
+    worker2 --> combine
+```
+### 흐름 설명
+#### Single Topic (기존 동작 유지)
+```
+START → create_plan (case: single_topic)
+      → analyze → cache → classify → search(×3) → collect → eval → subgraph → generate → END
+```
+#### Multiple Questions (신규)
+```
+START → create_plan (case: multiple_questions)
+      → initiate_dynamic_search (state 준비)
+      → fanout_multi_questions (conditional edge)
+          ├─ Send("run_single_question_worker", Q1) → [내부 서브그래프 전체 파이프라인] → multi_answers[0]
+          └─ Send("run_single_question_worker", Q2) → [내부 서브그래프 전체 파이프라인] → multi_answers[1]
+      → combine_answers (자동 fan-in) → END
+```
+#### Too Many (신규)
+```
+START → create_plan (case: too_many)
+      → handle_too_many_questions → END
+(사용자는 즉시 다시 질문 가능)
+```
+## 구현 상세
+### State 확장
+```python
+# src/agent/state.py
+class AgentState(BaseModel):
+    # ... 기존 필드 ...
+    # Phase 4: Dynamic Parallel Search
+    is_multi_question: bool = False
+    sub_question_index: int = 0
+    sub_question_text: Optional[str] = None
+    original_multi_question: Optional[str] = None
+    multi_answers: Annotated[List[Dict[str, Any]], merge_multi_answers] = []
+```
+### 새로운 노드 (5개)
+#### 1. create_plan_node (수정)
+- **위치**: `src/agent/nodes.py` 라인 206
+- **역할**: 질문 유형 및 개수 판단
+- **변경**:
+  - `case` 필드 추가 (single_topic/multiple_questions/too_many)
+  - **하드 가드 추가**: `_hard_guard_too_many` 함수로 3개 이상 질문 결정론적 차단
+    - 물음표 개수(3개 이상) 또는 질문 후보 개수(3개 이상) 감지
+    - LLM 분류와 무관하게 `too_many`로 강제
+#### 2. handle_too_many_questions_node (신규)
+- **위치**: `src/agent/nodes.py` 라인 1068
+- **역할**: 3개 이상 질문 시 안내 메시지
+- **특징**: 대화 종료하지 않음 (즉시 재질문 가능)
+#### 3. initiate_dynamic_search_node (신규)
+- **위치**: `src/agent/nodes.py` 라인 1092
+- **역할**: 다중 질문 처리 진입점, state 준비
+- **핵심**: dict만 반환 (Send는 반환하지 않음)
+#### 4. fanout_multi_questions (신규 - Edge 함수)
+- **위치**: `src/agent/nodes.py` 라인 1110
+- **역할**: conditional edge 함수로 `List[Send]` 반환
+- **핵심**: 각 서브 질문을 `run_single_question_worker`로 Send
+#### 5. run_single_question_worker_node (신규)
+- **위치**: `src/agent/nodes.py` 라인 1306
+- **역할**: 내부 서브그래프를 실행하여 state 충돌 방지
+- **핵심**:
+  - 독립된 단일 질문 그래프를 내부에서 실행
+  - outer graph의 scalar state 채널 충돌 방지
+  - 결과를 `multi_answers` reducer에만 추가
+#### 6. combine_answers_node (신규)
+- **위치**: `src/agent/nodes.py` 라인 1168
+- **역할**: multi_answers를 통합 Markdown 포맷으로 변환
+- **특징**: 자동 fan-in (모든 Send 완료 대기)
+### 수정된 노드 (1개)
+#### generate_answer_node (5줄 추가)
+- **위치**: `src/agent/nodes.py` 라인 726
+- **추가 내용**:
+```python
+# 기존 로직 마지막에 추가
+if state.is_multi_question:
+    updates["multi_answers"] = [{
+        "index": state.sub_question_index,
+        "question": state.sub_question_text,
+        "answer": final_answer
+    }]
+```
+### 그래프 재구성
+```python
+# src/agent/graph.py
+# 1. START 진입점 변경
+graph.add_edge(START, "create_plan")  # 기존: analyze_question
+# 2. create_plan 후 분기 추가
+graph.add_conditional_edges(
+    "create_plan",
+    route_after_plan,
+    {
+        "analyze_question": "analyze_question",
+        "initiate_dynamic_search": "initiate_dynamic_search",
+        "handle_too_many_questions": "handle_too_many_questions"
+    }
+)
+# 3. initiate_dynamic_search 후 fan-out
+graph.add_conditional_edges(
+    "initiate_dynamic_search",
+    fanout_multi_questions,  # List[Send] 반환
+)
+# 4. run_single_question_worker 후 fan-in
+graph.add_edge("run_single_question_worker", "combine_answers")
+# 5. generate_answer 후 분기 추가
+graph.add_conditional_edges(
+    "generate_answer",
+    route_after_generate,
+    {
+        "combine_answers": "combine_answers",
+        END: END
+    }
+)
+```
+## 사용 예시
+### 예시 1: 단일 주제 (기존 동작)
+```python
+from CodeWeaver.src.agent.graph import create_agent
+from langchain_core.messages import HumanMessage
+agent = create_agent()
+result = await agent.ainvoke({
+    "user_question": "React hooks 완벽 가이드",
+    "messages": [HumanMessage(content="React hooks 완벽 가이드")]
+})
+# 결과
+# plan.case: "single_topic"
+# plan.sub_questions: ["hooks란", "주요 hooks", "실무 패턴"]
+# 흐름: 기존 그래프 1회 실행
+# 출력: 일반 답변 형식
+```
+### 예시 2: 다중 독립 질문 (신규)
+```python
+result = await agent.ainvoke({
+    "user_question": "JWT가 뭐야? CORS 에러는 어떻게 해결해?",
+    "messages": [HumanMessage(content="JWT가 뭐야? CORS 에러는 어떻게 해결해?")]
+})
+# 결과
+# plan.case: "multiple_questions"
+# plan.sub_questions: ["JWT가 뭐야?", "CORS 에러는 어떻게 해결해?"]
+# 흐름: Send API로 그래프 2회 병렬 실행
+# 출력:
+```
+**출력 예시**:
+```markdown
+# 다중 질문 답변
+원본 질문: JWT가 뭐야? CORS 에러는 어떻게 해결해?
+---
+## 1. JWT가 뭐야?
+JWT(JSON Web Token)는 인증 정보를 안전하게 전송하기 위한...
+[상세 답변...]
+---
+## 2. CORS 에러는 어떻게 해결해?
+CORS(Cross-Origin Resource Sharing) 에러는...
+[상세 답변...]
+```
+### 예시 3: 질문 3개 이상
+```python
+result = await agent.ainvoke({
+    "user_question": "JWT? CORS? Docker?",
+    "messages": [HumanMessage(content="JWT? CORS? Docker?")]
+})
+# 결과
+# plan.case: "too_many"
+# 출력:
+```
+**출력 예시**:
+```
+죄송합니다. 한 번에 최대 2개의 질문까지만 처리할 수 있습니다.
+다음 중 하나를 선택해서 다시 질문해 주세요:
+1. **하나의 주제로 통합해서 질문**
+   예: "JWT 인증과 CORS 설정을 함께 구현하는 방법"
+2. **가장 중요한 2개 질문만 선택**
+   예: "JWT가 뭐야? 내 코드에 어떻게 적용해?"
+3. **질문을 나눠서 순차적으로 질문**
+   예: 먼저 "JWT가 뭐야?" 질문 → 답변 확인 → 다음 질문
+어떻게 도와드릴까요?
+```
+## 테스트
+테스트 파일은 프로젝트 루트에 있습니다. (삭제됨 - 필요시 재생성)
+### 테스트 시나리오
+1. ✅ **단일 주제**: "Spring Security JWT 인증 구현 방법"
+   - 기존 그래프 1회 실행
+   - multi_answers 비어있음
+   - 일반 답변 형식
+2. ✅ **다중 질문 2개**: "JWT가 뭐야? CORS는?"
+   - Send API로 그래프 2회 병렬 실행
+   - multi_answers에 2개 항목
+   - 섹션 구분된 통합 답변
+3. ✅ **질문 3개 이상**: "JWT? CORS? Docker?"
+   - handle_too_many_questions로 분기
+   - 친절한 에러 메시지
+   - 대화 계속 가능
+4. ✅ **엣지 케이스**: "JWT? CORS? Docker? Redis?"
+   - **하드 가드로 무조건 too_many 차단** (물음표 4개 감지)
+   - LLM 분류와 무관하게 차단 보장
+## 성능 고려사항
+### 병렬 실행
+- **단일 주제**: 3개 검색 노드 병렬 (기존)
+- **다중 질문 (2개)**: 2×3=6개 검색 노드 병렬
+- LangGraph Send API가 자동 병렬화 관리
+### 비용 관리
+- 질문 개수 제한: 최대 2개
+- 검색 결과 개수: 소스당 3-5개
+- 다중 질문 시 의도 분류 생략 (기본값 "learning" 사용)
+### 캐싱
+- **단일 주제**: 전체 답변 캐시 ✅
+- **다중 질문**: 각 서브 질문 답변 개별 캐시 ✅
+  - Q1 답변 → Q1 질문으로 캐시
+  - Q2 답변 → Q2 질문으로 캐시
+- 다음번 동일 질문 시 개별 캐시 히트 가능
+## 기술적 핵심
+### 1. Send API 패턴 (Conditional Edge 함수 사용)
+```python
+# ❌ 잘못된 방법: 노드에서 Send 반환
+def initiate_dynamic_search_node(state):
+    return [Send(...), Send(...)]  # 에러 발생!
+# ✅ 올바른 방법: conditional edge 함수에서 Send 반환
+def fanout_multi_questions(state: AgentState) -> List[Send]:
+    sends = []
+    for i, question in enumerate(sub_questions):
+        child_state = state.model_copy(deep=True)
+        child_state.user_question = question
+        sends.append(Send("run_single_question_worker", child_state))
+    return sends
+# 그래프 설정
+graph.add_conditional_edges(
+    "initiate_dynamic_search",
+    fanout_multi_questions,  # List[Send] 반환
+)
+# LangGraph가 자동으로:
+# 1. 두 Send를 병렬 실행
+# 2. 각 Send의 모든 노드 실행 대기
+# 3. 다음 공통 노드로 이동 (combine_answers)
+```
+### 2. Reducer 자동 병합 (Reset 기능 포함)
+```python
+# State 정의 (커스텀 reducer)
+multi_answers: Annotated[List[Dict[str, Any]], merge_multi_answers] = []
+# merge_multi_answers reducer:
+def merge_multi_answers(old: List[Dict], new: List[Dict]) -> List[Dict]:
+    if not new:
+        return old
+    # Reset 토큰 체크
+    if new[0].get("__token__") == "__RESET_MULTI_ANS__":
+        return new[1:]  # 이전 턴 누적 방지
+    return old + new  # 기본 병합
+# create_plan_node에서 매 실행 시작 시 리셋:
+updates["multi_answers"] = [{"__token__": "__RESET_MULTI_ANS__"}]
+# 병렬 실행 시:
+# [Q1_answer] + [Q2_answer] = [Q1_answer, Q2_answer]
+```
+### 3. Fan-in 보장
+```python
+# 모든 검색 노드가 collect_results로 연결
+graph.add_edge("search_stackoverflow", "collect_results")
+graph.add_edge("search_github", "collect_results")
+graph.add_edge("search_official_docs", "collect_results")
+# LangGraph가 자동으로:
+# 1. 3개 검색 모두 완료 대기
+# 2. collect_results 1회만 실행
+```
+## 코드 변경 요약
+### 파일별 변경사항
+| 파일 | 추가 | 수정 | 삭제 |
+|------|------|------|------|
+| `state.py` | 5 필드, 1 reducer 함수 | - | - |
+| `nodes.py` | 5 노드 + 1 edge 함수 (~300줄) | 2 노드 (create_plan 하드 가드 추가, generate_answer 5줄) | - |
+| `graph.py` | 3 routing 함수, 엣지 재구성 | build_agent_graph | - |
+**총 변경량**: ~350줄 추가, ~100줄 수정
+### 재사용률
+- **기존 노드 재사용**: 12/16 (75%)
+- **기존 로직 재사용**: ~95% (검색, 평가, 필터링, 요약 등)
+- **새로운 개념**: Send API + Reducer만
+## LangGraph 공식 가이드라인 준수
+### ✅ Graph API
+- StateGraph 사용
+- Pydantic BaseModel state
+- START/END 명시
+### ✅ Workflows + Agents
+- Send API로 동적 병렬화
+- Conditional edges로 라우팅
+- Fan-out/Fan-in 패턴
+### ✅ Thinking in LangGraph
+- 노드는 순수 함수 (한 가지 일만)
+- State는 불변 업데이트
+- Reducer로 병합 자동화
+## 한계 및 향후 개선
+### 현재 한계
+1. **질문 개수 제한**: 최대 2개
+   - 비용 vs 품질 트레이드오프
+   - 향후 3-4개로 확장 가능
+2. **캐싱 전략**: 통합 답변은 캐시 안 됨
+   - 각 서브 질문은 개별 캐시됨
+   - 동일한 다중 질문 재입력 시 개별 캐시 히트
+3. **Refinement 루프**: 다중 질문에서도 각각 독립적으로 작동
+   - 한 질문 refine 시 다른 질문에 영향 없음
+### 향후 개선 방향
+1. **더 많은 질문 지원**: 3-4개까지 확장
+2. **혼합 질문 감지**: "JWT가 뭐야? 그걸 Spring에 적용하려면?" (순차 의존)
+3. **스트리밍 답변**: 각 서브 질문 완료 즉시 스트리밍
+4. **우선순위**: 중요도에 따라 질문 순서 조정
+## 참고 자료
+- [LangGraph Graph API](https://docs.langchain.com/oss/python/langgraph/graph-api)
+- [LangGraph Workflows + Agents](https://docs.langchain.com/oss/python/langgraph/workflows-agents)
+- [LangGraph Thinking Guide](https://docs.langchain.com/oss/python/langgraph/thinking-in-langgraph)
+- CodeWeaver Phase 3: Open Deep Research
+## 문의
+구현 관련 질문이나 버그 리포트는 이슈로 등록해주세요.

README.md ADDED Viewed

	@@ -0,0 +1,40 @@

+---
+title: codeweaver-ai
+emoji: 🤖
+colorFrom: blue
+colorTo: purple
+sdk: gradio
+sdk_version: "4.44.1"
+app_file: app.py
+pinned: false
+license: mit
+---
+# CodeWeaver AI (Gradio Space)
+CodeWeaver를 Hugging Face Spaces에서 실행하기 위한 Gradio 데모입니다.
+## 실행 방식
+- Space 엔트리: `app.py` (repo root)
+- 실제 Gradio UI: `CodeWeaver/ui/app.py`
+## 필수 Secrets (Settings → Variables and secrets)
+- `GOOGLE_API_KEY`
+- `TAVILY_API_KEY`
+- `QDRANT_URL`
+- `QDRANT_API_KEY`
+선택:
+- `GITHUB_TOKEN`
+- `LANGCHAIN_TRACING_V2`, `LANGCHAIN_API_KEY`, `LANGCHAIN_PROJECT`
+## 문서
+- `ARCHITECTURE.md`
+- `DYNAMIC_PARALLEL_SEARCH.md`

app.py ADDED Viewed

	@@ -0,0 +1,41 @@

+"""
+Hugging Face Spaces entrypoint.
+This file is intentionally minimal:
+- It imports the existing Gradio Blocks app from `CodeWeaver/ui/app.py`
+- It launches it with HF-friendly defaults.
+Local dev remains unchanged:
+  - You can still run `python CodeWeaver/ui/app.py` as before.
+"""
+from __future__ import annotations
+import os
+import sys
+from pathlib import Path
+def _bootstrap_import_path() -> None:
+    # Make `CodeWeaver/` importable as a top-level path so we can `import ui.app`.
+    repo_root = Path(__file__).resolve().parent
+    codeweaver_root = repo_root / "CodeWeaver"
+    sys.path.insert(0, str(codeweaver_root))
+def main() -> None:
+    _bootstrap_import_path()
+    # Import AFTER sys.path tweak
+    from ui.app import app as demo  # type: ignore
+    # HF Spaces commonly provides PORT; fall back to 7860 for local.
+    port = int(os.getenv("PORT", "7860"))
+    demo.launch(server_name="0.0.0.0", server_port=port, show_api=False)
+if __name__ == "__main__":
+    main()

requirements.txt ADDED Viewed

	@@ -0,0 +1,7 @@

+# Hugging Face Spaces installs dependencies from the repository root.
+# Reuse the project's existing dependency list.
+-r CodeWeaver/requirements.txt