Spaces:

s880453
/

netzerointerview-ragsystem

Sleeping

App Files Files Community

s880453 commited on Aug 13, 2025

Commit

bee738e

verified ·

1 Parent(s): 88eb44e

Update app.py

Browse files

Files changed (1) hide show

app.py +370 -99

app.py CHANGED Viewed

@@ -12,6 +12,8 @@ from openai import OpenAI
 from docx import Document
 import io
 from typing import List, Dict, Any, Optional, Tuple
 # ==========================================
 # 環境變數設定
@@ -26,6 +28,40 @@ EMBEDDING_MODEL = "intfloat/multilingual-e5-large"
 # 採訪者名單（需要排除）
 INTERVIEWERS = ["徐美苓", "許弘諺", "郭禹彤"]
 # ==========================================
 # 全域變數
 # ==========================================
@@ -68,7 +104,6 @@ def initialize_system():
         print(f"🤖 正在載入模型: {EMBEDDING_MODEL}")
         tokenizer = AutoTokenizer.from_pretrained(EMBEDDING_MODEL)
         model = AutoModel.from_pretrained(EMBEDDING_MODEL)
-        # 設為評估模式
         model.eval()
         print("✅ 嵌入模型載入成功")
@@ -91,7 +126,7 @@ def initialize_system():
         return False, error_msg
 # ==========================================
-# 向量搜尋函數
 # ==========================================
 def average_pool(last_hidden_states, attention_mask):
     """Average pooling for embeddings"""
@@ -99,9 +134,9 @@ def average_pool(last_hidden_states, attention_mask):
     return last_hidden.sum(dim=1) / attention_mask.sum(dim=1)[..., None]
 def generate_query_embedding(query_text):
-    """生成查詢向量"""
     try:
-        # 添加查詢前綴
         query_with_prefix = f"query: {query_text}"
         # Tokenize
@@ -117,6 +152,7 @@ def generate_query_embedding(query_text):
         with torch.no_grad():
             outputs = model(**inputs)
             query_embedding = average_pool(outputs.last_hidden_state, inputs['attention_mask'])
             query_embedding = torch.nn.functional.normalize(query_embedding, p=2, dim=1)
         return query_embedding.cpu().numpy()[0]
@@ -124,106 +160,271 @@ def generate_query_embedding(query_text):
         print(f"生成查詢向量失敗: {str(e)}")
         return None
-def semantic_search(query, selected_speakers, top_k=20):
-    """語義搜尋"""
     if not dataset or not init_success:
         return []
     try:
-        # 生成查詢向量
         query_vector = generate_query_embedding(query)
         if query_vector is None:
             return []
-        # 計算相似度
-        similarities = []
         for i, item in enumerate(dataset):
-            # 檢查發言人過濾
             if selected_speakers and item['speaker'] not in selected_speakers:
                 continue
-            # 計算餘弦相似度
             item_vector = np.array(item['embedding'])
-            similarity = float(np.dot(query_vector, item_vector))
-            similarities.append({
-                'score': similarity,
                 'text': item.get('text', ''),
                 'speaker': item.get('speaker', ''),
                 'turn_index': item.get('turn_index', 0),
-                'file_id': item.get('file_id', '')
             })
-        # 排序並返回前 k 個結果
-        similarities.sort(key=lambda x: x['score'], reverse=True)
-        return similarities[:top_k]
     except Exception as e:
-        print(f"語義搜尋失敗: {str(e)}")
         return []
-# ==========================================
-# GPT-4o-mini 處理函數
-# ==========================================
-def call_gpt4o_mini(prompt, temperature=0.1):
-    """調用 GPT-4o-mini"""
-    if not openai_client:
-        return "OpenAI 客戶端未初始化"
-    try:
-        response = openai_client.chat.completions.create(
-            model="gpt-4o-mini",
-            messages=[
-                {"role": "system", "content": "你是一個專業的訪談分析助手，擅長從訪談內容中提取關鍵信息並回答問題。"},
-                {"role": "user", "content": prompt}
-            ],
-            temperature=temperature
-        )
-        return response.choices[0].message.content
-    except Exception as e:
-        return f"GPT 調用失敗: {str(e)}"
 # ==========================================
-# RAG 對話函數
 # ==========================================
 def rag_chat(question, selected_speakers, history):
-    """RAG 對話處理"""
     if not init_success:
         return history + [[question, "系統尚未初始化，請稍後再試。"]]
     try:
-        # 執行語義搜尋
-        search_results = semantic_search(question, selected_speakers, top_k=10)
         if not search_results:
             return history + [[question, "未找到相關內容，請嘗試其他問題。"]]
-        # 構建上下文
         context = "相關訪談內容：\n\n"
-        for i, result in enumerate(search_results[:5], 1):  # 只取前5個結果
             context += f"[片段 {i}]\n"
-            context += f"發言人：{result['speaker']}\n"
-            context += f"內容：{result['text'][:500]}\n"  # 限制長度
-            context += f"相似度：{result['score']:.3f}\n\n"
-        # 構建 GPT prompt
-        prompt = f"""基於以下訪談內容回答問題。
 {context}
 問題：{question}
-請提供準確、完整的回答，並在適當時引用具體的發言人和內容。"""
-        # 調用 GPT
-        answer = call_gpt4o_mini(prompt)
-        return history + [[question, answer]]
     except Exception as e:
         return history + [[question, f"處理過程中發生錯誤：{str(e)}"]]
 # ==========================================
-# 訪綱填答函數
 # ==========================================
 def parse_word_document(file_path):
     """解析 Word 文檔中的問題"""
@@ -233,10 +434,9 @@ def parse_word_document(file_path):
         for para in doc.paragraphs:
             text = para.text.strip()
-            # 識別問題
             if text and (
                 any(char in text for char in ['?', '？']) or
-                text[0].isdigit() or
                 text.startswith(('Q', '問'))
             ):
                 questions.append(text)
@@ -246,72 +446,108 @@ def parse_word_document(file_path):
         print(f"解析文檔失敗: {str(e)}")
         return []
-def fill_interview_guide(file_path, selected_speakers):
-    """填答訪綱"""
     if not init_success:
         return None, "系統尚未初始化"
     try:
-        # 解析 Word 文檔
         questions = parse_word_document(file_path)
         if not questions:
-            return None, "未能從文檔中提取問題，請確認格式"
         # 創建新的 Word 文檔
         output_doc = Document()
-        output_doc.add_heading('訪談訪綱 - AI 自動填答', 0)
         output_doc.add_paragraph(f'處理時間：{datetime.now().strftime("%Y-%m-%d %H:%M:%S")}')
         output_doc.add_paragraph(f'選擇的受訪者：{", ".join(selected_speakers) if selected_speakers else "全部"}')
         output_doc.add_paragraph('')
-        # 處理每個問題
-        for i, question in enumerate(questions[:10], 1):  # 限制處理10個問題
-            # 添加問題
-            output_doc.add_heading(f'問題 {i}', level=2)
             output_doc.add_paragraph(question)
-            # 搜尋相關內容
-            search_results = semantic_search(question, selected_speakers, top_k=5)
             if search_results:
                 # 構建上下文
                 context = ""
-                for result in search_results[:3]:  # 只用前3個結果
-                    context += f"發言人：{result['speaker']}\n"
-                    context += f"內容：{result['text'][:300]}\n\n"
-                # 使用 GPT 生成回答
-                prompt = f"""基於以下訪談內容回答問題：
 {context}
 問題：{question}
-請提供簡潔的回答。"""
-                answer = call_gpt4o_mini(prompt)
-                # 添加回答
-                output_doc.add_heading('回答：', level=3)
-                output_doc.add_paragraph(answer[:1000])  # 限制回答長度
             else:
                 output_doc.add_paragraph("未找到相關內容")
-            output_doc.add_paragraph('')  # 空行分隔
         # 保存文檔
         output_buffer = io.BytesIO()
         output_doc.save(output_buffer)
         output_buffer.seek(0)
-        # 保存到檔案
         output_filename = f"filled_guide_{datetime.now().strftime('%Y%m%d_%H%M%S')}.docx"
         with open(output_filename, 'wb') as f:
             f.write(output_buffer.getvalue())
-        return output_filename, "訪綱填答完成！"
     except Exception as e:
         return None, f"處理失敗：{str(e)}"
@@ -322,12 +558,29 @@ def fill_interview_guide(file_path, selected_speakers):
 def create_interface():
     """創建 Gradio 介面"""
-    with gr.Blocks(title="訪談轉錄稿 RAG 系統", theme=gr.themes.Soft()) as app:
         # 標題
         gr.Markdown("""
         # 🎙️ 訪談轉錄稿智慧分析系統
-        基於 RAG 技術的訪談內容分析與問答系統
         """)
         # 系統狀態
@@ -343,6 +596,8 @@ def create_interface():
         with gr.Tabs():
             # Tab 1: AI 對話
             with gr.Tab("💬 AI 對話"):
                 with gr.Row():
                     with gr.Column(scale=1):
                         gr.Markdown("### 選擇受訪者")
@@ -355,7 +610,8 @@ def create_interface():
                     with gr.Column(scale=3):
                         chatbot = gr.Chatbot(
                             height=500,
-                            label="對話記錄"
                         )
                         with gr.Row():
@@ -366,16 +622,20 @@ def create_interface():
                             )
                             send_btn = gr.Button("發送", variant="primary", scale=1)
-                        clear_btn = gr.Button("清除對話")
             # Tab 2: 訪綱填答
             with gr.Tab("📝 訪綱填答"):
                 gr.Markdown("""
-                ### 使用說明
-                1. 選擇要分析的受訪者
-                2. 上傳 Word 格式的訪綱文件
-                3. 系統將自動識別問題並填答
-                4. 下載完成的文檔
                 """)
                 with gr.Row():
@@ -383,7 +643,7 @@ def create_interface():
                         guide_speakers = gr.CheckboxGroup(
                             choices=[],
                             label="選擇受訪者",
-                            info="不選擇則分析全部受訪者"
                         )
                         file_input = gr.File(
@@ -404,14 +664,26 @@ def create_interface():
                             visible=False
                         )
-        # 關於
-        with gr.Accordion("ℹ️ 關於系統", open=False):
             gr.Markdown("""
-            ### 系統資訊
-            - **向量模型**: multilingual-e5-large
-            - **語言模型**: GPT-4o-mini
-            - **資料來源**: Hugging Face Dataset
-            - **版本**: 1.0.0
             """)
         # 事件處理
@@ -428,7 +700,7 @@ def create_interface():
             if not file:
                 return "請上傳文件", gr.File(visible=False)
-            result_file, status = fill_interview_guide(file.name, speakers)
             if result_file:
                 return status, gr.File(value=result_file, visible=True)
@@ -438,7 +710,6 @@ def create_interface():
         def update_status():
             success, message = initialize_system()
             if success:
-                # 更新發言人列表
                 return (
                     message,
                     gr.CheckboxGroup(choices=all_speakers),

 from docx import Document
 import io
 from typing import List, Dict, Any, Optional, Tuple
+from dataclasses import dataclass, field
+from enum import Enum
 # ==========================================
 # 環境變數設定
 # 採訪者名單（需要排除）
 INTERVIEWERS = ["徐美苓", "許弘諺", "郭禹彤"]
+# ==========================================
+# 結構化數據模型（Pydantic 風格）
+# ==========================================
+@dataclass
+class SearchResult:
+    """搜尋結果結構"""
+    text: str
+    speaker: str
+    turn_index: int
+    file_id: str
+    vector_score: float = 0.0
+    llm_score: float = 0.0
+    weighted_score: float = 0.0
+    relevance_reasoning: str = ""
+@dataclass
+class RerankingResult:
+    """重排序結果"""
+    reasoning: str
+    speaker_relevance: str
+    content_relevance: str
+    context_relevance: str
+    relevance_score: float
+@dataclass
+class QuestionAnswerPair:
+    """問答對結構"""
+    question: str
+    answers: List[str]
+    raw_contexts: List[str]  # 原始 RAG 內容
+    relevant_turn_indexes: List[int]
+    confidence_scores: List[float]
+    search_results: List[SearchResult]
 # ==========================================
 # 全域變數
 # ==========================================
         print(f"🤖 正在載入模型: {EMBEDDING_MODEL}")
         tokenizer = AutoTokenizer.from_pretrained(EMBEDDING_MODEL)
         model = AutoModel.from_pretrained(EMBEDDING_MODEL)
         model.eval()
         print("✅ 嵌入模型載入成功")
         return False, error_msg
 # ==========================================
+# 向量搜尋函數（結合 speaker + content）
 # ==========================================
 def average_pool(last_hidden_states, attention_mask):
     """Average pooling for embeddings"""
     return last_hidden.sum(dim=1) / attention_mask.sum(dim=1)[..., None]
 def generate_query_embedding(query_text):
+    """生成查詢向量 - 使用正確的前綴格式"""
     try:
+        # 添加查詢前綴（按照 multilingual-e5-large 的要求）
         query_with_prefix = f"query: {query_text}"
         # Tokenize
         with torch.no_grad():
             outputs = model(**inputs)
             query_embedding = average_pool(outputs.last_hidden_state, inputs['attention_mask'])
+            # L2 正規化
             query_embedding = torch.nn.functional.normalize(query_embedding, p=2, dim=1)
         return query_embedding.cpu().numpy()[0]
         print(f"生成查詢向量失敗: {str(e)}")
         return None
+# ==========================================
+# 冠軍級智慧路由與重排序系統
+# ==========================================
+def build_reranking_prompt(query: str, search_results: List[Dict]) -> str:
+    """構建重排序的結構化 Prompt"""
+    instruction = """你是一個訪談內容檢索排序系統。
+你將收到一個查詢和幾個檢索到的訪談片段。你的任務是根據片段與查詢的相關性來評估和評分每個片段。
+評分指南：
+1. 推理：分析片段中的關鍵信息及其與查詢的關係。
+2. 相關性評分（0到1）：
+   - 0 = 完全無關
+   - 0.3 = 輕微相關
+   - 0.5 = 中等相關
+   - 0.7 = 相關
+   - 0.9 = 高度相關
+   - 1 = 完全相關
+特別注意：
+- 必須排除採訪者（徐美苓、許弘諺、郭禹彤）的一般回覆
+- 檢查上下文相關性（turn_index前後範圍）
+- 評估多重主題匹配的可能性
+請為每個搜尋結果提供JSON格式的評分：
+{
+    "results": [
+        {
+            "index": 0,
+            "reasoning": "分析原因",
+            "speaker_relevance": "發言人相關性",
+            "content_relevance": "內容相關性",
+            "context_relevance": "上下文相關性",
+            "relevance_score": 0.8
+        }
+    ]
+}"""
+    # 構建搜尋結果文本
+    results_text = f"查詢：{query}\n\n檢索結果：\n"
+    for i, result in enumerate(search_results):
+        results_text += f"\n結果 {i}:\n"
+        results_text += f"發言人：{result['speaker']}\n"
+        results_text += f"內容：{result['text'][:500]}\n"
+        results_text += f"Turn Index：{result['turn_index']}\n"
+    return f"{instruction}\n\n{results_text}"
+def intelligent_routing_and_reranking(query: str, selected_speakers: List[str], top_k: int = 30) -> List[SearchResult]:
+    """智慧路由與重排序 - 冠軍策���實現"""
     if not dataset or not init_success:
         return []
     try:
+        # Step 1: 向量檢索 (Top-30 候選)
         query_vector = generate_query_embedding(query)
         if query_vector is None:
             return []
+        # Step 2: 計算相似度並過濾
+        initial_results = []
         for i, item in enumerate(dataset):
+            # 智慧路由：排除採訪者
+            if item['speaker'] in INTERVIEWERS:
+                continue
+            # 受訪者過濾
             if selected_speakers and item['speaker'] not in selected_speakers:
                 continue
+            # 計算向量相似度
             item_vector = np.array(item['embedding'])
+            vector_score = float(np.dot(query_vector, item_vector))
+            initial_results.append({
+                'index': i,
                 'text': item.get('text', ''),
                 'speaker': item.get('speaker', ''),
                 'turn_index': item.get('turn_index', 0),
+                'file_id': item.get('file_id', ''),
+                'vector_score': vector_score
             })
+        # 排序並取 Top-K
+        initial_results.sort(key=lambda x: x['vector_score'], reverse=True)
+        candidates = initial_results[:top_k]
+        if not candidates:
+            return []
+        # Step 3: LLM 重排序
+        rerank_prompt = build_reranking_prompt(query, candidates[:10])  # 只重排序前10個
+        try:
+            response = openai_client.chat.completions.create(
+                model="gpt-4o-mini",
+                messages=[
+                    {"role": "system", "content": "你是一個精準的訪談內容排序系統。"},
+                    {"role": "user", "content": rerank_prompt}
+                ],
+                temperature=0.1,
+                response_format={"type": "json_object"}
+            )
+            rerank_results = json.loads(response.choices[0].message.content)
+            # Step 4: 加權計分 (0.3 * vector + 0.7 * llm)
+            final_results = []
+            for i, candidate in enumerate(candidates[:10]):
+                llm_score = 0.5  # 預設分數
+                # 從 LLM 結果中找到對應的分數
+                if 'results' in rerank_results:
+                    for r in rerank_results['results']:
+                        if r.get('index') == i:
+                            llm_score = r.get('relevance_score', 0.5)
+                            break
+                # 計算加權分數
+                weighted_score = 0.3 * candidate['vector_score'] + 0.7 * llm_score
+                final_results.append(SearchResult(
+                    text=candidate['text'],
+                    speaker=candidate['speaker'],
+                    turn_index=candidate['turn_index'],
+                    file_id=candidate['file_id'],
+                    vector_score=candidate['vector_score'],
+                    llm_score=llm_score,
+                    weighted_score=weighted_score
+                ))
+            # 加入剩餘的候選（未經 LLM 重排序的）
+            for candidate in candidates[10:]:
+                final_results.append(SearchResult(
+                    text=candidate['text'],
+                    speaker=candidate['speaker'],
+                    turn_index=candidate['turn_index'],
+                    file_id=candidate['file_id'],
+                    vector_score=candidate['vector_score'],
+                    llm_score=0.0,
+                    weighted_score=candidate['vector_score'] * 0.3
+                ))
+            # 按加權分數排序
+            final_results.sort(key=lambda x: x.weighted_score, reverse=True)
+            # Step 5: 上下文擴展（turn_index ±10）
+            expanded_results = expand_context_by_turn_index(final_results[:5])
+            return expanded_results
+        except Exception as e:
+            print(f"LLM 重排序失敗，使用向量分數: {str(e)}")
+            # 降級處理：只使用向量分數
+            return [SearchResult(
+                text=c['text'],
+                speaker=c['speaker'],
+                turn_index=c['turn_index'],
+                file_id=c['file_id'],
+                vector_score=c['vector_score'],
+                llm_score=0.0,
+                weighted_score=c['vector_score']
+            ) for c in candidates[:top_k]]
     except Exception as e:
+        print(f"智慧路由失敗: {str(e)}")
         return []
+def expand_context_by_turn_index(search_results: List[SearchResult], context_window: int = 10) -> List[SearchResult]:
+    """根據 turn_index 擴展上下文"""
+    expanded_results = []
+    added_indexes = set()
+    for result in search_results:
+        # 添加原始結果
+        if result.turn_index not in added_indexes:
+            expanded_results.append(result)
+            added_indexes.add(result.turn_index)
+        # 查找前後文
+        target_turn = result.turn_index
+        for item in dataset:
+            item_turn = item.get('turn_index', 0)
+            # 檢查是否在範圍內
+            if abs(item_turn - target_turn) <= context_window and item_turn not in added_indexes:
+                # 檢查是否為同一發言人或相關發言人
+                if item['speaker'] not in INTERVIEWERS:
+                    context_result = SearchResult(
+                        text=item.get('text', ''),
+                        speaker=item.get('speaker', ''),
+                        turn_index=item_turn,
+                        file_id=item.get('file_id', ''),
+                        vector_score=0.0,
+                        llm_score=0.0,
+                        weighted_score=result.weighted_score * 0.5  # 上下文權重降低
+                    )
+                    expanded_results.append(context_result)
+                    added_indexes.add(item_turn)
+    return expanded_results
 # ==========================================
+# RAG 對話函數（每次獨立調用 API）
 # ==========================================
 def rag_chat(question, selected_speakers, history):
+    """RAG 對話處理 - 每次獨立調用避免幻覺"""
     if not init_success:
         return history + [[question, "系統尚未初始化，請稍後再試。"]]
     try:
+        # 執行智慧路由與重排序
+        search_results = intelligent_routing_and_reranking(question, selected_speakers, top_k=20)
         if not search_results:
             return history + [[question, "未找到相關內容，請嘗試其他問題。"]]
+        # 構建上下文（包含原始 RAG 內容）
         context = "相關訪談內容：\n\n"
+        raw_contexts = []
+        for i, result in enumerate(search_results[:5], 1):
             context += f"[片段 {i}]\n"
+            context += f"發言人：{result.speaker}\n"
+            context += f"內容：{result.text}\n"
+            context += f"相關性分數：向量={result.vector_score:.3f}, LLM={result.llm_score:.3f}, 加權={result.weighted_score:.3f}\n\n"
+            # 保存原始內容
+            raw_contexts.append(f"[{result.speaker} - Turn {result.turn_index}]: {result.text}")
+        # 構建 GPT prompt（每次獨立，不包含歷史）
+        prompt = f"""基於以下訪談內容回答問題。請提供準確、完整的回答。
 {context}
 問題：{question}
+要求：
+1. 基於提供的訪談內容回答
+2. 引用具體的發言人和內容
+3. 如果內容不足以回答，請明確說明"""
+        # 調用 GPT（每次獨立調用）
+        response = openai_client.chat.completions.create(
+            model="gpt-4o-mini",
+            messages=[
+                {"role": "system", "content": "你是一個專業的訪談分析助手。只基於提供的內容回答，不要添加額外信息。"},
+                {"role": "user", "content": prompt}
+            ],
+            temperature=0.1
+        )
+        answer = response.choices[0].message.content
+        # 添加原始 RAG 內容
+        answer_with_sources = f"{answer}\n\n---\n📚 **原始 RAG 來源：**\n"
+        for i, raw_context in enumerate(raw_contexts[:3], 1):
+            answer_with_sources += f"\n{i}. {raw_context[:200]}...\n"
+        return history + [[question, answer_with_sources]]
     except Exception as e:
         return history + [[question, f"處理過程中發生錯誤：{str(e)}"]]
 # ==========================================
+# 訪綱填答函數（包含原始 RAG 內容）
 # ==========================================
 def parse_word_document(file_path):
     """解析 Word 文檔中的問題"""
         for para in doc.paragraphs:
             text = para.text.strip()
             if text and (
                 any(char in text for char in ['?', '？']) or
+                (text[0].isdigit() if text else False) or
                 text.startswith(('Q', '問'))
             ):
                 questions.append(text)
         print(f"解析文檔失敗: {str(e)}")
         return []
+def single_interviewee_guide_filling(file_path, selected_speakers):
+    """單一受訪者訪綱填答 - 整合冠軍策略"""
     if not init_success:
         return None, "系統尚未初始化"
     try:
+        # 解析 Word 訪綱
         questions = parse_word_document(file_path)
         if not questions:
+            return None, "未能從文檔中提取問題"
         # 創建新的 Word 文檔
         output_doc = Document()
+        output_doc.add_heading('訪談訪綱 - AI 智慧填答', 0)
         output_doc.add_paragraph(f'處理時間：{datetime.now().strftime("%Y-%m-%d %H:%M:%S")}')
         output_doc.add_paragraph(f'選擇的受訪者：{", ".join(selected_speakers) if selected_speakers else "全部"}')
+        output_doc.add_paragraph(f'使用技術：Multilingual-E5-Large + GPT-4o-mini + 冠軍級 RAG')
         output_doc.add_paragraph('')
+        # 處理每個問題（每個問題獨立調用 API）
+        for i, question in enumerate(questions[:10], 1):
+            output_doc.add_heading(f'問題 {i}', level=1)
             output_doc.add_paragraph(question)
+            # 使用智慧路由與重排序檢索
+            search_results = intelligent_routing_and_reranking(question, selected_speakers, top_k=15)
             if search_results:
                 # 構建上下文
                 context = ""
+                raw_contexts = []
+                for j, result in enumerate(search_results[:5]):
+                    context += f"[片段 {j+1}]\n"
+                    context += f"發言人：{result.speaker}\n"
+                    context += f"內容：{result.text}\n"
+                    context += f"相關性：向量={result.vector_score:.3f}, LLM={result.llm_score:.3f}\n\n"
+                    raw_contexts.append({
+                        'speaker': result.speaker,
+                        'text': result.text,
+                        'turn_index': result.turn_index,
+                        'score': result.weighted_score
+                    })
+                # 獨立調用 GPT 生成回答
+                prompt = f"""基於以下訪談內容回答訪綱問題：
 {context}
 問題：{question}
+請提供：
+1. 主要回答
+2. 不同受訪者的觀點（如果有）
+3. 具體引述"""
+                response = openai_client.chat.completions.create(
+                    model="gpt-4o-mini",
+                    messages=[
+                        {"role": "system", "content": "你是訪談分析專家。基於提供的內容準確回答。"},
+                        {"role": "user", "content": prompt}
+                    ],
+                    temperature=0.1
+                )
+                answer = response.choices[0].message.content
+                # 添加 AI 回答
+                output_doc.add_heading('AI 分析回答：', level=2)
+                for line in answer.split('\n'):
+                    if line.strip():
+                        output_doc.add_paragraph(line)
+                # 添加原始 RAG 內容
+                output_doc.add_heading('原始 RAG 向量檢索內容：', level=2)
+                for j, raw in enumerate(raw_contexts[:3], 1):
+                    p = output_doc.add_paragraph()
+                    p.add_run(f"{j}. [{raw['speaker']} - Turn {raw['turn_index']}] ").bold = True
+                    p.add_run(f"(相關性: {raw['score']:.3f})\n")
+                    p.add_run(f"{raw['text'][:300]}...")
             else:
                 output_doc.add_paragraph("未找到相關內容")
+            output_doc.add_page_break()  # 分頁
+        # 添加未使用內容分析（如果是單一受訪者）
+        if len(selected_speakers) == 1:
+            output_doc.add_heading('補充：可能相關但未被問及的內容', level=1)
+            # 這裡可以加入額外的分析邏輯
         # 保存文檔
         output_buffer = io.BytesIO()
         output_doc.save(output_buffer)
         output_buffer.seek(0)
         output_filename = f"filled_guide_{datetime.now().strftime('%Y%m%d_%H%M%S')}.docx"
         with open(output_filename, 'wb') as f:
             f.write(output_buffer.getvalue())
+        return output_filename, "訪綱填答完成！使用冠軍級 RAG 策略"
     except Exception as e:
         return None, f"處理失敗：{str(e)}"
 def create_interface():
     """創建 Gradio 介面"""
+    with gr.Blocks(
+        title="訪談轉錄稿 RAG 系統",
+        theme=gr.themes.Soft(),
+        css="""
+        .gradio-container {
+            font-family: 'Microsoft JhengHei', sans-serif;
+        }
+        .markdown-text {
+            font-size: 16px;
+        }
+        """
+    ) as app:
         # 標題
         gr.Markdown("""
         # 🎙️ 訪談轉錄稿智慧分析系統
+        **技術架構：** Multilingual-E5-Large + GPT-4o-mini + 冠軍級 RAG 策略
+        **核心功能：**
+        - 🔍 智慧語義搜尋與重排序
+        - 💬 AI 對話（每次獨立調用避免幻覺）
+        - 📝 訪綱自動填答（含原始 RAG 內容）
+        - 📊 加權評分機制（0.3×向量 + 0.7×LLM）
         """)
         # 系統狀態
         with gr.Tabs():
             # Tab 1: AI 對話
             with gr.Tab("💬 AI 對話"):
+                gr.Markdown("### 智慧問答系統（每次獨立調用 API）")
                 with gr.Row():
                     with gr.Column(scale=1):
                         gr.Markdown("### 選擇受訪者")
                     with gr.Column(scale=3):
                         chatbot = gr.Chatbot(
                             height=500,
+                            label="對話記錄",
+                            show_label=True
                         )
                         with gr.Row():
                             )
                             send_btn = gr.Button("發送", variant="primary", scale=1)
+                        with gr.Row():
+                            clear_btn = gr.Button("清除對話")
+                            gr.Markdown("*每個問題都會獨立調用 API，避免產生幻覺*")
             # Tab 2: 訪綱填答
             with gr.Tab("📝 訪綱填答"):
                 gr.Markdown("""
+                ### 智慧訪綱填答系統
+                **特色功能：**
+                - 使用冠軍級 RAG 策略
+                - 每個問題獨立處理
+                - 顯示原始 RAG 檢索內容
+                - 加權評分機制
                 """)
                 with gr.Row():
                         guide_speakers = gr.CheckboxGroup(
                             choices=[],
                             label="選擇受訪者",
+                            info="建議選擇單一受訪者以獲得最佳效果"
                         )
                         file_input = gr.File(
                             visible=False
                         )
+        # 技術細節
+        with gr.Accordion("🔧 技術細節", open=False):
             gr.Markdown("""
+            ### 冠軍級 RAG 技術實現
+            **1. 向量化處理**
+            - 模型：Multilingual-E5-Large
+            - 格式：結合 speaker + content
+            - 前綴：query: / passage:
+            **2. 智慧路由與重排序**
+            - 初步檢索：Top-30 向量相似度
+            - LLM 重排序：GPT-4o-mini 評分
+            - 加權計算：0.3×向量 + 0.7×LLM
+            - 上下文擴展：±10 turn_index
+            **3. 防止幻覺機制**
+            - 每次問題獨立調用 API
+            - 不傳遞歷史對話上下文
+            - 顯示原始 RAG 來源
             """)
         # 事件處理
             if not file:
                 return "請上傳文件", gr.File(visible=False)
+            result_file, status = single_interviewee_guide_filling(file.name, speakers)
             if result_file:
                 return status, gr.File(value=result_file, visible=True)
         def update_status():
             success, message = initialize_system()
             if success:
                 return (
                     message,
                     gr.CheckboxGroup(choices=all_speakers),