Spaces:

youdie006
/

simsimi_ai_agent

Runtime error

App Files Files Community

youdie006 commited on Jun 12, 2025

Commit

add744f

1 Parent(s): b2664e5

fix: debug

Browse files

Files changed (3) hide show

src/api/chat.py +2 -2
src/services/aihub_processor.py +12 -15
src/services/openai_client.py +33 -21

src/api/chat.py CHANGED Viewed

@@ -78,12 +78,12 @@ async def run_pipeline(session_id: str, message: str) -> dict:
                                           "B_rule_based_adaptation": pre_adapted, "C_final_gpt4_prompt": final_prompt,
                                           "D_final_response": final_response}
     else:
-        # [최종 업그레이드] RAG-Fusion 적용: 실패한 RAG 결과를 '영감'으로 제공
         inspirational_docs = [doc.get("system_response", "") for doc in expert_responses]
         final_response, final_prompt = await openai_client.create_direct_response(
             user_message=message,
             conversation_history=conversation_history,
-            inspirational_docs=inspirational_docs  # <-- 추가된 부분
         )
         debug_info["step6_generation"] = {"strategy": strategy, "A_final_gpt4_prompt": final_prompt,
                                           "B_final_response": final_response}

                                           "B_rule_based_adaptation": pre_adapted, "C_final_gpt4_prompt": final_prompt,
                                           "D_final_response": final_response}
     else:
+        # RAG-Fusion 적용: 실패한 RAG 결과를 '영감'으로 제공
         inspirational_docs = [doc.get("system_response", "") for doc in expert_responses]
         final_response, final_prompt = await openai_client.create_direct_response(
             user_message=message,
             conversation_history=conversation_history,
+            inspirational_docs=inspirational_docs
         )
         debug_info["step6_generation"] = {"strategy": strategy, "A_final_gpt4_prompt": final_prompt,
                                           "B_final_response": final_response}

src/services/aihub_processor.py CHANGED Viewed

@@ -3,6 +3,8 @@ AI Hub 공감형 대화 데이터 처리기
 """
 from typing import Dict, List, Optional
 from loguru import logger
 class TeenEmpathyDataProcessor:
     def __init__(self, vector_store):
@@ -10,27 +12,23 @@ class TeenEmpathyDataProcessor:
         logger.info("TeenEmpathyDataProcessor 초기화 완료. Vector Store가 주입되었습니다.")
     async def search_similar_contexts(self, query: str, emotion: Optional[str] = None,
-                                    relationship: Optional[str] = None, top_k: int = 3) -> List[Dict]:
-        """
-        [수정됨] 원본 쿼리와 메타데이터 필터를 사용하여 유사한 대화 맥락을 정확하게 검색합니다.
-        """
         try:
-            # 1. 메타데이터 필터 구성 (ChromaDB의 올바른 $and 문법 사용)
             conditions = []
             if emotion: conditions.append({"emotion": {"$eq": emotion}})
             if relationship: conditions.append({"relationship": {"$eq": relationship}})
             search_filter = None
-            if len(conditions) > 1: search_filter = {"$and": conditions}
-            elif len(conditions) == 1: search_filter = conditions[0]
             logger.info(f"🔍 벡터 검색 시작 - Query: '{query}', Filter: {search_filter}")
-            # 2. 원본 쿼리로 벡터 검색 실행
             results = await self.vector_store.search(
-                query=query,
-                top_k=top_k,
-                filter_metadata=search_filter
             )
             formatted_results = [{
@@ -38,11 +36,9 @@ class TeenEmpathyDataProcessor:
                 "system_response": r.metadata.get("system_response", ""),
                 "emotion": r.metadata.get("emotion", ""),
                 "relationship": r.metadata.get("relationship", ""),
-                "empathy_label": r.metadata.get("empathy_label", ""),
                 "similarity_score": r.score
             } for r in results]
-            formatted_results.sort(key=lambda x: x["similarity_score"], reverse=True)
             logger.info(f"✅ 검색 완료: {len(formatted_results)}개 결과")
             return formatted_results
@@ -50,12 +46,13 @@ class TeenEmpathyDataProcessor:
             logger.error(f"❌ 유사 사례 검색 실패: {e}")
             return []
-# 전역 인스턴스 관리
 _processor_instance = None
 async def get_teen_empathy_processor() -> TeenEmpathyDataProcessor:
     global _processor_instance
     if _processor_instance is None:
-        from ..core.vector_store import get_vector_store
         vector_store = await get_vector_store()
         _processor_instance = TeenEmpathyDataProcessor(vector_store=vector_store)
     return _processor_instance

 """
 from typing import Dict, List, Optional
 from loguru import logger
+from ..core.vector_store import get_vector_store
 class TeenEmpathyDataProcessor:
     def __init__(self, vector_store):
         logger.info("TeenEmpathyDataProcessor 초기화 완료. Vector Store가 주입되었습니다.")
     async def search_similar_contexts(self, query: str, emotion: Optional[str] = None,
+                                      relationship: Optional[str] = None, top_k: int = 5) -> List[Dict]:
+        """원본 쿼리와 메타데이터 필터를 사용하여 유사한 대화 맥락을 정확하게 검색합니다."""
         try:
             conditions = []
             if emotion: conditions.append({"emotion": {"$eq": emotion}})
             if relationship: conditions.append({"relationship": {"$eq": relationship}})
             search_filter = None
+            if len(conditions) > 1:
+                search_filter = {"$and": conditions}
+            elif len(conditions) == 1:
+                search_filter = conditions[0]
             logger.info(f"🔍 벡터 검색 시작 - Query: '{query}', Filter: {search_filter}")
             results = await self.vector_store.search(
+                query=query, top_k=top_k, filter_metadata=search_filter
             )
             formatted_results = [{
                 "system_response": r.metadata.get("system_response", ""),
                 "emotion": r.metadata.get("emotion", ""),
                 "relationship": r.metadata.get("relationship", ""),
                 "similarity_score": r.score
             } for r in results]
             logger.info(f"✅ 검색 완료: {len(formatted_results)}개 결과")
             return formatted_results
             logger.error(f"❌ 유사 사례 검색 실패: {e}")
             return []
 _processor_instance = None
 async def get_teen_empathy_processor() -> TeenEmpathyDataProcessor:
     global _processor_instance
     if _processor_instance is None:
         vector_store = await get_vector_store()
         _processor_instance = TeenEmpathyDataProcessor(vector_store=vector_store)
     return _processor_instance

src/services/openai_client.py CHANGED Viewed

@@ -7,6 +7,7 @@ from openai import AsyncOpenAI
 from loguru import logger
 from ..models.function_models import EmotionType, RelationshipType
 class OpenAIClient:
     def __init__(self):
         self.client = None
@@ -21,7 +22,8 @@ class OpenAIClient:
 - **공감 우선:** 조언보다는 먼저 사용자의 감정을 알아주고 공감하는 말을 해줘. (예: "정말 속상했겠다.", "네 마음 충분히 이해돼.")
 - **영어 절대 금지:** 답변은 반드시 한글로만 생성해야 해.
 """
-        self.conversion_map = { "자기야": "너", "당신": "너", "직장": "학교", "회사": "학교", "업무": "공부", "동료": "친구", "상사": "선생님", "하세요": "해", "어떠세요": "어때", "해보세요": "해봐", "~ㅂ니다": "~야", "~습니다": "~어" }
     async def initialize(self):
         if not self.api_key or "your_" in self.api_key.lower(): raise ValueError("올바른 OpenAI API 키를 설정해주세요")
@@ -30,8 +32,11 @@ class OpenAIClient:
         logger.info("✅ OpenAI 클라이언트 초기화 완료")
     async def _test_connection(self):
-        try: await self.client.chat.completions.create(model=self.default_model, messages=[{"role": "user", "content": "Hello"}], max_tokens=5)
-        except Exception as e: raise e
     async def create_completion(self, messages: List[Dict[str, str]], **kwargs) -> str:
         if not self.client: await self.initialize()
@@ -42,7 +47,9 @@ class OpenAIClient:
         return response.choices[0].message.content
     async def rewrite_query_with_history(self, user_message: str, conversation_history: List[Dict]) -> str:
-        if not conversation_history: return user_message
         history_str = "\n".join([f"[{msg['role']}] {msg['content']}" for msg in conversation_history])
         prompt = f"""당신은 사용자의 대화 전체를 깊이 이해하여, 벡터 검색에 가장 적합한 검색 문장을 생성하는 '쿼리 재작성 전문가'입니다.
 ### 임무
@@ -50,7 +57,8 @@ class OpenAIClient:
 ### 규칙
 1. 반드시 사용자의 입장에서, 사용자가 겪는 문제 상황을 중심으로 서술해야 합니다.
 2. 단순 키워드 나열은 절대 금지됩니다.
-3. 오직 '재작성된 검색 쿼리:' 부분의 내용만 결과로 출력해야 합니다.
 ---
 ### 모범 답안 예시
 [이전 대화 내용]
@@ -68,7 +76,8 @@ class OpenAIClient:
 "{user_message}"
 [재작성된 검색 쿼리]
 """
-        rewritten_query = await self.create_completion(messages=[{"role": "user", "content": prompt}], temperature=0.0, max_tokens=200)
         logger.info(f"대화형 쿼리 재작성: '{user_message}' -> '{rewritten_query.strip()}'")
         return rewritten_query.strip()
@@ -77,8 +86,9 @@ class OpenAIClient:
         relationship_list = [r.value for r in RelationshipType]
         analysis_prompt = f"다음 청소년의 메시지에서 primary_emotion과 relationship_context를 추출해줘. 반드시 아래 목록의 한글 단어 중에서만 선택해서 JSON으로 응답해야 해.\n- primary_emotion: {emotion_list}\n- relationship_context: {relationship_list}\n\n메시지: \"{text}\""
         try:
-            response_content = await self.create_completion(messages=[{"role": "user", "content": analysis_prompt}], temperature=0.0, max_tokens=200)
-            import json
             return json.loads(response_content.strip())
         except Exception:
             return {"primary_emotion": EmotionType.ANXIETY.value, "relationship_context": RelationshipType.FRIEND.value}
@@ -89,30 +99,29 @@ class OpenAIClient:
     async def verify_rag_relevance(self, user_message: str, retrieved_doc: str) -> bool:
         prompt = f"사용자의 현재 메시지와 ���색된 전문가 조언이 의미적으로 관련이 있는지 판단해줘. 반드시 'Yes' 또는 'No'로만 대답해.\n- 사용자 메시지: \"{user_message}\"\n- 검색된 조언: \"{retrieved_doc}\"\n\n관련이 있는가? (Yes/No):"
-        response = await self.create_completion(messages=[{"role": "user", "content": prompt}], temperature=0.0, max_tokens=5)
         logger.info(f"RAG 검증 결과: {response.strip()}")
         return "yes" in response.strip().lower()
-    async def adapt_expert_response(self, expert_response: str, user_situation: str, conversation_history: List[Dict]) -> Tuple[str, str, str, str]:
         pre_adapted_response = self._apply_simple_conversions(expert_response)
-        messages = [{"role": "system", "content": self.teen_empathy_system_prompt}, *conversation_history, {"role": "user", "content": f"내 친구의 현재 상황은 '{user_situation}'이야. 내가 참고할 전문가 조언은 '{pre_adapted_response}'인데, 이 조언을 내 친구에게 말하듯 자연스럽고 따뜻한 반말로 바꿔줘."}]
         final_prompt_for_debug = "\n".join([f"[{msg['role']}] {msg['content']}" for msg in messages])
         final_response = await self.create_completion(messages=messages, temperature=0.5, max_tokens=400)
         return expert_response, pre_adapted_response, final_response, final_prompt_for_debug
-    async def create_direct_response(self, user_message: str, conversation_history: List[Dict], inspirational_docs: Optional[List[str]] = None) -> Tuple[str, str]:
-        """[최종 수정] '영감'을 위한 참고 자료(inspirational_docs)를 인자로 받아 프롬프트에 추가"""
-        messages = [
-            {"role": "system", "content": self.teen_empathy_system_prompt},
-            *conversation_history
-        ]
         inspiration_prompt = ""
         if inspirational_docs:
             inspiration_prompt = "\n\n### 참고 자료 (직접 언급하지 말고, 답변을 만들 때 영감을 얻는 용도로만 사용해)\n"
-            for doc in inspirational_docs:
-                inspiration_prompt += f"- {doc}\n"
         final_user_prompt = f"""'마음이'의 페르소나(친한 친구, 반말)를 완벽하게 지키면서 다음 메시지에 공감하는 답변을 해줘.{inspiration_prompt}
@@ -120,11 +129,14 @@ class OpenAIClient:
 """
         messages.append({"role": "user", "content": final_user_prompt})
-        final_response = await self.create_completion(messages=messages, temperature=0.7, max_tokens=300)
         prompt_for_debug = "\n".join([f"[{msg['role']}] {msg['content']}" for msg in messages])
         return final_response, prompt_for_debug
 _openai_client_instance = None
 async def get_openai_client() -> OpenAIClient:
     global _openai_client_instance
     if _openai_client_instance is None:

 from loguru import logger
 from ..models.function_models import EmotionType, RelationshipType
 class OpenAIClient:
     def __init__(self):
         self.client = None
 - **공감 우선:** 조언보다는 먼저 사용자의 감정을 알아주고 공감하는 말을 해줘. (예: "정말 속상했겠다.", "네 마음 충분히 이해돼.")
 - **영어 절대 금지:** 답변은 반드시 한글로만 생성해야 해.
 """
+        self.conversion_map = {"자기야": "너", "당신": "너", "직장": "학교", "회사": "학교", "업무": "공부", "동료": "친구", "상사": "선생님",
+                               "하세요": "해", "어떠세요": "어때", "해보세요": "해봐", "~ㅂ니다": "~야", "~습니다": "~어"}
     async def initialize(self):
         if not self.api_key or "your_" in self.api_key.lower(): raise ValueError("올바른 OpenAI API 키를 설정해주세요")
         logger.info("✅ OpenAI 클라이언트 초기화 완료")
     async def _test_connection(self):
+        try:
+            await self.client.chat.completions.create(model=self.default_model,
+                                                      messages=[{"role": "user", "content": "Hello"}], max_tokens=5)
+        except Exception as e:
+            raise e
     async def create_completion(self, messages: List[Dict[str, str]], **kwargs) -> str:
         if not self.client: await self.initialize()
         return response.choices[0].message.content
     async def rewrite_query_with_history(self, user_message: str, conversation_history: List[Dict]) -> str:
+        """One-shot 예제가 포함된, 대화 맥락 기반 쿼리 재작성 함수"""
+        if not conversation_history:
+            return user_message
         history_str = "\n".join([f"[{msg['role']}] {msg['content']}" for msg in conversation_history])
         prompt = f"""당신은 사용자의 대화 전체를 깊이 이해하여, 벡터 검색에 가장 적합한 검색 문장을 생성하는 '쿼리 재작성 전문가'입니다.
 ### 임무
 ### 규칙
 1. 반드시 사용자의 입장에서, 사용자가 겪는 문제 상황을 중심으로 서술해야 합니다.
 2. 단순 키워드 나열은 절대 금지됩니다.
+3. 재작성된 문장은 그 자체로 완전한 의미를 가져야 합니다.
+4. 오직 '재작성된 검색 쿼리:' 부분의 내용만 결과로 출력해야 합니다.
 ---
 ### 모범 답안 예시
 [이전 대화 내용]
 "{user_message}"
 [재작성된 검색 쿼리]
 """
+        rewritten_query = await self.create_completion(messages=[{"role": "user", "content": prompt}], temperature=0.0,
+                                                       max_tokens=200)
         logger.info(f"대화형 쿼리 재작성: '{user_message}' -> '{rewritten_query.strip()}'")
         return rewritten_query.strip()
         relationship_list = [r.value for r in RelationshipType]
         analysis_prompt = f"다음 청소년의 메시지에서 primary_emotion과 relationship_context를 추출해줘. 반드시 아래 목록의 한글 단어 중에서만 선택해서 JSON으로 응답해야 해.\n- primary_emotion: {emotion_list}\n- relationship_context: {relationship_list}\n\n메시지: \"{text}\""
         try:
+            response_content = await self.create_completion(messages=[{"role": "user", "content": analysis_prompt}],
+                                                            temperature=0.0, max_tokens=200)
+            import json;
             return json.loads(response_content.strip())
         except Exception:
             return {"primary_emotion": EmotionType.ANXIETY.value, "relationship_context": RelationshipType.FRIEND.value}
     async def verify_rag_relevance(self, user_message: str, retrieved_doc: str) -> bool:
         prompt = f"사용자의 현재 메시지와 ���색된 전문가 조언이 의미적으로 관련이 있는지 판단해줘. 반드시 'Yes' 또는 'No'로만 대답해.\n- 사용자 메시지: \"{user_message}\"\n- 검색된 조언: \"{retrieved_doc}\"\n\n관련이 있는가? (Yes/No):"
+        response = await self.create_completion(messages=[{"role": "user", "content": prompt}], temperature=0.0,
+                                                max_tokens=5)
         logger.info(f"RAG 검증 결과: {response.strip()}")
         return "yes" in response.strip().lower()
+    async def adapt_expert_response(self, expert_response: str, user_situation: str,
+                                    conversation_history: List[Dict]) -> Tuple[str, str, str, str]:
         pre_adapted_response = self._apply_simple_conversions(expert_response)
+        messages = [{"role": "system", "content": self.teen_empathy_system_prompt}, *conversation_history,
+                    {"role": "user",
+                     "content": f"내 친구의 현재 상황은 '{user_situation}'이야. 내가 참고할 전문가 조언은 '{pre_adapted_response}'인데, 이 조언을 내 친구에게 말하듯 자연스럽고 따뜻한 반말로 바꿔줘."}]
         final_prompt_for_debug = "\n".join([f"[{msg['role']}] {msg['content']}" for msg in messages])
         final_response = await self.create_completion(messages=messages, temperature=0.5, max_tokens=400)
         return expert_response, pre_adapted_response, final_response, final_prompt_for_debug
+    async def create_direct_response(self, user_message: str, conversation_history: List[Dict],
+                                     inspirational_docs: Optional[List[str]] = None) -> Tuple[str, str]:
+        messages = [{"role": "system", "content": self.teen_empathy_system_prompt}, *conversation_history]
         inspiration_prompt = ""
         if inspirational_docs:
             inspiration_prompt = "\n\n### 참고 자료 (직접 언급하지 말고, 답변을 만들 때 영감을 얻는 용도로만 사용해)\n"
+            for doc in inspirational_docs: inspiration_prompt += f"- {doc}\n"
         final_user_prompt = f"""'마음이'의 페르소나(친한 친구, 반말)를 완벽하게 지키면서 다음 메시지에 공감하는 답변을 해줘.{inspiration_prompt}
 """
         messages.append({"role": "user", "content": final_user_prompt})
         prompt_for_debug = "\n".join([f"[{msg['role']}] {msg['content']}" for msg in messages])
+        final_response = await self.create_completion(messages=messages, temperature=0.7, max_tokens=300)
         return final_response, prompt_for_debug
 _openai_client_instance = None
 async def get_openai_client() -> OpenAIClient:
     global _openai_client_instance
     if _openai_client_instance is None: