Spaces:

dev-yuje
/

gardio_test

Sleeping

App Files Files Community

dev-yuje commited on Apr 18

Commit

0112759

1 Parent(s): 5393c73

Fix model load traceability and Chatbot data format

Browse files

Files changed (2) hide show

app.py +45 -43
requirements.txt +2 -1

app.py CHANGED Viewed

@@ -18,6 +18,7 @@ import numpy as np
 import pandas as pd
 import tensorflow as tf
 import joblib
 # TF 최적화 경고 방지 및 안정성
 os.environ['TF_ENABLE_ONEDNN_OPTS'] = '0'
@@ -35,48 +36,51 @@ def load_all_models():
                     self.model_path = "models/telecom_cb_model.keras"
                     self.preprocessor = None
                     self.model = None
                     self.load_resources()
                 def load_resources(self):
                     try:
                         if os.path.exists(self.preprocessor_path):
                             self.preprocessor = joblib.load(self.preprocessor_path)
                         if os.path.exists(self.model_path):
-                            # compile=False가 중요함
-                            self.model = tf.keras.models.load_model(self.model_path, compile=False)
                     except Exception as e:
-                        print(f"Error loading resources: {e}")
                 def predict(self, features_dict):
                     try:
                         if self.model is None or self.preprocessor is None:
-                            return f"Error: 모델({self.model is not None})/전처리기({self.preprocessor is not None}) 로드 실패"
                         ALL_FEATURES = [
                             'C1Z001386', 'C1M210000', 'C18210000', 'C1L120001', 'C1L120004',
                             'L10210000', 'L90210100', 'L90210200', 'L10210B00', 'L10216000',
                             'L10217000', 'D10110000', 'D10133000', 'PERF1'
                         ]
-                        # 데이터 준비
-                        input_values = []
-                        for col in ALL_FEATURES:
-                            val = features_dict.get(col, 0.0)
-                            input_values.append(float(val))
                         df = pd.DataFrame([input_values], columns=ALL_FEATURES)
-                        # 로그 변환 (노트북 로직)
                         log_cols = ['C1Z001386', 'C1L120004', 'D10110000', 'D10133000', 'L90210200',
                                     'L10216000', 'L10210B00', 'L10217000', 'L90210100', 'L10210000']
                         df[log_cols] = np.log1p(df[log_cols].astype(float).clip(lower=0))
-                        # 전처리 및 예측
                         scaled_data = self.preprocessor.transform(df)
                         prediction = self.model.predict(scaled_data, verbose=0)
                         return float(prediction[0][0])
                     except Exception as e:
-                        import traceback
-                        return f"Error: {str(e)}\n{traceback.format_exc()[:100]}"
             _models["predictor"] = RobustCreditPredictor()
@@ -103,7 +107,7 @@ def load_all_models():
             _models["consultant"] = Consultant()
         except Exception as e:
-            print(f"Load Error: {e}")
 FEATURES_DETAIL = {
     'C1Z001386': ('1년 내 카드 총 이용금액', '만원 단위', '0'),
@@ -127,34 +131,35 @@ def handle_predict(*args):
         load_all_models()
         features_dict = {}
         for i, key in enumerate(ALL_KEYS):
-            val = str(args[i]).strip().replace(",", "")
             if key == 'PERF1':
-                features_dict[key] = 1.0 if (val.lower() == 'true' or val == '1' or args[i] is True) else 0.0
             else:
                 try:
-                    features_dict[key] = float(val or 0)
                 except:
-                    return f"❌ 오류: '{FEATURES_DETAIL[key][0]}' 숫자 아님", "❌"
-        # 합산 로직
         features_dict['L10210000'] = features_dict['L10216000'] + features_dict['L10217000']
         res = _models["predictor"].predict(features_dict)
         if isinstance(res, str) and "Error" in res:
-            # 에러 발생 시 에러 내용 일부를 UI에 표시
-            return f"❌ 분석 실패: {res}", f"⚠️ {res[:20]}..."
         score_val = str(int(round(float(res))))
         return {"features": features_dict, "score": score_val}, score_val
     except Exception as e:
-        return f"❌ 시스템 오류: {str(e)}", "⚠️ 시스템 오류"
 def generate_response(chatbot, user_message, analysis_report):
     if not user_message: yield chatbot, ""; return
-    # 1. 챗봇 기록 업데이트 (Gradio 4/5 호환을 위해 수동 구성)
-    # 튜플 방식 사용
-    chatbot.append([user_message, "⚡ 시스템 분석 중..."])
     yield chatbot, ""
     try:
@@ -162,38 +167,37 @@ def generate_response(chatbot, user_message, analysis_report):
         cons = _models["consultant"]
         cons.lazy_load_search()
-        # 문서 검색
         context = ""
         if cons.retriever:
-            docs = cons.retriever.invoke(user_message)
-            context = "\n\n".join([d.page_content for d in docs])
         from llm.prompt import QA_PROMPT
         score_val = analysis_report.get("score", "미측정") if isinstance(analysis_report, dict) else "미측정"
         query_text = f"■ 고객 점수: {score_val}점\n■ 질문: {user_message}"
-        # LangChain에 전달할 프롬프트 구성
         full_prompt = QA_PROMPT.format(context=context, query=query_text)
-        # "Incompatible format" 방지를 위해 리스트 메시지 대신 문자열로 시도
-        # 혹은 명시적인 Role 지정
         from langchain_core.messages import HumanMessage
         messages = [HumanMessage(content=full_prompt)]
         answer_buffer = ""
         for chunk in cons.llm.stream(messages):
             answer_buffer += chunk.content
-            # 현재 대화의 마지막 응답 업데이트
-            chatbot[-1][1] = answer_buffer
             yield chatbot, ""
     except Exception as e:
-        chatbot[-1][1] = f"⚠️ 오류 발생: {str(e)}"
         yield chatbot, ""
-with gr.Blocks(title="KCB AI") as demo:
     analysis_report = gr.State(None)
-    gr.Markdown("# 🛡️ KCB AI 신용 상담 시스템 (v5.6.0 Stable)")
     with gr.Row():
         with gr.Column(scale=1):
@@ -207,18 +211,16 @@ with gr.Blocks(title="KCB AI") as demo:
             predict_btn = gr.Button("📈 점수 분석하기", variant="primary")
         with gr.Column(scale=2):
-            result_display = gr.Text(label="🎯 AI 예측 신용 점수")
-            chatbot = gr.Chatbot(label="AI 상담사", height=450)
             with gr.Row():
                 msg = gr.Textbox(placeholder="질문을 입력하세요...", show_label=False, scale=8)
                 submit_btn = gr.Button("전송", variant="primary", scale=1)
     predict_btn.click(handle_predict, inputs=input_list, outputs=[analysis_report, result_display])
-    # 텍스트 박스 입력 후 전송 시 로직
-    # input을 msg로, output을 [chatbot, msg]로 설정하여 자동 비우기
-    submit_event = submit_btn.click(generate_response, inputs=[chatbot, msg, analysis_report], outputs=[chatbot, msg])
     msg.submit(generate_response, inputs=[chatbot, msg, analysis_report], outputs=[chatbot, msg])
 if __name__ == "__main__":
     demo.launch(server_name="0.0.0.0", server_port=7860)

 import pandas as pd
 import tensorflow as tf
 import joblib
+import traceback
 # TF 최적화 경고 방지 및 안정성
 os.environ['TF_ENABLE_ONEDNN_OPTS'] = '0'
                     self.model_path = "models/telecom_cb_model.keras"
                     self.preprocessor = None
                     self.model = None
+                    self.load_error = "초기화됨"
                     self.load_resources()
                 def load_resources(self):
                     try:
                         if os.path.exists(self.preprocessor_path):
                             self.preprocessor = joblib.load(self.preprocessor_path)
+                        else:
+                            self.load_error = "전처리기 파일 부재"
                         if os.path.exists(self.model_path):
+                            # compile=False가 중요함. 커스텀 레이어 무시.
+                            try:
+                                self.model = tf.keras.models.load_model(self.model_path, compile=False)
+                                self.load_error = "성공"
+                            except Exception as model_e:
+                                self.load_error = f"Keras 로드 에러: {str(model_e)}\n{traceback.format_exc()}"
+                        else:
+                            self.load_error = "모델 파일 부재"
                     except Exception as e:
+                        self.load_error = f"통합 로드 에러: {str(e)}\n{traceback.format_exc()}"
                 def predict(self, features_dict):
                     try:
                         if self.model is None or self.preprocessor is None:
+                            return f"Error: 로드 상태 확인 요망 (모델:{self.model is not None}). 로드 에러 원본: {self.load_error[:200]}"
                         ALL_FEATURES = [
                             'C1Z001386', 'C1M210000', 'C18210000', 'C1L120001', 'C1L120004',
                             'L10210000', 'L90210100', 'L90210200', 'L10210B00', 'L10216000',
                             'L10217000', 'D10110000', 'D10133000', 'PERF1'
                         ]
+                        input_values = [float(features_dict.get(col, 0.0)) for col in ALL_FEATURES]
                         df = pd.DataFrame([input_values], columns=ALL_FEATURES)
                         log_cols = ['C1Z001386', 'C1L120004', 'D10110000', 'D10133000', 'L90210200',
                                     'L10216000', 'L10210B00', 'L10217000', 'L90210100', 'L10210000']
                         df[log_cols] = np.log1p(df[log_cols].astype(float).clip(lower=0))
                         scaled_data = self.preprocessor.transform(df)
                         prediction = self.model.predict(scaled_data, verbose=0)
                         return float(prediction[0][0])
                     except Exception as e:
+                        return f"Error: 예측 연산 에러: {str(e)}\n{traceback.format_exc()[:100]}"
             _models["predictor"] = RobustCreditPredictor()
             _models["consultant"] = Consultant()
         except Exception as e:
+            print(f"Grand Load Error: {e}")
 FEATURES_DETAIL = {
     'C1Z001386': ('1년 내 카드 총 이용금액', '만원 단위', '0'),
         load_all_models()
         features_dict = {}
         for i, key in enumerate(ALL_KEYS):
+            # 전처리 전의 원본 값 정제
+            val_raw = str(args[i]).strip().replace(",", "")
             if key == 'PERF1':
+                features_dict[key] = 1.0 if (val_raw.lower() == 'true' or val_raw == '1' or args[i] is True) else 0.0
             else:
                 try:
+                    features_dict[key] = float(val_raw or 0)
                 except:
+                    return f"❌ 오류: '{FEATURES_DETAIL[key][0]}' 항목 숫자 입력 요망", "❌"
         features_dict['L10210000'] = features_dict['L10216000'] + features_dict['L10217000']
         res = _models["predictor"].predict(features_dict)
         if isinstance(res, str) and "Error" in res:
+            # 에러 발생 시 UI 상단 점수칸에 에러 내용 노출 (디버깅용)
+            # res[:50]으로는 부족할 수 있으니 최대한 보여줌
+            return f"❌ 분석 실패: {res}", f"⚠️ {res[:40]}..."
         score_val = str(int(round(float(res))))
         return {"features": features_dict, "score": score_val}, score_val
     except Exception as e:
+        return f"❌ 시스템 오류: {str(e)}", "⚠️ 시스템 에러"
 def generate_response(chatbot, user_message, analysis_report):
     if not user_message: yield chatbot, ""; return
+    # Gradio 5 Dictionary 규격 강제 준수
+    chatbot.append({"role": "user", "content": user_message})
+    chatbot.append({"role": "assistant", "content": "⚡ 상담사가 분석 중입니다..."})
     yield chatbot, ""
     try:
         cons = _models["consultant"]
         cons.lazy_load_search()
         context = ""
         if cons.retriever:
+            try:
+                docs = cons.retriever.invoke(user_message)
+                context = "\n\n".join([d.page_content for d in docs])
+            except: pass
         from llm.prompt import QA_PROMPT
         score_val = analysis_report.get("score", "미측정") if isinstance(analysis_report, dict) else "미측정"
         query_text = f"■ 고객 점수: {score_val}점\n■ 질문: {user_message}"
         full_prompt = QA_PROMPT.format(context=context, query=query_text)
+        # LangChain의 리스트 메시지 대신 딕셔너리 포맷으로 직접 시도 (가장 호환성 높음)
+        # 하지만 ChatGoogleGenerativeAI는 [HumanMessage(...)]를 기대함
         from langchain_core.messages import HumanMessage
         messages = [HumanMessage(content=full_prompt)]
         answer_buffer = ""
         for chunk in cons.llm.stream(messages):
             answer_buffer += chunk.content
+            # Gradio 5 Dictionary 포맷으로 마지막 메시지 업데이트
+            chatbot[-1] = {"role": "assistant", "content": answer_buffer}
             yield chatbot, ""
     except Exception as e:
+        chatbot[-1] = {"role": "assistant", "content": f"⚠️ 상담 에러: {str(e)}"}
         yield chatbot, ""
+with gr.Blocks(title="KCB AI Consultant") as demo:
     analysis_report = gr.State(None)
+    gr.Markdown("# 🛡️ KCB AI 신용 상담 시스템 (v5.7.0 Debug-Pro)")
     with gr.Row():
         with gr.Column(scale=1):
             predict_btn = gr.Button("📈 점수 분석하기", variant="primary")
         with gr.Column(scale=2):
+            result_display = gr.Text(label="🎯 AI 예측 신용 점수 (에러 발생 시 이곳에 내용 표시)")
+            # type="messages"가 Gradio 5의 핵심
+            chatbot = gr.Chatbot(label="AI 상담사", height=450, type="messages")
             with gr.Row():
                 msg = gr.Textbox(placeholder="질문을 입력하세요...", show_label=False, scale=8)
                 submit_btn = gr.Button("전송", variant="primary", scale=1)
     predict_btn.click(handle_predict, inputs=input_list, outputs=[analysis_report, result_display])
     msg.submit(generate_response, inputs=[chatbot, msg, analysis_report], outputs=[chatbot, msg])
+    submit_btn.click(generate_response, inputs=[chatbot, msg, analysis_report], outputs=[chatbot, msg])
 if __name__ == "__main__":
     demo.launch(server_name="0.0.0.0", server_port=7860)

requirements.txt CHANGED Viewed

@@ -4,7 +4,7 @@ numpy<2.0.0
 tensorflow-cpu==2.15.1
 keras<3.0.0
 scikit-learn
-langchain
 langchain-huggingface
 langchain-community
 langchain-google-genai
@@ -12,3 +12,4 @@ faiss-cpu
 sentence-transformers
 pypdf
 python-dotenv

 tensorflow-cpu==2.15.1
 keras<3.0.0
 scikit-learn
+langchain>=0.3.0
 langchain-huggingface
 langchain-community
 langchain-google-genai
 sentence-transformers
 pypdf
 python-dotenv
+pydantic>=2.0.0