Spaces:

code-slicer
/

chatbotMOAI

Sleeping

App Files Files Community

code-slicer commited on Sep 10, 2025

Commit

30eb937

verified ·

1 Parent(s): 2381854

Update app.py

Browse files

Files changed (1) hide show

app.py +41 -15

app.py CHANGED Viewed

@@ -194,13 +194,30 @@ def _build_structured_user_prompt(user_text: str) -> str:
     # 불필요한 래핑 없이, 모델이 JSON만 내도록 깔끔히 전달
     return user_text.strip()
-def _call_ollama_chat(
-    messages,
-    model=OLLAMA_MODEL,
-    temperature=0.8, top_p=0.9, top_k=40, repeat_penalty=1.1,
-    system_prompt=None
-):
-    url = f"{OLLAMA_HOST}/api/chat"
     _msgs = []
     if system_prompt:
         _msgs.append({"role": "system", "content": system_prompt})
@@ -209,20 +226,26 @@ def _call_ollama_chat(
     payload = {
         "model": model,
         "messages": _msgs,
-        "options": {
-            "temperature": temperature,
-            "top_p": top_p,
-            "top_k": top_k,
-            "repeat_penalty": repeat_penalty,
-        },
         "stream": False,
     }
     try:
         r = requests.post(url, json=payload, timeout=OLLAMA_TIMEOUT)
         r.raise_for_status()
         return (r.json().get("message") or {}).get("content", "") or ""
-    except requests.RequestException:
-        return ""
 def _llm_structured_extract(user_text: str):
     out = _call_ollama_chat(
@@ -1684,6 +1707,9 @@ def main():
     init_session()
     chat_container = st.container()
     # ✅ 풀스크린일 때만 조기 리턴
     if st.session_state.get("llm_mode") and not st.session_state.get("llm_inline", False):
         render_llm_followup(chat_container, inline=False)

     # 불필요한 래핑 없이, 모델이 JSON만 내도록 깔끔히 전달
     return user_text.strip()
+def _ollama_healthcheck():
+    base = OLLAMA_HOST.rstrip("/")
+    # 1) 서버 살아있는지
+    try:
+        r = requests.get(f"{base}/api/version", timeout=5)
+        r.raise_for_status()
+    except requests.RequestException as e:
+        st.error(f"❌ Ollama 연결 실패: {e}  (host={OLLAMA_HOST})")
+        return False
+    # 2) 모델 설치 여부
+    try:
+        tags = requests.get(f"{base}/api/tags", timeout=5).json()
+        names = [m.get("name") for m in tags.get("models", [])]
+        if OLLAMA_MODEL not in names:
+            st.warning(f"⚠️ 모델 미설치: `{OLLAMA_MODEL}`. 서버에서 `ollama pull {OLLAMA_MODEL}` 실행 필요.")
+    except requests.RequestException as e:
+        st.warning(f"모델 목록 조회 실패: {e}")
+    return True
+def _call_ollama_chat(messages, model=OLLAMA_MODEL, temperature=0.8, top_p=0.9, top_k=40, repeat_penalty=1.1, system_prompt=None):
+    url = f"{OLLAMA_HOST.rstrip('/')}/api/chat"
     _msgs = []
     if system_prompt:
         _msgs.append({"role": "system", "content": system_prompt})
     payload = {
         "model": model,
         "messages": _msgs,
+        "options": {"temperature": temperature, "top_p": top_p, "top_k": top_k, "repeat_penalty": repeat_penalty},
         "stream": False,
     }
     try:
         r = requests.post(url, json=payload, timeout=OLLAMA_TIMEOUT)
         r.raise_for_status()
         return (r.json().get("message") or {}).get("content", "") or ""
+    except requests.Timeout:
+        st.error(f"⏱️ Ollama 타임아웃({OLLAMA_TIMEOUT}s). host={OLLAMA_HOST}, model={model}")
+    except requests.ConnectionError as e:
+        st.error(f"🔌 연결 실패: {e}  (host={OLLAMA_HOST})")
+    except requests.HTTPError as e:
+        try:
+            detail = r.text[:500]
+        except Exception:
+            detail = str(e)
+        st.error(f"HTTP {r.status_code}: {detail}")
+    except requests.RequestException as e:
+        st.error(f"요청 오류: {e}")
+    return ""
 def _llm_structured_extract(user_text: str):
     out = _call_ollama_chat(
     init_session()
     chat_container = st.container()
+    if not _ollama_healthcheck():
+        st.stop()
     # ✅ 풀스크린일 때만 조기 리턴
     if st.session_state.get("llm_mode") and not st.session_state.get("llm_inline", False):
         render_llm_followup(chat_container, inline=False)