Spaces:

Paul720810
/

Softline-SQL-Assistant

Sleeping

App Files Files Community

Paul720810 commited on Sep 14, 2025

Commit

167da16

verified ·

1 Parent(s): 40f1973

Update app.py

Browse files

Files changed (1) hide show

app.py +55 -53

app.py CHANGED Viewed

@@ -1,4 +1,5 @@
 import gradio as gr
 import os
 import re
 import json
@@ -986,59 +987,60 @@ with gr.Blocks(theme=gr.themes.Soft(), title="Text-to-SQL 智能助手 (HF Space
     btn.click(process_query, inputs=[inp, prompt_override], outputs=[sql_out, status, logs], api_name="/predict")
     inp.submit(process_query, inputs=[inp, prompt_override], outputs=[sql_out, status, logs])
-    # ========== 健康檢查端點 /health ==========
-    @demo.add_server_route("/health", methods=["GET"])  # type: ignore[attr-defined]
-    def health_endpoint():
-        endpoints = []
-        try:
-            cfg = getattr(demo, "config", None)
-            if isinstance(cfg, dict):
-                deps = cfg.get("dependencies") or []
-                for dep in deps:
-                    endpoints.append({
-                        "api_name": dep.get("api_name"),
-                        "fn_index": dep.get("fn_index"),
-                        "inputs_count": len(dep.get("inputs") or []),
-                        "outputs_count": len(dep.get("outputs") or []),
-                    })
-        except Exception:
-            pass
-        if not endpoints:
-            endpoints.append({
-                "api_name": "/predict",
-                "fn_index": None,
-                "inputs_count": 2,
-                "outputs_count": 3,
-            })
-        env_info = {
-            "USE_GPU": USE_GPU,
-            "DEVICE": DEVICE,
-            "N_GPU_LAYERS": N_GPU_LAYERS,
-            "THREADS": THREADS,
-            "CTX": CTX,
-            "MAX_TOKENS": MAX_TOKENS,
-            "FEW_SHOT_EXAMPLES_COUNT": FEW_SHOT_EXAMPLES_COUNT,
-            "ENABLE_INDEX": ENABLE_INDEX,
-            "EMBED_BATCH": EMBED_BATCH,
-            "N_BATCH": N_BATCH,
-            "GGUF_REPO_ID": GGUF_REPO_ID,
-            "GGUF_FILENAME": GGUF_FILENAME,
-        }
-        server_info = {
-            "time": get_current_time(),
-            "gradio_version": getattr(gr, "__version__", "unknown"),
-            "pid": os.getpid(),
-        }
-        return {"status": "ok", "endpoints": endpoints, "env": env_info, "server": server_info}
 if __name__ == "__main__":
-    demo.launch(
-        server_name="0.0.0.0",
-        server_port=7860,
-        share=True,
-        show_error=True
-    )

 import gradio as gr
+from fastapi import FastAPI
 import os
 import re
 import json
     btn.click(process_query, inputs=[inp, prompt_override], outputs=[sql_out, status, logs], api_name="/predict")
     inp.submit(process_query, inputs=[inp, prompt_override], outputs=[sql_out, status, logs])
+# ========== 使用 FastAPI 掛載，提供 /health ==========
+_fastapi_app = FastAPI()
+@_fastapi_app.get("/health")
+def health_endpoint():
+    endpoints = []
+    try:
+        cfg = getattr(demo, "config", None)
+        if isinstance(cfg, dict):
+            deps = cfg.get("dependencies") or []
+            for dep in deps:
+                endpoints.append({
+                    "api_name": dep.get("api_name"),
+                    "fn_index": dep.get("fn_index"),
+                    "inputs_count": len(dep.get("inputs") or []),
+                    "outputs_count": len(dep.get("outputs") or []),
+                })
+    except Exception:
+        pass
+    if not endpoints:
+        endpoints.append({
+            "api_name": "/predict",
+            "fn_index": None,
+            "inputs_count": 2,
+            "outputs_count": 3,
+        })
+    env_info = {
+        "USE_GPU": USE_GPU,
+        "DEVICE": DEVICE,
+        "N_GPU_LAYERS": N_GPU_LAYERS,
+        "THREADS": THREADS,
+        "CTX": CTX,
+        "MAX_TOKENS": MAX_TOKENS,
+        "FEW_SHOT_EXAMPLES_COUNT": FEW_SHOT_EXAMPLES_COUNT,
+        "ENABLE_INDEX": ENABLE_INDEX,
+        "EMBED_BATCH": EMBED_BATCH,
+        "N_BATCH": N_BATCH,
+        "GGUF_REPO_ID": GGUF_REPO_ID,
+        "GGUF_FILENAME": GGUF_FILENAME,
+    }
+    server_info = {
+        "time": get_current_time(),
+        "gradio_version": getattr(gr, "__version__", "unknown"),
+        "pid": os.getpid(),
+    }
+    return {"status": "ok", "endpoints": endpoints, "env": env_info, "server": server_info}
+# 將 Gradio Blocks 掛載到 FastAPI 的根路徑
+app = gr.mount_gradio_app(_fastapi_app, demo, path="/")
 if __name__ == "__main__":
+    import uvicorn
+    uvicorn.run(app, host="0.0.0.0", port=7860)