Spaces:

m97j
/

PersonaChatEngine_hf-serve

Sleeping

App Files Files Community

m97j commited on Sep 1, 2025

Commit

800d562

1 Parent(s): f1f1dc0

edit gradio ui

Browse files

Files changed (1) hide show

app.py +18 -6

app.py CHANGED Viewed

@@ -2,13 +2,13 @@ import gradio as gr
 from inference import run_inference, reload_model  # reload_model은 모델 재로딩 함수
 from utils_prompt import build_webtest_prompt
 def gradio_infer(npc_id, npc_location, player_utt):
     prompt = build_webtest_prompt(npc_id, npc_location, player_utt)
     result = run_inference(prompt)
     return result["npc_output_text"], result["deltas"], result["flags_prob"]
-# API 호출용
 def api_infer(session_id, npc_id, prompt, max_tokens=200):
     result = run_inference(prompt)
     return {
@@ -20,7 +20,7 @@ def api_infer(session_id, npc_id, prompt, max_tokens=200):
         "thresholds": result["flags_thr"]
     }
-# Colab에서 호출할 ping endpoint
 def ping_reload():
     reload_model(branch="latest")  # latest 브랜치에서 재다운로드 & 로드
     return {"status": "reloaded"}
@@ -36,10 +36,22 @@ with gr.Blocks() as demo:
         deltas = gr.JSON(label="Deltas")
         flags = gr.JSON(label="Flags Probabilities")
         btn = gr.Button("Run Inference")
-        btn.click(fn=gradio_infer, inputs=[npc_id, npc_loc, player_utt], outputs=[npc_resp, deltas, flags])
-    demo.add_api_route("/predict_main", api_infer, methods=["POST"], api_name="predict_main")
-    demo.add_api_route("/ping_reload", lambda: ping_reload(), methods=["POST"], api_name="ping_reload")
 if __name__ == "__main__":
     demo.launch(server_name="0.0.0.0", server_port=7860)

 from inference import run_inference, reload_model  # reload_model은 모델 재로딩 함수
 from utils_prompt import build_webtest_prompt
+# UI에서 호출할 함수
 def gradio_infer(npc_id, npc_location, player_utt):
     prompt = build_webtest_prompt(npc_id, npc_location, player_utt)
     result = run_inference(prompt)
     return result["npc_output_text"], result["deltas"], result["flags_prob"]
+# API 호출용 함수
 def api_infer(session_id, npc_id, prompt, max_tokens=200):
     result = run_inference(prompt)
     return {
         "thresholds": result["flags_thr"]
     }
+# 모델 재로딩용 함수
 def ping_reload():
     reload_model(branch="latest")  # latest 브랜치에서 재다운로드 & 로드
     return {"status": "reloaded"}
         deltas = gr.JSON(label="Deltas")
         flags = gr.JSON(label="Flags Probabilities")
         btn = gr.Button("Run Inference")
+        # UI 버튼 클릭 시 API 엔드포인트도 자동 생성
+        btn.click(
+            fn=gradio_infer,
+            inputs=[npc_id, npc_loc, player_utt],
+            outputs=[npc_resp, deltas, flags],
+            api_name="predict_main"  # /api/predict_main 엔드포인트 생성
+        )
+    # 별도의 UI 없이 API만 제공하는 엔드포인트
+    gr.Button("Reload Model").click(
+        fn=ping_reload,
+        inputs=[],
+        outputs=[],
+        api_name="ping_reload"  # /api/ping_reload 엔드포인트 생성
+    )
 if __name__ == "__main__":
     demo.launch(server_name="0.0.0.0", server_port=7860)