Spaces:

WatNeru
/

LLMView_multi_model

Sleeping

App Files Files Community

WatNeru commited on Nov 23, 2025

Commit

e1a7842

1 Parent(s): 0dac8e2

gradio ui disable

Browse files

Files changed (1) hide show

app.py +133 -95

app.py CHANGED Viewed

@@ -9,11 +9,15 @@ import threading
 from pathlib import Path
 from typing import List, Dict, Any, Optional
-import gradio as gr
 from fastapi import FastAPI, HTTPException
-from fastapi.responses import JSONResponse
 from pydantic import BaseModel, Field
 # ZeroGPU対応: spacesパッケージをインポート（デコレータ用）
 try:
     import spaces
@@ -159,84 +163,94 @@ def get_status() -> str:
     return f"{model_info}ステータス: {current_status}"
-# Gradioインターフェース
-with gr.Blocks(title="LLMView Multi-Model", theme=gr.themes.Soft()) as demo:
-    gr.Markdown("""
-    # LLMView Multi-Model
-    複数のAIモデルに対応した単語ツリー構築ツール
-    ## 使い方
-    1. プロンプトを入力
-    2. オプションでルートテキストを指定（既存のテキストの続きを生成する場合）
-    3. パラメータを調整（top_k: 候補数、max_depth: 最大深さ）
-    4. 「単語ツリーを構築」ボタンをクリック
-    """)
-    with gr.Row():
-        with gr.Column(scale=2):
-            prompt_input = gr.Textbox(
-                label="プロンプト",
-                placeholder="例: 電球を作ったのは誰？",
-                lines=3
-            )
-            root_input = gr.Textbox(
-                label="ルートテキスト（オプション）",
-                placeholder="例: 電球を作ったのは",
-                lines=2
-            )
-            with gr.Row():
-                top_k_slider = gr.Slider(
-                    minimum=1,
-                    maximum=20,
-                    value=5,
-                    step=1,
-                    label="候補数 (top_k)"
                 )
-                max_depth_slider = gr.Slider(
-                    minimum=1,
-                    maximum=50,
-                    value=10,
-                    step=1,
-                    label="最大深さ (max_depth)"
                 )
-            build_btn = gr.Button("単語ツリーを構築", variant="primary")
-        with gr.Column(scale=1):
-            status_output = gr.Textbox(
-                label="ステータス",
-                value=get_status(),
-                lines=5,
-                interactive=False
-            )
-            refresh_status_btn = gr.Button("ステータス更新")
-    results_output = gr.Dataframe(
-        label="結果",
-        headers=["テキスト", "確率"],
-        datatype=["str", "number"],
-        interactive=False
-    )
-    # イベントハンドラ
-    def build_and_display(prompt, root, top_k, max_depth):
-        results = build_word_tree(prompt, root, int(top_k), int(max_depth))
-        # DataFrame用に変換
-        df_data = [[r["text"], f"{r['probability']:.4f}"] for r in results]
-        return df_data, get_status()
-    build_btn.click(
-        fn=build_and_display,
-        inputs=[prompt_input, root_input, top_k_slider, max_depth_slider],
-        outputs=[results_output, status_output]
-    )
-    refresh_status_btn.click(
-        fn=lambda: get_status(),
-        outputs=status_output
-    )
 # ZeroGPU対応: 起動時に検出されるように、デコレータ付き関数を定義
@@ -246,9 +260,28 @@ def _gpu_init_function():
     pass
-# GradioアプリのFastAPIインスタンスに直接ルートを追加
-# Gradioアプリは内部でFastAPIインスタンスを持っているので、それに直接ルートを追加
-@demo.app.get("/health")
 def health() -> Dict[str, Any]:
     """状態確認（元のLLMViewと同じ形式）"""
     with status_lock:
@@ -263,8 +296,8 @@ def health() -> Dict[str, Any]:
 @spaces.GPU  # ZeroGPU対応: デコレータを先に適用（Space起動時に検出される）
-@demo.app.post("/build_word_tree", response_model=List[WordTreeResponse])
-def build_word_tree(payload: WordTreeRequest) -> List[WordTreeResponse]:
     """単語ツリーを構築（元のLLMViewと同じAPI）"""
     if not payload.prompt_text.strip():
         raise HTTPException(status_code=400, detail="prompt_text を入力してください。")
@@ -303,18 +336,23 @@ def build_word_tree(payload: WordTreeRequest) -> List[WordTreeResponse]:
 if __name__ == "__main__":
-    # Hugging Face Spaces用の設定
-    # GPU要求を確実に検出させる
-    if SPACES_AVAILABLE:
-        try:
-            _gpu_init_function()
-            print("[SPACE] GPU要求を送信しました")
-        except Exception as e:
-            print(f"[SPACE] GPU要求エラー: {e}")
-    demo.launch(
-        server_name="0.0.0.0",
-        server_port=7860,
-        share=False
-    )

 from pathlib import Path
 from typing import List, Dict, Any, Optional
 from fastapi import FastAPI, HTTPException
 from pydantic import BaseModel, Field
+# Gradio UIを有効化するかどうか（環境変数で制御）
+ENABLE_GRADIO_UI = os.getenv("ENABLE_GRADIO_UI", "false").lower() == "true"
+if ENABLE_GRADIO_UI:
+    import gradio as gr
 # ZeroGPU対応: spacesパッケージをインポート（デコレータ用）
 try:
     import spaces
     return f"{model_info}ステータス: {current_status}"
+# Gradioインターフェース（オプション）
+demo = None
+if ENABLE_GRADIO_UI:
+    with gr.Blocks(title="LLMView Multi-Model", theme=gr.themes.Soft()) as demo:
+        gr.Markdown("""
+        # LLMView Multi-Model
+        複数のAIモデルに対応した単語ツリー構築ツール
+        ## 使い方
+        1. プロンプトを入力
+        2. オプションでルートテキストを指定（既存のテキストの続きを生成する場合）
+        3. パラメータを調整（top_k: 候補数、max_depth: 最大深さ）
+        4. 「単語ツリーを構築」ボタンをクリック
+        """)
+        with gr.Row():
+            with gr.Column(scale=2):
+                prompt_input = gr.Textbox(
+                    label="プロンプト",
+                    placeholder="例: 電球を作ったのは誰？",
+                    lines=3
                 )
+                root_input = gr.Textbox(
+                    label="ルートテキスト（オプション）",
+                    placeholder="例: 電球を作ったのは",
+                    lines=2
                 )
+                with gr.Row():
+                    top_k_slider = gr.Slider(
+                        minimum=1,
+                        maximum=20,
+                        value=5,
+                        step=1,
+                        label="候補数 (top_k)"
+                    )
+                    max_depth_slider = gr.Slider(
+                        minimum=1,
+                        maximum=50,
+                        value=10,
+                        step=1,
+                        label="最大深さ (max_depth)"
+                    )
+                build_btn = gr.Button("単語ツリーを構築", variant="primary")
+            with gr.Column(scale=1):
+                status_output = gr.Textbox(
+                    label="ステータス",
+                    value=get_status(),
+                    lines=5,
+                    interactive=False
+                )
+                refresh_status_btn = gr.Button("ステータス更新")
+        results_output = gr.Dataframe(
+            label="結果",
+            headers=["テキスト", "確率"],
+            datatype=["str", "number"],
+            interactive=False
+        )
+        # イベントハンドラ
+        def build_and_display(prompt, root, top_k, max_depth):
+            results = build_word_tree(prompt, root, int(top_k), int(max_depth))
+            # DataFrame用に変換
+            df_data = [[r["text"], f"{r['probability']:.4f}"] for r in results]
+            return df_data, get_status()
+        build_btn.click(
+            fn=build_and_display,
+            inputs=[prompt_input, root_input, top_k_slider, max_depth_slider],
+            outputs=[results_output, status_output]
+        )
+        refresh_status_btn.click(
+            fn=lambda: get_status(),
+            outputs=status_output
+        )
+# FastAPIアプリを作成（元のLLMViewと同じ構造）
+app = FastAPI(
+    title="LLMView Multi-Model API",
+    description="LLMView の単語ツリー構築 API。/build_word_tree にPOSTしてください。",
+    version="1.0.0",
+)
 # ZeroGPU対応: 起動時に検出されるように、デコレータ付き関数を定義
     pass
+@app.on_event("startup")
+async def startup_event():
+    """アプリ起動時の処理（GPU要求を確実に検出させる）"""
+    if SPACES_AVAILABLE:
+        try:
+            _gpu_init_function()
+            print("[SPACE] GPU要求をstartup eventで送信しました")
+        except Exception as e:
+            print(f"[SPACE] GPU要求エラー: {e}")
+@app.get("/")
+def root() -> Dict[str, str]:
+    """簡易案内（元のLLMViewと同じ）"""
+    return {
+        "message": "LLMView Multi-Model API",
+        "status_endpoint": "/health",
+        "build_endpoint": "/build_word_tree",
+    }
+@app.get("/health")
 def health() -> Dict[str, Any]:
     """状態確認（元のLLMViewと同じ形式）"""
     with status_lock:
 @spaces.GPU  # ZeroGPU対応: デコレータを先に適用（Space起動時に検出される）
+@app.post("/build_word_tree", response_model=List[WordTreeResponse])
+def api_build_word_tree(payload: WordTreeRequest) -> List[WordTreeResponse]:
     """単語ツリーを構築（元のLLMViewと同じAPI）"""
     if not payload.prompt_text.strip():
         raise HTTPException(status_code=400, detail="prompt_text を入力してください。")
 if __name__ == "__main__":
+    # Gradio UIが有効な場合はGradioアプリを起動、無効な場合はFastAPIのみ
+    if ENABLE_GRADIO_UI and demo is not None:
+        # GradioアプリにFastAPIを統合
+        demo.fastapi_app = app
+        demo.launch(
+            server_name="0.0.0.0",
+            server_port=7860,
+            share=False
+        )
+    else:
+        # FastAPIのみ（元のLLMViewと同じ）
+        import uvicorn
+        uvicorn.run(
+            app,
+            host="0.0.0.0",
+            port=7860,
+            log_level=os.getenv("UVICORN_LOG_LEVEL", "warning"),
+            access_log=os.getenv("UVICORN_ACCESS_LOG", "false").lower() == "true",
+        )