Spaces:

soiz
/

mikuTTSAPI

Paused

App Files Files Community

soiz commited on Oct 17, 2024

Commit

c280e59

verified ·

1 Parent(s): 150d7c2

Update app.py

Browse files

Files changed (1) hide show

app.py +40 -67

app.py CHANGED Viewed

@@ -1,73 +1,46 @@
-import gradio as gr
-from rvc import *
-initial_md = """
-# MIKU TTS - 5.0.1
-"""
-app = gr.Blocks(theme='NoCrypt/miku')
-with app:
-    gr.Markdown(initial_md)
-    with gr.Row():
-        with gr.Column():
-            model_name = gr.Dropdown(label="Model",choices=models,value=models[0])
-            f0_key_up = gr.Number(label="Tune",value=6)
-        with gr.Column():
-            f0_method = gr.Radio(label="Pitch extraction method (pm: very fast, low quality, rmvpe: a little slow, high quality)",choices=["pm", "rmvpe"], value="rmvpe",visible=False)
-            index_rate = gr.Slider(minimum=0,maximum=1,label="Index rate",value=1,interactive=True)
-            protect0 = gr.Slider(minimum=0,maximum=0.5,label="Protect",value=0.33,step=0.01,interactive=True)
-    with gr.Row():
-        with gr.Column():
-            tts_voice = gr.Dropdown(
-                label="Edge-tts speaker (format: language-Country-Name-Gender), make sure the gender matches the model",
-                choices=tts_voices,
-                allow_custom_value=False,
-                value="ja-JP-NanamiNeural-Female",
-            )
-            speed = gr.Slider(
-                minimum=-100,
-                maximum=100,
-                label="Speech speed (%)",
-                value=0,
-                step=10,
-                interactive=True,
-            )
-            tts_text = gr.Textbox(label="Input Text", value="こんにちは、私の名前は初音ミクです!")
-        with gr.Column():
-            but0 = gr.Button("Convert", variant="primary")
-            info_text = gr.Textbox(label="Output info")
-        with gr.Column():
-            with gr.Accordion("Edge Voice", visible=False):
-                edge_tts_output = gr.Audio(label="Edge Voice", type="filepath")
-            tts_output = gr.Audio(label="Result")
-        but0.click(
-            tts,
-            [
-                model_name,
-                speed,
-                tts_text,
-                tts_voice,
-                f0_key_up,
-                f0_method,
-                index_rate,
-                protect0,
-            ],
-            [info_text, edge_tts_output, tts_output],
-        )
-    with gr.Row():
-        examples = gr.Examples(
-            examples_per_page=100,
-            examples=[
-                ["こんにちは、私の名前は初音ミクです!", "ja-JP-NanamiNeural-Female", 6],
-                ["Hello there. My name is Hatsune Miku!","en-CA-ClaraNeural-Female", 6],
-                ["Halo. Nama saya Hatsune Miku!","id-ID-GadisNeural-Female", 4],
-                ["Halo. Jenengku Hatsune Miku!","jv-ID-SitiNeural-Female", 10],
-            ],
-            inputs=[tts_text, tts_voice, f0_key_up],
         )
-app.launch()

+from flask import Flask, request, jsonify, send_file
+from rvc import *  # 既存のTTSモデルがこのモジュールにあると仮定します
+import os
+app = Flask(__name__)
+# モデルの初期化 (必要ならば)
+# Gradio用に定義されていたモデルやパラメータをここで適用
+models = [...]  # 実際のモデルのリスト
+tts_voices = [...]  # TTS声のリスト
+@app.route('/tts', methods=['GET'])
+def tts_api():
+    try:
+        # URLパラメータの取得
+        model_name = request.args.get('model_name', default=models[0], type=str)
+        f0_key_up = request.args.get('f0_key_up', default=6, type=int)
+        f0_method = request.args.get('f0_method', default="rmvpe", type=str)
+        index_rate = request.args.get('index_rate', default=1.0, type=float)
+        protect0 = request.args.get('protect0', default=0.33, type=float)
+        tts_voice = request.args.get('tts_voice', default="ja-JP-NanamiNeural-Female", type=str)
+        speed = request.args.get('speed', default=0, type=int)
+        tts_text = request.args.get('tts_text', default="こんにちは、私の名前は初音ミクです!", type=str)
+        # Gradioと同じTTS関数を呼び出して、音声を生成
+        info_text, edge_tts_output, tts_output = tts(
+            model_name, speed, tts_text, tts_voice, f0_key_up, f0_method, index_rate, protect0
         )
+        # 生成された音声ファイルを返す
+        if tts_output and os.path.exists(tts_output):
+            return send_file(tts_output, as_attachment=True)
+        # エッジTTS出力がある場合はこちらを使用
+        if edge_tts_output and os.path.exists(edge_tts_output):
+            return send_file(edge_tts_output, as_attachment=True)
+        return jsonify({"error": "Failed to generate TTS output"}), 500
+    except Exception as e:
+        # エラーが発生した場合はJSONでエラーを返す
+        return jsonify({"error": str(e)}), 400
+if __name__ == '__main__':
+    app.run(host='0.0.0.0', port=7860)