Spaces:

Ryanus
/

parlerTTSmini

Sleeping

App Files Files Community

Ryanus commited on Jul 4, 2025

Commit

6c24caa

verified ·

1 Parent(s): e814c0d

Update app.py

Browse files

Files changed (1) hide show

app.py +5 -14

app.py CHANGED Viewed

@@ -3,13 +3,11 @@ from parler_tts import ParlerTTSForConditionalGeneration
 from transformers import AutoTokenizer
 import soundfile as sf
 import gradio as gr
-import numpy as np
-import tempfile
 import os
 import time
 import glob
-MODEL_ID = "parler-tts/parler-tts-mini-expresso"
 device = "cpu"
 model = ParlerTTSForConditionalGeneration.from_pretrained(MODEL_ID).to(device)
@@ -19,19 +17,14 @@ SAVE_DIR = "saved_audios"
 os.makedirs(SAVE_DIR, exist_ok=True)
 def tts(text, description, progress=gr.Progress()):
-    progress(0, desc="開始處理輸入...")
-    time.sleep(0.2)
     input_ids = tokenizer(description, return_tensors="pt").input_ids.to(device)
-    progress(0.15, desc="描述編碼完成")
-    time.sleep(0.2)
     prompt_input_ids = tokenizer(text, return_tensors="pt").input_ids.to(device)
-    progress(0.3, desc="文本編碼完成")
-    time.sleep(0.2)
-    progress(0.35, desc="開始生成語音")
     generation = model.generate(input_ids=input_ids, prompt_input_ids=prompt_input_ids)
     progress(0.8, desc="語音生成完成，正在寫入檔案")
     audio_arr = generation.cpu().numpy().squeeze()
-    # 自動儲存
     filename = f"tts_{int(time.time())}.wav"
     save_path = os.path.join(SAVE_DIR, filename)
     sf.write(save_path, audio_arr, model.config.sampling_rate)
@@ -39,7 +32,6 @@ def tts(text, description, progress=gr.Progress()):
     return save_path
 def list_saved_audios():
-    # 取得所有 wav 檔案路徑
     audio_files = sorted(
         glob.glob(os.path.join(SAVE_DIR, "*.wav")),
         key=os.path.getmtime,
@@ -48,7 +40,7 @@ def list_saved_audios():
     return audio_files
 with gr.Blocks() as demo:
-    gr.Markdown("## Parler-TTS Mini (Huggingface Space CPU) 帶進度條、自動儲存與音檔檢視")
     with gr.Tab("語音生成"):
         text = gr.Textbox(label="輸入文字", value="Hello, this is Parler-TTS mini running on CPU.")
@@ -61,7 +53,6 @@ with gr.Blocks() as demo:
         audio_list = gr.Files(label="已儲存音檔", file_count="multiple", type="filepath")
         refresh_btn = gr.Button("重新整理列表")
         refresh_btn.click(fn=list_saved_audios, inputs=[], outputs=audio_list)
-        # 預設自動載入
         demo.load(fn=list_saved_audios, inputs=[], outputs=audio_list)
 if __name__ == "__main__":

 from transformers import AutoTokenizer
 import soundfile as sf
 import gradio as gr
 import os
 import time
 import glob
+MODEL_ID = "parler-tts/parler-tts-mini-v1"  # v1 速度最快[2][5]
 device = "cpu"
 model = ParlerTTSForConditionalGeneration.from_pretrained(MODEL_ID).to(device)
 os.makedirs(SAVE_DIR, exist_ok=True)
 def tts(text, description, progress=gr.Progress()):
+    progress(0, desc="開始處理輸入")
     input_ids = tokenizer(description, return_tensors="pt").input_ids.to(device)
+    progress(0.2, desc="描述編碼完成")
     prompt_input_ids = tokenizer(text, return_tensors="pt").input_ids.to(device)
+    progress(0.4, desc="文本編碼完成")
     generation = model.generate(input_ids=input_ids, prompt_input_ids=prompt_input_ids)
     progress(0.8, desc="語音生成完成，正在寫入檔案")
     audio_arr = generation.cpu().numpy().squeeze()
     filename = f"tts_{int(time.time())}.wav"
     save_path = os.path.join(SAVE_DIR, filename)
     sf.write(save_path, audio_arr, model.config.sampling_rate)
     return save_path
 def list_saved_audios():
     audio_files = sorted(
         glob.glob(os.path.join(SAVE_DIR, "*.wav")),
         key=os.path.getmtime,
     return audio_files
 with gr.Blocks() as demo:
+    gr.Markdown("## Parler-TTS Mini v1 (CPU)｜進度條＋自動儲存＋音檔檢視")
     with gr.Tab("語音生成"):
         text = gr.Textbox(label="輸入文字", value="Hello, this is Parler-TTS mini running on CPU.")
         audio_list = gr.Files(label="已儲存音檔", file_count="multiple", type="filepath")
         refresh_btn = gr.Button("重新整理列表")
         refresh_btn.click(fn=list_saved_audios, inputs=[], outputs=audio_list)
         demo.load(fn=list_saved_audios, inputs=[], outputs=audio_list)
 if __name__ == "__main__":