Spaces:

Inial
/

Tts

Running

App Files Files Community

Inial commited on May 30, 2025

Commit

235660f

verified ·

1 Parent(s): b6930c9

Update app.py

Browse files

Files changed (1) hide show

app.py +45 -28

app.py CHANGED Viewed

@@ -1,34 +1,51 @@
-import os
-os.system("pip install --upgrade transformers==4.39.2")
-from transformers import AutoModelForTextToSpeech, AutoProcessor
 import torch
-# Tải mô hình và processor
-model = AutoModelForTextToSpeech.from_pretrained("facebook/mms-tts")
-processor = AutoProcessor.from_pretrained("facebook/mms-tts")
-# Lấy danh sách tất cả ngôn ngữ hỗ trợ
-supported_languages = list(processor.feature_extractor.sampling_rate_map.keys())
-supported_languages.sort()
-# Hàm xử lý chuyển văn bản thành giọng nói
-def tts_fn(text, language_code):
-    inputs = processor(text=text, language=language_code, return_tensors="pt")
-    with torch.no_grad():
-        output = model(**inputs)
-    audio = output.waveform.numpy()[0]
-    return (processor.feature_extractor.sampling_rate, audio)
 # Giao diện Gradio
-iface = gr.Interface(
-    fn=tts_fn,
-    inputs=[
-        gr.Textbox(label="Nhập văn bản"),
-        gr.Dropdown(choices=supported_languages, label="Chọn ngôn ngữ"),
-    ],
-    outputs=gr.Audio(label="Kết quả đọc"),
-    title="MMS-TTS 1100+ Ngôn ngữ",
-    description="Dự án tạo TTS sử dụng mô hình facebook/mms-tts, hỗ trợ hơn 1100 ngôn ngữ khác nhau"
-)
-iface.launch()

+import gradio as gr
 import torch
+from transformers import AutoProcessor, AutoModelForTextToSpeech, pipeline
+from huggingface_hub import list_models
+from iso639 import Lang
+import re
+# Lấy danh sách các model MMS-TTS
+def get_mms_tts_languages():
+    models = list_models(author="facebook", search="mms-tts-")
+    lang_map = {}
+    for model in models:
+        match = re.search(r"mms-tts-([a-z0-9]{3})$", model.modelId)
+        if match:
+            iso = match.group(1)
+            try:
+                lang = Lang(iso)
+                lang_map[lang.name.title()] = iso
+            except:
+                lang_map[iso.upper()] = iso
+    return dict(sorted(lang_map.items()))
+LANG_MAP = get_mms_tts_languages()
+LANGUAGE_NAMES = list(LANG_MAP.keys())
+# Sinh âm thanh từ văn bản
+@torch.inference_mode()
+def generate_tts(text, language_name):
+    iso_code = LANG_MAP[language_name]
+    model_id = f"facebook/mms-tts-{iso_code}"
+    processor = AutoProcessor.from_pretrained(model_id)
+    model = AutoModelForTextToSpeech.from_pretrained(model_id).to("cpu")
+    tts_pipeline = pipeline("text-to-speech", model=model, tokenizer=processor, feature_extractor=processor)
+    output = tts_pipeline(text)
+    return output["audio"]
 # Giao diện Gradio
+with gr.Blocks() as demo:
+    gr.Markdown("## 🌍 MMS-TTS: 1100+ Ngôn ngữ TTS từ Meta")
+    with gr.Row():
+        language = gr.Dropdown(label="Chọn ngôn ngữ", choices=LANGUAGE_NAMES, value="Vietnamese")
+        text = gr.Textbox(label="Nhập văn bản", placeholder="Xin chào thế giới")
+    output = gr.Audio(label="Giọng nói")
+    btn = gr.Button("Phát")
+    btn.click(generate_tts, inputs=[text, language], outputs=output)
+if __name__ == "__main__":
+    demo.launch()