import gradio as gr import torch from transformers import AutoProcessor, BarkModel import numpy as np model_id = "facebook/mms-tts-chv" processor = AutoProcessor.from_pretrained(model_id) model = BarkModel.from_pretrained(model_id) model.eval() def tts(text): inputs = processor(text=text, return_tensors="pt") with torch.no_grad(): output = model.generate(**inputs) audio = processor.decode(output[0], return_tensors="np")["audio"] return (16000, audio) gr.Interface( fn=tts, inputs=gr.Textbox(label="Nhập tiếng Chuvash"), outputs=gr.Audio(label="Kết quả TTS", type="numpy"), title="TTS tiếng Chuvash (Meta MMS)", description="Nhập văn bản tiếng Chuvash để chuyển thành giọng nói bằng Meta MMS." ).launch()