ollui's picture
Update app.py
6181211 verified
raw
history blame contribute delete
957 Bytes
import gradio as gr
from transformers import VitsModel, AutoTokenizer
import torch
import scipy
# Load model and tokenizer
model = VitsModel.from_pretrained("facebook/mms-tts-azj-script_cyrillic")
tokenizer = AutoTokenizer.from_pretrained("facebook/mms-tts-azj-script_cyrillic")
def synthesize(text):
inputs = tokenizer(text, return_tensors="pt")
with torch.no_grad():
output = model(**inputs).waveform
audio = output.squeeze().numpy()
return (model.config.sampling_rate, audio)
# Gradio UI
demo = gr.Interface(
fn=synthesize,
inputs=gr.Textbox(label="Nhập văn bản bằng tiếng Azerbaijan (Cyrillic)", lines=4, placeholder="Мəн сəни севирəм."),
outputs=gr.Audio(label="Kết quả giọng nói", type="numpy"),
title="🔊 MMS TTS AZJ - Cyrillic",
description="Chuyển văn bản tiếng Azerbaijan (chữ Cyrillic) thành giọng nói bằng mô hình Facebook MMS-TTS."
)
demo.launch()