Spaces:

Inial
/

Ttsnko

Sleeping

Inial commited on Jun 1, 2025

Commit

3e6e49c

verified ·

1 Parent(s): 7cc66cf

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,41 +1,33 @@
 import gradio as gr
 import torch
 from transformers import AutoProcessor, VitsModel
-# Load mô hình và processor
 model_id = "facebook/mms-tts-nko"
 processor = AutoProcessor.from_pretrained(model_id)
 model = VitsModel.from_pretrained(model_id)
-# Đặt thiết bị phù hợp
 device = "cuda" if torch.cuda.is_available() else "cpu"
 model.to(device)
 def tts_nko(text):
     try:
-        # Xử lý văn bản bằng processor
-        inputs = processor(text=text, return_tensors="pt").to(device)
-        # Dự đoán bằng mô hình
         with torch.no_grad():
             outputs = model(**inputs)
-        # Xuất audio
         waveform = outputs.audio[0].cpu().numpy()
-        # Lưu file WAV
-        from scipy.io.wavfile import write
         output_path = "nko_output.wav"
         write(output_path, rate=model.config.sampling_rate, data=waveform)
-        return "✅ Tạo thành công giọng N'Ko", output_path
     except Exception as e:
         return f"❌ Lỗi: {str(e)}", None
-# Giao diện Gradio
 with gr.Blocks() as demo:
-    gr.Markdown("## 🗣️ N'Ko TTS (ߒߞߏ)")
     txt = gr.Textbox(label="Nhập văn bản bằng chữ N'Ko", value="ߞߊߟߊ ߛߌ߬")
     out_txt = gr.Textbox(label="Trạng thái")
     out_audio = gr.Audio(label="Phát âm", type="filepath")

 import gradio as gr
 import torch
 from transformers import AutoProcessor, VitsModel
+from scipy.io.wavfile import write
 model_id = "facebook/mms-tts-nko"
 processor = AutoProcessor.from_pretrained(model_id)
 model = VitsModel.from_pretrained(model_id)
 device = "cuda" if torch.cuda.is_available() else "cpu"
 model.to(device)
 def tts_nko(text):
     try:
+        inputs = processor(text=text, return_tensors="pt")
+        inputs["input_ids"] = inputs["input_ids"].long()  # Ép kiểu ở đây
+        inputs = inputs.to(device)
         with torch.no_grad():
             outputs = model(**inputs)
         waveform = outputs.audio[0].cpu().numpy()
         output_path = "nko_output.wav"
         write(output_path, rate=model.config.sampling_rate, data=waveform)
+        return "✅ Đã tạo giọng đọc N'Ko", output_path
     except Exception as e:
         return f"❌ Lỗi: {str(e)}", None
 with gr.Blocks() as demo:
+    gr.Markdown("## 🗣️ TTS N'Ko (ߒߞߏ)")
     txt = gr.Textbox(label="Nhập văn bản bằng chữ N'Ko", value="ߞߊߟߊ ߛߌ߬")
     out_txt = gr.Textbox(label="Trạng thái")
     out_audio = gr.Audio(label="Phát âm", type="filepath")