Spaces:

Inial
/

Ttsnko

Sleeping

Inial commited on Jun 1, 2025

Commit

7cc66cf

verified ·

1 Parent(s): d6c031c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,33 +2,45 @@ import gradio as gr
 import torch
 from transformers import AutoProcessor, VitsModel
 model_id = "facebook/mms-tts-nko"
-device = "cuda" if torch.cuda.is_available() else "cpu"
 processor = AutoProcessor.from_pretrained(model_id)
-model = VitsModel.from_pretrained(model_id).to(device)
 def tts_nko(text):
     try:
-        inputs = processor(text=text, return_tensors="pt")
-        input_ids = inputs["input_ids"].to(device).long()  # ⚠️ ép kiểu Long
-        attention_mask = inputs["attention_mask"].to(device)
         with torch.no_grad():
-            output = model(input_ids=input_ids, attention_mask=attention_mask)
-        waveform = output.waveform[0].cpu().numpy()
-        return f"✅ Giọng N’Ko (nko)", (waveform, 16000)
     except Exception as e:
         return f"❌ Lỗi: {str(e)}", None
 with gr.Blocks() as demo:
-    gr.Markdown("# 🔊 N’Ko TTS (ߒߞߏ /nko/)")
-    text_input = gr.Textbox(label="Nhập văn bản N’Ko (ߒߞߏ...)")
-    output_text = gr.Textbox(label="Trạng thái")
-    output_audio = gr.Audio(label="Phát âm", type="numpy")
-    btn = gr.Button("Phát")
-    btn.click(fn=tts_nko, inputs=[text_input], outputs=[output_text, output_audio])
 demo.launch()

 import torch
 from transformers import AutoProcessor, VitsModel
+# Load mô hình và processor
 model_id = "facebook/mms-tts-nko"
 processor = AutoProcessor.from_pretrained(model_id)
+model = VitsModel.from_pretrained(model_id)
+# Đặt thiết bị phù hợp
+device = "cuda" if torch.cuda.is_available() else "cpu"
+model.to(device)
 def tts_nko(text):
     try:
+        # Xử lý văn bản bằng processor
+        inputs = processor(text=text, return_tensors="pt").to(device)
+        # Dự đoán bằng mô hình
         with torch.no_grad():
+            outputs = model(**inputs)
+        # Xuất audio
+        waveform = outputs.audio[0].cpu().numpy()
+        # Lưu file WAV
+        from scipy.io.wavfile import write
+        output_path = "nko_output.wav"
+        write(output_path, rate=model.config.sampling_rate, data=waveform)
+        return "✅ Tạo thành công giọng N'Ko", output_path
     except Exception as e:
         return f"❌ Lỗi: {str(e)}", None
+# Giao diện Gradio
 with gr.Blocks() as demo:
+    gr.Markdown("## 🗣️ N'Ko TTS (ߒߞߏ)")
+    txt = gr.Textbox(label="Nhập văn bản bằng chữ N'Ko", value="ߞߊߟߊ ߛߌ߬")
+    out_txt = gr.Textbox(label="Trạng thái")
+    out_audio = gr.Audio(label="Phát âm", type="filepath")
+    btn = gr.Button("Chuyển văn bản thành giọng nói")
+    btn.click(fn=tts_nko, inputs=[txt], outputs=[out_txt, out_audio])
 demo.launch()