Spaces:

Inial
/

Ttsnko

Sleeping

App Files Files Community

Inial commited on Jun 1, 2025

Commit

a90294a

verified ·

1 Parent(s): c51b93a

Update app.py

Browse files

Files changed (1) hide show

app.py +21 -28

app.py CHANGED Viewed

@@ -2,46 +2,39 @@ import gradio as gr
 import torch
 from transformers import AutoProcessor, VitsModel
 from scipy.io.wavfile import write
-import numpy as np
 model_id = "facebook/mms-tts-nko"
 processor = AutoProcessor.from_pretrained(model_id)
 model = VitsModel.from_pretrained(model_id)
-device = "cuda" if torch.cuda.is_available() else "cpu"
-model.to(device)
 def tts_nko(text):
     try:
-        # Xử lý văn bản
-        inputs = processor(text=text, return_tensors="pt")
-        # Kiểm tra input_ids không rỗng
-        if inputs["input_ids"].nelement() == 0:
-            return "❌ Văn bản N'Ko không hợp lệ hoặc không được hỗ trợ.", None
-        # Ép kiểu đúng cho mô hình VITS
-        inputs["input_ids"] = inputs["input_ids"].long().to(device)
-        # Tạo giọng nói
         with torch.no_grad():
-            outputs = model(**inputs)
-        audio = outputs.audio[0].cpu().numpy()
-        audio_path = "nko_output.wav"
-        write(audio_path, rate=model.config.sampling_rate, data=audio)
-        return "✅ Đã tạo giọng đọc N'Ko", audio_path
     except Exception as e:
         return f"❌ Lỗi: {str(e)}", None
 with gr.Blocks() as demo:
-    gr.Markdown("## 🗣️ TTS tiếng N'Ko (ߒߞߏ)")
-    input_text = gr.Textbox(label="Nhập chữ N'Ko", value="ߞߊߟߊ ߛߌ߬")
-    status = gr.Textbox(label="Trạng thái")
-    audio_output = gr.Audio(label="Kết quả", type="filepath")
-    button = gr.Button("Phát giọng nói")
-    button.click(fn=tts_nko, inputs=[input_text], outputs=[status, audio_output])
 demo.launch()

 import torch
 from transformers import AutoProcessor, VitsModel
 from scipy.io.wavfile import write
+# Khởi tạo model và processor
 model_id = "facebook/mms-tts-nko"
 processor = AutoProcessor.from_pretrained(model_id)
 model = VitsModel.from_pretrained(model_id)
+model.to("cpu")
+def transliterate_nko(text):
+    # Với mô hình MMS, có thể tự nhận dạng mã Latin (ví dụ như từ "kani").
+    # Nếu văn bản đã là chữ N'Ko gốc (ߞߐߣߌ), thì dùng luôn.
+    return text
 def tts_nko(text):
     try:
+        input_text = transliterate_nko(text)
+        inputs = processor(text=input_text, return_tensors="pt")
+        inputs["input_ids"] = inputs["input_ids"].long()
         with torch.no_grad():
+            output = model(**inputs)
+        audio = output.waveform[0].numpy()
+        path = "nko.wav"
+        write(path, rate=model.config.sampling_rate, data=audio)
+        return "✅ Đã phát sinh âm thanh từ văn bản N'Ko", path
     except Exception as e:
         return f"❌ Lỗi: {str(e)}", None
 with gr.Blocks() as demo:
+    gr.Markdown("# 🗣️ N'Ko TTS với Facebook MMS (ߒߞߏ)")
+    text_input = gr.Textbox(label="Nhập văn bản N'Ko (VD: ߞߐߣߌ)")
+    output_text = gr.Textbox(label="Kết quả")
+    output_audio = gr.Audio(label="Phát âm", type="filepath")
+    button = gr.Button("Phát")
+    button.click(fn=tts_nko, inputs=[text_input], outputs=[output_text, output_audio])
 demo.launch()