ollui commited on
Commit
d9b2afc
·
verified ·
1 Parent(s): 68de5cb

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +13 -12
app.py CHANGED
@@ -1,20 +1,21 @@
 
1
  import torch
2
- from transformers import AutoProcessor, AutoModelForSpeechSeq2Seq
3
  import soundfile as sf
4
 
5
- # Tải modelprocessor
6
- model = AutoModelForSpeechSeq2Seq.from_pretrained("facebook/mms-tts-mhr")
7
- processor = AutoProcessor.from_pretrained("facebook/mms-tts-mhr")
 
8
 
9
- # Nhập văn bản Meadow Mari
10
- text = "Мыйым пычал!" # dụ: "Chào buổi sáng!"
11
 
12
- # Tiền xử lý
13
- inputs = processor(text=text, return_tensors="pt")
14
 
15
- # Sinh giọng nói
16
  with torch.no_grad():
17
- waveform = model.generate(**inputs)
18
 
19
- # Ghi ra file âm thanh WAV
20
- sf.write("mari_tts.wav", waveform.cpu().squeeze().numpy(), 16000)
 
1
+ from transformers import VitsModel, VitsTokenizer
2
  import torch
 
3
  import soundfile as sf
4
 
5
+ # Tải tokenizermodel VITS
6
+ model_id = "facebook/mms-tts-mhr"
7
+ tokenizer = VitsTokenizer.from_pretrained(model_id)
8
+ model = VitsModel.from_pretrained(model_id)
9
 
10
+ # Nhập văn bản muốn đọc
11
+ text = "Привет" # hoặc tiếng Meadow Mari nếu em có
12
 
13
+ # Token hóa
14
+ inputs = tokenizer(text, return_tensors="pt")
15
 
16
+ # Sinh audio
17
  with torch.no_grad():
18
+ output = model(**inputs).waveform
19
 
20
+ # Lưu file
21
+ sf.write("output.wav", output.squeeze().numpy(), samplerate=22050)