OpenMOSS-Team
/

MOSS-VoiceGenerator

Model card Files Files and versions

CaasiHUANG commited on Feb 9

Commit

3e85610

·

1 Parent(s): 833d379

Fix Normalization

Files changed (1) hide show

processing_moss_tts.py +2 -2

processing_moss_tts.py CHANGED Viewed

@@ -687,7 +687,7 @@ class MossTTSDelayProcessor(ProcessorMixin):
                 audio_start_idx = int(audio_start_idx_t.item())
                 audio_end_idx = int(audio_end_idx_t.item())
                 delay_audio_codes = self.apply_delay_pattern(
-                    audio_ocodes, self.model_config.audio_pad_code
                 )
                 pad_codes = torch.full(
                     (audio_start_idx - prefix_idx + 1, n_vq),
@@ -762,7 +762,7 @@ class MossTTSDelayProcessor(ProcessorMixin):
         if breaks.numel() == 0:
             segments_idx = [idx]
         else:
-            segments_idx = torch.split(idx, breaks.tolist())
         audio_codes_list = [audio_codes[s] for s in segments_idx]

                 audio_start_idx = int(audio_start_idx_t.item())
                 audio_end_idx = int(audio_end_idx_t.item())
                 delay_audio_codes = self.apply_delay_pattern(
+                    audio_codes, self.model_config.audio_pad_code
                 )
                 pad_codes = torch.full(
                     (audio_start_idx - prefix_idx + 1, n_vq),
         if breaks.numel() == 0:
             segments_idx = [idx]
         else:
+            segments_idx = torch.split(idx, breaks)
         audio_codes_list = [audio_codes[s] for s in segments_idx]