Spaces:

Rajhuggingface4253
/

neu

Paused

Rajhuggingface4253 commited on Oct 18

Commit

74ce059

verified ·

1 Parent(s): 1b19075

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -143,11 +143,7 @@ class NeuTTSWrapper:
     def generate_speech_blocking(self, text: str, ref_audio_path: str) -> np.ndarray:
         """Blocking synthesis for standard endpoint."""
-        # 1. Load reference
-        reference_audio, sr = sf.read(ref_audio_path)
-        if sr != SAMPLE_RATE:
-            # Simple check/resize logic required if sample rate mismatch occurs
-            pass
         # 2. Encode reference
         ref_s = self.tts_model.encode_reference(reference_audio)
@@ -161,11 +157,9 @@ class NeuTTSWrapper:
         """Sentence-by-Sentence Streaming (Blocking)."""
         logger.info(f"Starting streaming synthesis for text length: {len(text)}")
-        # 1. Load reference audio (ONLY ONCE)
-        reference_audio, sr = sf.read(ref_audio_path)
-        # 2. Encode reference (ONLY ONCE)
-        ref_s = self.tts_model.encode_reference(reference_audio)
         # 3. Split text
         sentences = self._split_text_into_chunks(text)

     def generate_speech_blocking(self, text: str, ref_audio_path: str) -> np.ndarray:
         """Blocking synthesis for standard endpoint."""
         # 2. Encode reference
         ref_s = self.tts_model.encode_reference(reference_audio)
         """Sentence-by-Sentence Streaming (Blocking)."""
         logger.info(f"Starting streaming synthesis for text length: {len(text)}")
+        ref_s = self.tts_model.encode_reference(ref_audio_path)
         # 3. Split text
         sentences = self._split_text_into_chunks(text)