Spaces:

nambn0321
/

TTS_run

Runtime error

nambn0321 commited on Jul 30, 2025

Commit

2dc786b

verified ·

1 Parent(s): af16e48

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -28,23 +28,21 @@ def tts_generate(text):
         inputs = processor(text=text, return_tensors="pt").to(device)
         print("✅ Text processed.")
-        # Generate mel spectrogram
-        print("🎤 Generating speech...")
         with torch.no_grad():
-            mel = model.generate_speech(inputs["input_ids"], speaker_embedding)
-        print("✅ Mel spectrogram generated.")
-        # Convert mel spectrogram to waveform
-        print("🎚️ Vocoding waveform...")
-        waveform = vocoder(mel)
-        waveform = waveform.cpu()
         print("✅ Waveform generated.")
         # Save waveform
         output_path = "output.wav"
         if waveform.dim() == 1:
-            waveform = waveform.unsqueeze(0)
-        torchaudio.save(output_path, waveform, sample_rate=16000)
         print(f"💾 Audio saved to {output_path}")
         return output_path

         inputs = processor(text=text, return_tensors="pt").to(device)
         print("✅ Text processed.")
+        # Generate waveform directly (with vocoder)
+        print("🎤 Generating speech waveform...")
         with torch.no_grad():
+            waveform = model.generate_speech(
+                inputs["input_ids"],
+                speaker_embedding,
+                vocoder=vocoder
+            )
         print("✅ Waveform generated.")
         # Save waveform
         output_path = "output.wav"
         if waveform.dim() == 1:
+            waveform = waveform.unsqueeze(0)
+        torchaudio.save(output_path, waveform.cpu(), sample_rate=16000)
         print(f"💾 Audio saved to {output_path}")
         return output_path