Spaces:

garyuzair
/

TTS

Runtime error

garyuzair commited on May 20, 2025

Commit

a49cb4a

verified ·

1 Parent(s): 1f42111

Update tts_core.py

Files changed (1) hide show

tts_core.py CHANGED Viewed

@@ -5,7 +5,11 @@ import os
 import numpy as np
 class KokoroTTS:
     def __init__(self):
         self.lang_code = 'a'
         self.pipeline = KPipeline(lang_code=self.lang_code)
@@ -36,11 +40,11 @@ class KokoroTTS:
             "am_santa": "Male Santa"
         }
-        # Default voice and output directory setup
-       self.default_voice = "af_heart"
         self.output_dir = "/tmp/outputs"
-        os.makedirs(self.output_dir, exist_ok=True)   # Ensure write permissions
     def generate_speech(self, text, voice=None, speed=1.0, output_file=None, return_audio=True):
         """Generate speech from text"""
         voice = voice or self.default_voice
@@ -53,11 +57,9 @@ class KokoroTTS:
                     split_pattern=r'\n+'
                 )
-                # Process audio segments
                 audio_chunks = [audio for _, _, audio in generator]
                 final_audio = np.concatenate(audio_chunks) if audio_chunks else np.zeros(1000, dtype=np.float32)
-                # Save output
                 output_file = output_file or f"{self.output_dir}/tts_{voice}_{hash(text) % 10000}.wav"
                 sf.write(output_file, final_audio, 24000)

 import numpy as np
 class KokoroTTS:
+    """
+    A CPU-optimized wrapper for Kokoro82m TTS model
+    """
     def __init__(self):
+        # Initialize with American English
         self.lang_code = 'a'
         self.pipeline = KPipeline(lang_code=self.lang_code)
             "am_santa": "Male Santa"
         }
+        # Default configuration
+        self.default_voice = "af_heart"
         self.output_dir = "/tmp/outputs"
+        os.makedirs(self.output_dir, exist_ok=True)
     def generate_speech(self, text, voice=None, speed=1.0, output_file=None, return_audio=True):
         """Generate speech from text"""
         voice = voice or self.default_voice
                     split_pattern=r'\n+'
                 )
                 audio_chunks = [audio for _, _, audio in generator]
                 final_audio = np.concatenate(audio_chunks) if audio_chunks else np.zeros(1000, dtype=np.float32)
                 output_file = output_file or f"{self.output_dir}/tts_{voice}_{hash(text) % 10000}.wav"
                 sf.write(output_file, final_audio, 24000)