Spaces:

DroolingPanda
/

teachingAssistant

Sleeping

Michael Hu commited on Apr 28, 2025

Commit

e3843d2

1 Parent(s): 22bd0b9

update to set a voice

Files changed (1) hide show

utils/tts.py CHANGED Viewed

@@ -107,13 +107,6 @@ class TTSEngine:
                 self.client = Client("Remsky/Kokoro-TTS-Zero")
                 self.engine_type = "kokoro_space"
                 logger.info("TTS engine successfully initialized with Kokoro FastAPI server")
-                result = client.predict(
-                        text="The studio was filled with the rich odour of roses, and when the light",
-                        voice_names=None,
-                        speed=1,
-                        api_name="/generate_speech_from_ui"
-                )
-                logger.info(result)
             except Exception as kokoro_err:
                 logger.error(f"Failed to initialize Kokoro pipeline: {str(kokoro_err)}")
                 logger.error(f"Error type: {type(kokoro_err).__name__}")
@@ -170,12 +163,14 @@ class TTSEngine:
             elif self.engine_type == "kokoro_space":
                 # Use Kokoro FastAPI server for TTS generation
                 logger.info("Generating speech using Kokoro FastAPI server")
                 result = self.client.predict(
                         text=text,
-                        voice_names=None,
                         speed=speed,
                         api_name="/generate_speech_from_ui"
                 )
             elif self.engine_type == "dia":
                 # Use Dia for TTS generation
                 try:

                 self.client = Client("Remsky/Kokoro-TTS-Zero")
                 self.engine_type = "kokoro_space"
                 logger.info("TTS engine successfully initialized with Kokoro FastAPI server")
             except Exception as kokoro_err:
                 logger.error(f"Failed to initialize Kokoro pipeline: {str(kokoro_err)}")
                 logger.error(f"Error type: {type(kokoro_err).__name__}")
             elif self.engine_type == "kokoro_space":
                 # Use Kokoro FastAPI server for TTS generation
                 logger.info("Generating speech using Kokoro FastAPI server")
+                logger.info(f"text to generate speech on is: {text}")
                 result = self.client.predict(
                         text=text,
+                        voice_names=voice,
                         speed=speed,
                         api_name="/generate_speech_from_ui"
                 )
+                logger.info(f"Received audio from Kokoro FastAPI server: {result}")
             elif self.engine_type == "dia":
                 # Use Dia for TTS generation
                 try: