voicecloneapi

Runtime error

Arafath10 commited on Jan 12

Commit

35f9a40

verified ·

1 Parent(s): ffcdd4b

Update main.py

Files changed (1) hide show

main.py CHANGED Viewed

@@ -22,22 +22,7 @@ def split_text(text: str, words_per_chunk: int = 20):
     words = text.split()
     return [' '.join(words[i:i + words_per_chunk]) for i in range(0, len(words), words_per_chunk)]
-# Function to generate audio chunks
-def generate_audio_chunks(text: str, language: str, chunk_size: int = 20) -> Generator[bytes, None, None]:
-    if tts.is_multi_lingual and not language:
-        raise ValueError("Language must be specified for multi-lingual models.")
-    text_chunks = split_text(text, chunk_size)
-    for idx, chunk in enumerate(text_chunks):
-        # Generate audio for each chunk and yield as bytes
-        tts.tts_to_file(
-            text=chunk,
-            file_path=f"out_{idx}.wav",
-            speaker_wav=FIXED_SPEAKER_WAV,
-            language=language
-        )
-        yield f"out_{idx}.wav"
 @app.post("/generate-audio/")
 async def generate_audio(
@@ -49,10 +34,19 @@ async def generate_audio(
     # StreamingResponse to stream audio chunks
     def audio_stream():
-        try:
-            for audio_chunk in generate_audio_chunks(text=text, language=language):
-                yield audio_chunk
-        except Exception as e:
-            raise HTTPException(status_code=500, detail=str(e))
     return StreamingResponse(audio_stream(), media_type="audio/wav")

     words = text.split()
     return [' '.join(words[i:i + words_per_chunk]) for i in range(0, len(words), words_per_chunk)]
 @app.post("/generate-audio/")
 async def generate_audio(
     # StreamingResponse to stream audio chunks
     def audio_stream():
+            if tts.is_multi_lingual and not language:
+                raise ValueError("Language must be specified for multi-lingual models.")
+            text_chunks = split_text(text, 20)
+            for idx, chunk in enumerate(text_chunks):
+                # Generate audio for each chunk and yield as bytes
+                tts.tts_to_file(
+                    text=chunk,
+                    file_path=f"out_{idx}.wav",
+                    speaker_wav=FIXED_SPEAKER_WAV,
+                    language=language
+                )
+                yield f"out_{idx}.wav"
     return StreamingResponse(audio_stream(), media_type="audio/wav")