Spaces:

triflix
/

sky

Paused

App Files Files Community

triflix commited on Apr 22, 2025

Commit

86716a1

verified ·

1 Parent(s): 2061a01

Update main.py

Browse files

Files changed (1) hide show

main.py +42 -15

main.py CHANGED Viewed

@@ -1,3 +1,9 @@
 from fastapi import FastAPI
 from fastapi.responses import StreamingResponse
 from fastapi.staticfiles import StaticFiles
@@ -7,29 +13,50 @@ import numpy as np
 import soundfile as sf
 app = FastAPI()
 pipeline = KPipeline(lang_code='a')
-# Mount static/ at /static
-app.mount("/static", StaticFiles(directory="static"), name="static")
 @app.get("/tts-stream")
 def tts_stream(text: str):
-    # Generate Kokoro audio segments without splitting
-    segs = list(pipeline(text, voice='af_sky', speed=1.0, split_pattern=r'$^'))
     # Concatenate into one array
-    full = np.concatenate([audio for (_, _, audio) in segs])
-    # Write WAV into in-memory buffer
     buf = io.BytesIO()
-    sf.write(buf, full, 24000, format="WAV")
     buf.seek(0)
-    # Stream as audio/wav
-    return StreamingResponse(buf, media_type="audio/wav")
 @app.get("/tts-file")
 def tts_file(text: str):
-    segs = list(pipeline(text, voice='af_sky', speed=1.0, split_pattern=r'$^'))
-    full = np.concatenate([audio for (_, _, audio) in segs])
-    # Save to static/output_full.wav
-    path = "static/output_full.wav"
-    sf.write(path, full, 24000)
-    return {"url": f"/static/output_full.wav"}

+import os
+# Ensure HF cache dirs are set before any HF imports
+os.environ['HF_HOME'] = '/app/.cache/huggingface'
+os.environ['HUGGINGFACE_HUB_CACHE'] = '/app/.cache/huggingface/hub'
+os.environ['TRANSFORMERS_CACHE'] = '/app/.cache/huggingface'
 from fastapi import FastAPI
 from fastapi.responses import StreamingResponse
 from fastapi.staticfiles import StaticFiles
 import soundfile as sf
 app = FastAPI()
+# Initialize Kokoro TTS pipeline for American English
 pipeline = KPipeline(lang_code='a')
+# Mount the static/ directory at /static
+app.mount(
+    "/static", StaticFiles(directory="static"), name="static"
+)
 @app.get("/tts-stream")
 def tts_stream(text: str):
+    """
+    Generate and stream a single continuous WAV audio using af_sky voice.
+    """
+    # Generate segments without splitting
+    segments = list(
+        pipeline(
+            text,
+            voice='af_sky',
+            speed=1.0,
+            split_pattern=r'$^'  # never matches → full text as one segment
+        )
+    )
     # Concatenate into one array
+    audio_full = np.concatenate([audio for (_, _, audio) in segments])
+    # Write to in-memory buffer as WAV
     buf = io.BytesIO()
+    sf.write(buf, audio_full, 24000, format='WAV')
     buf.seek(0)
+    return StreamingResponse(buf, media_type='audio/wav')
 @app.get("/tts-file")
 def tts_file(text: str):
+    """
+    Generate a full WAV file, save to static/, and return its URL.
+    """
+    segments = list(
+        pipeline(
+            text,
+            voice='af_sky',
+            speed=1.0,
+            split_pattern=r'$^'
+        )
+    )
+    audio_full = np.concatenate([audio for (_, _, audio) in segments])
+    output_path = 'static/output_full.wav'
+    sf.write(output_path, audio_full, 24000)
+    return {"url": f"/static/output_full.wav"}