Chatterbox-Multilingual-TTS-API

Sleeping

App Files Files Community

rahul7star commited on 24 days ago

Commit

d334bcd

verified ·

1 Parent(s): 851663b

Update app.py

Browse files

Files changed (1) hide show

app.py +38 -104

app.py CHANGED Viewed

@@ -1,131 +1,65 @@
-import os
-import uuid
-import torch
-from fastapi import FastAPI
-from pydantic import BaseModel
-from fastapi.responses import FileResponse, HTMLResponse
-from src.chatterbox.mtl_tts import ChatterboxMultilingualTTS, SUPPORTED_LANGUAGES
 import os
 os.environ["CUDA_VISIBLE_DEVICES"] = ""
 os.environ["TORCH_FORCE_CPU"] = "1"
 import torch
-# ===============================
-# HARD FORCE CPU torch.load
-# ===============================
 _original_torch_load = torch.load
 def cpu_only_torch_load(*args, **kwargs):
-    # Force CPU regardless of how torch.load is called
     kwargs["map_location"] = torch.device("cpu")
     return _original_torch_load(*args, **kwargs)
 torch.load = cpu_only_torch_load
-# Extra safety: disable CUDA completely
 torch.cuda.is_available = lambda: False
-# -------------------------------------------------
-# App
-# -------------------------------------------------
-app = FastAPI(title="Chatterbox Multilingual TTS")
-# -------------------------------------------------
-# Globals (model loaded once)
-# -------------------------------------------------
-MODEL = None
-OUTPUT_DIR = "/tmp/tts_outputs"
-os.makedirs(OUTPUT_DIR, exist_ok=True)
-# -------------------------------------------------
-# Request schema
-# -------------------------------------------------
-class TTSRequest(BaseModel):
-    text: str
-    language: str = "en"   # "en" or "hi"
-    speaker: str | None = None
-# -------------------------------------------------
-# Model loader (NO .eval())
-# -------------------------------------------------
 MODEL = None
 def get_or_load_model():
     global MODEL
     if MODEL is None:
-        print("🔄 Loading ChatterboxMultilingualTTS (CPU-only)")
-        # ✅ THIS is the ONLY valid loader
         MODEL = ChatterboxMultilingualTTS.from_pretrained("cpu")
-        # Chatterbox is NOT torch.nn.Module → no .to()
-        MODEL.eval()
-        print("✅ Chatterbox model loaded successfully")
     return MODEL
-# -------------------------------------------------
-# API: TTS
-# -------------------------------------------------
-@app.post("/tts")
-def tts(req: TTSRequest):
-    if req.language not in SUPPORTED_LANGUAGES:
-        return {
-            "error": f"Unsupported language. Supported: {SUPPORTED_LANGUAGES}"
-        }
-    model = get_or_load_model()
-    out_path = os.path.join(OUTPUT_DIR, f"{uuid.uuid4().hex}.wav")
-    # ✅ Correct inference pattern
-    with torch.inference_mode():
-        audio = model.tts(
-            text=req.text,
-            language=req.language,
-            speaker=req.speaker,
-            output_path=out_path,
-        )
-    return FileResponse(
-        out_path,
-        media_type="audio/wav",
-        filename="speech.wav",
-    )
-# -------------------------------------------------
-# Simple UI (for quick testing)
-# -------------------------------------------------
-@app.get("/", response_class=HTMLResponse)
-def ui():
-    return """
-    <html>
-        <body>
-            <h2>Chatterbox Multilingual TTS</h2>
-            <form action="/tts" method="post">
-                <textarea name="text" rows="4" cols="60">Hello, how are you?</textarea><br><br>
-                <select name="language">
-                    <option value="en">English</option>
-                    <option value="hi">Hindi</option>
-                </select><br><br>
-                <button type="submit">Generate Speech</button>
-            </form>
-        </body>
-    </html>
-    """
-# -------------------------------------------------
-# Warm-up (optional, safe)
-# -------------------------------------------------
-@app.on_event("startup")
-def warmup():
     get_or_load_model()

+# ===============================
+# FORCE CPU ONLY (VERY TOP)
+# ===============================
 import os
 os.environ["CUDA_VISIBLE_DEVICES"] = ""
 os.environ["TORCH_FORCE_CPU"] = "1"
 import torch
+# ---- HARD FORCE torch.load → CPU ----
 _original_torch_load = torch.load
 def cpu_only_torch_load(*args, **kwargs):
     kwargs["map_location"] = torch.device("cpu")
     return _original_torch_load(*args, **kwargs)
 torch.load = cpu_only_torch_load
 torch.cuda.is_available = lambda: False
+# ===============================
+# STANDARD IMPORTS
+# ===============================
+from fastapi import FastAPI
+from contextlib import asynccontextmanager
+from src.chatterbox.mtl_tts import ChatterboxMultilingualTTS
+# ===============================
+# GLOBAL MODEL CACHE
+# ===============================
 MODEL = None
+# ===============================
+# MODEL LOADER
+# ===============================
 def get_or_load_model():
     global MODEL
     if MODEL is None:
+        print("🔄 Loading ChatterboxMultilingualTTS (CPU ONLY)")
         MODEL = ChatterboxMultilingualTTS.from_pretrained("cpu")
+        print("✅ Model loaded on CPU")
     return MODEL
+# ===============================
+# FASTAPI LIFESPAN
+# ===============================
+@asynccontextmanager
+async def lifespan(app: FastAPI):
+    # Warmup on startup
     get_or_load_model()
+    yield
+    # (no shutdown logic needed)
+app = FastAPI(lifespan=lifespan)
+# ===============================
+# HEALTH CHECK
+# ===============================
+@app.get("/health")
+def health():
+    return {
+        "status": "ok",
+        "device": "cpu",
+        "cuda_available": torch.cuda.is_available()
+    }