Spaces:

Quartz4065
/

AudioTranscriber

Sleeping

Quartz4065 commited on Sep 18

Commit

829baf1

verified ·

1 Parent(s): 28fc9e7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,10 +7,13 @@ from fastapi.middleware.cors import CORSMiddleware
 from fastapi.responses import JSONResponse
 from pydantic import BaseModel
-# ===== Writable caches (persist across restarts) =====
 os.environ.setdefault("HF_HOME", "/data/hf")
 os.environ.setdefault("HUGGINGFACE_HUB_CACHE", "/data/hf")
 os.environ.setdefault("XDG_CACHE_HOME", "/data/.cache")
 for p in ("/data", "/data/hf", "/data/.cache", "/tmp"):
     try:
         os.makedirs(p, exist_ok=True)
@@ -18,19 +21,26 @@ for p in ("/data", "/data/hf", "/data/.cache", "/tmp"):
     except Exception:
         pass
-# ===== Transcriber (CPU) =====
 from faster_whisper import WhisperModel
 MODEL_NAME = os.environ.get("WHISPER_MODEL", "tiny.en")
-app = FastAPI(title="Nuvia Free Transcriber", version="1.2.0")
 app.add_middleware(
     CORSMiddleware,
     allow_origins=["*"], allow_credentials=True,
     allow_methods=["*"], allow_headers=["*"],
 )
-# Load from /data to avoid runtime downloads
-model = WhisperModel(MODEL_NAME, device="cpu", compute_type="int8", download_root="/data/hf")
 class HealthOut(BaseModel):
     ok: bool
@@ -82,7 +92,7 @@ async def transcribe(file: UploadFile = File(...)):
     duration = ffprobe_duration(tmp_wav)
-    # Transcribe
     segments, _ = model.transcribe(tmp_wav, language="en")
     text = "".join(seg.text for seg in segments).strip()

 from fastapi.responses import JSONResponse
 from pydantic import BaseModel
+# ---- CACHES: point to writable dirs, ensure perms ----
 os.environ.setdefault("HF_HOME", "/data/hf")
 os.environ.setdefault("HUGGINGFACE_HUB_CACHE", "/data/hf")
 os.environ.setdefault("XDG_CACHE_HOME", "/data/.cache")
+os.environ.setdefault("HF_HUB_DISABLE_TELEMETRY", "1")
+os.environ.setdefault("HF_HUB_DISABLE_PROGRESS_BARS", "1")
 for p in ("/data", "/data/hf", "/data/.cache", "/tmp"):
     try:
         os.makedirs(p, exist_ok=True)
     except Exception:
         pass
+# ---- Transcriber (CPU) ----
 from faster_whisper import WhisperModel
 MODEL_NAME = os.environ.get("WHISPER_MODEL", "tiny.en")
+app = FastAPI(title="Nuvia Free Transcriber", version="1.3.0")
 app.add_middleware(
     CORSMiddleware,
     allow_origins=["*"], allow_credentials=True,
     allow_methods=["*"], allow_headers=["*"],
 )
+# IMPORTANT:
+# local_files_only=True prevents any runtime writes/downloads
+model = WhisperModel(
+    MODEL_NAME,
+    device="cpu",
+    compute_type="int8",
+    download_root="/data/hf",
+    local_files_only=True,
+)
 class HealthOut(BaseModel):
     ok: bool
     duration = ffprobe_duration(tmp_wav)
+    # Transcribe (no downloads, model already cached)
     segments, _ = model.transcribe(tmp_wav, language="en")
     text = "".join(seg.text for seg in segments).strip()