Spaces:

proz
/

api-allosaurus

Sleeping

App Files Files Community

proz commited on Jan 24

Commit

ded8778

verified ·

1 Parent(s): d8f3e66

Upload 4 files

Browse files

Files changed (4) hide show

Dockerfile +29 -0
app.py +62 -0
download_model.py +6 -0
requirements.txt +6 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,29 @@

+# 1. On part d'une version légère de Python
+FROM python:3.9-slim
+# 2. On installe les outils système pour l'audio (indispensable)
+RUN apt-get update && apt-get install -y \
+    libsndfile1 \
+    ffmpeg \
+    && rm -rf /var/lib/apt/lists/*
+# 3. On prépare le dossier de travail
+WORKDIR /app
+# 4. On installe les librairies Python (requirements.txt)
+COPY requirements.txt .
+RUN pip install --no-cache-dir -r requirements.txt
+# 5. ASTUCE : On copie le script de téléchargement et on le lance MAINTENANT
+# Le modèle sera ainsi gravé dans l'image Docker
+COPY download_model.py .
+RUN python download_model.py
+# 6. On copie le reste de ton code (app.py)
+COPY . .
+# 7. On donne les droits (Hugging Face aime bien l'utilisateur 1000)
+RUN chmod -R 777 /app
+# 8. La commande de démarrage
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "7860"]

app.py ADDED Viewed

	@@ -0,0 +1,62 @@

+from fastapi import FastAPI, File, UploadFile, HTTPException
+from allosaurus.app import read_recognizer
+from contextlib import asynccontextmanager
+import aiofiles
+import os
+import uuid
+# Variable globale pour stocker le modèle en mémoire
+ai_context = {}
+@asynccontextmanager
+async def lifespan(app: FastAPI):
+    print("🚀 Démarrage de l'API...")
+    try:
+        # On charge le modèle en RAM. C'est très rapide car il est déjà sur le disque.
+        ai_context["model"] = read_recognizer()
+        print("✅ Allosaurus est chargé et prêt !")
+    except Exception as e:
+        print(f"❌ Erreur au chargement : {e}")
+    yield
+    ai_context.clear()
+app = FastAPI(lifespan=lifespan)
+@app.get("/")
+def home():
+    return {"status": "En ligne", "info": "Envoie un fichier audio POST sur /transcribe"}
+@app.post("/transcribe")
+async def transcribe(file: UploadFile = File(...)):
+    # Vérifier que le modèle est bien là
+    if "model" not in ai_context:
+        raise HTTPException(status_code=500, detail="Le modèle n'est pas chargé.")
+    # 1. Créer un nom de fichier temporaire unique
+    temp_filename = f"temp_{uuid.uuid4()}.wav"
+    try:
+        # 2. Sauvegarder le fichier reçu sur le disque du serveur
+        async with aiofiles.open(temp_filename, 'wb') as out_file:
+            content = await file.read()
+            await out_file.write(content)
+        # 3. Lancer la reconnaissance
+        model = ai_context["model"]
+        # 'fra' force le modèle à utiliser l'inventaire phonétique français
+        phonemes = model.recognize(temp_filename, lang_id='fra')
+        return {
+            "ipa": phonemes,
+            "filename": file.filename
+        }
+    except Exception as e:
+        print(f"Erreur : {e}")
+        raise HTTPException(status_code=500, detail=str(e))
+    finally:
+        # 4. Nettoyage : Toujours supprimer le fichier temporaire
+        if os.path.exists(temp_filename):
+            os.remove(temp_filename)

download_model.py ADDED Viewed

	@@ -0,0 +1,6 @@

+from allosaurus.app import read_recognizer
+print("⬇️ DÉBUT du téléchargement du modèle Allosaurus...")
+# Cela télécharge le modèle 'uni2005' par défaut (environ 200Mo)
+model = read_recognizer()
+print("✅ FIN du téléchargement. Le modèle est prêt.")

requirements.txt ADDED Viewed

	@@ -0,0 +1,6 @@

+fastapi
+uvicorn
+python-multipart
+aiofiles
+allosaurus
+torch --extra-index-url https://download.pytorch.org/whl/cpu