Spaces:
Build error
Build error
metadata
title: MP3 Segmentation AI
emoji: 🎙️
colorFrom: blue
colorTo: purple
sdk: docker
pinned: false
license: mit
app_port: 7860
Segmentation de MP3 par IA avec Gemini
Cette application web permet d'effectuer une segmentation des locuteurs (diarisation) sur des fichiers MP3 directement dans le navigateur, en utilisant l'API puissante de Google Gemini (2.5 Flash, Pro ou 3.0).
Architecture
L'application repose sur une architecture moderne :
- Frontend : React + Vite + TypeScript (Interface utilisateur).
- Backend : FastAPI (Python) sert l'application statique et permet la compatibilité avec les environnements de déploiement cloud comme Hugging Face Spaces.
- IA : Google Gemini API (via
@google/genai).
🚀 Déploiement sur Hugging Face Spaces
Méthode Space Docker (Recommandée) 🏆
- Allez sur Hugging Face Spaces et cliquez sur Create new Space.
- Entrez un nom pour votre Space.
- IMPORTANT : Choisissez Docker comme SDK.
- Cliquez sur Create Space.
- Allez dans l'onglet Files et cliquez sur Add file > Upload files.
- Envoyez tous les fichiers de ce projet (y compris
Dockerfile,app.py,package.json, etc.). - Cliquez sur Commit changes.
Hugging Face va automatiquement construire et lancer l'application.
Sécurité et API Key
Cette application fonctionne sur le principe "Bring Your Own Key". La clé API Google Gemini est saisie par l'utilisateur dans le navigateur et n'est jamais stockée sur le serveur. Elle transite directement du navigateur vers les serveurs de Google.