--- title: MP3 Segmentation AI emoji: 🎙️ colorFrom: blue colorTo: purple sdk: docker pinned: false license: mit app_port: 7860 --- # Segmentation de MP3 par IA avec Gemini Cette application web permet d'effectuer une segmentation des locuteurs (diarisation) sur des fichiers MP3 directement dans le navigateur, en utilisant l'API puissante de Google Gemini (2.5 Flash, Pro ou 3.0). ## Architecture L'application repose sur une architecture moderne : * **Frontend :** React + Vite + TypeScript (Interface utilisateur). * **Backend :** FastAPI (Python) sert l'application statique et permet la compatibilité avec les environnements de déploiement cloud comme Hugging Face Spaces. * **IA :** Google Gemini API (via `@google/genai`). --- ## 🚀 Déploiement sur Hugging Face Spaces ### Méthode Space Docker (Recommandée) 🏆 1. Allez sur [Hugging Face Spaces](https://huggingface.co/spaces) et cliquez sur **Create new Space**. 2. Entrez un nom pour votre Space. 3. **IMPORTANT** : Choisissez **Docker** comme SDK. 4. Cliquez sur **Create Space**. 5. Allez dans l'onglet **Files** et cliquez sur **Add file > Upload files**. 6. Envoyez tous les fichiers de ce projet (y compris `Dockerfile`, `app.py`, `package.json`, etc.). 7. Cliquez sur **Commit changes**. Hugging Face va automatiquement construire et lancer l'application. ## Sécurité et API Key Cette application fonctionne sur le principe "Bring Your Own Key". La clé API Google Gemini est saisie par l'utilisateur dans le navigateur et n'est **jamais stockée** sur le serveur. Elle transite directement du navigateur vers les serveurs de Google.