segmentation-gemini / README.md
stephane09's picture
Update README.md
dc43597 verified
---
title: MP3 Segmentation AI
emoji: 🎙️
colorFrom: blue
colorTo: purple
sdk: docker
pinned: false
license: mit
app_port: 7860
---
# Segmentation de MP3 par IA avec Gemini
Cette application web permet d'effectuer une segmentation des locuteurs (diarisation) sur des fichiers MP3 directement dans le navigateur, en utilisant l'API puissante de Google Gemini (2.5 Flash, Pro ou 3.0).
## Architecture
L'application repose sur une architecture moderne :
* **Frontend :** React + Vite + TypeScript (Interface utilisateur).
* **Backend :** FastAPI (Python) sert l'application statique et permet la compatibilité avec les environnements de déploiement cloud comme Hugging Face Spaces.
* **IA :** Google Gemini API (via `@google/genai`).
---
## 🚀 Déploiement sur Hugging Face Spaces
### Méthode Space Docker (Recommandée) 🏆
1. Allez sur [Hugging Face Spaces](https://huggingface.co/spaces) et cliquez sur **Create new Space**.
2. Entrez un nom pour votre Space.
3. **IMPORTANT** : Choisissez **Docker** comme SDK.
4. Cliquez sur **Create Space**.
5. Allez dans l'onglet **Files** et cliquez sur **Add file > Upload files**.
6. Envoyez tous les fichiers de ce projet (y compris `Dockerfile`, `app.py`, `package.json`, etc.).
7. Cliquez sur **Commit changes**.
Hugging Face va automatiquement construire et lancer l'application.
## Sécurité et API Key
Cette application fonctionne sur le principe "Bring Your Own Key". La clé API Google Gemini est saisie par l'utilisateur dans le navigateur et n'est **jamais stockée** sur le serveur. Elle transite directement du navigateur vers les serveurs de Google.