Spaces:

stephane09
/

segmentation-gemini

Build error

App Files Files Community

segmentation-gemini / README.md

stephane09

Update README.md

dc43597 verified 3 months ago

preview code

raw

history blame contribute delete

1.64 kB

	---
	title: MP3 Segmentation AI
	emoji: 🎙️
	colorFrom: blue
	colorTo: purple
	sdk: docker
	pinned: false
	license: mit
	app_port: 7860
	---

	# Segmentation de MP3 par IA avec Gemini

	Cette application web permet d'effectuer une segmentation des locuteurs (diarisation) sur des fichiers MP3 directement dans le navigateur, en utilisant l'API puissante de Google Gemini (2.5 Flash, Pro ou 3.0).

	## Architecture

	L'application repose sur une architecture moderne :
	* Frontend : React + Vite + TypeScript (Interface utilisateur).
	* Backend : FastAPI (Python) sert l'application statique et permet la compatibilité avec les environnements de déploiement cloud comme Hugging Face Spaces.
	* IA : Google Gemini API (via `@google/genai`).

	---

	## 🚀 Déploiement sur Hugging Face Spaces

	### Méthode Space Docker (Recommandée) 🏆

	1. Allez sur [Hugging Face Spaces](https://huggingface.co/spaces) et cliquez sur Create new Space.
	2. Entrez un nom pour votre Space.
	3. IMPORTANT : Choisissez Docker comme SDK.
	4. Cliquez sur Create Space.
	5. Allez dans l'onglet Files et cliquez sur Add file > Upload files.
	6. Envoyez tous les fichiers de ce projet (y compris `Dockerfile`, `app.py`, `package.json`, etc.).
	7. Cliquez sur Commit changes.

	Hugging Face va automatiquement construire et lancer l'application.

	## Sécurité et API Key

	Cette application fonctionne sur le principe "Bring Your Own Key". La clé API Google Gemini est saisie par l'utilisateur dans le navigateur et n'est jamais stockée sur le serveur. Elle transite directement du navigateur vers les serveurs de Google.