voice-agent-livekit / README.md
sitsope's picture
Upgrade Whisper small → medium for better French STT accuracy
0c51c30
---
title: Voice Agent LiveKit
emoji: 🎙️
colorFrom: indigo
colorTo: purple
sdk: docker
app_port: 7860
pinned: false
license: mit
short_description: Voice agent LiveKit + GPT-4o + Whisper
tags:
- voice
- livekit
- speech
- openai
- gradio
---
# 🎙️ Voice Agent — LiveKit + GPT-4o
Assistant vocal temps réel : parlez dans le micro, l'agent vous répond avec une voix synthétique.
## Architecture
```
Navigateur (micro WebRTC)
LiveKit Server ◄──── LiveKit Agent (Python)
┌──────────────┼──────────────┐
▼ ▼ ▼
STT local LLM Azure TTS Azure
(Whisper medium) (GPT-4o) (TTS)
```
## Variables d'environnement (Secrets)
À configurer dans **Settings → Variables and Secrets** du Space :
| Variable | Description |
|---|---|
| `LIVEKIT_URL` | `wss://xxx.livekit.cloud` |
| `LIVEKIT_API_KEY` | Clé API LiveKit |
| `LIVEKIT_API_SECRET` | Secret LiveKit |
| `AZURE_OPENAI_API_KEY` | Clé Azure OpenAI |
| `AZURE_OPENAI_ENDPOINT` | Endpoint Azure OpenAI |
| `AZURE_OPENAI_MODEL` | Nom du déploiement GPT-4o |
| `OPENAI_API_VERSION` | Version API (ex: 2024-12-01-preview) |
| `AZURE_TTS_DEPLOYMENT` | Nom du déploiement TTS |
| `AZURE_TTS_VOICE` | Voix TTS (ex: alloy) |
| `WHISPER_LOCAL_MODEL` | Modèle Whisper (tiny/base/small) |