voice-agent-livekit / README.md
sitsope's picture
Upgrade Whisper small → medium for better French STT accuracy
0c51c30
metadata
title: Voice Agent LiveKit
emoji: 🎙️
colorFrom: indigo
colorTo: purple
sdk: docker
app_port: 7860
pinned: false
license: mit
short_description: Voice agent LiveKit + GPT-4o + Whisper
tags:
  - voice
  - livekit
  - speech
  - openai
  - gradio

🎙️ Voice Agent — LiveKit + GPT-4o

Assistant vocal temps réel : parlez dans le micro, l'agent vous répond avec une voix synthétique.

Architecture

Navigateur (micro WebRTC)
        │
        ▼
  LiveKit Server ◄──── LiveKit Agent (Python)
                              │
               ┌──────────────┼──────────────┐
               ▼              ▼              ▼
          STT local       LLM Azure        TTS Azure
       (Whisper medium)   (GPT-4o)          (TTS)

Variables d'environnement (Secrets)

À configurer dans Settings → Variables and Secrets du Space :

Variable Description
LIVEKIT_URL wss://xxx.livekit.cloud
LIVEKIT_API_KEY Clé API LiveKit
LIVEKIT_API_SECRET Secret LiveKit
AZURE_OPENAI_API_KEY Clé Azure OpenAI
AZURE_OPENAI_ENDPOINT Endpoint Azure OpenAI
AZURE_OPENAI_MODEL Nom du déploiement GPT-4o
OPENAI_API_VERSION Version API (ex: 2024-12-01-preview)
AZURE_TTS_DEPLOYMENT Nom du déploiement TTS
AZURE_TTS_VOICE Voix TTS (ex: alloy)
WHISPER_LOCAL_MODEL Modèle Whisper (tiny/base/small)