Spaces:
Running on CPU Upgrade
Running on CPU Upgrade
metadata
title: Wami - Dioula STT & TTS API
emoji: 🎙️
colorFrom: blue
colorTo: green
sdk: docker
app_port: 7860
Wami - API Dioula STT & TTS
API de reconnaissance vocale (Speech-to-Text) et synthèse vocale (Text-to-Speech) en langue Dioula.
🚀 Utilisation
Endpoints disponibles
1. Speech-to-Text (STT)
Transcrit un fichier audio en texte Dioula.
curl -X POST https://votre-space-name.hf.space/api/stt \
-F "audio=@recording.wav"
Réponse:
{
"transcription": "texte transcrit en dioula"
}
2. Text-to-Speech (TTS)
Génère un audio en Dioula depuis du texte.
curl -X POST https://votre-space-name.hf.space/api/tts \
-F "text=na an be do minkɛ" \
-o output.wav
Réponse: Fichier audio WAV
3. Health Check
Vérifie le statut de l'API.
curl https://votre-space-name.hf.space/health
Réponse:
{
"status": "healthy",
"device": "cuda",
"models_loaded": {
"stt": true,
"tts": true
}
}
📖 Documentation interactive
- Swagger UI:
https://votre-space-name.hf.space/docs - ReDoc:
https://votre-space-name.hf.space/redoc
🔧 Modèles utilisés
- STT: facebook/mms-1b-all (adapter Dioula)
- TTS: facebook/mms-tts-dyu
💻 Déploiement local
pip install -r requirements.txt
python app.py
Ouvrez http://localhost:7860
🌍 À propos du Dioula
Le Dioula (code langue: dyu) est une langue mandée parlée principalement en Côte d'Ivoire, au Burkina Faso et au Mali.
📝 Licence
Les modèles utilisés sont sous licence Apache 2.0. Voir les pages des modèles pour plus de détails.