A newer version of the Gradio SDK is available:
6.1.0
metadata
title: Conversion Audio Vers Mp3
emoji: 📈
colorFrom: yellow
colorTo: blue
sdk: gradio
sdk_version: 5.44.0
app_file: app.py
pinned: false
App de Transcrição + Saída MP3 (HF Spaces)
Esta aplicação:
- Recebe um arquivo de áudio (opus, wav, mp3, m4a, etc.).
- Detecta idioma automaticamente (Whisper tiny + langdetect).
- Transcreve com Whisper (modelo configurável no código).
- (Opcional) Faz diarização por locutor com pyannote (requer HF_TOKEN).
- Gera SEMPRE um arquivo .mp3 de saída com o mesmo nome do arquivo de entrada:
- Pode ouvir diretamente no player.
- Pode baixar o arquivo .mp3.
Dependências
- Ver
requirements.txt. - Necessário
ffmpeginstalado no sistema para conversões dopydub. - Para diarização (pyannote), defina a variável de ambiente
HF_TOKENcom um token válido do Hugging Face.
Como usar
- Faça upload do arquivo de áudio.
- (Opcional) Ajuste o idioma ou deixe em
auto. - (Opcional) Ative diarização.
- Clique em "Transcrever".
- Veja as transcrições e baixe/ouça o MP3 gerado (mesmo nome do arquivo original, extensão
.mp3).
Observações
- Se
HF_TOKENnão estiver definido, a diarização ficará desativada, mas a transcrição e a geração do MP3 funcionarão normalmente. - O MP3 é derivado do áudio de entrada convertido para WAV mono 16 kHz para padronização.