pierreguillou's picture
Update README.md
8e0f97f verified

A newer version of the Gradio SDK is available: 6.1.0

Upgrade
metadata
title: Conversion Audio Vers Mp3
emoji: 📈
colorFrom: yellow
colorTo: blue
sdk: gradio
sdk_version: 5.44.0
app_file: app.py
pinned: false

App de Transcrição + Saída MP3 (HF Spaces)

Esta aplicação:

  • Recebe um arquivo de áudio (opus, wav, mp3, m4a, etc.).
  • Detecta idioma automaticamente (Whisper tiny + langdetect).
  • Transcreve com Whisper (modelo configurável no código).
  • (Opcional) Faz diarização por locutor com pyannote (requer HF_TOKEN).
  • Gera SEMPRE um arquivo .mp3 de saída com o mesmo nome do arquivo de entrada:
    • Pode ouvir diretamente no player.
    • Pode baixar o arquivo .mp3.

Dependências

  • Ver requirements.txt.
  • Necessário ffmpeg instalado no sistema para conversões do pydub.
  • Para diarização (pyannote), defina a variável de ambiente HF_TOKEN com um token válido do Hugging Face.

Como usar

  1. Faça upload do arquivo de áudio.
  2. (Opcional) Ajuste o idioma ou deixe em auto.
  3. (Opcional) Ative diarização.
  4. Clique em "Transcrever".
  5. Veja as transcrições e baixe/ouça o MP3 gerado (mesmo nome do arquivo original, extensão .mp3).

Observações

  • Se HF_TOKEN não estiver definido, a diarização ficará desativada, mas a transcrição e a geração do MP3 funcionarão normalmente.
  • O MP3 é derivado do áudio de entrada convertido para WAV mono 16 kHz para padronização.