Spaces:

dieumercimvemba
/

dm

Sleeping

App Files Files Community

dieumercimvemba commited on Nov 24, 2025

Commit

b48943d

verified ·

1 Parent(s): 9219345

Update data/generate_audio.py

Browse files

Files changed (1) hide show

data/generate_audio.py +32 -15

data/generate_audio.py CHANGED Viewed

@@ -1,30 +1,47 @@
 import sys
 import torch
 import soundfile as sf
 from transformers import VitsModel, AutoTokenizer
-# Le texte est passé en argument de ligne de commande
-text = sys.argv[1]
-# Charger le modèle et le tokenizer (utiliser un modèle léger et rapide)
-# Vous pouvez choisir un autre modèle si vous préférez une voix différente
-model = VitsModel.from_pretrained("facebook/mms-tts-fra")
-tokenizer = AutoTokenizer.from_pretrained("facebook/mms-tts-fra")
-# Utiliser le GPU si disponible (pour la vitesse)
-device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model.to(device)
-# 1. Tokenisation du texte
 inputs = tokenizer(text, return_tensors="pt").to(device)
-# 2. Génération de la parole
-with torch.no_grad():
-    output = model(**inputs).waveform.float()
-# 3. Sauvegarder l'audio
-# L'audio est sauvegardé dans le format WAV nécessaire au nœud FFmpeg suivant
 output_file = "generated_audio.wav"
 sf.write(output_file, output.cpu().numpy(), model.config.sampling_rate)
-print(f"Audio generated successfully: {output_file}")

+# Fichier: /data/generate_audio.py
 import sys
 import torch
 import soundfile as sf
 from transformers import VitsModel, AutoTokenizer
+# 1. Vérifie si le texte est fourni en argument
+if len(sys.argv) < 2:
+    # Affiche l'erreur sur la sortie d'erreur (stderr) pour n8n
+    print("Usage: python3 generate_audio.py \"Votre texte ici\"", file=sys.stderr)
+    sys.exit(1)
+# Le premier argument est le texte à synthétiser
+# Nous utilisons une substitution simple pour les guillemets internes
+text = sys.argv[1].replace('"', '')
+# 2. Charger le modèle et le tokenizer (TTS Français)
+# Utilisation du CPU par défaut pour les Spaces gratuits
+try:
+    model = VitsModel.from_pretrained("facebook/mms-tts-fra")
+    tokenizer = AutoTokenizer.from_pretrained("facebook/mms-tts-fra")
+except Exception as e:
+    print(f"Erreur de chargement du modèle : {e}", file=sys.stderr)
+    sys.exit(1)
+# Définir l'appareil (CPU uniquement)
+device = torch.device("cpu")
 model.to(device)
+# 3. Génération de l'audio
 inputs = tokenizer(text, return_tensors="pt").to(device)
+try:
+    with torch.no_grad():
+        output = model(**inputs).waveform.float()
+except Exception as e:
+    print(f"Erreur de génération du waveform : {e}", file=sys.stderr)
+    sys.exit(1)
+# 4. Sauvegarde de l'audio dans le répertoire de travail /data
 output_file = "generated_audio.wav"
+# Utiliser output_file seulement (car /data est déjà le WORKDIR)
 sf.write(output_file, output.cpu().numpy(), model.config.sampling_rate)
+# 5. Imprimer le chemin complet du fichier (utile pour n8n)
+# Nous retournons le chemin d'accès au fichier pour les nœuds suivants
+print(f"/data/{output_file}")