Spaces:

omarbajouk
/

CapsulesVideo

Sleeping

App Files Files Community

omarbajouk commited on Oct 26, 2025

Commit

f58942a

verified ·

1 Parent(s): c4fb151

Update app.py

Browse files

Files changed (1) hide show

app.py +49 -9

app.py CHANGED Viewed

@@ -96,18 +96,34 @@ def _get_kokoro():
         kokoro_pipeline = pipeline("text-to-speech", model="onnx-community/Kokoro-82M-v1.0-ONNX")
     return kokoro_pipeline
-def tts_kokoro(text: str, langue: str = "fr") -> str:
     import soundfile as sf
     out = os.path.join(TMP_DIR, f"kokoro_{uuid.uuid4().hex}.wav")
     try:
         kokoro = _get_kokoro()
-        result = kokoro(text)
         sf.write(out, result["audio"], result["sampling_rate"])
         return out
     except Exception as e:
-        # Fallback gTTS si problème
         return tts_gtts(text, lang=langue)
 def tts_gtts(text: str, lang: str = "fr") -> str:
     from gtts import gTTS
     out = os.path.join(TMP_DIR, f"gtts_{uuid.uuid4().hex}.mp3")
@@ -303,11 +319,15 @@ def build_capsule(titre, sous_titre, texte_voix, texte_ecran, theme,
                   fond_mode="plein écran",
                   image_presentateur=None, voix_type="Féminine",
                   position_presentateur="bottom-right", plein=False,
-                  moteur_voix="Kokoro (HuggingFace, offline)", langue="fr"):
     # 1) TTS
     engine = "Kokoro" if moteur_voix.startswith("Kokoro") else ("gTTS" if moteur_voix.startswith("gTTS") else "Kokoro")
-    audio_mp = tts_kokoro(texte_voix, langue=langue) if engine == "Kokoro" else tts_gtts(texte_voix, lang=langue)
     audio_wav = _normalize_audio_to_wav(audio_mp)
     # 2) Fond (PIL)
@@ -449,7 +469,25 @@ with gr.Blocks(title="Créateur de Capsules CPAS – SadTalker + Kokoro",
                 titre = gr.Textbox(label="Titre", value="Aide médicale urgente / Dringende medische hulp")
                 sous_titre = gr.Textbox(label="Sous-titre", value="Soins accessibles à tous / Toegankelijke zorg voor iedereen")
                 theme = gr.Radio(list(THEMES.keys()), label="Thème", value="Bleu Professionnel")
-                langue = gr.Radio(["fr","nl"], label="Langue de la voix", value="fr")
                 voix_type = gr.Radio(["Féminine","Masculine"], label="Voix IA", value="Féminine")
                 moteur_voix = gr.Radio(
                     ["Kokoro (HuggingFace, offline)", "gTTS (en ligne)"],
@@ -489,12 +527,12 @@ with gr.Blocks(title="Créateur de Capsules CPAS – SadTalker + Kokoro",
         sortie_finale = gr.Video(label="Vidéo finale")
         btn_asm.click(lambda: assemble_final(), [], [sortie_finale, message])
-    def creer_capsule_ui(t, st, tv, te, th, img, fmode, logo, pos_logo, ip, vx, pos_p, plein, motor, lang):
         try:
             vid, msg, srt = build_capsule(t, st, tv, te, th,
                                           img, logo, pos_logo, fmode,
                                           ip, vx, pos_p, plein,
-                                          motor, lang)
             return vid, srt, msg, table_capsules()
         except Exception as e:
             return None, None, f"❌ Erreur: {e}\n\n{traceback.format_exc()}", table_capsules()
@@ -504,9 +542,11 @@ with gr.Blocks(title="Créateur de Capsules CPAS – SadTalker + Kokoro",
         [titre, sous_titre, texte_voix, texte_ecran, theme,
          image_fond, fond_mode, logo_path, logo_pos,
          image_presentateur, voix_type, position_presentateur,
-         plein, moteur_voix, langue],
         [sortie, srt_out, statut, liste]
     )
 if __name__ == "__main__":
     demo.launch()

         kokoro_pipeline = pipeline("text-to-speech", model="onnx-community/Kokoro-82M-v1.0-ONNX")
     return kokoro_pipeline
+def get_kokoro_voices(lang="fr"):
+    """Retourne la liste des speakers Kokoro disponibles pour une langue."""
+    try:
+        from transformers import AutoProcessor
+        model_id = "onnx-community/Kokoro-82M-v1.0-ONNX"
+        processor = AutoProcessor.from_pretrained(model_id)
+        voices = sorted([v for v in processor.speakers if v.startswith(lang)])
+        return voices
+    except Exception as e:
+        print(f"[Kokoro] Impossible de charger les voix ({e})")
+        return []
+def tts_kokoro(text: str, langue: str = "fr", speaker: Optional[str] = None) -> str:
     import soundfile as sf
     out = os.path.join(TMP_DIR, f"kokoro_{uuid.uuid4().hex}.wav")
     try:
         kokoro = _get_kokoro()
+        args = {"text": text}
+        if speaker:
+            args["speaker_id"] = speaker
+        result = kokoro(**args)
         sf.write(out, result["audio"], result["sampling_rate"])
         return out
     except Exception as e:
+        print(f"[Kokoro] Erreur TTS: {e}")
         return tts_gtts(text, lang=langue)
 def tts_gtts(text: str, lang: str = "fr") -> str:
     from gtts import gTTS
     out = os.path.join(TMP_DIR, f"gtts_{uuid.uuid4().hex}.mp3")
                   fond_mode="plein écran",
                   image_presentateur=None, voix_type="Féminine",
                   position_presentateur="bottom-right", plein=False,
+                  moteur_voix="Kokoro (HuggingFace, offline)", langue="fr",speaker=None):
     # 1) TTS
     engine = "Kokoro" if moteur_voix.startswith("Kokoro") else ("gTTS" if moteur_voix.startswith("gTTS") else "Kokoro")
+    audio_mp = (
+        tts_kokoro(texte_voix, langue=langue, speaker=speaker)
+        if engine == "Kokoro"
+        else tts_gtts(texte_voix, lang=langue)
+    )
     audio_wav = _normalize_audio_to_wav(audio_mp)
     # 2) Fond (PIL)
                 titre = gr.Textbox(label="Titre", value="Aide médicale urgente / Dringende medische hulp")
                 sous_titre = gr.Textbox(label="Sous-titre", value="Soins accessibles à tous / Toegankelijke zorg voor iedereen")
                 theme = gr.Radio(list(THEMES.keys()), label="Thème", value="Bleu Professionnel")
+                langue = gr.Radio(["fr", "nl"], label="Langue de la voix", value="fr")
+                def maj_voix(lang):
+                    try:
+                        voices = get_kokoro_voices(lang)
+                        if not voices:
+                            return gr.update(choices=["(aucune disponible)"], value="(aucune disponible)")
+                        return gr.update(choices=voices, value=voices[0])
+                    except Exception as e:
+                        return gr.update(choices=[], value=None)
+                speaker_id = gr.Dropdown(
+                    label="👤 Voix / Speaker Kokoro",
+                    choices=get_kokoro_voices("fr"),
+                    value=None
+                )
+                langue.change(maj_voix, [langue], [speaker_id])
                 voix_type = gr.Radio(["Féminine","Masculine"], label="Voix IA", value="Féminine")
                 moteur_voix = gr.Radio(
                     ["Kokoro (HuggingFace, offline)", "gTTS (en ligne)"],
         sortie_finale = gr.Video(label="Vidéo finale")
         btn_asm.click(lambda: assemble_final(), [], [sortie_finale, message])
+    def creer_capsule_ui(t, st, tv, te, th, img, fmode, logo, pos_logo, ip, vx, pos_p, plein, motor, lang, speaker):
         try:
             vid, msg, srt = build_capsule(t, st, tv, te, th,
                                           img, logo, pos_logo, fmode,
                                           ip, vx, pos_p, plein,
+                                          motor, lang, speaker=speaker)
             return vid, srt, msg, table_capsules()
         except Exception as e:
             return None, None, f"❌ Erreur: {e}\n\n{traceback.format_exc()}", table_capsules()
         [titre, sous_titre, texte_voix, texte_ecran, theme,
          image_fond, fond_mode, logo_path, logo_pos,
          image_presentateur, voix_type, position_presentateur,
+         plein, moteur_voix, langue, speaker_id],
         [sortie, srt_out, statut, liste]
     )
 if __name__ == "__main__":
     demo.launch()