Cascade-Edge

Sleeping

App Files Files Community

VSPAN commited on Nov 21, 2025

Commit

192a34f

verified ·

1 Parent(s): 8d7d379

Update app.py

Browse files

Files changed (1) hide show

app.py +95 -74

app.py CHANGED Viewed

@@ -2,24 +2,23 @@ import gradio as gr
 import edge_tts
 import asyncio
 import tempfile
-import re
-import emoji
 import os
 import uuid
-# Проверка версии при запуске
-try:
-    print(f"ℹ️ Версия edge-tts: {edge_tts.__version__}")
-except:
-    pass
-# Глобальные переменные
 VOICES_CACHE = []
 LANGUAGES_CACHE = []
-# --- ФУНКЦИИ ---
 def clean_text(text):
     if not text: return ""
     text = re.sub(r'[*_~><]', '', text)
     text = emoji.replace_emoji(text, replace='')
@@ -27,129 +26,151 @@ def clean_text(text):
     return text
 async def load_voices_async():
     global VOICES_CACHE, LANGUAGES_CACHE
     try:
         voices = await edge_tts.list_voices()
         VOICES_CACHE = sorted(voices, key=lambda x: x['Locale'])
-        seen_langs = set()
         for v in VOICES_CACHE:
-            if v['Locale'] not in seen_langs:
-                seen_langs.add(v['Locale'])
                 LANGUAGES_CACHE.append(v['Locale'])
         LANGUAGES_CACHE.sort()
-        print(f"✅ Голоса загружены ({len(VOICES_CACHE)} шт).")
     except Exception as e:
-        print(f"⚠️ Ошибка загрузки списка голосов: {e}")
-        # Фолбэк на случай отсутствия интернета при старте
         LANGUAGES_CACHE = ["ru-RU", "en-US"]
 def filter_voices(language):
     if not language: return gr.Dropdown(choices=[])
-    # Формируем список
     filtered = [f"{v['ShortName']} ({v['Gender']})" for v in VOICES_CACHE if v['Locale'] == language]
-    # Пытаемся найти Дмитрия для русского языка (он идеален для фэнтези)
-    default_voice = None
-    if filtered:
-        default_voice = filtered[0]
-        for v in filtered:
-            if "Dmitry" in v: # Приоритет Дмитрию
-                default_voice = v
-                break
-    return gr.Dropdown(choices=filtered, value=default_voice)
 async def generate_speech(text, voice_str, rate, pitch):
-    if not text.strip(): raise gr.Warning("Напишите текст вашей истории...")
-    if not voice_str: raise gr.Warning("Выберите голос рассказчика.")
     voice_short = voice_str.split(" (")[0]
     clean_input = clean_text(text)
-    # Формируем параметры
     rate_str = f"{rate:+d}%"
     pitch_str = f"{pitch:+d}Hz"
-    filename = f"fantasy_story_{uuid.uuid4().hex}.mp3"
-    output_path = os.path.join(tempfile.gettempdir(), filename)
-    print(f"📖 Читает: {voice_short} | Скорость: {rate_str} | Тон: {pitch_str}")
     try:
         communicate = edge_tts.Communicate(clean_input, voice_short, rate=rate_str, pitch=pitch_str)
-        await communicate.save(output_path)
-        return output_path
     except Exception as e:
-        err = str(e)
-        if "403" in err:
-            raise gr.Error("⚠️ СРОЧНО ОБНОВИТЕ БИБЛИОТЕКУ! В терминале: pip install --upgrade edge-tts")
-        raise gr.Error(f"Ошибка магии: {err}")
-# --- ИНТЕРФЕЙС (Fantasy Style) ---
 asyncio.run(load_voices_async())
 css = """
-body { background-color: #1a1b26; }
 .container { max-width: 900px; margin: auto; }
-.gradio-container { font-family: 'Georgia', serif; }
-h1 { font-family: 'Georgia', serif; color: #d4af37; text-align: center; }
 """
 theme = gr.themes.Soft(
-    primary_hue="amber", # Золотой оттенок для фэнтези
     secondary_hue="slate",
-    neutral_hue="slate",
 )
-with gr.Blocks(theme=theme, css=css, title="Fantasy Storyteller") as demo:
-    gr.Markdown("# 📜 Летописец: Фэнтези Озвучка")
     with gr.Row():
         with gr.Column(scale=1):
-            gr.Markdown("### 🧙‍♂️ Настройки барда")
-            # По умолчанию выбираем Русский
-            lang_dropdown = gr.Dropdown(
-                choices=LANGUAGES_CACHE,
-                value="ru-RU",
-                label="Язык сказания",
                 interactive=True
             )
-            # Ищем Дмитрия в кэше для старта
-            start_voices = [f"{v['ShortName']} ({v['Gender']})" for v in VOICES_CACHE if v['Locale'] == "ru-RU"]
-            dmitry = next((v for v in start_voices if "Dmitry" in v), start_voices[0] if start_voices else None)
-            voice_dropdown = gr.Dropdown(
-                choices=start_voices,
-                value=dmitry,
-                label="Голос",
                 interactive=True
             )
-            with gr.Group():
-                gr.Markdown("*Для эпичности рекомендую скорость -10% и тон -5Hz*")
-                # Дефолтные значения специально под Фэнтези
-                rate_slider = gr.Slider(-50, 50, value=-10, step=1, label="Скорость чтения (%)")
-                pitch_slider = gr.Slider(-20, 20, value=-5, step=1, label="Глубина голоса (Hz)")
         with gr.Column(scale=2):
-            text_input = gr.Textbox(
-                label="Текст легенды",
-                placeholder="В далекой темной пещере, где спал древний дракон...",
-                lines=8,
-                value="Давным-давно, в далекой стране, где горы пронзали небеса, жил древний дракон."
             )
-            btn = gr.Button("✨ Сотворить голос", variant="primary", size="lg")
-            audio_out = gr.Audio(label="Голос рассказчика", type="filepath", autoplay=True)
     # Логика
-    lang_dropdown.change(filter_voices, inputs=lang_dropdown, outputs=voice_dropdown)
-    btn.click(generate_speech, inputs=[text_input, voice_dropdown, rate_slider, pitch_slider], outputs=audio_out)
 if __name__ == "__main__":
     demo.launch()

 import edge_tts
 import asyncio
 import tempfile
 import os
 import uuid
+import re
+import emoji
+from pydub import AudioSegment  # Используем новую библиотеку pydub
+# --- КОНСТАНТЫ И НАСТРОЙКИ ---
+TEMP_DIR = tempfile.gettempdir()
+# Глобальные кэши
 VOICES_CACHE = []
 LANGUAGES_CACHE = []
+# --- ВСПОМОГАТЕЛЬНЫЕ ФУНКЦИИ ---
 def clean_text(text):
+    """Очистка текста от мусора."""
     if not text: return ""
     text = re.sub(r'[*_~><]', '', text)
     text = emoji.replace_emoji(text, replace='')
     return text
 async def load_voices_async():
+    """Загрузка списка голосов при старте."""
     global VOICES_CACHE, LANGUAGES_CACHE
     try:
+        print("🔮 Призыв духов голосов (загрузка списка)...")
         voices = await edge_tts.list_voices()
         VOICES_CACHE = sorted(voices, key=lambda x: x['Locale'])
+        seen = set()
+        LANGUAGES_CACHE = []
         for v in VOICES_CACHE:
+            if v['Locale'] not in seen:
+                seen.add(v['Locale'])
                 LANGUAGES_CACHE.append(v['Locale'])
         LANGUAGES_CACHE.sort()
+        print(f"✅ Успешно! Доступно {len(VOICES_CACHE)} голосов.")
     except Exception as e:
+        print(f"❌ Ошибка загрузки голосов: {e}")
         LANGUAGES_CACHE = ["ru-RU", "en-US"]
 def filter_voices(language):
+    """Фильтр голосов по языку."""
     if not language: return gr.Dropdown(choices=[])
     filtered = [f"{v['ShortName']} ({v['Gender']})" for v in VOICES_CACHE if v['Locale'] == language]
+    # Авто-выбор лучшего голоса для фэнтези (Дмитрий для RU, Гай для EN)
+    default_val = filtered[0] if filtered else None
+    for v in filtered:
+        if "Dmitry" in v or "Guy" in v:
+            default_val = v
+            break
+    return gr.Dropdown(choices=filtered, value=default_val)
 async def generate_speech(text, voice_str, rate, pitch):
+    """Генерация речи с использованием edge-tts и обработка через pydub."""
+    if not text.strip(): raise gr.Warning("Свиток пуст! Напишите текст.")
+    if not voice_str: raise gr.Warning("Выберите рассказчика.")
     voice_short = voice_str.split(" (")[0]
     clean_input = clean_text(text)
+    # Параметры для API
     rate_str = f"{rate:+d}%"
     pitch_str = f"{pitch:+d}Hz"
+    # Имя временного файла
+    filename = f"fantasy_{uuid.uuid4().hex}.mp3"
+    file_path = os.path.join(TEMP_DIR, filename)
+    print(f"🎙️ Озвучка: {voice_short} | Скорость: {rate_str} | Тон: {pitch_str}")
     try:
+        # 1. Генерация через Edge TTS
         communicate = edge_tts.Communicate(clean_input, voice_short, rate=rate_str, pitch=pitch_str)
+        await communicate.save(file_path)
+        # 2. Проверка файла (Pydub)
+        # Мы просто проверяем, что файл валиден и читается библиотекой pydub
+        if os.path.exists(file_path) and os.path.getsize(file_path) > 0:
+            try:
+                audio = AudioSegment.from_mp3(file_path)
+                print(f"✅ Аудио готово. Длительность: {len(audio) / 1000} сек.")
+            except Exception as e:
+                # Если у пользователя нет ffmpeg, pydub может ругаться, но файл всё равно рабочий
+                print(f"⚠️ Pydub warning (не критично): {e}")
+            return file_path
+        else:
+            raise Exception("Файл не создан.")
     except Exception as e:
+        error_msg = str(e)
+        if "403" in error_msg:
+            raise gr.Error("Ошибка 403! Ваша библиотека устарела. Выполните: pip install --upgrade edge-tts")
+        raise gr.Error(f"Ошибка магии: {error_msg}")
+# --- ЗАПУСК ИНТЕРФЕЙСА ---
+# Загружаем голоса перед стартом
 asyncio.run(load_voices_async())
+# Стилизация
 css = """
+body { background-color: #0f172a; }
 .container { max-width: 900px; margin: auto; }
+h1 { color: #fbbf24; text-align: center; font-family: serif; }
+.gradio-container { font-family: 'Merriweather', 'Georgia', serif; }
 """
 theme = gr.themes.Soft(
+    primary_hue="amber",
     secondary_hue="slate",
+    neutral_hue="slate"
 )
+with gr.Blocks(theme=theme, css=css, title="Fantasy TTS v2.0") as demo:
+    gr.Markdown("# 🐉 Легендарный Рассказчик")
     with gr.Row():
+        # Колонка настроек
         with gr.Column(scale=1):
+            gr.Markdown("### 🧙‍♂️ Настройки Голоса")
+            lang_dr = gr.Dropdown(
+                choices=LANGUAGES_CACHE,
+                value="ru-RU",
+                label="Язык Летописи",
                 interactive=True
             )
+            # Предзагрузка списка для русского языка
+            init_voices = [f"{v['ShortName']} ({v['Gender']})" for v in VOICES_CACHE if v['Locale'] == "ru-RU"]
+            # Ищем Дмитрия
+            dmitry = next((v for v in init_voices if "Dmitry" in v), init_voices[0] if init_voices else None)
+            voice_dr = gr.Dropdown(
+                choices=init_voices,
+                value=dmitry,
+                label="Рассказчик",
                 interactive=True
             )
+            with gr.Accordion("🎚️ Тонкая настройка магии", open=True):
+                rate_sl = gr.Slider(-50, 50, value=-10, step=1, label="Скорость (%) - Рекомендую -10")
+                pitch_sl = gr.Slider(-20, 20, value=-5, step=1, label="Высота (Hz) - Рекомендую -5")
+        # Колонка ввода
         with gr.Column(scale=2):
+            gr.Markdown("### 📜 Текст Истории")
+            input_text = gr.Textbox(
+                label="",
+                placeholder="В темные времена, когда драконы правили небесами...",
+                lines=10,
+                value="Давным-давно, в далекой стране, где горы пронзали небеса, жил древний дракон. Его чешуя блестела как золото, а глаза горели огнем вечности."
             )
+            btn = gr.Button("✨ Воплотить в звук", variant="primary", size="lg")
+            output_audio = gr.Audio(label="Результат", type="filepath", autoplay=True)
     # Логика
+    lang_dr.change(filter_voices, inputs=lang_dr, outputs=voice_dr)
+    btn.click(generate_speech, inputs=[input_text, voice_dr, rate_sl, pitch_sl], outputs=output_audio)
 if __name__ == "__main__":
+    print(f"ℹ️ Запуск с версией edge-tts: {edge_tts.__version__}")
     demo.launch()