Cascade-Edge

Sleeping

App Files Files Community

VSPAN commited on Nov 21, 2025

Commit

9795009

verified ·

1 Parent(s): b6e79a7

Update app.py

Browse files

Files changed (1) hide show

app.py +78 -141

app.py CHANGED Viewed

@@ -1,218 +1,155 @@
 import gradio as gr
 import edge_tts
-import tempfile
-import os
-import uuid
 import asyncio
 import re
 import emoji
-# --- КОНФИГУРАЦИЯ ---
-TEMP_DIR = tempfile.gettempdir()
-# Глобальные переменные для хранения списка голосов
 VOICES_CACHE = []
 LANGUAGES_CACHE = []
-# --- ВСПОМОГАТЕЛЬНЫЕ ФУНКЦИИ ---
 def clean_text(text):
-    """
-    Очистка текста для предотвращения ошибок парсера Microsoft.
-    """
-    if not text:
-        return ""
-    # Убираем символы, которые могут ломать SSML
     text = re.sub(r'[*_~><]', '', text)
-    # Убираем эмодзи (библиотека emoji 2.6.0)
     text = emoji.replace_emoji(text, replace='')
-    # Убираем лишние пробелы
     text = re.sub(r'\s+', ' ', text).strip()
     return text
-async def get_voices_async():
-    """
-    Асинхронная загрузка голосов и формирование структуры языков.
-    """
     global VOICES_CACHE, LANGUAGES_CACHE
     try:
         voices = await edge_tts.list_voices()
-        # Сортируем голоса
         VOICES_CACHE = sorted(voices, key=lambda x: x['Locale'])
-        # Формируем список уникальных языков
         seen_langs = set()
-        LANGUAGES_CACHE = []
         for v in VOICES_CACHE:
             if v['Locale'] not in seen_langs:
                 seen_langs.add(v['Locale'])
                 LANGUAGES_CACHE.append(v['Locale'])
         LANGUAGES_CACHE.sort()
-        print(f"✅ Успешно загружено {len(VOICES_CACHE)} голосов.")
     except Exception as e:
-        print(f"⚠️ Ошибка загрузки голосов: {e}")
-        # Фолбэк значения, если интернет недоступен при старте
-        LANGUAGES_CACHE = ["en-US", "ru-RU"]
 def filter_voices(language):
-    """
-    Фильтрация голосов при выборе языка в интерфейсе.
-    """
-    if not language:
-        return gr.Dropdown(choices=[], value=None)
-    # Формируем читаемый список: "Name (Gender)"
     filtered = [f"{v['ShortName']} ({v['Gender']})" for v in VOICES_CACHE if v['Locale'] == language]
-    # Возвращаем обновленный дропдаун с первым значением по умолчанию
-    return gr.Dropdown(choices=filtered, value=filtered[0] if filtered else None)
 async def generate_speech(text, voice_str, rate, pitch):
-    """
-    Главная функция генерации (Async).
-    Gradio 4.x отлично работает с async def.
-    """
-    if not text or not text.strip():
-        raise gr.Warning("Пожалуйста, введите текст.")
-    if not voice_str:
-        raise gr.Warning("Пожалуйста, выберите голос.")
-    # Извлекаем "ShortName" из строки вида "ru-RU-DmitryNeural (Male)"
     voice_short = voice_str.split(" (")[0]
-    # Подготовка параметров
     clean_input = clean_text(text)
     rate_str = f"{rate:+d}%"
     pitch_str = f"{pitch:+d}Hz"
-    # Уникальное имя файла (решает проблемы с кэшем браузера и доступом)
-    filename = f"audio_{uuid.uuid4().hex}.mp3"
-    file_path = os.path.join(TEMP_DIR, filename)
-    print(f"🔄 Генерация: {voice_short} | Скорость: {rate_str}")
     try:
-        # Создаем объект Communicate (версия 6.1.12)
         communicate = edge_tts.Communicate(clean_input, voice_short, rate=rate_str, pitch=pitch_str)
-        # Сохраняем файл
-        await communicate.save(file_path)
-        # Проверяем результат
-        if os.path.exists(file_path) and os.path.getsize(file_path) > 0:
-            return file_path
-        else:
-            raise Exception("Файл создан, но он пуст.")
     except Exception as e:
-        error_message = str(e)
-        print(f"❌ Ошибка: {error_message}")
-        if "403" in error_message:
-            raise gr.Error(
-                "Ошибка 403: Microsoft заблокировал доступ для вашей версии библиотеки. "
-                "Это не ошибка кода, это ограничение API для версии 6.1.12."
-            )
-        else:
-            raise gr.Error(f"Ошибка генерации: {error_message}")
-# --- ИНТЕРФЕЙС GRADIO (BLOCKS) ---
-# Предзагрузка голосов перед запуском интерфейса
-asyncio.run(get_voices_async())
-# CSS для красоты
 css = """
 .container { max-width: 900px; margin: auto; }
-footer { display: none !important; }
 """
-# Тема интерфейса
 theme = gr.themes.Soft(
-    primary_hue="blue",
     neutral_hue="slate",
-    radius_size="md"
 )
-with gr.Blocks(theme=theme, css=css, title="Edge TTS Pro") as demo:
     with gr.Row():
-        gr.Markdown(
-            """
-            # 🎧 Edge TTS Generator
-            ### Качественный синтез речи (версия 6.1.12)
-            """
-        )
-    with gr.Row():
-        # Левая колонка: Настройки
-        with gr.Column(scale=1, min_width=300):
-            gr.Markdown("### ⚙️ Настройки голоса")
-            # Выбор языка
             lang_dropdown = gr.Dropdown(
                 choices=LANGUAGES_CACHE,
-                value="ru-RU" if "ru-RU" in LANGUAGES_CACHE else None,
-                label="1. Язык",
                 interactive=True
             )
-            # Выбор голоса (заполняется динамически)
-            # Инициализируем начальным списком для выбранного языка
-            initial_voices = []
-            if lang_dropdown.value:
-                initial_voices = [f"{v['ShortName']} ({v['Gender']})" for v in VOICES_CACHE if v['Locale'] == lang_dropdown.value]
             voice_dropdown = gr.Dropdown(
-                choices=initial_voices,
-                value=initial_voices[0] if initial_voices else None,
-                label="2. Голос",
                 interactive=True
             )
-            # Слайдеры в аккордеоне для компактности
-            with gr.Accordion("Дополнительно", open=True):
-                rate_slider = gr.Slider(minimum=-50, maximum=50, value=0, step=1, label="Скорость речи (%)")
-                pitch_slider = gr.Slider(minimum=-20, maximum=20, value=0, step=1, label="Тон голоса (Hz)")
-        # Правая колонка: Ввод и Результат
         with gr.Column(scale=2):
-            gr.Markdown("### 📝 Текст")
             text_input = gr.Textbox(
-                label="Введите текст для озвучивания",
-                placeholder="Привет! Как твои дела?",
-                lines=6,
-                max_lines=20
             )
-            generate_btn = gr.Button("🚀 Создать аудио", variant="primary", size="lg")
-            gr.Markdown("### 🔊 Результат")
-            audio_output = gr.Audio(
-                label="Сгенерированный файл",
-                type="filepath",
-                interactive=False,
-                autoplay=True
-            )
-    # --- ЛОГИКА СОБЫТИЙ ---
-    # 1. При смене языка обновляем список голосов
-    lang_dropdown.change(
-        fn=filter_voices,
-        inputs=[lang_dropdown],
-        outputs=[voice_dropdown]
-    )
-    # 2. При нажатии кнопки генерируем (Gradio 4.x сам обработает async)
-    generate_btn.click(
-        fn=generate_speech,
-        inputs=[text_input, voice_dropdown, rate_slider, pitch_slider],
-        outputs=[audio_output]
-    )
-# Запуск приложения
 if __name__ == "__main__":
     demo.launch()

 import gradio as gr
 import edge_tts
 import asyncio
+import tempfile
 import re
 import emoji
+import os
+import uuid
+# Проверка версии при запуске
+try:
+    print(f"ℹ️ Версия edge-tts: {edge_tts.__version__}")
+except:
+    pass
+# Глобальные переменные
 VOICES_CACHE = []
 LANGUAGES_CACHE = []
+# --- ФУНКЦИИ ---
 def clean_text(text):
+    if not text: return ""
     text = re.sub(r'[*_~><]', '', text)
     text = emoji.replace_emoji(text, replace='')
     text = re.sub(r'\s+', ' ', text).strip()
     return text
+async def load_voices_async():
     global VOICES_CACHE, LANGUAGES_CACHE
     try:
         voices = await edge_tts.list_voices()
         VOICES_CACHE = sorted(voices, key=lambda x: x['Locale'])
         seen_langs = set()
         for v in VOICES_CACHE:
             if v['Locale'] not in seen_langs:
                 seen_langs.add(v['Locale'])
                 LANGUAGES_CACHE.append(v['Locale'])
         LANGUAGES_CACHE.sort()
+        print(f"✅ Голоса загружены ({len(VOICES_CACHE)} шт).")
     except Exception as e:
+        print(f"⚠️ Ошибка загрузки списка голосов: {e}")
+        # Фолбэк на случай отсутствия интернета при старте
+        LANGUAGES_CACHE = ["ru-RU", "en-US"]
 def filter_voices(language):
+    if not language: return gr.Dropdown(choices=[])
+    # Формируем список
     filtered = [f"{v['ShortName']} ({v['Gender']})" for v in VOICES_CACHE if v['Locale'] == language]
+    # Пытаемся найти Дмитрия для русского языка (он идеален для фэнтези)
+    default_voice = None
+    if filtered:
+        default_voice = filtered[0]
+        for v in filtered:
+            if "Dmitry" in v: # Приоритет Дмитрию
+                default_voice = v
+                break
+    return gr.Dropdown(choices=filtered, value=default_voice)
 async def generate_speech(text, voice_str, rate, pitch):
+    if not text.strip(): raise gr.Warning("Напишите текст вашей истории...")
+    if not voice_str: raise gr.Warning("Выберите голос рассказчика.")
     voice_short = voice_str.split(" (")[0]
     clean_input = clean_text(text)
+    # Формируем параметры
     rate_str = f"{rate:+d}%"
     pitch_str = f"{pitch:+d}Hz"
+    filename = f"fantasy_story_{uuid.uuid4().hex}.mp3"
+    output_path = os.path.join(tempfile.gettempdir(), filename)
+    print(f"📖 Читает: {voice_short} | Скорость: {rate_str} | Тон: {pitch_str}")
     try:
         communicate = edge_tts.Communicate(clean_input, voice_short, rate=rate_str, pitch=pitch_str)
+        await communicate.save(output_path)
+        return output_path
     except Exception as e:
+        err = str(e)
+        if "403" in err:
+            raise gr.Error("⚠️ СРОЧНО ОБНОВИТЕ БИБЛИОТЕКУ! В терминале: pip install --upgrade edge-tts")
+        raise gr.Error(f"Ошибка магии: {err}")
+# --- ИНТЕРФЕЙС (Fantasy Style) ---
+asyncio.run(load_voices_async())
 css = """
+body { background-color: #1a1b26; }
 .container { max-width: 900px; margin: auto; }
+.gradio-container { font-family: 'Georgia', serif; }
+h1 { font-family: 'Georgia', serif; color: #d4af37; text-align: center; }
 """
 theme = gr.themes.Soft(
+    primary_hue="amber", # Золотой оттенок для фэнтези
+    secondary_hue="slate",
     neutral_hue="slate",
 )
+with gr.Blocks(theme=theme, css=css, title="Fantasy Storyteller") as demo:
+    gr.Markdown("# 📜 Летописец: Фэнтези Озвучка")
     with gr.Row():
+        with gr.Column(scale=1):
+            gr.Markdown("### 🧙‍♂️ Настройки барда")
+            # По умолчанию выбираем Русский
             lang_dropdown = gr.Dropdown(
                 choices=LANGUAGES_CACHE,
+                value="ru-RU",
+                label="Язык сказания",
                 interactive=True
             )
+            # Ищем Дмитрия в кэше для старта
+            start_voices = [f"{v['ShortName']} ({v['Gender']})" for v in VOICES_CACHE if v['Locale'] == "ru-RU"]
+            dmitry = next((v for v in start_voices if "Dmitry" in v), start_voices[0] if start_voices else None)
             voice_dropdown = gr.Dropdown(
+                choices=start_voices,
+                value=dmitry,
+                label="Голос",
                 interactive=True
             )
+            with gr.Group():
+                gr.Markdown("*Для эпичности рекомендую скорость -10% и тон -5Hz*")
+                # Дефолтные значения специально под Фэнтези
+                rate_slider = gr.Slider(-50, 50, value=-10, step=1, label="Скорость чтения (%)")
+                pitch_slider = gr.Slider(-20, 20, value=-5, step=1, label="Глубина голоса (Hz)")
         with gr.Column(scale=2):
             text_input = gr.Textbox(
+                label="Текст легенды",
+                placeholder="В далекой темной пещере, где спал древний дракон...",
+                lines=8,
+                value="Давным-давно, в далекой стране, где горы пронзали небеса, жил древний дракон."
             )
+            btn = gr.Button("✨ Сотворить голос", variant="primary", size="lg")
+            audio_out = gr.Audio(label="Голос рассказчика", type="filepath", autoplay=True)
+    # Логика
+    lang_dropdown.change(filter_voices, inputs=lang_dropdown, outputs=voice_dropdown)
+    btn.click(generate_speech, inputs=[text_input, voice_dropdown, rate_slider, pitch_slider], outputs=audio_out)
 if __name__ == "__main__":
     demo.launch()