Cascade-Edge

Sleeping

App Files Files Community

VSPAN commited on Nov 21, 2025

Commit

b6e79a7

verified ·

1 Parent(s): 1c791e8

Update app.py

Browse files

Files changed (1) hide show

app.py +172 -136

app.py CHANGED Viewed

@@ -1,182 +1,218 @@
 import gradio as gr
 import edge_tts
-import asyncio
 import tempfile
-import re
-import emoji
 import os
 import uuid
-import time
-# Глобальные переменные для кэширования голосов
-VOICES_DATA = []
-LANGUAGES = []
-# --- Вспомогательные функции ---
 def clean_text(text):
     """
-    Очищает текст от спецсимволов и эмодзи.
     """
     if not text:
         return ""
     text = re.sub(r'[*_~><]', '', text)
     text = emoji.replace_emoji(text, replace='')
     text = re.sub(r'\s+', ' ', text).strip()
     return text
-async def load_voices_async():
     """
-    Асинхронная загрузка списка голосов при старте.
     """
-    global VOICES_DATA, LANGUAGES
     try:
         voices = await edge_tts.list_voices()
-        # Сортировка по локали
-        VOICES_DATA = sorted(voices, key=lambda x: x['Locale'])
-        # Сбор уникальных языков
         seen_langs = set()
-        langs_list = []
-        for v in VOICES_DATA:
-            locale = v['Locale']
-            if locale not in seen_langs:
-                seen_langs.add(locale)
-                langs_list.append(locale)
-        LANGUAGES = sorted(langs_list)
-        print(f"✅ Загружено {len(VOICES_DATA)} голосов. Библиотека готова.")
     except Exception as e:
-        print(f"❌ Ошибка загрузки голосов: {e}")
-        # Фолбэк, если не удалось загрузить (чтобы программа не упала сразу)
-        LANGUAGES = ["en-US", "ru-RU"]
-def filter_voices_by_language(language):
     """
-    Фильтр голосов по выбранному языку.
     """
     if not language:
-        return gr.Dropdown(choices=[])
-    filtered_voices = [
-        f"{v['ShortName']} ({v['Gender']})"
-        for v in VOICES_DATA
-        if v['Locale'] == language
-    ]
-    # Если голосов нет (например, ошибка сети при старте), возвращаем пустой список
-    if not filtered_voices:
-        return gr.Dropdown(choices=[], value=None)
-    return gr.Dropdown(choices=filtered_voices, value=filtered_voices[0], interactive=True)
-# --- Основная логика генерации (с Retry) ---
-async def generate_speech(text, voice_friendly_name, rate, pitch):
     """
-    Генерация аудио.
     """
     if not text or not text.strip():
-        raise gr.Warning("⚠️ Введите текст для озвучивания.")
-    if not voice_friendly_name:
-        raise gr.Warning("⚠️ Выберите голос из списка.")
-    # Получаем ShortName (например, ru-RU-DmitryNeural)
-    voice_short_name = voice_friendly_name.split(" (")[0]
     clean_input = clean_text(text)
     rate_str = f"{rate:+d}%"
     pitch_str = f"{pitch:+d}Hz"
-    print(f"🔄 Генерация... Голос: {voice_short_name}")
-    # Создаем путь к файлу
-    filename = f"tts_{uuid.uuid4().hex}.mp3"
-    output_path = os.path.join(tempfile.gettempdir(), filename)
-    # Попытка генерации с повтором (на случай сетевых сбоев)
-    max_retries = 3
-    for attempt in range(max_retries):
-        try:
-            communicate = edge_tts.Communicate(clean_input, voice_short_name, rate=rate_str, pitch=pitch_str)
-            await communicate.save(output_path)
-            # Проверка, создался ли файл и не пустой ли он
-            if os.path.exists(output_path) and os.path.getsize(output_path) > 0:
-                return output_path
-            else:
-                raise Exception("Файл создан, но он пуст.")
-        except Exception as e:
-            error_msg = str(e)
-            print(f"⚠️ Попытка {attempt + 1}/{max_retries} не удалась: {error_msg}")
-            # Если это ошибка 403, сразу говорим пользователю об обновлении
-            if "403" in error_msg:
-                raise gr.Error("Ошибка 403 (Forbidden). Сервер Microsoft отклонил запрос. "
-                               "Пожалуйста, обновите библиотеку: pip install --upgrade edge-tts")
-            if attempt < max_retries - 1:
-                await asyncio.sleep(1) # Ждем секунду перед повтором
-            else:
-                raise gr.Error(f"Не удалось сгенерировать аудио после {max_retries} попыток. Ошибка: {error_msg}")
-# --- Интерфейс ---
-def create_demo():
-    # Предзагрузка голосов
-    asyncio.run(load_voices_async())
-    css = """
-    .container { max-width: 850px; margin: auto; }
-    """
-    theme = gr.themes.Soft(primary_hue="blue")
-    with gr.Blocks(theme=theme, css=css, title="Ultra TTS 2.0") as demo:
-        gr.Markdown("## 🎧 Edge TTS (High Quality)")
-        with gr.Row():
-            with gr.Column(scale=1):
-                lang_dropdown = gr.Dropdown(
-                    choices=LANGUAGES,
-                    label="1. Выберите язык",
-                    value="ru-RU" if "ru-RU" in LANGUAGES else (LANGUAGES[0] if LANGUAGES else None)
-                )
-                # Инициализация списка голосов
-                initial_voices = []
-                if lang_dropdown.value:
-                    initial_voices = [f"{v['ShortName']} ({v['Gender']})" for v in VOICES_DATA if v['Locale'] == lang_dropdown.value]
-                voice_dropdown = gr.Dropdown(
-                    choices=initial_voices,
-                    value=initial_voices[0] if initial_voices else None,
-                    label="2. Выберите голос",
-                    interactive=True
-                )
-                with gr.Accordion("Настройки звука", open=False):
-                    rate_slider = gr.Slider(-50, 50, value=0, step=1, label="Скорость (%)")
-                    pitch_slider = gr.Slider(-20, 20, value=0, step=1, label="Тон (Hz)")
-            with gr.Column(scale=2):
-                text_input = gr.Textbox(
-                    label="Текст",
-                    lines=6,
-                    placeholder="Введите текст...",
-                    value="Привет! Это тест качественной озвучки."
-                )
-                btn = gr.Button("▶️ Озвучить", variant="primary")
-                audio_out = gr.Audio(label="Результат", type="filepath")
-        # События
-        lang_dropdown.change(fn=filter_voices_by_language, inputs=[lang_dropdown], outputs=[voice_dropdown])
-        btn.click(fn=generate_speech, inputs=[text_input, voice_dropdown, rate_slider, pitch_slider], outputs=[audio_out])
-    return demo
 if __name__ == "__main__":
-    app = create_demo()
-    app.launch(server_name="0.0.0.0", show_error=True)

 import gradio as gr
 import edge_tts
 import tempfile
 import os
 import uuid
+import asyncio
+import re
+import emoji
+# --- КОНФИГУРАЦИЯ ---
+TEMP_DIR = tempfile.gettempdir()
+# Глобальные переменные для хранения списка голосов
+VOICES_CACHE = []
+LANGUAGES_CACHE = []
+# --- ВСПОМОГАТЕЛЬНЫЕ ФУНКЦИИ ---
 def clean_text(text):
     """
+    Очистка текста для предотвращения ошибок парсера Microsoft.
     """
     if not text:
         return ""
+    # Убираем символы, которые могут ломать SSML
     text = re.sub(r'[*_~><]', '', text)
+    # Убираем эмодзи (библиотека emoji 2.6.0)
     text = emoji.replace_emoji(text, replace='')
+    # Убираем лишние пробелы
     text = re.sub(r'\s+', ' ', text).strip()
     return text
+async def get_voices_async():
     """
+    Асинхронная загрузка голосов и формирование структуры языков.
     """
+    global VOICES_CACHE, LANGUAGES_CACHE
     try:
         voices = await edge_tts.list_voices()
+        # Сортируем голоса
+        VOICES_CACHE = sorted(voices, key=lambda x: x['Locale'])
+        # Формируем список уникальных языков
         seen_langs = set()
+        LANGUAGES_CACHE = []
+        for v in VOICES_CACHE:
+            if v['Locale'] not in seen_langs:
+                seen_langs.add(v['Locale'])
+                LANGUAGES_CACHE.append(v['Locale'])
+        LANGUAGES_CACHE.sort()
+        print(f"✅ Успешно загружено {len(VOICES_CACHE)} голосов.")
     except Exception as e:
+        print(f"⚠️ Ошибка загрузки голосов: {e}")
+        # Фолбэк значения, если интернет недоступен при старте
+        LANGUAGES_CACHE = ["en-US", "ru-RU"]
+def filter_voices(language):
     """
+    Фильтрация голосов при выборе языка в интерфейсе.
     """
     if not language:
+        return gr.Dropdown(choices=[], value=None)
+    # Формируем читаемый список: "Name (Gender)"
+    filtered = [f"{v['ShortName']} ({v['Gender']})" for v in VOICES_CACHE if v['Locale'] == language]
+    # Возвращаем обновленный дропдаун с первым значением по умолчанию
+    return gr.Dropdown(choices=filtered, value=filtered[0] if filtered else None)
+async def generate_speech(text, voice_str, rate, pitch):
     """
+    Главная функция генерации (Async).
+    Gradio 4.x отлично работает с async def.
     """
     if not text or not text.strip():
+        raise gr.Warning("Пожалуйста, введит�� текст.")
+    if not voice_str:
+        raise gr.Warning("Пожалуйста, выберите голос.")
+    # Извлекаем "ShortName" из строки вида "ru-RU-DmitryNeural (Male)"
+    voice_short = voice_str.split(" (")[0]
+    # Подготовка параметров
     clean_input = clean_text(text)
     rate_str = f"{rate:+d}%"
     pitch_str = f"{pitch:+d}Hz"
+    # Уникальное имя файла (решает проблемы с кэшем браузера и доступом)
+    filename = f"audio_{uuid.uuid4().hex}.mp3"
+    file_path = os.path.join(TEMP_DIR, filename)
+    print(f"🔄 Генерация: {voice_short} | Скорость: {rate_str}")
+    try:
+        # Создаем объект Communicate (версия 6.1.12)
+        communicate = edge_tts.Communicate(clean_input, voice_short, rate=rate_str, pitch=pitch_str)
+        # Сохраняем файл
+        await communicate.save(file_path)
+        # Проверяем результат
+        if os.path.exists(file_path) and os.path.getsize(file_path) > 0:
+            return file_path
+        else:
+            raise Exception("Файл создан, но он пуст.")
+    except Exception as e:
+        error_message = str(e)
+        print(f"❌ Ошибка: {error_message}")
+        if "403" in error_message:
+            raise gr.Error(
+                "Ошибка 403: Microsoft заблокировал доступ для вашей версии библиотеки. "
+                "Это не ошибка кода, это ограничение API для версии 6.1.12."
+            )
+        else:
+            raise gr.Error(f"Ошибка генерации: {error_message}")
+# --- ИНТЕРФЕЙС GRADIO (BLOCKS) ---
+# Предзагрузка голосов перед запуском интерфейса
+asyncio.run(get_voices_async())
+# CSS для красоты
+css = """
+.container { max-width: 900px; margin: auto; }
+footer { display: none !important; }
+"""
+# Тема интерфейса
+theme = gr.themes.Soft(
+    primary_hue="blue",
+    neutral_hue="slate",
+    radius_size="md"
+)
+with gr.Blocks(theme=theme, css=css, title="Edge TTS Pro") as demo:
+    with gr.Row():
+        gr.Markdown(
+            """
+            # 🎧 Edge TTS Generator
+            ### Качественный синтез речи (версия 6.1.12)
+            """
+        )
+    with gr.Row():
+        # Левая колонка: Настройки
+        with gr.Column(scale=1, min_width=300):
+            gr.Markdown("### ⚙️ Настройки голоса")
+            # Выбор языка
+            lang_dropdown = gr.Dropdown(
+                choices=LANGUAGES_CACHE,
+                value="ru-RU" if "ru-RU" in LANGUAGES_CACHE else None,
+                label="1. Язык",
+                interactive=True
+            )
+            # Выбор голоса (заполняется динамически)
+            # Инициализируем начальным списком для выбранного языка
+            initial_voices = []
+            if lang_dropdown.value:
+                initial_voices = [f"{v['ShortName']} ({v['Gender']})" for v in VOICES_CACHE if v['Locale'] == lang_dropdown.value]
+            voice_dropdown = gr.Dropdown(
+                choices=initial_voices,
+                value=initial_voices[0] if initial_voices else None,
+                label="2. Голос",
+                interactive=True
+            )
+            # Слайдеры в аккордеоне для компактности
+            with gr.Accordion("Дополнительно", open=True):
+                rate_slider = gr.Slider(minimum=-50, maximum=50, value=0, step=1, label="Скорость речи (%)")
+                pitch_slider = gr.Slider(minimum=-20, maximum=20, value=0, step=1, label="Тон голоса (Hz)")
+        # Правая колонка: Ввод и Результат
+        with gr.Column(scale=2):
+            gr.Markdown("### 📝 Текст")
+            text_input = gr.Textbox(
+                label="Введите текст для озвучивания",
+                placeholder="Привет! Как твои дела?",
+                lines=6,
+                max_lines=20
+            )
+            generate_btn = gr.Button("🚀 Создать аудио", variant="primary", size="lg")
+            gr.Markdown("### 🔊 Результат")
+            audio_output = gr.Audio(
+                label="Сгенерированный файл",
+                type="filepath",
+                interactive=False,
+                autoplay=True
+            )
+    # --- ЛОГИКА СОБЫТИЙ ---
+    # 1. При смене языка обновляем список голосов
+    lang_dropdown.change(
+        fn=filter_voices,
+        inputs=[lang_dropdown],
+        outputs=[voice_dropdown]
+    )
+    # 2. При нажатии кнопки генерируем (Gradio 4.x сам обработает async)
+    generate_btn.click(
+        fn=generate_speech,
+        inputs=[text_input, voice_dropdown, rate_slider, pitch_slider],
+        outputs=[audio_output]
+    )
+# Запуск приложения
 if __name__ == "__main__":
+    demo.launch()