Cascade-Edge

Sleeping

App Files Files Community

VSPAN commited on Nov 21, 2025

Commit

a322c69

verified ·

1 Parent(s): c1a9333

Update app.py

Browse files

Files changed (1) hide show

app.py +68 -83

app.py CHANGED Viewed

@@ -7,24 +7,25 @@ import uuid
 import re
 import emoji
-# --- ГЛОБАЛЬНЫЕ ПЕРЕМЕННЫЕ ---
 VOICES_CACHE = []
 LANGUAGES_CACHE = []
-# --- ВСПОМОГАТЕЛЬНЫЕ ФУНКЦИИ ---
 def clean_text(text):
-    """Очистка текста от спецсимволов и эмодзи."""
     if not text: return ""
-    text = re.sub(r'[*_~><]', '', text)
     text = emoji.replace_emoji(text, replace='')
     text = re.sub(r'\s+', ' ', text).strip()
     return text
 async def load_voices_async():
-    """Загрузка списка голосов при старте."""
     global VOICES_CACHE, LANGUAGES_CACHE
     try:
         voices = await edge_tts.list_voices()
         VOICES_CACHE = sorted(voices, key=lambda x: x['Locale'])
@@ -35,18 +36,17 @@ async def load_voices_async():
                 seen.add(v['Locale'])
                 LANGUAGES_CACHE.append(v['Locale'])
         LANGUAGES_CACHE.sort()
-        print(f"✅ Загружено {len(VOICES_CACHE)} голосов.")
     except Exception as e:
-        print(f"❌ Ошибка загрузки голосов: {e}")
         LANGUAGES_CACHE = ["ru-RU", "en-US"]
 def filter_voices(language):
-    """Фильтр голосов при смене языка."""
     if not language: return gr.Dropdown(choices=[])
     filtered = [f"{v['ShortName']} ({v['Gender']})" for v in VOICES_CACHE if v['Locale'] == language]
-    # Пытаемся найти Светлану (лучший женский голос) по умолчанию
     default_voice = filtered[0] if filtered else None
     for v in filtered:
         if "Svetlana" in v:
@@ -55,107 +55,92 @@ def filter_voices(language):
     return gr.Dropdown(choices=filtered, value=default_voice)
 async def generate_speech(text, voice_str, rate, pitch):
-    """Генерация аудио."""
     if not text.strip():
-        raise gr.Warning("Введите текст для озвучивания.")
     if not voice_str:
-        raise gr.Warning("Выберите голос.")
     voice_short = voice_str.split(" (")[0]
     clean_input = clean_text(text)
-    # Формируем параметры (добавляем + или -, как требует API)
-    rate_str = f"{rate:+d}%"
-    pitch_str = f"{pitch:+d}Hz"
-    # Уникальное имя файла
     filename = f"tts_{uuid.uuid4().hex}.mp3"
     output_path = os.path.join(tempfile.gettempdir(), filename)
-    print(f"🎙️ Генерация: {voice_short} | Pitch: {pitch_str}")
-    try:
-        communicate = edge_tts.Communicate(clean_input, voice_short, rate=rate_str, pitch=pitch_str)
-        await communicate.save(output_path)
-        if os.path.exists(output_path) and os.path.getsize(output_path) > 0:
-            return output_path
-        else:
-            raise Exception("Файл пустой")
-    except Exception as e:
-        error_msg = str(e)
-        if "403" in error_msg:
-            raise gr.Error("Ошибка 403. Попробуйте обновить страницу или перезапустить Space.")
-        raise gr.Error(f"Ошибка: {error_msg}")
-# --- ЗАПУСК И ИНТЕРФЕЙС ---
-# Предзагрузка голосов
 asyncio.run(load_voices_async())
-# Настраиваем дефолтные значения
 DEFAULT_LANG = "ru-RU"
-# Ищем Светлану для старта
-START_VOICES = [f"{v['ShortName']} ({v['Gender']})" for v in VOICES_CACHE if v['Locale'] == DEFAULT_LANG]
-DEFAULT_VOICE = next((v for v in START_VOICES if "Svetlana" in v), START_VOICES[0] if START_VOICES else None)
-css = """
-body { background-color: #0b0f19; }
-.container { max-width: 850px; margin: auto; }
-"""
-theme = gr.themes.Soft(
-    primary_hue="purple",
-    secondary_hue="indigo"
-)
-with gr.Blocks(theme=theme, css=css, title="TTS Classic") as demo:
-    gr.Markdown("# 🎧 Edge TTS: Classic")
     with gr.Row():
-        # Левая колонка: Настройки
         with gr.Column(scale=1):
-            gr.Markdown("### ⚙️ Настройки")
-            lang_dropdown = gr.Dropdown(
-                choices=LANGUAGES_CACHE,
-                value=DEFAULT_LANG,
-                label="1. Язык",
-                interactive=True
-            )
-            voice_dropdown = gr.Dropdown(
-                choices=START_VOICES,
-                value=DEFAULT_VOICE,
-                label="2. Голос",
-                interactive=True
-            )
-            gr.Markdown("---")
-            # Слайдеры (Тон по умолчанию -7, как ты просил)
-            rate_slider = gr.Slider(minimum=-50, maximum=50, value=0, step=1, label="Скорость (%)")
-            pitch_slider = gr.Slider(minimum=-20, maximum=20, value=-7, step=1, label="Тон (Hz) [Дефолт: -7]")
-        # Правая колонка: Ввод текста
         with gr.Column(scale=2):
-            gr.Markdown("### 📝 Текст")
-            text_input = gr.Textbox(
-                label="",
-                placeholder="Введите текст здесь...",
-                lines=8,
-                value="Привет! Я готова озвучить твою историю с мистическим оттенком."
-            )
-            btn = gr.Button("🔊 Озвучить", variant="primary", size="lg")
-            audio_output = gr.Audio(label="Результат", type="filepath")
-    # Логика
-    lang_dropdown.change(filter_voices, inputs=lang_dropdown, outputs=voice_dropdown)
-    btn.click(generate_speech, inputs=[text_input, voice_dropdown, rate_slider, pitch_slider], outputs=audio_output)
 if __name__ == "__main__":
     demo.queue().launch()

 import re
 import emoji
+# --- НАСТРОЙКИ ---
+# Глобальные переменные
 VOICES_CACHE = []
 LANGUAGES_CACHE = []
+# --- ОЧИСТКА ТЕКСТА ---
 def clean_text(text):
     if not text: return ""
+    # Microsoft не любит некоторые спецсимволы, убираем их
+    text = re.sub(r'[*_~><^]', '', text)
     text = emoji.replace_emoji(text, replace='')
     text = re.sub(r'\s+', ' ', text).strip()
     return text
+# --- ЗАГРУЗКА ГОЛОСОВ ---
 async def load_voices_async():
     global VOICES_CACHE, LANGUAGES_CACHE
     try:
+        print("⏳ Загрузка голосов...")
         voices = await edge_tts.list_voices()
         VOICES_CACHE = sorted(voices, key=lambda x: x['Locale'])
                 seen.add(v['Locale'])
                 LANGUAGES_CACHE.append(v['Locale'])
         LANGUAGES_CACHE.sort()
+        print(f"✅ Успешно загружено {len(VOICES_CACHE)} голосов.")
     except Exception as e:
+        print(f"❌ Ошибка загрузки: {e}")
         LANGUAGES_CACHE = ["ru-RU", "en-US"]
 def filter_voices(language):
     if not language: return gr.Dropdown(choices=[])
     filtered = [f"{v['ShortName']} ({v['Gender']})" for v in VOICES_CACHE if v['Locale'] == language]
+    # Авто-выбор Светланы
     default_voice = filtered[0] if filtered else None
     for v in filtered:
         if "Svetlana" in v:
     return gr.Dropdown(choices=filtered, value=default_voice)
+# --- ГЕНЕРАЦИЯ (С ЗАЩИТОЙ ОТ СБОЕВ) ---
 async def generate_speech(text, voice_str, rate, pitch):
     if not text.strip():
+        raise gr.Warning("Введите текст!")
     if not voice_str:
+        raise gr.Warning("Выберите голос!")
     voice_short = voice_str.split(" (")[0]
     clean_input = clean_text(text)
+    # Форматирование: Microsoft любит "+0Hz", но иногда "-7Hz" может вызвать сбой.
+    # Убедимся, что формат строгий.
+    rate_str = f"{int(rate):+d}%"
+    pitch_str = f"{int(pitch):+d}Hz"
     filename = f"tts_{uuid.uuid4().hex}.mp3"
     output_path = os.path.join(tempfile.gettempdir(), filename)
+    print(f"🎙️ Попытка генерации: {voice_short} | {pitch_str} | {rate_str}")
+    # 3 Попытки на случай разрыва соединения
+    max_retries = 3
+    last_error = ""
+    for attempt in range(max_retries):
+        try:
+            communicate = edge_tts.Communicate(clean_input, voice_short, rate=rate_str, pitch=pitch_str)
+            await communicate.save(output_path)
+            if os.path.exists(output_path) and os.path.getsize(output_path) > 0:
+                return output_path
+            else:
+                raise Exception("Файл создан, но пуст (0 байт)")
+        except Exception as e:
+            last_error = str(e)
+            print(f"⚠️ Попытка {attempt+1} не удалась: {last_error}")
+            await asyncio.sleep(1) # Ждем секунду перед повтором
+    # Если ничего не помогло
+    if "NoAudioReceived" in last_error:
+        raise gr.Error("Microsoft сбрасывает соединение. Попробуйте изменить текст или перезагрузить страницу.")
+    else:
+        raise gr.Error(f"Ошибка после {max_retries} попыток: {last_error}")
+# --- ЗАПУСК ---
+# Грузим голоса
 asyncio.run(load_voices_async())
 DEFAULT_LANG = "ru-RU"
+START_VOICES = []
+# Безопасный поиск стартовых голосов
+if VOICES_CACHE:
+    START_VOICES = [f"{v['ShortName']} ({v['Gender']})" for v in VOICES_CACHE if v['Locale'] == DEFAULT_LANG]
+DEFAULT_VOICE = None
+if START_VOICES:
+    # Ищем Светлану
+    DEFAULT_VOICE = next((v for v in START_VOICES if "Svetlana" in v), START_VOICES[0])
+css = "body {background-color: #0b0f19;} .container {max-width: 850px; margin: auto;}"
+theme = gr.themes.Soft(primary_hue="purple")
+with gr.Blocks(theme=theme, css=css, title="Fantasy TTS Fixed") as demo:
+    gr.Markdown("# 🧙‍♀️ Fantasy TTS (Stable)")
     with gr.Row():
         with gr.Column(scale=1):
+            gr.Markdown("### Настройки")
+            lang = gr.Dropdown(choices=LANGUAGES_CACHE, value=DEFAULT_LANG, label="Язык", interactive=True)
+            voice = gr.Dropdown(choices=START_VOICES, value=DEFAULT_VOICE, label="Голос", interactive=True)
+            # Слайдеры: по умолчанию -7 Hz
+            slider_rate = gr.Slider(-50, 50, value=0, step=1, label="Скорость (%)")
+            slider_pitch = gr.Slider(-20, 20, value=-7, step=1, label="Тон (Hz) [-7 для Фэнтези]")
         with gr.Column(scale=2):
+            gr.Markdown("### Текст")
+            txt = gr.Textbox(lines=8, value="Привет. Я говорю голосом из твоих снов.", label="")
+            btn = gr.Button("🔮 Озвучить", variant="primary")
+            audio = gr.Audio(label="Аудио")
+    lang.change(filter_voices, inputs=lang, outputs=voice)
+    btn.click(generate_speech, inputs=[txt, voice, slider_rate, slider_pitch], outputs=audio)
 if __name__ == "__main__":
     demo.queue().launch()