Cascade-Edge

Sleeping

App Files Files Community

VSPAN commited on Nov 21, 2025

Commit

7e3a62b

verified ·

1 Parent(s): ad98b57

Update app.py

Browse files

Files changed (1) hide show

app.py +128 -120

app.py CHANGED Viewed

@@ -5,149 +5,157 @@ import tempfile
 import os
 import uuid
 import re
-import shutil
-from pydub import AudioSegment
-# --- ПРОВЕРКА FFmpeg ---
-if not shutil.which("ffmpeg"):
-    print("⚠️ FFmpeg не найден! Убедитесь, что он установлен на сервере.")
-# --- НАСТРОЙКИ ГОЛОСОВ ---
-VOICE_CONFIG = {
-    "narrator": {"voice": "ru-RU-DmitryNeural", "pitch": "-7Hz", "rate": "-5%"},
-    "male":     {"voice": "ru-RU-DenisNeural",  "pitch": "-2Hz", "rate": "+0%"},
-    "female":   {"voice": "ru-RU-SvetlanaNeural","pitch": "+5Hz", "rate": "+5%"}
-}
-TEMP_DIR = tempfile.gettempdir()
-# --- УМНАЯ ЛОГИКА (БЕЗ НЕЙРОСЕТИ) ---
-def analyze_gender_by_grammar(text):
-    """
-    Определяет пол по окончаниям русских глаголов в словах автора.
-    Работает мгновенно и точно.
-    """
-    text_lower = text.lower()
-    # Маркеры женского рода (прошедшее время + "а")
-    female_verbs = [
-        r"сказала", r"спросила", r"ответила", r"прошептала", r"крикнула",
-        r"подумала", r"заметила", r"усмехнулась", r"вздохнула", r"обернулась"
-    ]
-    # Маркеры мужского рода
-    male_verbs = [
-        r"сказал\b", r"спросил\b", r"ответил\b", r"прошептал\b", r"крикнул\b",
-        r"подумал\b", r"заметил\b", r"усмехнулся", r"вздохнул", r"обернулся"
-    ]
-    # Проверяем контекст (слова автора)
-    for verb in female_verbs:
-        if re.search(verb, text_lower):
-            return "female"
-    for verb in male_verbs:
-        if re.search(verb, text_lower):
-            return "male"
-    return "narrator" # Если не понятно — читает рассказчик
-def smart_split_text(text):
-    """Разбивает текст на сцены и раздает роли"""
-    segments = []
-    paragraphs = text.split('\n')
-    for p in paragraphs:
-        p = p.strip()
-        if not p: continue
-        # Логика: Если это диалог (тире или кавычки)
-        if p.startswith('—') or p.startswith('-') or '"' in p or '«' in p:
-            # Пытаемся найти пол в этом же абзаце (слова автора)
-            role = analyze_gender_by_grammar(p)
-            # Если грамматика не помогла, но это явно диалог — ставим мужчину (как дефолт для героя)
-            if role == "narrator":
-                role = "male"
-            segments.append({"text": p, "role": role})
-        else:
-            # Просто опи��ание
-            segments.append({"text": p, "role": "narrator"})
-    return segments
-# --- ГЕНЕРАЦИЯ ---
-async def generate_segment(text, role):
-    if not text.strip(): return None
-    conf = VOICE_CONFIG.get(role, VOICE_CONFIG["narrator"])
-    path = os.path.join(TEMP_DIR, f"seg_{uuid.uuid4().hex}.mp3")
-    try:
-        comm = edge_tts.Communicate(text, conf["voice"], rate=conf["rate"], pitch=conf["pitch"])
-        await comm.save(path)
-        if os.path.exists(path) and os.path.getsize(path) > 100:
-            return path
-    except:
-        pass
-    return None
-async def process_book(text):
-    if not text.strip(): raise gr.Warning("Текст пуст!")
-    print("⚡ Мгновенный анализ текста...")
-    segments = smart_split_text(text)
-    full_audio = AudioSegment.empty()
-    temp_files = []
-    progress = gr.Progress()
-    for item in progress.tqdm(segments, desc="Озвучка"):
-        path = await generate_segment(item["text"], item["role"])
-        if path:
-            temp_files.append(path)
-            seg = AudioSegment.from_mp3(path)
-            if len(full_audio) > 0:
-                full_audio = full_audio.append(seg, crossfade=50)
-            else:
-                full_audio = seg
-            await asyncio.sleep(0.1)
-    out_path = os.path.join(TEMP_DIR, f"turbo_book_{uuid.uuid4().hex}.mp3")
-    full_audio.export(out_path, format="mp3")
-    for f in temp_files:
-        try: os.remove(f)
-        except: pass
-    return out_path, segments
-# --- ИНТЕРФЕЙС ---
-css = "body {background-color: #111827;} .container {max-width: 900px; margin: auto;}"
-theme = gr.themes.Soft(primary_hue="green")
-with gr.Blocks(theme=theme, css=css, title="Turbo TTS") as demo:
-    gr.Markdown("# 🚀 Turbo Fantasy TTS (No GPU needed)")
-    gr.Markdown("Мгновенная загрузка. Умное определение пола по грамматике.")
     with gr.Row():
         with gr.Column(scale=2):
-            inp = gr.Textbox(
-                label="Текст", lines=12,
-                value='— Я пришла за тобой, — прошептала ведьма.\nРыцарь ответил: — Я готов.',
-                placeholder="Вставьте текст..."
             )
-            btn = gr.Button("⚡ Создать моментально", variant="primary")
-        with gr.Column(scale=1):
-            out_audio = gr.Audio(label="Результат")
-            out_debug = gr.JSON(label="Роли (Debug)")
-    btn.click(process_book, inputs=inp, outputs=[out_audio, out_debug])
 if __name__ == "__main__":
     demo.queue().launch()

 import os
 import uuid
 import re
+import emoji
+# --- ГЛОБАЛЬНЫЕ ПЕРЕМЕННЫЕ ---
+VOICES_CACHE = []
+LANGUAGES_CACHE = []
+# --- ВСПОМОГАТЕЛЬНЫЕ ФУНКЦИИ ---
+def clean_text(text):
+    """Очистка текста от спецсимволов и эмодзи."""
+    if not text: return ""
+    text = re.sub(r'[*_~><]', '', text)
+    text = emoji.replace_emoji(text, replace='')
+    text = re.sub(r'\s+', ' ', text).strip()
+    return text
+async def load_voices_async():
+    """Загрузка списка голосов при старте."""
+    global VOICES_CACHE, LANGUAGES_CACHE
+    try:
+        voices = await edge_tts.list_voices()
+        VOICES_CACHE = sorted(voices, key=lambda x: x['Locale'])
+        seen = set()
+        LANGUAGES_CACHE = []
+        for v in VOICES_CACHE:
+            if v['Locale'] not in seen:
+                seen.add(v['Locale'])
+                LANGUAGES_CACHE.append(v['Locale'])
+        LANGUAGES_CACHE.sort()
+        print(f"✅ Загружено {len(VOICES_CACHE)} голосов.")
+    except Exception as e:
+        print(f"❌ Ошибка загрузки голосов: {e}")
+        LANGUAGES_CACHE = ["ru-RU", "en-US"]
+def filter_voices(language):
+    """Фильтр голосов при смене языка."""
+    if not language: return gr.Dropdown(choices=[])
+    filtered = [f"{v['ShortName']} ({v['Gender']})" for v in VOICES_CACHE if v['Locale'] == language]
+    # Пытаемся найти Светлану (лучший женский голос) по умолчанию
+    default_voice = filtered[0] if filtered else None
+    for v in filtered:
+        if "Svetlana" in v:
+            default_voice = v
+            break
+    return gr.Dropdown(choices=filtered, value=default_voice)
+async def generate_speech(text, voice_str, rate, pitch):
+    """Генерация аудио."""
+    if not text.strip():
+        raise gr.Warning("Введите текст для озвучивания.")
+    if not voice_str:
+        raise gr.Warning("Выберите голос.")
+    voice_short = voice_str.split(" (")[0]
+    clean_input = clean_text(text)
+    # Формируем параметры (добавляем + или -, как требует API)
+    rate_str = f"{rate:+d}%"
+    pitch_str = f"{pitch:+d}Hz"
+    # Уникальное имя файла
+    filename = f"tts_{uuid.uuid4().hex}.mp3"
+    output_path = os.path.join(tempfile.gettempdir(), filename)
+    print(f"🎙️ Генерация: {voice_short} | Pitch: {pitch_str}")
+    try:
+        communicate = edge_tts.Communicate(clean_input, voice_short, rate=rate_str, pitch=pitch_str)
+        await communicate.save(output_path)
+        if os.path.exists(output_path) and os.path.getsize(output_path) > 0:
+            return output_path
+        else:
+            raise Exception("Файл пустой")
+    except Exception as e:
+        error_msg = str(e)
+        if "403" in error_msg:
+            raise gr.Error("Ошибка 403. Попробуйте обновить страницу или перезапустить Space.")
+        raise gr.Error(f"Ошибка: {error_msg}")
+# --- ЗАПУСК И ИНТЕРФЕЙС ---
+# Предзагрузка голосов
+asyncio.run(load_voices_async())
+# Настраиваем дефолтные значения
+DEFAULT_LANG = "ru-RU"
+# Ищем Светлану для старта
+START_VOICES = [f"{v['ShortName']} ({v['Gender']})" for v in VOICES_CACHE if v['Locale'] == DEFAULT_LANG]
+DEFAULT_VOICE = next((v for v in START_VOICES if "Svetlana" in v), START_VOICES[0] if START_VOICES else None)
+css = """
+body { background-color: #0b0f19; }
+.container { max-width: 850px; margin: auto; }
+"""
+theme = gr.themes.Soft(
+    primary_hue="purple",
+    secondary_hue="indigo"
+)
+with gr.Blocks(theme=theme, css=css, title="TTS Classic") as demo:
+    gr.Markdown("# 🎧 Edge TTS: Classic")
     with gr.Row():
+        # Левая колонка: Настройки
+        with gr.Column(scale=1):
+            gr.Markdown("### ⚙️ Настройки")
+            lang_dropdown = gr.Dropdown(
+                choices=LANGUAGES_CACHE,
+                value=DEFAULT_LANG,
+                label="1. Язык",
+                interactive=True
+            )
+            voice_dropdown = gr.Dropdown(
+                choices=START_VOICES,
+                value=DEFAULT_VOICE,
+                label="2. Голос",
+                interactive=True
+            )
+            gr.Markdown("---")
+            # Слайдеры (Тон по умолчанию -7, как ты просил)
+            rate_slider = gr.Slider(minimum=-50, maximum=50, value=0, step=1, label="Скорость (%)")
+            pitch_slider = gr.Slider(minimum=-20, maximum=20, value=-7, step=1, label="Тон (Hz) [Дефолт: -7]")
+        # Правая колонка: Ввод текста
         with gr.Column(scale=2):
+            gr.Markdown("### 📝 Текст")
+            text_input = gr.Textbox(
+                label="",
+                placeholder="Введите текст здесь...",
+                lines=8,
+                value="Привет! Я готова озвучить твою историю с мистическим оттенком."
             )
+            btn = gr.Button("🔊 Озвучить", variant="primary", size="lg")
+            audio_output = gr.Audio(label="Результат", type="filepath")
+    # Логика
+    lang_dropdown.change(filter_voices, inputs=lang_dropdown, outputs=voice_dropdown)
+    btn.click(generate_speech, inputs=[text_input, voice_dropdown, rate_slider, pitch_slider], outputs=audio_output)
 if __name__ == "__main__":
     demo.queue().launch()