Ttspro2

Running

App Files Files Community

Hamed744 commited on Jul 5, 2025

Commit

e4cf6e1

verified ·

1 Parent(s): 9e97ca0

Update app.py

Browse files

Files changed (1) hide show

app.py +186 -228

app.py CHANGED Viewed

@@ -1,7 +1,4 @@
 import gradio as gr
-# این خط برای بررسی نسخه Gradio در لاگ‌ها اضافه شده است
-print(f"Gradio version at startup: {gr.__version__}")
 import base64
 import mimetypes
 import os
@@ -9,64 +6,49 @@ import re
 import struct
 import time
 import zipfile
-import google.generativeai as genai
-from google.generativeai import types
 import threading
 import logging
-import io
-import numpy as np # جدید: این خط را اضافه کنید
 try:
     from pydub import AudioSegment
     PYDUB_AVAILABLE = True
 except ImportError:
     PYDUB_AVAILABLE = False
-    logging.warning("⚠️ pydub نصب نشده است. قابلیت ادغام فایل‌های صوتی و تبدیل به NumPy غیرفعال خواهد بود.")
 # --- START: پیکربندی لاگینگ ---
 logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s', datefmt='%Y-%m-%d %H:%M:%S')
 # --- END: پیکربندی لاگینگ ---
-# --- START: منطق جدید مدیریت API Key (مشابه کد قبلی شما) ---
 ALL_API_KEYS: list[str] = []
 NEXT_KEY_INDEX: int = 0
-KEY_LOCK: threading.Lock = threading.Lock() # برای اطمینان از ایمنی تردها هنگام به روز رسانی ایندکس
 def _init_api_keys():
-    """
-    کلیدهای API را از یک متغیر محیطی واحد شناسایی و مرتب می‌کند.
-    این تابع باید یک بار هنگام شروع برنامه اجرا شود.
-    """
     global ALL_API_KEYS
-    all_keys_string = os.environ.get("ALL_GEMINI_API_KEYS")
     if all_keys_string:
         ALL_API_KEYS = [key.strip() for key in all_keys_string.split(',') if key.strip()]
     logging.info(f"✅ تعداد {len(ALL_API_KEYS)} کلید API جیمینای بارگذاری شد.")
     if not ALL_API_KEYS:
         logging.warning("⛔️ خطای حیاتی: هیچ Secret با نام ALL_GEMINI_API_KEYS یافت نشد!")
         logging.warning("   لطفاً Secret را به عنوان یک رشته با کاما جدا شده (مثال: key1,key2,key3) در تنظیمات Space خود اضافه کنید.")
-# فراخوانی تابع شناسایی کلیدها در ابتدای برنامه
 _init_api_keys()
 def get_next_api_key():
-    """
-    کلید API بعدی را به صورت چرخشی برمی‌گرداند.
-    """
     global NEXT_KEY_INDEX, ALL_API_KEYS, KEY_LOCK
-    with KEY_LOCK: # اطمینان از اینکه تنها یک ترد در هر زمان به ایندکس دسترسی دارد
         if not ALL_API_KEYS:
             return None, None
         key_to_use = ALL_API_KEYS[NEXT_KEY_INDEX % len(ALL_API_KEYS)]
         key_display_index = (NEXT_KEY_INDEX % len(ALL_API_KEYS)) + 1
         NEXT_KEY_INDEX += 1
         return key_to_use, key_display_index
-# --- END: منطق جدید مدیریت API Key ---
 SPEAKER_VOICES = [
     "Achird", "Zubenelgenubi", "Vindemiatrix", "Sadachbia", "Sadaltager",
@@ -75,12 +57,20 @@ SPEAKER_VOICES = [
     "Rasalthgeti", "Orus", "Aoede", "Callirrhoe", "Autonoe", "Enceladus",
     "Iapetus", "Zephyr", "Puck", "Charon", "Kore", "Fenrir", "Leda"
 ]
-FIXED_MODEL_NAME = "gemini-2.5-flash-preview-tts"
 DEFAULT_MAX_CHUNK_SIZE = 3800
 DEFAULT_SLEEP_BETWEEN_REQUESTS = 8
 def convert_to_wav(audio_data: bytes, mime_type: str) -> bytes:
-    """تبدیل داده‌های صوتی LPCM به فرمت WAV استاندارد (در حافظه)."""
     parameters = parse_audio_mime_type(mime_type)
     bits_per_sample, rate = parameters["bits_per_sample"], parameters["rate"]
     num_channels, data_size = 1, len(audio_data)
@@ -90,238 +80,236 @@ def convert_to_wav(audio_data: bytes, mime_type: str) -> bytes:
     return header + audio_data
 def parse_audio_mime_type(mime_type: str) -> dict[str, int]:
-    """تجزیه MIME Type صوتی برای استخراج اطلاعات نمونه‌برداری."""
-    bits, rate = 16, 24000 # مقادیر پیش‌فرض
     for param in mime_type.split(";"):
         param = param.strip()
         if param.lower().startswith("rate="):
             try: rate = int(param.split("=", 1)[1])
-            except ValueError: pass
         elif param.startswith("audio/L"):
             try: bits = int(param.split("L", 1)[1])
-            except ValueError: pass
     return {"bits_per_sample": bits, "rate": rate}
 def smart_text_split(text, max_size=3800):
-    """تقسیم متن به قطعات کوچکتر بر اساس علائم نگارشی برای سازگاری با محدودیت API."""
     if len(text) <= max_size: return [text]
     chunks, current_chunk = [], ""
-    # سعی می‌کنیم بر اساس جملات یا نقاط مکث منطقی تقسیم کنیم
-    sentences = re.split(r'(?<=[.!?؟])\s+', text)
-    if not sentences: # اگر هیچ نقطه نگارشی نبود یا متن کوتاه بود
-        sentences = re.split(r'(?<=[,؛:،])\s*|\s+', text) # بر اساس کاما یا فاصله تقسیم کن
     for sentence in sentences:
         if len(current_chunk) + len(sentence) + 1 > max_size:
             if current_chunk: chunks.append(current_chunk.strip())
             current_chunk = sentence
-            # اگر یک جمله به تنهایی بزرگتر از max_size بود، آن را هم تقسیم کنید
             while len(current_chunk) > max_size:
-                # سعی کنید در نقطه ای منطقی مانند کاما، نقطه ویرگول یا فاصله بزرگ تقسیم کنید
                 split_idx = next((i for i in range(max_size - 1, max_size // 2, -1) if current_chunk[i] in ['،', ',', ';', ':', ' ']), -1)
                 part, current_chunk = (current_chunk[:split_idx+1], current_chunk[split_idx+1:]) if split_idx != -1 else (current_chunk[:max_size], current_chunk[max_size:])
                 chunks.append(part.strip())
-        else:
-            current_chunk += (" " if current_chunk else "") + sentence
     if current_chunk: chunks.append(current_chunk.strip())
     final_chunks = [c for c in chunks if c]
     return final_chunks
-def merge_audio_bytes_to_numpy(audio_data_list: list[bytes]) -> tuple[int, np.ndarray] | None:
-    """
-    لیستی از بایت‌های صوتی WAV را ادغام کرده و یک تاپل (sample_rate, numpy_array) برمی‌گرداند.
-    """
-    if not PYDUB_AVAILABLE:
-        logging.warning("⚠️ pydub برای ادغام و تبدیل به NumPy در دسترس نیست.")
-        return None # در این حالت نمی‌توانیم خروجی NumPy بدهیم
     try:
-        combined_audio_segment = AudioSegment.empty()
-        for i, audio_bytes in enumerate(audio_data_list):
-            audio_segment = AudioSegment.from_file(io.BytesIO(audio_bytes), format="wav")
-            combined_audio_segment += audio_segment
-            if i < len(audio_data_list) - 1:
-                combined_audio_segment += AudioSegment.silent(duration=150) # 150 میلی‌ثانیه سکوت
-        # استخراج نرخ نمونه و داده‌های صوتی به عنوان آرایه NumPy
-        sample_rate = combined_audio_segment.frame_rate
-        # pydub به صورت پیش‌فرض داده‌ها را به int16 تبدیل می‌کند، مناسب برای NumPy
-        audio_array = np.array(combined_audio_segment.get_array_of_samples())
-        return (sample_rate, audio_array)
     except Exception as e:
-        logging.error(f"❌ خطا در ادغام بایت‌های صوتی و تبدیل به NumPy: {e}")
-        return None
-# --- START: منطق تولید صدا با قابلیت تلاش مجدد با کلیدهای چرخشی ---
-def generate_audio_chunk_with_retry(chunk_text, prompt_text, voice, temp):
-    """
-    یک قطعه صوتی را با قابلیت تلاش مجدد با کلیدهای مختلف API تولید می‌کند.
-    اگر یک کلید ناموفق بود، به طور خودکار کلید بعدی را امتحان می‌کند تا تمام کلیدها بررسی شوند.
-    """
     if not ALL_API_KEYS:
-        logging.error("❌ هیچ کلید API برای تولید صدا در دسترس نیست.")
         return None
-    for _ in range(len(ALL_API_KEYS)):
         selected_api_key, key_idx_display = get_next_api_key()
         if not selected_api_key:
-            logging.warning("⚠️ get_next_api_key هیچ کلیدی برنگرداند. تلاش‌های باقیمانده نادیده گرفته می‌شوند.")
-            break
-        logging.info(f"⚙️ تلاش برای تولید قطعه با کلید API شماره {key_idx_display} (...{selected_api_key[-4:]})")
         try:
-            client = genai.Client(api_key=selected_api_key)
             final_text = f'"{prompt_text}"\n{chunk_text}' if prompt_text and prompt_text.strip() else chunk_text
-            contents = [types.Content(role="user", parts=[types.Part.from_text(text=final_text)])]
-            config = types.GenerateContentConfig(temperature=temp, response_modalities=["audio"],
-                speech_config=types.SpeechConfig(voice_config=types.VoiceConfig(
-                    prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=voice))))
-            response = client.models.generate_content(model=FIXED_MODEL_NAME, contents=contents, config=config)
-            if response.candidates and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data:
-                logging.info(f"✅ قطعه با موفقیت توسط کلید شماره {key_idx_display} تولید شد.")
-                # همیشه داده را به صورت بایت WAV برمی‌گرداند.
-                data_buffer = response.candidates[0].content.parts[0].inline_data.data
-                mime_type = response.candidates[0].content.parts[0].inline_data.mime_type
-                if "audio/L" in mime_type:
-                    data_buffer = convert_to_wav(data_buffer, mime_type)
-                return data_buffer
             else:
-                logging.warning(f"⚠️ پاسخ API برای قطعه با کلید شماره {key_idx_display} بدون داده صوتی بود. تلاش با کلید بعدی...")
         except Exception as e:
-            logging.error(f"❌ خطا در تولید قطعه با کلید شماره {key_idx_display}: {e}. تلاش با کلید بعدی...")
-    logging.error("❌ تمام کلیدهای API امتحان شدند اما هیچ‌کدام موفق به تولید قطعه نشدند.")
     return None
-def core_generate_audio(text_input, prompt_input, selected_voice, temperature_val):
-    logging.info("🚀 شروع فرآیند تولید صدا با قابلیت تعویض کلید خودکار...")
     max_chunk, sleep_time = DEFAULT_MAX_CHUNK_SIZE, DEFAULT_SLEEP_BETWEEN_REQUESTS
-    if not text_input or not text_input.strip():
-        logging.error("❌ متن ورودی خالی است.")
-        return None
     text_chunks = smart_text_split(text_input, max_chunk)
     if not text_chunks:
-        logging.error("❌ متن قابل پردازش به قطعات کوچکتر نیست.")
         return None
-    generated_wav_bytes_list = [] # لیست حاوی داده‌های صوتی هر قطعه (بایت WAV)
-    for i, chunk in enumerate(text_chunks):
-        logging.info(f"🔊 پردازش قطعه {i+1}/{len(text_chunks)}...")
-        # generate_audio_chunk_with_retry اکنون مستقیماً بایت‌های WAV را برمی‌گرداند
-        wav_data_for_chunk = generate_audio_chunk_with_retry(chunk, prompt_input, selected_voice, temperature_val)
-        if wav_data_for_chunk:
-            generated_wav_bytes_list.append(wav_data_for_for_chunk)
-        else:
-            logging.error(f"🛑 فرآیند متوقف شد زیرا تولید قطعه {i+1} با تمام کلیدهای موجود ناموفق بود.")
-            break
-        if i < len(text_chunks) - 1 and len(text_chunks) > 1:
-            time.sleep(sleep_time)
-    if not generated_wav_bytes_list:
-        logging.error(f"❌ هیچ داده صوتی تولید نشد.")
-        return None
-    final_audio_output = None
-    if len(generated_wav_bytes_list) > 1:
-        logging.info("♻️ ادغام قطعات صوتی و تبدیل به NumPy...")
-        final_audio_output = merge_audio_bytes_to_numpy(generated_wav_bytes_list)
-        if final_audio_output:
-            logging.info("✅ ادغام و تبدیل به NumPy با موفقیت انجام شد.")
-        else:
-            logging.warning("⚠️ ادغام ناموفق بود یا pydub در دسترس نیست. تلاش برای بازگرداندن اولین قطعه به عنوان NumPy...")
-            if generated_wav_bytes_list and PYDUB_AVAILABLE:
-                try:
-                    # اگر ادغام به مشکل خورد، سعی می‌کنیم حداقل اولین قطعه را به NumPy تبدیل کنیم
-                    single_audio_segment = AudioSegment.from_file(io.BytesIO(generated_wav_bytes_list[0]), format="wav")
-                    final_audio_output = (single_audio_segment.frame_rate, np.array(single_audio_segment.get_array_of_samples()))
-                except Exception as e:
-                    logging.error(f"❌ خطا در تبدیل اولین قطعه به NumPy: {e}")
-                    return None
-            else:
-                return None # هیچ راهی برای بازگرداندن NumPy بدون pydub/داده وجود ندارد
-    elif len(generated_wav_bytes_list) == 1:
-        logging.info("✅ تنها یک قطعه صوتی تولید شد. تبدیل مستقیم به NumPy.")
-        if PYDUB_AVAILABLE:
-            try:
-                single_audio_segment = AudioSegment.from_file(io.BytesIO(generated_wav_bytes_list[0]), format="wav")
-                final_audio_output = (single_audio_segment.frame_rate, np.array(single_audio_segment.get_array_of_samples()))
-            except Exception as e:
-                logging.error(f"❌ خطا در تبدیل قطعه تکی به NumPy: {e}")
-                return None
-        else:
-            logging.error("❌ pydub برای تبدیل قطعه تکی به NumPy در دسترس نیست.")
-            return None # نمی‌توانیم خروجی numpy بدهیم
-    if final_audio_output:
-        logging.info("✅ عملیات تولید صدا با موفقیت کامل شد.")
-        return final_audio_output
-    else:
-        logging.error("❓ وضعیت نامشخص برای خروجی نهایی صدا.")
-        return None
-# --- END: منطق جدید تولید صدا ---
-def gradio_tts_interface(use_file_input, uploaded_file, text_to_speak, speech_prompt, speaker_voice, temperature, progress=gr.Progress(track_tqdm=True)):
     actual_text = ""
     if use_file_input:
-        if uploaded_file and uploaded_file.name:
             try:
                 with open(uploaded_file.name, 'r', encoding='utf-8') as f: actual_text = f.read().strip()
-                if not actual_text: logging.error("❌ فایل آپلود شده خالی است یا خوانده نشد."); return None
-            except Exception as e: logging.error(f"❌ خطا در خواندن فایل آپلود شده: {e}"); return None
-        else: logging.warning("❌ گزینه استفاده از فایل انتخاب شده اما فایلی آپلود نشده."); return None
     else:
         actual_text = text_to_speak
-        if not actual_text or not actual_text.strip(): logging.warning("❌ متن ورودی برای تبدیل خالی است."); return None
-    # core_generate_audio اکنون یک تاپل (sample_rate, numpy_array) برمی‌گرداند
-    output_audio_data_numpy = core_generate_audio(actual_text, speech_prompt, speaker_voice, temperature)
-    return output_audio_data_numpy
-# --- تابع جدید برای ریست خودکار هر 24 ساعت ---
 def auto_restart_service():
     RESTART_INTERVAL_SECONDS = 24 * 60 * 60
     logging.info(f"سرویس برای ری‌استارت خودکار پس از {RESTART_INTERVAL_SECONDS / 3600:.0f} ساعت زمان‌بندی شده است.")
     time.sleep(RESTART_INTERVAL_SECONDS)
     logging.info(f"زمان ری‌استارت خودکار فرا رسیده است. برنامه برای ری‌استارت خارج می‌شود...")
     os._exit(1)
-# --- END: تابع ری‌استارت خودکار ---
 # --- CSS و Gradio UI (بدون تغییر) ---
 custom_css_inspired_by_image = f"""
 @import url('https://fonts.googleapis.com/css2?family=Vazirmatn:wght@300;400;500;700;800&display=swap');
 :root {{
-    --app-font: 'Vazirmatn', sans-serif;
-    --app-header-grad-start: #2980b9;
-    --app-header-grad-end: #2ecc71;
-    --app-panel-bg: #FFFFFF;
-    --app-input-bg: #F7F7F7;
-    --app-button-bg: #2979FF;
-    --app-main-bg: linear-gradient(170deg, #E0F2FE 0%, #F3E8FF 100%);
-    --app-text-primary: #333;
-    --app-text-secondary: #555;
-    --app-border-color: #E0E0E0;
-    --radius-card: 20px;
-    --radius-input: 8px;
-    --shadow-card: 0 10px 30px -5px rgba(0,0,0,0.1);
-    --shadow-button: 0 4px 10px -2px rgba(41,121,255,0.5);
 }}
 body, .gradio-container {{ font-family: var(--app-font); direction: rtl; background: var(--app-main-bg); color: var(--app-text-primary); font-size: 16px; line-height: 1.65; }}
 .gradio-container {{ max-width:100% !important; min-height:100vh; margin:0 !important; padding:0 !important; display:flex; flex-direction:column; }}
@@ -331,7 +319,6 @@ body, .gradio-container {{ font-family: var(--app-font); direction: rtl; backgro
 .main-content-panel-alpha {{ padding: 1.8rem 1.5rem; max-width: 680px; margin: -2.5rem auto 2rem auto; width: 90%; background-color: var(--app-panel-bg); border-radius: var(--radius-card); box-shadow: var(--shadow-card); position:relative; z-index:10; }}
 @media (max-width: 768px) {{ .main-content-panel-alpha {{ width: 95%; padding: 1.5rem 1rem; margin-top: -2rem; }} .app-header-alpha h1 {{font-size:2em;}} .app-header-alpha p {{font-size:1em;}} }}
 footer {{display:none !important;}}
 .gr-button.generate-button-final {{ background: var(--app-button-bg) !important; color: white !important; border:none !important; border-radius: var(--radius-input) !important; padding: 0.8rem 1.5rem !important; font-weight: 700 !important; font-size:1.05em !important; transition: all 0.3s ease; box-shadow: var(--shadow-button); width:100%; margin-top:1.5rem !important; }}
 .gr-button.generate-button-final:hover {{ filter: brightness(1.1); transform: translateY(-2px); box-shadow: 0 6px 12px -3px rgba(41,121,255,0.6);}}
 .gr-input > label + div > textarea, .gr-dropdown > label + div > div > input, .gr-dropdown > label + div > div > select, .gr-textbox > label + div > textarea, .gr-file > label + div {{ border-radius: var(--radius-input) !important; border: 1px solid var(--app-border-color) !important; background-color: var(--app-input-bg) !important; box-shadow: inset 0 1px 2px rgba(0,0,0,0.05); padding: 0.75rem !important; }}
@@ -344,7 +331,6 @@ label[for*="text_input_main_alpha_v3"] > .label-text::before {{ content: '📝';
 label[for*="speech_prompt_alpha_v3"] > .label-text::before {{ content: '🗣️'; }}
 label[for*="speaker_voice_alpha_v3"] > .label-text::before {{ content: '🎤'; }}
 label[for*="temperature_slider_alpha_v3"] > .label-text::before {{ content: '🌡️'; }}
 #output_audio_player_alpha_v3 audio {{ width: 100%; border-radius: var(--radius-input); margin-top:0.8rem; }}
 .temp_description_class_alpha_v3 {{ font-size: 0.85em; color: #777; margin-top: -0.4rem; margin-bottom: 1rem; }}
 .app-footer-final {{text-align:center;font-size:0.9em;color: var(--app-text-secondary);opacity:0.8; margin-top:3rem;padding:1.5rem 0; border-top:1px solid var(--app-border-color);}}
@@ -357,56 +343,27 @@ alpha_header_html_v3 = """
 </div>
 """
-# --- رابط کاربری Gradio ---
 with gr.Blocks(theme=gr.themes.Base(font=[gr.themes.GoogleFont("Vazirmatn")]), css=custom_css_inspired_by_image, title="آلفا TTS") as demo:
     gr.HTML(alpha_header_html_v3)
     with gr.Column(elem_classes=["main-content-panel-alpha"]):
         use_file_input_cb = gr.Checkbox(label="📄 استفاده از فایل متنی (.txt)", value=False, elem_id="use_file_cb_alpha_v3")
-        uploaded_file_input = gr.File(
-            label=" ",
-            file_types=['.txt'],
-            visible=False,
-            elem_id="file_uploader_alpha_main_v3"
-        )
-        text_to_speak_tb = gr.Textbox(
-            label="متن فارسی برای تبدیل",
-            placeholder="مثال: سلام، فردا هوا چطور است؟",
-            lines=5,
-            value="",
-            visible=True,
-            elem_id="text_input_main_alpha_v3"
-        )
-        use_file_input_cb.change(
-            fn=lambda x: (gr.update(visible=x, label=" " if x else "متن فارسی برای تبدیل"), gr.update(visible=not x)),
-            inputs=use_file_input_cb,
-            outputs=[uploaded_file_input, text_to_speak_tb]
-        )
-        speech_prompt_tb = gr.Textbox(
-            label="سبک گفتار (اختیاری)",
-            placeholder="مثال: با لحنی شاد و پرانرژی",
-            value="با لحنی دوستانه و رسا صحبت کن.",
-            lines=2, elem_id="speech_prompt_alpha_v3"
-        )
-        speaker_voice_dd = gr.Dropdown(
-            SPEAKER_VOICES, label="انتخاب گوینده و لهجه", value="Charon", elem_id="speaker_voice_alpha_v3"
-        )
-        temperature_slider = gr.Slider(
-            minimum=0.1, maximum=1.5, step=0.05, value=0.9, label="میزان خلاقیت صدا",
-            elem_id="temperature_slider_alpha_v3"
-        )
         gr.Markdown("<p class='temp_description_class_alpha_v3'>مقادیر بالاتر = تنوع بیشتر، مقادیر پایین‌تر = یکنواختی بیشتر.</p>")
         generate_button = gr.Button("🚀 تولید و پخش صدا", elem_classes=["generate-button-final"], elem_id="generate_button_alpha_v3")
-        # مهم: type="numpy" را برای خروجی صو��ی تنظیم کنید
-        output_audio = gr.Audio(label=" ", type="numpy", elem_id="output_audio_player_alpha_v3")
         generate_button.click(
             fn=gradio_tts_interface,
             inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ],
-            outputs=[output_audio]
         )
         gr.Markdown("<h3 class='section-title-main-alpha' style='margin-top:2.5rem; text-align:center; border-bottom:none;'>نمونه‌های کاربردی</h3>", elem_id="examples_section_title_v3")
@@ -418,7 +375,7 @@ with gr.Blocks(theme=gr.themes.Base(font=[gr.themes.GoogleFont("Vazirmatn")]), c
             inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ],
             outputs=[output_audio],
             fn=gradio_tts_interface,
-            cache_examples=False
         )
     gr.Markdown("<p class='app-footer-final'>Alpha Language Learning © 2024</p>")
@@ -426,6 +383,7 @@ if __name__ == "__main__":
     threading.Thread(target=auto_restart_service, daemon=True, name="AutoRestartThread").start()
     if len(ALL_API_KEYS) > 0 :
-        demo.launch(server_name="0.0.0.0", server_port=int(os.getenv("PORT", 7860)))
     else:
         logging.critical("🔴 برنامه به دلیل عدم وجود کلید API جیمینای اجرا نشد. لطفاً Secrets را بررسی کنید.")

 import gradio as gr
 import base64
 import mimetypes
 import os
 import struct
 import time
 import zipfile
+from google import genai
+from google.genai import types
 import threading
 import logging
+import uuid # [IMPROVEMENT] اضافه شد برای تولید شناسه منحصر به فرد
 try:
     from pydub import AudioSegment
     PYDUB_AVAILABLE = True
 except ImportError:
     PYDUB_AVAILABLE = False
 # --- START: پیکربندی لاگینگ ---
 logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s', datefmt='%Y-%m-%d %H:%M:%S')
 # --- END: پیکربندی لاگینگ ---
+# --- START: منطق مدیریت API Key ---
 ALL_API_KEYS: list[str] = []
 NEXT_KEY_INDEX: int = 0
+KEY_LOCK: threading.Lock = threading.Lock()
 def _init_api_keys():
     global ALL_API_KEYS
+    all_keys_string = os.environ.get("ALL_GEMINI_API_KEYS")
     if all_keys_string:
         ALL_API_KEYS = [key.strip() for key in all_keys_string.split(',') if key.strip()]
     logging.info(f"✅ تعداد {len(ALL_API_KEYS)} کلید API جیمینای بارگذاری شد.")
     if not ALL_API_KEYS:
         logging.warning("⛔️ خطای حیاتی: هیچ Secret با نام ALL_GEMINI_API_KEYS یافت نشد!")
         logging.warning("   لطفاً Secret را به عنوان یک رشته با کاما جدا شده (مثال: key1,key2,key3) در تنظیمات Space خود اضافه کنید.")
 _init_api_keys()
 def get_next_api_key():
     global NEXT_KEY_INDEX, ALL_API_KEYS, KEY_LOCK
+    with KEY_LOCK:
         if not ALL_API_KEYS:
             return None, None
         key_to_use = ALL_API_KEYS[NEXT_KEY_INDEX % len(ALL_API_KEYS)]
         key_display_index = (NEXT_KEY_INDEX % len(ALL_API_KEYS)) + 1
         NEXT_KEY_INDEX += 1
         return key_to_use, key_display_index
+# --- END: منطق مدیریت API Key ---
 SPEAKER_VOICES = [
     "Achird", "Zubenelgenubi", "Vindemiatrix", "Sadachbia", "Sadaltager",
     "Rasalthgeti", "Orus", "Aoede", "Callirrhoe", "Autonoe", "Enceladus",
     "Iapetus", "Zephyr", "Puck", "Charon", "Kore", "Fenrir", "Leda"
 ]
+FIXED_MODEL_NAME = "gemini-1.5-flash-preview-0514" # استفاده از مدل جدیدتر و پایدارتر
 DEFAULT_MAX_CHUNK_SIZE = 3800
 DEFAULT_SLEEP_BETWEEN_REQUESTS = 8
+DEFAULT_OUTPUT_FILENAME_BASE = "alpha_tts_audio"
+def save_binary_file(file_name, data):
+    try:
+        with open(file_name, "wb") as f: f.write(data)
+        return file_name
+    except Exception as e:
+        logging.error(f"❌ خطا در ذخیره فایل {file_name}: {e}")
+        return None
 def convert_to_wav(audio_data: bytes, mime_type: str) -> bytes:
     parameters = parse_audio_mime_type(mime_type)
     bits_per_sample, rate = parameters["bits_per_sample"], parameters["rate"]
     num_channels, data_size = 1, len(audio_data)
     return header + audio_data
 def parse_audio_mime_type(mime_type: str) -> dict[str, int]:
+    bits, rate = 16, 24000
     for param in mime_type.split(";"):
         param = param.strip()
         if param.lower().startswith("rate="):
             try: rate = int(param.split("=", 1)[1])
+            except: pass
         elif param.startswith("audio/L"):
             try: bits = int(param.split("L", 1)[1])
+            except: pass
     return {"bits_per_sample": bits, "rate": rate}
 def smart_text_split(text, max_size=3800):
     if len(text) <= max_size: return [text]
     chunks, current_chunk = [], ""
+    sentences = re.split(r'(?<=[.!?؟])\s+', text)
     for sentence in sentences:
         if len(current_chunk) + len(sentence) + 1 > max_size:
             if current_chunk: chunks.append(current_chunk.strip())
             current_chunk = sentence
             while len(current_chunk) > max_size:
                 split_idx = next((i for i in range(max_size - 1, max_size // 2, -1) if current_chunk[i] in ['،', ',', ';', ':', ' ']), -1)
                 part, current_chunk = (current_chunk[:split_idx+1], current_chunk[split_idx+1:]) if split_idx != -1 else (current_chunk[:max_size], current_chunk[max_size:])
                 chunks.append(part.strip())
+        else: current_chunk += (" " if current_chunk else "") + sentence
     if current_chunk: chunks.append(current_chunk.strip())
     final_chunks = [c for c in chunks if c]
     return final_chunks
+def merge_audio_files_func(file_paths, output_path, request_id=""):
+    if not PYDUB_AVAILABLE: logging.warning(f"[{request_id}] ⚠️ pydub برای ادغام در دسترس نیست."); return False
     try:
+        combined = AudioSegment.empty()
+        for i, fp in enumerate(file_paths):
+            if os.path.exists(fp):
+                combined += AudioSegment.from_file(fp) + (AudioSegment.silent(duration=150) if i < len(file_paths) - 1 else AudioSegment.empty())
+            else:
+                logging.warning(f"[{request_id}] ⚠️ فایل برای ادغام پیدا نشد: {fp}")
+        combined.export(output_path, format="wav")
+        logging.info(f"[{request_id}] ✅ فایل‌ها با موفقیت در {output_path} ادغام شدند.")
+        return True
     except Exception as e:
+        logging.error(f"[{request_id}] ❌ خطا در ادغام فایل‌های صوتی: {e}"); return False
+def generate_audio_chunk_with_retry(chunk_text, prompt_text, voice, temp, request_id=""):
     if not ALL_API_KEYS:
+        logging.error(f"[{request_id}] ❌ هیچ کلید API برای تولید صدا در دسترس نیست.")
         return None
+    for _ in range(len(ALL_API_KEYS)):
         selected_api_key, key_idx_display = get_next_api_key()
         if not selected_api_key:
+            logging.warning(f"[{request_id}] ⚠️ get_next_api_key هیچ کلیدی برنگرداند. تلاش‌های باقیمانده نادیده گرفته می‌شوند.")
+            break
+        logging.info(f"[{request_id}] ⚙️ تلاش برای تولید قطعه با کلید API شماره {key_idx_display} (...{selected_api_key[-4:]})")
         try:
+            # [IMPROVEMENT] استفاده از client جدید در هر تلاش برای اطمینان از تنظیمات صحیح
+            genai.configure(api_key=selected_api_key)
+            model = genai.GenerativeModel(FIXED_MODEL_NAME)
             final_text = f'"{prompt_text}"\n{chunk_text}' if prompt_text and prompt_text.strip() else chunk_text
+            # [IMPROVEMENT] ساختار جدید API برای مدل های 1.5
+            response = model.generate_content(
+                final_text,
+                generation_config=genai.types.GenerationConfig(temperature=temp),
+                request_options={"timeout": 60},
+                # مدل های 1.5 از این ساختار جدید برای TTS استفاده می کنند
+                tools=[genai.protos.Tool(
+                    google_search_retrieval=genai.protos.GoogleSearchRetrieval(),
+                    tool_code=genai.protos.ToolCode(
+                        function_call=genai.protos.FunctionCall(
+                            name="text-to-speech",
+                            args={"text": final_text, "voice_name": voice}
+                        )
+                    )
+                )]
+            )
+            audio_part = response.candidates[0].content.parts[0]
+            if audio_part.file_data:
+                logging.info(f"[{request_id}] ✅ قطعه با موفقیت توسط کلید شماره {key_idx_display} تولید شد.")
+                return audio_part.file_data
             else:
+                logging.warning(f"[{request_id}] ⚠️ پاسخ API برای قطعه با کلید شماره {key_idx_display} بدون داده صوتی بود. تلاش با کلید بعدی...")
         except Exception as e:
+            logging.error(f"[{request_id}] ❌ خطا در تولید قطعه با کلید شماره {key_idx_display}: {e}. تلاش با کلید بعدی...")
+            # برخی خطاها نیاز به یک تاخیر کوتاه قبل از تلاش مجدد دارند
+            time.sleep(2)
+    logging.error(f"[{request_id}] ❌ تمام کلیدهای API امتحان شدند اما هیچ‌کدام موفق به تولید قطعه نشدند.")
     return None
+def core_generate_audio(text_input, prompt_input, selected_voice, temperature_val, request_id):
+    logging.info(f"[{request_id}] 🚀 شروع فرآیند تولید صدا.")
+    # [IMPROVEMENT] استفاده از شناسه منحصر به فرد برای نام‌گذاری فایل‌ها
+    output_base_name = f"{DEFAULT_OUTPUT_FILENAME_BASE}_{request_id}"
     max_chunk, sleep_time = DEFAULT_MAX_CHUNK_SIZE, DEFAULT_SLEEP_BETWEEN_REQUESTS
     text_chunks = smart_text_split(text_input, max_chunk)
     if not text_chunks:
+        logging.error(f"[{request_id}] ❌ متن قابل پردازش به قطعات کوچکتر نیست.")
         return None
+    generated_files = []
+    final_audio_file = None
+    # [IMPROVEMENT] استفاده از try/finally برای تضمین پاک‌سازی فایل‌های موقت
+    try:
+        for i, chunk in enumerate(text_chunks):
+            logging.info(f"[{request_id}] 🔊 پردازش قطعه {i+1}/{len(text_chunks)}...")
+            file_data = generate_audio_chunk_with_retry(chunk, prompt_input, selected_voice, temperature_val, request_id)
+            if file_data:
+                data_buffer = file_data.data
+                ext = mimetypes.guess_extension(file_data.mime_type) or ".wav"
+                fname_base = f"{output_base_name}_part{i+1:03d}"
+                fpath = save_binary_file(f"{fname_base}{ext}", data_buffer)
+                if fpath:
+                    generated_files.append(fpath)
+                else:
+                    logging.error(f"[{request_id}] ❌ موفق به ذخیره فایل برای قطعه {i+1} نشدیم. این قطعه نادیده گرفته می‌شود.")
+                    continue
+            else:
+                logging.error(f"[{request_id}] 🛑 فرآیند متوقف شد زیرا تولید قطعه {i+1} با تمام کلیدهای موجود ناموفق بود.")
+                # اگر یک قطعه شکست بخورد، ادامه نده
+                raise Exception(f"Failed to generate chunk {i+1}")
+            if i < len(text_chunks) - 1 and len(text_chunks) > 1:
+                time.sleep(sleep_time)
+        if not generated_files:
+            logging.error(f"[{request_id}] ❌ هیچ فایل صوتی تولید نشد.")
+            return None
+        final_output_path_base = f"{output_base_name}_final"
+        if len(generated_files) > 1:
+            if PYDUB_AVAILABLE:
+                merged_fn = f"{final_output_path_base}.wav"
+                if os.path.exists(merged_fn): os.remove(merged_fn)
+                if merge_audio_files_func(generated_files, merged_fn, request_id):
+                    final_audio_file = merged_fn
+                else:
+                    logging.warning(f"[{request_id}] ⚠️ ادغام ناموفق بود. فقط قطعه اول برگردانده می‌شود.")
+                    # اگر ادغام شکست خورد، به عنوان جایگزین، فایل اول را برگردان
+                    final_audio_file = generated_files[0]
+            else:
+                logging.warning(f"[{request_id}] ⚠️ pydub در دسترس نیست. اولین قطعه صوتی ارائه می‌شود.")
+                final_audio_file = generated_files[0]
+        else: # فقط یک فایل تولید شده است
+            final_audio_file = generated_files[0]
+        # [IMPROVEMENT] تغییر نام فایل نهایی برای سازگاری بهتر و پاک کردن شناسه
+        if final_audio_file:
+            target_ext = os.path.splitext(final_audio_file)[1]
+            final_renamed_path = f"{DEFAULT_OUTPUT_FILENAME_BASE}_final_{request_id}{target_ext}"
+            os.rename(final_audio_file, final_renamed_path)
+            # فایل نهایی را در لیست فایل های تولید شده به روز می کن��م تا در finally حذف نشود
+            generated_files.remove(final_audio_file)
+            generated_files.append(final_renamed_path)
+            logging.info(f"[{request_id}] ✅ فایل صوتی نهایی با موفقیت تولید شد: {os.path.basename(final_renamed_path)}")
+            return final_renamed_path
+        return None # اگر هیچ فایلی نهایی نشد
+    except Exception as e:
+        logging.error(f"[{request_id}] ❌ خطای کلی در حین پردازش: {e}")
+        return None
+    finally:
+        # [IMPROVEMENT] پاک‌سازی تمام فایل‌های موقت به جز فایل نهایی که برگردانده شده
+        logging.info(f"[{request_id}] 🧹 شروع پاک‌سازی فایل‌های موقت...")
+        for fp in generated_files:
+             # اگر fp همان فایل نهایی است که به کاربر ارسال می شود، آن را حذف نکن
+            if final_audio_file and os.path.abspath(fp) == os.path.abspath(final_audio_file):
+                continue
+            try:
+                if os.path.exists(fp):
+                    os.remove(fp)
+                    logging.info(f"[{request_id}] 🗑️ فایل موقت حذف شد: {fp}")
+            except Exception as e_clean:
+                logging.error(f"[{request_id}] ❌ خطا در حذف فایل موقت {fp}: {e_clean}")
+def gradio_tts_interface(use_file_input, uploaded_file, text_to_speak, speech_prompt, speaker_voice, temperature, progress=gr.Progress(track_tqdm=True)):
+    # [IMPROVEMENT] تولید شناسه منحصر به فرد برای هر درخواست
+    request_id = f"{int(time.time())}_{uuid.uuid4().hex[:8]}"
+    logging.info(f"
+    ✅ درخواست جدید با شناسه دریافت شد: {request_id}")
     actual_text = ""
     if use_file_input:
+        if uploaded_file:
             try:
                 with open(uploaded_file.name, 'r', encoding='utf-8') as f: actual_text = f.read().strip()
+                if not actual_text: logging.error(f"[{request_id}] ❌ فایل آپلود شده خالی است یا خوانده نشد."); return None
+            except Exception as e: logging.error(f"[{request_id}] ❌ خطا در خواندن فایل آپلود شده: {e}"); return None
+        else: logging.warning(f"[{request_id}] ❌ گزینه استفاده از فایل انتخاب شده اما فایلی آپلود نشده."); return None
     else:
         actual_text = text_to_speak
+        if not actual_text or not actual_text.strip(): logging.warning(f"[{request_id}] ❌ متن ورودی برای تبدیل خالی است."); return None
+    final_path = core_generate_audio(actual_text, speech_prompt, speaker_voice, temperature, request_id)
+    if final_path:
+        logging.info(f"[{request_id}] ✅ فرآیند با موفقیت به پایان رسید. فایل صوتی برای کاربر ارسال می‌شود.")
+    else:
+        logging.error(f"[{request_id}] ❌ فرآیند ناموفق بود. هیچ فایلی برای کاربر ارسال نمی‌شود.")
+    return final_path
 def auto_restart_service():
     RESTART_INTERVAL_SECONDS = 24 * 60 * 60
     logging.info(f"سرویس برای ری‌استارت خودکار پس از {RESTART_INTERVAL_SECONDS / 3600:.0f} ساعت زمان‌بندی شده است.")
     time.sleep(RESTART_INTERVAL_SECONDS)
     logging.info(f"زمان ری‌استارت خودکار فرا رسیده است. برنامه برای ری‌استارت خارج می‌شود...")
     os._exit(1)
 # --- CSS و Gradio UI (بدون تغییر) ---
 custom_css_inspired_by_image = f"""
 @import url('https://fonts.googleapis.com/css2?family=Vazirmatn:wght@300;400;500;700;800&display=swap');
 :root {{
+    --app-font: 'Vazirmatn', sans-serif; --app-header-grad-start: #2980b9; --app-header-grad-end: #2ecc71; --app-panel-bg: #FFFFFF; --app-input-bg: #F7F7F7; --app-button-bg: #2979FF; --app-main-bg: linear-gradient(170deg, #E0F2FE 0%, #F3E8FF 100%); --app-text-primary: #333; --app-text-secondary: #555; --app-border-color: #E0E0E0; --radius-card: 20px; --radius-input: 8px; --shadow-card: 0 10px 30px -5px rgba(0,0,0,0.1); --shadow-button: 0 4px 10px -2px rgba(41,121,255,0.5);
 }}
 body, .gradio-container {{ font-family: var(--app-font); direction: rtl; background: var(--app-main-bg); color: var(--app-text-primary); font-size: 16px; line-height: 1.65; }}
 .gradio-container {{ max-width:100% !important; min-height:100vh; margin:0 !important; padding:0 !important; display:flex; flex-direction:column; }}
 .main-content-panel-alpha {{ padding: 1.8rem 1.5rem; max-width: 680px; margin: -2.5rem auto 2rem auto; width: 90%; background-color: var(--app-panel-bg); border-radius: var(--radius-card); box-shadow: var(--shadow-card); position:relative; z-index:10; }}
 @media (max-width: 768px) {{ .main-content-panel-alpha {{ width: 95%; padding: 1.5rem 1rem; margin-top: -2rem; }} .app-header-alpha h1 {{font-size:2em;}} .app-header-alpha p {{font-size:1em;}} }}
 footer {{display:none !important;}}
 .gr-button.generate-button-final {{ background: var(--app-button-bg) !important; color: white !important; border:none !important; border-radius: var(--radius-input) !important; padding: 0.8rem 1.5rem !important; font-weight: 700 !important; font-size:1.05em !important; transition: all 0.3s ease; box-shadow: var(--shadow-button); width:100%; margin-top:1.5rem !important; }}
 .gr-button.generate-button-final:hover {{ filter: brightness(1.1); transform: translateY(-2px); box-shadow: 0 6px 12px -3px rgba(41,121,255,0.6);}}
 .gr-input > label + div > textarea, .gr-dropdown > label + div > div > input, .gr-dropdown > label + div > div > select, .gr-textbox > label + div > textarea, .gr-file > label + div {{ border-radius: var(--radius-input) !important; border: 1px solid var(--app-border-color) !important; background-color: var(--app-input-bg) !important; box-shadow: inset 0 1px 2px rgba(0,0,0,0.05); padding: 0.75rem !important; }}
 label[for*="speech_prompt_alpha_v3"] > .label-text::before {{ content: '🗣️'; }}
 label[for*="speaker_voice_alpha_v3"] > .label-text::before {{ content: '🎤'; }}
 label[for*="temperature_slider_alpha_v3"] > .label-text::before {{ content: '🌡️'; }}
 #output_audio_player_alpha_v3 audio {{ width: 100%; border-radius: var(--radius-input); margin-top:0.8rem; }}
 .temp_description_class_alpha_v3 {{ font-size: 0.85em; color: #777; margin-top: -0.4rem; margin-bottom: 1rem; }}
 .app-footer-final {{text-align:center;font-size:0.9em;color: var(--app-text-secondary);opacity:0.8; margin-top:3rem;padding:1.5rem 0; border-top:1px solid var(--app-border-color);}}
 </div>
 """
 with gr.Blocks(theme=gr.themes.Base(font=[gr.themes.GoogleFont("Vazirmatn")]), css=custom_css_inspired_by_image, title="آلفا TTS") as demo:
     gr.HTML(alpha_header_html_v3)
     with gr.Column(elem_classes=["main-content-panel-alpha"]):
         use_file_input_cb = gr.Checkbox(label="📄 استفاده از فایل متنی (.txt)", value=False, elem_id="use_file_cb_alpha_v3")
+        uploaded_file_input = gr.File(label=" ", file_types=['.txt'], visible=False, elem_id="file_uploader_alpha_main_v3")
+        text_to_speak_tb = gr.Textbox(label="متن فارسی برای تبدیل", placeholder="مثال: سلام، فردا هوا چطور است؟", lines=5, value="", visible=True, elem_id="text_input_main_alpha_v3")
+        use_file_input_cb.change(fn=lambda x: (gr.update(visible=x, label=" " if x else "متن فارسی برای تبدیل"), gr.update(visible=not x)), inputs=use_file_input_cb, outputs=[uploaded_file_input, text_to_speak_tb])
+        speech_prompt_tb = gr.Textbox(label="سبک گفتار (اختیاری)", placeholder="مثال: با لحنی شاد و پرانرژی", value="با لحنی دوستانه و رسا صحبت کن.", lines=2, elem_id="speech_prompt_alpha_v3")
+        speaker_voice_dd = gr.Dropdown(SPEAKER_VOICES, label="انتخاب گوینده و لهجه", value="Charon", elem_id="speaker_voice_alpha_v3")
+        temperature_slider = gr.Slider(minimum=0.1, maximum=1.5, step=0.05, value=0.9, label="میزان خلاقیت صدا", elem_id="temperature_slider_alpha_v3")
         gr.Markdown("<p class='temp_description_class_alpha_v3'>مقادیر بالاتر = تنوع بیشتر، مقادیر پایین‌تر = یکنواختی بیشتر.</p>")
         generate_button = gr.Button("🚀 تولید و پخش صدا", elem_classes=["generate-button-final"], elem_id="generate_button_alpha_v3")
+        output_audio = gr.Audio(label=" ", type="filepath", elem_id="output_audio_player_alpha_v3")
         generate_button.click(
             fn=gradio_tts_interface,
             inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ],
+            outputs=[output_audio]
         )
         gr.Markdown("<h3 class='section-title-main-alpha' style='margin-top:2.5rem; text-align:center; border-bottom:none;'>نمونه‌های کاربردی</h3>", elem_id="examples_section_title_v3")
             inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ],
             outputs=[output_audio],
             fn=gradio_tts_interface,
+            cache_examples=False
         )
     gr.Markdown("<p class='app-footer-final'>Alpha Language Learning © 2024</p>")
     threading.Thread(target=auto_restart_service, daemon=True, name="AutoRestartThread").start()
     if len(ALL_API_KEYS) > 0 :
+        # [IMPROVEMENT] افزایش تعداد تردها در صف برای مدیریت بهتر کاربران همزمان
+        demo.queue(default_concurrency_limit=10).launch(server_name="0.0.0.0", server_port=int(os.getenv("PORT", 7860)))
     else:
         logging.critical("🔴 برنامه به دلیل عدم وجود کلید API جیمینای اجرا نشد. لطفاً Secrets را بررسی کنید.")