Ttspro2

Sleeping

App Files Files Community

Hamed744 commited on Jun 5, 2025

Commit

4e27563

verified ·

1 Parent(s): e18004c

Update app.py

Browse files

Files changed (1) hide show

app.py +253 -145

app.py CHANGED Viewed

@@ -6,56 +6,43 @@ import re
 import struct
 import time
 import zipfile
-import importlib.metadata # برای بررسی نسخه پکیج
-# --- START: Import کتابخانه‌های گوگل با بررسی دقیق‌تر ---
 GOOGLE_LIBS_AVAILABLE = False
-GENAI_CLIENT_AVAILABLE = False
-def _log_startup(message): # تابع لاگ مخصوص این بخش
     print(f"[Startup Log] {message}")
 try:
-    # ابتدا سعی در import کردن google.generativeai
     import google.generativeai as genai
     _log_startup("ماژول 'google.generativeai' با موفقیت به عنوان 'genai' وارد شد.")
-    # بررسی نسخه نصب شده
     try:
         version = importlib.metadata.version('google-generativeai')
         _log_startup(f"نسخه نصب شده 'google-generativeai': {version}")
     except importlib.metadata.PackageNotFoundError:
         _log_startup("هشدار: پکیج 'google-generativeai' نصب شده، اما نسخه‌ی آن قابل تشخیص نیست.")
-    # بررسی وجود Client
-    if hasattr(genai, 'Client'):
-        _log_startup("ویژگی 'Client' در ماژول 'genai' (google.generativeai) یافت شد.")
-        GENAI_CLIENT_AVAILABLE = True
     else:
-        _log_startup("⛔️ خطای مهم: ویژگی 'Client' در ماژول 'genai' (google.generativeai) یافت نشد.")
-        _log_startup(f"   محتویات ماژول genai: {dir(genai)}") # نمایش تمام محتویات برای دیباگ بیشتر
-    # Import کردن types و exceptions
-    from google.generativeai import types
     from google.api_core import exceptions as google_exceptions
     _log_startup("'types' و 'google_exceptions' با موفقیت وارد شدند.")
     GOOGLE_LIBS_AVAILABLE = True
 except ImportError as e:
     _log_startup(f"❌ خطای حیاتی در Import: {e}")
-    _log_startup("   لطفاً از صحت 'google-generativeai' و 'google-api-core' در requirements.txt و ری‌استارت کامل Space مطمئن شوید.")
 except Exception as e_other:
     _log_startup(f"❌ خطای ناشناخته در حین import یا بررسی کتابخانه‌های گوگل: {e_other}")
 # --- END: Import کتابخانه‌های گوگل ---
-try:
-    from pydub import AudioSegment
-    PYDUB_AVAILABLE = True
-except ImportError:
-    _log_startup("⚠️ کتابخانه pydub یافت نشد. قابلیت ادغام فایل‌های صوتی غیرفعال خواهد بود.")
-    PYDUB_AVAILABLE = False
 # --- START: منطق چرخش API Key (بدون تغییر نسبت به قبل) ---
 GEMINI_API_KEYS = []
 i = 1
@@ -82,26 +69,13 @@ def advance_global_key_index_for_next_request():
     global CURRENT_KEY_INDEX_GLOBAL
     if NUM_API_KEYS > 0: CURRENT_KEY_INDEX_GLOBAL = (CURRENT_KEY_INDEX_GLOBAL + 1) % NUM_API_KEYS
 # --- END: منطق چرخش API Key ---
-# ... (بقیه کد شامل SPEAKER_VOICES, FIXED_MODEL_NAME, توابع save_binary_file, convert_to_wav, etc. بدون تغییر باقی می‌ماند) ...
-# ... فقط مطمئن شوید که در core_generate_audio، قبل از استفاده از genai.Client، چک GENAI_CLIENT_AVAILABLE را اضافه کنید ...
-# تابع core_generate_audio با یک بررسی اضافه در ابتدا
-def core_generate_audio(text_input, prompt_input, selected_voice, temperature_val):
-    if not GOOGLE_LIBS_AVAILABLE or not GENAI_CLIENT_AVAILABLE:
-        _log("❌ کتابخانه‌های گوگل یا genai.Client به درستی بارگذاری نشده‌اند. امکان تولید صدا وجود ندارد.")
-        return None
-    # ... (بقیه کد core_generate_audio که قبلاً داشتید، از اینجا شروع می‌شود) ...
-    # ... و به جای if not GOOGLE_LIBS_AVAILABLE: در ابتدای تابع قبلی، حالا از GENAI_CLIENT_AVAILABLE هم چک می‌کنید ...
-    _log("🚀 شروع فرآیند تولید صدا...")
-    # ... (بقیه کد core_generate_audio بدون تغییر)
-    # client = genai.Client(api_key=selected_api_key) # این خط باید بعد از بررسی GENAI_CLIENT_AVAILABLE باشد
-# ... (بقیه کد شامل SPEAKER_VOICES, FIXED_MODEL_NAME, توابع save_binary_file, convert_to_wav, etc. باید از نسخه کامل قبلی کپی شود)
-# این یک خلاصه است، کد کامل قبلی را با تغییرات بخش import ترکیب کنید.
-# --- کد کامل توابع کمکی (برای اطمینان از کامل بودن) ---
 SPEAKER_VOICES = [
     "Achird", "Zubenelgenubi", "Vindemiatrix", "Sadachbia", "Sadaltager",
     "Sulafat", "Laomedeia", "Achernar", "Alnilam", "Schedar", "Gacrux",
@@ -109,12 +83,39 @@ SPEAKER_VOICES = [
     "Rasalthgeti", "Orus", "Aoede", "Callirrhoe", "Autonoe", "Enceladus",
     "Iapetus", "Zephyr", "Puck", "Charon", "Kore", "Fenrir", "Leda"
 ]
-FIXED_MODEL_NAME = "gemini-2.5-flash-preview-tts"
 DEFAULT_MAX_CHUNK_SIZE = 3800
 DEFAULT_SLEEP_BETWEEN_REQUESTS = 6
 RETRY_SLEEP_AFTER_QUOTA_ERROR = 2
 DEFAULT_OUTPUT_FILENAME_BASE = "alpha_tts_audio"
 def save_binary_file(file_name, data):
     try:
         with open(file_name, "wb") as f: f.write(data)
@@ -122,7 +123,6 @@ def save_binary_file(file_name, data):
     except Exception as e:
         _log(f"❌ خطا در ذخیره فایل {file_name}: {e}")
         return None
 def convert_to_wav(audio_data: bytes, mime_type: str) -> bytes:
     parameters = parse_audio_mime_type(mime_type)
     bits_per_sample, rate = parameters["bits_per_sample"], parameters["rate"]
@@ -131,23 +131,20 @@ def convert_to_wav(audio_data: bytes, mime_type: str) -> bytes:
     byte_rate, chunk_size = rate * block_align, 36 + data_size
     header = struct.pack("<4sI4s4sIHHIIHH4sI", b"RIFF", chunk_size, b"WAVE", b"fmt ", 16, 1, num_channels, rate, byte_rate, block_align, bits_per_sample, b"data", data_size)
     return header + audio_data
 def parse_audio_mime_type(mime_type: str) -> dict[str, int]:
-    bits, rate = 16, 24000
     for param in mime_type.split(";"):
         param = param.strip()
-        if param.lower().startswith("rate="):
             try: rate = int(param.split("=", 1)[1])
             except: pass
         elif param.startswith("audio/L"):
             try: bits = int(param.split("L", 1)[1])
             except: pass
     return {"bits_per_sample": bits, "rate": rate}
 def smart_text_split(text, max_size=3800):
     if len(text) <= max_size: return [text]
-    chunks, current_chunk = [], ""
-    sentences = re.split(r'(?<=[.!?؟۔])\s+', text)
     for sentence in sentences:
         if len(current_chunk) + len(sentence) + 1 > max_size:
             if current_chunk: chunks.append(current_chunk.strip())
@@ -155,63 +152,53 @@ def smart_text_split(text, max_size=3800):
             while len(current_chunk) > max_size:
                 split_idx = -1
                 for char_to_find in ['،', ',', ';', ':', ' ']:
-                    try:
-                        split_idx = current_chunk.rindex(char_to_find, max_size // 2, max_size)
-                        break
-                    except ValueError:
-                        continue
-                if split_idx != -1:
-                    part = current_chunk[:split_idx+1]
-                    current_chunk = current_chunk[split_idx+1:]
-                else:
-                    part = current_chunk[:max_size]
-                    current_chunk = current_chunk[max_size:]
                 chunks.append(part.strip())
-        else:
-            if current_chunk:
-                current_chunk += " " + sentence
-            else:
-                current_chunk = sentence
     if current_chunk: chunks.append(current_chunk.strip())
-    final_chunks = [c for c in chunks if c]
-    return final_chunks
 def merge_audio_files_func(file_paths, output_path):
-    if not PYDUB_AVAILABLE: _log("⚠️ pydub برای ادغام در دسترس نیست."); return False
     try:
         combined = AudioSegment.empty()
         for i, fp in enumerate(file_paths):
             if os.path.exists(fp): combined += AudioSegment.from_file(fp) + (AudioSegment.silent(duration=150) if i < len(file_paths) - 1 else AudioSegment.empty())
-            else: _log(f"⚠️ فایل برای ادغام پیدا نشد: {fp}")
-        combined.export(output_path, format="wav")
-        return True
-    except Exception as e: _log(f"❌ خطا در ادغام فایل‌های صوتی: {e}"); return False
 def core_generate_audio(text_input, prompt_input, selected_voice, temperature_val):
-    if not GOOGLE_LIBS_AVAILABLE: # اولین بررسی
-        _log("❌ کتابخانه‌های گوگل به طور کلی بارگذاری نشده‌اند.")
-        return None
-    if not GENAI_CLIENT_AVAILABLE: # بررسی وجود Client
-        _log("❌ ویژگی 'Client' در کتابخانه 'google.generativeai' یافت نشد. لطفاً نسخه کتابخانه را بررسی کنید.")
         return None
     if NUM_API_KEYS == 0:
-        _log("❌ هیچ کلید API برای استفاده موجود نیست.")
         return None
-    _log("🚀 شروع فرآیند تولید صدا...")
     output_base_name = DEFAULT_OUTPUT_FILENAME_BASE
     max_chunk, sleep_time = DEFAULT_MAX_CHUNK_SIZE, DEFAULT_SLEEP_BETWEEN_REQUESTS
     if not text_input or not text_input.strip():
-        _log("❌ متن ورودی خالی است.")
-        advance_global_key_index_for_next_request()
-        return None
     text_chunks = smart_text_split(text_input, max_chunk)
     if not text_chunks:
-        _log("❌ متن قابل پردازش به قطعات کوچکتر نیست.")
-        advance_global_key_index_for_next_request()
-        return None
     generated_files = []
     all_chunks_processed = True
@@ -222,58 +209,203 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
         max_attempts_for_chunk = NUM_API_KEYS
         for attempt_num_for_chunk in range(max_attempts_for_chunk):
-            selected_api_key, key_display_num, actual_key_idx = get_api_key_for_attempt(attempt_num_for_chunk)
-            _log(f"     प्रयास {attempt_num_for_chunk + 1}/{max_attempts_for_chunk} برای قطعه {chunk_idx+1} با کلید شماره {key_display_num} (...{selected_api_key[-4:]})")
             try:
-                client = genai.Client(api_key=selected_api_key)
                 if prompt_input and prompt_input.strip():
                     processed_prompt = prompt_input.strip()
                     if not re.search(r'[.!?؟،:۔]$', processed_prompt): processed_prompt += "،"
                     final_text_for_api = f"{processed_prompt} {chunk_text.strip()}"
                 else: final_text_for_api = chunk_text.strip()
-                contents = [types.Content(role="user", parts=[types.Part.from_text(text=final_text_for_api)])]
-                config = types.GenerateContentConfig(temperature=temperature_val, response_modalities=["audio"],
                     speech_config=types.SpeechConfig(voice_config=types.VoiceConfig(
-                        prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=selected_voice))))
-                fname_base = f"{output_base_name}_part{chunk_idx+1:03d}"
-                response = client.models.generate_content(model=FIXED_MODEL_NAME, contents=contents, config=config)
                 if response.candidates and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data:
-                    inline_data = response.candidates[0].content.parts[0].inline_data; data_buffer = inline_data.data
-                    ext = mimetypes.guess_extension(inline_data.mime_type) or ".wav"
-                    if "audio/L" in inline_data.mime_type and ext == ".wav": data_buffer = convert_to_wav(data_buffer, inline_data.mime_type)
                     if not ext.startswith("."): ext = "." + ext
                     temp_fpath_for_chunk = f"{fname_base}{ext}"
                     if os.path.exists(temp_fpath_for_chunk):
                         try: os.remove(temp_fpath_for_chunk)
                         except OSError: pass
                     fpath = save_binary_file(temp_fpath_for_chunk, data_buffer)
                     if fpath:
                         generated_files.append(fpath); chunk_processed_successfully = True
                         _log(f"      ✅ قطعه {chunk_idx+1} با کلید شماره {key_display_num} موفقیت آمیز بود.")
                         if chunk_idx < len(text_chunks) - 1: time.sleep(DEFAULT_SLEEP_BETWEEN_REQUESTS)
                         break
-                else: _log(f"      ⚠️ پاسخ API برای قطعه {chunk_idx+1} با کلید {key_display_num} بدون داده صوتی بود.")
             except google_exceptions.ResourceExhausted as e_quota:
                 _log(f"      ❌ خطای سهمیه برای قطعه {chunk_idx+1} با کلید شماره {key_display_num}: {str(e_quota)[:100]}...")
                 if attempt_num_for_chunk < max_attempts_for_chunk - 1:
                     _log(f"         ... تلاش با کلید بعدی پس از {RETRY_SLEEP_AFTER_QUOTA_ERROR} ثانیه."); time.sleep(RETRY_SLEEP_AFTER_QUOTA_ERROR)
                 else: _log(f"      ⛔️ تمام کلیدهای API برای قطعه {chunk_idx+1} امتحان شدند (خطای سهمیه)."); all_chunks_processed = False
             except Exception as e_general:
-                _log(f"      ❌ خطای عمومی در تولید قطعه {chunk_idx+1} با کلید {key_display_num}: {type(e_general).__name__} - {str(e_general)[:150]}")
                 if attempt_num_for_chunk < max_attempts_for_chunk - 1: time.sleep(RETRY_SLEEP_AFTER_QUOTA_ERROR)
                 else: all_chunks_processed = False
             if chunk_processed_successfully: break
         if not chunk_processed_successfully:
             _log(f"  ⛔️ پردازش قطعه {chunk_idx+1} پس از {max_attempts_for_chunk} تلاش ناموفق بود."); all_chunks_processed = False; break
     advance_global_key_index_for_next_request()
     if not all_chunks_processed or not generated_files:
         _log("❌ هیچ فایل صوتی معتبری تولید نشد.")
-        for fp in generated_files:
-            try: os.remove(fp)
             except: pass
         return None
     final_audio_file = None; final_output_path_base = f"{DEFAULT_OUTPUT_FILENAME_BASE}_final"
@@ -289,9 +421,9 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
                         if os.path.exists(renamed_first_chunk): os.remove(renamed_first_chunk)
                         os.rename(generated_files[0], renamed_first_chunk); final_audio_file = renamed_first_chunk
                     except Exception as e_rename: _log(f"خطا در تغییر نام اولین قطعه: {e_rename}"); final_audio_file = generated_files[0]
-            for fp_cleanup in generated_files:
-                if final_audio_file and os.path.abspath(fp_cleanup) == os.path.abspath(final_audio_file): continue
-                try: os.remove(fp_cleanup)
                 except: pass
         else:
             _log("⚠️ pydub نیست. اولین قطعه ارائه می‌شود.")
@@ -303,18 +435,20 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
                     for i_gf in range(1, len(generated_files)):
                         try: os.remove(generated_files[i_gf])
                         except: pass
-                except Exception as e_rename_single: _log(f"خطا در تغییر نام (بدون pydub): {e_rename_single}"); final_audio_file = generated_files[0]
     elif len(generated_files) == 1:
         try:
             target_ext = os.path.splitext(generated_files[0])[1]; final_single_fn = f"{final_output_path_base}{target_ext}"
             if os.path.exists(final_single_fn): os.remove(final_single_fn)
             os.rename(generated_files[0], final_single_fn); final_audio_file = final_single_fn
-        except Exception as e_rename_single_final: _log(f"خطا در تغییر نام فایل تکی: {e_rename_single_final}"); final_audio_file = generated_files[0]
     if final_audio_file and os.path.exists(final_audio_file): _log(f"✅ فایل نهایی: {os.path.basename(final_audio_file)}")
     elif final_audio_file: _log(f"⚠️ فایل نهایی '{final_audio_file}' وجود ندارد!"); return None
     else: _log(f"❓ وضعیت نامشخص برای فایل نهایی."); return None
     return final_audio_file
 def gradio_tts_interface(use_file_input, uploaded_file, text_to_speak, speech_prompt, speaker_voice, temperature, progress=gr.Progress(track_tqdm=True)):
     actual_text = ""
     if use_file_input:
@@ -327,47 +461,21 @@ def gradio_tts_interface(use_file_input, uploaded_file, text_to_speak, speech_pr
     else:
         actual_text = text_to_speak
         if not actual_text or not actual_text.strip(): _log("❌ متن ورودی خالی."); return None
-    if not GOOGLE_LIBS_AVAILABLE or not GENAI_CLIENT_AVAILABLE:
-        gr.Warning("خطای سیستمی: کتابخانه‌های مورد نیاز بارگذاری نشده‌اند.")
         return None
     if NUM_API_KEYS == 0:
         gr.Warning("خطای سیستمی: کلید API موجود نیست.")
         return None
-    final_path = core_generate_audio(actual_text, speech_prompt, speaker_voice, temperature)
     if final_path is None:
         gr.Info("امکان تولید صدا وجود ندارد. لطفاً دقایقی دیگر یا با متن کوتاه‌تری امتحان کنید.")
     return final_path
-# --- CSS و UI (بدون تغییر نسبت به نسخه کامل قبلی) ---
-custom_css_inspired_by_image = f"""
-@import url('https://fonts.googleapis.com/css2?family=Vazirmatn:wght@300;400;500;700;800&display=swap');
-:root {{ --app-font: 'Vazirmatn', sans-serif; --app-header-grad-start: #2980b9; --app-header-grad-end: #2ecc71; --app-panel-bg: #FFFFFF; --app-input-bg: #F7F7F7; --app-button-bg: #2979FF; --app-main-bg: linear-gradient(170deg, #E0F2FE 0%, #F3E8FF 100%); --app-text-primary: #333; --app-text-secondary: #555; --app-border-color: #E0E0E0; --radius-card: 20px; --radius-input: 8px; --shadow-card: 0 10px 30px -5px rgba(0,0,0,0.1); --shadow-button: 0 4px 10px -2px rgba(41,121,255,0.5);}}
-body, .gradio-container {{ font-family: var(--app-font); direction: rtl; background: var(--app-main-bg); color: var(--app-text-primary); font-size: 16px; line-height: 1.65; }}
-.gradio-container {{ max-width:100% !important; min-height:100vh; margin:0 !important; padding:0 !important; display:flex; flex-direction:column; }}
-.app-header-alpha {{ padding: 3rem 1.5rem 4rem 1.5rem; text-align: center; background-image: linear-gradient(135deg, var(--app-header-grad-start) 0%, var(--app-header-grad-end) 100%); color: white; border-bottom-left-radius: var(--radius-card); border-bottom-right-radius: var(--radius-card); box-shadow: 0 6px 20px -5px rgba(0,0,0,0.2); }}
-.app-header-alpha h1 {{ font-size: 2.4em; font-weight: 800; margin:0 0 0.5rem 0; text-shadow: 0 2px 4px rgba(0,0,0,0.15); }}
-.app-header-alpha p {{ font-size: 1.1em; color: rgba(255,255,255,0.9); margin-top:0; opacity: 0.9; }}
-.main-content-panel-alpha {{ padding: 1.8rem 1.5rem; max-width: 680px; margin: -2.5rem auto 2rem auto; width: 90%; background-color: var(--app-panel-bg); border-radius: var(--radius-card); box-shadow: var(--shadow-card); position:relative; z-index:10; }}
-@media (max-width: 768px) {{ .main-content-panel-alpha {{ width: 95%; padding: 1.5rem 1rem; margin-top: -2rem; }} .app-header-alpha h1 {{font-size:2em;}} .app-header-alpha p {{font-size:1em;}} }}
-footer {{display:none !important;}}
-.gr-button.generate-button-final {{ background: var(--app-button-bg) !important; color: white !important; border:none !important; border-radius: var(--radius-input) !important; padding: 0.8rem 1.5rem !important; font-weight: 700 !important; font-size:1.05em !important; transition: all 0.3s ease; box-shadow: var(--shadow-button); width:100%; margin-top:1.5rem !important; }}
-.gr-button.generate-button-final:hover {{ filter: brightness(1.1); transform: translateY(-2px); box-shadow: 0 6px 12px -3px rgba(41,121,255,0.6);}}
-.gr-input > label + div > textarea, .gr-dropdown > label + div > div > input, .gr-dropdown > label + div > div > select, .gr-textbox > label + div > textarea, .gr-file > label + div {{ border-radius: var(--radius-input) !important; border: 1px solid var(--app-border-color) !important; background-color: var(--app-input-bg) !important; box-shadow: inset 0 1px 2px rgba(0,0,0,0.05); padding: 0.75rem !important; }}
-.gr-file > label + div {{ text-align:center; border-style: dashed !important; }}
-.gr-input > label + div > textarea:focus, .gr-dropdown > label + div > div > input:focus, .gr-textbox > label + div > textarea:focus {{ border-color: var(--app-button-bg) !important; box-shadow: 0 0 0 3px rgba(41,121,255,0.2) !important; }}
-label > .label-text {{ font-weight: 700 !important; color: var(--app-text-primary) !important; font-size: 0.95em !important; margin-bottom: 0.5rem !important; }}
-.section-title-main-alpha {{ font-size: 1.1em; color: var(--app-text-secondary); margin-bottom:1rem; padding-bottom: 0.5rem; border-bottom: 1px solid var(--app-border-color); font-weight:500; text-align:right; }}
-label > .label-text::before {{ margin-left: 8px; vertical-align: middle; opacity: 0.7; }}
-label[for*="text_input_main_alpha_v3"] > .label-text::before {{ content: '📝'; }}
-label[for*="speech_prompt_alpha_v3"] > .label-text::before {{ content: '🗣️'; }}
-label[for*="speaker_voice_alpha_v3"] > .label-text::before {{ content: '🎤'; }}
-label[for*="temperature_slider_alpha_v3"] > .label-text::before {{ content: '🌡️'; }}
-#output_audio_player_alpha_v3 audio {{ width: 100%; border-radius: var(--radius-input); margin-top:0.8rem; }}
-.temp_description_class_alpha_v3 {{ font-size: 0.85em; color: #777; margin-top: -0.4rem; margin-bottom: 1rem; }}
-.app-footer-final {{text-align:center;font-size:0.9em;color: var(--app-text-secondary);opacity:0.8; margin-top:3rem;padding:1.5rem 0; border-top:1px solid var(--app-border-color);}}"""
 alpha_header_html_v3 = """<div class='app-header-alpha'><h1>Alpha TTS</h1><p>جادوی تبدیل متن به صدا در دستان شما</p></div>"""
-if GOOGLE_LIBS_AVAILABLE and GENAI_CLIENT_AVAILABLE:
     with gr.Blocks(theme=gr.themes.Base(font=[gr.themes.GoogleFont("Vazirmatn")]), css=custom_css_inspired_by_image, title="آلفا TTS") as demo:
         gr.HTML(alpha_header_html_v3)
         with gr.Column(elem_classes=["main-content-panel-alpha"]):
@@ -376,24 +484,24 @@ if GOOGLE_LIBS_AVAILABLE and GENAI_CLIENT_AVAILABLE:
             text_to_speak_tb = gr.Textbox(label="متن فارسی برای تبدیل", placeholder="مثال: سلام، فردا هوا چطور است؟", lines=5, value="", visible=True, elem_id="text_input_main_alpha_v3")
             use_file_input_cb.change(fn=lambda x: (gr.update(visible=x, label=" " if x else "متن فارسی برای تبدیل"), gr.update(visible=not x)), inputs=use_file_input_cb, outputs=[uploaded_file_input, text_to_speak_tb])
             speech_prompt_tb = gr.Textbox(label="سبک گفتار (اختیاری)", placeholder="مثال: با لحنی شاد و پرانرژی", value="با لحنی دوستانه و رسا صحبت کن.", lines=2, elem_id="speech_prompt_alpha_v3")
-            speaker_voice_dd = gr.Dropdown(SPEAKER_VOICES, label="انتخاب گوینده و لهجه", value="Charon", elem_id="speaker_voice_alpha_v3")
             temperature_slider = gr.Slider(minimum=0.1, maximum=1.5, step=0.05, value=0.9, label="میزان خلاقیت صدا", elem_id="temperature_slider_alpha_v3")
             gr.Markdown("<p class='temp_description_class_alpha_v3'>مقادیر بالاتر = تنوع بیشتر، مقادیر پایین‌تر = یکنواختی بیشتر.</p>")
             generate_button = gr.Button("🚀 تولید و پخش صدا", elem_classes=["generate-button-final"], elem_id="generate_button_alpha_v3")
             output_audio = gr.Audio(label=" ", type="filepath", elem_id="output_audio_player_alpha_v3")
             generate_button.click(fn=gradio_tts_interface, inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ], outputs=[output_audio])
             gr.Markdown("<h3 class='section-title-main-alpha' style='margin-top:2.5rem; text-align:center; border-bottom:none;'>نمونه‌های کاربردی</h3>", elem_id="examples_section_title_v3")
-            gr.Examples(examples=[[False,None,"سلام بر شما، امیدوارم روز خوبی داشته باشید.","با لحنی گرم و صمیمی.","Zephyr",0.85],[False,None,"این یک آزمایش برای بررسی کیفیت صدای تولید شده توسط هوش مصنوعی آلفا است. امیدوارم از نتیجه راضی باشید.","با صدایی طبیعی و روان.","Charon",0.9],[False,None,"آیا می‌توانم سوالی از شما بپرسم؟ لطفاً راهنمایی کنید.","با کنجکاوی","Puck",0.95],[False,None,"این یک متن بسیار طولانی است که به احتمال زیاد به چندین قطعه تقسیم خواهد شد. هدف از این نمونه، بررسی عملکرد صحیح تقسیم متن و همچنین آزمایش مکانیزم چرخش کلید API در صورتی که سهمیه یک کلید در حین پردازش تمام شود، می‌باشد. امیدواریم که برنامه بتواند به طور خودکار به کلید بعدی سوئیچ کرده و فرآیند تولید صدا را با موفقیت به اتمام برساند. این بخش اول است. این بخش دوم است. و این هم بخش سوم برای طولانی‌تر کردن متن.","با لحنی آرام و واضح","Achird",0.8],], inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ], outputs=[output_audio], fn=gradio_tts_interface, cache_examples=False )
         gr.Markdown("<p class='app-footer-final'>Alpha Language Learning © 2024</p>")
 if __name__ == "__main__":
-    if GOOGLE_LIBS_AVAILABLE and GENAI_CLIENT_AVAILABLE and NUM_API_KEYS > 0:
         demo.launch()
     else:
         if not GOOGLE_LIBS_AVAILABLE: msg = "کتابخانه‌های گوگل بارگذاری نشدند."
-        elif not GENAI_CLIENT_AVAILABLE: msg = "'genai.Client' یافت نشد. نسخه کتابخانه را بررسی کنید."
         elif NUM_API_KEYS == 0: msg = "هیچ کلید API یافت نشد."
-        else: msg = "خطای ناشناخته در شروع برنامه."
         _log(f"🔴 برنامه به دلیل '{msg}' اجرا نشد.")
         with gr.Blocks(title="خطا") as error_demo:
             gr.Markdown(f"# خطای اجرای برنامه\n\n**دلیل:** {msg}\n\nلطفاً لاگ‌های برنامه یا تنظیمات Space را بررسی کنید.")

 import struct
 import time
 import zipfile
+import importlib.metadata
+# --- START: Import کتابخانه‌های گوگل ---
 GOOGLE_LIBS_AVAILABLE = False
+GENAI_MODEL_ACCESS_CONFIGURED = False # برای اطمینان از اینکه configure قبل از model استفاده می‌شود
+def _log_startup(message):
     print(f"[Startup Log] {message}")
 try:
     import google.generativeai as genai
     _log_startup("ماژول 'google.generativeai' با موفقیت به عنوان 'genai' وارد شد.")
     try:
         version = importlib.metadata.version('google-generativeai')
         _log_startup(f"نسخه نصب شده 'google-generativeai': {version}")
     except importlib.metadata.PackageNotFoundError:
         _log_startup("هشدار: پکیج 'google-generativeai' نصب شده، اما نسخه‌ی آن قابل تشخیص نیست.")
+    # در نسخه‌های جدید، Client وجود ندارد، به جای آن GenerativeModel و configure استفاده می‌شود
+    if hasattr(genai, 'GenerativeModel') and hasattr(genai, 'configure'):
+        _log_startup("ویژگی‌های 'GenerativeModel' و 'configure' در ماژول 'genai' یافت شدند.")
+        GENAI_MODEL_ACCESS_CONFIGURED = True # نشان‌دهنده آمادگی برای استفاده از API جدید
     else:
+        _log_startup("⛔️ خطای مهم: 'GenerativeModel' یا 'configure' در 'genai' یافت نشد. سازگاری نسخه کتابخانه بررسی شود.")
+    from google.generativeai import types # انواع هنوز به همین شکل هستند
     from google.api_core import exceptions as google_exceptions
     _log_startup("'types' و 'google_exceptions' با موفقیت وارد شدند.")
     GOOGLE_LIBS_AVAILABLE = True
 except ImportError as e:
     _log_startup(f"❌ خطای حیاتی در Import: {e}")
 except Exception as e_other:
     _log_startup(f"❌ خطای ناشناخته در حین import یا بررسی کتابخانه‌های گوگل: {e_other}")
 # --- END: Import کتابخانه‌های گوگل ---
+# ... (بقیه import های pydub و منطق چرخش کلید API و توابع کمکی بدون تغییر باقی می‌مانند) ...
 # --- START: منطق چرخش API Key (بدون تغییر نسبت به قبل) ---
 GEMINI_API_KEYS = []
 i = 1
     global CURRENT_KEY_INDEX_GLOBAL
     if NUM_API_KEYS > 0: CURRENT_KEY_INDEX_GLOBAL = (CURRENT_KEY_INDEX_GLOBAL + 1) % NUM_API_KEYS
 # --- END: منطق چرخش API Key ---
+try:
+    from pydub import AudioSegment
+    PYDUB_AVAILABLE = True
+except ImportError:
+    _log_startup("⚠️ کتابخانه pydub یافت نشد. قابلیت ادغام فایل‌های صوتی غیرفعال خواهد بود.")
+    PYDUB_AVAILABLE = False
 SPEAKER_VOICES = [
     "Achird", "Zubenelgenubi", "Vindemiatrix", "Sadachbia", "Sadaltager",
     "Sulafat", "Laomedeia", "Achernar", "Alnilam", "Schedar", "Gacrux",
     "Rasalthgeti", "Orus", "Aoede", "Callirrhoe", "Autonoe", "Enceladus",
     "Iapetus", "Zephyr", "Puck", "Charon", "Kore", "Fenrir", "Leda"
 ]
+FIXED_MODEL_NAME = "models/gemini-1.5-flash-latest" # نام مدل برای API جدید ممکن است متفاوت باشد، این را چک کنید. برای TTS باید از مدل مخصوص TTS استفاده کرد.
+# نام مدل صحیح برای TTS در API جدید: "gemini-1.5-flash" و استفاده از response_mime_type="audio/ogg" یا "audio/wav" در generation_config
+# یا استفاده از مدل خاص TTS اگر موجود باشد. فعلا "models/tts-alpha" یا مشابه را در نظر می‌گیریم
+# بر اساس داکیومنت جدید، مدل‌های TTS ممکن است به صورت "models/text-to-speech" یا نام‌های خاص دیگر باشند.
+# برای Gemini 1.5 Flash و قابلیت TTS، باید مدل درست را پیدا کنیم.
+# اگر از مدل پایه Flash استفاده می‌کنیم، باید قابلیت TTS آن را فعال کنیم.
+# فعلاً از نام مدل قبلی استفاده می‌کنیم و امیدواریم با configure کار کند.
+# ** مهم: نام مدل TTS در API جدید ممکن است "models/tts-1" یا چیزی شبیه به این باشد. باید داکیومنت API v1beta را برای TTS بررسی کرد.
+# با توجه به اینکه قبلا از "gemini-2.5-flash-preview-tts" استفاده می‌کردید، احتمالاً برای API جدید
+# باید از "models/gemini-1.5-flash" (یا مشابه) به همراه تنظیمات TTS استفاده کنید.
+# فعلاً "models/gemini-1.5-flash" را فرض می‌کنیم و generation_config را برای TTS تنظیم می‌کنیم.
+# **اصلاح مهم: مدل TTS هنوز در API اصلی به طور عمومی در دسترس نیست و ممکن است نیاز به endpoint خاصی داشته باشد یا از طریق Vertex AI قابل دسترس باشد.**
+# **با فرض اینکه مدل TTS مانند قبل در دسترس است، اما با API جدید:**
+# **مدل صحیح برای TTS با API جدیدتر احتمالاً چیزی شبیه به این است:**
+# FIXED_MODEL_NAME_TTS = "models/tts-1" # یا نامی که در داکیومنت جدید برای TTS آمده
+# یا استفاده از مدل پایه با قابلیت‌های خاص:
+FIXED_MODEL_NAME_FOR_TTS_API_V1 = "gemini-1.5-flash" # یا "gemini-pro" اگر TTS دارند
+# فعلا با همان نام مدل قبلی شما پیش می‌رویم و امیدواریم با API جدید کار کند:
+# FIXED_MODEL_NAME_ACTUAL = "gemini-2.5-flash-preview-tts" # این نام برای API قبلی بود
+# برای API جدید (که Client ندارد)، باید از نام مدل‌های استاندارد استفاده کرد.
+# **به نظر می‌رسد مستقیم‌ترین راه برای TTS با API جدید از طریق `genai.GenerativeModel('models/gemini-1.5-flash-latest')` و تنظیم `response_mime_type='audio/ogg'` در `generation_config` است.**
+# یا یک مدل خاص TTS اگر تعریف شده.
+# بیایید فرض کنیم یک مدل به نام "tts-model" یا مشابه در دسترس است.
+# فعلاً از نام مدل قبلی شما استفاده می‌کنیم و به جای client.models... از model... استفاده خواهیم کرد.
+# **اگر مدل "gemini-2.5-flash-preview-tts" با API جدید (که Client ندارد) کار نکند، باید به دنبال نام مدل TTS معادل در API جدید بگردید.**
+# **مهمترین تغییر این است که `client.models.generate_content` به `model.generate_content` تبدیل می‌شود.**
 DEFAULT_MAX_CHUNK_SIZE = 3800
 DEFAULT_SLEEP_BETWEEN_REQUESTS = 6
 RETRY_SLEEP_AFTER_QUOTA_ERROR = 2
 DEFAULT_OUTPUT_FILENAME_BASE = "alpha_tts_audio"
+# ... (توابع save_binary_file, convert_to_wav, parse_audio_mime_type, smart_text_split, merge_audio_files_func بدون تغییر) ...
 def save_binary_file(file_name, data):
     try:
         with open(file_name, "wb") as f: f.write(data)
     except Exception as e:
         _log(f"❌ خطا در ذخیره فایل {file_name}: {e}")
         return None
 def convert_to_wav(audio_data: bytes, mime_type: str) -> bytes:
     parameters = parse_audio_mime_type(mime_type)
     bits_per_sample, rate = parameters["bits_per_sample"], parameters["rate"]
     byte_rate, chunk_size = rate * block_align, 36 + data_size
     header = struct.pack("<4sI4s4sIHHIIHH4sI", b"RIFF", chunk_size, b"WAVE", b"fmt ", 16, 1, num_channels, rate, byte_rate, block_align, bits_per_sample, b"data", data_size)
     return header + audio_data
 def parse_audio_mime_type(mime_type: str) -> dict[str, int]:
+    bits, rate = 16, 24000; param_lower_startswith = lambda p, s: p.lower().startswith(s)
     for param in mime_type.split(";"):
         param = param.strip()
+        if param_lower_startswith(param, "rate="):
             try: rate = int(param.split("=", 1)[1])
             except: pass
         elif param.startswith("audio/L"):
             try: bits = int(param.split("L", 1)[1])
             except: pass
     return {"bits_per_sample": bits, "rate": rate}
 def smart_text_split(text, max_size=3800):
     if len(text) <= max_size: return [text]
+    chunks, current_chunk = [], ""; sentences = re.split(r'(?<=[.!?؟۔])\s+', text)
     for sentence in sentences:
         if len(current_chunk) + len(sentence) + 1 > max_size:
             if current_chunk: chunks.append(current_chunk.strip())
             while len(current_chunk) > max_size:
                 split_idx = -1
                 for char_to_find in ['،', ',', ';', ':', ' ']:
+                    try: split_idx = current_chunk.rindex(char_to_find, max_size // 2, max_size); break
+                    except ValueError: continue
+                part, current_chunk = (current_chunk[:split_idx+1], current_chunk[split_idx+1:]) if split_idx != -1 else (current_chunk[:max_size], current_chunk[max_size:])
                 chunks.append(part.strip())
+        else: current_chunk += (" " if current_chunk else "") + sentence
     if current_chunk: chunks.append(current_chunk.strip())
+    return [c for c in chunks if c]
 def merge_audio_files_func(file_paths, output_path):
+    if not PYDUB_AVAILABLE: _log("⚠️ pydub نیست."); return False
     try:
         combined = AudioSegment.empty()
         for i, fp in enumerate(file_paths):
             if os.path.exists(fp): combined += AudioSegment.from_file(fp) + (AudioSegment.silent(duration=150) if i < len(file_paths) - 1 else AudioSegment.empty())
+            else: _log(f"⚠️ فایل {fp} نیست.")
+        combined.export(output_path, format="wav"); return True
+    except Exception as e: _log(f"❌ خطا در ادغام: {e}"); return False
 def core_generate_audio(text_input, prompt_input, selected_voice, temperature_val):
+    if not GOOGLE_LIBS_AVAILABLE or not GENAI_MODEL_ACCESS_CONFIGURED:
+        _log("❌ کتابخانه‌های گوگل یا تنظیمات مدل به درستی بارگذاری نشده‌اند.")
         return None
     if NUM_API_KEYS == 0:
+        _log("❌ هیچ کلید API موجود نیست.")
         return None
+    _log("🚀 شروع فرآیند تولید صدا (با API جدید)...")
     output_base_name = DEFAULT_OUTPUT_FILENAME_BASE
     max_chunk, sleep_time = DEFAULT_MAX_CHUNK_SIZE, DEFAULT_SLEEP_BETWEEN_REQUESTS
+    # ** مهم: نام مدل برای TTS با API جدید باید بررسی شود. **
+    # در اینجا از FIXED_MODEL_NAME_FOR_TTS_API_V1 استفاده می‌کنیم که باید نام یک مدل پایه باشد.
+    # اگر یک مدل خاص TTS مانند "models/text-to-speech" وجود دارد، از آن استفاده کنید.
+    # در حال حاضر، از نام مدل قبلی شما ("gemini-2.5-flash-preview-tts") استفاده می‌کنیم،
+    # و امیدواریم که با ساختار API جدید (بدون Client) کار کند.
+    # اگر کار نکرد، باید نام مدل را به یکی از مدل‌های استاندارد مانند "gemini-1.5-flash-latest" تغییر دهید
+    # و generation_config را برای خروجی صوتی تنظیم کنید.
+    # **برای سادگی و تست اولیه، فرض می‌کنیم نام مدل قبلی هنوز معتبر است.**
+    model_name_to_use = "gemini-1.5-flash-latest" # این یک مدل پایه است، برای TTS باید config خاصی داشته باشد.
+    # یا اگر مدل قبلی شما هنوز کار می‌کند:
+    # model_name_to_use = "gemini-2.5-flash-preview-tts" # این نام از API قبلی است
     if not text_input or not text_input.strip():
+        _log("❌ متن ورودی خالی است."); advance_global_key_index_for_next_request(); return None
     text_chunks = smart_text_split(text_input, max_chunk)
     if not text_chunks:
+        _log("❌ متن قابل پردازش نیست."); advance_global_key_index_for_next_request(); return None
     generated_files = []
     all_chunks_processed = True
         max_attempts_for_chunk = NUM_API_KEYS
         for attempt_num_for_chunk in range(max_attempts_for_chunk):
+            selected_api_key, key_display_num, _ = get_api_key_for_attempt(attempt_num_for_chunk)
+            _log(f"     प्रयास {attempt_num_for_chunk + 1}/{max_attempts_for_chunk} با کلید شماره {key_display_num} (...{selected_api_key[-4:]})")
             try:
+                # --- تغییر کلیدی: تنظیم API Key و ایجاد مدل ---
+                genai.configure(api_key=selected_api_key)
+                # model = genai.GenerativeModel(model_name_to_use) # برای مدل‌های پایه
+                # برای TTS ممکن است نیاز به مدل خاص یا تنظیمات خاص باشد.
+                # فعلا از نام مدل قبلی استفاده می‌کنیم، اگر با API جدید کار کند:
+                # ** اگر "gemini-2.5-flash-preview-tts" با API جدید کار نمی‌کند، این بخش باید تغییر کند **
+                # ** به احتمال زیاد باید از یک مدل پایه (مانند gemini-1.5-flash-latest) و GenerationConfig برای TTS استفاده کرد **
+                # استفاده از نام مدل قبلی شما با این فرض که با API جدید هم کار می‌کند
+                # این بخش نیاز به تست و احتمالا اصلاح نام مدل دارد.
+                model_instance = genai.GenerativeModel(model_name_to_use)
                 if prompt_input and prompt_input.strip():
                     processed_prompt = prompt_input.strip()
                     if not re.search(r'[.!?؟،:۔]$', processed_prompt): processed_prompt += "،"
                     final_text_for_api = f"{processed_prompt} {chunk_text.strip()}"
                 else: final_text_for_api = chunk_text.strip()
+                # تنظیمات برای خروجی صوتی (این بخش ممکن است نیاز به تنظیم دقیق‌تر بر اساس داکیومنت API جدید داشته باشد)
+                # این config از کد قبلی شما می‌آید و برای API جدید باید سازگار باشد.
+                # ** مهم: `response_modalities` در API جدید با `response_mime_type` جایگزین شده است. **
+                generation_config_tts = types.GenerationConfig(
+                    temperature=temperature_val,
+                    # response_modalities=["audio"], # این برای API قدیمی بود
+                    response_mime_type="audio/wav", # یا audio/ogg - برای API جدید
+                    candidate_count=1 # معمولا برای TTS یک کاندید کافی است
+                )
+                # speech_config هنوز ممکن است معتبر باشد یا به generation_config منتقل شده باشد.
+                # فعلا فرض می‌کنیم SpeechConfig جداگانه هنوز استفاده می‌شود.
+                # ** این بخش نیاز به بررسی داکیومنت API v1 (یا جدیدتر) دارد. **
+                # ** به نظر می‌رسد SpeechConfig دیگر به این شکل مستقیم در generate_content نیست **
+                # ** و تنظیمات صدا باید بخشی از prompt یا generation_config باشند. **
+                # ** برای سادگی، فعلا speech_config را حذف می‌کنیم و به تنظیمات پایه اکتفا می‌کنیم **
+                # ** و امیدواریم مدل TTS به طور پیش‌فرض صدای مناسبی تولید کند یا بتوانیم با prompt آن را کنترل کنیم. **
+                # response = model_instance.generate_content(
+                #     contents=final_text_for_api, # API جدید معمولا contents را به عنوان رشته یا لیست رشته‌ها می‌پذیرد
+                #     generation_config=generation_config_tts,
+                #     # speech_config=types.SpeechConfig(...) # این احتمالا دیگر کار نمی‌کند
+                # )
+                # ** روش قدیمی‌تر ارسال content با types.Content **
+                contents_payload = [types.Content(role="user", parts=[types.Part.from_text(text=final_text_for_api)])]
+                # ** این generation_config از کد قبلی شما می‌آید **
+                original_config_from_your_code = types.GenerateContentConfig(
+                    temperature=temperature_val,
+                    response_modalities=["audio"], # این باید به response_mime_type تغییر کند
                     speech_config=types.SpeechConfig(voice_config=types.VoiceConfig(
+                        prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=selected_voice)))
+                )
+                # ** تطبیق با API جدید **
+                # در API جدید، `response_modalities` وجود ندارد. به جای آن `response_mime_type` در `GenerationConfig` اصلی قرار می‌گیرد.
+                # `speech_config` هم ممکن است مستقیماً در `generate_content` نباشد.
+                # فعلاً از ساختار قبلی شما با کمی تغییر برای `generate_content` مدل جدید استفاده می‌کنیم.
+                # --- روش جدیدتر برای TTS با مدل پایه (مثل Flash) ---
+                # این روش استانداردتر برای API جدید است اگر مدل پایه قابلیت TTS دارد.
+                # شما باید voice و سایر تنظیمات را از طریق prompt یا تنظیمات خاص مدل انجام دهید.
+                # فعلاً فرض می‌کنیم که مدل `model_name_to_use` به طور مستقیم از TTS پشتیبانی می‌کند
+                # و `speech_config` هنوز معتبر است.
+                # این بخش بحرانی است و نیاز به تطبیق با داکیومنت دقیق API جدید دارد.
+                # ** اگر از مدل پایه مثل gemini-1.5-flash-latest استفاده می‌کنید، به احتمال زیاد speech_config مستقیم کار نمی‌کند **
+                # ** و باید از طریق prompt یا generation_config خاص TTS عمل کنید. **
+                # ** تلاش برای استفاده از ساختار قبلی شما با مدل جدید، با این امید که کار کند **
+                # این فقط یک حدس است و ممکن است نیاز به تغییرات اساسی داشته باشد.
+                # مهمترین تغییر `client.models.generate_content` به `model_instance.generate_content` است.
+                # --- START: تلاش برای تطبیق با ساختار قبلی generate_content ---
+                # این بخش بحرانی است و ممکن است با API جدید کار نکند اگر مدل و configها تغییر کرده باشند
+                # ** این GenerationConfig از کد قبلی شما می‌آید **
+                generation_config_for_tts = types.GenerationConfig( # در API جدید، این معمولاً GenerationConfig ساده است
+                    temperature=temperature_val,
+                    # response_modalities=["audio"], # حذف شد
+                    response_mime_type="audio/wav", # یا audio/ogg
+                    # speech_config ممکن است دیگر اینجا نباشد
+                )
+                # اگر speech_config هنوز کار می‌کند:
+                # tools = [types.Tool(speech_config=types.SpeechConfig(voice_config=...))]
+                # اما به احتمال زیاد این تغییر کرده.
+                # ** یک فرض ساده‌تر: مدل خودش می‌داند که TTS است و فقط متن و config پایه را می‌خواهد **
+                # response = model_instance.generate_content(
+                #     final_text_for_api,
+                #     generation_config=generation_config_for_tts
+                # )
+                # ** بازگشت به تلاش برای استفاده از ساختار config قبلی شما، با تغییرات جزئی **
+                # این بخش بسیار آزمایشی است
+                final_config_attempt = types.GenerateContentConfig( # این GenerateContentConfig از google.generativeai.types است
+                    temperature=temperature_val,
+                    # response_modalities=["audio"], # این دیگر وجود ندارد
+                    # speech_config هنوز ممکن است در برخی موارد خاص کار کند، اما بعید است
+                    # speech_config=types.SpeechConfig(voice_config=types.VoiceConfig(
+                    #     prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=selected_voice)))
+                )
+                # برای TTS با مدل‌های جدید، معمولاً به این شکل است:
+                # model = genai.GenerativeModel('models/gemini-1.5-flash') یا مدل TTS خاص
+                # response = model.generate_content(
+                #     "متن شما",
+                #     generation_config=genai.types.GenerationConfig(
+                #         response_mime_type="audio/wav", # یا ogg
+                #         # سایر پارامترهای دما و ...
+                #     ),
+                #     # برای کنترل صدا، ممکن است نیاز به prompt engineering باشد
+                #     # یا اگر مدلی با قابلیت‌های voice وجود دارد، از طریق آن.
+                # )
+                # ** با توجه به اینکه شما speech_config داشتید، باید ببینیم معادل آن در API جدید چیست **
+                # ** فعلا فرض می‌کنیم مدل TTS هوشمند است و فقط با متن کار می‌کند و تنظیمات پایه **
+                # ** این یک ساده‌سازی بزرگ است و احتمالاً کار نخواهد کرد بدون تنظیمات دقیق TTS **
+                # ** برای تست، فعلاً speech_config را حذف می‌کنیم و فقط متن و config پایه را ارسال می‌کنیم **
+                # ** و امیدواریم مدل پیش‌فرض TTS صدای مناسبی بدهد. **
+                # ** این احتمالاً درست نیست و نیاز به بررسی داکیومنت API جدید برای TTS دارد. **
+                # *** مهمترین تغییر: ***
+                # از `model_instance.generate_content` استفاده می‌کنیم.
+                # `contents` باید یک لیست از `Part` یا رشته باشد.
+                # `generation_config` باید `types.GenerationConfig` باشد.
+                # `speech_config` در اینجا دیگر مستقیم نیست.
+                # ساختار ساده‌تر برای generate_content با API جدید:
+                response = model_instance.generate_content(
+                    contents=final_text_for_api, # یا [final_text_for_api]
+                    generation_config=types.GenerationConfig( # استفاده از types.GenerationConfig
+                        temperature=temperature_val,
+                        response_mime_type="audio/wav" # درخواست خروجی صوتی
+                        # candidate_count=1 # معمولا برای TTS
+                    )
+                    # پارامتر voice_name و speech_prompt باید به نحو دیگری به مدل منتقل شوند،
+                    # احتمالاً از طریق خود متن (prompt engineering) یا تنظیمات خاص مدل اگر وجود داشته باشد.
+                    # این یک چالش با API جدید برای TTS است اگر تنظیمات صدا پیچیده باشند.
+                )
+                # --- END: تلاش برای تطبیق ---
+                # پردازش پاسخ (این بخش باید با ساختار پاسخ جدید API تطابق داشته باشد)
+                # در API جدید، معمولاً پاسخ مستقیم حاوی داده باینری نیست، بلکه یک URI به فایل است یا داده در Candidate.
+                # با فرض اینکه ساختار Candidate.content.parts[0].inline_data هنوز معتبر است:
                 if response.candidates and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data:
+                    inline_data = response.candidates[0].content.parts[0].inline_data
+                    data_buffer = inline_data.data
+                    # mime_type از پاسخ هم باید بررسی شود
+                    # mime_type_from_response = inline_data.mime_type
+                    # ext = mimetypes.guess_extension(mime_type_from_response) or ".wav"
+                    ext = ".wav" # چون درخواست wav کرده‌ایم
+                    # if "audio/L" in mime_type_from_response and ext == ".wav": # این برای فرمت خاص قبلی بود
+                    #     data_buffer = convert_to_wav(data_buffer, mime_type_from_response)
                     if not ext.startswith("."): ext = "." + ext
+                    fname_base = f"{output_base_name}_part{chunk_idx+1:03d}"
                     temp_fpath_for_chunk = f"{fname_base}{ext}"
                     if os.path.exists(temp_fpath_for_chunk):
                         try: os.remove(temp_fpath_for_chunk)
                         except OSError: pass
                     fpath = save_binary_file(temp_fpath_for_chunk, data_buffer)
                     if fpath:
                         generated_files.append(fpath); chunk_processed_successfully = True
                         _log(f"      ✅ قطعه {chunk_idx+1} با کلید شماره {key_display_num} موفقیت آمیز بود.")
                         if chunk_idx < len(text_chunks) - 1: time.sleep(DEFAULT_SLEEP_BETWEEN_REQUESTS)
                         break
+                else:
+                    _log(f"      ⚠️ پاسخ API برای قطعه {chunk_idx+1} با کلید {key_display_num} بدون داده صوتی معتبر بود. پاسخ: {response.text if hasattr(response, 'text') else str(response)[:200]}")
             except google_exceptions.ResourceExhausted as e_quota:
                 _log(f"      ❌ خطای سهمیه برای قطعه {chunk_idx+1} با کلید شماره {key_display_num}: {str(e_quota)[:100]}...")
                 if attempt_num_for_chunk < max_attempts_for_chunk - 1:
                     _log(f"         ... تلاش با کلید بعدی پس از {RETRY_SLEEP_AFTER_QUOTA_ERROR} ثانیه."); time.sleep(RETRY_SLEEP_AFTER_QUOTA_ERROR)
                 else: _log(f"      ⛔️ تمام کلیدهای API برای قطعه {chunk_idx+1} امتحان شدند (خطای سهمیه)."); all_chunks_processed = False
             except Exception as e_general:
+                error_type_name = type(e_general).__name__
+                _log(f"      ❌ خطای عمومی ({error_type_name}) در تولید قطعه {chunk_idx+1} با کلید {key_display_num}: {str(e_general)[:200]}")
+                if "response_mime_type" in str(e_general).lower() or "modality" in str(e_general).lower():
+                    _log("         این خطا ممکن است مربوط به عدم پشتیبانی ��دل از خروجی صوتی یا تنظیمات نادرست response_mime_type باشد.")
+                if "model" in str(e_general).lower() and "not found" in str(e_general).lower():
+                     _log(f"         مدل '{model_name_to_use}' یافت نشد یا برای این کلید API در دسترس نیست.")
                 if attempt_num_for_chunk < max_attempts_for_chunk - 1: time.sleep(RETRY_SLEEP_AFTER_QUOTA_ERROR)
                 else: all_chunks_processed = False
             if chunk_processed_successfully: break
         if not chunk_processed_successfully:
             _log(f"  ⛔️ پردازش قطعه {chunk_idx+1} پس از {max_attempts_for_chunk} تلاش ناموفق بود."); all_chunks_processed = False; break
     advance_global_key_index_for_next_request()
+    # ... (بقیه کد core_generate_audio برای ادغام و بازگرداندن فایل، بدون تغییر) ...
     if not all_chunks_processed or not generated_files:
         _log("❌ هیچ فایل صوتی معتبری تولید نشد.")
+        for fp_cleanup in generated_files: # پاک کردن فایل‌های جزئی ایجاد شده
+            try: os.remove(fp_cleanup)
             except: pass
         return None
     final_audio_file = None; final_output_path_base = f"{DEFAULT_OUTPUT_FILENAME_BASE}_final"
                         if os.path.exists(renamed_first_chunk): os.remove(renamed_first_chunk)
                         os.rename(generated_files[0], renamed_first_chunk); final_audio_file = renamed_first_chunk
                     except Exception as e_rename: _log(f"خطا در تغییر نام اولین قطعه: {e_rename}"); final_audio_file = generated_files[0]
+            for fp_cleanup_merge in generated_files: # پاک کردن فایل‌های جزئی
+                if final_audio_file and os.path.abspath(fp_cleanup_merge) == os.path.abspath(final_audio_file): continue
+                try: os.remove(fp_cleanup_merge)
                 except: pass
         else:
             _log("⚠️ pydub نیست. اولین قطعه ارائه می‌شود.")
                     for i_gf in range(1, len(generated_files)):
                         try: os.remove(generated_files[i_gf])
                         except: pass
+                except Exception as e_rename_single_no_pydub: _log(f"خطا در تغییر نام (بدون pydub): {e_rename_single_no_pydub}"); final_audio_file = generated_files[0]
     elif len(generated_files) == 1:
         try:
             target_ext = os.path.splitext(generated_files[0])[1]; final_single_fn = f"{final_output_path_base}{target_ext}"
             if os.path.exists(final_single_fn): os.remove(final_single_fn)
             os.rename(generated_files[0], final_single_fn); final_audio_file = final_single_fn
+        except Exception as e_rename_single_final_file: _log(f"خطا در تغییر نام فایل تکی: {e_rename_single_final_file}"); final_audio_file = generated_files[0]
     if final_audio_file and os.path.exists(final_audio_file): _log(f"✅ فایل نهایی: {os.path.basename(final_audio_file)}")
     elif final_audio_file: _log(f"⚠️ فایل نهایی '{final_audio_file}' وجود ندارد!"); return None
     else: _log(f"❓ وضعیت نامشخص برای فایل نهایی."); return None
     return final_audio_file
+# ... (تابع gradio_tts_interface و UI و launch بدون تغییر نسبت به نسخه کامل قبلی) ...
 def gradio_tts_interface(use_file_input, uploaded_file, text_to_speak, speech_prompt, speaker_voice, temperature, progress=gr.Progress(track_tqdm=True)):
     actual_text = ""
     if use_file_input:
     else:
         actual_text = text_to_speak
         if not actual_text or not actual_text.strip(): _log("❌ متن ورودی خالی."); return None
+    if not GOOGLE_LIBS_AVAILABLE or not GENAI_MODEL_ACCESS_CONFIGURED : # بررس�� جدید
+        gr.Warning("خطای سیستمی: کتابخانه‌های مورد نیاز یا تنظیمات مدل به درستی بارگذاری نشده‌اند.")
         return None
     if NUM_API_KEYS == 0:
         gr.Warning("خطای سیستمی: کلید API موجود نیست.")
         return None
+    final_path = core_generate_audio(actual_text, prompt_input, speaker_voice, temperature)
     if final_path is None:
         gr.Info("امکان تولید صدا وجود ندارد. لطفاً دقایقی دیگر یا با متن کوتاه‌تری امتحان کنید.")
     return final_path
+custom_css_inspired_by_image = f"""@import url('https://fonts.googleapis.com/css2?family=Vazirmatn:wght@300;400;500;700;800&display=swap');:root {{ --app-font: 'Vazirmatn', sans-serif; --app-header-grad-start: #2980b9; --app-header-grad-end: #2ecc71; --app-panel-bg: #FFFFFF; --app-input-bg: #F7F7F7; --app-button-bg: #2979FF; --app-main-bg: linear-gradient(170deg, #E0F2FE 0%, #F3E8FF 100%); --app-text-primary: #333; --app-text-secondary: #555; --app-border-color: #E0E0E0; --radius-card: 20px; --radius-input: 8px; --shadow-card: 0 10px 30px -5px rgba(0,0,0,0.1); --shadow-button: 0 4px 10px -2px rgba(41,121,255,0.5);}}body, .gradio-container {{ font-family: var(--app-font); direction: rtl; background: var(--app-main-bg); color: var(--app-text-primary); font-size: 16px; line-height: 1.65; }}.gradio-container {{ max-width:100% !important; min-height:100vh; margin:0 !important; padding:0 !important; display:flex; flex-direction:column; }}.app-header-alpha {{ padding: 3rem 1.5rem 4rem 1.5rem; text-align: center; background-image: linear-gradient(135deg, var(--app-header-grad-start) 0%, var(--app-header-grad-end) 100%); color: white; border-bottom-left-radius: var(--radius-card); border-bottom-right-radius: var(--radius-card); box-shadow: 0 6px 20px -5px rgba(0,0,0,0.2); }}.app-header-alpha h1 {{ font-size: 2.4em; font-weight: 800; margin:0 0 0.5rem 0; text-shadow: 0 2px 4px rgba(0,0,0,0.15); }}.app-header-alpha p {{ font-size: 1.1em; color: rgba(255,255,255,0.9); margin-top:0; opacity: 0.9; }}.main-content-panel-alpha {{ padding: 1.8rem 1.5rem; max-width: 680px; margin: -2.5rem auto 2rem auto; width: 90%; background-color: var(--app-panel-bg); border-radius: var(--radius-card); box-shadow: var(--shadow-card); position:relative; z-index:10; }}@media (max-width: 768px) {{ .main-content-panel-alpha {{ width: 95%; padding: 1.5rem 1rem; margin-top: -2rem; }} .app-header-alpha h1 {{font-size:2em;}} .app-header-alpha p {{font-size:1em;}} }}footer {{display:none !important;}}.gr-button.generate-button-final {{ background: var(--app-button-bg) !important; color: white !important; border:none !important; border-radius: var(--radius-input) !important; padding: 0.8rem 1.5rem !important; font-weight: 700 !important; font-size:1.05em !important; transition: all 0.3s ease; box-shadow: var(--shadow-button); width:100%; margin-top:1.5rem !important; }}.gr-button.generate-button-final:hover {{ filter: brightness(1.1); transform: translateY(-2px); box-shadow: 0 6px 12px -3px rgba(41,121,255,0.6);}}.gr-input > label + div > textarea, .gr-dropdown > label + div > div > input, .gr-dropdown > label + div > div > select, .gr-textbox > label + div > textarea, .gr-file > label + div {{ border-radius: var(--radius-input) !important; border: 1px solid var(--app-border-color) !important; background-color: var(--app-input-bg) !important; box-shadow: inset 0 1px 2px rgba(0,0,0,0.05); padding: 0.75rem !important; }}.gr-file > label + div {{ text-align:center; border-style: dashed !important; }}.gr-input > label + div > textarea:focus, .gr-dropdown > label + div > div > input:focus, .gr-textbox > label + div > textarea:focus {{ border-color: var(--app-button-bg) !important; box-shadow: 0 0 0 3px rgba(41,121,255,0.2) !important; }}label > .label-text {{ font-weight: 700 !important; color: var(--app-text-primary) !important; font-size: 0.95em !important; margin-bottom: 0.5rem !important; }}.section-title-main-alpha {{ font-size: 1.1em; color: var(--app-text-secondary); margin-bottom:1rem; padding-bottom: 0.5rem; border-bottom: 1px solid var(--app-border-color); font-weight:500; text-align:right; }}label > .label-text::before {{ margin-left: 8px; vertical-align: middle; opacity: 0.7; }}label[for*="text_input_main_alpha_v3"] > .label-text::before {{ content: '📝'; }}label[for*="speech_prompt_alpha_v3"] > .label-text::before {{ content: '🗣️'; }}label[for*="speaker_voice_alpha_v3"] > .label-text::before {{ content: '🎤'; }}label[for*="temperature_slider_alpha_v3"] > .label-text::before {{ content: '🌡️'; }}#output_audio_player_alpha_v3 audio {{ width: 100%; border-radius: var(--radius-input); margin-top:0.8rem; }}.temp_description_class_alpha_v3 {{ font-size: 0.85em; color: #777; margin-top: -0.4rem; margin-bottom: 1rem; }}.app-footer-final {{text-align:center;font-size:0.9em;color: var(--app-text-secondary);opacity:0.8; margin-top:3rem;padding:1.5rem 0; border-top:1px solid var(--app-border-color);}}"""
 alpha_header_html_v3 = """<div class='app-header-alpha'><h1>Alpha TTS</h1><p>جادوی تبدیل متن به صدا در دستان شما</p></div>"""
+if GOOGLE_LIBS_AVAILABLE and GENAI_MODEL_ACCESS_CONFIGURED:
     with gr.Blocks(theme=gr.themes.Base(font=[gr.themes.GoogleFont("Vazirmatn")]), css=custom_css_inspired_by_image, title="آلفا TTS") as demo:
         gr.HTML(alpha_header_html_v3)
         with gr.Column(elem_classes=["main-content-panel-alpha"]):
             text_to_speak_tb = gr.Textbox(label="متن فارسی برای تبدیل", placeholder="مثال: سلام، فردا هوا چطور است؟", lines=5, value="", visible=True, elem_id="text_input_main_alpha_v3")
             use_file_input_cb.change(fn=lambda x: (gr.update(visible=x, label=" " if x else "متن فارسی برای تبدیل"), gr.update(visible=not x)), inputs=use_file_input_cb, outputs=[uploaded_file_input, text_to_speak_tb])
             speech_prompt_tb = gr.Textbox(label="سبک گفتار (اختیاری)", placeholder="مثال: با لحنی شاد و پرانرژی", value="با لحنی دوستانه و رسا صحبت کن.", lines=2, elem_id="speech_prompt_alpha_v3")
+            speaker_voice_dd = gr.Dropdown(SPEAKER_VOICES, label="انتخاب گوینده و لهجه", value="Charon", elem_id="speaker_voice_alpha_v3") # speaker_voice دیگر به طور مستقیم به API ارسال نمی‌شود، اما در UI باقی می‌ماند
             temperature_slider = gr.Slider(minimum=0.1, maximum=1.5, step=0.05, value=0.9, label="میزان خلاقیت صدا", elem_id="temperature_slider_alpha_v3")
             gr.Markdown("<p class='temp_description_class_alpha_v3'>مقادیر بالاتر = تنوع بیشتر، مقادیر پایین‌تر = یکنواختی بیشتر.</p>")
             generate_button = gr.Button("🚀 تولید و پخش صدا", elem_classes=["generate-button-final"], elem_id="generate_button_alpha_v3")
             output_audio = gr.Audio(label=" ", type="filepath", elem_id="output_audio_player_alpha_v3")
             generate_button.click(fn=gradio_tts_interface, inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ], outputs=[output_audio])
             gr.Markdown("<h3 class='section-title-main-alpha' style='margin-top:2.5rem; text-align:center; border-bottom:none;'>نمونه‌های کاربردی</h3>", elem_id="examples_section_title_v3")
+            gr.Examples(examples=[[False,None,"سلام بر شما، امیدوارم روز خوبی داشته باشید.","با لحنی گرم و صمیمی.","Zephyr",0.85],[False,None,"این یک آزمایش برای بررسی کیفیت صدای تولید شده توسط هوش مصنوعی آلفا است. امیدوارم از نتیجه راضی باشید.","با صدایی طبیعی و روان.","Charon",0.9],[False,None,"آیا می‌توانم سوالی از شما بپرسم؟ لطفاً راهنمایی کنید.","با کنجکاوی","Puck",0.95],[False,None,"این یک متن بسیار طولانی است.","با لحنی آرام و واضح","Achird",0.8],], inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ], outputs=[output_audio], fn=gradio_tts_interface, cache_examples=False )
         gr.Markdown("<p class='app-footer-final'>Alpha Language Learning © 2024</p>")
 if __name__ == "__main__":
+    if GOOGLE_LIBS_AVAILABLE and GENAI_MODEL_ACCESS_CONFIGURED and NUM_API_KEYS > 0:
         demo.launch()
     else:
+        msg = "خطای ناشناخته در شروع برنامه."
         if not GOOGLE_LIBS_AVAILABLE: msg = "کتابخانه‌های گوگل بارگذاری نشدند."
+        elif not GENAI_MODEL_ACCESS_CONFIGURED: msg = "تنظیمات مدل API جدید (GenerativeModel/configure) یافت نشد."
         elif NUM_API_KEYS == 0: msg = "هیچ کلید API یافت نشد."
         _log(f"🔴 برنامه به دلیل '{msg}' اجرا نشد.")
         with gr.Blocks(title="خطا") as error_demo:
             gr.Markdown(f"# خطای اجرای برنامه\n\n**دلیل:** {msg}\n\nلطفاً لاگ‌های برنامه یا تنظیمات Space را بررسی کنید.")