Spaces:

Hamed744
/

Ttspro

Running

App Files Files Community

Hamed744 commited on Jun 5, 2025

Commit

4a1e151

verified ·

1 Parent(s): 4e27563

Update app.py

Browse files

Files changed (1) hide show

app.py +76 -209

app.py CHANGED Viewed

@@ -8,11 +8,11 @@ import time
 import zipfile
 import importlib.metadata
-# --- START: Import کتابخانه‌های گوگل ---
 GOOGLE_LIBS_AVAILABLE = False
-GENAI_MODEL_ACCESS_CONFIGURED = False # برای اطمینان از اینکه configure قبل از model استفاده می‌شود
-def _log_startup(message):
     print(f"[Startup Log] {message}")
 try:
@@ -24,14 +24,13 @@ try:
     except importlib.metadata.PackageNotFoundError:
         _log_startup("هشدار: پکیج 'google-generativeai' نصب شده، اما نسخه‌ی آن قابل تشخیص نیست.")
-    # در نسخه‌های جدید، Client وجود ندارد، به جای آن GenerativeModel و configure استفاده می‌شود
     if hasattr(genai, 'GenerativeModel') and hasattr(genai, 'configure'):
         _log_startup("ویژگی‌های 'GenerativeModel' و 'configure' در ماژول 'genai' یافت شدند.")
-        GENAI_MODEL_ACCESS_CONFIGURED = True # نشان‌دهنده آمادگی برای استفاده از API جدید
     else:
-        _log_startup("⛔️ خطای مهم: 'GenerativeModel' یا 'configure' در 'genai' یافت نشد. سازگاری نسخه کتابخانه بررسی شود.")
-    from google.generativeai import types # انواع هنوز به همین شکل هستند
     from google.api_core import exceptions as google_exceptions
     _log_startup("'types' و 'google_exceptions' با موفقیت وارد شدند.")
     GOOGLE_LIBS_AVAILABLE = True
@@ -42,8 +41,14 @@ except Exception as e_other:
     _log_startup(f"❌ خطای ناشناخته در حین import یا بررسی کتابخانه‌های گوگل: {e_other}")
 # --- END: Import کتابخانه‌های گوگل ---
-# ... (بقیه import های pydub و منطق چرخش کلید API و توابع کمکی بدون تغییر باقی می‌مانند) ...
-# --- START: منطق چرخش API Key (بدون تغییر نسبت به قبل) ---
 GEMINI_API_KEYS = []
 i = 1
 while os.environ.get(f"GEMINI_API_KEY_{i}"):
@@ -51,12 +56,12 @@ while os.environ.get(f"GEMINI_API_KEY_{i}"):
   i += 1
 NUM_API_KEYS = len(GEMINI_API_KEYS)
 CURRENT_KEY_INDEX_GLOBAL = 0
-def _log(message): # تابع لاگ اصلی برنامه
     print(f"[لاگ آلفا TTS] {message}")
 if not GOOGLE_LIBS_AVAILABLE:
     _log("🔴 به دلیل عدم بارگذاری کتابخانه‌های اصلی گوگل، عملکرد برنامه مختل خواهد شد.")
 if NUM_API_KEYS == 0:
-  _log("⛔️ هشدار: هیچ Secret با نام GEMINI_API_KEY_n یافت نشد! برنامه بدون کلید API کار نخواهد کرد.")
 else:
   _log(f"✅ تعداد {NUM_API_KEYS} کلید API جیمینای بارگذاری شد.")
 def get_api_key_for_attempt(attempt_within_request):
@@ -69,12 +74,6 @@ def advance_global_key_index_for_next_request():
     global CURRENT_KEY_INDEX_GLOBAL
     if NUM_API_KEYS > 0: CURRENT_KEY_INDEX_GLOBAL = (CURRENT_KEY_INDEX_GLOBAL + 1) % NUM_API_KEYS
 # --- END: منطق چرخش API Key ---
-try:
-    from pydub import AudioSegment
-    PYDUB_AVAILABLE = True
-except ImportError:
-    _log_startup("⚠️ کتابخانه pydub یافت نشد. قابلیت ادغام فایل‌های صوتی غیرفعال خواهد بود.")
-    PYDUB_AVAILABLE = False
 SPEAKER_VOICES = [
     "Achird", "Zubenelgenubi", "Vindemiatrix", "Sadachbia", "Sadaltager",
@@ -83,39 +82,17 @@ SPEAKER_VOICES = [
     "Rasalthgeti", "Orus", "Aoede", "Callirrhoe", "Autonoe", "Enceladus",
     "Iapetus", "Zephyr", "Puck", "Charon", "Kore", "Fenrir", "Leda"
 ]
-FIXED_MODEL_NAME = "models/gemini-1.5-flash-latest" # نام مدل برای API جدید ممکن است متفاوت باشد، این را چک کنید. برای TTS باید از مدل مخصوص TTS استفاده کرد.
-# نام مدل صحیح برای TTS در API جدید: "gemini-1.5-flash" و استفاده از response_mime_type="audio/ogg" یا "audio/wav" در generation_config
-# یا استفاده از مدل خاص TTS اگر موجود باشد. فعلا "models/tts-alpha" یا مشابه را در نظر می‌گیریم
-# بر اساس داکیومنت جدید، مدل‌های TTS ممکن است به صورت "models/text-to-speech" یا نام‌های خاص دیگر باشند.
-# برای Gemini 1.5 Flash و قابلیت TTS، باید مدل درست را پیدا کنیم.
-# اگر از مدل پایه Flash استفاده می‌کنیم، باید قابلیت TTS آن را فعال کنیم.
-# فعلاً از نام مدل قبلی استفاده می‌کنیم و امیدواریم با configure کار کند.
-# ** مهم: نام مدل TTS در API جدید ممکن است "models/tts-1" یا چیزی شبیه به این باشد. باید داکیومنت API v1beta را برای TTS بررسی کرد.
-# با توجه به اینکه قبلا از "gemini-2.5-flash-preview-tts" استفاده می‌کردید، احتمالاً برای API جدید
-# باید از "models/gemini-1.5-flash" (یا مشابه) به همراه تنظیمات TTS استفاده کنید.
-# فعلاً "models/gemini-1.5-flash" را فرض می‌کنیم و generation_config را برای TTS تنظیم می‌کنیم.
-# **اصلاح مهم: مدل TTS هنوز در API اصلی به طور عمومی در دسترس نیست و ممکن است نیاز به endpoint خاصی داشته باشد یا از طریق Vertex AI قابل دسترس باشد.**
-# **با فرض اینکه مدل TTS مانند قبل در دسترس است، اما با API جدید:**
-# **مدل صحیح برای TTS با API جدیدتر احتمالاً چیزی شبیه به این است:**
-# FIXED_MODEL_NAME_TTS = "models/tts-1" # یا نامی که در داکیومنت جدید برای TTS آمده
-# یا استفاده از مدل پایه با قابلیت‌های خاص:
-FIXED_MODEL_NAME_FOR_TTS_API_V1 = "gemini-1.5-flash" # یا "gemini-pro" اگر TTS دارند
-# فعلا با همان نام مدل قبلی شما پیش می‌رویم و امیدواریم با API جدید کار کند:
-# FIXED_MODEL_NAME_ACTUAL = "gemini-2.5-flash-preview-tts" # این نام برای API قبلی بود
-# برای API جدید (که Client ندارد)، باید از نام مدل‌های استاندارد استفاده کرد.
-# **به نظر می‌رسد مستقیم‌ترین راه برای TTS با API جدید از طریق `genai.GenerativeModel('models/gemini-1.5-flash-latest')` و تنظیم `response_mime_type='audio/ogg'` در `generation_config` است.**
-# یا یک مدل خاص TTS اگر تعریف شده.
-# بیایید فرض کنیم یک مدل به نام "tts-model" یا مشابه در دسترس است.
-# فعلاً از نام مدل قبلی شما استفاده می‌کنیم و به جای client.models... از model... استفاده خواهیم کرد.
-# **اگر مدل "gemini-2.5-flash-preview-tts" با API جدید (که Client ندارد) کار نکند، باید به دنبال نام مدل TTS معادل در API جدید بگردید.**
-# **مهمترین تغییر این است که `client.models.generate_content` به `model.generate_content` تبدیل می‌شود.**
 DEFAULT_MAX_CHUNK_SIZE = 3800
 DEFAULT_SLEEP_BETWEEN_REQUESTS = 6
 RETRY_SLEEP_AFTER_QUOTA_ERROR = 2
 DEFAULT_OUTPUT_FILENAME_BASE = "alpha_tts_audio"
-# ... (توابع save_binary_file, convert_to_wav, parse_audio_mime_type, smart_text_split, merge_audio_files_func بدون تغییر) ...
 def save_binary_file(file_name, data):
     try:
         with open(file_name, "wb") as f: f.write(data)
@@ -123,7 +100,7 @@ def save_binary_file(file_name, data):
     except Exception as e:
         _log(f"❌ خطا در ذخیره فایل {file_name}: {e}")
         return None
-def convert_to_wav(audio_data: bytes, mime_type: str) -> bytes:
     parameters = parse_audio_mime_type(mime_type)
     bits_per_sample, rate = parameters["bits_per_sample"], parameters["rate"]
     num_channels, data_size = 1, len(audio_data)
@@ -138,7 +115,7 @@ def parse_audio_mime_type(mime_type: str) -> dict[str, int]:
         if param_lower_startswith(param, "rate="):
             try: rate = int(param.split("=", 1)[1])
             except: pass
-        elif param.startswith("audio/L"):
             try: bits = int(param.split("L", 1)[1])
             except: pass
     return {"bits_per_sample": bits, "rate": rate}
@@ -169,8 +146,7 @@ def merge_audio_files_func(file_paths, output_path):
         combined.export(output_path, format="wav"); return True
     except Exception as e: _log(f"❌ خطا در ادغام: {e}"); return False
-def core_generate_audio(text_input, prompt_input, selected_voice, temperature_val):
     if not GOOGLE_LIBS_AVAILABLE or not GENAI_MODEL_ACCESS_CONFIGURED:
         _log("❌ کتابخانه‌های گوگل یا تنظیمات مدل به درستی بارگذاری نشده‌اند.")
         return None
@@ -182,17 +158,7 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
     output_base_name = DEFAULT_OUTPUT_FILENAME_BASE
     max_chunk, sleep_time = DEFAULT_MAX_CHUNK_SIZE, DEFAULT_SLEEP_BETWEEN_REQUESTS
-    # ** مهم: نام مدل برای TTS با API جدید باید بررسی شود. **
-    # در اینجا از FIXED_MODEL_NAME_FOR_TTS_API_V1 استفاده می‌کنیم که باید نام یک مدل پایه باشد.
-    # اگر یک مدل خاص TTS مانند "models/text-to-speech" وجود دارد، از آن استفاده کنید.
-    # در حال حاضر، از نام مدل قبلی شما ("gemini-2.5-flash-preview-tts") استفاده می‌کنیم،
-    # و امیدواریم که با ساختار API جدید (بدون Client) کار کند.
-    # اگر کار نکرد، باید نام مدل را به یکی از مدل‌های استاندارد مانند "gemini-1.5-flash-latest" تغییر دهید
-    # و generation_config را برای خروجی صوتی تنظیم کنید.
-    # **برای سادگی و تست اولیه، فرض می‌کنیم نام مدل قبلی هنوز معتبر است.**
-    model_name_to_use = "gemini-1.5-flash-latest" # این یک مدل پایه است، برای TTS باید config خاصی داشته باشد.
-    # یا اگر مدل قبلی شما هنوز کار می‌کند:
-    # model_name_to_use = "gemini-2.5-flash-preview-tts" # این نام از API قبلی است
     if not text_input or not text_input.strip():
         _log("❌ متن ورودی خالی است."); advance_global_key_index_for_next_request(); return None
@@ -213,156 +179,46 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
             _log(f"     प्रयास {attempt_num_for_chunk + 1}/{max_attempts_for_chunk} با کلید شماره {key_display_num} (...{selected_api_key[-4:]})")
             try:
-                # --- تغییر کلیدی: تنظیم API Key و ایجاد مدل ---
                 genai.configure(api_key=selected_api_key)
-                # model = genai.GenerativeModel(model_name_to_use) # برای مدل‌های پایه
-                # برای TTS ممکن است نیاز به مدل خاص یا تنظیمات خاص باشد.
-                # فعلا از نام مدل قبلی استفاده می‌کنیم، اگر با API جدید کار کند:
-                # ** اگر "gemini-2.5-flash-preview-tts" با API جدید کار نمی‌کند، این بخش باید تغییر کند **
-                # ** به احتمال زیاد باید از یک مدل پایه (مانند gemini-1.5-flash-latest) و GenerationConfig برای TTS استفاده کرد **
-                # استفاده از نام مدل قبلی شما با این فرض که با API جدید هم کار می‌کند
-                # این بخش نیاز به تست و احتمالا اصلاح نام مدل دارد.
                 model_instance = genai.GenerativeModel(model_name_to_use)
-                if prompt_input and prompt_input.strip():
-                    processed_prompt = prompt_input.strip()
                     if not re.search(r'[.!?؟،:۔]$', processed_prompt): processed_prompt += "،"
-                    final_text_for_api = f"{processed_prompt} {chunk_text.strip()}"
-                else: final_text_for_api = chunk_text.strip()
-                # تنظیمات برای خروجی صوتی (این بخش ممکن است نیاز به تنظیم دقیق‌تر بر اساس داکیومنت API جدید داشته باشد)
-                # این config از کد قبلی شما می‌آید و برای API جدید باید سازگار باشد.
-                # ** مهم: `response_modalities` در API جدید با `response_mime_type` جایگزین شده است. **
-                generation_config_tts = types.GenerationConfig(
-                    temperature=temperature_val,
-                    # response_modalities=["audio"], # این برای API قدیمی بود
-                    response_mime_type="audio/wav", # یا audio/ogg - برای API جدید
-                    candidate_count=1 # معمولا برای TTS یک کاندید کافی است
-                )
-                # speech_config هنوز ممکن است معتبر باشد یا به generation_config منتقل شده باشد.
-                # فعلا فرض می‌کنیم SpeechConfig جداگانه هنوز استفاده می‌شود.
-                # ** این بخش نیاز به بررسی داکیومنت API v1 (یا جدیدتر) دارد. **
-                # ** به نظر می‌رسد SpeechConfig دیگر به این شکل مستقیم در generate_content نیست **
-                # ** و تنظیمات صدا باید بخشی از prompt یا generation_config باشند. **
-                # ** برای سادگی، فعلا speech_config را حذف می‌کنیم و به تنظیمات پایه اکتفا می‌کنیم **
-                # ** و امیدواریم مدل TTS به طور پیش‌فرض صدای مناسبی تولید کند یا بتوانیم با prompt آن را کنترل کنیم. **
-                # response = model_instance.generate_content(
-                #     contents=final_text_for_api, # API جدید معمولا contents را به عنوان رشته یا لیست رشته‌ها می‌پذیرد
-                #     generation_config=generation_config_tts,
-                #     # speech_config=types.SpeechConfig(...) # این احتمالا دیگر کار نمی‌کند
-                # )
-                # ** روش قدیمی‌تر ارسال content با types.Content **
-                contents_payload = [types.Content(role="user", parts=[types.Part.from_text(text=final_text_for_api)])]
-                # ** این generation_config از کد قبلی شما می‌آید **
-                original_config_from_your_code = types.GenerateContentConfig(
-                    temperature=temperature_val,
-                    response_modalities=["audio"], # این باید به response_mime_type تغییر کند
-                    speech_config=types.SpeechConfig(voice_config=types.VoiceConfig(
-                        prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=selected_voice)))
-                )
-                # ** تطبیق با API جدید **
-                # در API جدید، `response_modalities` وجود ندارد. به جای آن `response_mime_type` در `GenerationConfig` اصلی قرار می‌گیرد.
-                # `speech_config` هم ممکن است مستقیماً در `generate_content` نباشد.
-                # فعلاً از ساختار قبلی شما با کمی تغییر برای `generate_content` مدل جدید استفاده می‌کنیم.
-                # --- روش جدیدتر برای TTS با مدل پایه (مثل Flash) ---
-                # این روش استانداردتر برای API جدید است اگر مدل پایه قابلیت TTS دارد.
-                # شما باید voice و سایر تنظیمات را از طریق prompt یا تنظیمات خاص مدل انجام دهید.
-                # فعلاً فرض می‌کنیم که مدل `model_name_to_use` به طور مستقیم از TTS پشتیبانی می‌کند
-                # و `speech_config` هنوز معتبر است.
-                # این بخش بحرانی است و نیاز به تطبیق با داکیومنت دقیق API جدید دارد.
-                # ** اگر از مدل پایه مثل gemini-1.5-flash-latest استفاده می‌کنید، به احتمال زیاد speech_config مستقیم کار نمی‌کند **
-                # ** و باید از طریق prompt یا generation_config خاص TTS عمل کنید. **
-                # ** تلاش برای استفاده از ساختار قبلی شما با مدل جدید، با این امید که کار کند **
-                # این فقط یک حدس است و ممکن است نیاز به تغییرات اساسی داشته باشد.
-                # مهمترین تغییر `client.models.generate_content` به `model_instance.generate_content` است.
-                # --- START: تلاش برای تطبیق با ساختار قبلی generate_content ---
-                # این بخش بحرانی است و ممکن است با API جدید کار نکند اگر مدل و configها تغییر کرده باشند
-                # ** این GenerationConfig از کد قبلی شما می‌آید **
-                generation_config_for_tts = types.GenerationConfig( # در API جدید، این معمولاً GenerationConfig ساده است
-                    temperature=temperature_val,
-                    # response_modalities=["audio"], # حذف شد
-                    response_mime_type="audio/wav", # یا audio/ogg
-                    # speech_config ممکن است دیگر اینجا نباشد
-                )
-                # اگر speech_config هنوز کار می‌کند:
-                # tools = [types.Tool(speech_config=types.SpeechConfig(voice_config=...))]
-                # اما به احتمال زیاد این تغییر کرده.
-                # ** یک فرض ساده‌تر: مدل خودش می‌داند که TTS است و فقط متن و config پایه را می‌خواهد **
-                # response = model_instance.generate_content(
-                #     final_text_for_api,
-                #     generation_config=generation_config_for_tts
-                # )
-                # ** بازگشت به تلاش برای استفاده از ساختار config قبلی شما، با تغییرات جزئی **
-                # این بخش بسیار آزمایشی است
-                final_config_attempt = types.GenerateContentConfig( # این GenerateContentConfig از google.generativeai.types است
-                    temperature=temperature_val,
-                    # response_modalities=["audio"], # این دیگر وجود ندارد
-                    # speech_config هنوز ممکن است در برخی موارد خاص کار کند، اما بعید است
-                    # speech_config=types.SpeechConfig(voice_config=types.VoiceConfig(
-                    #     prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=selected_voice)))
-                )
-                # برای TTS با مدل‌های جدید، معمولاً به این شکل است:
-                # model = genai.GenerativeModel('models/gemini-1.5-flash') یا مدل TTS خاص
-                # response = model.generate_content(
-                #     "متن شما",
-                #     generation_config=genai.types.GenerationConfig(
-                #         response_mime_type="audio/wav", # یا ogg
-                #         # سایر پارامترهای دما و ...
-                #     ),
-                #     # برای کنترل صدا، ممکن است نیاز به prompt engineering باشد
-                #     # یا اگر مدلی با قابلیت‌های voice وجود دارد، از طریق آن.
-                # )
-                # ** با توجه به اینکه شما speech_config داشتید، باید ببینیم معادل آن در API جدید چیست **
-                # ** فعلا فرض می‌کنیم مدل TTS هوشمند است و فقط با متن کار می‌کند و تنظیمات پایه **
-                # ** این یک ساده‌سازی بزرگ است و احتمالاً کار نخواهد کرد بدون تنظیمات دقیق TTS **
-                # ** برای تست، فعلاً speech_config را حذف می‌کنیم و فقط متن و config پایه را ارسال می‌کنیم **
-                # ** و امیدواریم مدل پیش‌فرض TTS صدای مناسبی بدهد. **
-                # ** این احتمالاً درست نیست و نیاز به بررسی داکیومنت API جدید برای TTS دارد. **
-                # *** مهمترین تغییر: ***
-                # از `model_instance.generate_content` استفاده می‌کنیم.
-                # `contents` باید یک لیست از `Part` یا رشته باشد.
-                # `generation_config` باید `types.GenerationConfig` باشد.
-                # `speech_config` در اینجا دیگر مستقیم نیست.
-                # ساختار ساده‌تر برای generate_content با API جدید:
                 response = model_instance.generate_content(
-                    contents=final_text_for_api, # یا [final_text_for_api]
-                    generation_config=types.GenerationConfig( # استفاده از types.GenerationConfig
                         temperature=temperature_val,
-                        response_mime_type="audio/wav" # درخواست خروجی صوتی
-                        # candidate_count=1 # معمولا برای TTS
                     )
-                    # پارامتر voice_name و speech_prompt باید به نحو دیگری به مدل منتقل شوند،
-                    # احتمالاً از طریق خود متن (prompt engineering) یا تنظیمات خاص مدل اگر وجود داشته باشد.
-                    # این یک چالش با API جدید برای TTS است اگر تنظیمات صدا پیچیده باشند.
                 )
-                # --- END: تلاش برای تطبیق ---
-                # پردازش پاسخ (این بخش باید با ساختار پاسخ جدید API تطابق داشته باشد)
-                # در API جدید، معمولاً پاسخ مستقیم حاوی داده باینری نیست، بلکه یک URI به فایل است یا داده در Candidate.
-                # با فرض اینکه ساختار Candidate.content.parts[0].inline_data هنوز معتبر است:
                 if response.candidates and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data:
                     inline_data = response.candidates[0].content.parts[0].inline_data
                     data_buffer = inline_data.data
-                    # mime_type از پاسخ هم باید بررسی شود
-                    # mime_type_from_response = inline_data.mime_type
-                    # ext = mimetypes.guess_extension(mime_type_from_response) or ".wav"
-                    ext = ".wav" # چون درخواست wav کرده‌ایم
-                    # if "audio/L" in mime_type_from_response and ext == ".wav": # این برای فرمت خاص قبلی بود
-                    #     data_buffer = convert_to_wav(data_buffer, mime_type_from_response)
                     if not ext.startswith("."): ext = "." + ext
                     fname_base = f"{output_base_name}_part{chunk_idx+1:03d}"
                     temp_fpath_for_chunk = f"{fname_base}{ext}"
                     if os.path.exists(temp_fpath_for_chunk):
@@ -376,7 +232,10 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
                         if chunk_idx < len(text_chunks) - 1: time.sleep(DEFAULT_SLEEP_BETWEEN_REQUESTS)
                         break
                 else:
-                    _log(f"      ⚠️ پاسخ API برای قطعه {chunk_idx+1} با کلید {key_display_num} بدون داده صوتی معتبر بود. پاسخ: {response.text if hasattr(response, 'text') else str(response)[:200]}")
             except google_exceptions.ResourceExhausted as e_quota:
                 _log(f"      ❌ خطای سهمیه برای قطعه {chunk_idx+1} با کلید شماره {key_display_num}: {str(e_quota)[:100]}...")
@@ -386,11 +245,15 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
             except Exception as e_general:
                 error_type_name = type(e_general).__name__
-                _log(f"      ❌ خطای عمومی ({error_type_name}) در تولید قطعه {chunk_idx+1} با کلید {key_display_num}: {str(e_general)[:200]}")
-                if "response_mime_type" in str(e_general).lower() or "modality" in str(e_general).lower():
-                    _log("         این خطا ممکن است مربوط به عدم پشتیبانی مدل از خروجی صوتی یا تنظیمات نادرست response_mime_type باشد.")
-                if "model" in str(e_general).lower() and "not found" in str(e_general).lower():
                      _log(f"         مدل '{model_name_to_use}' یافت نشد یا برای این کلید API در دسترس نیست.")
                 if attempt_num_for_chunk < max_attempts_for_chunk - 1: time.sleep(RETRY_SLEEP_AFTER_QUOTA_ERROR)
                 else: all_chunks_processed = False
@@ -401,10 +264,10 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
             _log(f"  ⛔️ پردازش قطعه {chunk_idx+1} پس از {max_attempts_for_chunk} تلاش ناموفق بود."); all_chunks_processed = False; break
     advance_global_key_index_for_next_request()
-    # ... (بقیه کد core_generate_audio برای ادغام و بازگرداندن فایل، بدون تغییر) ...
     if not all_chunks_processed or not generated_files:
         _log("❌ هیچ فایل صوتی معتبری تولید نشد.")
-        for fp_cleanup in generated_files: # پاک کردن فایل‌های جزئی ایجاد شده
             try: os.remove(fp_cleanup)
             except: pass
         return None
@@ -421,7 +284,7 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
                         if os.path.exists(renamed_first_chunk): os.remove(renamed_first_chunk)
                         os.rename(generated_files[0], renamed_first_chunk); final_audio_file = renamed_first_chunk
                     except Exception as e_rename: _log(f"خطا در تغییر نام اولین قطعه: {e_rename}"); final_audio_file = generated_files[0]
-            for fp_cleanup_merge in generated_files: # پاک کردن فایل‌های جزئی
                 if final_audio_file and os.path.abspath(fp_cleanup_merge) == os.path.abspath(final_audio_file): continue
                 try: os.remove(fp_cleanup_merge)
                 except: pass
@@ -447,8 +310,6 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
     else: _log(f"❓ وضعیت نامشخص برای فایل نهایی."); return None
     return final_audio_file
-# ... (تابع gradio_tts_interface و UI و launch بدون تغییر نسبت به نسخه کامل قبلی) ...
 def gradio_tts_interface(use_file_input, uploaded_file, text_to_speak, speech_prompt, speaker_voice, temperature, progress=gr.Progress(track_tqdm=True)):
     actual_text = ""
     if use_file_input:
@@ -461,21 +322,25 @@ def gradio_tts_interface(use_file_input, uploaded_file, text_to_speak, speech_pr
     else:
         actual_text = text_to_speak
         if not actual_text or not actual_text.strip(): _log("❌ متن ورودی خالی."); return None
-    if not GOOGLE_LIBS_AVAILABLE or not GENAI_MODEL_ACCESS_CONFIGURED : # بررسی جدید
         gr.Warning("خطای سیستمی: کتابخانه‌های مورد نیاز یا تنظیمات مدل به درستی بارگذاری نشده‌اند.")
         return None
     if NUM_API_KEYS == 0:
         gr.Warning("خطای سیستمی: کلید API موجود نیست.")
         return None
-    final_path = core_generate_audio(actual_text, prompt_input, speaker_voice, temperature)
     if final_path is None:
-        gr.Info("امکان تولید صدا وجود ندارد. لطفاً دقایقی دیگر یا با متن کوتاه‌تری امتحان کنید.")
     return final_path
 custom_css_inspired_by_image = f"""@import url('https://fonts.googleapis.com/css2?family=Vazirmatn:wght@300;400;500;700;800&display=swap');:root {{ --app-font: 'Vazirmatn', sans-serif; --app-header-grad-start: #2980b9; --app-header-grad-end: #2ecc71; --app-panel-bg: #FFFFFF; --app-input-bg: #F7F7F7; --app-button-bg: #2979FF; --app-main-bg: linear-gradient(170deg, #E0F2FE 0%, #F3E8FF 100%); --app-text-primary: #333; --app-text-secondary: #555; --app-border-color: #E0E0E0; --radius-card: 20px; --radius-input: 8px; --shadow-card: 0 10px 30px -5px rgba(0,0,0,0.1); --shadow-button: 0 4px 10px -2px rgba(41,121,255,0.5);}}body, .gradio-container {{ font-family: var(--app-font); direction: rtl; background: var(--app-main-bg); color: var(--app-text-primary); font-size: 16px; line-height: 1.65; }}.gradio-container {{ max-width:100% !important; min-height:100vh; margin:0 !important; padding:0 !important; display:flex; flex-direction:column; }}.app-header-alpha {{ padding: 3rem 1.5rem 4rem 1.5rem; text-align: center; background-image: linear-gradient(135deg, var(--app-header-grad-start) 0%, var(--app-header-grad-end) 100%); color: white; border-bottom-left-radius: var(--radius-card); border-bottom-right-radius: var(--radius-card); box-shadow: 0 6px 20px -5px rgba(0,0,0,0.2); }}.app-header-alpha h1 {{ font-size: 2.4em; font-weight: 800; margin:0 0 0.5rem 0; text-shadow: 0 2px 4px rgba(0,0,0,0.15); }}.app-header-alpha p {{ font-size: 1.1em; color: rgba(255,255,255,0.9); margin-top:0; opacity: 0.9; }}.main-content-panel-alpha {{ padding: 1.8rem 1.5rem; max-width: 680px; margin: -2.5rem auto 2rem auto; width: 90%; background-color: var(--app-panel-bg); border-radius: var(--radius-card); box-shadow: var(--shadow-card); position:relative; z-index:10; }}@media (max-width: 768px) {{ .main-content-panel-alpha {{ width: 95%; padding: 1.5rem 1rem; margin-top: -2rem; }} .app-header-alpha h1 {{font-size:2em;}} .app-header-alpha p {{font-size:1em;}} }}footer {{display:none !important;}}.gr-button.generate-button-final {{ background: var(--app-button-bg) !important; color: white !important; border:none !important; border-radius: var(--radius-input) !important; padding: 0.8rem 1.5rem !important; font-weight: 700 !important; font-size:1.05em !important; transition: all 0.3s ease; box-shadow: var(--shadow-button); width:100%; margin-top:1.5rem !important; }}.gr-button.generate-button-final:hover {{ filter: brightness(1.1); transform: translateY(-2px); box-shadow: 0 6px 12px -3px rgba(41,121,255,0.6);}}.gr-input > label + div > textarea, .gr-dropdown > label + div > div > input, .gr-dropdown > label + div > div > select, .gr-textbox > label + div > textarea, .gr-file > label + div {{ border-radius: var(--radius-input) !important; border: 1px solid var(--app-border-color) !important; background-color: var(--app-input-bg) !important; box-shadow: inset 0 1px 2px rgba(0,0,0,0.05); padding: 0.75rem !important; }}.gr-file > label + div {{ text-align:center; border-style: dashed !important; }}.gr-input > label + div > textarea:focus, .gr-dropdown > label + div > div > input:focus, .gr-textbox > label + div > textarea:focus {{ border-color: var(--app-button-bg) !important; box-shadow: 0 0 0 3px rgba(41,121,255,0.2) !important; }}label > .label-text {{ font-weight: 700 !important; color: var(--app-text-primary) !important; font-size: 0.95em !important; margin-bottom: 0.5rem !important; }}.section-title-main-alpha {{ font-size: 1.1em; color: var(--app-text-secondary); margin-bottom:1rem; padding-bottom: 0.5rem; border-bottom: 1px solid var(--app-border-color); font-weight:500; text-align:right; }}label > .label-text::before {{ margin-left: 8px; vertical-align: middle; opacity: 0.7; }}label[for*="text_input_main_alpha_v3"] > .label-text::before {{ content: '📝'; }}label[for*="speech_prompt_alpha_v3"] > .label-text::before {{ content: '🗣️'; }}label[for*="speaker_voice_alpha_v3"] > .label-text::before {{ content: '🎤'; }}label[for*="temperature_slider_alpha_v3"] > .label-text::before {{ content: '🌡️'; }}#output_audio_player_alpha_v3 audio {{ width: 100%; border-radius: var(--radius-input); margin-top:0.8rem; }}.temp_description_class_alpha_v3 {{ font-size: 0.85em; color: #777; margin-top: -0.4rem; margin-bottom: 1rem; }}.app-footer-final {{text-align:center;font-size:0.9em;color: var(--app-text-secondary);opacity:0.8; margin-top:3rem;padding:1.5rem 0; border-top:1px solid var(--app-border-color);}}"""
 alpha_header_html_v3 = """<div class='app-header-alpha'><h1>Alpha TTS</h1><p>جادوی تبدیل متن به صدا در دستان شما</p></div>"""
-if GOOGLE_LIBS_AVAILABLE and GENAI_MODEL_ACCESS_CONFIGURED:
     with gr.Blocks(theme=gr.themes.Base(font=[gr.themes.GoogleFont("Vazirmatn")]), css=custom_css_inspired_by_image, title="آلفا TTS") as demo:
         gr.HTML(alpha_header_html_v3)
         with gr.Column(elem_classes=["main-content-panel-alpha"]):
@@ -484,7 +349,9 @@ if GOOGLE_LIBS_AVAILABLE and GENAI_MODEL_ACCESS_CONFIGURED:
             text_to_speak_tb = gr.Textbox(label="متن فارسی برای تبدیل", placeholder="مثال: سلام، فردا هوا چطور است؟", lines=5, value="", visible=True, elem_id="text_input_main_alpha_v3")
             use_file_input_cb.change(fn=lambda x: (gr.update(visible=x, label=" " if x else "متن فارسی برای تبدیل"), gr.update(visible=not x)), inputs=use_file_input_cb, outputs=[uploaded_file_input, text_to_speak_tb])
             speech_prompt_tb = gr.Textbox(label="سبک گفتار (اختیاری)", placeholder="مثال: با لحنی شاد و پرانرژی", value="با لحنی دوستانه و رسا صحبت کن.", lines=2, elem_id="speech_prompt_alpha_v3")
-            speaker_voice_dd = gr.Dropdown(SPEAKER_VOICES, label="انتخاب گوینده و لهجه", value="Charon", elem_id="speaker_voice_alpha_v3") # speaker_voice دیگر به طور مستقیم به API ارسال نمی‌شود، اما در UI باقی می‌ماند
             temperature_slider = gr.Slider(minimum=0.1, maximum=1.5, step=0.05, value=0.9, label="میزان خلاقیت صدا", elem_id="temperature_slider_alpha_v3")
             gr.Markdown("<p class='temp_description_class_alpha_v3'>مقادیر بالاتر = تنوع بیشتر، مقادیر پایین‌تر = یکنواختی بیشتر.</p>")
             generate_button = gr.Button("🚀 تولید و پخش صدا", elem_classes=["generate-button-final"], elem_id="generate_button_alpha_v3")
@@ -500,9 +367,9 @@ if __name__ == "__main__":
     else:
         msg = "خطای ناشناخته در شروع برنامه."
         if not GOOGLE_LIBS_AVAILABLE: msg = "کتابخانه‌های گوگل بارگذاری نشدند."
-        elif not GENAI_MODEL_ACCESS_CONFIGURED: msg = "تنظیمات مدل API جدید (GenerativeModel/configure) یافت نشد."
         elif NUM_API_KEYS == 0: msg = "هیچ کلید API یافت نشد."
         _log(f"🔴 برنامه به دلیل '{msg}' اجرا نشد.")
         with gr.Blocks(title="خطا") as error_demo:
-            gr.Markdown(f"# خطای اجرای برنامه\n\n**دلیل:** {msg}\n\nلطفاً لاگ‌های برنامه یا تنظیمات Space را بررسی کنید.")
         error_demo.launch()

 import zipfile
 import importlib.metadata
+# --- START: Import کتابخانه‌های گوگل با بررسی دقیق‌تر ---
 GOOGLE_LIBS_AVAILABLE = False
+GENAI_MODEL_ACCESS_CONFIGURED = False
+def _log_startup(message):
     print(f"[Startup Log] {message}")
 try:
     except importlib.metadata.PackageNotFoundError:
         _log_startup("هشدار: پکیج 'google-generativeai' نصب شده، اما نسخه‌ی آن قابل تشخیص نیست.")
     if hasattr(genai, 'GenerativeModel') and hasattr(genai, 'configure'):
         _log_startup("ویژگی‌های 'GenerativeModel' و 'configure' در ماژول 'genai' یافت شدند.")
+        GENAI_MODEL_ACCESS_CONFIGURED = True
     else:
+        _log_startup("⛔️ خطای مهم: 'GenerativeModel' یا 'configure' در 'genai' یافت نشد.")
+    from google.generativeai import types
     from google.api_core import exceptions as google_exceptions
     _log_startup("'types' و 'google_exceptions' با موفقیت وارد شدند.")
     GOOGLE_LIBS_AVAILABLE = True
     _log_startup(f"❌ خطای ناشناخته در حین import یا بررسی کتابخانه‌های گوگل: {e_other}")
 # --- END: Import کتابخانه‌های گوگل ---
+try:
+    from pydub import AudioSegment
+    PYDUB_AVAILABLE = True
+except ImportError:
+    _log_startup("⚠️ کتابخانه pydub یافت نشد. قابلیت ادغام فایل‌های صوتی غیرفعال خواهد بود.")
+    PYDUB_AVAILABLE = False
+# --- START: منطق چرخش API Key ---
 GEMINI_API_KEYS = []
 i = 1
 while os.environ.get(f"GEMINI_API_KEY_{i}"):
   i += 1
 NUM_API_KEYS = len(GEMINI_API_KEYS)
 CURRENT_KEY_INDEX_GLOBAL = 0
+def _log(message):
     print(f"[لاگ آلفا TTS] {message}")
 if not GOOGLE_LIBS_AVAILABLE:
     _log("🔴 به دلیل عدم بارگذاری کتابخانه‌های اصلی گوگل، عملکرد برنامه مختل خواهد شد.")
 if NUM_API_KEYS == 0:
+  _log("⛔️ هشدار: هیچ Secret با نام GEMINI_API_KEY_n یافت نشد!")
 else:
   _log(f"✅ تعداد {NUM_API_KEYS} کلید API جیمینای بارگذاری شد.")
 def get_api_key_for_attempt(attempt_within_request):
     global CURRENT_KEY_INDEX_GLOBAL
     if NUM_API_KEYS > 0: CURRENT_KEY_INDEX_GLOBAL = (CURRENT_KEY_INDEX_GLOBAL + 1) % NUM_API_KEYS
 # --- END: منطق چرخش API Key ---
 SPEAKER_VOICES = [
     "Achird", "Zubenelgenubi", "Vindemiatrix", "Sadachbia", "Sadaltager",
     "Rasalthgeti", "Orus", "Aoede", "Callirrhoe", "Autonoe", "Enceladus",
     "Iapetus", "Zephyr", "Puck", "Charon", "Kore", "Fenrir", "Leda"
 ]
+# ** نام مدل برای TTS با API جدید **
+# این باید نام مدلی باشد که از TTS با API جدید پشتیبانی می‌کند.
+# "gemini-1.5-flash-latest" یک مدل پایه است. برای TTS، ممکن است نیاز به prompt خاص یا تنظیمات خاص باشد.
+# اگر گوگل مدل خاصی برای TTS معرفی کرده (مثلا "models/text-to-speech")، باید از آن استفاده شود.
+MODEL_NAME_FOR_TTS = "gemini-1.5-flash-latest"
 DEFAULT_MAX_CHUNK_SIZE = 3800
 DEFAULT_SLEEP_BETWEEN_REQUESTS = 6
 RETRY_SLEEP_AFTER_QUOTA_ERROR = 2
 DEFAULT_OUTPUT_FILENAME_BASE = "alpha_tts_audio"
 def save_binary_file(file_name, data):
     try:
         with open(file_name, "wb") as f: f.write(data)
     except Exception as e:
         _log(f"❌ خطا در ذخیره فایل {file_name}: {e}")
         return None
+def convert_to_wav(audio_data: bytes, mime_type: str) -> bytes: # این تابع ممکن است دیگر لازم نباشد اگر API مستقیما WAV بدهد
     parameters = parse_audio_mime_type(mime_type)
     bits_per_sample, rate = parameters["bits_per_sample"], parameters["rate"]
     num_channels, data_size = 1, len(audio_data)
         if param_lower_startswith(param, "rate="):
             try: rate = int(param.split("=", 1)[1])
             except: pass
+        elif param.startswith("audio/L"): # این فرمت احتمالا دیگر استفاده نمی‌شود
             try: bits = int(param.split("L", 1)[1])
             except: pass
     return {"bits_per_sample": bits, "rate": rate}
         combined.export(output_path, format="wav"); return True
     except Exception as e: _log(f"❌ خطا در ادغام: {e}"); return False
+def core_generate_audio(text_input, speech_prompt, selected_voice, temperature_val): # پارامتر speech_prompt
     if not GOOGLE_LIBS_AVAILABLE or not GENAI_MODEL_ACCESS_CONFIGURED:
         _log("❌ کتابخانه‌های گوگل یا تنظیمات مدل به درستی بارگذاری نشده‌اند.")
         return None
     output_base_name = DEFAULT_OUTPUT_FILENAME_BASE
     max_chunk, sleep_time = DEFAULT_MAX_CHUNK_SIZE, DEFAULT_SLEEP_BETWEEN_REQUESTS
+    model_name_to_use = MODEL_NAME_FOR_TTS
     if not text_input or not text_input.strip():
         _log("❌ متن ورودی خالی است."); advance_global_key_index_for_next_request(); return None
             _log(f"     प्रयास {attempt_num_for_chunk + 1}/{max_attempts_for_chunk} با کلید شماره {key_display_num} (...{selected_api_key[-4:]})")
             try:
                 genai.configure(api_key=selected_api_key)
                 model_instance = genai.GenerativeModel(model_name_to_use)
+                # ترکیب speech_prompt با متن اصلی
+                final_text_for_api = chunk_text.strip()
+                if speech_prompt and speech_prompt.strip(): # استفاده از speech_prompt
+                    processed_prompt = speech_prompt.strip()
                     if not re.search(r'[.!?؟،:۔]$', processed_prompt): processed_prompt += "،"
+                    final_text_for_api = f"{processed_prompt} {final_text_for_api}"
+                # ** نحوه کنترل صدا (selected_voice) با API جدید نیاز به بررسی دارد **
+                # در حال حاضر selected_voice مستقیماً استفاده نمی‌شود. ممکن است نیاز به prompt engineering
+                # یا پارامترهای خاص در generation_config باشد اگر مدل از آن پشتیبانی کند.
+                # مثال: final_text_for_api = f"با صدای {selected_voice}، {final_text_for_api}" (این فقط یک حدس است)
+                _log(f"      متن نهایی برای API: '{final_text_for_api[:100]}...'")
                 response = model_instance.generate_content(
+                    contents=final_text_for_api,
+                    generation_config=types.GenerationConfig(
                         temperature=temperature_val,
+                        response_mime_type="audio/wav"
                     )
                 )
                 if response.candidates and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data:
                     inline_data = response.candidates[0].content.parts[0].inline_data
                     data_buffer = inline_data.data
+                    # mime_type از پاسخ برای اطمینان (اگرچه wav درخواست کرده‌ایم)
+                    mime_type_from_response = inline_data.mime_type
+                    _log(f"      نوع MIME دریافت شده از API: {mime_type_from_response}")
+                    ext = mimetypes.guess_extension(mime_type_from_response) or ".wav"
                     if not ext.startswith("."): ext = "." + ext
+                    # تابع convert_to_wav ممکن است دیگر لازم نباشد اگر API مستقیم فرمت استاندارد بدهد.
+                    # if "audio/L" in mime_type_from_response and ext == ".wav":
+                    # data_buffer = convert_to_wav(data_buffer, mime_type_from_response)
                     fname_base = f"{output_base_name}_part{chunk_idx+1:03d}"
                     temp_fpath_for_chunk = f"{fname_base}{ext}"
                     if os.path.exists(temp_fpath_for_chunk):
                         if chunk_idx < len(text_chunks) - 1: time.sleep(DEFAULT_SLEEP_BETWEEN_REQUESTS)
                         break
                 else:
+                    error_message = "پاسخ API بدون داده صوتی معتبر."
+                    if hasattr(response, 'prompt_feedback') and response.prompt_feedback:
+                        error_message += f" بازخورد Prompt: {response.prompt_feedback}"
+                    _log(f"      ⚠️ {error_message} با کلید {key_display_num}. پاسخ کلی: {str(response)[:200]}")
             except google_exceptions.ResourceExhausted as e_quota:
                 _log(f"      ❌ خطای سهمیه برای قطعه {chunk_idx+1} با کلید شماره {key_display_num}: {str(e_quota)[:100]}...")
             except Exception as e_general:
                 error_type_name = type(e_general).__name__
+                error_msg_str = str(e_general)
+                _log(f"      ❌ خطای عمومی ({error_type_name}) در تولید قطعه {chunk_idx+1} با کلید {key_display_num}: {error_msg_str[:200]}")
+                if "response_mime_type" in error_msg_str.lower() or "modality" in error_msg_str.lower() or "audio" in error_msg_str.lower() :
+                    _log(f"         این خطا ممکن است مربوط به عدم پشتیبانی مدل '{model_name_to_use}' از خروجی صوتی یا تنظیمات نادرست response_mime_type باشد.")
+                if "model" in error_msg_str.lower() and "not found" in error_msg_str.lower():
                      _log(f"         مدل '{model_name_to_use}' یافت نشد یا برای این کلید API در دسترس نیست.")
+                if "permission denied" in error_msg_str.lower() or "access denied" in error_msg_str.lower():
+                     _log(f"         خطای دسترسی با کلید API شماره {key_display_num}. ممکن است کلید نامعتبر باشد یا به مدل دسترسی نداشته باشد.")
                 if attempt_num_for_chunk < max_attempts_for_chunk - 1: time.sleep(RETRY_SLEEP_AFTER_QUOTA_ERROR)
                 else: all_chunks_processed = False
             _log(f"  ⛔️ پردازش قطعه {chunk_idx+1} پس از {max_attempts_for_chunk} تلاش ناموفق بود."); all_chunks_processed = False; break
     advance_global_key_index_for_next_request()
     if not all_chunks_processed or not generated_files:
         _log("❌ هیچ فایل صوتی معتبری تولید نشد.")
+        for fp_cleanup in generated_files:
             try: os.remove(fp_cleanup)
             except: pass
         return None
                         if os.path.exists(renamed_first_chunk): os.remove(renamed_first_chunk)
                         os.rename(generated_files[0], renamed_first_chunk); final_audio_file = renamed_first_chunk
                     except Exception as e_rename: _log(f"خطا در تغییر نام اولین قطعه: {e_rename}"); final_audio_file = generated_files[0]
+            for fp_cleanup_merge in generated_files:
                 if final_audio_file and os.path.abspath(fp_cleanup_merge) == os.path.abspath(final_audio_file): continue
                 try: os.remove(fp_cleanup_merge)
                 except: pass
     else: _log(f"❓ وضعیت نامشخص برای فایل نهایی."); return None
     return final_audio_file
 def gradio_tts_interface(use_file_input, uploaded_file, text_to_speak, speech_prompt, speaker_voice, temperature, progress=gr.Progress(track_tqdm=True)):
     actual_text = ""
     if use_file_input:
     else:
         actual_text = text_to_speak
         if not actual_text or not actual_text.strip(): _log("❌ متن ورودی خالی."); return None
+    if not GOOGLE_LIBS_AVAILABLE or not GENAI_MODEL_ACCESS_CONFIGURED:
         gr.Warning("خطای سیستمی: کتابخانه‌های مورد نیاز یا تنظیمات مدل به درستی بارگذاری نشده‌اند.")
         return None
     if NUM_API_KEYS == 0:
         gr.Warning("خطای سیستمی: کلید API موجود نیست.")
         return None
+    final_path = core_generate_audio(actual_text, speech_prompt, speaker_voice, temperature) # ارسال speech_prompt
     if final_path is None:
+        gr.Info("امکان تولید صدا وجود ندارد. لطفاً دقایقی دیگر، با متن کوتاه‌تری یا با بررسی لاگ‌ها برای خطاهای احتمالی API، مجدداً تلاش کنید.")
     return final_path
+# --- CSS و UI (بدون تغییر) ---
 custom_css_inspired_by_image = f"""@import url('https://fonts.googleapis.com/css2?family=Vazirmatn:wght@300;400;500;700;800&display=swap');:root {{ --app-font: 'Vazirmatn', sans-serif; --app-header-grad-start: #2980b9; --app-header-grad-end: #2ecc71; --app-panel-bg: #FFFFFF; --app-input-bg: #F7F7F7; --app-button-bg: #2979FF; --app-main-bg: linear-gradient(170deg, #E0F2FE 0%, #F3E8FF 100%); --app-text-primary: #333; --app-text-secondary: #555; --app-border-color: #E0E0E0; --radius-card: 20px; --radius-input: 8px; --shadow-card: 0 10px 30px -5px rgba(0,0,0,0.1); --shadow-button: 0 4px 10px -2px rgba(41,121,255,0.5);}}body, .gradio-container {{ font-family: var(--app-font); direction: rtl; background: var(--app-main-bg); color: var(--app-text-primary); font-size: 16px; line-height: 1.65; }}.gradio-container {{ max-width:100% !important; min-height:100vh; margin:0 !important; padding:0 !important; display:flex; flex-direction:column; }}.app-header-alpha {{ padding: 3rem 1.5rem 4rem 1.5rem; text-align: center; background-image: linear-gradient(135deg, var(--app-header-grad-start) 0%, var(--app-header-grad-end) 100%); color: white; border-bottom-left-radius: var(--radius-card); border-bottom-right-radius: var(--radius-card); box-shadow: 0 6px 20px -5px rgba(0,0,0,0.2); }}.app-header-alpha h1 {{ font-size: 2.4em; font-weight: 800; margin:0 0 0.5rem 0; text-shadow: 0 2px 4px rgba(0,0,0,0.15); }}.app-header-alpha p {{ font-size: 1.1em; color: rgba(255,255,255,0.9); margin-top:0; opacity: 0.9; }}.main-content-panel-alpha {{ padding: 1.8rem 1.5rem; max-width: 680px; margin: -2.5rem auto 2rem auto; width: 90%; background-color: var(--app-panel-bg); border-radius: var(--radius-card); box-shadow: var(--shadow-card); position:relative; z-index:10; }}@media (max-width: 768px) {{ .main-content-panel-alpha {{ width: 95%; padding: 1.5rem 1rem; margin-top: -2rem; }} .app-header-alpha h1 {{font-size:2em;}} .app-header-alpha p {{font-size:1em;}} }}footer {{display:none !important;}}.gr-button.generate-button-final {{ background: var(--app-button-bg) !important; color: white !important; border:none !important; border-radius: var(--radius-input) !important; padding: 0.8rem 1.5rem !important; font-weight: 700 !important; font-size:1.05em !important; transition: all 0.3s ease; box-shadow: var(--shadow-button); width:100%; margin-top:1.5rem !important; }}.gr-button.generate-button-final:hover {{ filter: brightness(1.1); transform: translateY(-2px); box-shadow: 0 6px 12px -3px rgba(41,121,255,0.6);}}.gr-input > label + div > textarea, .gr-dropdown > label + div > div > input, .gr-dropdown > label + div > div > select, .gr-textbox > label + div > textarea, .gr-file > label + div {{ border-radius: var(--radius-input) !important; border: 1px solid var(--app-border-color) !important; background-color: var(--app-input-bg) !important; box-shadow: inset 0 1px 2px rgba(0,0,0,0.05); padding: 0.75rem !important; }}.gr-file > label + div {{ text-align:center; border-style: dashed !important; }}.gr-input > label + div > textarea:focus, .gr-dropdown > label + div > div > input:focus, .gr-textbox > label + div > textarea:focus {{ border-color: var(--app-button-bg) !important; box-shadow: 0 0 0 3px rgba(41,121,255,0.2) !important; }}label > .label-text {{ font-weight: 700 !important; color: var(--app-text-primary) !important; font-size: 0.95em !important; margin-bottom: 0.5rem !important; }}.section-title-main-alpha {{ font-size: 1.1em; color: var(--app-text-secondary); margin-bottom:1rem; padding-bottom: 0.5rem; border-bottom: 1px solid var(--app-border-color); font-weight:500; text-align:right; }}label > .label-text::before {{ margin-left: 8px; vertical-align: middle; opacity: 0.7; }}label[for*="text_input_main_alpha_v3"] > .label-text::before {{ content: '📝'; }}label[for*="speech_prompt_alpha_v3"] > .label-text::before {{ content: '🗣️'; }}label[for*="speaker_voice_alpha_v3"] > .label-text::before {{ content: '🎤'; }}label[for*="temperature_slider_alpha_v3"] > .label-text::before {{ content: '🌡️'; }}#output_audio_player_alpha_v3 audio {{ width: 100%; border-radius: var(--radius-input); margin-top:0.8rem; }}.temp_description_class_alpha_v3 {{ font-size: 0.85em; color: #777; margin-top: -0.4rem; margin-bottom: 1rem; }}.app-footer-final {{text-align:center;font-size:0.9em;color: var(--app-text-secondary);opacity:0.8; margin-top:3rem;padding:1.5rem 0; border-top:1px solid var(--app-border-color);}}"""
 alpha_header_html_v3 = """<div class='app-header-alpha'><h1>Alpha TTS</h1><p>جادوی تبدیل متن به صدا در دستان شما</p></div>"""
+if GOOGLE_LIBS_AVAILABLE and GENAI_MODEL_ACCESS_CONFIGURED: # بررسی هر دو پرچم
     with gr.Blocks(theme=gr.themes.Base(font=[gr.themes.GoogleFont("Vazirmatn")]), css=custom_css_inspired_by_image, title="آلفا TTS") as demo:
         gr.HTML(alpha_header_html_v3)
         with gr.Column(elem_classes=["main-content-panel-alpha"]):
             text_to_speak_tb = gr.Textbox(label="متن فارسی برای تبدیل", placeholder="مثال: سلام، فردا هوا چطور است؟", lines=5, value="", visible=True, elem_id="text_input_main_alpha_v3")
             use_file_input_cb.change(fn=lambda x: (gr.update(visible=x, label=" " if x else "متن فارسی برای تبدیل"), gr.update(visible=not x)), inputs=use_file_input_cb, outputs=[uploaded_file_input, text_to_speak_tb])
             speech_prompt_tb = gr.Textbox(label="سبک گفتار (اختیاری)", placeholder="مثال: با لحنی شاد و پرانرژی", value="با لحنی دوستانه و رسا صحبت کن.", lines=2, elem_id="speech_prompt_alpha_v3")
+            # speaker_voice_dd دیگر مستقیماً به API ارسال نمی‌شود، اما برای کاربر باقی می‌ماند.
+            # برای کنترل صدا، باید از روش‌های دیگر (مانند prompt engineering) استفاده کرد.
+            speaker_voice_dd = gr.Dropdown(SPEAKER_VOICES, label="انتخاب گوینده (توجه: این گزینه فعلاً تأثیر مستقیم روی صدای API جدید ندارد)", value="Charon", elem_id="speaker_voice_alpha_v3")
             temperature_slider = gr.Slider(minimum=0.1, maximum=1.5, step=0.05, value=0.9, label="میزان خلاقیت صدا", elem_id="temperature_slider_alpha_v3")
             gr.Markdown("<p class='temp_description_class_alpha_v3'>مقادیر بالاتر = تنوع بیشتر، مقادیر پایین‌تر = یکنواختی بیشتر.</p>")
             generate_button = gr.Button("🚀 تولید و پخش صدا", elem_classes=["generate-button-final"], elem_id="generate_button_alpha_v3")
     else:
         msg = "خطای ناشناخته در شروع برنامه."
         if not GOOGLE_LIBS_AVAILABLE: msg = "کتابخانه‌های گوگل بارگذاری نشدند."
+        elif not GENAI_MODEL_ACCESS_CONFIGURED: msg = "تنظیمات مدل API جدید (GenerativeModel/configure) یافت نشد یا سازگار نیست."
         elif NUM_API_KEYS == 0: msg = "هیچ کلید API یافت نشد."
         _log(f"🔴 برنامه به دلیل '{msg}' اجرا نشد.")
         with gr.Blocks(title="خطا") as error_demo:
+            gr.Markdown(f"# خطای اجرای برنامه\n\n**دلیل:** {msg}\n\nلطفاً لاگ‌های برنامه یا تنظیمات Space را بررسی کنید و از صحت نسخه کتابخانه google-generativeai و نام مدل TTS اطمینان حاصل کنید.")
         error_demo.launch()