Ttspro

Running

App Files Files Community

Hamed744 commited on Jun 5, 2025

Commit

5b42498

verified ·

1 Parent(s): 5f5b8e1

Update app.py

Browse files

Files changed (1) hide show

app.py +153 -87

app.py CHANGED Viewed

@@ -8,6 +8,7 @@ import time
 import zipfile
 from google import genai
 from google.genai import types
 try:
     from pydub import AudioSegment
@@ -23,28 +24,43 @@ while os.environ.get(f"GEMINI_API_KEY_{i}"):
   i += 1
 NUM_API_KEYS = len(GEMINI_API_KEYS)
-CURRENT_KEY_INDEX = 0
 def _log(message):
-    """تابع ساده شده برای لاگ کردن پیام‌ها به کنسول."""
     print(f"[لاگ آلفا TTS] {message}")
 if NUM_API_KEYS == 0:
   _log("⛔️ خطای حیاتی: هیچ Secret با نام GEMINI_API_KEY_n یافت نشد!")
-  _log("   لطفاً Secret ها را مانند GEMINI_API_KEY_1, GEMINI_API_KEY_2, ... در تنظیمات Space خود اضافه کنید.")
 else:
   _log(f"✅ تعداد {NUM_API_KEYS} کلید API جیمینای بارگذاری شد.")
-def get_next_api_key():
-  global CURRENT_KEY_INDEX
   if NUM_API_KEYS == 0:
-    _log("⚠️ تلاش برای گرفتن کلید API در حالی که هیچ کلیدی بارگذاری نشده است.")
-    return None, -1
-  key_to_use = GEMINI_API_KEYS[CURRENT_KEY_INDEX % NUM_API_KEYS]
-  key_display_index = (CURRENT_KEY_INDEX % NUM_API_KEYS) + 1
-  CURRENT_KEY_INDEX += 1
-  return key_to_use, key_display_index
 # --- END: منطق چرخش API Key ---
 SPEAKER_VOICES = [
@@ -56,7 +72,8 @@ SPEAKER_VOICES = [
 ]
 FIXED_MODEL_NAME = "gemini-2.5-flash-preview-tts"
 DEFAULT_MAX_CHUNK_SIZE = 3800
-DEFAULT_SLEEP_BETWEEN_REQUESTS = 8
 DEFAULT_OUTPUT_FILENAME_BASE = "alpha_tts_audio"
 def save_binary_file(file_name, data):
@@ -91,33 +108,28 @@ def parse_audio_mime_type(mime_type: str) -> dict[str, int]:
 def smart_text_split(text, max_size=3800):
     if len(text) <= max_size: return [text]
     chunks, current_chunk = [], ""
-    # بهبود regex برای پشتیبانی بهتر از جداکننده‌های فارسی و انگلیسی
     sentences = re.split(r'(?<=[.!?؟۔])\s+', text)
     for sentence in sentences:
-        if len(current_chunk) + len(sentence) + 1 > max_size: # +1 for space
             if current_chunk: chunks.append(current_chunk.strip())
             current_chunk = sentence
-            while len(current_chunk) > max_size: # If a single sentence is too long
-                # Try to split at sensible places like comma, semicolon, or space
                 split_idx = -1
-                # Prefer splitting at punctuation, then space
                 for char_to_find in ['،', ',', ';', ':', ' ']:
                     try:
-                        # Search backwards from max_size towards middle
                         split_idx = current_chunk.rindex(char_to_find, max_size // 2, max_size)
                         break
                     except ValueError:
                         continue
                 if split_idx != -1:
                     part = current_chunk[:split_idx+1]
                     current_chunk = current_chunk[split_idx+1:]
-                else: # Force split if no ideal character found
                     part = current_chunk[:max_size]
                     current_chunk = current_chunk[max_size:]
                 chunks.append(part.strip())
         else:
-            if current_chunk: # Add space if it's not the first part of the chunk
                 current_chunk += " " + sentence
             else:
                 current_chunk = sentence
@@ -142,77 +154,124 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
     output_base_name = DEFAULT_OUTPUT_FILENAME_BASE
     max_chunk, sleep_time = DEFAULT_MAX_CHUNK_SIZE, DEFAULT_SLEEP_BETWEEN_REQUESTS
-    selected_api_key, key_idx_display = get_next_api_key()
-    if not selected_api_key:
-        _log("❌ کلید API برای این درخواست در دسترس نیست. لطفاً از تنظیمات Secrets مطمئن شوید.")
-        return None
-    _log(f"⚙️ استفاده از کلید API شماره {key_idx_display} (پایان یافته با: ...{selected_api_key[-4:]})")
-    try:
-        client = genai.Client(api_key=selected_api_key)
-    except Exception as e:
-        _log(f"❌ خطا در مقداردهی اولیه کلاینت Gemini با کلید شماره {key_idx_display}: {e}")
-        return None
     if not text_input or not text_input.strip():
         _log("❌ متن ورودی خالی است.")
         return None
     text_chunks = smart_text_split(text_input, max_chunk)
     if not text_chunks:
         _log("❌ متن قابل پردازش به قطعات کوچکتر نیست.")
         return None
     generated_files = []
-    for i, chunk in enumerate(text_chunks):
-        # --- START: تغییر نحوه ترکیب prompt و chunk ---
-        if prompt_input and prompt_input.strip():
-            processed_prompt = prompt_input.strip()
-            # اگر سبک گفتار با نقطه گذاری تمام نمی‌شود، یک ویرگول یا نقطه اضافه می‌کنیم
-            # این به مدل کمک می‌کند تا آن را به عنوان یک عبارت راهنما قبل از متن اصلی تشخیص دهد
-            if not re.search(r'[.!?؟،:۔]$', processed_prompt):
-                processed_prompt += "،" # افزودن ویرگول فارسی به عنوان جداکننده ملایم
-            final_text = f"{processed_prompt} {chunk.strip()}"
-        else:
-            final_text = chunk.strip()
-        # --- END: تغییر نحوه ترکیب prompt و chunk ---
-        _log(f"   متن ارسالی به API (قطعه {i+1}): '{final_text[:100]}...'") # نمایش بخش کوچکی از متن نهایی برای دیباگ
-        contents = [types.Content(role="user", parts=[types.Part.from_text(text=final_text)])]
-        config = types.GenerateContentConfig(temperature=temperature_val, response_modalities=["audio"],
-            speech_config=types.SpeechConfig(voice_config=types.VoiceConfig(
-                prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=selected_voice))))
-        fname_base = f"{output_base_name}_part{i+1:03d}"
-        try:
-            response = client.models.generate_content(model=FIXED_MODEL_NAME, contents=contents, config=config)
-            if response.candidates and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data:
-                inline_data = response.candidates[0].content.parts[0].inline_data
-                data_buffer = inline_data.data
-                ext = mimetypes.guess_extension(inline_data.mime_type) or ".wav"
-                if "audio/L" in inline_data.mime_type and ext == ".wav": data_buffer = convert_to_wav(data_buffer, inline_data.mime_type)
-                if not ext.startswith("."): ext = "." + ext
-                fpath = save_binary_file(f"{fname_base}{ext}", data_buffer)
-                if fpath: generated_files.append(fpath)
-            else: _log(f"⚠️ پاسخ API برای قطعه {i+1} بدون داده صوتی بود (با کلید شماره {key_idx_display}).")
-        except Exception as e:
-            _log(f"❌ خطا در تولید قطعه {i+1} با کلید شماره {key_idx_display}: {e}")
-            # بررسی جزئیات خطا از Gemini، اگر موجود باشد
-            if hasattr(e, 'message') and "API key" in e.message:
-                 _log(f"   این خطا ممکن است مربوط به کلید API (شماره {key_idx_display}) یا محدودیت‌های آن باشد.")
-            elif hasattr(e, 'message') and "resource has been exhausted" in e.message.lower():
-                 _log(f"   احتمالاً به محدودیت استفاده از کلید API (شماره {key_idx_display}) رسیده‌اید.")
-            continue
-        if i < len(text_chunks) - 1 and len(text_chunks) > 1: time.sleep(sleep_time)
-    if not generated_files:
-        _log(f"❌ هیچ فایل صوتی با کلید شماره {key_idx_display} تولید نشد.")
         return None
     final_audio_file = None
-    final_output_path_base = f"{output_base_name}_final"
     if len(generated_files) > 1:
         if PYDUB_AVAILABLE:
@@ -229,7 +288,7 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
                         os.rename(generated_files[0], renamed_first_chunk)
                         final_audio_file = renamed_first_chunk
                     except Exception as e_rename:
-                         _log(f"خطا در تغییر نام فایل اولین قطعه (پس از ادغام ناموفق): {e_rename}")
                          final_audio_file = generated_files[0]
             for fp_cleanup in generated_files:
@@ -264,13 +323,13 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
             final_audio_file = generated_files[0]
     if final_audio_file and os.path.exists(final_audio_file):
-        _log(f"✅ فایل صوتی نهایی با موفقیت با کلید شماره {key_idx_display} تولید شد: {os.path.basename(final_audio_file)}")
     elif final_audio_file:
-        _log(f"⚠️ فایل نهایی '{final_audio_file}' پس از پردازش وجود ندارد! (با کلید شماره {key_idx_display})")
         return None
     else:
         # این حالت نباید رخ دهد اگر generated_files خالی نباشد و خطایی در تغییر نام رخ ندهد
-        _log(f"❓ وضعیت نامشخص برای فایل نهایی پس از پردازش تمام قطعات. (با کلید شماره {key_idx_display})")
         return None
     return final_audio_file
@@ -280,7 +339,6 @@ def gradio_tts_interface(use_file_input, uploaded_file, text_to_speak, speech_pr
     if use_file_input:
         if uploaded_file:
             try:
-                # استفاده از uploaded_file.name که مسیر فایل موقت در Gradio است
                 with open(uploaded_file.name, 'r', encoding='utf-8') as f: actual_text = f.read().strip()
                 if not actual_text: _log("❌ فایل آپلود شده خالی است یا خوانده نشد."); return None
             except Exception as e: _log(f"❌ خطا در خواندن فایل آپلود شده: {e}"); return None
@@ -289,6 +347,10 @@ def gradio_tts_interface(use_file_input, uploaded_file, text_to_speak, speech_pr
         actual_text = text_to_speak
         if not actual_text or not actual_text.strip(): _log("❌ متن ورودی برای تبدیل خالی است."); return None
     final_path = core_generate_audio(actual_text, speech_prompt, speaker_voice, temperature)
     return final_path
@@ -373,7 +435,7 @@ with gr.Blocks(theme=gr.themes.Base(font=[gr.themes.GoogleFont("Vazirmatn")]), c
         speech_prompt_tb = gr.Textbox(
             label="سبک گفتار (اختیاری)",
             placeholder="مثال: با لحنی شاد و پرانرژی",
-            value="با لحنی دوستانه و رسا صحبت کن.", # مقدار پیش‌فرض
             lines=2, elem_id="speech_prompt_alpha_v3"
         )
         speaker_voice_dd = gr.Dropdown(
@@ -387,7 +449,7 @@ with gr.Blocks(theme=gr.themes.Base(font=[gr.themes.GoogleFont("Vazirmatn")]), c
         generate_button = gr.Button("🚀 تولید و پخش صدا", elem_classes=["generate-button-final"], elem_id="generate_button_alpha_v3")
-        output_audio = gr.Audio(label=" ", type="filepath", elem_id="output_audio_player_alpha_v3") # لیبل خالی برای تطابق با ظاهر
         generate_button.click(
             fn=gradio_tts_interface,
@@ -399,13 +461,17 @@ with gr.Blocks(theme=gr.themes.Base(font=[gr.themes.GoogleFont("Vazirmatn")]), c
         gr.Examples(
             examples=[
                 [False, None, "سلام بر شما، امیدوارم روز خوبی داشته باشید.", "با لحنی گرم و صمیمی.", "Zephyr", 0.85],
-                [False, None, "این یک آزمایش برای بررسی کیفیت صدای تولید شده توسط هوش مصنوعی آلفا است.", "با صدایی طبیعی و روان.", "Charon", 0.9],
-                [False, None, "آیا می‌توانم سوالی از شما بپرسم؟", "با کنجکاوی", "Puck", 0.95],
             ],
             inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ],
             outputs=[output_audio],
             fn=gradio_tts_interface,
-            cache_examples=False # برای اینکه همیشه با API تماس بگیرد و از کش استفاده نکند
         )
     gr.Markdown("<p class='app-footer-final'>Alpha Language Learning © 2024</p>")

 import zipfile
 from google import genai
 from google.genai import types
+from google.api_core import exceptions as google_exceptions # برای تشخیص دقیق‌تر خطای سهمیه
 try:
     from pydub import AudioSegment
   i += 1
 NUM_API_KEYS = len(GEMINI_API_KEYS)
+# CURRENT_KEY_INDEX_GLOBAL: نشان دهنده *اولین* کلیدی است که برای یک درخواست کامل از Gradio باید امتحان شود.
+# این متغیر پس از هر درخواست کامل (موفق یا ناموفق) پیش می‌رود.
+CURRENT_KEY_INDEX_GLOBAL = 0
 def _log(message):
     print(f"[لاگ آلفا TTS] {message}")
 if NUM_API_KEYS == 0:
   _log("⛔️ خطای حیاتی: هیچ Secret با نام GEMINI_API_KEY_n یافت نشد!")
 else:
   _log(f"✅ تعداد {NUM_API_KEYS} کلید API جیمینای بارگذاری شد.")
+def get_api_key_for_attempt(attempt_within_request):
+  """
+  کلید API را برای یک تلاش خاص *درون یک درخواست Gradio* برمی‌گرداند.
+  attempt_within_request از 0 شروع می‌شود.
+  """
   if NUM_API_KEYS == 0:
+    return None, -1, -1 # key, display_num, actual_index_in_list
+  # اندیس کلیدی که باید در لیست GEMINI_API_KEYS استفاده شود:
+  # (اندیس کلید شروع سراسری + تعداد تلاش‌های این درخواست) % تعداد کل کلیدها
+  actual_key_index_in_list = (CURRENT_KEY_INDEX_GLOBAL + attempt_within_request) % NUM_API_KEYS
+  key_to_use = GEMINI_API_KEYS[actual_key_index_in_list]
+  key_display_number = actual_key_index_in_list + 1 # برای نمایش به کاربر (1-based)
+  return key_to_use, key_display_number, actual_key_index_in_list
+def advance_global_key_index_for_next_request():
+    """
+    پس از اتمام یک درخواست کامل Gradio (تمام قطعات آن)،
+    اندیس سراسری را برای *درخواست Gradio بعدی* پیش می‌برد.
+    """
+    global CURRENT_KEY_INDEX_GLOBAL
+    if NUM_API_KEYS > 0:
+        CURRENT_KEY_INDEX_GLOBAL = (CURRENT_KEY_INDEX_GLOBAL + 1) % NUM_API_KEYS
 # --- END: منطق چرخش API Key ---
 SPEAKER_VOICES = [
 ]
 FIXED_MODEL_NAME = "gemini-2.5-flash-preview-tts"
 DEFAULT_MAX_CHUNK_SIZE = 3800
+DEFAULT_SLEEP_BETWEEN_REQUESTS = 8 # کاهش زمان انتظار بین قطعات اگر از یک کلید موفق استفاده می‌کنیم
+RETRY_SLEEP_AFTER_QUOTA_ERROR = 2 # زمان کوتاه انتظار قبل از تلاش با کلید بعدی
 DEFAULT_OUTPUT_FILENAME_BASE = "alpha_tts_audio"
 def save_binary_file(file_name, data):
 def smart_text_split(text, max_size=3800):
     if len(text) <= max_size: return [text]
     chunks, current_chunk = [], ""
     sentences = re.split(r'(?<=[.!?؟۔])\s+', text)
     for sentence in sentences:
+        if len(current_chunk) + len(sentence) + 1 > max_size:
             if current_chunk: chunks.append(current_chunk.strip())
             current_chunk = sentence
+            while len(current_chunk) > max_size:
                 split_idx = -1
                 for char_to_find in ['،', ',', ';', ':', ' ']:
                     try:
                         split_idx = current_chunk.rindex(char_to_find, max_size // 2, max_size)
                         break
                     except ValueError:
                         continue
                 if split_idx != -1:
                     part = current_chunk[:split_idx+1]
                     current_chunk = current_chunk[split_idx+1:]
+                else:
                     part = current_chunk[:max_size]
                     current_chunk = current_chunk[max_size:]
                 chunks.append(part.strip())
         else:
+            if current_chunk:
                 current_chunk += " " + sentence
             else:
                 current_chunk = sentence
     output_base_name = DEFAULT_OUTPUT_FILENAME_BASE
     max_chunk, sleep_time = DEFAULT_MAX_CHUNK_SIZE, DEFAULT_SLEEP_BETWEEN_REQUESTS
     if not text_input or not text_input.strip():
         _log("❌ متن ورودی خالی است.")
+        advance_global_key_index_for_next_request() # اطمینان از اینکه درخواست بعدی با کلید بعدی شروع شود
         return None
     text_chunks = smart_text_split(text_input, max_chunk)
     if not text_chunks:
         _log("❌ متن قابل پردازش به قطعات کوچکتر نیست.")
+        advance_global_key_index_for_next_request()
         return None
     generated_files = []
+    all_chunks_processed = True # پرچمی برای بررسی اینکه آیا تمام قطعات موفقیت آمیز بوده اند
+    # --- START: منطق تلاش مجدد با کلیدهای مختلف برای هر قطعه ---
+    for chunk_idx, chunk_text in enumerate(text_chunks):
+        chunk_processed_successfully = False
+        _log(f"  🔊 پردازش قطعه {chunk_idx + 1}/{len(text_chunks)}...")
+        # تعداد تلاش‌ها برای این قطعه خاص، حداکثر به تعداد کلیدهای موجود یا 1 اگر کلیدی نیست
+        max_attempts_for_chunk = NUM_API_KEYS if NUM_API_KEYS > 0 else 1
+        for attempt_num_for_chunk in range(max_attempts_for_chunk):
+            selected_api_key, key_display_num, actual_key_idx = get_api_key_for_attempt(attempt_num_for_chunk)
+            if not selected_api_key: # اگر هیچ کلیدی موجود نباشد (نباید اینجا اتفاق بیفتد اگر NUM_API_KEYS > 0)
+                _log("❌ هیچ کلید API معتبری برای تلاش وجود ندارد.")
+                all_chunks_processed = False
+                break # خروج از حلقه تلاش برای این قطعه
+            _log(f"     प्रयास {attempt_num_for_chunk + 1}/{max_attempts_for_chunk} برای قطعه {chunk_idx+1} با کلید شماره {key_display_num} (...{selected_api_key[-4:]})")
+            try:
+                client = genai.Client(api_key=selected_api_key)
+                if prompt_input and prompt_input.strip():
+                    processed_prompt = prompt_input.strip()
+                    if not re.search(r'[.!?؟،:۔]$', processed_prompt):
+                        processed_prompt += "،"
+                    final_text_for_api = f"{processed_prompt} {chunk_text.strip()}"
+                else:
+                    final_text_for_api = chunk_text.strip()
+                # _log(f"      متن ارسالی به API: '{final_text_for_api[:70]}...'")
+                contents = [types.Content(role="user", parts=[types.Part.from_text(text=final_text_for_api)])]
+                config = types.GenerateContentConfig(temperature=temperature_val, response_modalities=["audio"],
+                    speech_config=types.SpeechConfig(voice_config=types.VoiceConfig(
+                        prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=selected_voice))))
+                fname_base = f"{output_base_name}_part{chunk_idx+1:03d}" # نام فایل موقت برای این قطعه
+                response = client.models.generate_content(model=FIXED_MODEL_NAME, contents=contents, config=config)
+                if response.candidates and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data:
+                    inline_data = response.candidates[0].content.parts[0].inline_data
+                    data_buffer = inline_data.data
+                    ext = mimetypes.guess_extension(inline_data.mime_type) or ".wav"
+                    if "audio/L" in inline_data.mime_type and ext == ".wav": data_buffer = convert_to_wav(data_buffer, inline_data.mime_type)
+                    if not ext.startswith("."): ext = "." + ext
+                    # اطمینان از اینکه فایل قبلی (اگر از تلاش قبلی برای همین قطعه مانده) حذف شود
+                    temp_fpath_for_chunk = f"{fname_base}{ext}"
+                    if os.path.exists(temp_fpath_for_chunk):
+                        try: os.remove(temp_fpath_for_chunk)
+                        except OSError as e_rem: _log(f"      ⚠️ نتوانست فایل موقت قبلی را حذف کند: {e_rem}")
+                    fpath = save_binary_file(temp_fpath_for_chunk, data_buffer)
+                    if fpath:
+                        generated_files.append(fpath)
+                        chunk_processed_successfully = True
+                        _log(f"      ✅ قطعه {chunk_idx+1} با کلید شماره {key_display_num} موفقیت آمیز بود.")
+                        if chunk_idx < len(text_chunks) - 1: # اگر قطعات دیگری هم هستند
+                             time.sleep(DEFAULT_SLEEP_BETWEEN_REQUESTS) # صبر قبل از پردازش قطعه بعدی (با همین کلید)
+                        break # خروج از حلقه تلاش (attempt_num_for_chunk) چون این قطعه موفق بود
+                else:
+                    _log(f"      ⚠️ پاسخ API برای قطعه {chunk_idx+1} با کلید {key_display_num} بدون داده صوتی بود.")
+            except google_exceptions.ResourceExhausted as e_quota:
+                _log(f"      ❌ خطای سهمیه (RESOURCE_EXHAUSTED) برای قطعه {chunk_idx+1} با کلید شماره {key_display_num}: {e_quota.message[:100]}...")
+                if attempt_num_for_chunk < max_attempts_for_chunk - 1: # اگر کلیدهای دیگری برای امتحان باقی مانده
+                    _log(f"         ... تلاش با کلید بعدی پس از {RETRY_SLEEP_AFTER_QUOTA_ERROR} ثانیه.")
+                    time.sleep(RETRY_SLEEP_AFTER_QUOTA_ERROR)
+                else:
+                    _log(f"      ⛔️ تمام کلیدهای API برای قطعه {chunk_idx+1} امتحان شدند و ناموفق بودند (خطای سهمیه).")
+                    all_chunks_processed = False # یک قطعه ناموفق بود
+            except Exception as e_general:
+                _log(f"      ❌ خطای عمومی در تولید قطعه {chunk_idx+1} با کلید {key_display_num}: {e_general}")
+                # برای خطاهای عمومی، معمولاً تلاش مجدد با کلید دیگر کمکی نمی‌کند، مگر اینکه خطای شبکه موقتی باشد
+                # اما برای سادگی، اجازه می‌دهیم حلقه تلاش ادامه یابد
+                if attempt_num_for_chunk < max_attempts_for_chunk - 1:
+                     time.sleep(RETRY_SLEEP_AFTER_QUOTA_ERROR) # کمی صبر قبل از تلاش با کلید بعدی
+                else:
+                    all_chunks_processed = False # یک قطعه ناموفق بود
+            if chunk_processed_successfully:
+                break # از حلقه تلاش برای این قطعه خارج شو
+        if not chunk_processed_successfully:
+            _log(f"  ⛔️ پردازش قطعه {chunk_idx+1} پس از {max_attempts_for_chunk} تلاش ناموفق بود.")
+            all_chunks_processed = False
+            break # خروج از حلقه اصلی پردازش قطعات (chunk_idx) چون یک قطعه حیاتی ناموفق بود
+    # --- END: منطق تلاش مجدد ---
+    advance_global_key_index_for_next_request() # برای درخواست Gradio بعدی، از کلید بعدی شروع کن
+    if not all_chunks_processed or not generated_files:
+        _log("❌ هیچ فایل صوتی معتبری تولید نشد (ممکن است برخی قطعات ناموفق بوده باشند یا سهمیه تمام کلیدها تمام شده باشد).")
+        # پاک کردن فایل‌های جزئی ایجاد شده اگر فرآیند کامل نشده
+        for fp in generated_files:
+            try: os.remove(fp)
+            except: pass
         return None
+    # _log(f"🎉 {len(generated_files)} فایل(های) صوتی خام تولید شد.") # لاگ کمتر
     final_audio_file = None
+    final_output_path_base = f"{DEFAULT_OUTPUT_FILENAME_BASE}_final"
     if len(generated_files) > 1:
         if PYDUB_AVAILABLE:
                         os.rename(generated_files[0], renamed_first_chunk)
                         final_audio_file = renamed_first_chunk
                     except Exception as e_rename:
+                         _log(f"خطا در تغییر نام اولین قطعه (پس از ادغام ناموفق): {e_rename}")
                          final_audio_file = generated_files[0]
             for fp_cleanup in generated_files:
             final_audio_file = generated_files[0]
     if final_audio_file and os.path.exists(final_audio_file):
+        _log(f"✅ فایل صوتی نهایی با موفقیت تولید شد: {os.path.basename(final_audio_file)}")
     elif final_audio_file:
+        _log(f"⚠️ فایل نهایی '{final_audio_file}' پس از پردازش وجود ندارد!")
         return None
     else:
         # این حالت نباید رخ دهد اگر generated_files خالی نباشد و خطایی در تغییر نام رخ ندهد
+        _log(f"❓ وضعیت نامشخص برای فایل نهایی.")
         return None
     return final_audio_file
     if use_file_input:
         if uploaded_file:
             try:
                 with open(uploaded_file.name, 'r', encoding='utf-8') as f: actual_text = f.read().strip()
                 if not actual_text: _log("❌ فایل آپلود شده خالی است یا خوانده نشد."); return None
             except Exception as e: _log(f"❌ خطا در خواندن فایل آپلود شده: {e}"); return None
         actual_text = text_to_speak
         if not actual_text or not actual_text.strip(): _log("❌ متن ورودی برای تبدیل خالی است."); return None
+    if NUM_API_KEYS == 0: # بررسی اولیه قبل از فراخوانی core_generate_audio
+        _log("❌ هیچ کلید API برای پردازش موجود نیست. لطفاً Secrets را بررسی کنید.")
+        return None
     final_path = core_generate_audio(actual_text, speech_prompt, speaker_voice, temperature)
     return final_path
         speech_prompt_tb = gr.Textbox(
             label="سبک گفتار (اختیاری)",
             placeholder="مثال: با لحنی شاد و پرانرژی",
+            value="با لحنی دوستانه و رسا صحبت کن.",
             lines=2, elem_id="speech_prompt_alpha_v3"
         )
         speaker_voice_dd = gr.Dropdown(
         generate_button = gr.Button("🚀 تولید و پخش صدا", elem_classes=["generate-button-final"], elem_id="generate_button_alpha_v3")
+        output_audio = gr.Audio(label=" ", type="filepath", elem_id="output_audio_player_alpha_v3")
         generate_button.click(
             fn=gradio_tts_interface,
         gr.Examples(
             examples=[
                 [False, None, "سلام بر شما، امیدوارم روز خوبی داشته باشید.", "با لحنی گرم و صمیمی.", "Zephyr", 0.85],
+                [False, None, "این یک آزمایش برای بررسی کیفیت صدای تولید شده توسط هوش مصنوعی آلفا است. امیدوارم از نتیجه راضی باشید.", "با صدایی طبیعی و روان.", "Charon", 0.9],
+                [False, None, "آیا می‌توانم سوالی از شما بپرسم؟ لطفاً راهنمایی کنید.", "با کنجکاوی", "Puck", 0.95],
+                # یک نمونه طولانی‌تر برای تست تقسیم به چند قطعه و چرخش کلید
+                [False, None,
+                 "این یک متن بسیار طولانی است که به احتمال زیاد به چندین قطعه تقسیم خواهد شد. هدف از این نمونه، بررسی عملکرد صحیح تقسیم متن و همچنین آزمایش مکانیزم چرخش کلید API در صورتی که سهمیه یک کلید در حین پردازش تمام شود، می‌باشد. امیدواریم که برنامه بتواند به طور خودکار به کلید بعدی سوئیچ کرده و فرآیند تولید صدا را با موفقیت به اتمام برساند. این بخش اول است. این بخش دوم است. و این هم بخش سوم برای طولانی‌تر کردن متن.",
+                 "با لحنی آرام و واضح", "Achird", 0.8],
             ],
             inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ],
             outputs=[output_audio],
             fn=gradio_tts_interface,
+            cache_examples=False
         )
     gr.Markdown("<p class='app-footer-final'>Alpha Language Learning © 2024</p>")