Ttspro

Running

App Files Files Community

Hamed744 commited on Jul 2, 2025

Commit

322a5a8

verified ·

1 Parent(s): 70ba269

Update app.py

Browse files

Files changed (1) hide show

app.py +143 -81

app.py CHANGED Viewed

@@ -41,7 +41,7 @@ def get_next_api_key():
   global CURRENT_KEY_INDEX
   if NUM_API_KEYS == 0:
     _log("⚠️ تلاش برای گرفتن کلید API در حالی که هیچ کلیدی بارگذاری نشده است.")
-    return None
   key_to_use = GEMINI_API_KEYS[CURRENT_KEY_INDEX % NUM_API_KEYS]
   key_display_index = (CURRENT_KEY_INDEX % NUM_API_KEYS) + 1
@@ -101,7 +101,8 @@ def smart_text_split(text, max_size=3800):
             if current_chunk: chunks.append(current_chunk.strip())
             current_chunk = sentence
             while len(current_chunk) > max_size:
-                split_idx = next((i for i in range(max_size - 1, max_size // 2, -1) if current_chunk[i] in ['،', ',', ';', ':', ' ']), -1)
                 part, current_chunk = (current_chunk[:split_idx+1], current_chunk[split_idx+1:]) if split_idx != -1 else (current_chunk[:max_size], current_chunk[max_size:])
                 chunks.append(part.strip())
         else: current_chunk += (" " if current_chunk else "") + sentence
@@ -127,21 +128,8 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
     _log("🚀 شروع فرآیند تولید صدا...")
     output_base_name = DEFAULT_OUTPUT_FILENAME_BASE
-    max_chunk, sleep_time = DEFAULT_MAX_CHUNK_SIZE, DEFAULT_SLEEP_BETWEEN_REQUESTS
-    selected_api_key, key_idx_display = get_next_api_key()
-    if not selected_api_key:
-        _log("❌ کلید API برای این درخواست در دسترس نیست. لطفاً از تنظیمات Secrets مطمئن شوید.")
-        return None
-    _log(f"⚙️ استفاده از کلید API شماره {key_idx_display} (پایان یافته با: ...{selected_api_key[-4:]})")
-    try:
-        client = genai.Client(api_key=selected_api_key)
-    except Exception as e:
-        _log(f"❌ خطا در مقداردهی اولیه کلاینت Gemini با کلید شماره {key_idx_display}: {e}")
-        return None
     if not text_input or not text_input.strip():
         _log("❌ متن ورودی خالی است.")
@@ -152,116 +140,190 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
         _log("❌ متن قابل پردازش به قطعات کوچکتر نیست.")
         return None
-    generated_files = []
-    for i, chunk in enumerate(text_chunks):
-        # _log(f"🔊 پردازش قطعه {i+1}/{len(text_chunks)}...") # لاگ کمتر
-        final_text = f'"{prompt_input}"\n{chunk}' if prompt_input and prompt_input.strip() else chunk
-        contents = [types.Content(role="user", parts=[types.Part.from_text(text=final_text)])]
-        config = types.GenerateContentConfig(temperature=temperature_val, response_modalities=["audio"],
-            speech_config=types.SpeechConfig(voice_config=types.VoiceConfig(
-                prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=selected_voice))))
-        fname_base = f"{output_base_name}_part{i+1:03d}"
         try:
-            response = client.models.generate_content(model=FIXED_MODEL_NAME, contents=contents, config=config)
-            if response.candidates and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data:
-                inline_data = response.candidates[0].content.parts[0].inline_data
-                data_buffer = inline_data.data
-                ext = mimetypes.guess_extension(inline_data.mime_type) or ".wav"
-                if "audio/L" in inline_data.mime_type and ext == ".wav": data_buffer = convert_to_wav(data_buffer, inline_data.mime_type)
-                if not ext.startswith("."): ext = "." + ext
-                fpath = save_binary_file(f"{fname_base}{ext}", data_buffer)
-                if fpath: generated_files.append(fpath)
-            else: _log(f"⚠️ پاسخ API برای قطعه {i+1} بدون داده صوتی بود (با کلید شماره {key_idx_display}).")
         except Exception as e:
-            _log(f"❌ خطا در تولید قطعه {i+1} با کلید شماره {key_idx_display}: {e}")
-            continue
-        if i < len(text_chunks) - 1 and len(text_chunks) > 1: time.sleep(sleep_time)
-    if not generated_files:
-        _log(f"❌ هیچ فایل صوتی با کلید شماره {key_idx_display} تولید نشد.")
         return None
     final_audio_file = None
     final_output_path_base = f"{output_base_name}_final"
-    if len(generated_files) > 1:
         if PYDUB_AVAILABLE:
             merged_fn = f"{final_output_path_base}.wav"
             if os.path.exists(merged_fn): os.remove(merged_fn)
-            if merge_audio_files_func(generated_files, merged_fn):
                 final_audio_file = merged_fn
-            else: # اگر ادغام ناموفق بود
-                if generated_files:
                     try:
-                        target_ext = os.path.splitext(generated_files[0])[1]
                         renamed_first_chunk = f"{final_output_path_base}{target_ext}"
                         if os.path.exists(renamed_first_chunk): os.remove(renamed_first_chunk)
-                        os.rename(generated_files[0], renamed_first_chunk)
                         final_audio_file = renamed_first_chunk
                     except Exception as e_rename:
                          _log(f"خطا در تغییر نام فایل اولین قطعه (پس از ادغام ناموفق): {e_rename}")
-                         final_audio_file = generated_files[0]
-            # پاک کردن فایل‌های جزئی چه ادغام موفق بوده چه ناموفق
-            for fp_cleanup in generated_files:
                 if final_audio_file and os.path.abspath(fp_cleanup) == os.path.abspath(final_audio_file):
-                    continue # فایل نهایی را پاک نکن
-                try: os.remove(fp_cleanup)
-                except: pass
         else:
-            _log("⚠️ pydub در دسترس نیست. اولین قطعه صوتی ارائه می‌شود.")
-            if generated_files:
                 try:
-                    target_ext = os.path.splitext(generated_files[0])[1]
                     renamed_first_chunk = f"{final_output_path_base}{target_ext}"
                     if os.path.exists(renamed_first_chunk): os.remove(renamed_first_chunk)
-                    os.rename(generated_files[0], renamed_first_chunk)
                     final_audio_file = renamed_first_chunk
-                    for i_gf in range(1, len(generated_files)): # پاک کردن بقیه فایل‌های جزئی
-                        try: os.remove(generated_files[i_gf])
                         except: pass
                 except Exception as e_rename_single:
                     _log(f"خطا در تغییر نام فایل اولین قطعه (بدون pydub): {e_rename_single}")
-                    final_audio_file = generated_files[0]
-    elif len(generated_files) == 1:
         try:
-            target_ext = os.path.splitext(generated_files[0])[1]
             final_single_fn = f"{final_output_path_base}{target_ext}"
             if os.path.exists(final_single_fn): os.remove(final_single_fn)
-            os.rename(generated_files[0], final_single_fn)
             final_audio_file = final_single_fn
         except Exception as e_rename_single_final:
             _log(f"خطا در تغییر نام فایل تکی نهایی: {e_rename_single_final}")
-            final_audio_file = generated_files[0]
     if final_audio_file and os.path.exists(final_audio_file):
         _log(f"✅ فایل صوتی نهایی با موفقیت با کلید شماره {key_idx_display} تولید شد: {os.path.basename(final_audio_file)}")
     elif final_audio_file:
         _log(f"⚠️ فایل نهایی '{final_audio_file}' پس از پردازش وجود ندارد! (با کلید شماره {key_idx_display})")
         return None
     else:
         _log(f"❓ وضعیت نامشخص برای فایل نهایی. (با کلید شماره {key_idx_display})")
         return None
-    return final_audio_file
-def gradio_tts_interface(use_file_input, uploaded_file, text_to_speak, speech_prompt, speaker_voice, temperature, progress=gr.Progress(track_tqdm=True)):
-    actual_text = ""
-    if use_file_input:
-        if uploaded_file:
-            try:
-                with open(uploaded_file.name, 'r', encoding='utf-8') as f: actual_text = f.read().strip()
-                if not actual_text: _log("❌ فایل آپلود شده خالی است یا خوانده نشد."); return None
-            except Exception as e: _log(f"❌ خطا در خواندن فایل آپلود شده: {e}"); return None
-        else: _log("❌ گزینه استفاده از فایل انتخاب شده اما فایلی آپلود نشده."); return None
-    else:
-        actual_text = text_to_speak
-        if not actual_text or not actual_text.strip(): _log("❌ متن ورودی برای تبدیل خالی است."); return None
-    final_path = core_generate_audio(actual_text, speech_prompt, speaker_voice, temperature)
-    return final_path
 # --- CSS (بدون تغییر نسبت به کد شما) ---
 custom_css_inspired_by_image = f"""

   global CURRENT_KEY_INDEX
   if NUM_API_KEYS == 0:
     _log("⚠️ تلاش برای گرفتن کلید API در حالی که هیچ کلیدی بارگذاری نشده است.")
+    return None, 0 # Return 0 for key_display_index
   key_to_use = GEMINI_API_KEYS[CURRENT_KEY_INDEX % NUM_API_KEYS]
   key_display_index = (CURRENT_KEY_INDEX % NUM_API_KEYS) + 1
             if current_chunk: chunks.append(current_chunk.strip())
             current_chunk = sentence
             while len(current_chunk) > max_size:
+                # Prioritize splitting at Persian punctuation (،) or common separators
+                split_idx = next((i for i in range(max_size - 1, max_size // 2, -1) if current_chunk[i] in ['،', ',', ';', ':', ' ', '؟', '!']), -1)
                 part, current_chunk = (current_chunk[:split_idx+1], current_chunk[split_idx+1:]) if split_idx != -1 else (current_chunk[:max_size], current_chunk[max_size:])
                 chunks.append(part.strip())
         else: current_chunk += (" " if current_chunk else "") + sentence
     _log("🚀 شروع فرآیند تولید صدا...")
     output_base_name = DEFAULT_OUTPUT_FILENAME_BASE
+    max_chunk = DEFAULT_MAX_CHUNK_SIZE # Corrected assignment
+    sleep_time = DEFAULT_SLEEP_BETWEEN_REQUESTS # Corrected assignment
     if not text_input or not text_input.strip():
         _log("❌ متن ورودی خالی است.")
         _log("❌ متن قابل پردازش به قطعات کوچکتر نیست.")
         return None
+    final_generated_files = [] # This will hold the successfully generated files from *one* full attempt
+    # Ensure there's at least one API key before attempting.
+    if NUM_API_KEYS == 0:
+        _log("⛔️ هیچ کلید API برای تولید صدا در دسترس نیست.")
+        return None
+    # Outer loop for retrying the entire generation process with different API keys
+    # We will try each available API key once if the previous one fails
+    for attempt_num in range(NUM_API_KEYS):
+        selected_api_key, key_idx_display = get_next_api_key()
+        if not selected_api_key:
+            _log(f"⚠️ کلید API در تلاش {attempt_num + 1}/{NUM_API_KEYS} در دسترس نیست. ادامه به تلاش بعدی...")
+            continue # Try the next key if this one somehow returns None (shouldn't happen if NUM_API_KEYS > 0)
+        _log(f"⚙️ تلاش برای تولید صدا با کلید API شماره {key_idx_display} (پایان یافته با: ...{selected_api_key[-4:]}) (تلاش: {attempt_num + 1}/{NUM_API_KEYS})")
         try:
+            client = genai.Client(api_key=selected_api_key)
         except Exception as e:
+            _log(f"❌ خطا در مقداردهی اولیه کلاینت Gemini با کلید شماره {key_idx_display} در تلاش {attempt_num + 1}: {e}")
+            if attempt_num == NUM_API_KEYS - 1: # If this was the last attempt
+                _log("❌ تمام تلاش‌ها برای مقداردهی اولیه کلاینت ناموفق بود.")
+                return None
+            else:
+                _log("⚠️ خطا در کلاینت، تلاش مجدد با کلید بعدی...")
+                continue # Go to the next attempt (which will get the next key)
+        current_attempt_generated_files = [] # Files generated successfully within this specific API key attempt
+        all_chunks_successful_in_this_attempt = True
+        for i, chunk in enumerate(text_chunks):
+            final_text = f'"{prompt_input}"\n{chunk}' if prompt_input and prompt_input.strip() else chunk
+            contents = [types.Content(role="user", parts=[types.Part.from_text(text=final_text)])]
+            speech_config = types.SpeechConfig(
+                voice_config=types.VoiceConfig(
+                    prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=selected_voice)
+                )
+            )
+            config = types.GenerateContentConfig(
+                temperature=temperature_val,
+                response_modalities=["audio"],
+                speech_config=speech_config
+            )
+            fname_base = f"{output_base_name}_part{i+1:03d}"
+            try:
+                # _log(f"🔊 پردازش قطعه {i+1}/{len(text_chunks)} با کلید شماره {key_idx_display}...") # verbose log
+                response = client.models.generate_content(model=FIXED_MODEL_NAME, contents=contents, config=config)
+                if response.candidates and response.candidates[0].content and \
+                   response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data:
+                    inline_data = response.candidates[0].content.parts[0].inline_data
+                    data_buffer = inline_data.data
+                    # Determine extension. Prioritize WAV if it's raw audio.
+                    ext = ".wav" # Default to wav
+                    if "audio/L" in inline_data.mime_type: # raw audio, needs WAV header
+                        data_buffer = convert_to_wav(data_buffer, inline_data.mime_type)
+                    else: # Other mime types, try to guess or default to wav
+                        guessed_ext = mimetypes.guess_extension(inline_data.mime_type)
+                        if guessed_ext:
+                            ext = guessed_ext
+                    if not ext.startswith("."): ext = "." + ext
+                    fpath = save_binary_file(f"{fname_base}{ext}", data_buffer)
+                    if fpath:
+                        current_attempt_generated_files.append(fpath)
+                    else:
+                        _log(f"⚠️ ذخیره فایل برای قطعه {i+1} ناموفق بود. با کلید شماره {key_idx_display}. این کلید ممکن است مشکل داشته باشد.")
+                        all_chunks_successful_in_this_attempt = False
+                        break # Break from inner chunk loop, this key failed
+                else:
+                    _log(f"⚠️ پاسخ API برای قطعه {i+1} از کلید شماره {key_idx_display} بدون داده صوتی بود. این کلید ممکن است مشکل داشته باشد.")
+                    all_chunks_successful_in_this_attempt = False
+                    break # Break from inner chunk loop, this key failed
+            except Exception as e:
+                _log(f"❌ خطا در تولید قطعه {i+1} با کلید شماره {key_idx_display}: {e}. این کلید ممکن است مشکل داشته باشد.")
+                all_chunks_successful_in_this_attempt = False
+                break # Break from inner chunk loop, this key failed
+            # Only sleep if there are more chunks to process in this attempt
+            if i < len(text_chunks) - 1 and len(text_chunks) > 1:
+                time.sleep(sleep_time)
+        # Check if all chunks were successful for this API key attempt
+        if all_chunks_successful_in_this_attempt and len(current_attempt_generated_files) == len(text_chunks):
+            final_generated_files = current_attempt_generated_files
+            _log(f"✅ تولید موفقیت آمیز تمام قطعات با کلید شماره {key_idx_display}.")
+            break # Success! Exit the outer retry loop.
+        else:
+            _log(f"❌ تولید کامل صدا با کلید شماره {key_idx_display} ناموفق بود. پاکسازی فایل‌های موقت و تلاش مجدد با کلید بعدی...")
+            # Clean up files generated in this failed attempt
+            for fp_cleanup in current_attempt_generated_files:
+                try:
+                    if os.path.exists(fp_cleanup):
+                        os.remove(fp_cleanup)
+                except Exception as clean_e:
+                    _log(f"⚠️ خطا در پاکسازی فایل موقت {fp_cleanup}: {clean_e}")
+            # Continue to the next iteration of the outer loop to try another key
+    if not final_generated_files:
+        _log(f"❌ پس از {NUM_API_KEYS} تلاش با کلیدهای مختلف، هیچ فایل صوتی تولید نشد.")
         return None
     final_audio_file = None
     final_output_path_base = f"{output_base_name}_final"
+    if len(final_generated_files) > 1:
         if PYDUB_AVAILABLE:
             merged_fn = f"{final_output_path_base}.wav"
             if os.path.exists(merged_fn): os.remove(merged_fn)
+            if merge_audio_files_func(final_generated_files, merged_fn):
                 final_audio_file = merged_fn
+            else:
+                # If merging failed, revert to providing the first chunk (renamed)
+                _log("⚠️ ادغام فایل‌ها ناموفق بود. ارائه اولین قطعه.")
+                if final_generated_files:
                     try:
+                        target_ext = os.path.splitext(final_generated_files[0])[1]
                         renamed_first_chunk = f"{final_output_path_base}{target_ext}"
                         if os.path.exists(renamed_first_chunk): os.remove(renamed_first_chunk)
+                        os.rename(final_generated_files[0], renamed_first_chunk)
                         final_audio_file = renamed_first_chunk
                     except Exception as e_rename:
                          _log(f"خطا در تغییر نام فایل اولین قطعه (پس از ادغام ناموفق): {e_rename}")
+                         final_audio_file = final_generated_files[0]
+            # Clean up all partial files, regardless of merge success, as long as they are not the final merged file
+            for fp_cleanup in final_generated_files:
                 if final_audio_file and os.path.abspath(fp_cleanup) == os.path.abspath(final_audio_file):
+                    continue # Do not delete the final output file if it's one of the chunks (in case merge failed)
+                try:
+                    if os.path.exists(fp_cleanup):
+                        os.remove(fp_cleanup)
+                except Exception as cleanup_e:
+                    _log(f"⚠️ خطا در پاکسازی فایل موقت پس از ادغام/تغییر نام: {cleanup_e}")
         else:
+            _log("⚠️ pydub در دسترس نیست. فقط اولین قطعه صوتی ارائه می‌شود.")
+            if final_generated_files:
                 try:
+                    target_ext = os.path.splitext(final_generated_files[0])[1]
                     renamed_first_chunk = f"{final_output_path_base}{target_ext}"
                     if os.path.exists(renamed_first_chunk): os.remove(renamed_first_chunk)
+                    os.rename(final_generated_files[0], renamed_first_chunk)
                     final_audio_file = renamed_first_chunk
+                    for i_gf in range(1, len(final_generated_files)): # Clean up other partial files
+                        try:
+                            if os.path.exists(final_generated_files[i_gf]):
+                                os.remove(final_generated_files[i_gf])
                         except: pass
                 except Exception as e_rename_single:
                     _log(f"خطا در تغییر نام فایل اولین قطعه (بدون pydub): {e_rename_single}")
+                    final_audio_file = final_generated_files[0]
+    elif len(final_generated_files) == 1:
         try:
+            target_ext = os.path.splitext(final_generated_files[0])[1]
             final_single_fn = f"{final_output_path_base}{target_ext}"
             if os.path.exists(final_single_fn): os.remove(final_single_fn)
+            os.rename(final_generated_files[0], final_single_fn)
             final_audio_file = final_single_fn
         except Exception as e_rename_single_final:
             _log(f"خطا در تغییر نام فایل تکی نهایی: {e_rename_single_final}")
+            final_audio_file = final_generated_files[0]
     if final_audio_file and os.path.exists(final_audio_file):
         _log(f"✅ فایل صوتی نهایی با موفقیت با کلید شماره {key_idx_display} تولید شد: {os.path.basename(final_audio_file)}")
+        return final_audio_file
     elif final_audio_file:
         _log(f"⚠️ فایل نهایی '{final_audio_file}' پس از پردازش وجود ندارد! (با کلید شماره {key_idx_display})")
         return None
     else:
         _log(f"❓ وضعیت نامشخص برای فایل نهایی. (با کلید شماره {key_idx_display})")
         return None
+# بقیه کد Gradiod.Blocks بدون تغییر باقی می‌ماند.
+# ... (rest of your Gradio interface code) ...
 # --- CSS (بدون تغییر نسبت به کد شما) ---
 custom_css_inspired_by_image = f"""