Hamed744 commited on
Commit
3eb70c5
·
verified ·
1 Parent(s): ebe1edc

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +293 -178
app.py CHANGED
@@ -6,80 +6,63 @@ import re
6
  import struct
7
  import time
8
  import zipfile
9
- # این کد صحیح است
10
- import google.generativeai as genai
11
- from google.generativeai import types
12
  import threading
13
  import logging
14
- import uuid # <<<< جدید: برای تولید شناسه‌های منحصر به فرد
15
- import tempfile # <<<< جدید: برای مدیریت فایل‌ها و دایرکتوری‌های موقت
16
- import glob # <<<< جدید: برای پیدا کردن و پاک کردن فایل‌های قدیمی
17
 
18
  try:
19
  from pydub import AudioSegment
20
  PYDUB_AVAILABLE = True
21
  except ImportError:
22
  PYDUB_AVAILABLE = False
 
23
 
24
  # --- START: پیکربندی لاگینگ ---
25
  logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s', datefmt='%Y-%m-%d %H:%M:%S')
 
26
 
27
- # --- START: منطق مدیریت API Key (بدون تغییر، عالی است) ---
28
  ALL_API_KEYS: list[str] = []
29
  NEXT_KEY_INDEX: int = 0
30
- KEY_LOCK: threading.Lock = threading.Lock()
31
 
32
  def _init_api_keys():
 
 
 
 
33
  global ALL_API_KEYS
 
34
  all_keys_string = os.environ.get("ALL_GEMINI_API_KEYS")
 
35
  if all_keys_string:
36
  ALL_API_KEYS = [key.strip() for key in all_keys_string.split(',') if key.strip()]
 
37
  logging.info(f"✅ تعداد {len(ALL_API_KEYS)} کلید API جیمینای بارگذاری شد.")
38
  if not ALL_API_KEYS:
39
  logging.warning("⛔️ خطای حیاتی: هیچ Secret با نام ALL_GEMINI_API_KEYS یافت نشد!")
 
 
 
40
  _init_api_keys()
41
 
42
  def get_next_api_key():
 
 
 
43
  global NEXT_KEY_INDEX, ALL_API_KEYS, KEY_LOCK
44
- with KEY_LOCK:
45
- if not ALL_API_KEYS: return None, None
 
 
 
46
  key_to_use = ALL_API_KEYS[NEXT_KEY_INDEX % len(ALL_API_KEYS)]
47
  key_display_index = (NEXT_KEY_INDEX % len(ALL_API_KEYS)) + 1
48
  NEXT_KEY_INDEX += 1
49
  return key_to_use, key_display_index
50
- # --- END: منطق مدیریت API Key ---
51
-
52
- # --- START: منطق پاک‌سازی خودکار فایل‌های خروجی قدیمی --- # <<<< بخش کاملاً جدید
53
- OUTPUT_DIR = "gradio_output" # یک پوشه برای نگهداری فایل‌های نهایی
54
- os.makedirs(OUTPUT_DIR, exist_ok=True)
55
- CLEANUP_INTERVAL_SECONDS = 60 * 10 # هر ۱۰ دقیقه یکبار
56
- FILE_LIFETIME_SECONDS = 60 * 15 # فایل‌ها پس از ۱۵ دقیقه حذف شوند
57
-
58
- def cleanup_old_files():
59
- """یک ریسه پس‌زمینه که فایل‌های صوتی قدیمی را پاک می‌کند."""
60
- while True:
61
- try:
62
- logging.info(f"🧹 اجرای پاک‌سازی فایل‌های قدیمی در پوشه {OUTPUT_DIR}...")
63
- current_time = time.time()
64
- # فقط فایل‌هایی با فرمت alpha_tts_final_... را بررسی می‌کنیم
65
- files_to_check = glob.glob(os.path.join(OUTPUT_DIR, "alpha_tts_final_*.wav"))
66
- files_to_check += glob.glob(os.path.join(OUTPUT_DIR, "alpha_tts_final_*.mp3")) # برای فرمت‌های دیگر
67
-
68
- for file_path in files_to_check:
69
- try:
70
- if os.path.isfile(file_path):
71
- file_age = current_time - os.path.getmtime(file_path)
72
- if file_age > FILE_LIFETIME_SECONDS:
73
- os.remove(file_path)
74
- logging.info(f"🗑️ فایل قدیمی حذف شد: {os.path.basename(file_path)}")
75
- except Exception as e:
76
- logging.warning(f"⚠️ خطا در هنگام حذف فایل {file_path}: {e}")
77
- except Exception as e:
78
- logging.error(f"❌ خطای جدی در ریسه پاک‌سازی: {e}")
79
-
80
- time.sleep(CLEANUP_INTERVAL_SECONDS)
81
- # --- END: منطق پاک‌سازی خودکار ---
82
-
83
 
84
  SPEAKER_VOICES = [
85
  "Achird", "Zubenelgenubi", "Vindemiatrix", "Sadachbia", "Sadaltager",
@@ -91,9 +74,8 @@ SPEAKER_VOICES = [
91
  FIXED_MODEL_NAME = "gemini-2.5-flash-preview-tts"
92
  DEFAULT_MAX_CHUNK_SIZE = 3800
93
  DEFAULT_SLEEP_BETWEEN_REQUESTS = 8
 
94
 
95
- # توابع کمکی (save_binary_file, convert_to_wav, parse_audio_mime_type, smart_text_split) بدون تغییر باقی می‌مانند
96
- # ... (کد این توابع را اینجا قرار دهید) ...
97
  def save_binary_file(file_name, data):
98
  try:
99
  with open(file_name, "wb") as f: f.write(data)
@@ -126,43 +108,82 @@ def parse_audio_mime_type(mime_type: str) -> dict[str, int]:
126
  def smart_text_split(text, max_size=3800):
127
  if len(text) <= max_size: return [text]
128
  chunks, current_chunk = [], ""
129
- sentences = re.split(r'(?<=[.!?؟])\s+', text)
 
130
  for sentence in sentences:
131
- if len(current_chunk) + len(sentence) + 1 > max_size:
132
- if current_chunk: chunks.append(current_chunk.strip())
133
- current_chunk = sentence
 
 
 
 
 
 
 
 
134
  while len(current_chunk) > max_size:
 
135
  split_idx = next((i for i in range(max_size - 1, max_size // 2, -1) if current_chunk[i] in ['،', ',', ';', ':', ' ']), -1)
136
- part, current_chunk = (current_chunk[:split_idx+1], current_chunk[split_idx+1:]) if split_idx != -1 else (current_chunk[:max_size], current_chunk[max_size:])
 
 
 
 
 
137
  chunks.append(part.strip())
138
- else: current_chunk += (" " if current_chunk else "") + sentence
139
- if current_chunk: chunks.append(current_chunk.strip())
140
- final_chunks = [c for c in chunks if c]
141
- return final_chunks
142
 
 
 
 
 
 
 
 
143
  def merge_audio_files_func(file_paths, output_path):
144
- if not PYDUB_AVAILABLE: logging.warning("⚠️ pydub برای ادغام در دسترس نیست."); return False
 
 
145
  try:
146
  combined = AudioSegment.empty()
147
  for i, fp in enumerate(file_paths):
148
- if os.path.exists(fp): combined += AudioSegment.from_file(fp) + (AudioSegment.silent(duration=150) if i < len(file_paths) - 1 else AudioSegment.empty())
149
- else: logging.warning(f"⚠️ فایل برای ادغام پیدا نشد: {fp}")
 
 
 
 
 
150
  combined.export(output_path, format="wav")
151
  return True
152
- except Exception as e: logging.error(f"❌ خطا در ادغام فایل‌های صوتی: {e}"); return False
 
 
153
 
154
- # تابع generate_audio_chunk_with_retry بدون تغییر باقی می‌ماند
155
- # ... (کد این تابع را اینجا قرار دهید) ...
156
- def generate_audio_chunk_with_retry(chunk_text, prompt_text, voice, temp):
 
 
 
 
157
  if not ALL_API_KEYS:
158
- logging.error("❌ هیچ کلید API برای تولید صدا در دسترس نیست.")
159
  return None
 
160
  for _ in range(len(ALL_API_KEYS)):
161
  selected_api_key, key_idx_display = get_next_api_key()
 
162
  if not selected_api_key:
163
- logging.warning("⚠️ get_next_api_key هیچ کلیدی برنگرداند. تلاش‌های باقیمانده نادیده گرفته می‌شوند.")
164
  break
165
- logging.info(f"⚙️ تلاش برای تولید قطعه با کلید API شماره {key_idx_display} (...{selected_api_key[-4:]})")
 
 
166
  try:
167
  client = genai.Client(api_key=selected_api_key)
168
  final_text = f'"{prompt_text}"\n{chunk_text}' if prompt_text and prompt_text.strip() else chunk_text
@@ -170,137 +191,184 @@ def generate_audio_chunk_with_retry(chunk_text, prompt_text, voice, temp):
170
  config = types.GenerateContentConfig(temperature=temp, response_modalities=["audio"],
171
  speech_config=types.SpeechConfig(voice_config=types.VoiceConfig(
172
  prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=voice))))
 
173
  response = client.models.generate_content(model=FIXED_MODEL_NAME, contents=contents, config=config)
 
174
  if response.candidates and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data:
175
- logging.info(f"✅ قطعه با موفقیت توسط کلید شماره {key_idx_display} تولید شد.")
176
  return response.candidates[0].content.parts[0].inline_data
177
  else:
178
- logging.warning(f"⚠️ پاسخ API برای قطعه با کلید شماره {key_idx_display} بدون داده صوتی بود. تلاش با کلید بعدی...")
 
179
  except Exception as e:
180
- logging.error(f"❌ خطا در تولید قطعه با کلید شماره {key_idx_display}: {e}. تلاش با کلید بعدی...")
181
- logging.error("❌ تمام کلیدهای API امتحان شدند اما هیچ‌کدام موفق به تولید قطعه نشدند.")
182
- return None
183
 
184
- # --- START: بازنویسی کامل core_generate_audio برای ایمنی در برابر همزمانی ---
 
 
185
  def core_generate_audio(text_input, prompt_input, selected_voice, temperature_val):
186
- # <<<< تغییر کلیدی: استفاده از with tempfile.TemporaryDirectory()
187
- # این دستور یک پوشه موقت و منحصر به فرد برای این درخواست ایجاد می‌کند
188
- # و پس از اتمام کار، به طور خودکار آن را با تمام محتویاتش پاک می‌کند.
189
- with tempfile.TemporaryDirectory() as temp_dir:
190
- request_id = str(uuid.uuid4()) # <<<< جدید: یک شناسه یکتا برای این درخواست
191
- logging.info(f"🚀 شروع فرآیند تولید صدا برای درخواست {request_id[:8]}...")
192
-
193
- max_chunk, sleep_time = DEFAULT_MAX_CHUNK_SIZE, DEFAULT_SLEEP_BETWEEN_REQUESTS
194
 
195
- if not text_input or not text_input.strip():
196
- logging.error(f"❌ متن ورودی برای درخواست {request_id[:8]} خالی است.")
197
- return None
198
 
199
- text_chunks = smart_text_split(text_input, max_chunk)
200
- if not text_chunks:
201
- logging.error(f"❌ متن برای درخواست {request_id[:8]} قابل پردازش به قطعات کوچکتر نیست.")
202
- return None
203
 
204
- generated_files_in_temp = []
205
- for i, chunk in enumerate(text_chunks):
206
- logging.info(f"🔊 [{request_id[:8]}] پردازش قطعه {i+1}/{len(text_chunks)}...")
 
 
 
 
 
 
 
 
 
 
 
 
 
 
207
 
208
- inline_data = generate_audio_chunk_with_retry(chunk, prompt_input, selected_voice, temperature_val)
209
-
210
- if inline_data:
211
- data_buffer = inline_data.data
212
- ext = mimetypes.guess_extension(inline_data.mime_type) or ".wav"
213
- if "audio/L" in inline_data.mime_type and ext == ".wav":
214
- data_buffer = convert_to_wav(data_buffer, inline_data.mime_type)
215
- if not ext.startswith("."): ext = "." + ext
216
-
217
- # <<<< تغییر کلیدی: فایل‌ها در پوشه موقت منحصر به فرد ذخیره می‌شوند
218
- temp_fname_base = os.path.join(temp_dir, f"part{i+1:03d}")
219
- temp_fpath = save_binary_file(f"{temp_fname_base}{ext}", data_buffer)
220
-
221
- if temp_fpath:
222
- generated_files_in_temp.append(temp_fpath)
223
- else:
224
- logging.error(f"❌ [{request_id[:8]}] موفق به ذخیره فایل برای قطعه {i+1} نشدیم.")
225
- continue
226
  else:
227
- logging.error(f"🛑 [{request_id[:8]}] فرآیند متوقف شد زیرا تولید قطعه {i+1} ناموفق بود.")
228
- break
 
 
 
229
 
230
- if i < len(text_chunks) - 1 and len(text_chunks) > 1:
231
- time.sleep(sleep_time)
232
 
233
- if not generated_files_in_temp:
234
- logging.error(f"❌ [{request_id[:8]}] هیچ فایل صوتی تولید نشد.")
235
- return None
236
-
237
- # <<<< تغییر کلیدی: نام فایل نهایی نیز منحصر به فرد است
238
- final_output_filename = f"alpha_tts_final_{request_id}.wav"
239
- final_output_path = os.path.join(OUTPUT_DIR, final_output_filename)
240
-
241
- final_audio_to_return = None
242
-
243
- if len(generated_files_in_temp) > 1:
244
- if PYDUB_AVAILABLE:
245
- # <<<< تغییر کلیدی: فایل ادغام شده موقت
246
- temp_merged_path = os.path.join(temp_dir, "merged.wav")
247
- if merge_audio_files_func(generated_files_in_temp, temp_merged_path):
248
- # انتقال فایل نهایی به پوشه خروجی اصلی
249
- os.rename(temp_merged_path, final_output_path)
250
- final_audio_to_return = final_output_path
251
- else:
252
- logging.error(f"❌ [{request_id[:8]}] ادغام فایل‌ها ناموفق بود. اولین قطعه برگردانده می‌شود.")
253
- # اگر ادغام شکست خورد، فقط اولین قطعه را منتقل کن
254
- os.rename(generated_files_in_temp[0], final_output_path)
255
- final_audio_to_return = final_output_path
256
- else:
257
- logging.warning(f"⚠️ [{request_id[:8]}] pydub در دسترس نیست. اولین قطعه ارائه می‌شود.")
258
- os.rename(generated_files_in_temp[0], final_output_path)
259
- final_audio_to_return = final_output_path
260
-
261
- elif len(generated_files_in_temp) == 1:
262
- # فقط یک فایل وجود دارد، آن را به پوشه خروجی منتقل کن
263
- os.rename(generated_files_in_temp[0], final_output_path)
264
- final_audio_to_return = final_output_path
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
265
 
266
- if final_audio_to_return and os.path.exists(final_audio_to_return):
267
- logging.info(f"✅ [{request_id[:8]}] فایل صوتی نهایی با موفقیت تولید شد: {os.path.basename(final_audio_to_return)}")
268
- return final_audio_to_return
269
- else:
270
- logging.error(f"❌ [{request_id[:8]}] تولید فایل نهایی با شکست مواجه شد.")
271
- return None
272
- # <<<< اینجا پوشه temp_dir و تمام محتویات آن به طور خودکار حذف می‌شود.
273
 
274
- # --- END: بازنویسی core_generate_audio ---
275
 
276
-
277
- # تابع رابط کاربری Gradio (بدون تغییر)
278
  def gradio_tts_interface(use_file_input, uploaded_file, text_to_speak, speech_prompt, speaker_voice, temperature, progress=gr.Progress(track_tqdm=True)):
279
  actual_text = ""
280
  if use_file_input:
281
  if uploaded_file:
282
  try:
283
- with open(uploaded_file.name, 'r', encoding='utf-8') as f: actual_text = f.read().strip()
284
- if not actual_text: logging.error("❌ فایل آپلود شده خالی است یا خوانده نشد."); return None
285
- except Exception as e: logging.error(f"❌ خطا در خواندن فایل آپلود شده: {e}"); return None
286
- else: logging.warning("❌ گزینه استفاده از فایل انتخاب شده اما فایلی آپلود نشده."); return None
 
 
 
 
 
 
 
 
287
  else:
288
  actual_text = text_to_speak
289
- if not actual_text or not actual_text.strip(): logging.warning("❌ متن ورودی برای تبدیل خالی است."); return None
 
 
290
 
 
291
  final_path = core_generate_audio(actual_text, speech_prompt, speaker_voice, temperature)
292
  return final_path
293
 
294
- # تابع ریستارت خودکار (بدون تغییر)
295
  def auto_restart_service():
296
  RESTART_INTERVAL_SECONDS = 24 * 60 * 60
297
  logging.info(f"سرویس برای ری‌استارت خودکار پس از {RESTART_INTERVAL_SECONDS / 3600:.0f} ساعت زمان‌بندی شده است.")
298
  time.sleep(RESTART_INTERVAL_SECONDS)
299
  logging.info(f"زمان ری‌استارت خودکار فرا رسیده است. برنامه برای ری‌استارت خارج می‌شود...")
300
  os._exit(1)
 
 
301
 
302
- # CSS و HTML (بدون تغییر)
303
- # ... (کد CSS و HTML را اینجا قرار دهید) ...
304
  custom_css_inspired_by_image = f"""
305
  @import url('https://fonts.googleapis.com/css2?family=Vazirmatn:wght@300;400;500;700;800&display=swap');
306
  :root {{
@@ -353,37 +421,84 @@ alpha_header_html_v3 = """
353
  </div>
354
  """
355
 
 
356
  with gr.Blocks(theme=gr.themes.Base(font=[gr.themes.GoogleFont("Vazirmatn")]), css=custom_css_inspired_by_image, title="آلفا TTS") as demo:
357
  gr.HTML(alpha_header_html_v3)
358
 
359
  with gr.Column(elem_classes=["main-content-panel-alpha"]):
360
  use_file_input_cb = gr.Checkbox(label="📄 استفاده از فایل متنی (.txt)", value=False, elem_id="use_file_cb_alpha_v3")
361
- uploaded_file_input = gr.File(label=" ", file_types=['.txt'], visible=False, elem_id="file_uploader_alpha_main_v3")
362
- text_to_speak_tb = gr.Textbox(label="متن فارسی برای تبدیل", placeholder="مثال: سلام، فردا هوا چطور است؟", lines=5, value="", visible=True, elem_id="text_input_main_alpha_v3")
363
- use_file_input_cb.change(fn=lambda x: (gr.update(visible=x, label=" " if x else "متن فارسی برای تبدیل"), gr.update(visible=not x)), inputs=use_file_input_cb, outputs=[uploaded_file_input, text_to_speak_tb])
364
- speech_prompt_tb = gr.Textbox(label="سبک گفتار (اختیاری)", placeholder="مثال: با لحنی شاد و پرانرژی", value="با لحنی دوستانه و رسا صحبت کن.", lines=2, elem_id="speech_prompt_alpha_v3")
365
- speaker_voice_dd = gr.Dropdown(SPEAKER_VOICES, label="انتخاب گوینده و لهجه", value="Charon", elem_id="speaker_voice_alpha_v3")
366
- temperature_slider = gr.Slider(minimum=0.1, maximum=1.5, step=0.05, value=0.9, label="میزان خلاقیت صدا", elem_id="temperature_slider_alpha_v3")
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
367
  gr.Markdown("<p class='temp_description_class_alpha_v3'>مقادیر بالاتر = تنوع بیشتر، مقادیر پایین‌تر = یکنواختی بیشتر.</p>")
 
368
  generate_button = gr.Button("🚀 تولید و پخش صدا", elem_classes=["generate-button-final"], elem_id="generate_button_alpha_v3")
 
369
  output_audio = gr.Audio(label=" ", type="filepath", elem_id="output_audio_player_alpha_v3")
370
- generate_button.click(fn=gradio_tts_interface, inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ], outputs=[output_audio])
 
 
 
 
 
 
371
  gr.Markdown("<h3 class='section-title-main-alpha' style='margin-top:2.5rem; text-align:center; border-bottom:none;'>نمونه‌های کاربردی</h3>", elem_id="examples_section_title_v3")
372
- gr.Examples(examples=[[False, None, "سلام بر شما، امیدوارم روز خوبی داشته باشید.", "با لحنی گرم و صمیمی.", "Zephyr", 0.85], [False, None, "این یک آزمایش برای بررسی کیفیت صدای تولید شده توسط هوش مصنوعی آلفا است.", "با صدایی طبیعی و روان.", "Charon", 0.9]], inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ], outputs=[output_audio], fn=gradio_tts_interface, cache_examples=False)
 
 
 
 
 
 
 
 
 
373
  gr.Markdown("<p class='app-footer-final'>Alpha Language Learning © 2024</p>")
374
 
375
-
376
  if __name__ == "__main__":
377
- # <<<< جدید: اجرای ریسههای پس‌زمینه در شروع برنامه
378
  threading.Thread(target=auto_restart_service, daemon=True, name="AutoRestartThread").start()
379
- threading.Thread(target=cleanup_old_files, daemon=True, name="FileCleanupThread").start()
380
-
381
  if len(ALL_API_KEYS) > 0 :
382
- # <<<< نکته مهم برای هاگینگ فیس: استفاده از .queue()
383
- # این متد درخواست‌ها را در یک صف قرار می‌دهد و از کرش کردن برنامه به دلیل
384
- # درخواست‌های همزمان زیاده منابع را تمام می‌کنند) جلوگیری می‌کند.
385
- # concurrency_count مشخص می‌کند چند کاربر همزمان می‌توانند پردازش را اجرا کنند.
386
- # برای پلن رایگان، 1 یا 2 مقدار معقولی است.
387
- demo.queue().launch(server_name="0.0.0.0", server_port=int(os.getenv("PORT", 7860)))
 
 
 
 
388
  else:
389
  logging.critical("🔴 برنامه به دلیل عدم وجود کلید API جیمینای اجرا نشد. لطفاً Secrets را بررسی کنید.")
 
6
  import struct
7
  import time
8
  import zipfile
9
+ from google import genai
10
+ from google.genai import types
 
11
  import threading
12
  import logging
13
+ import uuid # اضافه شد: برای تولید شناسه‌های یکتا
 
 
14
 
15
  try:
16
  from pydub import AudioSegment
17
  PYDUB_AVAILABLE = True
18
  except ImportError:
19
  PYDUB_AVAILABLE = False
20
+ logging.warning("⚠️ کتابخانه pydub یافت نشد. قابلیت ادغام فایل‌های صوتی غیرفعال است. برای فعال‌سازی آن را نصب کنید (pip install pydub).")
21
 
22
  # --- START: پیکربندی لاگینگ ---
23
  logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s', datefmt='%Y-%m-%d %H:%M:%S')
24
+ # --- END: پیکربندی لاگینگ ---
25
 
26
+ # --- START: منطق جدید مدیریت API Key (مشابه کد قبلی شما) ---
27
  ALL_API_KEYS: list[str] = []
28
  NEXT_KEY_INDEX: int = 0
29
+ KEY_LOCK: threading.Lock = threading.Lock() # برای اطمینان از ایمنی تردها هنگام به روز رسانی ایندکس
30
 
31
  def _init_api_keys():
32
+ """
33
+ کلیدهای API را از یک متغیر محیطی واحد شناسایی و مرتب می‌کند.
34
+ این تابع باید یک بار هنگام شروع برنامه اجرا شود.
35
+ """
36
  global ALL_API_KEYS
37
+
38
  all_keys_string = os.environ.get("ALL_GEMINI_API_KEYS")
39
+
40
  if all_keys_string:
41
  ALL_API_KEYS = [key.strip() for key in all_keys_string.split(',') if key.strip()]
42
+
43
  logging.info(f"✅ تعداد {len(ALL_API_KEYS)} کلید API جیمینای بارگذاری شد.")
44
  if not ALL_API_KEYS:
45
  logging.warning("⛔️ خطای حیاتی: هیچ Secret با نام ALL_GEMINI_API_KEYS یافت نشد!")
46
+ logging.warning(" لطفاً Secret را به عنوان یک رشته با کاما جدا شده (مثال: key1,key2,key3) در تنظیمات Space خود اضافه کنید.")
47
+
48
+ # فراخوانی تابع شناسایی کلیدها در ابتدای برنامه
49
  _init_api_keys()
50
 
51
  def get_next_api_key():
52
+ """
53
+ کلید API بعدی را به صورت چرخشی برمی‌گرداند.
54
+ """
55
  global NEXT_KEY_INDEX, ALL_API_KEYS, KEY_LOCK
56
+
57
+ with KEY_LOCK: # اطمینان از اینکه تنها یک ترد در هر زمان به ایندکس دسترسی دارد
58
+ if not ALL_API_KEYS:
59
+ return None, None
60
+
61
  key_to_use = ALL_API_KEYS[NEXT_KEY_INDEX % len(ALL_API_KEYS)]
62
  key_display_index = (NEXT_KEY_INDEX % len(ALL_API_KEYS)) + 1
63
  NEXT_KEY_INDEX += 1
64
  return key_to_use, key_display_index
65
+ # --- END: منطق جدید مدیریت API Key ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
66
 
67
  SPEAKER_VOICES = [
68
  "Achird", "Zubenelgenubi", "Vindemiatrix", "Sadachbia", "Sadaltager",
 
74
  FIXED_MODEL_NAME = "gemini-2.5-flash-preview-tts"
75
  DEFAULT_MAX_CHUNK_SIZE = 3800
76
  DEFAULT_SLEEP_BETWEEN_REQUESTS = 8
77
+ # نام پایه فایل دیگر ثابت نیست و به uuid هر درخواست بستگی دارد.
78
 
 
 
79
  def save_binary_file(file_name, data):
80
  try:
81
  with open(file_name, "wb") as f: f.write(data)
 
108
  def smart_text_split(text, max_size=3800):
109
  if len(text) <= max_size: return [text]
110
  chunks, current_chunk = [], ""
111
+ # اصلاح regex برای مدیریت بهتر کاراکترهای فارسی و فضای سفید
112
+ sentences = re.split(r'(?<=[.!?؟…])\s*|\n+', text) # اضافه شد: ... و newline
113
  for sentence in sentences:
114
+ sentence = sentence.strip() # اطمینان از حذف فضای سفید اضافی در ابتدا/انتها
115
+ if not sentence: continue # رد کردن جملات خالی
116
+
117
+ # اگر اضافه کردن جمله جاری، اندازه قطعه را از حداکثر مجاز فراتر ببرد
118
+ # یا اگر جمله جاری به تنهایی از حداکثر مجاز بزرگتر باشد
119
+ if len(current_chunk) + len(sentence) + 1 > max_size or (not current_chunk and len(sentence) > max_size):
120
+ if current_chunk: # اگر قطعه جاری محتوایی دارد، آن را اضافه کن
121
+ chunks.append(current_chunk.strip())
122
+ current_chunk = sentence # شروع یک قطعه جدید با جمله جاری
123
+
124
+ # اگر جمله جاری به تنهایی از max_size بزرگتر است، آن را هم خرد کن
125
  while len(current_chunk) > max_size:
126
+ # تلاش برای یافتن نقطه تقسیم در یک مرز منطقی (کاما، نقطه ویرگول، دو نقطه، فاصله)
127
  split_idx = next((i for i in range(max_size - 1, max_size // 2, -1) if current_chunk[i] in ['،', ',', ';', ':', ' ']), -1)
128
+
129
+ if split_idx != -1:
130
+ part, current_chunk = current_chunk[:split_idx+1], current_chunk[split_idx+1:]
131
+ else: # اگر هیچ مرزی منطقی پیدا نشد، به زور از max_size برش بزن
132
+ part, current_chunk = current_chunk[:max_size], current_chunk[max_size:]
133
+
134
  chunks.append(part.strip())
135
+ current_chunk = current_chunk.strip() # فضای سفید اضافه را حذف کن
136
+
137
+ else: # در غیر این صورت، جمله جاری را به قطعه فعلی اضافه کن
138
+ current_chunk += (" " if current_chunk else "") + sentence
139
 
140
+ if current_chunk: # آخرین قطعه را اضافه کن اگر خالی نیست
141
+ chunks.append(current_chunk.strip())
142
+
143
+ final_chunks = [c for c in chunks if c] # حذف هر قطعه خالی نهایی
144
+ return final_chunks
145
+
146
+
147
  def merge_audio_files_func(file_paths, output_path):
148
+ if not PYDUB_AVAILABLE:
149
+ logging.warning("⚠️ pydub برای ادغام در دسترس نیست.")
150
+ return False
151
  try:
152
  combined = AudioSegment.empty()
153
  for i, fp in enumerate(file_paths):
154
+ if os.path.exists(fp):
155
+ combined += AudioSegment.from_file(fp)
156
+ # اضافه کردن یک سکوت کوتاه بین قطعات، به جز آخرین قطعه
157
+ if i < len(file_paths) - 1:
158
+ combined += AudioSegment.silent(duration=150) # 150 میلی‌ثانیه سکوت
159
+ else:
160
+ logging.warning(f"⚠️ فایل برای ادغام پیدا نشد: {fp}")
161
  combined.export(output_path, format="wav")
162
  return True
163
+ except Exception as e:
164
+ logging.error(f"❌ خطا در ادغام فایل‌های صوتی به {output_path}: {e}")
165
+ return False
166
 
167
+ # --- START: منطق تولید صدا با قابلیت تلاش مجدد با کلیدهای چرخشی ---
168
+
169
+ def generate_audio_chunk_with_retry(chunk_text, prompt_text, voice, temp, request_id):
170
+ """
171
+ یک قطعه صوتی را با قابلیت تلاش مجدد با کلیدهای مختلف API تولید می‌کند.
172
+ اگر یک کلید ناموفق بود، به طور خودکار کلید بعدی را امتحان می‌کند تا تمام کلیدها بررسی شوند.
173
+ """
174
  if not ALL_API_KEYS:
175
+ logging.error(f"❌ (درخواست {request_id}) هیچ کلید API برای تولید صدا در دسترس نیست.")
176
  return None
177
+
178
  for _ in range(len(ALL_API_KEYS)):
179
  selected_api_key, key_idx_display = get_next_api_key()
180
+
181
  if not selected_api_key:
182
+ logging.warning(f"⚠️ (درخواست {request_id}) get_next_api_key هیچ کلیدی برنگرداند. تلاش‌های باقیمانده نادیده گرفته می‌شوند.")
183
  break
184
+
185
+ logging.info(f"⚙️ (درخواست {request_id}) تلاش برای تولید قطعه با کلید API شماره {key_idx_display} (...{selected_api_key[-4:]})")
186
+
187
  try:
188
  client = genai.Client(api_key=selected_api_key)
189
  final_text = f'"{prompt_text}"\n{chunk_text}' if prompt_text and prompt_text.strip() else chunk_text
 
191
  config = types.GenerateContentConfig(temperature=temp, response_modalities=["audio"],
192
  speech_config=types.SpeechConfig(voice_config=types.VoiceConfig(
193
  prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=voice))))
194
+
195
  response = client.models.generate_content(model=FIXED_MODEL_NAME, contents=contents, config=config)
196
+
197
  if response.candidates and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data:
198
+ logging.info(f"✅ (درخواست {request_id}) قطعه با موفقیت توسط کلید شماره {key_idx_display} تولید شد.")
199
  return response.candidates[0].content.parts[0].inline_data
200
  else:
201
+ logging.warning(f"⚠️ (درخواست {request_id}) پاسخ API برای قطعه با کلید شماره {key_idx_display} بدون داده صوتی بود. تلاش با کلید بعدی...")
202
+
203
  except Exception as e:
204
+ logging.error(f"❌ (درخواست {request_id}) خطا در تولید قطعه با کلید شماره {key_idx_display}: {e}. تلاش با کلید بعدی...")
 
 
205
 
206
+ logging.error(f"❌ (درخواست {request_id}) تمام کلیدهای API امتحان شدند اما هیچ‌کدام موفق به تولید قطعه نشدند.")
207
+ return None
208
+
209
  def core_generate_audio(text_input, prompt_input, selected_voice, temperature_val):
210
+ # برای هر درخواست یک شناسه یکتا تولید می‌شود تا نام فایل‌ها تداخل نداشته باشند
211
+ request_id = str(uuid.uuid4())
212
+ logging.info(f"🚀 (درخواست {request_id}) شروع فرآیند تولید صدا با قابلیت تعویض کلید خودکار...")
 
 
 
 
 
213
 
214
+ # نام پایه فایل اکنون شامل شناسه درخواست است
215
+ output_base_name = f"alpha_tts_audio_{request_id}"
216
+ max_chunk, sleep_time = DEFAULT_MAX_CHUNK_SIZE, DEFAULT_SLEEP_BETWEEN_REQUESTS
217
 
218
+ if not text_input or not text_input.strip():
219
+ logging.error(f"❌ (درخواست {request_id}) متن ورودی خالی است.")
220
+ return None
 
221
 
222
+ text_chunks = smart_text_split(text_input, max_chunk)
223
+ if not text_chunks:
224
+ logging.error(f" (درخواست {request_id}) متن قابل پردازش به قطعات کوچکتر نیست.")
225
+ return None
226
+
227
+ generated_files = []
228
+ for i, chunk in enumerate(text_chunks):
229
+ logging.info(f"🔊 (درخواست {request_id}) پردازش قطعه {i+1}/{len(text_chunks)}...")
230
+
231
+ inline_data = generate_audio_chunk_with_retry(chunk, prompt_input, selected_voice, temperature_val, request_id)
232
+
233
+ if inline_data:
234
+ data_buffer = inline_data.data
235
+ ext = mimetypes.guess_extension(inline_data.mime_type) or ".wav"
236
+ if "audio/L" in inline_data.mime_type and ext == ".wav":
237
+ data_buffer = convert_to_wav(data_buffer, inline_data.mime_type)
238
+ if not ext.startswith("."): ext = "." + ext
239
 
240
+ # نام فایل قطعه با شناسه درخواست منحصر به فرد می‌شود
241
+ fname_base = f"{output_base_name}_part{i+1:03d}"
242
+ fpath = save_binary_file(f"{fname_base}{ext}", data_buffer)
243
+ if fpath:
244
+ generated_files.append(fpath)
 
 
 
 
 
 
 
 
 
 
 
 
 
245
  else:
246
+ logging.error(f" (درخواست {request_id}) موفق به ذخیره فایل برای قطعه {i+1} نشدیم. این قطعه نادیده گرفته می‌شود.")
247
+ continue
248
+ else:
249
+ logging.error(f"🛑 (درخواست {request_id}) فرآیند متوقف شد زیرا تولید قطعه {i+1} با تمام کلیدهای موجود ناموفق بود.")
250
+ break
251
 
252
+ if i < len(text_chunks) - 1 and len(text_chunks) > 1:
253
+ time.sleep(sleep_time)
254
 
255
+ if not generated_files:
256
+ logging.error(f"❌ (درخواست {request_id}) هیچ فایل صوتی تولید نشد.")
257
+ return None
258
+
259
+ final_audio_file = None
260
+ # نام فایل خروجی نهایی نیز باید شامل شناسه درخواست باشد
261
+ final_output_path_base = f"{output_base_name}_final"
262
+
263
+ if len(generated_files) > 1:
264
+ if PYDUB_AVAILABLE:
265
+ merged_fn = f"{final_output_path_base}.wav"
266
+ # نیازی به os.remove قبلی نیست چون نام فایل یونیک است
267
+ if merge_audio_files_func(generated_files, merged_fn):
268
+ final_audio_file = merged_fn
269
+ else:
270
+ logging.error(f"❌ (درخواست {request_id}) ادغام فایل‌ها ناموفق بود. بازگشت به اولین قطعه.")
271
+ # اگر ادغام ناموفق بود، اولین قطعه را به عنوان خروجی نهایی برمی‌گردانیم
272
+ if generated_files:
273
+ try:
274
+ target_ext = os.path.splitext(generated_files[0])[1]
275
+ renamed_first_chunk = f"{final_output_path_base}_single{target_ext}" # نامی متفاوت برای جلوگیری از تداخل
276
+ # نیازی به os.remove قبلی نیست
277
+ os.rename(generated_files[0], renamed_first_chunk)
278
+ final_audio_file = renamed_first_chunk
279
+ except Exception as e_rename:
280
+ logging.error(f"❌ (درخواست {request_id}) خطا در تغییر نام فایل اولین قطعه (پس از ادغام ناموفق): {e_rename}")
281
+ final_audio_file = generated_files[0] # اگر تغییر نام هم نشد، همان فایل اصلی را برگردان
282
+ else:
283
+ logging.warning(f"⚠️ (درخواست {request_id}) pydub در دسترس نیست. اولین قطعه صوتی ارائه می‌شود.")
284
+ if generated_files:
285
+ try:
286
+ target_ext = os.path.splitext(generated_files[0])[1]
287
+ renamed_first_chunk = f"{final_output_path_base}_single{target_ext}"
288
+ # نیازی به os.remove قبلی نیست
289
+ os.rename(generated_files[0], renamed_first_chunk)
290
+ final_audio_file = renamed_first_chunk
291
+ for i_gf in range(1, len(generated_files)): # حذف بقیه قطعات اضافی
292
+ try: os.remove(generated_files[i_gf])
293
+ except: pass
294
+ except Exception as e_rename_single:
295
+ logging.error(f"❌ (درخواست {request_id}) خطا در تغییر نام فایل اولین قطعه (بدون pydub): {e_rename_single}")
296
+ final_audio_file = generated_files[0] # اگر تغییر نام هم نشد، همان فایل اصلی را برگردان
297
+
298
+ elif len(generated_files) == 1: # فقط یک قطعه تولید شده است
299
+ try:
300
+ target_ext = os.path.splitext(generated_files[0])[1]
301
+ final_single_fn = f"{final_output_path_base}{target_ext}"
302
+ # نیازی به os.remove قبلی نیست
303
+ os.rename(generated_files[0], final_single_fn)
304
+ final_audio_file = final_single_fn
305
+ except Exception as e_rename_single_final:
306
+ logging.error(f"❌ (درخواست {request_id}) خطا در تغییر نام فایل تکی نهایی: {e_rename_single_final}")
307
+ final_audio_file = generated_files[0]
308
+
309
+ # --- تمیز کردن فایل‌های میانی (اگر ادغام انجام شده باشد یا تنها یک فایل بوده باشد) ---
310
+ for fp_cleanup in generated_files:
311
+ # مطمئن می‌شویم که فایل نهایی را حذف نمی‌کنیم
312
+ if final_audio_file and os.path.abspath(fp_cleanup) == os.path.abspath(final_audio_file):
313
+ continue
314
+ try:
315
+ if os.path.exists(fp_cleanup):
316
+ os.remove(fp_cleanup)
317
+ logging.info(f"🗑️ (درخواست {request_id}) فایل میانی حذف شد: {os.path.basename(fp_cleanup)}")
318
+ except Exception as e_cleanup:
319
+ logging.warning(f"⚠️ (درخواست {request_id}) خطا در حذف فایل میانی {os.path.basename(fp_cleanup)}: {e_cleanup}")
320
+
321
+ if final_audio_file and os.path.exists(final_audio_file):
322
+ logging.info(f"✅ (درخواست {request_id}) فایل صوتی نهایی با موفقیت تولید شد: {os.path.basename(final_audio_file)}")
323
+ elif final_audio_file:
324
+ logging.warning(f"⚠️ (درخواست {request_id}) فایل نهایی '{final_audio_file}' پس از پردازش وجود ندارد!")
325
+ return None
326
+ else:
327
+ logging.error(f"❓ (درخواست {request_id}) وضعیت نامشخص برای فایل نهایی.")
328
+ return None
329
 
330
+ return final_audio_file
 
 
 
 
 
 
331
 
332
+ # --- END: منطق جدید تولید صدا ---
333
 
 
 
334
  def gradio_tts_interface(use_file_input, uploaded_file, text_to_speak, speech_prompt, speaker_voice, temperature, progress=gr.Progress(track_tqdm=True)):
335
  actual_text = ""
336
  if use_file_input:
337
  if uploaded_file:
338
  try:
339
+ # اطمینان از اینکه فایل به درستی از مسیر temp خوانده می‌شود
340
+ with open(uploaded_file.name, 'r', encoding='utf-8') as f:
341
+ actual_text = f.read().strip()
342
+ if not actual_text:
343
+ logging.error("❌ فایل آپلود شده خالی است یا خوانده نشد.")
344
+ return None
345
+ except Exception as e:
346
+ logging.error(f"❌ خطا در خواندن فایل آپلود شده: {e}")
347
+ return None
348
+ else:
349
+ logging.warning("❌ گزینه استفاده از فایل انتخاب شده اما فایلی آپلود نشده.")
350
+ return None
351
  else:
352
  actual_text = text_to_speak
353
+ if not actual_text or not actual_text.strip():
354
+ logging.warning("❌ متن ورودی برای تبدیل خالی است.")
355
+ return None
356
 
357
+ # Gradio به صورت خودکار فایل خروجی را پس از اتمام درخواست حذف می‌کند.
358
  final_path = core_generate_audio(actual_text, speech_prompt, speaker_voice, temperature)
359
  return final_path
360
 
361
+ # --- تابع جدید برای ریست خودکار هر 24 ساعت ---
362
  def auto_restart_service():
363
  RESTART_INTERVAL_SECONDS = 24 * 60 * 60
364
  logging.info(f"سرویس برای ری‌استارت خودکار پس از {RESTART_INTERVAL_SECONDS / 3600:.0f} ساعت زمان‌بندی شده است.")
365
  time.sleep(RESTART_INTERVAL_SECONDS)
366
  logging.info(f"زمان ری‌استارت خودکار فرا رسیده است. برنامه برای ری‌استارت خارج می‌شود...")
367
  os._exit(1)
368
+ # --- END: تابع ری‌استارت خودکار ---
369
+
370
 
371
+ # --- CSS و Gradio UI (بدون تغییر) ---
 
372
  custom_css_inspired_by_image = f"""
373
  @import url('https://fonts.googleapis.com/css2?family=Vazirmatn:wght@300;400;500;700;800&display=swap');
374
  :root {{
 
421
  </div>
422
  """
423
 
424
+ # --- رابط کاربری Gradio ---
425
  with gr.Blocks(theme=gr.themes.Base(font=[gr.themes.GoogleFont("Vazirmatn")]), css=custom_css_inspired_by_image, title="آلفا TTS") as demo:
426
  gr.HTML(alpha_header_html_v3)
427
 
428
  with gr.Column(elem_classes=["main-content-panel-alpha"]):
429
  use_file_input_cb = gr.Checkbox(label="📄 استفاده از فایل متنی (.txt)", value=False, elem_id="use_file_cb_alpha_v3")
430
+ uploaded_file_input = gr.File(
431
+ label=" ",
432
+ file_types=['.txt'],
433
+ visible=False,
434
+ elem_id="file_uploader_alpha_main_v3"
435
+ )
436
+ text_to_speak_tb = gr.Textbox(
437
+ label="متن فارسی برای تبدیل",
438
+ placeholder="مثال: سلام، فردا هوا چطور است؟",
439
+ lines=5,
440
+ value="",
441
+ visible=True,
442
+ elem_id="text_input_main_alpha_v3"
443
+ )
444
+ use_file_input_cb.change(
445
+ fn=lambda x: (gr.update(visible=x, label=" " if x else "متن فارسی برای تبدیل"), gr.update(visible=not x)),
446
+ inputs=use_file_input_cb,
447
+ outputs=[uploaded_file_input, text_to_speak_tb]
448
+ )
449
+
450
+ speech_prompt_tb = gr.Textbox(
451
+ label="سبک گفتار (اختیاری)",
452
+ placeholder="مثال: با لحنی شاد و پرانرژی",
453
+ value="با لحنی دوستانه و رسا صحبت کن.",
454
+ lines=2, elem_id="speech_prompt_alpha_v3"
455
+ )
456
+ speaker_voice_dd = gr.Dropdown(
457
+ SPEAKER_VOICES, label="انتخاب گوینده و لهجه", value="Charon", elem_id="speaker_voice_alpha_v3"
458
+ )
459
+ temperature_slider = gr.Slider(
460
+ minimum=0.1, maximum=1.5, step=0.05, value=0.9, label="میزان خلاقیت صدا",
461
+ elem_id="temperature_slider_alpha_v3"
462
+ )
463
  gr.Markdown("<p class='temp_description_class_alpha_v3'>مقادیر بالاتر = تنوع بیشتر، مقادیر پایین‌تر = یکنواختی بیشتر.</p>")
464
+
465
  generate_button = gr.Button("🚀 تولید و پخش صدا", elem_classes=["generate-button-final"], elem_id="generate_button_alpha_v3")
466
+
467
  output_audio = gr.Audio(label=" ", type="filepath", elem_id="output_audio_player_alpha_v3")
468
+
469
+ generate_button.click(
470
+ fn=gradio_tts_interface,
471
+ inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ],
472
+ outputs=[output_audio]
473
+ )
474
+
475
  gr.Markdown("<h3 class='section-title-main-alpha' style='margin-top:2.5rem; text-align:center; border-bottom:none;'>نمونه‌های کاربردی</h3>", elem_id="examples_section_title_v3")
476
+ gr.Examples(
477
+ examples=[
478
+ [False, None, "سلام بر شما، امیدوارم روز خوبی داشته باشید.", "با لحنی گرم و صمیمی.", "Zephyr", 0.85],
479
+ [False, None, "این یک آزمایش برای بررسی کیفیت صدای تولید شده توسط هوش مصنوعی آلفا است.", "با صدایی طبیعی و روان.", "Charon", 0.9],
480
+ ],
481
+ inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ],
482
+ outputs=[output_audio],
483
+ fn=gradio_tts_interface,
484
+ cache_examples=False
485
+ )
486
  gr.Markdown("<p class='app-footer-final'>Alpha Language Learning © 2024</p>")
487
 
 
488
  if __name__ == "__main__":
489
+ # اجرای تابع ری‌استارت خودکار در یک ترد جداگانه
490
  threading.Thread(target=auto_restart_service, daemon=True, name="AutoRestartThread").start()
491
+
 
492
  if len(ALL_API_KEYS) > 0 :
493
+ # فعال‌سازی همزمانی برای Gradio:
494
+ # concurrency_count تعداد درخواست‌هایی است که Gradio می‌تواند به صورت همزمان پردازش کند.
495
+ # برای Spaces رایگان، 2 یا 3 (حداکثر 4) معمولاً نقطه شروع خوبی است تا منابع Space بیش از حد بارگذاری نشود.
496
+ # max_queue_size تعداد درخواست‌هایی است که در صف نگه داشته می‌شوند.
497
+ demo.launch(
498
+ server_name="0.0.0.0",
499
+ server_port=int(os.getenv("PORT", 7860)),
500
+ concurrency_count=3, # تنظیم برای پردازش 3 درخواست همزمان
501
+ max_queue_size=10 # حداکثر 10 درخواست در صف نگهداری می‌شوند
502
+ )
503
  else:
504
  logging.critical("🔴 برنامه به دلیل عدم وجود کلید API جیمینای اجرا نشد. لطفاً Secrets را بررسی کنید.")