Ttspro2

Running

App Files Files Community

Hamed744 commited on Jul 10, 2025

Commit

50ab425

verified ·

1 Parent(s): 11bff8c

Update app.py

Browse files

Files changed (1) hide show

app.py +42 -35

app.py CHANGED Viewed

@@ -1,4 +1,4 @@
-# app.py - نسخه کامل و نهایی برای تمام اسپیس‌های Hugging Face
 import os
 import sys
@@ -15,8 +15,6 @@ from fastapi import FastAPI, HTTPException
 from pydantic import BaseModel
 from google import genai
 from google.genai import types
-# اضافه کردن uvicorn برای اجرا از داخل اسکریپت
 import uvicorn
 try:
@@ -25,12 +23,11 @@ try:
 except ImportError:
     PYDUB_AVAILABLE = False
-# --- پیکربندی لاگینگ ---
 logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s', datefmt='%Y-%m-%d %H:%M:%S')
-# --- START: تعریف تمام توابع کمکی ---
-# --- منطق مدیریت API Key ---
 ALL_API_KEYS: list[str] = []
 NEXT_KEY_INDEX: int = 0
 KEY_LOCK: threading.Lock = threading.Lock()
@@ -42,14 +39,33 @@ def _init_api_keys():
         ALL_API_KEYS = [key.strip() for key in all_keys_string.split(',') if key.strip()]
     logging.info(f"✅ تعداد {len(ALL_API_KEYS)} کلید API جیمینای بارگذاری شد.")
     if not ALL_API_KEYS:
-        logging.warning("⛔️ هشدار: هیچ Secret با نام ALL_GEMINI_API_KEYS یافت نشد! برنامه بدون کلید API کار نخواهد کرد.")
-# --- ثابت‌ها ---
 FIXED_MODEL_NAME = "gemini-2.5-flash-preview-tts"
 DEFAULT_MAX_CHUNK_SIZE = 3800
 DEFAULT_SLEEP_BETWEEN_REQUESTS = 8
-# --- توابع کمکی فایل و صدا ---
 def save_binary_file(file_name, data):
     try:
         with open(file_name, "wb") as f: f.write(data)
@@ -107,35 +123,33 @@ def merge_audio_files_func(file_paths, output_path):
         return True
     except Exception as e: logging.error(f"❌ خطا در ادغام فایل‌های صوتی: {e}"); return False
-def get_next_api_key():
-    global NEXT_KEY_INDEX, ALL_API_KEYS, KEY_LOCK
-    with KEY_LOCK:
-        if not ALL_API_KEYS: return None, None
-        key_to_use = ALL_API_KEYS[NEXT_KEY_INDEX % len(ALL_API_KEYS)]
-        key_display_index = (NEXT_KEY_INDEX % len(ALL_API_KEYS)) + 1
-        NEXT_KEY_INDEX += 1
-        return key_to_use, key_display_index
-# --- منطق اصلی تولید صدا ---
 def generate_audio_chunk_with_retry(chunk_text, prompt_text, voice, temp, session_id):
     if not ALL_API_KEYS: raise Exception("هیچ کلید API برای پردازش در دسترس نیست.")
     for _ in range(len(ALL_API_KEYS)):
-        selected_api_key, key_idx_display = get_next_api_key()
-        if not selected_api_key: break
         logging.info(f"[{session_id}] ⚙️ تلاش برای تولید قطعه با کلید API شماره {key_idx_display}")
         try:
-            client = genai.Client(api_key=selected_api_key)
             final_text = f'"{prompt_text}"\n{chunk_text}' if prompt_text and prompt_text.strip() else chunk_text
             contents = [types.Content(role="user", parts=[types.Part.from_text(text=final_text)])]
             config = types.GenerateContentConfig(temperature=temp, response_modalities=["audio"],
                 speech_config=types.SpeechConfig(voice_config=types.VoiceConfig(
                     prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=voice))))
             response = client.models.generate_content(model=FIXED_MODEL_NAME, contents=contents, config=config)
             if response.candidates and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data:
                 logging.info(f"[{session_id}] ✅ قطعه با موفقیت توسط کلید شماره {key_idx_display} تولید شد.")
                 return response.candidates[0].content.parts[0].inline_data
         except Exception as e:
             logging.error(f"[{session_id}] ❌ خطا در تولید قطعه با کلید شماره {key_idx_display}: {e}.")
     return None
 def core_generate_audio(text_input, prompt_input, selected_voice, temperature_val, session_id):
@@ -179,13 +193,8 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
         if os.path.exists(temp_dir):
             shutil.rmtree(temp_dir)
-# --- END: تعریف تمام توابع کمکی ---
-# --- اجرای کدهای اولیه برنامه ---
 _init_api_keys()
-# --- تعریف اپلیکیشن FastAPI ---
 app = FastAPI(title="Alpha TTS Worker API")
 class TTSRequest(BaseModel):
@@ -194,8 +203,12 @@ class TTSRequest(BaseModel):
     speaker: str
     temperature: float
 @app.post("/generate")
-async def generate_audio_endpoint(request: TTSRequest):
     session_id = str(uuid.uuid4())[:8]
     logging.info(f"[{session_id}] 🏁 درخواست جدید API در این Worker دریافت شد.")
     try:
@@ -221,12 +234,6 @@ def health_check():
 logging.info("✅✅✅ Application logic initialized successfully. Starting Uvicorn server...")
-# --- START: بخش جدید برای اجرای سرور ---
 if __name__ == "__main__":
-    # پورت را از متغیرهای محیطی هاگینگ فیس یا به صورت پیش‌فرض 7860 بخوان
     port = int(os.environ.get("PORT", 7860))
-    # اجرای سرور Uvicorn از داخل کد پایتون
-    # reload=False برای محیط production مهم است
-    uvicorn.run(app, host="0.0.0.0", port=port, reload=False)
-# --- END: بخش جدید برای اجرای سرور ---

+# app.py - نسخه نهایی با اجرای همزمان واقعی برای حداکثر پایداری
 import os
 import sys
 from pydantic import BaseModel
 from google import genai
 from google.genai import types
 import uvicorn
 try:
 except ImportError:
     PYDUB_AVAILABLE = False
 logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s', datefmt='%Y-%m-%d %H:%M:%S')
+GEMINI_CLIENTS_CACHE = {}
+CLIENT_CACHE_LOCK = threading.Lock()
 ALL_API_KEYS: list[str] = []
 NEXT_KEY_INDEX: int = 0
 KEY_LOCK: threading.Lock = threading.Lock()
         ALL_API_KEYS = [key.strip() for key in all_keys_string.split(',') if key.strip()]
     logging.info(f"✅ تعداد {len(ALL_API_KEYS)} کلید API جیمینای بارگذاری شد.")
     if not ALL_API_KEYS:
+        logging.warning("⛔️ هشدار: هیچ Secret با نام ALL_GEMINI_API_KEYS یافت نشد!")
+def get_next_api_key_and_client():
+    global NEXT_KEY_INDEX
+    with KEY_LOCK:
+        if not ALL_API_KEYS:
+            return None, None, -1
+        current_index = NEXT_KEY_INDEX % len(ALL_API_KEYS)
+        key_to_use = ALL_API_KEYS[current_index]
+        key_display_index = current_index + 1
+        NEXT_KEY_INDEX += 1
+    with CLIENT_CACHE_LOCK:
+        if key_to_use in GEMINI_CLIENTS_CACHE:
+            client = GEMINI_CLIENTS_CACHE[key_to_use]
+        else:
+            logging.info(f"Creating new Gemini client for key ending in ...{key_to_use[-4:]}")
+            client = genai.Client(api_key=key_to_use)
+            GEMINI_CLIENTS_CACHE[key_to_use] = client
+    return key_to_use, client, key_display_index
 FIXED_MODEL_NAME = "gemini-2.5-flash-preview-tts"
 DEFAULT_MAX_CHUNK_SIZE = 3800
 DEFAULT_SLEEP_BETWEEN_REQUESTS = 8
 def save_binary_file(file_name, data):
     try:
         with open(file_name, "wb") as f: f.write(data)
         return True
     except Exception as e: logging.error(f"❌ خطا در ادغام فایل‌های صوتی: {e}"); return False
 def generate_audio_chunk_with_retry(chunk_text, prompt_text, voice, temp, session_id):
     if not ALL_API_KEYS: raise Exception("هیچ کلید API برای پردازش در دسترس نیست.")
     for _ in range(len(ALL_API_KEYS)):
+        selected_api_key, client, key_idx_display = get_next_api_key_and_client()
+        if not client:
+            break
         logging.info(f"[{session_id}] ⚙️ تلاش برای تولید قطعه با کلید API شماره {key_idx_display}")
         try:
             final_text = f'"{prompt_text}"\n{chunk_text}' if prompt_text and prompt_text.strip() else chunk_text
             contents = [types.Content(role="user", parts=[types.Part.from_text(text=final_text)])]
             config = types.GenerateContentConfig(temperature=temp, response_modalities=["audio"],
                 speech_config=types.SpeechConfig(voice_config=types.VoiceConfig(
                     prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=voice))))
             response = client.models.generate_content(model=FIXED_MODEL_NAME, contents=contents, config=config)
             if response.candidates and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data:
                 logging.info(f"[{session_id}] ✅ قطعه با موفقیت توسط کلید شماره {key_idx_display} تولید شد.")
                 return response.candidates[0].content.parts[0].inline_data
         except Exception as e:
             logging.error(f"[{session_id}] ❌ خطا در تولید قطعه با کلید شماره {key_idx_display}: {e}.")
+            if "authentication" in str(e).lower():
+                with CLIENT_CACHE_LOCK:
+                    if selected_api_key in GEMINI_CLIENTS_CACHE:
+                        del GEMINI_CLIENTS_CACHE[selected_api_key]
+                        logging.warning(f"Client for key ...{selected_api_key[-4:]} removed from cache due to auth error.")
     return None
 def core_generate_audio(text_input, prompt_input, selected_voice, temperature_val, session_id):
         if os.path.exists(temp_dir):
             shutil.rmtree(temp_dir)
 _init_api_keys()
 app = FastAPI(title="Alpha TTS Worker API")
 class TTSRequest(BaseModel):
     speaker: str
     temperature: float
+# --- START: تغییر اصلی برای اجرای همزمان واقعی ---
+# کلمه کلیدی async از تعریف تابع حذف شده است.
+# این به FastAPI می‌گوید که این تابع سنگین را در یک thread جداگانه اجرا کند.
 @app.post("/generate")
+def generate_audio_endpoint(request: TTSRequest):
+# --- END: تغییر اصلی ---
     session_id = str(uuid.uuid4())[:8]
     logging.info(f"[{session_id}] 🏁 درخواست جدید API در این Worker دریافت شد.")
     try:
 logging.info("✅✅✅ Application logic initialized successfully. Starting Uvicorn server...")
 if __name__ == "__main__":
     port = int(os.environ.get("PORT", 7860))
+    uvicorn.run(app, host="0.0.0.0", port=port, reload=False)