Spaces:

Opera8
/

Geminidub1

Sleeping

App Files Files Community

Opera8 commited on Feb 23

Commit

6c6bd59

verified ·

1 Parent(s): aaae3e3

Update app.py

Browse files

Files changed (1) hide show

app.py +89 -79

app.py CHANGED Viewed

@@ -7,7 +7,7 @@ import aiohttp
 import requests
 import subprocess
 import shutil
-import random  # اضافه شده برای انتخاب تصادفی کلید
 from flask import Flask, request, jsonify, send_file, render_template
 from flask_cors import CORS
 from werkzeug.utils import secure_filename
@@ -18,6 +18,12 @@ import yt_dlp
 app = Flask(__name__, template_folder='templates', static_folder='static')
 CORS(app)
 # تنظیمات مسیرها
 UPLOAD_FOLDER = 'uploads'
 TEMP_AUDIO_FOLDER = 'temp_audio'
@@ -54,6 +60,63 @@ def download_youtube(url):
         ydl.download([url])
     return filepath
 async def generate_audio_async(session, text, speaker, index):
     """تولید صدا به صورت غیرهمزمان از API پادکست"""
     try:
@@ -102,20 +165,11 @@ def serve_audio(filename):
 @app.route('/api/analyze', methods=['POST'])
 def analyze_video():
-    # دریافت کلیدها به صورت رشته (ممکن است شامل کاما باشد)
-    raw_api_keys = request.form.get('api_key')
     youtube_url = request.form.get('youtube_url')
     video_file = request.files.get('video_file')
     target_lang = request.form.get('language', 'Persian')
-    if not raw_api_keys: return jsonify({"error": "API Key is required"}), 400
-    # تبدیل رشته کلیدها به لیست و حذف فاصله‌های اضافی
-    api_keys_list = [k.strip() for k in raw_api_keys.split(',') if k.strip()]
-    # بهم ریختن ترتیب کلیدها برای انتخاب تصادفی
-    random.shuffle(api_keys_list)
     try:
         # 1. دریافت ویدیو
         if youtube_url:
@@ -130,66 +184,26 @@ def analyze_video():
         # 2. استخراج صدا
         audio_path = extract_audio(video_path)
-        # 3. تلاش برای استفاده از کلیدها (Logic Retry & Fallback)
-        script = None
-        last_error = None
-        for current_key in api_keys_list:
-            try:
-                print(f"Trying API Key: {current_key[:5]}...") # فقط لاگ کردن ابتدای کلید
-                genai.configure(api_key=current_key)
-                model = genai.GenerativeModel('gemini-2.5-flash')
-                prompt = f"""
-                You are a Dubbing Director.
-                {CAST_PROMPT}
-                TASK:
-                1. Identify speakers in the audio.
-                2. Assign a Voice Actor ID from the list to each segment based on gender/tone.
-                3. Translate the dialogue to {target_lang}.
-                4. Return a JSON Array.
-                Format:
-                [
-                  {{"start": 0.0, "end": 4.5, "speaker_id": "Charon", "text": "Translated text..."}},
-                  ...
-                ]
-                """
-                # آپلود فایل (توجه: فایل باید با همان کلیدی آپلود شود که جنریت انجام می‌شود)
-                audio_file = genai.upload_file(audio_path)
-                # انتظار برای پردازش فایل
-                while audio_file.state.name == "PROCESSING":
-                    time.sleep(1)
-                    audio_file = genai.get_file(audio_file.name)
-                if audio_file.state.name == "FAILED":
-                    raise Exception("File upload failed on Google servers")
-                res = model.generate_content([prompt, audio_file], generation_config={"response_mime_type": "application/json"})
-                # پارس کردن خروجی
-                try:
-                    script = json.loads(res.text)
-                except:
-                    # گاهی اوقات مدل جیسون خالص نمی‌دهد، پاکسازی ساده
-                    clean_json = res.text.replace('```json', '').replace('```', '')
-                    script = json.loads(clean_json)
-                # اگر موفق بود، حلقه را بشکن
-                break
-            except Exception as e:
-                print(f"Key {current_key[:5]}... failed. Error: {e}")
-                last_error = e
-                # ادامه می‌دهیم به کلید بعدی در لیست
-                continue
-        # اگر بعد از امتحان تمام کلیدها اسکریپت هنوز خالی بود
-        if script is None:
-            return jsonify({"error": f"All API keys failed. Last error: {str(last_error)}"}), 500
         # 4. تولید صدای اولیه به صورت همزمان (Batch Processing)
         results = asyncio.run(batch_generate_audio(script))
@@ -217,7 +231,7 @@ def regenerate_segment():
     speaker = data.get('speaker_id')
     try:
-        # درخواست تکی به API پادکست (Sync request via standard requests lib)
         resp = requests.post(PODCAST_API_URL, json={"text": text, "speaker": speaker, "temperature": 0.9})
         if resp.status_code == 200:
             filename = f"seg_{uuid.uuid4()}.wav"
@@ -256,15 +270,12 @@ def render_final():
             current_dur_ms = len(audio)
             if current_dur_ms > 0:
-                # اگر تفاوت زمان زیاد بود، سرعت را تغییر بده (محدودیت بین 0.5 تا 2.0 برابر)
                 speed = current_dur_ms / target_dur_ms
                 speed = max(0.6, min(2.0, speed))
                 if abs(speed - 1.0) > 0.05:
-                    # تغییر سرعت با FFmpeg چون کیفیت بهتری از pydub دارد
                     temp_out = seg_path.replace('.wav', '_speed.wav')
                     atempo = f"atempo={speed}"
-                    # برای سرعت‌های خیلی زیاد یا کم نیاز به زنجیره فیلتر است
                     if speed > 2.0: atempo = "atempo=2.0,atempo={}".format(speed/2)
                     elif speed < 0.5: atempo = "atempo=0.5,atempo={}".format(speed/0.5)
@@ -284,15 +295,14 @@ def render_final():
         # ترکیب با ویدیو
         final_video_path = os.path.join(UPLOAD_FOLDER, f"dubbed_{uuid.uuid4()}.mp4")
-        # دستور FFmpeg: ویدیو اصلی + صدای جدید (جایگزین صدای قبلی)
         cmd = [
             'ffmpeg', '-y',
             '-i', video_path,
             '-i', final_mix_path,
-            '-c:v', 'copy',      # کپی ویدیو بدون انکود مجدد (سریع)
-            '-c:a', 'aac',       # انکود صدا
-            '-map', '0:v:0',     # تصویر از فایل اول
-            '-map', '1:a:0',     # صدا از فایل دوم
             '-shortest',
             final_video_path
         ]

 import requests
 import subprocess
 import shutil
+import random
 from flask import Flask, request, jsonify, send_file, render_template
 from flask_cors import CORS
 from werkzeug.utils import secure_filename
 app = Flask(__name__, template_folder='templates', static_folder='static')
 CORS(app)
+# ==========================================
+# تنظیمات کلیدهای API (محل قرارگیری کلیدها)
+# ==========================================
+# کلیدهای خود را در اینجا وارد کنید و با کاما (,) جدا کنید
+ALL_GEMINI_API_KEYS = "YOUR_API_KEY_1,YOUR_API_KEY_2,YOUR_API_KEY_3,YOUR_API_KEY_4"
 # تنظیمات مسیرها
 UPLOAD_FOLDER = 'uploads'
 TEMP_AUDIO_FOLDER = 'temp_audio'
         ydl.download([url])
     return filepath
+def generate_content_with_retry(prompt, audio_file_path):
+    """
+    این تابع کلیدها را مدیریت می‌کند.
+    اگر یک کلید خطا داد، سراغ بعدی می‌رود.
+    """
+    # تبدیل رشته کلیدها به لیست و حذف فاصله‌های اضافی
+    keys_list = [k.strip() for k in ALL_GEMINI_API_KEYS.split(',') if k.strip()]
+    if not keys_list:
+        raise Exception("هیچ کلید API تعریف نشده است.")
+    # مخلوط کردن کلیدها برای انتخاب تصادفی
+    random.shuffle(keys_list)
+    last_exception = None
+    for api_key in keys_list:
+        try:
+            print(f"Trying with API Key: ...{api_key[-4:]}") # لاگ کردن ۴ حرف آخر کلید برای دیباگ
+            genai.configure(api_key=api_key)
+            model = genai.GenerativeModel('gemini-2.5-flash')
+            # آپلود فایل برای جمینای
+            # نکته: هر کلید فضای فایل خود را دارد، پس باید با کلید جدید دوباره آپلود شود
+            uploaded_file = genai.upload_file(audio_file_path)
+            # انتظار برای پردازش فایل
+            while uploaded_file.state.name == "PROCESSING":
+                time.sleep(1)
+                uploaded_file = genai.get_file(uploaded_file.name)
+            if uploaded_file.state.name == "FAILED":
+                raise Exception("Google failed to process audio file.")
+            # تولید محتوا
+            response = model.generate_content(
+                [prompt, uploaded_file],
+                generation_config={"response_mime_type": "application/json"}
+            )
+            # پاک کردن فایل از سرور گوگل برای جلوگیری از پر شدن حافظه
+            try:
+                genai.delete_file(uploaded_file.name)
+            except:
+                pass
+            return json.loads(response.text)
+        except Exception as e:
+            print(f"Key failed: {e}")
+            last_exception = e
+            # حلقه ادامه می‌یابد و سراغ کلید بعدی می‌رود
+            continue
+    # اگر از حلقه خارج شد یعنی همه کلیدها خطا داده‌اند
+    raise Exception(f"All API keys failed. Last error: {str(last_exception)}")
 async def generate_audio_async(session, text, speaker, index):
     """تولید صدا به صورت غیرهمزمان از API پادکست"""
     try:
 @app.route('/api/analyze', methods=['POST'])
 def analyze_video():
+    # دیگر نیازی به دریافت api_key از سمت کلاینت نیست
     youtube_url = request.form.get('youtube_url')
     video_file = request.files.get('video_file')
     target_lang = request.form.get('language', 'Persian')
     try:
         # 1. دریافت ویدیو
         if youtube_url:
         # 2. استخراج صدا
         audio_path = extract_audio(video_path)
+        # 3. ارسال به Gemini با قابلیت Retry و چرخش کلیدها
+        prompt = f"""
+        You are a Dubbing Director.
+        {CAST_PROMPT}
+        TASK:
+        1. Identify speakers in the audio.
+        2. Assign a Voice Actor ID from the list to each segment based on gender/tone.
+        3. Translate the dialogue to {target_lang}.
+        4. Return a JSON Array.
+        Format:
+        [
+          {{"start": 0.0, "end": 4.5, "speaker_id": "Charon", "text": "Translated text..."}},
+          ...
+        ]
+        """
+        # استفاده از تابع جدید که مدیریت کلیدها را بر عهده دارد
+        script = generate_content_with_retry(prompt, audio_path)
         # 4. تولید صدای اولیه به صورت همزمان (Batch Processing)
         results = asyncio.run(batch_generate_audio(script))
     speaker = data.get('speaker_id')
     try:
+        # درخواست تکی به API پادکست
         resp = requests.post(PODCAST_API_URL, json={"text": text, "speaker": speaker, "temperature": 0.9})
         if resp.status_code == 200:
             filename = f"seg_{uuid.uuid4()}.wav"
             current_dur_ms = len(audio)
             if current_dur_ms > 0:
                 speed = current_dur_ms / target_dur_ms
                 speed = max(0.6, min(2.0, speed))
                 if abs(speed - 1.0) > 0.05:
                     temp_out = seg_path.replace('.wav', '_speed.wav')
                     atempo = f"atempo={speed}"
                     if speed > 2.0: atempo = "atempo=2.0,atempo={}".format(speed/2)
                     elif speed < 0.5: atempo = "atempo=0.5,atempo={}".format(speed/0.5)
         # ترکیب با ویدیو
         final_video_path = os.path.join(UPLOAD_FOLDER, f"dubbed_{uuid.uuid4()}.mp4")
         cmd = [
             'ffmpeg', '-y',
             '-i', video_path,
             '-i', final_mix_path,
+            '-c:v', 'copy',
+            '-c:a', 'aac',
+            '-map', '0:v:0',
+            '-map', '1:a:0',
             '-shortest',
             final_video_path
         ]