Spaces:

Opera8
/

Geminidub1

Sleeping

App Files Files Community

Opera8 commited on Feb 23

Commit

f5f5f3c

verified ·

1 Parent(s): a1fd7e3

Update app.py

Browse files

Files changed (1) hide show

app.py +62 -28

app.py CHANGED Viewed

@@ -8,6 +8,7 @@ import requests
 import subprocess
 import shutil
 import random
 from flask import Flask, request, jsonify, send_file, render_template
 from flask_cors import CORS
 from werkzeug.utils import secure_filename
@@ -15,14 +16,42 @@ import google.generativeai as genai
 from pydub import AudioSegment
 import yt_dlp
 app = Flask(__name__, template_folder='templates', static_folder='static')
 CORS(app)
 # ==========================================
-# تنظیمات کلیدهای API (خواندن از Secret)
 # ==========================================
-# کد زیر کلیدها را از تنظیمات هاگینگ فیس با نام GEMINI_API_KEYS میخواند
-ALL_GEMINI_API_KEYS = os.environ.get("GEMINI_API_KEYS", "")
 # تنظیمات مسیرها
 UPLOAD_FOLDER = 'uploads'
@@ -65,27 +94,26 @@ def generate_content_with_retry(prompt, audio_file_path):
     این تابع کلیدها را مدیریت می‌کند.
     اگر یک کلید خطا داد، سراغ بعدی می‌رود.
     """
-    if not ALL_GEMINI_API_KEYS:
-        raise Exception("کلیدهای API یافت نشدند. لطفاً در تنظیمات Secret مقدار GEMINI_API_KEYS را تنظیم کنید.")
-    # تبدیل رشته کلیدها به لیست و حذف فاصله‌های اضافی
-    keys_list = [k.strip() for k in ALL_GEMINI_API_KEYS.split(',') if k.strip()]
     if not keys_list:
-        raise Exception("لیست کلیدها خالی است.")
     # مخلوط کردن کلیدها برای انتخاب تصادفی
     random.shuffle(keys_list)
     last_exception = None
-    for api_key in keys_list:
         try:
-            print(f"Trying with API Key: ...{api_key[-4:]}") # لاگ کردن ۴ حرف آخر کلید برای دیباگ
             genai.configure(api_key=api_key)
             model = genai.GenerativeModel('gemini-2.5-flash')
             # آپلود فایل برای جمینای
             uploaded_file = genai.upload_file(audio_file_path)
             # انتظار برای پردازش فایل
@@ -96,28 +124,32 @@ def generate_content_with_retry(prompt, audio_file_path):
             if uploaded_file.state.name == "FAILED":
                 raise Exception("Google failed to process audio file.")
             # تولید محتوا
             response = model.generate_content(
                 [prompt, uploaded_file],
                 generation_config={"response_mime_type": "application/json"}
             )
-            # پاک کردن فایل از سرور گوگل برای جلوگیری از پر شدن حافظه
             try:
                 genai.delete_file(uploaded_file.name)
             except:
                 pass
             return json.loads(response.text)
         except Exception as e:
-            print(f"Key failed: {e}")
             last_exception = e
             # حلقه ادامه می‌یابد و سراغ کلید بعدی می‌رود
             continue
     # اگر از حلقه خارج شد یعنی همه کلیدها خطا داده‌اند
-    raise Exception(f"All API keys failed. Last error: {str(last_exception)}")
 async def generate_audio_async(session, text, speaker, index):
     """تولید صدا به صورت غیرهمزمان از API پادکست"""
@@ -131,8 +163,10 @@ async def generate_audio_async(session, text, speaker, index):
                 with open(path, 'wb') as f:
                     f.write(audio_data)
                 return {"index": index, "status": "success", "file": filename}
     except Exception as e:
-        print(f"Error gen audio {index}: {e}")
     return {"index": index, "status": "failed"}
 async def batch_generate_audio(segments):
@@ -167,7 +201,6 @@ def serve_audio(filename):
 @app.route('/api/analyze', methods=['POST'])
 def analyze_video():
-    # دریافت ورودی‌ها
     youtube_url = request.form.get('youtube_url')
     video_file = request.files.get('video_file')
     target_lang = request.form.get('language', 'Persian')
@@ -175,8 +208,10 @@ def analyze_video():
     try:
         # 1. دریافت ویدیو
         if youtube_url:
             video_path = download_youtube(youtube_url)
         elif video_file:
             filename = secure_filename(f"{uuid.uuid4()}_{video_file.filename}")
             video_path = os.path.join(UPLOAD_FOLDER, filename)
             video_file.save(video_path)
@@ -184,9 +219,10 @@ def analyze_video():
             return jsonify({"error": "No video provided"}), 400
         # 2. استخراج صدا
         audio_path = extract_audio(video_path)
-        # 3. ارسال به Gemini با قابلیت Retry و چرخش کلیدها
         prompt = f"""
         You are a Dubbing Director.
         {CAST_PROMPT}
@@ -204,26 +240,27 @@ def analyze_video():
         ]
         """
-        # استفاده از تابع جدید که مدیریت کلیدها را بر عهده دارد
         script = generate_content_with_retry(prompt, audio_path)
-        # 4. تولید صدای اولیه به صورت همزمان (Batch Processing)
         results = asyncio.run(batch_generate_audio(script))
-        # اتصال فایل‌های صوتی به اسکریپت
         for res_item in results:
             idx = res_item['index']
             if res_item['status'] == 'success':
                 script[idx]['audio_file'] = res_item['file']
             else:
                 script[idx]['audio_file'] = None
         return jsonify({
             "video_filename": os.path.basename(video_path),
             "script": script
         })
     except Exception as e:
         return jsonify({"error": str(e)}), 500
 @app.route('/api/regenerate_segment', methods=['POST'])
@@ -233,7 +270,6 @@ def regenerate_segment():
     speaker = data.get('speaker_id')
     try:
-        # درخواست تکی به API پادکست
         resp = requests.post(PODCAST_API_URL, json={"text": text, "speaker": speaker, "temperature": 0.9})
         if resp.status_code == 200:
             filename = f"seg_{uuid.uuid4()}.wav"
@@ -256,7 +292,7 @@ def render_final():
     if not os.path.exists(video_path): return jsonify({"error": "Video not found"}), 404
     try:
-        # میکس صداها
         video_duration = get_video_duration(video_path)
         final_audio = AudioSegment.silent(duration=int(video_duration * 1000))
@@ -266,7 +302,6 @@ def render_final():
             seg_path = os.path.join(TEMP_AUDIO_FOLDER, seg['audio_file'])
             if not os.path.exists(seg_path): continue
-            # تنظیم ��رعت (Time Stretch)
             audio = AudioSegment.from_file(seg_path)
             target_dur_ms = (seg['end'] - seg['start']) * 1000
             current_dur_ms = len(audio)
@@ -286,15 +321,12 @@ def render_final():
                     if os.path.exists(temp_out):
                         audio = AudioSegment.from_file(temp_out)
-            # قرار دادن در خط زمانی
             start_ms = int(seg['start'] * 1000)
             final_audio = final_audio.overlay(audio, position=start_ms)
-        # ذخیره فایل صوتی نهایی
         final_mix_path = os.path.join(UPLOAD_FOLDER, f"mix_{uuid.uuid4()}.wav")
         final_audio.export(final_mix_path, format="wav")
-        # ترکیب با ویدیو
         final_video_path = os.path.join(UPLOAD_FOLDER, f"dubbed_{uuid.uuid4()}.mp4")
         cmd = [
@@ -310,9 +342,11 @@ def render_final():
         ]
         subprocess.run(cmd, stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)
         return jsonify({"download_url": f"/uploads/{os.path.basename(final_video_path)}"})
     except Exception as e:
         return jsonify({"error": str(e)}), 500
 if __name__ == '__main__':

 import subprocess
 import shutil
 import random
+import logging
 from flask import Flask, request, jsonify, send_file, render_template
 from flask_cors import CORS
 from werkzeug.utils import secure_filename
 from pydub import AudioSegment
 import yt_dlp
+# ==========================================
+# تنظیمات سیستم لاگ (نمایش پیام‌ها در کنسول)
+# ==========================================
+logging.basicConfig(
+    level=logging.INFO,
+    format='%(asctime)s - %(levelname)s - %(message)s',
+    datefmt='%Y-%m-%d %H:%M:%S'
+)
+logger = logging.getLogger(__name__)
 app = Flask(__name__, template_folder='templates', static_folder='static')
 CORS(app)
 # ==========================================
+# بررسی کلیدها در لحظه شروع برنامه
 # ==========================================
+def load_api_keys():
+    """خواندن و بررسی کلیدها از تنظیمات"""
+    raw_keys = os.environ.get("GEMINI_API_KEYS", "")
+    # تمیزکاری کلیدها (حذف فاصله و خط جدید)
+    keys_list = [k.strip() for k in raw_keys.split(',') if k.strip()]
+    if keys_list:
+        logger.info(f"✅ تعداد {len(keys_list)} کلید API جیمینای با موفقیت شناسایی شد.")
+        # نمایش ۴ حرف آخر اولین کلید برای اطمینان (بدون لو رفتن کلید)
+        first_key_preview = keys_list[0][-4:] if len(keys_list[0]) > 4 else "****"
+        logger.info(f"ℹ️ نمونه کلید اول: ...{first_key_preview}")
+    else:
+        logger.error("❌ هیچ کلید API یافت نشد!")
+        logger.warning("⚠️ لطفاً مطمئن شوید در بخش Settings > Secrets متغیر GEMINI_API_KEYS را مقداردهی کرده‌اید.")
+    return keys_list
+# بارگذاری اولیه برای نمایش در لاگ
+GLOBAL_KEYS = load_api_keys()
 # تنظیمات مسیرها
 UPLOAD_FOLDER = 'uploads'
     این تابع کلیدها را مدیریت می‌کند.
     اگر یک کلید خطا داد، سراغ بعدی می‌رود.
     """
+    # خواندن مجدد کلیدها برای اطمینان
+    keys_list = load_api_keys()
     if not keys_list:
+        raise Exception("هیچ کلید API در سیستم ثبت نشده است. لطفاً تنظیمات Secret را بررسی کنید.")
     # مخلوط کردن کلیدها برای انتخاب تصادفی
     random.shuffle(keys_list)
     last_exception = None
+    for i, api_key in enumerate(keys_list):
         try:
+            logger.info(f"🔄 تلاش با کلید شماره {i+1} (انتهای کلید: ...{api_key[-4:]})")
             genai.configure(api_key=api_key)
             model = genai.GenerativeModel('gemini-2.5-flash')
             # آپلود فایل برای جمینای
+            logger.info("📤 در حال آپلود فایل صوتی به سرور گوگل...")
             uploaded_file = genai.upload_file(audio_file_path)
             # انتظار برای پردازش فایل
             if uploaded_file.state.name == "FAILED":
                 raise Exception("Google failed to process audio file.")
+            logger.info("🤖 فایل پردازش شد. در حال ارسال درخواست به جمینای...")
             # تولید محتوا
             response = model.generate_content(
                 [prompt, uploaded_file],
                 generation_config={"response_mime_type": "application/json"}
             )
+            # پاک کردن فایل از سرور گوگل
             try:
                 genai.delete_file(uploaded_file.name)
             except:
                 pass
+            logger.info("✅ پاسخ با موفقیت از جمینای دریافت شد.")
             return json.loads(response.text)
         except Exception as e:
+            logger.error(f"❌ خطا با کلید شماره {i+1}: {e}")
             last_exception = e
             # حلقه ادامه می‌یابد و سراغ کلید بعدی می‌رود
             continue
     # اگر از حلقه خارج شد یعنی همه کلیدها خطا داده‌اند
+    logger.critical("⛔ تمام کلیدهای API با خطا مواجه شدند.")
+    raise Exception(f"تمام کلیدهای API ناموفق بودند. آخرین خطا: {str(last_exception)}")
 async def generate_audio_async(session, text, speaker, index):
     """تولید صدا به صورت غیرهمزمان از API پادکست"""
                 with open(path, 'wb') as f:
                     f.write(audio_data)
                 return {"index": index, "status": "success", "file": filename}
+            else:
+                logger.error(f"Podcast API Error: {resp.status}")
     except Exception as e:
+        logger.error(f"Error gen audio {index}: {e}")
     return {"index": index, "status": "failed"}
 async def batch_generate_audio(segments):
 @app.route('/api/analyze', methods=['POST'])
 def analyze_video():
     youtube_url = request.form.get('youtube_url')
     video_file = request.files.get('video_file')
     target_lang = request.form.get('language', 'Persian')
     try:
         # 1. دریافت ویدیو
         if youtube_url:
+            logger.info(f"📥 دانلود ویدیو از یوتیوب: {youtube_url}")
             video_path = download_youtube(youtube_url)
         elif video_file:
+            logger.info("📥 دریافت فایل آپلودی...")
             filename = secure_filename(f"{uuid.uuid4()}_{video_file.filename}")
             video_path = os.path.join(UPLOAD_FOLDER, filename)
             video_file.save(video_path)
             return jsonify({"error": "No video provided"}), 400
         # 2. استخراج صدا
+        logger.info("🎵 در حال استخراج صدا از ویدیو...")
         audio_path = extract_audio(video_path)
+        # 3. ارسال به Gemini
         prompt = f"""
         You are a Dubbing Director.
         {CAST_PROMPT}
         ]
         """
         script = generate_content_with_retry(prompt, audio_path)
+        # 4. تولید صدای اولیه به صورت همزمان
+        logger.info(f"🎙️ شروع تولید صدا برای {len(script)} قطعه...")
         results = asyncio.run(batch_generate_audio(script))
         for res_item in results:
             idx = res_item['index']
             if res_item['status'] == 'success':
                 script[idx]['audio_file'] = res_item['file']
             else:
                 script[idx]['audio_file'] = None
+        logger.info("✅ تحلیل و تولید اولیه تمام شد.")
         return jsonify({
             "video_filename": os.path.basename(video_path),
             "script": script
         })
     except Exception as e:
+        logger.error(f"❌ خطای کلی سیستم: {str(e)}")
         return jsonify({"error": str(e)}), 500
 @app.route('/api/regenerate_segment', methods=['POST'])
     speaker = data.get('speaker_id')
     try:
         resp = requests.post(PODCAST_API_URL, json={"text": text, "speaker": speaker, "temperature": 0.9})
         if resp.status_code == 200:
             filename = f"seg_{uuid.uuid4()}.wav"
     if not os.path.exists(video_path): return jsonify({"error": "Video not found"}), 404
     try:
+        logger.info("🎬 شروع رندر نهایی ویدیو...")
         video_duration = get_video_duration(video_path)
         final_audio = AudioSegment.silent(duration=int(video_duration * 1000))
             seg_path = os.path.join(TEMP_AUDIO_FOLDER, seg['audio_file'])
             if not os.path.exists(seg_path): continue
             audio = AudioSegment.from_file(seg_path)
             target_dur_ms = (seg['end'] - seg['start']) * 1000
             current_dur_ms = len(audio)
                     if os.path.exists(temp_out):
                         audio = AudioSegment.from_file(temp_out)
             start_ms = int(seg['start'] * 1000)
             final_audio = final_audio.overlay(audio, position=start_ms)
         final_mix_path = os.path.join(UPLOAD_FOLDER, f"mix_{uuid.uuid4()}.wav")
         final_audio.export(final_mix_path, format="wav")
         final_video_path = os.path.join(UPLOAD_FOLDER, f"dubbed_{uuid.uuid4()}.mp4")
         cmd = [
         ]
         subprocess.run(cmd, stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)
+        logger.info("✅ رندر نهایی با موفقیت انجام شد.")
         return jsonify({"download_url": f"/uploads/{os.path.basename(final_video_path)}"})
     except Exception as e:
+        logger.error(f"❌ خطا در رندر نهایی: {str(e)}")
         return jsonify({"error": str(e)}), 500
 if __name__ == '__main__':