Spaces:

Opera8
/

Chat

Paused

App Files Files Community

Sada10 commited on Nov 26, 2025

Commit

b53a67a

unverified ·

1 Parent(s): 63617fd

Update app.py

Browse files

Files changed (1) hide show

app.py +103 -117

app.py CHANGED Viewed

@@ -6,11 +6,12 @@ import logging
 import threading
 import base64
 import io
-from flask import Flask, render_template, request, Response
 import requests
 import docx
-# ================== بخش تنظیمات لاگ‌نویسی (بدون تغییر) ==================
 class NoGrpcFilter(logging.Filter):
     def filter(self, record):
@@ -35,14 +36,14 @@ def setup_logging():
 setup_logging()
 app = Flask(__name__)
-# ================== بخش پیکربندی Gemini (با تغییر) ==================
 GEMINI_MODEL_NAME = "gemini-2.5-flash"
 ALL_KEYS_STR = os.environ.get("ALL_GEMINI_API_KEYS", "")
 GEMINI_API_KEYS = [key.strip() for key in ALL_KEYS_STR.split(',') if key.strip()]
 if not GEMINI_API_KEYS:
-    logging.critical("هشدار: هیچ کلید API برای Gemini در Secrets تنظیم نشده است! (ALL_GEMINI_API_KEYS)")
 key_index_counter = 0
 key_lock = threading.Lock()
@@ -57,15 +58,13 @@ def get_next_key_with_index():
         key_index_counter = (key_index_counter + 1) % len(GEMINI_API_KEYS)
         return key, current_index
-# *** START: OPTIMIZED TIMEOUT SETTINGS ***
-# مهلت زمانی برای برقراری اتصال اولیه با سرور گوگل (اگر اینترنت قطع باشد یا سرور دان باشد سریع سوئیچ میکند)
-STREAM_CONNECT_TIMEOUT = 10
-# مهلت زمانی برای انتظار پردازش و دریافت پاسخ.
-# برای فایل‌ها بسیار مهم است که این عدد بالا باشد (مثلا 100 ثانیه) تا وسط پردازش فایل قطع نکند.
-STREAM_READ_TIMEOUT = 100
-# *** END: OPTIMIZED TIMEOUT SETTINGS ***
-# ================== پایان بخش پیکربندی ====================
 @app.route('/')
 def index():
@@ -74,7 +73,8 @@ def index():
 @app.route('/chat', methods=['POST'])
 def chat():
     if not GEMINI_API_KEYS:
-        error_payload = {"type": "error", "message": "خطای سرور: هیچ کلید API پیکربندی نشده است."}
         return Response(f"data: {json.dumps(error_payload)}\n\n", status=500, mimetype='text/event-stream')
     data = request.json
@@ -82,7 +82,7 @@ def chat():
     show_thoughts = data.get("show_thoughts", False)
-    # بخش پردازش پیام‌ها و فایل DOCX
     gemini_messages = []
     for msg in data.get("messages", []):
         role = "model" if msg.get("role") == "assistant" else msg.get("role")
@@ -94,22 +94,16 @@ def chat():
             if part.get("base64Data") and part.get("mimeType"):
                 mime_type = part["mimeType"]
                 if mime_type == "application/vnd.openxmlformats-officedocument.wordprocessingml.document":
                     try:
                         decoded_data = base64.b64decode(part["base64Data"])
                         file_stream = io.BytesIO(decoded_data)
                         document = docx.Document(file_stream)
                         full_text = "\n".join([para.text for para in document.paragraphs])
-                        final_text_part = f"کاربر یک فایل Word آپلود کرد. محتوای متنی آن به شرح زیر است:\n\n---\n\n{full_text}\n\n---"
                         processed_parts.append({"text": final_text_part})
-                        logging.info("فایل DOCX با موفقیت پردازش و متن آن استخراج شد.")
-                    except Exception as e:
-                        logging.error(f"خطا در پردازش فایل DOCX: {e}")
-                        processed_parts.append({"text": "[خطا: امکان پردازش فایل Word وجود نداشت.]"})
                 else:
                     processed_parts.append({"inline_data": {"mime_type": part["mimeType"], "data": part["base64Data"]}})
@@ -122,17 +116,20 @@ def chat():
     if not any(msg['role'] == 'user' for msg in gemini_messages):
         return Response("data: [DONE]\n\n", mimetype='text/event-stream')
     def stream_response():
-        last_error = None
-        # تلاش برای همه کلیدها تا زمانی که یکی جواب دهد
-        # ما یک کپی از لیست کلیدها میگیریم تا مطمئن شویم حلقه به اندازه تعداد کلیدها اجرا میشود
-        attempts = len(GEMINI_API_KEYS)
-        for i in range(attempts):
             try:
                 api_key, key_index = get_next_key_with_index()
-                logging.info(f"تلاش {i+1} از {attempts}: ارسال درخواست با کلید شماره {key_index + 1}...")
                 api_endpoint = f"https://generativelanguage.googleapis.com/v1beta/models/{GEMINI_MODEL_NAME}:streamGenerateContent?key={api_key}&alt=sse"
                 payload = {
@@ -145,100 +142,89 @@ def chat():
                 }
                 if show_thoughts:
-                    payload["generationConfig"]["thinking_config"] = {
-                        "include_thoughts": True
-                    }
-                # استفاده از تنظیمات Timeout بهینه شده
-                # connect: زمان اتصال به سرور (سریع)
-                # read: زمان انتظار برای پردازش فایل و پاسخ (طولانی)
-                with requests.post(api_endpoint, json=payload, stream=True, timeout=(STREAM_CONNECT_TIMEOUT, STREAM_READ_TIMEOUT)) as response:
-                    # بررسی خطاهای HTTP
-                    if response.status_code != 200:
-                        logging.warning(f"خطای سرور با کلید {key_index + 1}: کد {response.status_code} - متن: {response.text}")
-                        # اگر محدودیت درخواست یا خطای سرور بود، برو کلید بعدی
-                        if response.status_code in [429, 500, 502, 503, 504]:
-                            last_error = f"HTTP {response.status_code}"
-                            continue # پرش سریع به کلید بعدی
-                        elif response.status_code == 403:
-                            last_error = "Invalid API Key"
-                            continue # پرش سریع
-                        else:
-                            response.raise_for_status() # برای سایر خطاها
-                    logging.info(f"اتصال با کلید شماره {key_index + 1} برقرار شد. در حال دریافت داده...")
-                    # اگر به اینجا رسیدیم یعنی اتصال موفق بوده و استریم شروع شده
-                    # حالا داده‌ها را به کلاینت می‌فرستیم
-                    has_sent_data = False
-                    for line in response.iter_lines():
-                        if line:
-                            decoded_line = line.decode('utf-8')
-                            if decoded_line.startswith('data: '):
-                                try:
-                                    chunk_data = json.loads(decoded_line[6:])
-                                    parts = chunk_data.get("candidates", [{}])[0].get("content", {}).get("parts", [])
-                                    for part in parts:
-                                        if "text" not in part or not part["text"]:
-                                            continue
-                                        has_sent_data = True
-                                        is_a_thought = part.get("thought") is True
-                                        if show_thoughts and is_a_thought:
-                                            thought_payload = {"type": "thought", "content": part["text"]}
-                                            yield f"data: {json.dumps(thought_payload)}\n\n"
-                                        elif not is_a_thought:
-                                            sse_payload = {"choices": [{"delta": {"content": part["text"]}}]}
-                                            yield f"data: {json.dumps(sse_payload)}\n\n"
-                                except (json.JSONDecodeError, IndexError, KeyError):
-                                    continue
-                    # اگر حلقه تمام شد و دیتایی ارسال شد، یعنی موفقیت آمیز بوده
-                    if has_sent_data:
-                        logging.info(f"پاسخ کامل با کلید {key_index + 1} ارسال شد.")
-                        return # خروج از کل تابع و پایان کار
-                    else:
-                        # اگر هیچ دیتایی نیامد اما کد 200 بود (مثلا پاسخ خالی)، باز هم موفقیت حساب میشه
-                        return
-            except requests.exceptions.ConnectTimeout:
-                logging.warning(f"Timeout در اتصال با کلید {key_index + 1}. تلاش فوری با کلید بعدی...")
-                last_error = "Connection Timeout"
-                continue # تلاش با کلید بعدی
-            except requests.exceptions.ReadTimeout:
-                # اگر ReadTimeout رخ داد یعنی گوگل خیلی طولش داده، اما معمولا با 100 ثانیه رخ نمیده.
-                # اگر رخ داد یعنی سرور پاسخگو نیست، پس کلید بعدی.
-                logging.warning(f"ReadTimeout (عدم پاسخگویی طولانی) با کلید {key_index + 1}. تلاش با کلید بعدی...")
-                last_error = "Read Timeout"
-                continue
-            except requests.exceptions.ConnectionError:
-                 logging.warning(f"خطای شبکه (ConnectionError) با کلید {key_index + 1}. تلاش با کلید بعدی...")
-                 last_error = "Network Error"
-                 continue
             except Exception as e:
-                logging.error(f"خطای پیش‌بینی نشده با کلید {key_index + 1}: {e}")
-                last_error = str(e)
-                # برای خطاهای ناشناخته هم به کلید بعدی شانس میدهیم
-                continue
-        # اگر حلقه تمام شد و هیچ کلیدی موفق نشد:
-        error_message = "متاسفانه سرور پاسخگو نیست. لطفا دقایقی دیگر تلاش کنید."
-        if last_error:
-            logging.critical(f"تمام تلاش‌ها ناموفق بود. آخرین خطا: {last_error}")
-        error_payload = {"type": "error", "message": error_message}
-        yield f"data: {json.dumps(error_payload)}\n\n"
     return Response(stream_response(), mimetype='text/event-stream')
 if __name__ == '__main__':
-    if GEMINI_API_KEYS:
-        logging.info(f"سیستم شروع به کار کرد. تعداد {len(GEMINI_API_KEYS)} کلید شناسایی شد.")
     app.run(debug=True, host='0.0.0.0', port=os.environ.get("PORT", 7860))
 # --- END OF FILE app.py ---

 import threading
 import base64
 import io
+import time
+from flask import Flask, render_template, request, Response, stream_with_context
 import requests
 import docx
+# ================== بخش تنظیمات لاگ‌نویسی ==================
 class NoGrpcFilter(logging.Filter):
     def filter(self, record):
 setup_logging()
 app = Flask(__name__)
+# ================== بخش پیکربندی Gemini ==================
 GEMINI_MODEL_NAME = "gemini-2.5-flash"
 ALL_KEYS_STR = os.environ.get("ALL_GEMINI_API_KEYS", "")
 GEMINI_API_KEYS = [key.strip() for key in ALL_KEYS_STR.split(',') if key.strip()]
 if not GEMINI_API_KEYS:
+    logging.critical("هشدار: هیچ کلید API برای Gemini تنظیم نشده است!")
 key_index_counter = 0
 key_lock = threading.Lock()
         key_index_counter = (key_index_counter + 1) % len(GEMINI_API_KEYS)
         return key, current_index
+# تنظیمات زمانی حیاتی
+# اتصال اولیه: سریع قطع کن اگر وصل نشد (5 ثانیه)
+# خواندن دیتا: صبر زیاد برای پردازش فایل‌ها (120 ثانیه)
+STREAM_CONNECT_TIMEOUT = 5
+STREAM_READ_TIMEOUT = 120
+# ================== پایان پیکربندی ====================
 @app.route('/')
 def index():
 @app.route('/chat', methods=['POST'])
 def chat():
     if not GEMINI_API_KEYS:
+        # اگر هیچ کلیدی کلا وجود نداشت، چاره‌ای جز خطا نیست
+        error_payload = {"type": "error", "message": "خطای تنظیمات سرور: کلید API یافت نشد."}
         return Response(f"data: {json.dumps(error_payload)}\n\n", status=500, mimetype='text/event-stream')
     data = request.json
     show_thoughts = data.get("show_thoughts", False)
+    # --- بخش پردازش پیام‌ها و فایل (بدون تغییر) ---
     gemini_messages = []
     for msg in data.get("messages", []):
         role = "model" if msg.get("role") == "assistant" else msg.get("role")
             if part.get("base64Data") and part.get("mimeType"):
                 mime_type = part["mimeType"]
                 if mime_type == "application/vnd.openxmlformats-officedocument.wordprocessingml.document":
                     try:
                         decoded_data = base64.b64decode(part["base64Data"])
                         file_stream = io.BytesIO(decoded_data)
                         document = docx.Document(file_stream)
                         full_text = "\n".join([para.text for para in document.paragraphs])
+                        final_text_part = f"کاربر یک فایل Word آپلود کرد. محتوای متنی آن:\n\n---\n\n{full_text}\n\n---"
                         processed_parts.append({"text": final_text_part})
+                    except Exception:
+                        processed_parts.append({"text": "[خطا در خواندن فایل Word]"})
                 else:
                     processed_parts.append({"inline_data": {"mime_type": part["mimeType"], "data": part["base64Data"]}})
     if not any(msg['role'] == 'user' for msg in gemini_messages):
         return Response("data: [DONE]\n\n", mimetype='text/event-stream')
+    @stream_with_context
     def stream_response():
+        # تعداد تلاش‌ها برابر با تعداد کلیدهاست (یک دور کامل روی همه کلیدها)
+        max_attempts = len(GEMINI_API_KEYS)
+        # اگر تعداد کلیدها کم بود، حداقل 3 بار تلاش کن (با تکرار کلیدها)
+        if max_attempts < 3:
+            max_attempts = 3
+        for attempt in range(max_attempts):
             try:
+                # انتخاب کلید
                 api_key, key_index = get_next_key_with_index()
+                # ساخت درخواست
                 api_endpoint = f"https://generativelanguage.googleapis.com/v1beta/models/{GEMINI_MODEL_NAME}:streamGenerateContent?key={api_key}&alt=sse"
                 payload = {
                 }
                 if show_thoughts:
+                    payload["generationConfig"]["thinking_config"] = {"include_thoughts": True}
+                logging.info(f"تلاش {attempt+1}: استفاده از کلید {key_index + 1}...")
+                # ارسال درخواست به گوگل
+                # stream=True یعنی پاسخ را تکه تکه بگیر
+                # timeout=(Connect, Read)
+                response = requests.post(
+                    api_endpoint,
+                    json=payload,
+                    stream=True,
+                    timeout=(STREAM_CONNECT_TIMEOUT, STREAM_READ_TIMEOUT)
+                )
+                # اگر وضعیت 200 نبود، یعنی این کلید مشکل دارد.
+                # Exception ایجاد میکنیم تا برود به بخش except و کلید بعدی را تست کند
+                if response.status_code != 200:
+                    logging.warning(f"کلید {key_index + 1} خطا داد: {response.status_code}")
+                    response.close()
+                    continue # برو به کلید بعدی
+                # ترفند اصلی: ساخت Iterator
+                # ما سعی میکنیم "اولین خط" پاسخ را بگیریم.
+                # اگر اینجا خطا بدهد یعنی هنوز چیزی به کاربر نفرستادیم، پس میتونیم سوییچ کنیم.
+                line_iterator = response.iter_lines()
+                # اینجا با yield from ما عملاً استریم را به کلاینت وصل میکنیم
+                # اگر وسط استریم قطع شود کاری نمیتوان کرد، اما مهم شروعش است.
+                data_received = False
+                for line in line_iterator:
+                    if line:
+                        decoded_line = line.decode('utf-8')
+                        if decoded_line.startswith('data: '):
+                            try:
+                                chunk_data = json.loads(decoded_line[6:])
+                                parts = chunk_data.get("candidates", [{}])[0].get("content", {}).get("parts", [])
+                                for part in parts:
+                                    if "text" not in part or not part["text"]:
+                                        continue
+                                    # به محض اینکه اولین داده سالم رسید، یعنی اتصال موفق بوده
+                                    data_received = True
+                                    is_thought = part.get("thought") is True
+                                    if show_thoughts and is_thought:
+                                        yield f"data: {json.dumps({'type': 'thought', 'content': part['text']})}\n\n"
+                                    elif not is_thought:
+                                        yield f"data: {json.dumps({'choices': [{'delta': {'content': part['text']}}]})}\n\n"
+                            except Exception:
+                                continue
+                # اگر حلقه تمام شد و دیتایی ارسال شد، کار تمام است
+                if data_received:
+                    logging.info(f"پاسخ با موفقیت با کلید {key_index + 1} تکمیل شد.")
+                    return
+                # اگر ریسپانس 200 بود ولی دیتایی نداشت (خیلی بعید)، باز هم یعنی موفق بوده
+                # اما اگر خالی بودنش به خاطر خطا بود، شاید بهتر باشد ادامه دهیم.
+                # اینجا فرض را بر اتمام موفق میگذاریم.
+                return
             except Exception as e:
+                # هر خطایی رخ داد (تایم اوت، شبکه، قطعی، فیلتر)
+                # لاگ کن و برو دور بعدی حلقه (کلید بعدی)
+                logging.error(f"خطا در کلید {key_index + 1}: {e} -- تلاش مجدد با کلید دیگر...")
+                time.sleep(0.5) # مکث کوتاه برای جلوگیری از اسپم سریع
+                continue
+        # === اگر از حلقه خارج شدیم یعنی همه کلیدها تست شدند و هیچکدام کار نکردند ===
+        # فقط در این حالت نهایی مجبوریم یک پیام به کاربر بدهیم که بفهمد تمام شده
+        # اما سعی میکنیم پیام سیستمی نباشد.
+        # یا میتوانیم یک پیام [DONE] بفرستیم که انگار تمام شده (بدون خطا)
+        logging.critical("تمام کلیدها شکست خوردند.")
+        # اینجا یک پیام خطای نرم میفرستیم که کاربر فکر نکند سرور خراب است
+        final_err = {"type": "error", "message": "شبکه شلوغ است. لطفا مجددا دکمه ارسال را بزنید."}
+        yield f"data: {json.dumps(final_err)}\n\n"
     return Response(stream_response(), mimetype='text/event-stream')
 if __name__ == '__main__':
     app.run(debug=True, host='0.0.0.0', port=os.environ.get("PORT", 7860))
 # --- END OF FILE app.py ---