Spaces:

TradaAI
/

Chatopus

Sleeping

App Files Files Community

VietCat commited on Aug 25, 2025

Commit

0d5bd79

1 Parent(s): 844483c

fix max token error

Browse files

Files changed (1) hide show

app/gemini_client.py +20 -18

app/gemini_client.py CHANGED Viewed

@@ -87,41 +87,43 @@ class GeminiClient:
                 # --- START: Cải tiến logic xử lý response ---
                 # 1. Kiểm tra response có hợp lệ không
                 if not response.candidates:
-                    # Trường hợp bất thường, response không có candidate. Coi là lỗi tạm thời.
-                    raise ValueError("Gemini response is missing 'candidates' field.")
                 candidate = response.candidates[0]
                 finish_reason_name = getattr(getattr(candidate, 'finish_reason', None), 'name', 'UNKNOWN')
                 # Kiểm tra xem có nội dung thực sự không
-                has_content = bool(candidate.content and candidate.content.parts)
-                # 2. Phân loại lỗi: Lỗi logic (cần xử lý ở tầng nghiệp vụ)
-                # Lỗi xảy ra nếu: (A) lý do kết thúc không phải là STOP, HOẶC (B) lý do là STOP nhưng lại không có nội dung.
-                if finish_reason_name != "STOP" or not has_content:
                     usage_metadata = response.usage_metadata if hasattr(response, 'usage_metadata') else None
-                    if finish_reason_name == "STOP" and not has_content:
-                        error_message = "Gemini response finished with STOP but has no content parts."
-                    else:
-                        error_message = f"Gemini response finished with non-OK reason: {finish_reason_name}."
                     raise GeminiResponseError(
-                        error_message,
-                        finish_reason=finish_reason_name if finish_reason_name != "STOP" else "STOP_NO_CONTENT",
-                        usage_metadata=usage_metadata
                     )
-                # 3. Nếu không có lỗi logic, tiến hành lấy text
                 self.limit_manager.log_request(key, model, success=True)
                 if hasattr(response, 'usage_metadata'):
                     logger.info(f"[GEMINI][USAGE] Prompt Token Count: {response.usage_metadata.prompt_token_count} - Candidate Token Count: {response.usage_metadata.candidates_token_count} - Total Token Count: {response.usage_metadata.total_token_count}")
-                # Bọc lại phần truy cập .text để bắt lỗi ValueError một cách an toàn nhất
                 try:
                     logger.info(f"[GEMINI][TEXT_RESPONSE] {_safe_truncate(response.text)}")
                     return response.text
                 except ValueError as ve:
-                    # Nếu truy cập .text thất bại dù các kiểm tra trước đó đã qua,
-                    # đây chắc chắn là lỗi logic (MAX_TOKENS/SAFETY).
-                    # Chuyển đổi nó thành GeminiResponseError để tầng trên xử lý đúng.
                     usage_metadata = response.usage_metadata if hasattr(response, 'usage_metadata') else None
                     raise GeminiResponseError(
                         f"Gemini response has no valid content part. Original error: {ve}",

                 # --- START: Cải tiến logic xử lý response ---
                 # 1. Kiểm tra response có hợp lệ không
                 if not response.candidates:
+                    # Lỗi này nên được coi là lỗi tạm thời, thử lại với key/model khác
+                    raise ValueError("Gemini response is missing 'candidates' field. Retrying...")
                 candidate = response.candidates[0]
                 finish_reason_name = getattr(getattr(candidate, 'finish_reason', None), 'name', 'UNKNOWN')
                 # Kiểm tra xem có nội dung thực sự không
+                # Sửa: Dùng getattr để tránh AttributeError nếu 'parts' không tồn tại
+                has_content = bool(candidate.content and getattr(candidate.content, 'parts', None))
+                # 2. Phân loại lỗi và xử lý
+                # Case 1: Lỗi nội dung không thể thử lại (SAFETY, MAX_TOKENS, etc.)
+                if finish_reason_name != "STOP":
                     usage_metadata = response.usage_metadata if hasattr(response, 'usage_metadata') else None
+                    error_message = f"Gemini response finished with non-OK reason: {finish_reason_name}."
                     raise GeminiResponseError(
+                        error_message, finish_reason=finish_reason_name, usage_metadata=usage_metadata
                     )
+                # Case 2: Lỗi có thể thử lại (STOP nhưng không có nội dung)
+                if not has_content: # Tại đây, ta biết chắc chắn finish_reason_name là "STOP"
+                    usage_metadata = response.usage_metadata if hasattr(response, 'usage_metadata') else None
+                    last_error = GeminiResponseError("Gemini response finished with STOP but has no content parts.", finish_reason='STOP_NO_CONTENT', usage_metadata=usage_metadata)
+                    logger.warning(f"[GEMINI] Model returned STOP with no content. Retrying with another key/model... (Attempt {attempt + 1}/{max_retries})")
+                    self.limit_manager.log_request(key, model, success=False, retry_delay=5)
+                    continue # Thử lại vòng lặp với key/model mới
+                # Case 3: Thành công (STOP và có nội dung)
                 self.limit_manager.log_request(key, model, success=True)
                 if hasattr(response, 'usage_metadata'):
                     logger.info(f"[GEMINI][USAGE] Prompt Token Count: {response.usage_metadata.prompt_token_count} - Candidate Token Count: {response.usage_metadata.candidates_token_count} - Total Token Count: {response.usage_metadata.total_token_count}")
                 try:
                     logger.info(f"[GEMINI][TEXT_RESPONSE] {_safe_truncate(response.text)}")
                     return response.text
                 except ValueError as ve:
+                    # Safety net: Nếu truy cập .text thất bại dù các kiểm tra trước đó đã qua,
+                    # coi như đây là lỗi STOP_NO_CONTENT và ném ra để tầng trên xử lý.
                     usage_metadata = response.usage_metadata if hasattr(response, 'usage_metadata') else None
                     raise GeminiResponseError(
                         f"Gemini response has no valid content part. Original error: {ve}",