Spaces:

TradaAI
/

Chatopus

Running

App Files Files Community

VietCat commited on Aug 23, 2025

Commit

1ca0b43

1 Parent(s): 9d94525

fix max token error

Browse files

Files changed (2) hide show

app/gemini_client.py +14 -2
app/llm.py +8 -2

app/gemini_client.py CHANGED Viewed

@@ -100,8 +100,20 @@ class GeminiClient:
                 if hasattr(response, 'usage_metadata'):
                     logger.info(f"[GEMINI][USAGE] Prompt Token Count: {response.usage_metadata.prompt_token_count} - Candidate Token Count: {response.usage_metadata.candidates_token_count} - Total Token Count: {response.usage_metadata.total_token_count}")
-                logger.info(f"[GEMINI][TEXT_RESPONSE] {_safe_truncate(response.text)}")
-                return response.text
                 # --- END: Cải tiến logic xử lý response ---
             except GeminiResponseError as e:
                 # Lỗi nội dung, không thể retry bằng cách đổi key. Propagate lên.

                 if hasattr(response, 'usage_metadata'):
                     logger.info(f"[GEMINI][USAGE] Prompt Token Count: {response.usage_metadata.prompt_token_count} - Candidate Token Count: {response.usage_metadata.candidates_token_count} - Total Token Count: {response.usage_metadata.total_token_count}")
+                # Bọc lại phần truy cập .text để bắt lỗi ValueError một cách an toàn nhất
+                try:
+                    logger.info(f"[GEMINI][TEXT_RESPONSE] {_safe_truncate(response.text)}")
+                    return response.text
+                except ValueError as ve:
+                    # Nếu truy cập .text thất bại dù các kiểm tra trước đó đã qua,
+                    # đây chắc chắn là lỗi logic (MAX_TOKENS/SAFETY).
+                    # Chuyển đổi nó thành GeminiResponseError để tầng trên xử lý đúng.
+                    usage_metadata = response.usage_metadata if hasattr(response, 'usage_metadata') else None
+                    raise GeminiResponseError(
+                        f"Gemini response has no valid content part. Original error: {ve}",
+                        finish_reason='STOP_NO_CONTENT',
+                        usage_metadata=usage_metadata
+                    ) from ve
                 # --- END: Cải tiến logic xử lý response ---
             except GeminiResponseError as e:
                 # Lỗi nội dung, không thể retry bằng cách đổi key. Propagate lên.

app/llm.py CHANGED Viewed

@@ -23,8 +23,14 @@ from .utils import (
 retry_on_llm_transient_error = retry(
     stop=stop_after_attempt(4), # 1 lần gọi gốc + 3 lần thử lại
     wait=wait_exponential(multiplier=5, min=10, max=60), # Chờ 10s, 20s, 40s
-    # Chỉ retry nếu exception KHÔNG PHẢI là GeminiResponseError (lỗi nội dung)
-    retry=lambda e: not isinstance(e, GeminiResponseError),
     before_sleep=lambda retry_state: logger.warning(
         f"[LLM][RETRY] LLM call failed with transient error, retrying... "
         f"Attempt: {retry_state.attempt_number}, Error: {retry_state.outcome.exception()}"

 retry_on_llm_transient_error = retry(
     stop=stop_after_attempt(4), # 1 lần gọi gốc + 3 lần thử lại
     wait=wait_exponential(multiplier=5, min=10, max=60), # Chờ 10s, 20s, 40s
+    # Sửa lỗi: Điều kiện retry phải rõ ràng và an toàn
+    # Chỉ retry nếu có exception, và exception đó không phải là GeminiResponseError.
+    retry=lambda retry_state: (
+        # Phải có exception mới xét đến retry
+        retry_state.outcome.failed and
+        # Exception đó không được là GeminiResponseError (lỗi logic)
+        not isinstance(retry_state.outcome.exception(), GeminiResponseError)
+    ),
     before_sleep=lambda retry_state: logger.warning(
         f"[LLM][RETRY] LLM call failed with transient error, retrying... "
         f"Attempt: {retry_state.attempt_number}, Error: {retry_state.outcome.exception()}"