Spaces:

TradaAI
/

Chatopus

Sleeping

VietCat commited on Jul 5, 2025

Commit

906da16

1 Parent(s): 44013a5

refactor request limiter

Files changed (2) hide show

app/gemini_client.py CHANGED Viewed

@@ -30,6 +30,16 @@ class GeminiClient:
         logger.info(f"[GEMINI] Created new model instance for key={key[:5]}...{key[-5:]} model={model}")
         return self._cached_model_instance
     def generate_text(self, prompt: str, **kwargs) -> str:
         last_error = None
         max_retries = 3
@@ -67,13 +77,11 @@ class GeminiClient:
                     if m:
                         retry_delay = int(m.group(1))
-                    # Log failure và trigger scan cho key/model mới
                     self.limit_manager.log_request(key, model, success=False, retry_delay=retry_delay)
-                    # Clear cache để force tạo model instance mới với key/model mới
-                    self._cached_model_instance = None
-                    self._cached_key = None
-                    self._cached_model = None
                     logger.warning(f"[GEMINI] Rate limit hit, will retry with new key/model (attempt {attempt + 1}/{max_retries})")
                     last_error = e

         logger.info(f"[GEMINI] Created new model instance for key={key[:5]}...{key[-5:]} model={model}")
         return self._cached_model_instance
+    def _clear_cache_if_needed(self, new_key: str, new_model: str):
+        """
+        Chỉ clear cache khi key/model thực sự thay đổi.
+        """
+        if (self._cached_key != new_key or self._cached_model != new_model):
+            logger.info(f"[GEMINI] Clearing cache due to key/model change: {self._cached_key}->{new_key}, {self._cached_model}->{new_model}")
+            self._cached_model_instance = None
+            self._cached_key = None
+            self._cached_model = None
     def generate_text(self, prompt: str, **kwargs) -> str:
         last_error = None
         max_retries = 3
                     if m:
                         retry_delay = int(m.group(1))
+                    # Log failure với key/model thực tế đang được sử dụng
                     self.limit_manager.log_request(key, model, success=False, retry_delay=retry_delay)
+                    # Chỉ clear cache nếu key/model thay đổi
+                    # Không clear cache ngay lập tức để tránh recreate không cần thiết
                     logger.warning(f"[GEMINI] Rate limit hit, will retry with new key/model (attempt {attempt + 1}/{max_retries})")
                     last_error = e

app/request_limit_manager.py CHANGED Viewed

@@ -120,11 +120,11 @@ class RequestLimitManager:
                 self.status[key][model]["status"] = "blocked"
                 self.status[key][model]["timestamp"] = now + (retry_delay or 60)
-                # Nếu current pair bị blocked, trigger scan cho pair mới
                 if key == self.current_key and model == self.current_model:
                     logger.warning(f"[LIMIT] Current pair blocked, will scan for new pair on next request")
-                    self.current_key = None
-                    self.current_model = None
     def iterate_key_model(self) -> Iterator[Tuple[str, str]]:
         """

                 self.status[key][model]["status"] = "blocked"
                 self.status[key][model]["timestamp"] = now + (retry_delay or 60)
+                # Chỉ clear current pair nếu chính xác là pair đang được sử dụng
+                # Không clear ngay lập tức để tránh trigger scan không cần thiết
                 if key == self.current_key and model == self.current_model:
                     logger.warning(f"[LIMIT] Current pair blocked, will scan for new pair on next request")
+                    # Không clear ngay lập tức, để get_current_key_model() tự xử lý
     def iterate_key_model(self) -> Iterator[Tuple[str, str]]:
         """