Spaces:

elmerzole
/

llm-api-proxy

Paused

Mirrowel commited on Jul 9, 2025

Commit

c68b148

1 Parent(s): 5a4ba9e

fix(client): relocate model parameter conversion

Moved the `_convert_model_params` calls from the `acompletion` and `aembedding` dispatcher methods into their respective internal execution functions (`_execute_with_retry` and `_streaming_acompletion_with_retry`).

This streamlines the top-level dispatchers and ensures parameter conversion occurs within the context of the retry and streaming logic, improving consistency.

Files changed (1) hide show

src/rotator_library/client.py +3 -3

src/rotator_library/client.py CHANGED Viewed

@@ -196,7 +196,8 @@ class RotatingClient:
         keys_for_provider = self.api_keys[provider]
         tried_keys = set()
         last_exception = None
         while len(tried_keys) < len(keys_for_provider):
             current_key = None
             key_acquired = False
@@ -313,6 +314,7 @@ class RotatingClient:
         keys_for_provider = self.api_keys[provider]
         tried_keys = set()
         last_exception = None
         try:
             while len(tried_keys) < len(keys_for_provider):
                 current_key = None
@@ -471,7 +473,6 @@ class RotatingClient:
     def acompletion(self, request: Optional[Any] = None, **kwargs) -> Union[Any, AsyncGenerator[str, None]]:
         """Dispatcher for completion requests."""
-        kwargs = self._convert_model_params(**kwargs)
         if kwargs.get("stream"):
             return self._streaming_acompletion_with_retry(request, **kwargs)
         else:
@@ -479,7 +480,6 @@ class RotatingClient:
     def aembedding(self, request: Optional[Any] = None, **kwargs) -> Any:
         """Executes an embedding request with retry logic."""
-        kwargs = self._convert_model_params(**kwargs)
         return self._execute_with_retry(litellm.aembedding, request, **kwargs)
     def token_count(self, **kwargs) -> int:

         keys_for_provider = self.api_keys[provider]
         tried_keys = set()
         last_exception = None
+        kwargs = self._convert_model_params(**kwargs)
         while len(tried_keys) < len(keys_for_provider):
             current_key = None
             key_acquired = False
         keys_for_provider = self.api_keys[provider]
         tried_keys = set()
         last_exception = None
+        kwargs = self._convert_model_params(**kwargs)
         try:
             while len(tried_keys) < len(keys_for_provider):
                 current_key = None
     def acompletion(self, request: Optional[Any] = None, **kwargs) -> Union[Any, AsyncGenerator[str, None]]:
         """Dispatcher for completion requests."""
         if kwargs.get("stream"):
             return self._streaming_acompletion_with_retry(request, **kwargs)
         else:
     def aembedding(self, request: Optional[Any] = None, **kwargs) -> Any:
         """Executes an embedding request with retry logic."""
         return self._execute_with_retry(litellm.aembedding, request, **kwargs)
     def token_count(self, **kwargs) -> int: