Spaces:

Marek4321
/

Prompt_Tester

Running

App Files Files Community

Marek4321 commited on Dec 15, 2025

Commit

bcb100b

verified ·

1 Parent(s): 9c7015e

Update api_handler.py

Browse files

Files changed (1) hide show

api_handler.py +36 -45

api_handler.py CHANGED Viewed

@@ -88,49 +88,16 @@ class APIHandler:
             print(f"Błąd pobierania modeli: {e}")
             return ["gpt-4o", "gpt-4", "gpt-3.5-turbo"]
-    def _get_model_parameters(self, model, temperature, max_tokens, top_p):
-        """
-        Przygotowuje parametry API dla danego modelu
-        Args:
-            model: Nazwa modelu
-            temperature: Temperatura (0.0-2.0)
-            max_tokens: Maksymalna długość odpowiedzi
-            top_p: Nucleus sampling parameter
-        Returns:
-            dict: Słownik z parametrami gotowymi do przekazania do API
-        """
-        # Modele o1 wymagają innych parametrów
-        is_o1_model = model.startswith('o1')
-        params = {
-            "model": model,
-            "messages": []  # Będzie wypełnione w generate_response
-        }
-        if is_o1_model:
-            # Modele o1 używają max_completion_tokens zamiast max_tokens
-            # i nie akceptują temperature/top_p
-            params["max_completion_tokens"] = max_tokens
-        else:
-            # Standardowe modele (gpt-4, gpt-3.5, fine-tuned)
-            params["max_tokens"] = max_tokens
-            params["temperature"] = temperature
-            params["top_p"] = top_p
-        return params
     def generate_response(self, prompt, model="gpt-4o", temperature=0.1, max_tokens=2000, top_p=1.0):
         """
-        Generuje odpowiedź z OpenAI API
         Args:
             prompt: Tekst promptu systemowego
             model: Model OpenAI
-            temperature: Temperatura (0.0-2.0) - ignorowane dla modeli o1
             max_tokens: Maksymalna długość odpowiedzi
-            top_p: Nucleus sampling parameter - ignorowane dla modeli o1
         Returns:
             str: Wygenerowana odpowiedź lub komunikat błędu
@@ -138,21 +105,45 @@ class APIHandler:
         if not self.client:
             return "ERROR: Brak połączenia z API (nieprawidłowy klucz)"
-        try:
-            # Przygotuj parametry dostosowane do modelu
-            params = self._get_model_parameters(model, temperature, max_tokens, top_p)
-            # Dodaj wiadomości
-            params["messages"] = [
                 {"role": "system", "content": prompt},
                 {"role": "user", "content": "Please provide your response based on the system prompt."}
-            ]
-            # Wywołaj API z odpowiednimi parametrami
-            response = self.client.chat.completions.create(**params)
             return response.choices[0].message.content
         except Exception as e:
             error_msg = str(e)
             if "429" in error_msg:
                 return f"ERROR: Rate limit exceeded - poczekaj chwilę"
             elif "insufficient_quota" in error_msg:

             print(f"Błąd pobierania modeli: {e}")
             return ["gpt-4o", "gpt-4", "gpt-3.5-turbo"]
     def generate_response(self, prompt, model="gpt-4o", temperature=0.1, max_tokens=2000, top_p=1.0):
         """
+        Generuje odpowiedź z OpenAI API z automatycznym fallback dla nowych modeli
         Args:
             prompt: Tekst promptu systemowego
             model: Model OpenAI
+            temperature: Temperatura (0.0-2.0)
             max_tokens: Maksymalna długość odpowiedzi
+            top_p: Nucleus sampling parameter
         Returns:
             str: Wygenerowana odpowiedź lub komunikat błędu
         if not self.client:
             return "ERROR: Brak połączenia z API (nieprawidłowy klucz)"
+        # Przygotuj parametry API - najpierw spróbuj ze starym API (max_tokens)
+        api_params = {
+            "model": model,
+            "messages": [
                 {"role": "system", "content": prompt},
                 {"role": "user", "content": "Please provide your response based on the system prompt."}
+            ],
+            "temperature": temperature,
+            "max_tokens": max_tokens,  # Starsze modele (gpt-4, gpt-3.5, fine-tuned)
+            "top_p": top_p
+        }
+        try:
+            # Pierwsza próba: użyj max_tokens (kompatybilność ze starszymi modelami)
+            response = self.client.chat.completions.create(**api_params)
             return response.choices[0].message.content
         except Exception as e:
             error_msg = str(e)
+            # Automatyczny fallback: jeśli błąd dotyczy max_tokens, przełącz na max_completion_tokens
+            if "max_tokens" in error_msg and "max_completion_tokens" in error_msg:
+                try:
+                    # Usuń stary parametr i dodaj nowy
+                    api_params.pop("max_tokens")
+                    api_params["max_completion_tokens"] = max_tokens
+                    # Usuń również temperature i top_p (nowe modele ich nie akceptują)
+                    api_params.pop("temperature", None)
+                    api_params.pop("top_p", None)
+                    # Ponów zapytanie z nowymi parametrami
+                    response = self.client.chat.completions.create(**api_params)
+                    return response.choices[0].message.content
+                except Exception as retry_error:
+                    return f"ERROR: Retry failed: {str(retry_error)[:200]}"
+            # Standardowa obsługa błędów
             if "429" in error_msg:
                 return f"ERROR: Rate limit exceeded - poczekaj chwilę"
             elif "insufficient_quota" in error_msg: