TeleChars-AI-API3

Running

MarcosFRGames commited on Dec 2, 2025

Commit

24de8e1

verified ·

1 Parent(s): d1e4da4

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,7 +9,6 @@ import tempfile
 app = Flask(__name__)
 logging.basicConfig(level=logging.INFO)
-# CONFIGURACIÓN DE TOKENS
 MAX_CONTEXT_TOKENS = 1024 * 8
 MAX_GENERATION_TOKENS = 1024 * 4
@@ -236,6 +235,10 @@ def chat_completions():
         # Aplicar límite de tokens si no se especifica
         if 'max_tokens' not in kwargs:
             kwargs['max_tokens'] = MAX_GENERATION_TOKENS
         result = llm_manager.chat_completion(model_name, messages, **kwargs)

 app = Flask(__name__)
 logging.basicConfig(level=logging.INFO)
 MAX_CONTEXT_TOKENS = 1024 * 8
 MAX_GENERATION_TOKENS = 1024 * 4
         # Aplicar límite de tokens si no se especifica
         if 'max_tokens' not in kwargs:
             kwargs['max_tokens'] = MAX_GENERATION_TOKENS
+        else:
+            # Validar que max_tokens no exceda el máximo permitido
+            if kwargs['max_tokens'] > MAX_GENERATION_TOKENS:
+                kwargs['max_tokens'] = MAX_GENERATION_TOKENS
         result = llm_manager.chat_completion(model_name, messages, **kwargs)