Spaces:

AniseF
/

AI-ClassicsQueryTool_2

Sleeping

App Files Files Community

AniseF commited on Feb 22

Commit

64183b3

verified ·

1 Parent(s): 44298e7

Update utils.py

Browse files

Files changed (1) hide show

utils.py +36 -24

utils.py CHANGED Viewed

@@ -1,39 +1,51 @@
 import os
-import openai
-# Definição das listas de prioridade
 MODEL_PRIORITY_A = ["anthropic/claude-3.5-sonnet", "openai/gpt-4o", "google/gemini-pro-1.5"]
 MODEL_PRIORITY_B = ["google/gemini-flash-1.5", "mistralai/mistral-7b-instruct", "cohere/command-r"]
 def call_openrouter(prompt, mode):
     api_key = os.getenv("OPENROUTER_API_KEY")
-    # Inicializa o cliente OpenRouter (padrão OpenAI)
-    client = openai.OpenAI(
-        base_url="https://openrouter.ai/api/v1",
-        api_key=api_key
-    )
-    # Seleciona a estratégia
-    chain = MODEL_PRIORITY_A if mode == "Alta Precisão (Filológico)" else MODEL_PRIORITY_B
     for model_name in chain:
         try:
-            # A chamada para a IA com os parâmetros de fôlego e precisão
-            completion = client.chat.completions.create(
-                model=model_name,
-                messages=[{"role": "user", "content": prompt}],
-                max_tokens=6000,    # Fôlego suficiente para não cortar
-                temperature=0.1,    # Baixa temperatura = mais foco e menos erro de idioma
-                timeout=300         # 2 minutos de espera para análises profundas
-            )
-            # Se deu certo, retorna o texto e o nome do modelo usado
-            if completion.choices[0].message.content:
-                return completion.choices[0].message.content, model_name
         except Exception as e:
-            print(f"Erro no modelo {model_name}: {str(e)}")
-            continue # Se um falhar, tenta o próximo da lista
-    return "Lamento, todos os modelos falharam na análise. Verifique sua conexão ou saldo.", "Nenhum"

 import os
+import requests
+import time
+# Listas de prioridade baseadas no arquivo config do Thomas
 MODEL_PRIORITY_A = ["anthropic/claude-3.5-sonnet", "openai/gpt-4o", "google/gemini-pro-1.5"]
 MODEL_PRIORITY_B = ["google/gemini-flash-1.5", "mistralai/mistral-7b-instruct", "cohere/command-r"]
 def call_openrouter(prompt, mode):
+    """
+    Envia uma única pergunta por vez para evitar cortes (Estratégia Thomas).
+    """
     api_key = os.getenv("OPENROUTER_API_KEY")
+    url = "https://openrouter.ai/api/v1/chat/completions"
+    # Seleciona a lista de modelos conforme a estratégia escolhida
+    chain = MODEL_PRIORITY_A if mode == "Alta Precisão (Filológica)" else MODEL_PRIORITY_B
     for model_name in chain:
         try:
+            headers = {
+                "Authorization": f"Bearer {api_key}",
+                "Content-Type": "application/json"
+            }
+            payload = {
+                "model": model_name,
+                "messages": [
+                    {"role": "system", "content": "Você é um especialista em línguas clássicas. Responda APENAS em português, de forma clara e direta."},
+                    {"role": "user", "content": prompt}
+                ],
+                "temperature": 0.3, # Baixa temperatura para maior precisão filológica
+                "max_tokens": 1000  # 1000 tokens por pergunta é mais que suficiente para não cortar
+            }
+            # Timeout de 60s é seguro para uma única pergunta
+            response = requests.post(url, headers=headers, json=payload, timeout=60)
+            response.raise_for_status()
+            result = response.json()
+            content = result["choices"][0]["message"]["content"]
+            if content:
+                return content.strip(), model_name
         except Exception as e:
+            print(f"Falha no modelo {model_name}: {e}")
+            time.sleep(1) # Pequena pausa antes de tentar o próximo modelo da lista
+            continue
+    return "Falha ao processar esta pergunta. Verifique o saldo.", "Nenhum"