Spaces:

EduuGomes
/

CachoeiraBot

Sleeping

App Files Files Community

EduuGomes commited on May 31

Commit

a802c01

verified ·

1 Parent(s): 3f5723d

Update app.py

Browse files

Files changed (1) hide show

app.py +30 -24

app.py CHANGED Viewed

@@ -1,39 +1,44 @@
 import os
 import gradio as gr
-from openai import OpenAI
-# Verifica e obtém a chave da API OpenRouter
 API_KEY = os.environ.get("OPENROUTER_API_KEY")
 if not API_KEY:
     raise ValueError("Defina a variável de ambiente OPENROUTER_API_KEY com sua chave válida.")
-# Cria o cliente OpenAI para OpenRouter com o endpoint correto
-client = OpenAI(api_key=API_KEY, base_url="https://openrouter.ai/v1")
-# Modelos a serem usados (confirme se estão disponíveis no OpenRouter)
 MODEL_1 = "meta-llama/llama-3.2-1b-instruct:free"
 MODEL_2 = "mistralai/mistral-7b-instruct:free"
 MODEL_3 = "google/gemma-2-9b-it:free"  # LLM julgadora
 def call_model(model_name, messages, max_tokens=512, temperature=0.7, top_p=0.95):
     try:
-        response = client.chat.completions.create(
-            model=model_name,
-            messages=messages,
-            max_tokens=max_tokens,
-            temperature=temperature,
-            top_p=top_p
-        )
-        return response.choices[0].message.content.strip()
     except Exception as e:
-        # Retorna erro para interface e também imprime no terminal para debug
-        error_msg = f"Erro na chamada ao modelo {model_name}: {str(e)}"
-        print(error_msg)
-        return error_msg
 def generate_and_judge(user_input):
     if not user_input.strip():
-        return "Por favor, insira uma pergunta válida.", "", ""
     system_prompt = "Você é um assistente útil e objetivo."
@@ -42,11 +47,11 @@ def generate_and_judge(user_input):
         {"role": "user", "content": user_input}
     ]
-    # Gera respostas das duas primeiras LLMs
     response1 = call_model(MODEL_1, messages)
     response2 = call_model(MODEL_2, messages)
-    # Cria prompt para a LLM julgadora
     judge_prompt = f"""
 Você é um avaliador imparcial. Dadas duas respostas para a mesma pergunta, escolha a melhor.
@@ -69,17 +74,18 @@ Resposta:
     return response1, response2, judgment
 with gr.Blocks() as demo:
-    gr.Markdown("# Cascata de 3 LLMs - Resposta + Julgamento")
-    user_input = gr.Textbox(label="Digite sua pergunta aqui")
-    generate_button = gr.Button("Gerar respostas")
     response1_out = gr.Textbox(label="Resposta da LLM 1", interactive=False)
     response2_out = gr.Textbox(label="Resposta da LLM 2", interactive=False)
     judgment_out = gr.Textbox(label="Julgamento da LLM 3", interactive=False)
     generate_button.click(
-        generate_and_judge,
         inputs=user_input,
         outputs=[response1_out, response2_out, judgment_out]
     )

 import os
 import gradio as gr
+import requests
+# Verifique se a variável de ambiente está configurada
 API_KEY = os.environ.get("OPENROUTER_API_KEY")
 if not API_KEY:
     raise ValueError("Defina a variável de ambiente OPENROUTER_API_KEY com sua chave válida.")
+# Endpoint correto da OpenRouter
+OPENROUTER_URL = "https://openrouter.ai/api/v1/chat/completions"
+# Modelos a serem utilizados
 MODEL_1 = "meta-llama/llama-3.2-1b-instruct:free"
 MODEL_2 = "mistralai/mistral-7b-instruct:free"
 MODEL_3 = "google/gemma-2-9b-it:free"  # LLM julgadora
 def call_model(model_name, messages, max_tokens=512, temperature=0.7, top_p=0.95):
+    headers = {
+        "Authorization": f"Bearer {API_KEY}",
+        "Content-Type": "application/json"
+    }
+    payload = {
+        "model": model_name,
+        "messages": messages,
+        "max_tokens": max_tokens,
+        "temperature": temperature,
+        "top_p": top_p
+    }
     try:
+        response = requests.post(OPENROUTER_URL, headers=headers, json=payload)
+        response.raise_for_status()
+        return response.json()['choices'][0]['message']['content'].strip()
     except Exception as e:
+        return f"Erro na chamada ao modelo {model_name}: {str(e)}"
 def generate_and_judge(user_input):
     if not user_input.strip():
+        return "Digite algo válido.", "", ""
     system_prompt = "Você é um assistente útil e objetivo."
         {"role": "user", "content": user_input}
     ]
+    # Gera respostas dos dois primeiros modelos
     response1 = call_model(MODEL_1, messages)
     response2 = call_model(MODEL_2, messages)
+    # Monta o prompt para a LLM julgadora
     judge_prompt = f"""
 Você é um avaliador imparcial. Dadas duas respostas para a mesma pergunta, escolha a melhor.
     return response1, response2, judgment
+# Interface Gradio minimalista
 with gr.Blocks() as demo:
+    gr.Markdown("### Cascata de 3 LLMs com Julgamento")
+    user_input = gr.Textbox(label="Pergunta", placeholder="Digite sua pergunta")
+    generate_button = gr.Button("Gerar e Julgar")
     response1_out = gr.Textbox(label="Resposta da LLM 1", interactive=False)
     response2_out = gr.Textbox(label="Resposta da LLM 2", interactive=False)
     judgment_out = gr.Textbox(label="Julgamento da LLM 3", interactive=False)
     generate_button.click(
+        fn=generate_and_judge,
         inputs=user_input,
         outputs=[response1_out, response2_out, judgment_out]
     )