Spaces:

JMAA00
/

Testllama8b

Sleeping

App Files Files Community

JMAA00 commited on Mar 29, 2025

Commit

c376a15

1 Parent(s): ff801d4

v19

Browse files

Files changed (1) hide show

app.py +16 -16

app.py CHANGED Viewed

@@ -53,9 +53,16 @@ def do_websearch(query: str) -> str:
 # ----------------------------------------------------------------
-# CONFIGURACIÓN DEL MODELO
 # ----------------------------------------------------------------
-client = InferenceClient("meta-llama/Llama-3.1-8B-Instruct")
 def respond(
     message,
@@ -73,17 +80,13 @@ def respond(
     - use_search: booleano que indica si se habilita la búsqueda en serper
     """
-    # ----------------------------------------------------------------
     # 1) Si el toggle está activo, hacemos búsqueda y la agregamos al prompt
-    # ----------------------------------------------------------------
     if use_search:
         web_info = do_websearch(message)
         # Agregamos info al final del texto del usuario
         message = f"{message}\nInformación de la web:\n{web_info}"
-    # ----------------------------------------------------------------
     # 2) Construimos la lista de mensajes para la API de chat
-    # ----------------------------------------------------------------
     messages = [{"role": "system", "content": system_message}]
     for val in history:
         if val[0]:
@@ -94,10 +97,8 @@ def respond(
     # Añadimos el mensaje nuevo del usuario (posiblemente complementado con la info web)
     messages.append({"role": "user", "content": message})
-    # ----------------------------------------------------------------
     # 3) Llamamos a la API con streaming de tokens
-    # ----------------------------------------------------------------
-    response = ""
     for chunk in client.chat_completion(
         messages,
         max_tokens=max_tokens,
@@ -106,15 +107,14 @@ def respond(
         top_p=top_p,
     ):
         token = chunk.choices[0].delta.get("content", "")
-        response += token
-        yield response
 # ----------------------------------------------------------------
 # CONFIGURACIÓN DE LA INTERFAZ
 # ----------------------------------------------------------------
-# Para usar Tailwind, podemos asignar clases en "elem_classes".
-# Ejemplo de clases genéricas (puedes cambiarlas a tu gusto):
 tailwind_toggle_classes = [
     "inline-flex",
     "items-center",
@@ -163,10 +163,10 @@ demo = gr.ChatInterface(
             step=0.05,
             label="Top-p (muestreo por núcleo)",
         ),
-        # Un checkbox que hace de "toggle" para la búsqueda
         gr.Checkbox(
-            value=False,         # Por defecto desactivado
-            label="🌐 Búsqueda", # Etiqueta
             elem_classes=tailwind_toggle_classes
         ),
     ],

 # ----------------------------------------------------------------
+# CONFIGURACIÓN DEL MODELO (AHORA CON TOKEN)
 # ----------------------------------------------------------------
+# Cargamos el token desde la variable de entorno 'HF_API_TOKEN'
+hf_api_token = os.getenv("HF_API_TOKEN")
+# Usamos el modelo meta-llama/Llama-3.1-8B-Instruct con acceso a tu cuenta
+client = InferenceClient(
+    model="meta-llama/Llama-3.1-8B-Instruct",
+    token=hf_api_token  # <-- la clave para evitar el 401 Unauthorized
+)
 def respond(
     message,
     - use_search: booleano que indica si se habilita la búsqueda en serper
     """
     # 1) Si el toggle está activo, hacemos búsqueda y la agregamos al prompt
     if use_search:
         web_info = do_websearch(message)
         # Agregamos info al final del texto del usuario
         message = f"{message}\nInformación de la web:\n{web_info}"
     # 2) Construimos la lista de mensajes para la API de chat
     messages = [{"role": "system", "content": system_message}]
     for val in history:
         if val[0]:
     # Añadimos el mensaje nuevo del usuario (posiblemente complementado con la info web)
     messages.append({"role": "user", "content": message})
     # 3) Llamamos a la API con streaming de tokens
+    response_text = ""
     for chunk in client.chat_completion(
         messages,
         max_tokens=max_tokens,
         top_p=top_p,
     ):
         token = chunk.choices[0].delta.get("content", "")
+        response_text += token
+        yield response_text
 # ----------------------------------------------------------------
 # CONFIGURACIÓN DE LA INTERFAZ
 # ----------------------------------------------------------------
+# Ejemplo de Tailwind classes (puedes personalizarlas):
 tailwind_toggle_classes = [
     "inline-flex",
     "items-center",
             step=0.05,
             label="Top-p (muestreo por núcleo)",
         ),
+        # Un checkbox para habilitar "búsqueda web" (use_search)
         gr.Checkbox(
+            value=False,
+            label="🌐 Búsqueda",
             elem_classes=tailwind_toggle_classes
         ),
     ],