ManualEmbCRMinbox

Sleeping

App Files Files Community

Daniel00611 commited on Dec 20, 2025

Commit

57df3b5

verified ·

1 Parent(s): d87fa11

Update app.py

Browse files

Files changed (1) hide show

app.py +33 -25

app.py CHANGED Viewed

@@ -30,15 +30,11 @@ def obtener_extractos(pregunta):
     docs_relevantes = retriever.invoke(pregunta)
     return [(doc.page_content, doc.metadata.get("url", "URL no disponible")) for doc in docs_relevantes]
-def respond(message, history: list[tuple[str, str]], system_message, max_tokens, temperature, top_p):
-    """Genera una respuesta basada en el historial y documentos relevantes."""
     # Obtener documentos relevantes desde ChromaDB
     contexto = obtener_extractos(message)
-    # Construir el mensaje del sistema con el contexto directamente incluido
     system_message_final = f"""{system_message}
     Información relevante extraída de los documentos, en caso de que estos documentos tenga la informacion que necesitas, no olvides tomar
     el historial de conversacion con el usuario:
     {contexto}
@@ -46,33 +42,45 @@ def respond(message, history: list[tuple[str, str]], system_message, max_tokens,
     messages = [{"role": "system", "content": system_message_final}]
-    # Agregar historial del chat
-    for val in history:
-        if val[0]:
-            messages.append({"role": "user", "content": val[0]})
-        if val[1]:
-            messages.append({"role": "assistant", "content": val[1]})
-    # Agregar la nueva pregunta del usuario
     messages.append({"role": "user", "content": message})
-    # Llamar a la API de OpenAI con streaming
     stream = client.responses.create(
-        model="gpt-5-nano",
-        input=messages,
-        #max_tokens=max_tokens,
         stream=True,
-        reasoning={ "effort": "low" },
-        text={ "verbosity": "low" },
-        #temperature=temperature,
-        #top_p=top_p,
     )
-    response = ""
-    for chunk in stream:
-        if chunk.choices and chunk.choices[0].delta.content:
-            response += chunk.choices[0].delta.content
-            yield response
 # Configuración de la interfaz Gradio

     docs_relevantes = retriever.invoke(pregunta)
     return [(doc.page_content, doc.metadata.get("url", "URL no disponible")) for doc in docs_relevantes]
+def respond(message, history, system_message, max_tokens=2048, temperature=0.7, top_p=0.95):
     # Obtener documentos relevantes desde ChromaDB
     contexto = obtener_extractos(message)
     system_message_final = f"""{system_message}
     Información relevante extraída de los documentos, en caso de que estos documentos tenga la informacion que necesitas, no olvides tomar
     el historial de conversacion con el usuario:
     {contexto}
     messages = [{"role": "system", "content": system_message_final}]
+    # Historial
+    for user_msg, assistant_msg in history:
+        if user_msg:
+            messages.append({"role": "user", "content": user_msg})
+        if assistant_msg:
+            messages.append({"role": "assistant", "content": assistant_msg})
+    # Nueva pregunta
     messages.append({"role": "user", "content": message})
+    # ⚠️ Recomendado: adaptar al formato de 'input' de Responses
+    inputs = [
+        {
+            "type": "message",
+            "role": m["role"],
+            "content": m["content"],
+        }
+        for m in messages
+    ]
     stream = client.responses.create(
+        model="gpt-5-nano",  # verifica que este modelo exista en tu cuenta
+        input=inputs,
         stream=True,
+        reasoning={"effort": "low"},
+        text={"verbosity": "low"},
+        # max_output_tokens=max_tokens,  # si lo quieres usar, el nombre del parámetro en Responses es este
+        # temperature=temperature,       # (depende del modelo/SDK si lo soporta en responses)
+        # top_p=top_p,
     )
+    respuesta = ""
+    for event in stream:
+        # Cada trozo de texto viene en eventos tipo 'response.output_text.delta'
+        if event.type == "response.output_text.delta":
+            # En la doc actual el texto viene en event.delta (string) :contentReference[oaicite:1]{index=1}
+            delta = event.delta or ""
+            respuesta += delta
+            yield respuesta
 # Configuración de la interfaz Gradio