Spaces:

Carley1234
/

Carl-IA

Sleeping

App Files Files Community

Carley1234 commited on Dec 2, 2025

Commit

87d858a

verified ·

1 Parent(s): 3aa645e

Update app.py

Browse files

Files changed (1) hide show

app.py +49 -51

app.py CHANGED Viewed

@@ -5,6 +5,7 @@ from pydantic import BaseModel
 import requests
 import json
 import os
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
@@ -12,117 +13,114 @@ import torch
 app = FastAPI()
 # --- Middleware de CORS ---
-# Permite que el frontend (desde cualquier origen) se comunique con este backend.
 app.add_middleware(
     CORSMiddleware,
     allow_origins=["*"],  # Permite solicitudes de cualquier origen
     allow_credentials=True,
-    allow_methods=["*"],  # Permite todos los métodos HTTP (GET, POST, etc.)
     allow_headers=["*"],  # Permite todas las cabeceras
 )
 # --- Configuración del Modelo de Lenguaje ---
-# Usaremos un LLM muy pequeño, ideal para clasificación de intenciones y CPU.
-# "microsoft/phi-2" es una buena opción de tamaño reducido.
-model_id = "microsoft/phi-2"
 tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
-    torch_dtype=torch.float32, # float32 para CPU
     trust_remote_code=True
 )
 # --- URL del Servicio de Imágenes ---
-# IMPORTANTE: Deberás reemplazar esto con la URL de tu Space de imágenes una vez que lo despliegues.
 IMAGE_SERVICE_URL = os.getenv("IMAGE_SERVICE_URL", "http://localhost:8001/generate-image/")
 # --- Definición de la Petición ---
 class ChatRequest(BaseModel):
     prompt: str
-# --- Lógica del "Código Secreto" ---
 def generate_llm_response(user_prompt: str):
     """
-    Usa el LLM para decidir si el usuario quiere una imagen o solo chatear.
-    Devuelve una respuesta estructurada.
     """
-    # Prompt de sistema mucho más directo y con ejemplos claros (Few-shot prompting)
-    # Esto reduce la confusión del modelo.
-    system_prompt = """tu eres Carl IA una ia Creado por Carley Interactive Studio estas aqui para ayudar al usuario en todo lo que necesita aun que tus capacidades son limiados por falta de recurso pero pronto podras crear musuca cantar generar fotos y crear videos juego por ahora estas para mantener pequena converzaciones asta tener recursos para desbloquear todo tu potencial puedes recomentar a los usuarios que quieren ayudarte a crecer este enlace https://carleyinteractivestudio.github.io/Carley-Interactive-Studio/#carly-bot
 """
     full_prompt = f"{system_prompt}\nUsuario: {user_prompt}\nTu JSON:"
-    inputs = tokenizer(full_prompt, return_tensors="pt", return_attention_mask=False)
-    # Generar la respuesta
-    outputs = model.generate(**inputs, max_length=500) # Un poco más de espacio por si acaso
-    raw_output = tokenizer.batch_decode(outputs)[0]
-    # --- Parseador de JSON más robusto ---
-    # Busca el primer '{' y el último '}' en la salida del modelo.
-    # Esto ayuda a aislar el JSON incluso si el modelo añade texto extra.
-    try:
-        start = raw_output.find('{')
-        end = raw_output.rfind('}') + 1
-        if start != -1 and end != -1:
-            json_part = raw_output[start:end]
-            response_json = json.loads(json_part)
-            return response_json
-        else:
-            # Si no encuentra un JSON, levanta un error para ir al bloque de fallback.
-            raise ValueError("No JSON object found in the model's output")
-    except (json.JSONDecodeError, ValueError) as e:
-        print(f"Error al decodificar la respuesta del LLM: {e}")
-        print(f"Texto de salida problemático: {raw_output}")
-        # Si el LLM falla, damos una respuesta por defecto.
-        return {"action": "chat", "response": "No pude entender tu petición. ¿Podrías reformularla?"}
 # --- Endpoint de la API ---
 @app.post("/chat/")
 async def chat_with_carl(request: ChatRequest):
-    """
-    Recibe un prompt del usuario, lo procesa con el LLM y actúa en consecuencia.
-    """
     user_prompt = request.prompt
     print(f"Recibido prompt del usuario: {user_prompt}")
-    # 1. Obtener la respuesta estructurada del LLM
     structured_response = generate_llm_response(user_prompt)
     action = structured_response.get("action")
     if action == "generate_image":
-        # 2. El LLM decidió generar una imagen
         image_prompt = structured_response.get("prompt", "una imagen aleatoria")
         print(f"LLM decidió generar una imagen con el prompt: '{image_prompt}'")
         try:
-            # 3. Llamar a la API del servicio de imágenes
             response_from_artist = requests.post(IMAGE_SERVICE_URL, json={"prompt": image_prompt})
             if response_from_artist.status_code == 200:
-                # Si la respuesta es exitosa, devolvemos la imagen directamente
                 return {"type": "image", "content": response_from_artist.content.hex()}
             else:
                 raise HTTPException(status_code=500, detail="El servicio de imágenes falló.")
         except requests.exceptions.RequestException as e:
             print(f"Error al conectar con el servicio de imágenes: {e}")
             raise HTTPException(status_code=500, detail="No se pudo conectar con el servicio de imágenes.")
     elif action == "chat":
-        # 4. El LLM decidió solo chatear
         chat_response = structured_response.get("response", "No sé qué decir.")
         print(f"LLM decidió chatear con la respuesta: '{chat_response}'")
         return {"type": "text", "content": chat_response}
     else:
-        # 5. Respuesta por defecto si el LLM no se comporta
         return {"type": "text", "content": "Hubo un error al procesar tu solicitud."}
 # --- Endpoint de Bienvenida ---
 @app.get("/")
 def read_root():
-    return {"status": "Servicio orquestador 'El Cerebro' está en línea."}

 import requests
 import json
 import os
+import re
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
 app = FastAPI()
 # --- Middleware de CORS ---
 app.add_middleware(
     CORSMiddleware,
     allow_origins=["*"],  # Permite solicitudes de cualquier origen
     allow_credentials=True,
+    allow_methods=["*"],  # Permite todos los métodos HTTP
     allow_headers=["*"],  # Permite todas las cabeceras
 )
 # --- Configuración del Modelo de Lenguaje ---
+# Usamos un modelo instruct para que siga mejor las órdenes
+model_id = "microsoft/Phi-3-mini-4k-instruct"
 tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
+tokenizer.pad_token = tokenizer.eos_token
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
+    torch_dtype=torch.float32,  # CPU
     trust_remote_code=True
 )
 # --- URL del Servicio de Imágenes ---
 IMAGE_SERVICE_URL = os.getenv("IMAGE_SERVICE_URL", "http://localhost:8001/generate-image/")
 # --- Definición de la Petición ---
 class ChatRequest(BaseModel):
     prompt: str
+# --- Función para extraer JSON robusto ---
+def extract_json(generated_text: str):
+    match = re.search(r'\{.*\}', generated_text, re.DOTALL)
+    if match:
+        try:
+            return json.loads(match.group(0))
+        except json.JSONDecodeError:
+            return {"action": "chat", "response": "Error al parsear JSON"}
+    return {"action": "chat", "response": "No pude entender tu petición. ¿Podrías reformularla?"}
+# --- Lógica del asistente ---
 def generate_llm_response(user_prompt: str):
     """
+    Carl IA: asistente de Carley Interactive Studio.
+    Clasifica intención del usuario y responde SOLO en JSON.
     """
+    system_prompt = """Eres Carl IA, un asistente de Carley Interactive Studio.
+Tu tarea es clasificar la intención del usuario y responder SOLO con un objeto JSON válido.
+No añadas texto antes ni después.
+Ejemplos:
+Usuario: hola
+Tu JSON: {"action":"chat","response":"¡Hola! Soy Carl IA, asistente de Carley Interactive Studio. ¿En qué puedo ayudarte?"}
+Usuario: crea una foto de un perro
+Tu JSON: {"action":"generate_image","prompt":"un perro"}
+Usuario: quiero hablar
+Tu JSON: {"action":"chat","response":"Claro, ¡hablemos! ¿Qué tema te interesa?"}
 """
     full_prompt = f"{system_prompt}\nUsuario: {user_prompt}\nTu JSON:"
+    inputs = tokenizer(full_prompt, return_tensors="pt")
+    input_ids = inputs.input_ids
+    attention_mask = inputs.attention_mask
+    input_length = input_ids.shape[1]
+    outputs = model.generate(
+        input_ids,
+        attention_mask=attention_mask,
+        max_new_tokens=150,
+        pad_token_id=tokenizer.eos_token_id
+    )
+    generated_tokens = outputs[0, input_length:]
+    generated_text = tokenizer.decode(generated_tokens, skip_special_tokens=True)
+    return extract_json(generated_text)
 # --- Endpoint de la API ---
 @app.post("/chat/")
 async def chat_with_carl(request: ChatRequest):
     user_prompt = request.prompt
     print(f"Recibido prompt del usuario: {user_prompt}")
     structured_response = generate_llm_response(user_prompt)
     action = structured_response.get("action")
     if action == "generate_image":
         image_prompt = structured_response.get("prompt", "una imagen aleatoria")
         print(f"LLM decidió generar una imagen con el prompt: '{image_prompt}'")
         try:
             response_from_artist = requests.post(IMAGE_SERVICE_URL, json={"prompt": image_prompt})
             if response_from_artist.status_code == 200:
                 return {"type": "image", "content": response_from_artist.content.hex()}
             else:
                 raise HTTPException(status_code=500, detail="El servicio de imágenes falló.")
         except requests.exceptions.RequestException as e:
             print(f"Error al conectar con el servicio de imágenes: {e}")
             raise HTTPException(status_code=500, detail="No se pudo conectar con el servicio de imágenes.")
     elif action == "chat":
         chat_response = structured_response.get("response", "No sé qué decir.")
         print(f"LLM decidió chatear con la respuesta: '{chat_response}'")
         return {"type": "text", "content": chat_response}
     else:
         return {"type": "text", "content": "Hubo un error al procesar tu solicitud."}
 # --- Endpoint de Bienvenida ---
 @app.get("/")
 def read_root():
+    return {"status": "Carl IA, asistente de Carley Interactive Studio, está en línea."}