Spaces:

jimytech
/

chatAPI

Running

App Files Files Community

jimytech commited on 1 day ago

Commit

ce734ca

verified ·

1 Parent(s): 0a729a6

Update rag_api.py

Browse files

Files changed (1) hide show

rag_api.py +88 -124

rag_api.py CHANGED Viewed

@@ -19,169 +19,133 @@ os.environ['SENTENCE_TRANSFORMERS_HOME'] = TEMP_CACHE_DIR
 os.makedirs(TEMP_CACHE_DIR, exist_ok=True)
 # --------------------------------------------------------
-# 1. CONFIGURACIÓN
 # --------------------------------------------------------
 URL_FAISS = "https://drive.google.com/uc?export=download&id=1hiVycS4DQHO1MBdC-L_z1TXA6sJO_Y-r"
 URL_PKL = "https://drive.google.com/uc?export=download&id=1vbG8unx88Kb5jn7puGv1gqSM4S6rIUQC"
 DOWNLOAD_DIR  = "/tmp/db_faiss"
 DB_FAISS_PATH = DOWNLOAD_DIR
-# --------------------------------------------------------
-# 2. CLASIFICADOR DE INTENCIÓN  ← NUEVO
-# --------------------------------------------------------
 INTENT_PROMPT = PromptTemplate(
-    template="""Eres un clasificador de intenciones para un asistente del portal de la Universidad Poltécnica de Aragua.
-Analiza el mensaje del usuario y clasifícalo en UNA de estas categorías:
-- SALUDO: saludos, despedidas, conversación casual ("hola", "gracias", "adiós", "¿cómo estás?")
-- UNIVERSIDAD: preguntas sobre carreras o programas, investigación, cursos, admisiones, notas, proyectos, postgrado,
-  PNF, PNFA, diplomados, servivios, Y TAMBIÉN cualquier pregunta relacionada con La Universidad relacionado con: sus autoridades, reglamentos,
-  servivios estudiantiles, precios de cursos, programas, etc.
-- OTRO: preguntas claramente NO relacionadas con la Universidad tales como: matemáticas, historia, tecnología general, etc.
-IMPORTANTE: Ante la duda, clasifica como Universidad Politécnica de Aragua o UPT Aragua. Solo usa OTRO cuando estés
-completamente seguro de que no tiene relación con la Universidad.
-Responde SOLO con la categoría, sin explicación.
 Mensaje: {query}
 Categoría:""",
     input_variables=["query"]
 )
 SALUDO_PROMPT = PromptTemplate(
-    template="""Eres UPTA bot, un Asistente Virtual de la UPT Aragua. Estas aquí para ayudar con información sobre admisiones, programas académicos,
-    servicios, becas y mucho más. Si el usuario se despide o agradece, invítalo a preguntar sobre la universidad.
 Mensaje: {query}
 Respuesta:""",
     input_variables=["query"]
 )
 RAG_PROMPT = PromptTemplate(
-    template="""Eres UPTA bot, un Asistente Virtual experto  de la UPT Aragua. Estas aquí para ayudar con información sobre
-    admisiones, programas académicos, servicios, becas y mucho más. Tu tarea es responder basándote en el contexto proporcionado. Si el contexto
-    no tiene suficiente información, pide al usuario que te proporcione una pregunta más específica sobre la UPT Aragua para dar una respuesta fiable. Sé amigable, claro y conciso.
-Contexto de la base de datos: {context}
-Pregunta del usuario: {question}
 Respuesta:""",
     input_variables=["context", "question"]
 )
 # --------------------------------------------------------
-# 3. FUNCIONES DE DESCARGA Y CARGA
 # --------------------------------------------------------
 class QueryRequest(BaseModel):
     query: str
 def download_file(url, local_path):
-    file_name = os.path.basename(local_path)
-    print(f"Descargando: {file_name}...")
     headers = {'User-Agent': 'Mozilla/5.0'}
-    try:
-        response = requests.get(url, stream=True, headers=headers, timeout=30)
-        if response.status_code == 403:
-            raise PermissionError(f"Error 403: {file_name} no es público.")
-        response.raise_for_status()
-        os.makedirs(os.path.dirname(local_path), exist_ok=True)
-        with open(local_path, 'wb') as f:
-            shutil.copyfileobj(response.raw, f)
-        print(f"✓ {file_name} descargado.")
-    except requests.exceptions.RequestException as e:
-        raise RuntimeError(f"Fallo al descargar {file_name}: {e}")
 def load_and_configure_rag():
-    try:
-        download_file(URL_FAISS, os.path.join(DOWNLOAD_DIR, 'index.faiss'))
-        download_file(URL_PKL,   os.path.join(DOWNLOAD_DIR, 'index.pkl'))
-        print("Cargando embeddings...")
-        embeddings = HuggingFaceEmbeddings(
-            model_name="sentence-transformers/all-MiniLM-L6-v2",
-            model_kwargs={'device': 'cpu'},
-            cache_folder=TEMP_CACHE_DIR
-        )
-        print("Cargando FAISS...")
-        vectorstore = FAISS.load_local(
-            DB_FAISS_PATH, embeddings, allow_dangerous_deserialization=True
-        )
-        llm = ChatGroq(temperature=0.150, model_name="openai/gpt-oss-120b")
-        # Cadena clasificadora de intención
-        intent_chain = INTENT_PROMPT | llm
-        # Cadena para saludos
-        saludo_chain = SALUDO_PROMPT | llm
-        # Cadena RAG principal
-        retriever  = vectorstore.as_retriever(search_kwargs={"k": 4})
-        rag_chain  = (
-            {"context": retriever, "question": RunnablePassthrough()}
-            | RAG_PROMPT
-            | llm
-        )
-        return intent_chain, saludo_chain, rag_chain, retriever
-    except Exception as e:
-        print(f"Error CRÍTICO al inicializar: {type(e).__name__}: {e}")
-        raise RuntimeError(f"Falla al cargar RAG: {e}")
 # --------------------------------------------------------
-# 4. FASTAPI
 # --------------------------------------------------------
-app = FastAPI(title="UPT Aragua bot RAG API")
-intent_chain = saludo_chain = qa_chain = retriever = None
-try:
-    intent_chain, saludo_chain, qa_chain, retriever = load_and_configure_rag()
-except RuntimeError:
-    pass
-@app.get("/")
-def home():
-    if qa_chain is None:
-        return {"error": "RAG no inicializado. Revisa los logs."}
-    return {"message": "API UPT Aragua bot operativa. Usa /query."}
 @app.post("/query")
 async def process_query(request: QueryRequest):
-    if qa_chain is None:
-        return {"error": "El sistema RAG no se pudo cargar."}
-    try:
-        # ── 1. Clasificar intención ──────────────────────────────
-        intent_result = intent_chain.invoke({"query": request.query})
-        intent = intent_result.content.strip().upper()
-        print(f"[Intent] '{request.query}' → {intent}")
-        # ── 2. Ruta según intención ──────────────────────────────
-        if "SALUDO" in intent:
-            respuesta = saludo_chain.invoke({"query": request.query})
-            return {
-                "query": request.query,
-                "response": respuesta.content,
-                "intent": "SALUDO",
-                "sources": []
-            }
-        elif "OTRO" in intent:
-            return {
-                "query": request.query,
-                "response": "Soy UPTA bot, estoy especializado en la UPT Aragua. ¿Tienes alguna pregunta sobre programas, carreras, inscripciones, fechas...? 🥗",
-                "intent": "OTRO",
-                "sources": []
-            }
-        else:
-            # UNIVERSIDAD o cualquier categoría no reconocida → RAG
-            respuesta  = qa_chain.invoke(request.query)
-            docs       = retriever.invoke(request.query)
-            sources    = [doc.metadata.get("source", "N/A") for doc in docs]
-            return {
-                "query":    request.query,
-                "response": respuesta.content,
-                "intent":   "UNIVERSIDAD",
-                "sources":  sources
-            }
     except Exception as e:
         return {"error": f"Error al procesar la consulta: {e}"}

 os.makedirs(TEMP_CACHE_DIR, exist_ok=True)
 # --------------------------------------------------------
+# 1. CONFIGURACIÓN Y PROMPTS
 # --------------------------------------------------------
 URL_FAISS = "https://drive.google.com/uc?export=download&id=1hiVycS4DQHO1MBdC-L_z1TXA6sJO_Y-r"
 URL_PKL = "https://drive.google.com/uc?export=download&id=1vbG8unx88Kb5jn7puGv1gqSM4S6rIUQC"
 DOWNLOAD_DIR  = "/tmp/db_faiss"
 DB_FAISS_PATH = DOWNLOAD_DIR
+# --- NUEVO: PROMPT PARA RE-ESCRIBIR LA PREGUNTA ---
+CONDENSE_PROMPT = PromptTemplate(
+    template="""Dada la siguiente conversación y una pregunta de seguimiento, reescribe la pregunta de seguimiento para que sea una pregunta independiente que contenga todo el contexto, especialmente si se refiere a la UPT Aragua.
+Historial:
+{chat_history}
+Pregunta de seguimiento: {question}
+Pregunta independiente reescrita:""",
+    input_variables=["chat_history", "question"]
+)
 INTENT_PROMPT = PromptTemplate(
+    template="""Eres un clasificador de intenciones para la UPT Aragua. Clasifica en: SALUDO, UNIVERSIDAD u OTRO.
+Responde SOLO con la categoría.
 Mensaje: {query}
 Categoría:""",
     input_variables=["query"]
 )
 SALUDO_PROMPT = PromptTemplate(
+    template="""Eres UPTA bot, saluda amigablemente y menciona que puedes ayudar con info de la UPT Aragua.
 Mensaje: {query}
 Respuesta:""",
     input_variables=["query"]
 )
 RAG_PROMPT = PromptTemplate(
+    template="""Eres UPTA bot, experto de la UPT Aragua. Responde usando el contexto. Si no lo sabes, pide ser más específico.
+Contexto: {context}
+Pregunta: {question}
 Respuesta:""",
     input_variables=["context", "question"]
 )
 # --------------------------------------------------------
+# 2. MODELOS DE DATOS
 # --------------------------------------------------------
 class QueryRequest(BaseModel):
     query: str
+    history: list = [] # Aquí recibiremos el historial desde Gradio
+# --------------------------------------------------------
+# 3. FUNCIONES DE CARGA
+# --------------------------------------------------------
 def download_file(url, local_path):
     headers = {'User-Agent': 'Mozilla/5.0'}
+    response = requests.get(url, stream=True, headers=headers, timeout=30)
+    os.makedirs(os.path.dirname(local_path), exist_ok=True)
+    with open(local_path, 'wb') as f:
+        shutil.copyfileobj(response.raw, f)
 def load_and_configure_rag():
+    download_file(URL_FAISS, os.path.join(DOWNLOAD_DIR, 'index.faiss'))
+    download_file(URL_PKL,   os.path.join(DOWNLOAD_DIR, 'index.pkl'))
+    embeddings = HuggingFaceEmbeddings(
+        model_name="sentence-transformers/all-MiniLM-L6-v2",
+        model_kwargs={'device': 'cpu'},
+        cache_folder=TEMP_CACHE_DIR
+    )
+    vectorstore = FAISS.load_local(DB_FAISS_PATH, embeddings, allow_dangerous_deserialization=True)
+    # Asegúrate de tener la variable de entorno GROQ_API_KEY configurada en Hugging Face
+    llm = ChatGroq(temperature=0.15, model_name="openai/gpt-oss-120b")
+    retriever = vectorstore.as_retriever(search_kwargs={"k": 4})
+    # Creamos todas las cadenas
+    condense_chain = CONDENSE_PROMPT | llm
+    intent_chain = INTENT_PROMPT | llm
+    saludo_chain = SALUDO_PROMPT | llm
+    rag_chain = (
+        {"context": retriever, "question": RunnablePassthrough()}
+        | RAG_PROMPT
+        | llm
+    )
+    return condense_chain, intent_chain, saludo_chain, rag_chain, retriever
 # --------------------------------------------------------
+# 4. API FASTAPI
 # --------------------------------------------------------
+app = FastAPI()
+condense_chain = intent_chain = saludo_chain = rag_chain = retriever = None
+@app.on_event("startup")
+async def startup_event():
+    global condense_chain, intent_chain, saludo_chain, rag_chain, retriever
+    condense_chain, intent_chain, saludo_chain, rag_chain, retriever = load_and_configure_rag()
 @app.post("/query")
 async def process_query(request: QueryRequest):
+    # 1. Convertir historial a texto
+    chat_str = ""
+    for user_msg, bot_msg in request.history:
+        chat_str += f"Usuario: {user_msg}\nBot: {bot_msg}\n"
+    # 2. Re-escribir consulta si hay historial
+    query_to_process = request.query
+    if request.history:
+        res = condense_chain.invoke({"chat_history": chat_str, "question": request.query})
+        query_to_process = res.content.strip()
+    # 3. Clasificar intención
+    intent_res = intent_chain.invoke({"query": query_to_process})
+    intent = intent_res.content.upper()
+    if "SALUDO" in intent:
+        resp = saludo_chain.invoke({"query": request.query})
+        return {"response": resp.content, "intent": "SALUDO"}
+    elif "OTRO" in intent:
+        return {"response": "Solo puedo ayudarte con temas de la UPT Aragua.", "intent": "OTRO"}
+    else:
+        # RAG con la consulta re-escrita
+        resp = rag_chain.invoke(query_to_process)
+        docs = retriever.invoke(query_to_process)
+        sources = list(set([doc.metadata.get("source", "N/A") for doc in docs]))
+        return {"response": resp.content, "intent": "UNIVERSIDAD", "sources": sources}
     except Exception as e:
         return {"error": f"Error al procesar la consulta: {e}"}