Spaces:

jimytech
/

chatAPI

Sleeping

App Files Files Community

jimytech commited on 6 days ago

Commit

9e0e903

verified ·

1 Parent(s): ce734ca

Update rag_api.py

Browse files

Files changed (1) hide show

rag_api.py +71 -81

rag_api.py CHANGED Viewed

@@ -9,77 +9,61 @@ from langchain_core.runnables import RunnablePassthrough
 from langchain_core.prompts import PromptTemplate
 from langchain_groq import ChatGroq
-# --------------------------------------------------------
-# CACHÉ EN /tmp
-# --------------------------------------------------------
 TEMP_CACHE_DIR = '/tmp/huggingface_cache'
 os.environ['TRANSFORMERS_CACHE'] = TEMP_CACHE_DIR
 os.environ['HF_HOME'] = TEMP_CACHE_DIR
 os.environ['SENTENCE_TRANSFORMERS_HOME'] = TEMP_CACHE_DIR
 os.makedirs(TEMP_CACHE_DIR, exist_ok=True)
-# --------------------------------------------------------
-# 1. CONFIGURACIÓN Y PROMPTS
-# --------------------------------------------------------
 URL_FAISS = "https://drive.google.com/uc?export=download&id=1hiVycS4DQHO1MBdC-L_z1TXA6sJO_Y-r"
 URL_PKL = "https://drive.google.com/uc?export=download&id=1vbG8unx88Kb5jn7puGv1gqSM4S6rIUQC"
 DOWNLOAD_DIR  = "/tmp/db_faiss"
 DB_FAISS_PATH = DOWNLOAD_DIR
-# --- NUEVO: PROMPT PARA RE-ESCRIBIR LA PREGUNTA ---
 CONDENSE_PROMPT = PromptTemplate(
-    template="""Dada la siguiente conversación y una pregunta de seguimiento, reescribe la pregunta de seguimiento para que sea una pregunta independiente que contenga todo el contexto, especialmente si se refiere a la UPT Aragua.
-Historial:
-{chat_history}
-Pregunta de seguimiento: {question}
-Pregunta independiente reescrita:""",
     input_variables=["chat_history", "question"]
 )
 INTENT_PROMPT = PromptTemplate(
-    template="""Eres un clasificador de intenciones para la UPT Aragua. Clasifica en: SALUDO, UNIVERSIDAD u OTRO.
-Responde SOLO con la categoría.
-Mensaje: {query}
-Categoría:""",
     input_variables=["query"]
 )
 SALUDO_PROMPT = PromptTemplate(
-    template="""Eres UPTA bot, saluda amigablemente y menciona que puedes ayudar con info de la UPT Aragua.
-Mensaje: {query}
-Respuesta:""",
     input_variables=["query"]
 )
 RAG_PROMPT = PromptTemplate(
-    template="""Eres UPTA bot, experto de la UPT Aragua. Responde usando el contexto. Si no lo sabes, pide ser más específico.
 Contexto: {context}
 Pregunta: {question}
 Respuesta:""",
     input_variables=["context", "question"]
 )
-# --------------------------------------------------------
-# 2. MODELOS DE DATOS
-# --------------------------------------------------------
 class QueryRequest(BaseModel):
     query: str
-    history: list = [] # Aquí recibiremos el historial desde Gradio
-# --------------------------------------------------------
-# 3. FUNCIONES DE CARGA
-# --------------------------------------------------------
 def download_file(url, local_path):
     headers = {'User-Agent': 'Mozilla/5.0'}
-    response = requests.get(url, stream=True, headers=headers, timeout=30)
     os.makedirs(os.path.dirname(local_path), exist_ok=True)
-    with open(local_path, 'wb') as f:
-        shutil.copyfileobj(response.raw, f)
-def load_and_configure_rag():
     download_file(URL_FAISS, os.path.join(DOWNLOAD_DIR, 'index.faiss'))
-    download_file(URL_PKL,   os.path.join(DOWNLOAD_DIR, 'index.pkl'))
     embeddings = HuggingFaceEmbeddings(
         model_name="sentence-transformers/all-MiniLM-L6-v2",
@@ -88,64 +72,70 @@ def load_and_configure_rag():
     )
     vectorstore = FAISS.load_local(DB_FAISS_PATH, embeddings, allow_dangerous_deserialization=True)
-    # Asegúrate de tener la variable de entorno GROQ_API_KEY configurada en Hugging Face
-    llm = ChatGroq(temperature=0.15, model_name="openai/gpt-oss-120b")
-    retriever = vectorstore.as_retriever(search_kwargs={"k": 4})
-    # Creamos todas las cadenas
-    condense_chain = CONDENSE_PROMPT | llm
-    intent_chain = INTENT_PROMPT | llm
-    saludo_chain = SALUDO_PROMPT | llm
-    rag_chain = (
-        {"context": retriever, "question": RunnablePassthrough()}
-        | RAG_PROMPT
-        | llm
     )
-    return condense_chain, intent_chain, saludo_chain, rag_chain, retriever
-# --------------------------------------------------------
-# 4. API FASTAPI
-# --------------------------------------------------------
 app = FastAPI()
-condense_chain = intent_chain = saludo_chain = rag_chain = retriever = None
 @app.on_event("startup")
-async def startup_event():
-    global condense_chain, intent_chain, saludo_chain, rag_chain, retriever
-    condense_chain, intent_chain, saludo_chain, rag_chain, retriever = load_and_configure_rag()
 @app.post("/query")
 async def process_query(request: QueryRequest):
-    # 1. Convertir historial a texto
-    chat_str = ""
-    for user_msg, bot_msg in request.history:
-        chat_str += f"Usuario: {user_msg}\nBot: {bot_msg}\n"
-    # 2. Re-escribir consulta si hay historial
-    query_to_process = request.query
-    if request.history:
-        res = condense_chain.invoke({"chat_history": chat_str, "question": request.query})
-        query_to_process = res.content.strip()
-    # 3. Clasificar intención
-    intent_res = intent_chain.invoke({"query": query_to_process})
-    intent = intent_res.content.upper()
-    if "SALUDO" in intent:
-        resp = saludo_chain.invoke({"query": request.query})
-        return {"response": resp.content, "intent": "SALUDO"}
-    elif "OTRO" in intent:
-        return {"response": "Solo puedo ayudarte con temas de la UPT Aragua.", "intent": "OTRO"}
-    else:
-        # RAG con la consulta re-escrita
-        resp = rag_chain.invoke(query_to_process)
-        docs = retriever.invoke(query_to_process)
-        sources = list(set([doc.metadata.get("source", "N/A") for doc in docs]))
-        return {"response": resp.content, "intent": "UNIVERSIDAD", "sources": sources}
     except Exception as e:
         return {"error": f"Error al procesar la consulta: {e}"}

 from langchain_core.prompts import PromptTemplate
 from langchain_groq import ChatGroq
+# 1. VARIABLES DE ENTORNO Y CACHÉ
 TEMP_CACHE_DIR = '/tmp/huggingface_cache'
 os.environ['TRANSFORMERS_CACHE'] = TEMP_CACHE_DIR
 os.environ['HF_HOME'] = TEMP_CACHE_DIR
 os.environ['SENTENCE_TRANSFORMERS_HOME'] = TEMP_CACHE_DIR
 os.makedirs(TEMP_CACHE_DIR, exist_ok=True)
+# 2. CONFIGURACIÓN DE RUTAS
 URL_FAISS = "https://drive.google.com/uc?export=download&id=1hiVycS4DQHO1MBdC-L_z1TXA6sJO_Y-r"
 URL_PKL = "https://drive.google.com/uc?export=download&id=1vbG8unx88Kb5jn7puGv1gqSM4S6rIUQC"
 DOWNLOAD_DIR  = "/tmp/db_faiss"
 DB_FAISS_PATH = DOWNLOAD_DIR
+# 3. PROMPTS
 CONDENSE_PROMPT = PromptTemplate(
+    template="""Dada la conversación y la pregunta, reescríbela para que sea independiente y clara sobre la UPT Aragua.
+Historial: {chat_history}
+Pregunta: {question}
+Pregunta reescrita:""",
     input_variables=["chat_history", "question"]
 )
 INTENT_PROMPT = PromptTemplate(
+    template="Categoriza el mensaje en: SALUDO, UNIVERSIDAD u OTRO. Responde solo la palabra. Mensaje: {query}",
     input_variables=["query"]
 )
 SALUDO_PROMPT = PromptTemplate(
+    template="Eres UPTA bot. Saluda cordialmente. Mensaje: {query}",
     input_variables=["query"]
 )
 RAG_PROMPT = PromptTemplate(
+    template="""Eres UPTA bot. Responde usando solo el contexto.
 Contexto: {context}
 Pregunta: {question}
 Respuesta:""",
     input_variables=["context", "question"]
 )
+# 4. MODELOS
 class QueryRequest(BaseModel):
     query: str
+    history: list = []
 def download_file(url, local_path):
     headers = {'User-Agent': 'Mozilla/5.0'}
     os.makedirs(os.path.dirname(local_path), exist_ok=True)
+    with requests.get(url, stream=True, headers=headers, timeout=30) as r:
+        with open(local_path, 'wb') as f:
+            shutil.copyfileobj(r.raw, f)
+def load_rag():
     download_file(URL_FAISS, os.path.join(DOWNLOAD_DIR, 'index.faiss'))
+    download_file(URL_PKL, os.path.join(DOWNLOAD_DIR, 'index.pkl'))
     embeddings = HuggingFaceEmbeddings(
         model_name="sentence-transformers/all-MiniLM-L6-v2",
     )
     vectorstore = FAISS.load_local(DB_FAISS_PATH, embeddings, allow_dangerous_deserialization=True)
+    # Asegúrate de que la Key esté en los Secrets de Hugging Face
+    llm = ChatGroq(temperature=0.1, model_name="openai/gpt-oss-120b")
+    retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
+    return (
+        CONDENSE_PROMPT | llm,
+        INTENT_PROMPT | llm,
+        SALUDO_PROMPT | llm,
+        ( {"context": retriever, "question": RunnablePassthrough()} | RAG_PROMPT | llm ),
+        retriever
     )
+# 5. INICIALIZACIÓN DE API
 app = FastAPI()
+condense_c, intent_c, saludo_c, rag_c, retriever = (None, None, None, None, None)
 @app.on_event("startup")
+async def startup():
+    global condense_c, intent_c, saludo_c, rag_c, retriever
+    condense_c, intent_c, saludo_c, rag_c, retriever = load_rag()
+@app.get("/")
+def root():
+    return {"status": "ready"}
 @app.post("/query")
 async def process_query(request: QueryRequest):
+    try:
+        # Convertir historial a texto
+        chat_str = "\n".join([f"U: {m[0]}\nB: {m[1]}" for m in request.history])
+        # Reescritura de pregunta
+        q_final = request.query
+        if request.history:
+            res_c = condense_c.invoke({"chat_history": chat_str, "question": request.query})
+            q_final = res_c.content.strip()
+        # Intención
+        res_i = intent_c.invoke({"query": q_final})
+        intent = res_i.content.upper()
+        if "SALUDO" in intent:
+            res_s = saludo_c.invoke({"query": request.query})
+            return {"response": res_s.content, "intent": "SALUDO"}
+        elif "OTRO" in intent:
+            return {"response": "Solo respondo sobre la UPT Aragua.", "intent": "OTRO"}
+        else:
+            # RAG
+            res_r = rag_c.invoke(q_final)
+            docs = retriever.invoke(q_final)
+            sources = list(set([d.metadata.get("source", "N/A") for d in docs]))
+            return {
+                "response": res_r.content,
+                "intent": "UNIVERSIDAD",
+                "sources": sources,
+                "contextual_query": q_final
+            }
+    except Exception as e:
+        # Aquí estaba tu error. Asegúrate de que esta línea esté
+        # alineada exactamente con el 'try:' de arriba.
+        return {"error": str(e)}
     except Exception as e:
         return {"error": f"Error al procesar la consulta: {e}"}