Spaces:

edurojas95
/

Kimun

Sleeping

App Files Files Community

edurojas95 commited on Mar 7

Commit

c983252

verified ·

1 Parent(s): 029e308

Upload app.py

Browse files

Files changed (1) hide show

app.py +114 -0

app.py ADDED Viewed

	@@ -0,0 +1,114 @@

+import streamlit as st
+import os
+from langchain_huggingface import HuggingFaceEmbeddings
+from langchain_community.vectorstores import Chroma
+from langchain_google_genai import ChatGoogleGenerativeAI
+# ==========================================
+# 1. CONFIGURACIÓN Y CRÉDITOS
+# ==========================================
+st.set_page_config(page_title="Kimün Chile", page_icon="🩸", layout="centered")
+st.title("🩸 Kimün: sabiduría")
+st.subheader(" Chatbot de Hematología Basado en Normativas MINSAL y SOCHIHEM")
+st.markdown("""
+**Desarrollado por:**
+* **TM Eduardo Rojas Maturana**
+* **Dr. TM Neftalí Guzmán Oyarzo**
+*Facultad de Ciencias de la Salud, Carrera de Tecnología Médica.* *Laboratorio de Investigación en Salud de Precisión, Universidad Católica de Temuco.*
+---
+""")
+# ==========================================
+# 2. CARGA DE BASE DE DATOS (Caché)
+# ==========================================
+@st.cache_resource(show_spinner="Cargando base de datos clínica...")
+def cargar_base_datos():
+    # Solo inicializamos el modelo de embeddings, no descargamos PDFs
+    embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")
+    # Apuntamos a la carpeta que subiste a Hugging Face
+    directorio_db = "./db_hematologia"
+    # Conectamos ChromaDB a esa carpeta
+    vectorstore = Chroma(persist_directory=directorio_db, embedding_function=embeddings)
+    # Buscador MMR para respuestas variadas y precisas
+    retriever = vectorstore.as_retriever(search_type="mmr", search_kwargs={"k": 15, "fetch_k": 40})
+    return retriever
+retriever = cargar_base_datos()
+# ==========================================
+# 3. CONFIGURACIÓN DEL MODELO (Gemini)
+# ==========================================
+api_key = os.environ.get("GEMINI_API_KEY")
+if not api_key:
+    st.error("⚠️ Error: Falta configurar la GEMINI_API_KEY en los secretos de Hugging Face.")
+    st.stop()
+# Usamos temperature=0.1 para que sea riguroso y académico
+llm = ChatGoogleGenerativeAI(model="gemini-2.5-flash", temperature=0.1, google_api_key=api_key)
+# ==========================================
+# 4. MEMORIA Y CHAT UI
+# ==========================================
+if "mensajes" not in st.session_state:
+    st.session_state.mensajes = [
+        {"role": "assistant", "content": "¡Hola! Soy Kimün. Ingresa tu consulta sobre guías clínicas, protocolos o diagnósticos hematológicos."}
+    ]
+# Dibujar historial
+for mensaje in st.session_state.mensajes:
+    with st.chat_message(mensaje["role"]):
+        st.markdown(mensaje["content"])
+# Entrada del usuario
+pregunta = st.chat_input("Ej: ¿Cuáles son los criterios diagnósticos para SMD según SOCHIHEM?")
+if pregunta:
+    # Mostramos la pregunta en pantalla
+    st.session_state.mensajes.append({"role": "user", "content": pregunta})
+    with st.chat_message("user"):
+        st.markdown(pregunta)
+    # Construimos el historial corto para dar contexto a la IA (Últimos 3 mensajes)
+    historial = ""
+    if len(st.session_state.mensajes) > 2:
+        ultimos_mensajes = st.session_state.mensajes[-4:-1]
+        historial = "\n".join([f"{m['role'].upper()}: {m['content']}" for m in ultimos_mensajes])
+    # Generamos la respuesta
+    with st.chat_message("assistant"):
+        with st.spinner("Buscando en la literatura clínica..."):
+            # Buscar en ChromaDB local
+            docs = retriever.invoke(pregunta)
+            contexto_unido = "\n\n---\n\n".join([doc.page_content for doc in docs])
+            prompt_final = f"""Eres un asistente académico experto en hematología, diseñado para enseñar a estudiantes de tecnología médica y medicina en Chile.
+            REGLAS ESTRICTAS:
+            1. Basa tu respuesta ÚNICAMENTE en el contexto recuperado de las bases de datos proporcionadas.
+            2. Si la respuesta no está, responde: 'Lo siento, esta información no se encuentra en las guías y libros ingresados en mi base de datos.' No inventes.
+            3. Lee el historial de la conversación para entender si el estudiante está haciendo una pregunta de seguimiento sobre una patología anterior.
+            4. Desarrolla la respuesta de forma estructurada, usando viñetas si hay listas de criterios o valores.
+            HISTORIAL DE LA CONVERSACIÓN RECIENTE:
+            {historial}
+            CONTEXTO RECUPERADO DE LA BASE DE DATOS:
+            {contexto_unido}
+            PREGUNTA ACTUAL DEL ESTUDIANTE:
+            {pregunta}
+            RESPUESTA ACADÉMICA:"""
+            respuesta = llm.invoke(prompt_final)
+            st.markdown(respuesta.content)
+    # Guardamos en memoria
+    st.session_state.mensajes.append({"role": "assistant", "content": respuesta.content})