Spaces:

DiegoPerezPonce
/

python-rag-chatbot

No application file

App Files Files Community

DiegoPerezPonce commited on Mar 25

Commit

c9af776

verified ·

1 Parent(s): d1fe255

Upload 4 files

Browse files

Files changed (4) hide show

app.py +40 -0
documents.json +7 -0
rag_engine.py +72 -0
requirements.txt +8 -0

app.py ADDED Viewed

	@@ -0,0 +1,40 @@

+import gradio as gr
+from rag_engine import recuperar_documentos, generar_respuesta, preguntar
+def ask(query, top_k, umbral):
+    # Obtener documentos relevantes
+    docs_recuperados = recuperar_documentos(query, top_k, umbral)
+    # Generar respuesta usando la lógica del motor
+    respuesta = generar_respuesta(query, docs_recuperados)
+    # Formatear documentos para mostrarlos
+    docs_formateados = "\n\n---\n\n".join(docs_recuperados)
+    return respuesta, docs_formateados
+# Construcción de la Interfaz
+with gr.Blocks(title="RAG Hospital System") as demo:
+    gr.Markdown("# 🏥 Hospital Q&A System (RAG)")
+    gr.Markdown("Ask questions about contact details, hours, and services.")
+    with gr.Row():
+        with gr.Column():
+            input_text = gr.Textbox(label="Question", placeholder="E.g., What are the working hours?", lines=2)
+            slider_k = gr.Slider(minimum=1, maximum=5, value=5, step=1, label="Top K Documents")
+            slider_threshold = gr.Slider(minimum=0.0, maximum=1.0, value=0.55, step=0.05, label="Similarity Threshold")
+            btn = gr.Button("Send")
+        with gr.Column():
+            output_answer = gr.Textbox(label="Generated Answer", lines=3)
+            output_docs = gr.Textbox(label="Retrieved Context", lines=6, max_lines=15)
+    # Evento de clic
+    btn.click(
+        fn=ask,
+        inputs=[input_text, slider_k, slider_threshold],
+        outputs=[output_answer, output_docs]
+    )
+if __name__ == "__main__":
+    demo.launch()

documents.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "doc1": "Hospital contact details: You can contact the hospital at email testing@gmail.com, phone +911234567890, or visit us at xyz, abc, 1234, Nepal.",
+    "doc2": "Hospital's working hours: The hospital's working hours are 7:00 AM - 8:00 PM daily.",
+    "doc3": "Official email address: The official email address to contact the hospital is testing@gmail.com.",
+    "doc4": "Main services: We provide comprehensive healthcare services including emergency care, diagnostic testing, surgical procedures, maternity services, and specialized treatments.",
+    "doc5": "Hospital location: The hospital is located at xyz, abc, 1234, Nepal."
+}

rag_engine.py ADDED Viewed

	@@ -0,0 +1,72 @@

+import json
+import torch
+from sentence_transformers import SentenceTransformer, util
+from transformers import AutoTokenizer, AutoModelForCausalLM
+from sklearn.metrics.pairwise import cosine_similarity
+# --- Carga de Modelos y Datos ---
+# Modelo de embeddings
+embedding_model = SentenceTransformer("MongoDB/mdbr-leaf-ir")
+# Modelo de lenguaje y tokenizer
+model_name = "PleIAs/Pleias-RAG-350M"
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+llm_model = AutoModelForCausalLM.from_pretrained(model_name)
+# Cargar documentos
+with open("documents.json", "r", encoding="utf-8") as f:
+    docs_data = json.load(f)
+    # Extraemos solo el texto de los documentos
+    docs_texts = list(docs_data.values())
+# Precalcular embeddings de los documentos (una sola vez)
+docs_embeddings = embedding_model.encode(docs_texts)
+def recuperar_documentos(consulta, top_k=2, umbral=0.4):
+    """Recupera los documentos más similares a la consulta."""
+    # 1. Calcular embedding de la consulta
+    query_embedding = embedding_model.encode([consulta])
+    # 2. Calcular similitud del coseno
+    similitudes = cosine_similarity(query_embedding, docs_embeddings)[0]
+    # 3. Emparejar textos con sus similitudes y ordenar
+    docs_con_similitud = sorted(
+        zip(docs_texts, similitudes),
+        key=lambda x: x[1],
+        reverse=True
+    )
+    # 4. Filtrar por umbral y top_k
+    seleccionados = []
+    for texto, sim in docs_con_similitud:
+        if sim >= umbral and len(seleccionados) < top_k:
+            seleccionados.append(texto)
+    return seleccionados
+def generar_respuesta(consulta, documentos_recuperados):
+    """Genera una respuesta usando el contexto inyectado."""
+    # 1. Concatenar documentos
+    contexto = " ".join(documentos_recuperados)
+    # 2. Construir el prompt (formato exacto pedido)
+    prompt = f"Answer the question based only on the context provided\nContext: {contexto}\nQuestion: {consulta}\nAnswer:"
+    # 3. Generar respuesta
+    inputs = tokenizer(prompt, return_tensors="pt")
+    outputs = llm_model.generate(**inputs, max_new_tokens=150)
+    respuesta_completa = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    # Extraer solo la parte después de "Answer:"
+    respuesta = respuesta_completa.split("Answer:")[-1].strip()
+    return respuesta
+def preguntar(consulta, top_k=2, umbral=0.4):
+    """Función de alto nivel que une recuperación y generación."""
+    docs = recuperar_documentos(consulta, top_k, umbral)
+    if not docs:
+        return "I'm sorry, I couldn't find relevant information in the knowledge base."
+    respuesta = generar_respuesta(consulta, docs)
+    return respuesta

requirements.txt ADDED Viewed

	@@ -0,0 +1,8 @@

+torch
+transformers
+sentence-transformers
+scikit-learn
+fastapi
+uvicorn
+gradio
+pydantic