Spaces:

pharma-IA
/

MCP_Public_Server

Sleeping

App Files Files Community

geronimo-pericoli commited on Apr 29, 2025

Commit

3bc496b

verified ·

1 Parent(s): 8b49bfd

Update server.py

Browse files

Files changed (1) hide show

server.py +33 -24

server.py CHANGED Viewed

@@ -42,6 +42,7 @@ Settings.embed_model = embed_model
 DOCUMENTS_BASE_PATH = "./"
 RETRIEVERS_JSON_PATH = Path("./retrievers.json")
@@ -63,6 +64,7 @@ indices: Dict[str, VectorStoreIndex] = {}
 for source, rel_path in SOURCES.items():
     full_path = os.path.join(DOCUMENTS_BASE_PATH, rel_path)
     if not os.path.exists(full_path):
         continue
     for root, dirs, files in os.walk(full_path):
@@ -77,6 +79,7 @@ for source, rel_path in SOURCES.items():
@@ -86,14 +89,21 @@ mcp = FastMCP("OnBase", port=port)
 @mcp.resource(
     uri="info://available_retrievers",
     name="AvailableRetrievers",
-    description="Lista completa de retrievers disponibles",
     mime_type="application/json"
 )
 def get_available_retrievers() -> dict:
-    # Generar automáticamente la lista desde el JSON
     available = []
     for source, indexes in retrievers_metadata.items():
@@ -101,16 +111,17 @@ def get_available_retrievers() -> dict:
             available.append({
                 "name": index_name,
                 "source": source,
                 "description": metadata.get("description", ""),
-                "content_info": metadata.get("content_info", "")
             })
     return {
         "retrievers": available,
-        "sources": list(retrievers_metadata.keys()),
         "count": len(available)
     }
 @mcp.tool()
 def retrieve_docs(
     query: str,
@@ -118,21 +129,17 @@ def retrieve_docs(
     top_k: int = 3
 ) -> dict:
     """
-    Realiza búsqueda semántica en los documentos indexados.
     Parámetros:
-        query (str, requerido): Texto de búsqueda. Ejemplo: "vacunas COVID-19"
-        retrievers (List[str], requerido): Lista de nombres de retrievers a consultar.
-                                          Ejemplo: ["vec_who_1", "fda_tree_1"]
-        top_k (int, opcional): Número máximo de resultados por retriever. Default: 3
-    Retorna:
-        dict
-    Ejemplo de uso:
         retrieve_docs(
-            query="guías de vacunación",
-            retrievers=["vec_who_2"],
             top_k=2
         )
     """
@@ -148,16 +155,15 @@ def retrieve_docs(
             retriever = indices[name].as_retriever(similarity_top_k=top_k)
             nodes = retriever.retrieve(query)
-            # Obtener metadatos del JSON
-            metadata = {}
-            source = "unknown"
-            for src, indexes in retrievers_metadata.items():
-                if name in indexes:
-                    metadata = indexes[name]
-                    source = src
-                    break
             results[name] = {
                 "documents": [
                     {
                         "content": node.get_content(),
@@ -167,7 +173,10 @@ def retrieve_docs(
                     for node in nodes
                 ],
                 "description": metadata.get("description", ""),
-                "source": source
             }
         except Exception as e:
             results[name] = {"error": str(e)}

+# Configuración de paths
 DOCUMENTS_BASE_PATH = "./"
 RETRIEVERS_JSON_PATH = Path("./retrievers.json")
 for source, rel_path in SOURCES.items():
     full_path = os.path.join(DOCUMENTS_BASE_PATH, rel_path)
     if not os.path.exists(full_path):
+        print(f"Advertencia: No se encontró la ruta para {source}")
         continue
     for root, dirs, files in os.walk(full_path):
+# Resource para listar retrievers
 @mcp.resource(
     uri="info://available_retrievers",
     name="AvailableRetrievers",
+    description="Lista todos los retrievers disponibles con sus metadatos",
     mime_type="application/json"
 )
 def get_available_retrievers() -> dict:
+    """
+    Devuelve lista completa de retrievers con:
+    - Nombre del índice
+    - Título del documento
+    - Descripción
+    - Fecha de actualización
+    """
     available = []
     for source, indexes in retrievers_metadata.items():
             available.append({
                 "name": index_name,
                 "source": source,
+                "title": metadata.get("title", ""),
                 "description": metadata.get("description", ""),
+                "last_updated": metadata.get("last_updated", "")
             })
     return {
         "retrievers": available,
         "count": len(available)
     }
+# Función principal de búsqueda
 @mcp.tool()
 def retrieve_docs(
     query: str,
     top_k: int = 3
 ) -> dict:
     """
+    Realiza búsqueda semántica en documentos indexados.
     Parámetros:
+        query (str): Texto de búsqueda (requerido)
+        retrievers (List[str]): Nombres de retrievers a consultar (requerido)
+        top_k (int): Número de resultados por retriever (opcional, default=3)
+    Ejemplo:
         retrieve_docs(
+            query="estándares farmacéuticos",
+            retrievers=["vec_who_1"],
             top_k=2
         )
     """
             retriever = indices[name].as_retriever(similarity_top_k=top_k)
             nodes = retriever.retrieve(query)
+            # Obtener metadatos
+            metadata = next(
+                (meta for src in retrievers_metadata.values()
+                 for idx, meta in src.items() if idx == name),
+                {}
+            )
             results[name] = {
+                "title": metadata.get("title", name),
                 "documents": [
                     {
                         "content": node.get_content(),
                     for node in nodes
                 ],
                 "description": metadata.get("description", ""),
+                "source": next(
+                    (s for s, idx in retrievers_metadata.items() if name in idx),
+                    "unknown"
+                )
             }
         except Exception as e:
             results[name] = {"error": str(e)}