Spaces:

Francogv
/

api-semantic

Sleeping

App Files Files Community

Francogv commited on Aug 31, 2025

Commit

fb8a717

verified ·

1 Parent(s): e87e27a

Update api_semantica.py

Browse files

Files changed (1) hide show

api_semantica.py +56 -51

api_semantica.py CHANGED Viewed

@@ -1,51 +1,56 @@
-from fastapi import FastAPI
-from pydantic import BaseModel
-from sentence_transformers import SentenceTransformer, util
-import numpy as np
-import json
-import uvicorn
-app = FastAPI()
-# Cargar el modelo
-modelo = SentenceTransformer("sentence-transformers/paraphrase-multilingual-mpnet-base-v2")
-# Cargar la base de embeddings
-with open("base_semantica.json", "r", encoding="utf-8") as f:
-    base = json.load(f)
-# Pydantic schema para entrada
-class PreguntaInput(BaseModel):
-    pregunta: str
-    top_k: int = 3
-# Función de búsqueda
-def buscar_semanticamente(pregunta, top_k=3):
-    emb_pregunta = modelo.encode(pregunta)
-    resultados = []
-    for item in base:
-        emb_item = np.array(item["embedding"], dtype=np.float32)
-        score = util.cos_sim(emb_pregunta, emb_item).item()
-        resultados.append((score, item))
-    resultados.sort(reverse=True, key=lambda x: x[0])
-    return resultados[:top_k]
-# Endpoint principal
-@app.post("/buscar")
-async def buscar(input: PreguntaInput):
-    resultados = buscar_semanticamente(input.pregunta, input.top_k)
-    return {
-        "pregunta": input.pregunta,
-        "resultados": [
-            {
-                "score": round(score, 4),
-                "titulo": item["titulo"],
-                "url": item["url"],
-                "texto": item["texto"]
-            } for score, item in resultados
-        ]
-    }
-# Para correr en Hugging Face
-if __name__ == "__main__":
-    uvicorn.run(app, host="0.0.0.0", port=7860)

+from fastapi import FastAPI
+from pydantic import BaseModel
+from sentence_transformers import SentenceTransformer, util
+import numpy as np
+import json
+import uvicorn
+import os
+os.environ["HF_HOME"] = "/data"
+os.environ["TRANSFORMERS_CACHE"] = "/data"
+os.environ["SENTENCE_TRANSFORMERS_HOME"] = "/data"
+app = FastAPI()
+# Cargar el modelo
+modelo = SentenceTransformer("sentence-transformers/paraphrase-multilingual-mpnet-base-v2")
+# Cargar la base de embeddings
+with open("base_semantica.json", "r", encoding="utf-8") as f:
+    base = json.load(f)
+# Pydantic schema para entrada
+class PreguntaInput(BaseModel):
+    pregunta: str
+    top_k: int = 3
+# Función de búsqueda
+def buscar_semanticamente(pregunta, top_k=3):
+    emb_pregunta = modelo.encode(pregunta)
+    resultados = []
+    for item in base:
+        emb_item = np.array(item["embedding"], dtype=np.float32)
+        score = util.cos_sim(emb_pregunta, emb_item).item()
+        resultados.append((score, item))
+    resultados.sort(reverse=True, key=lambda x: x[0])
+    return resultados[:top_k]
+# Endpoint principal
+@app.post("/buscar")
+async def buscar(input: PreguntaInput):
+    resultados = buscar_semanticamente(input.pregunta, input.top_k)
+    return {
+        "pregunta": input.pregunta,
+        "resultados": [
+            {
+                "score": round(score, 4),
+                "titulo": item["titulo"],
+                "url": item["url"],
+                "texto": item["texto"]
+            } for score, item in resultados
+        ]
+    }
+# Para correr en Hugging Face
+if __name__ == "__main__":
+    uvicorn.run(app, host="0.0.0.0", port=7860)