APISAvant2

Running

App Files Files Community

antonypamo commited on Dec 11, 2025

Commit

1aacddb

verified ·

1 Parent(s): 777913e

Update app.py

Browse files

Files changed (1) hide show

app.py +60 -7

app.py CHANGED Viewed

@@ -18,6 +18,7 @@ import joblib
 import torch
 import torch.nn as nn
 # ============================
@@ -32,7 +33,8 @@ META_LOGIT_REPO      = "antonypamo/RRFSavantMetaLogit"
 META_LOGIT_FILENAME  = "logreg_rrf_savant_15.joblib"  # versión 15 features
 # Dataset central con TODOS los artefactos RRF/Savant
-RRF_DATASET_REPO     = "antonypamo/savant_rrf1_curated"
 def hf_data_path(filename: str) -> str:
@@ -113,7 +115,7 @@ PHYS_ADJ_13               = safe_hf("adjacency_13.csv")
 # ============================
-# Savant CNN + nodos RRF (demo futura)
 # ============================
 class SavantCNN(nn.Module):
@@ -534,8 +536,6 @@ def apply_role_profile(scores: Dict[str, float], role_name: Optional[str]) -> Di
 # RRF Tutor: carga de dataset savant_rrf1_curated
 # ============================
-from datasets import load_dataset
 print(f"🔄 [Startup] Cargando dataset para RRF Tutor: {RRF_TUTOR_DATASET_ID}...", flush=True)
 ds_rrf = None
 rrf_corpus_texts: List[str] = []
@@ -590,6 +590,56 @@ except Exception as e:
     print("⚠️ [RRF Tutor] Endpoint /v1/rrf_tutor devolverá error 503 si se usa.", flush=True)
 # ============================
 # FastAPI models
 # ============================
@@ -847,10 +897,13 @@ def rrf_tutor_endpoint(body: RRFTutorRequest):
     if not body.query or not body.query.strip():
         raise HTTPException(status_code=400, detail="El campo 'query' no puede estar vacío.")
-    if rrf_corpus_embeds is None or len(rrf_corpus_embeds) == 0:
         raise HTTPException(
-            status_code=500,
-            detail="El dataset/embeddings de RRF Tutor no están disponibles en este momento.",
         )
     try:

 import torch
 import torch.nn as nn
+from datasets import load_dataset
 # ============================
 META_LOGIT_FILENAME  = "logreg_rrf_savant_15.joblib"  # versión 15 features
 # Dataset central con TODOS los artefactos RRF/Savant
+RRF_DATASET_REPO      = "antonypamo/savant_rrf1_curated"
+RRF_TUTOR_DATASET_ID  = RRF_DATASET_REPO  # mismo repo para Tutor
 def hf_data_path(filename: str) -> str:
 # ============================
+# Savant CNN + nodos RRF (demo interna)
 # ============================
 class SavantCNN(nn.Module):
 # RRF Tutor: carga de dataset savant_rrf1_curated
 # ============================
 print(f"🔄 [Startup] Cargando dataset para RRF Tutor: {RRF_TUTOR_DATASET_ID}...", flush=True)
 ds_rrf = None
 rrf_corpus_texts: List[str] = []
     print("⚠️ [RRF Tutor] Endpoint /v1/rrf_tutor devolverá error 503 si se usa.", flush=True)
+def rrf_tutor_retrieve_examples(query: str, top_k: int = 3):
+    """
+    Recupera los ejemplos más similares desde savant_rrf1_curated
+    usando embeddings del encoder RRF.
+    """
+    if (not rrf_tutor_ready) or rrf_corpus_embeds is None or len(rrf_corpus_embeds) == 0:
+        raise RuntimeError("Embeddings de RRF Tutor no están disponibles.")
+    q_emb = encoder.encode([query], convert_to_numpy=True, normalize_embeddings=True)[0]
+    sims = np.dot(rrf_corpus_embeds, q_emb)
+    top_k = min(top_k, len(rrf_corpus_embeds))
+    top_idx = np.argsort(-sims)[:top_k]
+    results = []
+    for idx in top_idx:
+        results.append(
+            {
+                "idx": int(idx),
+                "score": float(sims[idx]),
+                "prompt": rrf_corpus_prompts[idx],
+                "completion": rrf_corpus_completions[idx],
+            }
+        )
+    return results
+def rrf_tutor_build_answer(query: str, retrieved_examples):
+    """
+    Construye una respuesta simple basada en el mejor ejemplo del corpus.
+    """
+    if not retrieved_examples:
+        return (
+            "No encontré ejemplos relevantes en el dataset RRF Tutor para tu consulta. "
+            "Verifica que antonypamo/savant_rrf1_curated contenga 'prompt' y 'completion'."
+        )
+    best = retrieved_examples[0]
+    base_completion = best["completion"]
+    answer = (
+        "🔎 Respuesta basada en el ejemplo más cercano del corpus RRF:\n\n"
+        f"{base_completion}\n\n"
+        "💡 Nota: Esta es una versión mínima que reutiliza directamente la 'completion' "
+        "del ejemplo más similar en savant_rrf1_curated. En una versión extendida, aquí "
+        "se conectaría un LLM pequeño que combine varios ejemplos como contexto."
+    )
+    return answer
 # ============================
 # FastAPI models
 # ============================
     if not body.query or not body.query.strip():
         raise HTTPException(status_code=400, detail="El campo 'query' no puede estar vacío.")
+    if not rrf_tutor_ready:
         raise HTTPException(
+            status_code=503,
+            detail=(
+                "RRF Tutor no está listo: embeddings no cargados. "
+                "Verifica el dataset antonypamo/savant_rrf1_curated y reinicia el Space."
+            ),
         )
     try: