Spaces:

UPTC
/

Recomendador_Cod

Sleeping

App Files Files Community

Romanes commited on Nov 5, 2025

Commit

dce718d

verified ·

1 Parent(s): c7e1de1

Update app.py

Browse files

Files changed (1) hide show

app.py +42 -6

app.py CHANGED Viewed

@@ -65,6 +65,43 @@ def parse_code_name(codes_raw: str, text_original: str) -> Tuple[str, str]:
     name = (re.search(r"NOMBRE\s*:\s*([^|]+)", codes_raw, flags=re.I) or re.search(r"NOMBRE\s*:\s*([^|]+)", text_original, flags=re.I))
     return (code.group(1).strip() if code else ""), (name.group(1).strip() if name else "")
 # =========================
 # Reglas
 # =========================
@@ -713,12 +750,11 @@ def recomendar(query: str):
     parsed = df.apply(lambda r: parse_code_name(r.get("codes_raw",""), r.get("text_original","")), axis=1)
     df["Código"] = [c for c,_ in parsed]; df["Nombre"] = [n for _,n in parsed]
-    out = (df[["Catálogo","Código","Nombre","Similaridad"]]
-           .sort_values("Similaridad", ascending=False)
-           .head(TOP_N)
-           .reset_index(drop=True))
-    if out.empty: return pd.DataFrame(), "Sin candidatos."
-    return out, "OK"
 # =========================
 # Exportar (xlsx con fallback a csv)

     name = (re.search(r"NOMBRE\s*:\s*([^|]+)", codes_raw, flags=re.I) or re.search(r"NOMBRE\s*:\s*([^|]+)", text_original, flags=re.I))
     return (code.group(1).strip() if code else ""), (name.group(1).strip() if name else "")
+# --- añade esto cerca de tus utilidades, debajo de parse_code_name ---
+ORDER_CATS = ["CICP", "CPC", "UNSPSC"]
+def normalize_unspsc_if_cpc_901(rows):
+    """rows: lista de dicts [{'Catálogo','Código','Nombre','Similaridad'}]"""
+    out = []
+    for r in rows:
+        if r["Catálogo"] == "CPC" and str(r["Código"]).strip() == "901":
+            out.append({"Catálogo":"UNSPSC","Código":"N/A","Nombre":"N/A","Similaridad":1.0})
+        else:
+            out.append(r)
+    return out
+def order_and_fill_one_per_catalog(df):
+    """Garantiza 1 por catálogo (CICP,CPC,UNSPSC), con orden fijo y normalización 901->N/A."""
+    # Tomar el mejor por catálogo
+    best = (
+        df.sort_values("Similaridad", ascending=False)
+          .groupby("Catálogo", as_index=False)
+          .head(1)
+    )
+    # Pasar a lista para poder normalizar UNSPSC si CPC=901
+    rows = [{"Catálogo":r["Catálogo"], "Código":r["Código"], "Nombre":r["Nombre"], "Similaridad":r["Similaridad"]}
+            for _, r in best.iterrows()]
+    rows = normalize_unspsc_if_cpc_901(rows)
+    # Asegurar orden y devolver sólo los catálogos esperados
+    ordered = [r for r in rows if r["Catálogo"] in ORDER_CATS]
+    ordered.sort(key=lambda x: ORDER_CATS.index(x["Catálogo"]))
+    # Si alguno faltó, crear placeholders vacíos (opcional)
+    seen = {r["Catálogo"] for r in ordered}
+    for cat in ORDER_CATS:
+        if cat not in seen:
+            ordered.append({"Catálogo":cat, "Código":"", "Nombre":"", "Similaridad":0.0})
+    ordered.sort(key=lambda x: ORDER_CATS.index(x["Catálogo"]))
+    return pd.DataFrame(ordered, columns=["Catálogo","Código","Nombre","Similaridad"])
 # =========================
 # Reglas
 # =========================
     parsed = df.apply(lambda r: parse_code_name(r.get("codes_raw",""), r.get("text_original","")), axis=1)
     df["Código"] = [c for c,_ in parsed]; df["Nombre"] = [n for _,n in parsed]
+    # ⬇️ NUEVO: 1 por catálogo, orden CICP→CPC→UNSPSC y normalización CPC=901
+    df = df[["Catálogo","Código","Nombre","Similaridad"]]
+    df_out = order_and_fill_one_per_catalog(df)
+    return df_out, "OK"
 # =========================
 # Exportar (xlsx con fallback a csv)