Spaces:

AgamP
/

llm_recommendation_backend

Running

AgamP commited on Dec 17, 2025

Commit

30d16ab

verified ·

1 Parent(s): be305b9

Update agent/server.py

Files changed (1) hide show

agent/server.py CHANGED Viewed

@@ -38,6 +38,8 @@ from tools.rerank_tool import rerank_candidates
 from tools.constraints_tool import apply_constraints
 class ChatRequest(BaseModel):
     query: str
     clarification_answer: Optional[str] = None
@@ -178,9 +180,7 @@ def _format_test_types(meta: dict) -> list[str]:
 def _run_pipeline(query: str, topn: int = 200, verbose: bool = False, llm_model: Optional[str] = None):
-    if verbose:
-        # For debugging, bypass cached resources to ensure fresh state
-        load_resources.cache_clear()
     df_catalog, bm25, vec, reranker, lookup, vocab, llm_extractor, catalog_by_id = load_resources(llm_model_override=llm_model)
     plan = _build_plan_with_fallback(query, vocab=vocab, llm_extractor=llm_extractor)
     cand_set = retrieve_candidates(plan, bm25, vec, topn=topn, catalog_df=df_catalog)

 from tools.constraints_tool import apply_constraints
+os.environ.setdefault("HF_HOME", "/home/user/.cache/huggingface")
 class ChatRequest(BaseModel):
     query: str
     clarification_answer: Optional[str] = None
 def _run_pipeline(query: str, topn: int = 200, verbose: bool = False, llm_model: Optional[str] = None):
     df_catalog, bm25, vec, reranker, lookup, vocab, llm_extractor, catalog_by_id = load_resources(llm_model_override=llm_model)
     plan = _build_plan_with_fallback(query, vocab=vocab, llm_extractor=llm_extractor)
     cand_set = retrieve_candidates(plan, bm25, vec, topn=topn, catalog_df=df_catalog)