Spaces:

Marylene
/

OpenFoodFactsAgent_POC

Sleeping

App Files Files Community

Marylene commited on Sep 23, 2025

Commit

b6dc1cd

verified ·

1 Parent(s): 5ede9de

Update quick_deploy_agent.py

Browse files

Files changed (1) hide show

quick_deploy_agent.py +38 -20

quick_deploy_agent.py CHANGED Viewed

@@ -5,11 +5,15 @@ import requests
 from smolagents import Tool, CodeAgent, InferenceClientModel
 from sentence_transformers import SentenceTransformer, util
 FALLBACK_MODELS = [
-    # ordre de préférence ; tous dispos en Inference API publique
-    "meta-llama/Meta-Llama-3.1-8B-Instruct",
-    "mistralai/Mistral-7B-Instruct-v0.3",
     "Qwen/Qwen2.5-7B-Instruct",
 ]
@@ -633,33 +637,46 @@ class Resolve(Tool):
 # ---- build_agent ----
 def build_agent(model_id: str | None = None) -> CodeAgent:
-    mid = model_id or os.getenv("HF_MODEL_ID") or "meta-llama/Meta-Llama-3.1-8B-Instruct"
     model = InferenceClientModel(
         model_id=mid,
         temperature=0.2,
-        max_tokens=512,   # chat_completion param
-        timeout=60,
         top_p=0.95,
     )
     agent = CodeAgent(
-        tools=[
-            ValidateEANTool(),
-            OFFByEAN(),
-            RegexCOICOP(),
-            OFFtoCOICOP(),
-            SemSim(),
-            WebSearch(),     # <-- autorise recherche web
-            WebGet(),        # <-- autorise lecture de pages
-            MergeCandidatesTool(),
-            Resolve(),
-        ],
         model=model,
         add_base_tools=False,
-        max_steps=8,        # un peu plus de marge si web utilisé
-        verbosity_level=2,
     )
     return agent
 def parse_result(res):
     if isinstance(res, dict): return res
     try: return ast.literal_eval(res)
@@ -704,5 +721,6 @@ if __name__ == "__main__":
     Retourne uniquement un JSON valide (objet), sans backticks.
     """
-    out = agent.run(task)
     print(parse_result(out))

 from smolagents import Tool, CodeAgent, InferenceClientModel
 from sentence_transformers import SentenceTransformer, util
+# --- Config runtime via env (avec valeurs par défaut sûres sur Space) ---
+HF_TIMEOUT = int(os.getenv("HF_TIMEOUT", "180"))        # 180s au lieu de 60s
+HF_MAX_TOKENS = int(os.getenv("HF_MAX_TOKENS", "384"))  # réduire un peu la génération
+AGENT_MAX_STEPS = int(os.getenv("AGENT_MAX_STEPS", "6"))
+# Ordre: un modèle préféré, puis 2 replis rapides et dispo publique
 FALLBACK_MODELS = [
+    os.getenv("HF_MODEL_ID") or "meta-llama/Meta-Llama-3.1-8B-Instruct",
     "Qwen/Qwen2.5-7B-Instruct",
+    "HuggingFaceH4/zephyr-7b-beta",
 ]
 # ---- build_agent ----
 def build_agent(model_id: str | None = None) -> CodeAgent:
+    mid = model_id or FALLBACK_MODELS[0]
     model = InferenceClientModel(
         model_id=mid,
         temperature=0.2,
+        max_tokens=HF_MAX_TOKENS,
+        timeout=HF_TIMEOUT,      # ⬅️ timeout augmenté
         top_p=0.95,
     )
     agent = CodeAgent(
+        tools=[ValidateEANTool(), OFFByEAN(), RegexCOICOP(), OFFtoCOICOP(), SemSim(),
+               WebSearch(), WebGet(),
+               MergeCandidatesTool(), Resolve()],
         model=model,
         add_base_tools=False,
+        max_steps=AGENT_MAX_STEPS,  # ⬅️ moins d’étapes = moins de tokens/latence
+        verbosity_level=1,          # ⬅️ logs plus courts = moins de tokens sortants
     )
     return agent
+# ---- run task with fallback ----
+def run_task_with_fallback(task: str):
+    errors = []
+    for mid in [m for m in FALLBACK_MODELS if m]:
+        try:
+            agent = build_agent(mid)
+            return agent.run(task)
+        except Exception as e:
+            errors.append(f"{mid}: {type(e).__name__}: {e}")
+            # on tente le modèle suivant
+            continue
+    # Si TOUT a échoué, renvoyer un JSON propre plutôt qu’un crash
+    return {
+        "final": None,
+        "alternatives": [],
+        "candidates_top": [],
+        "explanation": "LLM backend indisponible (timeouts).",
+        "errors": errors,
+    }
 def parse_result(res):
     if isinstance(res, dict): return res
     try: return ast.literal_eval(res)
     Retourne uniquement un JSON valide (objet), sans backticks.
     """
+    # out = agent.run(task)
+    out = run_task_with_fallback(task)
     print(parse_result(out))