Spaces:

Marylene
/

OpenFoodFactsAgent_POC

Sleeping

App Files Files Community

Marylene commited on Sep 22, 2025

Commit

9ff51f8

verified ·

1 Parent(s): 133e275

Mise en forme

Browse files

Files changed (1) hide show

app.py +94 -16

app.py CHANGED Viewed

@@ -6,6 +6,36 @@ from contextlib import redirect_stdout, redirect_stderr
 # 👉 adapte le module si ton fichier agent a un autre nom
 from quick_deploy_agent import build_agent, parse_result
 # ---------- util "tee" pour dupliquer les logs ----------
 class _Tee(io.TextIOBase):
     def __init__(self, *streams): self.streams = streams
@@ -25,56 +55,104 @@ if hasattr(agent, "verbosity_level"):
     agent.verbosity_level = 3  # 0..3 (3 = très verbeux)
 # ---------- prompt interne (l'utilisateur ne tape rien) ----------
-TASK_TMPL = """
 Classe ce produit en COICOP:
 EAN: {ean}
 Libellé: {label}
-Pipeline:
 1) validate_ean(ean)
 2) openfoodfacts_product_by_ean(ean)
-3) map_off_to_coicop(off_payload=<retour brut de l'étape 2>)
-(ou, si nécessaire, map_off_to_coicop(product_name, categories_tags, ingredients_text))
-4) coicop_regex_rules(text=libellé)
-5) coicop_semantic_similarity(text=libellé, topk=5)
 6) resolve_coicop_candidates([...], topn=3)
-Contraintes:
-- Si libellé vide mais EAN présent, utilise le product_name issu de (2) comme texte pour (4) et (5).
-- Termine après (6) et retourne uniquement le JSON final.
 """
 def classify(label: str, ean: str):
     label = (label or "").strip()
     ean = (ean or "").strip()
     if not label and not ean:
         return json.dumps({"error": "Veuillez saisir un libellé ou un EAN."}, ensure_ascii=False, indent=2), "—"
     task = TASK_TMPL.format(ean=ean or "N/A", label=label or "N/A")
-    # Buffers UI + duplication vers logs Space
     buf_out, buf_err = io.StringIO(), io.StringIO()
     tee_out, tee_err = _Tee(sys.stdout, buf_out), _Tee(sys.stderr, buf_err)
     print("\n===== Agent run start =====")
     print(task)
     try:
         with redirect_stdout(tee_out), redirect_stderr(tee_err):
             res = agent.run(task)
-        try:
-            obj = parse_result(res)
-        except Exception:
-            obj = {"raw": res}
-        logs_ui = "\n".join(s for s in [buf_out.getvalue().strip(), buf_err.getvalue().strip()] if s) or "(aucun log)"
         print("===== Agent run end =====\n")
         return json.dumps(obj, ensure_ascii=False, indent=2), logs_ui
     except Exception as e:
-        logs_ui = "\n".join(s for s in [buf_out.getvalue().strip(), buf_err.getvalue().strip()] if s) or "(aucun log)"
         print(f"✖ Agent error: {e}")
         return json.dumps({"error": str(e)}, ensure_ascii=False, indent=2), logs_ui
 def fill_example():
     # EAN réel OFF (Les p'tits crémeux – Aldi – 216 g)
     return "Camembert au lait cru AOP 250g - ALDI", "2006050033638"

 # 👉 adapte le module si ton fichier agent a un autre nom
 from quick_deploy_agent import build_agent, parse_result
+# --- en haut de app.py, ajoute cet util ---
+import re
+def _extract_json(text: str):
+    """
+    Essaie de parser un JSON valable depuis une chaîne.
+    - d'abord json.loads direct
+    - sinon, extrait le contenu d'un bloc ```json ... ``` puis parse
+    - renvoie None si rien de valable
+    """
+    if isinstance(text, dict):
+        return text
+    if not isinstance(text, str):
+        return None
+    # 1) direct
+    try:
+        return json.loads(text)
+    except Exception:
+        pass
+    # 2) dans des backticks
+    try:
+        m = re.search(r"```(?:json)?\s*(\{[\s\S]*\})\s*```", text)
+        if m:
+            return json.loads(m.group(1))
+    except Exception:
+        pass
+    return None
 # ---------- util "tee" pour dupliquer les logs ----------
 class _Tee(io.TextIOBase):
     def __init__(self, *streams): self.streams = streams
     agent.verbosity_level = 3  # 0..3 (3 = très verbeux)
 # ---------- prompt interne (l'utilisateur ne tape rien) ----------
+TASK_TMPL = """\
 Classe ce produit en COICOP:
 EAN: {ean}
 Libellé: {label}
+Outils autorisés UNIQUEMENT : validate_ean, openfoodfacts_product_by_ean,
+map_off_to_coicop, coicop_regex_rules, coicop_semantic_similarity, resolve_coicop_candidates.
+N'UTILISE PAS python_interpreter. N'ÉCRIS PAS DE CODE. N'INDEXE JAMAIS la sortie d'un tool.
+Pipeline :
 1) validate_ean(ean)
 2) openfoodfacts_product_by_ean(ean)
+3) map_off_to_coicop(off_payload=<sortie brute de (2)>) ou, si nécessaire,
+   map_off_to_coicop(product_name, categories_tags, ingredients_text)
+4) coicop_regex_rules(text=LIBELLÉ UTILISATEUR)
+5) coicop_semantic_similarity(text=LIBELLÉ UTILISATEUR, topk=5)
 6) resolve_coicop_candidates([...], topn=3)
+Règles strictes :
+- Pour (4) et (5), UTILISE EXCLUSIVEMENT le libellé fourni par l'utilisateur (ne lis pas la réponse OFF).
+- Si le libellé est vide, effectue (4) et (5) avec une chaîne vide (pas d'indexation JSON).
+Sortie :
+- Retourne UNIQUEMENT un objet JSON valide, sans backticks, sans prose.
 """
 def classify(label: str, ean: str):
+    import re
     label = (label or "").strip()
     ean = (ean or "").strip()
     if not label and not ean:
         return json.dumps({"error": "Veuillez saisir un libellé ou un EAN."}, ensure_ascii=False, indent=2), "—"
+    # Construire le message pour l’agent
     task = TASK_TMPL.format(ean=ean or "N/A", label=label or "N/A")
+    # Buffers UI + duplication vers logs Space (stdout/stderr)
     buf_out, buf_err = io.StringIO(), io.StringIO()
     tee_out, tee_err = _Tee(sys.stdout, buf_out), _Tee(sys.stderr, buf_err)
+    # Utilitaire local : extraire un vrai JSON d'une chaîne (gère les ```json ... ```)
+    def _extract_json(text: str):
+        if isinstance(text, dict):
+            return text
+        if not isinstance(text, str):
+            return None
+        # 1) direct
+        try:
+            return json.loads(text)
+        except Exception:
+            pass
+        # 2) JSON dans des backticks
+        try:
+            m = re.search(r"```(?:json)?\s*(\{[\s\S]*\})\s*```", text)
+            if m:
+                return json.loads(m.group(1))
+        except Exception:
+            pass
+        return None
     print("\n===== Agent run start =====")
     print(task)
     try:
+        # Exécuter l’agent en dupliquant les logs vers l’UI et le Space
         with redirect_stdout(tee_out), redirect_stderr(tee_err):
             res = agent.run(task)
+        # Parsing robuste du résultat
+        obj = None
+        if isinstance(res, dict):
+            obj = res
+        if obj is None:
+            obj = _extract_json(res)
+        if obj is None:
+            try:
+                obj = parse_result(res)  # ton parseur existant
+            except Exception:
+                obj = None
+        if obj is None:
+            obj = {"raw": str(res)}  # dernier recours
+        logs_ui = "\n".join(
+            s for s in [buf_out.getvalue().strip(), buf_err.getvalue().strip()] if s
+        ) or "(aucun log)"
         print("===== Agent run end =====\n")
         return json.dumps(obj, ensure_ascii=False, indent=2), logs_ui
     except Exception as e:
+        logs_ui = "\n".join(
+            s for s in [buf_out.getvalue().strip(), buf_err.getvalue().strip()] if s
+        ) or "(aucun log)"
         print(f"✖ Agent error: {e}")
         return json.dumps({"error": str(e)}, ensure_ascii=False, indent=2), logs_ui
 def fill_example():
     # EAN réel OFF (Les p'tits crémeux – Aldi – 216 g)
     return "Camembert au lait cru AOP 250g - ALDI", "2006050033638"