Spaces:

LCA
/

PART_API_ENDPOINT

Sleeping

App Files Files Community

LCA commited on Jun 20, 2025

Commit

2fd6167

verified ·

1 Parent(s): 885ae73

mise à jour du prompt

Browse files

Files changed (1) hide show

app.py +32 -44

app.py CHANGED Viewed

@@ -9,7 +9,6 @@ from huggingface_hub import InferenceClient
 from datasets import load_dataset
 import json
 DATASET_REPO = "LCA/HACKATHON_PARTS"
 dataset = load_dataset(DATASET_REPO, split="train")
@@ -18,7 +17,6 @@ df = dataset.to_pandas()
 descriptions = df['DESIGNATION'].tolist()
 codes = df["CODE"].astype(str).tolist()
 # --- Embedding model ---
 embedding_model = SentenceTransformer("all-MiniLM-L6-v2")
@@ -40,7 +38,8 @@ else:
 # client = InferenceClient("HuggingFaceH4/zephyr-7b-beta", token=os.getenv("HF_TOKEN"))
 def rechercher_article(articleSource):
     source = articleSource["designation"]
     query_embedding = embedding_model.encode([source], convert_to_numpy=True)
     faiss.normalize_L2(query_embedding)
@@ -48,46 +47,41 @@ def rechercher_article(articleSource):
     similarity_scores, indices = index.search(query_embedding, k=1)
     # Gérer la qualité du retour avec un seuil de similarité
     threshold = 0.7  # à ajuster selon vos tests
     if similarity_scores[0][0] < threshold:
-        print(f"Score de similarité trop faible ({similarity_scores[0][0]:.2f}) pour '{source}'")
-        return "UNKNOWN"
-    article = {}
-    article["code"] = codes[indices[0][0]]
-    article["designation"] = descriptions[indices[0][0]]
-    article["source"] = source
-    article["quantite"] = articleSource.get("quantite", None)
-    print(f"Code trouvé pour '{source}': {article['code']} / {article['designation']}")
     return article
 def respond(message):
     # Prompt par défaut
-    custom_prompt = """Tu es un analyseur de messages expert.
     Ta mission est de déterminer dans le messages fourni quels sont les articles qui sont demandés et pour quelle quantité.
-    La réponse est au format json et donne 2 informations par article identifié : la désignation et le nombre
-    La désignation est formé du type d'article et des caractéristiques comme la matière ou les dimensions
-    Ne retourne que le JSON.
     """
-    # query_embedding = embedding_model.encode([message], convert_to_numpy=True)
-    # faiss.normalize_L2(query_embedding)
-    # _, indices = index.search(query_embedding, k=5)
-    # context = "\n".join([f"{codes[i]}: {descriptions[i]}" for i in indices[0]])
-    # Utilise le prompt personnalisé
-    # message = custom_prompt.format(message=message)
     messages = [{"role": "system", "content": custom_prompt}]
     messages +=  [{"role": "user", "content": message}]
-    # full_response = client.text_generation(message)
     client = InferenceClient("HuggingFaceH4/zephyr-7b-beta", token=os.getenv("HF_TOKEN"))
     # client = InferenceClient(
     #     "deepseek-ai/DeepSeek-R1-Distill-Qwen-32B",
@@ -102,13 +96,17 @@ def respond(message):
         max_tokens=512,
         stream=True,
         temperature=0.1,
-        top_p=0.8,
     ):
         token = chunk.choices[0].delta.content
         if token:
             full_response += token
             # yield full_response.replace("\n", "\n\n")
     # If you expect a JSON response, you can try to parse it here
     # import json
     # try:
@@ -118,8 +116,7 @@ def respond(message):
         articles = []
         for article in data.get("articles", []):
             found_article = rechercher_article(article)
-            if found_article != "UNKNOWN":
-                articles.append(found_article)
         order["articles"] = articles
         # Ajouter les champs destinataire et delai avec des valeurs figées
         order["destinataire"] = {
@@ -148,15 +145,7 @@ with gr.Blocks() as demo:
     def chat(message):
         history = []  # ou récupère l'historique si tu veux le gérer
         gen = respond(message)
-        # full_response = ""
-        # for response in gen:
-        #     full_response = full_response + response
-        # On renvoie la dernière réponse et le contexte utilisé
-        # Il faut recalculer le contexte ici pour l'afficher
-        # query_embedding = embedding_model.encode([message], convert_to_numpy=True)
-        # faiss.normalize_L2(query_embedding)
-        # _, indices = index.search(query_embedding, k=5)
-        # context = "\n".join([f"{codes[i]}: {descriptions[i]}" for i in indices[0]])
         return json.dumps(gen, indent=2, ensure_ascii=False)
     send_btn.click(
@@ -166,5 +155,4 @@ with gr.Blocks() as demo:
     )
 if __name__ == "__main__":
-    demo.launch(share=True)

 from datasets import load_dataset
 import json
 DATASET_REPO = "LCA/HACKATHON_PARTS"
 dataset = load_dataset(DATASET_REPO, split="train")
 descriptions = df['DESIGNATION'].tolist()
 codes = df["CODE"].astype(str).tolist()
 # --- Embedding model ---
 embedding_model = SentenceTransformer("all-MiniLM-L6-v2")
 # client = InferenceClient("HuggingFaceH4/zephyr-7b-beta", token=os.getenv("HF_TOKEN"))
 def rechercher_article(articleSource):
+    print(f"Recherch article pour {articleSource}")
+    article = {}
     source = articleSource["designation"]
     query_embedding = embedding_model.encode([source], convert_to_numpy=True)
     faiss.normalize_L2(query_embedding)
     similarity_scores, indices = index.search(query_embedding, k=1)
     # Gérer la qualité du retour avec un seuil de similarité
     threshold = 0.7  # à ajuster selon vos tests
+    print(f"Score de similarité ({similarity_scores[0][0]:.2f}) pour '{source}'")
     if similarity_scores[0][0] < threshold:
+        article["code"] = "Inconnu"
+        article["designation"] = source
+        article["source"] = source
+        article["quantite"] = articleSource.get("quantite", None)
+        print(f"Code non trouvé pour '{source}'")
+    else:
+        article["code"] = codes[indices[0][0]]
+        article["designation"] = descriptions[indices[0][0]]
+        article["source"] = source
+        article["quantite"] = articleSource.get("quantite", None)
+        print(f"Code trouvé pour '{source}': {article['code']} / {article['designation']}")
     return article
 def respond(message):
+    print(" ------------------ ")
+    print(message)
+    print(" ------------------ ")
     # Prompt par défaut
+    custom_prompt = """Tu es un programme chargé de générer un fichier JSON à partir d'un message.
     Ta mission est de déterminer dans le messages fourni quels sont les articles qui sont demandés et pour quelle quantité.
+    La réponse est au format json et donne uniquement une liste d'article.
+    Pour chaque article 2 informations par article identifié : la désignation et le nombre
+    La désignation peut être est formée du type d'article et des caractéristiques comme la matière ou les dimensions
+    Return only JSON content.
     """
     messages = [{"role": "system", "content": custom_prompt}]
     messages +=  [{"role": "user", "content": message}]
     client = InferenceClient("HuggingFaceH4/zephyr-7b-beta", token=os.getenv("HF_TOKEN"))
     # client = InferenceClient(
     #     "deepseek-ai/DeepSeek-R1-Distill-Qwen-32B",
         max_tokens=512,
         stream=True,
         temperature=0.1,
+        top_p=0.1,
     ):
         token = chunk.choices[0].delta.content
         if token:
             full_response += token
             # yield full_response.replace("\n", "\n\n")
+    print("---- retour de l'analyse")
+    print(full_response)
+    print("")
     # If you expect a JSON response, you can try to parse it here
     # import json
     # try:
         articles = []
         for article in data.get("articles", []):
             found_article = rechercher_article(article)
+            articles.append(found_article)
         order["articles"] = articles
         # Ajouter les champs destinataire et delai avec des valeurs figées
         order["destinataire"] = {
     def chat(message):
         history = []  # ou récupère l'historique si tu veux le gérer
         gen = respond(message)
         return json.dumps(gen, indent=2, ensure_ascii=False)
     send_btn.click(
     )
 if __name__ == "__main__":
+    demo.launch(share=True)