Spaces:

samiha123
/

chatbot

Sleeping

App Files Files Community

samiha123 commited on Jun 29, 2025

Commit

8235df4

verified ·

1 Parent(s): 3f86398

Update src/generation.py

Browse files

Files changed (1) hide show

src/generation.py +29 -30

src/generation.py CHANGED Viewed

@@ -1,33 +1,36 @@
 from langchain_groq import ChatGroq
 from langchain.schema import AIMessage, HumanMessage, SystemMessage
 import json
 class RAGGenerator:
-    def generate_answer(self, messages: list, solution: str, lang: str) -> str:
-        # Ajout dans la consigne de la détection et citation explicite des sources légales si présentes
         consigne = (
-            "Tu es un assistant technique. En te basant uniquement sur la solution finale fournie, "
-            "mets en évidence uniquement les éléments pertinents qui répondent à la question de l'utilisateur. "
-            "Formule ensuite une réponse claire, concise, strictement factuelle, précise et détaillée. "
-            "Ne contiens aucune personnalisation (pas de nom, de salutation, ni de remerciement). "
-            "Ne demande pas l'envoi de fichiers, captures d'écran, ou toute autre aide externe.\n"
-            "Si le texte contient des citations de lois, articles, décrets, règlements, codes, directives ou toute source officielle, "
-            "mentionne explicitement ces sources en citant leur nom ou référence."
-        )
         langue_instruction = {
             'fr': 'Réponds en français.',
             'en': 'Respond in English.',
             'es': 'Responde en español.',
             'de': 'Antworte auf Deutsch.',
-            'zh': '请用中文回答。'
         }
-        sys_msg = consigne + " " + langue_instruction.get(lang, '')
-        content = [SystemMessage(content=f"Utilise la solution finale suivante pour formuler la réponse :\n{solution}")]
         chat_history = [SystemMessage(content=sys_msg)] + [
             AIMessage(content=msg["content"]) if msg["role"] == "assistant" else HumanMessage(content=msg["content"])
@@ -35,7 +38,7 @@ class RAGGenerator:
         ] + content
         chat = ChatGroq(
-            model_name="meta-llama/llama-4-scout-17b-16e-instruct",
             temperature=0.2
         )
@@ -44,9 +47,9 @@ class RAGGenerator:
         return reply.content
-    def retrieve_qa(self, query: str, docs_scores: list = []) -> tuple:
         if not docs_scores:
-            raise ValueError("Aucun document trouvé pour la requête.")
         chat = ChatGroq(
             model_name="LLaMA3-8b-8192",
@@ -54,29 +57,33 @@ class RAGGenerator:
         )
         try:
             lang_detect_messages = [
-                SystemMessage(content="Détecte la langue ISO 639-1 de la phrase suivante (ex: 'fr', 'en', 'es'):"),
                 HumanMessage(content=query)
             ]
             lang_response = chat.invoke(lang_detect_messages)
             lang = lang_response.content.strip().lower()
         except Exception:
             lang = "en"
         first_doc, _ = docs_scores[0]
         try:
             qa_pairs = json.loads(first_doc.metadata.get('qa_pairs', '[]'))
             qa_pairs = [q for q in qa_pairs if q.get('question')]
         except json.JSONDecodeError:
-            raise ValueError("Métadonnée 'qa_pairs' invalide.")
-        # Traduction des questions dans la langue détectée
         if lang and qa_pairs:
             for pair in qa_pairs:
                 original_question = pair.get("question", "")
                 if original_question:
                     try:
                         messages = [
-                            SystemMessage(content=f"Traduis la question suivante en {lang}, uniquement la phrase traduite:"),
                             HumanMessage(content=original_question)
                         ]
                         response = chat.invoke(messages)
@@ -85,18 +92,10 @@ class RAGGenerator:
                         pass
         solutions = []
-        sources = set()  # Pour collecter les sources
         for doc, _ in docs_scores:
             sol = doc.metadata.get('solution_finale', '')
             if sol:
                 solutions.append(sol)
-            # Supposons que la source est stockée dans metadata sous 'source' ou 'origin'
-            src = doc.metadata.get('source') or doc.metadata.get('origin') or doc.metadata.get('reference')
-            if src:
-                sources.add(src)
         full_solution = "\n\n".join(solutions)
-        # Retourner aussi la liste des sources pour info / traçabilité
-        return qa_pairs, full_solution, lang, list(sources)

 from langchain_groq import ChatGroq
 from langchain.schema import AIMessage, HumanMessage, SystemMessage
 import json
+from langchain.schema import SystemMessage, HumanMessage
+from langchain_groq import ChatGroq
 class RAGGenerator:
+    def generate_answer(self,messages: list, solution: str, lang: str) -> str:
         consigne = (
+        "Te egy műszaki asszisztens vagy. A megadott végleges megoldás alapján "
+        "csak azokat a releváns elemeket emeld ki, amelyek válaszolnak a felhasználó kérdésére. "
+        "Ezután fogalmazz meg egy tiszta, tömör, szigorúan tényszerű, pontos és részletes választ. "
+        "NE tartalmazzon SEMMILYEN személyesítést (sem nevet, sem keresztnév, sem köszönést, sem köszönetet, sem aláírást). "
+        "NE tartalmazzon SEMMILYEN kérést fájlok, külső objektumok, képernyőképek küldésére "
+        "vagy bármilyen más, külső átvitelhez szükséges segítségnyújtást."
+    )
         langue_instruction = {
             'fr': 'Réponds en français.',
             'en': 'Respond in English.',
             'es': 'Responde en español.',
             'de': 'Antworte auf Deutsch.',
+            'zh': '请用中文回答。'
         }
+        sys_msg = consigne + ' ' + langue_instruction.get(lang, '')
+        content = [SystemMessage(content = f"A következő megoldás felhasználásával készítsd el az átfogalmazást: Végleges megoldás:\n{solution}")]
         chat_history = [SystemMessage(content=sys_msg)] + [
             AIMessage(content=msg["content"]) if msg["role"] == "assistant" else HumanMessage(content=msg["content"])
         ] + content
         chat = ChatGroq(
+            model_name="meta-llama/llama-4-scout-17b-16e-instruct",
             temperature=0.2
         )
         return reply.content
+    def retrieve_qa(self,query: str, docs_scores: list = []) -> tuple:
         if not docs_scores:
+            raise ValueError("Nem található dokumentum a lekérdezéshez.")
         chat = ChatGroq(
             model_name="LLaMA3-8b-8192",
         )
         try:
             lang_detect_messages = [
+                SystemMessage(content="Határozd meg a következő mondat nyelvét. Csak az ISO 639-1 nyelvkódot válaszold meg (pl. 'fr', 'en', 'es' stb.):"),
                 HumanMessage(content=query)
             ]
             lang_response = chat.invoke(lang_detect_messages)
             lang = lang_response.content.strip().lower()
         except Exception:
             lang = "en"
+        if not docs_scores:
+                raise ValueError("Aucun document pertinent trouvé après reranking.")
         first_doc, _ = docs_scores[0]
         try:
             qa_pairs = json.loads(first_doc.metadata.get('qa_pairs', '[]'))
             qa_pairs = [q for q in qa_pairs if q.get('question')]
         except json.JSONDecodeError:
+            raise ValueError("Érvénytelen a 'qa_pairs' metaadat.")
         if lang and qa_pairs:
             for pair in qa_pairs:
                 original_question = pair.get("question", "")
                 if original_question:
                     try:
                         messages = [
+                            SystemMessage(content=f"Fordítsd le a következő kérdést {lang} nyelvre, csak a lefordított mondatot add meg:"),
                             HumanMessage(content=original_question)
                         ]
                         response = chat.invoke(messages)
                         pass
         solutions = []
         for doc, _ in docs_scores:
             sol = doc.metadata.get('solution_finale', '')
             if sol:
                 solutions.append(sol)
         full_solution = "\n\n".join(solutions)
+        return qa_pairs, full_solution, lang