Spaces:

samiha123
/

chatbot

Sleeping

App Files Files Community

samiha123 commited on Jun 29, 2025

Commit

ecd0d07

verified ·

1 Parent(s): e09c69d

Update src/generation.py

Browse files

Files changed (1) hide show

src/generation.py +39 -34

src/generation.py CHANGED Viewed

@@ -3,36 +3,36 @@ from langchain.schema import AIMessage, HumanMessage, SystemMessage
 import json
 class RAGGenerator:
-    def generate_answer(self, messages: list, solution: str, lang: str, raw_context: str = "") -> str:
-        """
-        Génère une réponse basée sur la solution finale et le texte brut, avec consignes pour ne pas omettre
-        les lois ou sources citées, en langue hongroise.
-        """
-        # Instructions en hongrois avec inclusion explicite des lois/sources
         consigne = (
-            "Te egy műszaki asszisztens vagy. A végleges megoldás és a nyers szöveg alapján "
-            "készíts egy világos, tömör, tényszerű, pontos és részletes választ a felhasználó kérdésére. "
-            "A válaszban minden jogi, szabályozási vagy hivatkozott forrás (pl. törvény, cikk, rendelet, szakasz, kódex, irányelv stb.) "
-            "szerepeljen pontosan úgy, ahogy az a szövegben található. Ezeket soha ne hagyd ki, még ha csak közvetve is utalnak rájuk. "
-            "A válasz NE tartalmazzon semmilyen megszemélyesítést, köszöntést, nevet, aláírást vagy kérdést fájlok küldésére."
         )
-        context_msg = SystemMessage(content=f"""
-Ez a nyers szöveg, amely dokumentumokból származik:
-{raw_context}
-Ez pedig az előre kiszűrt végleges megoldás:
-{solution}
-""")
-        chat_history = [SystemMessage(content=consigne)] + [
-            AIMessage(content=msg["content"]) if msg["role"] == "assistant" else HumanMessage(content=msg["content"])
             for msg in messages
-        ] + [context_msg]
         chat = ChatGroq(
             model_name="meta-llama/llama-4-scout-17b-16e-instruct",
@@ -40,11 +40,13 @@ Ez pedig az előre kiszűrt végleges megoldás:
         )
         reply = chat.invoke(chat_history)
         return reply.content
     def retrieve_qa(self, query: str, docs_scores: list = []) -> tuple:
         if not docs_scores:
-            raise ValueError("Nem található dokumentum a lekérdezéshez.")
         chat = ChatGroq(
             model_name="LLaMA3-8b-8192",
@@ -52,28 +54,29 @@ Ez pedig az előre kiszűrt végleges megoldás:
         )
         try:
             lang_detect_messages = [
-                SystemMessage(content="Határozd meg a következő mondat nyelvét. Csak az ISO 639-1 nyelvkódot válaszold meg (pl. 'fr', 'en', 'es' stb.):"),
                 HumanMessage(content=query)
             ]
             lang_response = chat.invoke(lang_detect_messages)
             lang = lang_response.content.strip().lower()
         except Exception:
-            lang = "en"
         first_doc, _ = docs_scores[0]
         try:
             qa_pairs = json.loads(first_doc.metadata.get('qa_pairs', '[]'))
             qa_pairs = [q for q in qa_pairs if q.get('question')]
         except json.JSONDecodeError:
-            raise ValueError("Érvénytelen a 'qa_pairs' metaadat.")
         if lang and qa_pairs:
             for pair in qa_pairs:
                 original_question = pair.get("question", "")
                 if original_question:
                     try:
                         messages = [
-                            SystemMessage(content=f"Fordítsd le a következő kérdést {lang} nyelvre, csak a lefordított mondatot add meg:"),
                             HumanMessage(content=original_question)
                         ]
                         response = chat.invoke(messages)
@@ -82,16 +85,18 @@ Ez pedig az előre kiszűrt végleges megoldás:
                         pass
         solutions = []
-        full_texts = []
         for doc, _ in docs_scores:
             sol = doc.metadata.get('solution_finale', '')
-            text = doc.page_content or ''
             if sol:
                 solutions.append(sol)
-            if text:
-                full_texts.append(text)
         full_solution = "\n\n".join(solutions)
-        raw_context = "\n\n".join(full_texts)
-        return qa_pairs, full_solution, raw_context, lang

 import json
 class RAGGenerator:
+    def generate_answer(self, messages: list, solution: str, lang: str) -> str:
+        # Ajout dans la consigne de la détection et citation explicite des sources légales si présentes
         consigne = (
+            "Tu es un assistant technique. En te basant uniquement sur la solution finale fournie, "
+            "mets en évidence uniquement les éléments pertinents qui répondent à la question de l'utilisateur. "
+            "Formule ensuite une réponse claire, concise, strictement factuelle, précise et détaillée. "
+            "Ne contiens aucune personnalisation (pas de nom, de salutation, ni de remerciement). "
+            "Ne demande pas l'envoi de fichiers, captures d'écran, ou toute autre aide externe.\n"
+            "Si le texte contient des citations de lois, articles, décrets, règlements, codes, directives ou toute source officielle, "
+            "mentionne explicitement ces sources en citant leur nom ou référence."
         )
+        langue_instruction = {
+            'fr': 'Réponds en français.',
+            'en': 'Respond in English.',
+            'es': 'Responde en español.',
+            'de': 'Antworte auf Deutsch.',
+            'zh': '请用中文回答。'
+        }
+        sys_msg = consigne + " " + langue_instruction.get(lang, '')
+        content = [SystemMessage(content=f"Utilise la solution finale suivante pour formuler la réponse :\n{solution}")]
+        chat_history = [SystemMessage(content=sys_msg)] + [
+            AIMessage(content=msg["content"]) if msg["role"] == "assistant" else HumanMessage(content=msg["content"])
             for msg in messages
+        ] + content
         chat = ChatGroq(
             model_name="meta-llama/llama-4-scout-17b-16e-instruct",
         )
         reply = chat.invoke(chat_history)
         return reply.content
     def retrieve_qa(self, query: str, docs_scores: list = []) -> tuple:
         if not docs_scores:
+            raise ValueError("Aucun document trouvé pour la requête.")
         chat = ChatGroq(
             model_name="LLaMA3-8b-8192",
         )
         try:
             lang_detect_messages = [
+                SystemMessage(content="Détecte la langue ISO 639-1 de la phrase suivante (ex: 'fr', 'en', 'es'):"),
                 HumanMessage(content=query)
             ]
             lang_response = chat.invoke(lang_detect_messages)
             lang = lang_response.content.strip().lower()
         except Exception:
+            lang = "en"
         first_doc, _ = docs_scores[0]
         try:
             qa_pairs = json.loads(first_doc.metadata.get('qa_pairs', '[]'))
             qa_pairs = [q for q in qa_pairs if q.get('question')]
         except json.JSONDecodeError:
+            raise ValueError("Métadonnée 'qa_pairs' invalide.")
+        # Traduction des questions dans la langue détectée
         if lang and qa_pairs:
             for pair in qa_pairs:
                 original_question = pair.get("question", "")
                 if original_question:
                     try:
                         messages = [
+                            SystemMessage(content=f"Traduis la question suivante en {lang}, uniquement la phrase traduite:"),
                             HumanMessage(content=original_question)
                         ]
                         response = chat.invoke(messages)
                         pass
         solutions = []
+        sources = set()  # Pour collecter les sources
         for doc, _ in docs_scores:
             sol = doc.metadata.get('solution_finale', '')
             if sol:
                 solutions.append(sol)
+            # Supposons que la source est stockée dans metadata sous 'source' ou 'origin'
+            src = doc.metadata.get('source') or doc.metadata.get('origin') or doc.metadata.get('reference')
+            if src:
+                sources.add(src)
         full_solution = "\n\n".join(solutions)
+        # Retourner aussi la liste des sources pour info / traçabilité
+        return qa_pairs, full_solution, lang, list(sources)