Spaces:

Guillaumedbx
/

AssistantJuridique2

Sleeping

App Files Files Community

Guillaumedbx commited on Jun 27, 2025

Commit

e8d52de

1 Parent(s): 4accd60

adaptation prompt

Browse files

Files changed (1) hide show

src/streamlit_app.py +41 -21

src/streamlit_app.py CHANGED Viewed

@@ -42,9 +42,12 @@ def generate_response(prompt, tokenizer, model):
             top_p=0.9
         )
     text = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    # Nettoyage optionnel : couper avant [RESPONSE] si tu utilises ce tag
     if "[RESPONSE]" in text:
         text = text.split("[RESPONSE]", 1)[-1].strip()
     return text
 st.set_page_config(page_title="Assistant Juridique IA", layout="wide")
@@ -147,36 +150,53 @@ if st.button("📤 Envoyer") and user_input.strip():
                     unsafe_allow_html=True
                 )
-    # Préparation d'un prompt optimisé pour Falcon, tenant compte du score de pertinence
     context_text = "\n\n".join([
         f"<doc pertinence={score:.2f}>\n{doc.page_content.strip()}\n</doc>"
         for doc, score, pertinence in filtered_docs
     ])
-    prompt = f"""
-    <s>
-    [INSTRUCTION]
-    Vous êtes un assistant juridique spécialisé en droit français.
-    Votre tâche est de proposer une réponse synthétique et argumentée à la question suivante, en vous appuyant uniquement sur les extraits de documents fournis, classés par pertinence.
-    Indiquez clairement si la réponse est incertaine ou partielle.
-    Répondez en français.
-    Question : {user_input}
-    Contexte documentaire (avec pertinence) :
-    {context_text}
-    [RESPONSE]
-    """
     # Génération des deux réponses en colonnes, d'abord le modèle le plus rapide (flan-t5-small)
     col1, col2 = st.columns(2)
     with col1:
         with st.spinner("Génération de la réponse (flan-t5-small)..."):
-            output_flan = generate_response(prompt, flan_tokenizer, flan_model)
         st.subheader("Réponse (flan-t5-small)")
-        st.write(output_flan)
     with col2:
         with st.spinner("Génération de la réponse (t5-base-fr-sum-cnndm)..."):
-            output_plg = generate_response(prompt, plg_tokenizer, plg_model)
         st.subheader("Réponse (t5-base-fr-sum-cnndm)")
-        st.write(output_plg)

             top_p=0.9
         )
     text = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    # Si le tag [RESPONSE] n'est pas généré, on affiche tout
     if "[RESPONSE]" in text:
         text = text.split("[RESPONSE]", 1)[-1].strip()
+    # Si la réponse est vide, on affiche la sortie brute
+    if not text.strip():
+        return tokenizer.decode(outputs[0], skip_special_tokens=True)
     return text
 st.set_page_config(page_title="Assistant Juridique IA", layout="wide")
                     unsafe_allow_html=True
                 )
+    # Préparation du contexte documentaire (doit être défini avant les prompts)
     context_text = "\n\n".join([
         f"<doc pertinence={score:.2f}>\n{doc.page_content.strip()}\n</doc>"
         for doc, score, pertinence in filtered_docs
     ])
+    # Définition des mots-clés pour chaque modèle
+    flan_keywords = {"question": "Question", "context": "Contexte documentaire", "response": "Réponse"}
+    plg_keywords = {"question": "question", "context": "contexte", "response": "résumé"}
+    # Prompt template commun
+    def build_prompt(keywords):
+        return f"""
+Vous êtes un assistant juridique spécialisé en droit français.
+Votre tâche est de proposer une réponse synthétique et argumentée à la {keywords['question']} suivante, en vous appuyant uniquement sur les extraits de documents fournis, classés par pertinence.
+Indiquez clairement si la {keywords['response']} est incertaine ou partielle.
+Répondez en français.
+{keywords['question']} : {user_input}
+{keywords['context']} :
+{context_text}
+"""
+    prompt_flan = build_prompt(flan_keywords)
+    prompt_plg = build_prompt(plg_keywords)
     # Génération des deux réponses en colonnes, d'abord le modèle le plus rapide (flan-t5-small)
     col1, col2 = st.columns(2)
+    output_flan = None
+    output_plg = None
     with col1:
         with st.spinner("Génération de la réponse (flan-t5-small)..."):
+            try:
+                output_flan = generate_response(prompt_flan, flan_tokenizer, flan_model)
+            except Exception as e:
+                st.error(f"Erreur génération flan-t5-small : {e}")
         st.subheader("Réponse (flan-t5-small)")
+        if output_flan:
+            st.write(output_flan)
+        else:
+            st.info("Aucune réponse générée par flan-t5-small.")
     with col2:
         with st.spinner("Génération de la réponse (t5-base-fr-sum-cnndm)..."):
+            try:
+                output_plg = generate_response(prompt_plg, plg_tokenizer, plg_model)
+            except Exception as e:
+                st.error(f"Erreur génération t5-base-fr-sum-cnndm : {e}")
         st.subheader("Réponse (t5-base-fr-sum-cnndm)")
+        if output_plg:
+            st.write(output_plg)
+        else:
+            st.info("Aucune réponse générée par t5-base-fr-sum-cnndm.")