Spaces:

CCPA-GAIA
/

GAIA26CCPA

Sleeping

Commit

13bb974

1 Parent(s): f6b9880

Modifs J2 (#9)

- modifications fichiers (181215fa357447fd447554c01d6383df7397a221)
- update layout (058b0ec65a4d420604eab0a217a02bf37f6fa7b0)

Files changed (4) hide show

src/app.py +270 -31
src/config.py +3 -2
src/logigramme.json +8 -11
src/proxy_log.py +150 -0

src/app.py CHANGED Viewed

@@ -5,13 +5,19 @@ des matières premières pour aliments composés.
 Lancement : streamlit run app.py
 """
 import re
 import streamlit as st
 import pandas as pd
 from flowchart_engine import evaluate_carbon_impact, CarbonResult
 import llm_service
 import data_loader
 import config
 # ============================================================================
@@ -120,16 +126,18 @@ st.divider()
 # ============================================================================
 # ONGLETS PRINCIPAUX
 # ============================================================================
-tab_formulation, tab_single = st.tabs(["📊 Formulation produit", "🔍 Recherche unitaire"])
 # ============================================================================
 # TAB 1 : FORMULATION PRODUIT
 # ============================================================================
 with tab_formulation:
-    st.subheader("📊 Tableau de formulation — Calcul d'impact complet")
     st.markdown("""
-    Remplissez le tableau ci-dessous avec les matières premières de votre formulation.
     - **Code MP** : code interne de la matière première
     - **Matière première** : nom usuel
     - **Type MP** : Végétale/Animale, Soja ou Minérale (détermine le logigramme)
@@ -138,32 +146,79 @@ with tab_formulation:
     """)
     # --- Initialiser le DataFrame éditable dans session_state ---
     if "formulation_df" not in st.session_state:
-        st.session_state["formulation_df"] = pd.DataFrame({
-            "Code MP": ["", "", "", "", ""],
-            "Matière première": ["", "", "", "", ""],
-            "Type MP": ["vegetal_animal", "vegetal_animal", "vegetal_animal", "vegetal_animal", "vegetal_animal"],
-            "Pays production": ["", "", "", "", ""],
-            "Pays transformation": ["", "", "", "", ""],
-            "% Appro origine": [100.0, 100.0, 100.0, 100.0, 100.0],
-        })
     # --- Boutons d'action ---
-    col_add, col_clear, _ = st.columns([1, 1, 3])
     with col_add:
         if st.button("➕ Ajouter une ligne", key="btn_add_row"):
-            new_row = pd.DataFrame({
-                "Code MP": [""],
-                "Matière première": [""],
-                "Type MP": ["vegetal_animal"],
-                "Pays production": [""],
-                "Pays transformation": [""],
-                "% Appro origine": [100.0],
-            })
             st.session_state["formulation_df"] = pd.concat(
-                [st.session_state["formulation_df"], new_row], ignore_index=True
             )
             st.rerun()
     with col_clear:
         if st.button("🗑️ Réinitialiser", key="btn_clear_form"):
             st.session_state.pop("formulation_df", None)
@@ -187,14 +242,13 @@ with tab_formulation:
             ),
             "Pays production": st.column_config.TextColumn("Pays production", width="medium"),
             "Pays transformation": st.column_config.TextColumn("Pays transformation", width="medium"),
             "% Appro origine": st.column_config.NumberColumn("% Appro origine", min_value=0, max_value=100, step=0.1, format="%.1f"),
         },
     )
     # Synchroniser les éditions
     st.session_state["formulation_df"] = edited_df
-    # --- Bouton calcul ---
-    st.markdown("---")
     if st.button("🚀 Calculer l'impact de la formulation", type="primary", use_container_width=True, key="btn_calc_formulation"):
         # Filtrer les lignes valides
         rows_to_eval = edited_df[edited_df["Matière première"].astype(str).str.strip() != ""].copy()
@@ -235,18 +289,36 @@ with tab_formulation:
                 # Forfait transport
                 transport_val, transport_zone = _get_transport_surcharge(pays_p)
-                # Impact total = impact unitaire + forfait transport
                 if impact_kg_t is not None:
-                    impact_avec_transport = impact_kg_t + transport_val
                 else:
                     impact_avec_transport = None
-                # Impact pondéré = (impact + transport) × (% appro / 100)
                 if impact_avec_transport is not None:
                     impact_pondere = impact_avec_transport * (pct_appro / 100.0)
                 else:
                     impact_pondere = None
                 results_list.append({
                     "Code MP": code_mp,
                     "Matière première": mp_name,
@@ -257,10 +329,13 @@ with tab_formulation:
                     "Impact unitaire (kg CO2 eq/t)": round(impact_kg_t, 2) if impact_kg_t else None,
                     "Zone transport": transport_zone,
                     "Forfait transport (kg CO2 eq/t)": transport_val,
-                    "Impact + transport (kg CO2 eq/t)": round(impact_avec_transport, 2) if impact_avec_transport else None,
                     "Impact pondéré (kg CO2 eq/t)": round(impact_pondere, 2) if impact_pondere else None,
-                    "Intrant utilisé": res.intrant_utilise or "",
                     "Source": res.source_db or "",
                     "Match exact": "✅" if res.match_exact else "⚠️",
                     "Erreur": res.erreur or "",
                 })
@@ -284,12 +359,40 @@ with tab_formulation:
             column_config={
                 "Impact unitaire (kg CO2 eq/t)": st.column_config.NumberColumn(format="%.2f"),
                 "Forfait transport (kg CO2 eq/t)": st.column_config.NumberColumn(format="%.0f"),
-                "Impact + transport (kg CO2 eq/t)": st.column_config.NumberColumn(format="%.2f"),
                 "Impact pondéré (kg CO2 eq/t)": st.column_config.NumberColumn(format="%.2f"),
                 "% Appro origine": st.column_config.NumberColumn(format="%.1f"),
             },
         )
         # --- Résumé par Code MP ---
         st.subheader("📋 Résumé par matière première")
@@ -417,6 +520,11 @@ with tab_single:
                 )
         st.markdown("---")
         run_button = st.button(
             "🚀 Évaluer l'impact carbone", type="primary", use_container_width=True
         )
@@ -484,6 +592,27 @@ with tab_single:
         st.session_state["last_matiere"] = matiere.strip()
         st.session_state.pop("searched_alternatives", None)
     # ========================================================================
     # Affichage des résultats (depuis session_state — persiste entre reruns)
     # ========================================================================
@@ -567,15 +696,25 @@ with tab_single:
                     transport_val, transport_zone = _get_transport_surcharge(
                         result.pays_production
                     )
-                    impact_total = impact_kg_t + transport_val
                     st.metric(
                         label=f"🚚 Forfait transport ({transport_zone})",
                         value=f"+{transport_val:.0f}",
                         delta="kg CO2 eq / t",
                     )
                     st.metric(
-                        label="🌍 Impact TOTAL (MP + transport)",
                         value=f"{impact_total:.2f}",
                         delta="kg CO2 eq / t produit",
                     )
@@ -720,6 +859,26 @@ with tab_single:
                         with st.spinner(f"Évaluation de {mp}..."):
                             res = evaluate_carbon_impact(mp, pays_p, pays_t)
                         results_list.append({
                             "Matière première": mp,
                             "Pays production": pays_p or "",
@@ -762,6 +921,86 @@ with tab_single:
             st.error(f"Erreur lors de la lecture du fichier : {e}")
 # ============================================================================
 # Footer
 # ============================================================================

 Lancement : streamlit run app.py
 """
 import re
+import sys
+import os
 import streamlit as st
 import pandas as pd
+# Ajouter le dossier src/ au path pour les imports
+sys.path.insert(0, os.path.join(os.path.dirname(__file__), "src"))
 from flowchart_engine import evaluate_carbon_impact, CarbonResult
 import llm_service
 import data_loader
 import config
+import proxy_log
 # ============================================================================
 # ============================================================================
 # ONGLETS PRINCIPAUX
 # ============================================================================
+tab_formulation, tab_single, tab_stats = st.tabs(
+    ["📊 Calcul par liste de MP", "🔍 Calcul unitaire", "📈 Statistiques proxies"]
+)
 # ============================================================================
 # TAB 1 : FORMULATION PRODUIT
 # ============================================================================
 with tab_formulation:
+    st.subheader("📊 Calcul d'impact par liste de matières premières")
     st.markdown("""
+    Remplissez le tableau ci-dessous avec les matières premières.
     - **Code MP** : code interne de la matière première
     - **Matière première** : nom usuel
     - **Type MP** : Végétale/Animale, Soja ou Minérale (détermine le logigramme)
     """)
     # --- Initialiser le DataFrame éditable dans session_state ---
+    _EMPTY_ROW = {
+        "Code MP": "",
+        "Matière première": "",
+        "Type MP": "vegetal_animal",
+        "Pays production": "",
+        "Pays transformation": "",
+        "Extrusion": False,
+        "% Appro origine": 100.0,
+    }
     if "formulation_df" not in st.session_state:
+        st.session_state["formulation_df"] = pd.DataFrame([_EMPTY_ROW.copy() for _ in range(5)])
     # --- Boutons d'action ---
+    col_add, col_del, col_import, col_clear, _ = st.columns([1, 1, 1, 1, 2])
     with col_add:
         if st.button("➕ Ajouter une ligne", key="btn_add_row"):
             st.session_state["formulation_df"] = pd.concat(
+                [st.session_state["formulation_df"], pd.DataFrame([_EMPTY_ROW.copy()])],
+                ignore_index=True,
             )
             st.rerun()
+    with col_del:
+        if st.button("➖ Retirer dernière ligne", key="btn_del_row"):
+            if len(st.session_state["formulation_df"]) > 1:
+                st.session_state["formulation_df"] = (
+                    st.session_state["formulation_df"].iloc[:-1].reset_index(drop=True)
+                )
+                st.rerun()
+            else:
+                st.warning("⚠️ Le tableau doit contenir au moins une ligne.")
+    with col_import:
+        _import_file = st.file_uploader(
+            "📥 Importer tableau Excel",
+            type=["xlsx", "xls"],
+            key="btn_import_formulation",
+            label_visibility="collapsed",
+        )
+        if _import_file is not None:
+            try:
+                _df_imp = pd.read_excel(_import_file)
+                # Mapper les colonnes connues
+                _col_map = {}
+                for _c in _df_imp.columns:
+                    _cl = str(_c).lower()
+                    if "code" in _cl:
+                        _col_map["Code MP"] = _c
+                    elif "matière" in _cl or "matiere" in _cl or ("mp" in _cl and "code" not in _cl):
+                        _col_map["Matière première"] = _c
+                    elif "type" in _cl:
+                        _col_map["Type MP"] = _c
+                    elif "production" in _cl or ("pays" in _cl and "transf" not in _cl):
+                        _col_map["Pays production"] = _c
+                    elif "transf" in _cl:
+                        _col_map["Pays transformation"] = _c
+                    elif "extru" in _cl:
+                        _col_map["Extrusion"] = _c
+                    elif "appro" in _cl or "%" in _cl:
+                        _col_map["% Appro origine"] = _c
+                _new_df = pd.DataFrame([_EMPTY_ROW.copy() for _ in range(len(_df_imp))])
+                for target, src in _col_map.items():
+                    _new_df[target] = _df_imp[src].astype(str).fillna("")
+                if "% Appro origine" in _col_map:
+                    _new_df["% Appro origine"] = pd.to_numeric(
+                        _df_imp[_col_map["% Appro origine"]], errors="coerce"
+                    ).fillna(100.0)
+                if "Extrusion" in _col_map:
+                    _new_df["Extrusion"] = _df_imp[_col_map["Extrusion"]].astype(bool)
+                st.session_state["formulation_df"] = _new_df
+                st.session_state.pop("formulation_results", None)
+                st.success(f"✅ {len(_new_df)} lignes importées.")
+                st.rerun()
+            except Exception as _e:
+                st.error(f"Erreur d'import : {_e}")
     with col_clear:
         if st.button("🗑️ Réinitialiser", key="btn_clear_form"):
             st.session_state.pop("formulation_df", None)
             ),
             "Pays production": st.column_config.TextColumn("Pays production", width="medium"),
             "Pays transformation": st.column_config.TextColumn("Pays transformation", width="medium"),
+            "Extrusion": st.column_config.CheckboxColumn("Extrusion", help="Cocher si la MP subit une extrusion (+56,77 kg CO2 eq/t)", width="small"),
             "% Appro origine": st.column_config.NumberColumn("% Appro origine", min_value=0, max_value=100, step=0.1, format="%.1f"),
         },
     )
     # Synchroniser les éditions
     st.session_state["formulation_df"] = edited_df
     if st.button("🚀 Calculer l'impact de la formulation", type="primary", use_container_width=True, key="btn_calc_formulation"):
         # Filtrer les lignes valides
         rows_to_eval = edited_df[edited_df["Matière première"].astype(str).str.strip() != ""].copy()
                 # Forfait transport
                 transport_val, transport_zone = _get_transport_surcharge(pays_p)
+                # Forfait extrusion
+                is_extrusion = bool(row.get("Extrusion", False))
+                extrusion_val = config.FORFAIT_EXTRUSION if is_extrusion else 0.0
+                # Impact total = impact unitaire + transport + extrusion
                 if impact_kg_t is not None:
+                    impact_avec_transport = impact_kg_t + transport_val + extrusion_val
                 else:
                     impact_avec_transport = None
+                # Impact pondéré = (impact + transport + extrusion) × (% appro / 100)
                 if impact_avec_transport is not None:
                     impact_pondere = impact_avec_transport * (pct_appro / 100.0)
                 else:
                     impact_pondere = None
+                # --- Enregistrer le proxy choisi (formulation) ---
+                if res.intrant_utilise:
+                    proxy_log.log_selection(
+                        matiere_recherchee=mp_name,
+                        proxy_choisi=res.intrant_utilise,
+                        scenario=res.node_resultat or "inconnu",
+                        impact_kg_co2_t=impact_kg_t,
+                        source_db=res.source_db or "",
+                        match_exact=res.match_exact,
+                        pays_production=pays_p or "",
+                        pays_transformation=pays_t or "",
+                        type_mp=type_mp_val,
+                    )
                 results_list.append({
                     "Code MP": code_mp,
                     "Matière première": mp_name,
                     "Impact unitaire (kg CO2 eq/t)": round(impact_kg_t, 2) if impact_kg_t else None,
                     "Zone transport": transport_zone,
                     "Forfait transport (kg CO2 eq/t)": transport_val,
+                    "Extrusion": "✅" if is_extrusion else "",
+                    "Forfait extrusion (kg CO2 eq/t)": extrusion_val if is_extrusion else 0.0,
+                    "Impact total (kg CO2 eq/t)": round(impact_avec_transport, 2) if impact_avec_transport else None,
                     "Impact pondéré (kg CO2 eq/t)": round(impact_pondere, 2) if impact_pondere else None,
+                    "Proxy utilisé": res.intrant_utilise or "",
                     "Source": res.source_db or "",
+                    "Scénario (node)": res.node_resultat or "",
                     "Match exact": "✅" if res.match_exact else "⚠️",
                     "Erreur": res.erreur or "",
                 })
             column_config={
                 "Impact unitaire (kg CO2 eq/t)": st.column_config.NumberColumn(format="%.2f"),
                 "Forfait transport (kg CO2 eq/t)": st.column_config.NumberColumn(format="%.0f"),
+                "Forfait extrusion (kg CO2 eq/t)": st.column_config.NumberColumn(format="%.2f"),
+                "Impact total (kg CO2 eq/t)": st.column_config.NumberColumn(format="%.2f"),
                 "Impact pondéré (kg CO2 eq/t)": st.column_config.NumberColumn(format="%.2f"),
                 "% Appro origine": st.column_config.NumberColumn(format="%.1f"),
             },
         )
+        # --- Bouton pour proposer des scénarios sur les lignes en erreur ---
+        df_errors = df_results[df_results["Erreur"].astype(str).str.strip() != ""]
+        if len(df_errors) > 0:
+            st.warning(
+                f"⚠️ **{len(df_errors)} ligne(s)** n'ont pas pu être évaluées. "
+                "Vous pouvez lancer une recherche d'alternatives pour ces matières."
+            )
+            if st.button(
+                "🔍 Proposer des scénarios pour les lignes en erreur",
+                key="btn_scenario_errors",
+                type="primary",
+            ):
+                for _idx, _err_row in df_errors.iterrows():
+                    _mp_err = _err_row["Matière première"]
+                    _pays_hint = _err_row.get("Pays production", "") or _err_row.get("Pays transformation", "")
+                    st.markdown(f"#### 🔎 Alternatives pour **{_mp_err}**")
+                    with st.spinner(f"Recherche d'alternatives pour {_mp_err}…"):
+                        _alts = llm_service.find_alternative_materials(
+                            _mp_err,
+                            db_name="GFLI",
+                            country_hint=_pays_hint if _pays_hint else None,
+                        )
+                    if _alts:
+                        _display_4_alternatives(_alts, title=f"🎯 Alternatives pour {_mp_err}")
+                    else:
+                        st.info(f"Aucune alternative trouvée pour {_mp_err}.")
         # --- Résumé par Code MP ---
         st.subheader("📋 Résumé par matière première")
                 )
         st.markdown("---")
+        extrusion_single = st.checkbox(
+            "🔧 Forfait extrusion (+56,77 kg CO2 eq/t)",
+            key="input_extrusion",
+            help="Cocher si la matière première subit une extrusion.",
+        )
         run_button = st.button(
             "🚀 Évaluer l'impact carbone", type="primary", use_container_width=True
         )
         st.session_state["last_matiere"] = matiere.strip()
         st.session_state.pop("searched_alternatives", None)
+        # --- Enregistrer le proxy choisi ---
+        if result.intrant_utilise:
+            _impact_for_log = None
+            if result.impact_kg_co2_eq is not None:
+                _impact_for_log = (
+                    result.impact_kg_co2_eq
+                    if "tonne" in (result.unite_source or "")
+                    else result.impact_kg_co2_eq * 1000.0
+                )
+            proxy_log.log_selection(
+                matiere_recherchee=matiere.strip(),
+                proxy_choisi=result.intrant_utilise,
+                scenario=result.node_resultat or "inconnu",
+                impact_kg_co2_t=_impact_for_log,
+                source_db=result.source_db or "",
+                match_exact=result.match_exact,
+                pays_production=result.pays_production or "",
+                pays_transformation=result.pays_transformation or "",
+                type_mp=type_mp_code,
+            )
     # ========================================================================
     # Affichage des résultats (depuis session_state — persiste entre reruns)
     # ========================================================================
                     transport_val, transport_zone = _get_transport_surcharge(
                         result.pays_production
                     )
+                    # --- Forfait extrusion ---
+                    extrusion_val = config.FORFAIT_EXTRUSION if extrusion_single else 0.0
+                    impact_total = impact_kg_t + transport_val + extrusion_val
                     st.metric(
                         label=f"🚚 Forfait transport ({transport_zone})",
                         value=f"+{transport_val:.0f}",
                         delta="kg CO2 eq / t",
                     )
+                    if extrusion_single:
+                        st.metric(
+                            label="🔧 Forfait extrusion",
+                            value=f"+{extrusion_val:.2f}",
+                            delta="kg CO2 eq / t",
+                        )
                     st.metric(
+                        label="🌍 Impact TOTAL (MP + transport" + (" + extrusion)" if extrusion_single else ")"),
                         value=f"{impact_total:.2f}",
                         delta="kg CO2 eq / t produit",
                     )
                         with st.spinner(f"Évaluation de {mp}..."):
                             res = evaluate_carbon_impact(mp, pays_p, pays_t)
+                        # --- Enregistrer le proxy choisi (batch) ---
+                        if res.intrant_utilise:
+                            _batch_impact = None
+                            if res.impact_kg_co2_eq is not None:
+                                _batch_impact = (
+                                    res.impact_kg_co2_eq
+                                    if "tonne" in (res.unite_source or "")
+                                    else res.impact_kg_co2_eq * 1000.0
+                                )
+                            proxy_log.log_selection(
+                                matiere_recherchee=mp,
+                                proxy_choisi=res.intrant_utilise,
+                                scenario=res.node_resultat or "inconnu",
+                                impact_kg_co2_t=_batch_impact,
+                                source_db=res.source_db or "",
+                                match_exact=res.match_exact,
+                                pays_production=pays_p or "",
+                                pays_transformation=pays_t or "",
+                            )
                         results_list.append({
                             "Matière première": mp,
                             "Pays production": pays_p or "",
             st.error(f"Erreur lors de la lecture du fichier : {e}")
+# ============================================================================
+# TAB 3 : STATISTIQUES PROXIES
+# ============================================================================
+with tab_stats:
+    st.subheader("📈 Statistiques des proxies sélectionnés")
+    st.markdown(
+        "Ce tableau recense les **intrants (proxies)** choisis lors des évaluations, "
+        "avec le nombre de fois qu'ils ont été sélectionnés."
+    )
+    # --- Filtre temporel ---
+    col_filter, _ = st.columns([1, 3])
+    with col_filter:
+        period = st.selectbox(
+            "Période",
+            options=["Tout", "7 derniers jours", "30 derniers jours", "90 derniers jours"],
+            index=0,
+            key="stats_period",
+        )
+    days_map = {"Tout": None, "7 derniers jours": 7, "30 derniers jours": 30, "90 derniers jours": 90}
+    selected_days = days_map[period]
+    # --- Top proxies ---
+    st.markdown("### 🏆 Top proxies les plus choisis")
+    df_top_proxies = proxy_log.top_proxies(n=30, days=selected_days)
+    if df_top_proxies.empty:
+        st.info("Aucune sélection enregistrée pour le moment.")
+    else:
+        st.dataframe(
+            df_top_proxies,
+            use_container_width=True,
+            column_config={
+                "proxy_choisi": st.column_config.TextColumn("Intrant / Proxy", width="large"),
+                "nb_selections": st.column_config.NumberColumn("Nb sélections", format="%d"),
+                "dernière_utilisation": st.column_config.DatetimeColumn(
+                    "Dernière utilisation", format="DD/MM/YYYY HH:mm"
+                ),
+            },
+        )
+    st.divider()
+    # --- Top scénarios ---
+    st.markdown("### 🔀 Top scénarios (nodes résultat)")
+    df_top_scenarios = proxy_log.top_scenarios(n=20, days=selected_days)
+    if df_top_scenarios.empty:
+        st.info("Aucune sélection enregistrée pour le moment.")
+    else:
+        st.dataframe(
+            df_top_scenarios,
+            use_container_width=True,
+            column_config={
+                "scenario": st.column_config.TextColumn("Scénario (node)", width="medium"),
+                "nb_selections": st.column_config.NumberColumn("Nb sélections", format="%d"),
+                "dernière_utilisation": st.column_config.DatetimeColumn(
+                    "Dernière utilisation", format="DD/MM/YYYY HH:mm"
+                ),
+            },
+        )
+    st.divider()
+    # --- Journal complet ---
+    with st.expander("📋 Journal complet des sélections", expanded=False):
+        df_full = proxy_log.load_log()
+        if df_full.empty:
+            st.info("Aucune sélection enregistrée.")
+        else:
+            st.dataframe(df_full.sort_values("timestamp", ascending=False), use_container_width=True)
+            csv_log = df_full.to_csv(index=False).encode("utf-8")
+            st.download_button(
+                label="📥 Télécharger le journal (CSV)",
+                data=csv_log,
+                file_name="proxy_selections_log.csv",
+                mime="text/csv",
+                key="btn_download_proxy_log",
+            )
 # ============================================================================
 # Footer
 # ============================================================================

src/config.py CHANGED Viewed

@@ -5,8 +5,6 @@ import os
 from dotenv import load_dotenv
 load_dotenv()
 # ---------------------------------------------------------------------------
 # Clé API Mistral
 # ---------------------------------------------------------------------------
@@ -145,6 +143,9 @@ TRANSPORT_SURCHARGE = {
     "autre": 300,
 }
 # Modèle Mistral à utiliser
 MISTRAL_MODEL = "mistral-small-latest"
 MISTRAL_MODEL_POWERFUL = "mistral-large-latest"  # Pour analyses complexes (alternatives, tri)

 from dotenv import load_dotenv
 load_dotenv()
 # ---------------------------------------------------------------------------
 # Clé API Mistral
 # ---------------------------------------------------------------------------
     "autre": 300,
 }
+# Forfait extrusion (kg CO2 eq / t) — appliqué aux produits extrudés
+FORFAIT_EXTRUSION = 56.77
 # Modèle Mistral à utiliser
 MISTRAL_MODEL = "mistral-small-latest"
 MISTRAL_MODEL_POWERFUL = "mistral-large-latest"  # Pour analyses complexes (alternatives, tri)

src/logigramme.json CHANGED Viewed

@@ -134,9 +134,8 @@
         "type": "resultat",
         "actions_priorisees": [
           "1. Je prends la valeur correspondant à cet intrant transformé dans ECOALIM",
-	  "2. Si la valeur n'existe pas,j'utilise la valeur GFLI si elle existe",
-          "3. Si je connais de manière fiable l'impact du process de transformation, je pars de la valeur pour l'intrant brut dans ECOALIM et j'ajoute l'impact du process
-          "4. Si cela n'est pas possible, je prends la valeur d'un intrant qui a le process le plus proche dans ECOALIM"
         ]
       },
       {
@@ -144,10 +143,9 @@
         "type": "resultat",
         "actions_priorisees": [
           "1. Je prends la valeur France indiquée pour l'intrant dans le GFLI",
-          "2. Si la valeur n'existe pas, je prends la valeur GFLI du Mix Européen (RER)",
-          "3. Si je connais de manière fiable l'impact du process, je pars de la valeur pour l'intrant brut dans le GFLI et j'ajoute l'impact du process.
-          "4. Si cela n'est pas possible, je prends la valeur pour l'intrant correspondant dans ECOALIM",
-          "5. Si la valeur n'existe pas, je prends la valeur d'un intrant qui a la pratique culturale la plus proche dans le GFLI"
         ]
       },
       {
@@ -155,10 +153,9 @@
         "type": "resultat",
         "actions_priorisees": [
           "1. Je prends la valeur GFLI du pays correspondant",
-          "2. Si la valeur n'existe pas, je prends la valeur GFLI du Mix Européen (RER) si l'intrant provient d'Europe et la valeur du Mix Monde (GLO) si l'intrant vient d'un autre continent",
-          "3. Si je connais de manière fiable l'impact du process, je pars de la valeur pour la MP brute dans le GFLI et j'ajoute l'impact du process.
-          "4. Si cela n'est pas possible, je prends la valeur pour l'intrant correspondant dans ECOALIM",
-          "5. Si la valeur n'existe pas, je prends la valeur d'un intrant qui a la pratique culturale la plus proche dans le GFLI"
         ]
       }
     ]

         "type": "resultat",
         "actions_priorisees": [
           "1. Je prends la valeur correspondant à cet intrant transformé dans ECOALIM",
+          "2. Si la valeur n'existe pas : A/ Si je connais de manière fiable l'impact du process de transformation, je pars de la valeur pour l'intrant brut dans ECOALIM et j'ajoute l'impact du process. B/ Si je ne connais pas de manière fiable l'impact du process, j'utilise la valeur GFLI si elle existe",
+          "3. Si cela n'est pas possible, je prends la valeur d'un intrant qui a le process le plus proche dans ECOALIM"
         ]
       },
       {
         "type": "resultat",
         "actions_priorisees": [
           "1. Je prends la valeur France indiquée pour l'intrant dans le GFLI",
+          "2. Si la valeur n'existe pas : A/ Si je connais de manière fiable l'impact du process, je pars de la valeur pour l'intrant brut dans le GFLI et j'ajoute l'impact du process. B/ Si je ne connais pas de manière fiable l'impact du process, je prends la valeur GFLI du Mix Européen (RER)",
+          "3. Si cela n'est pas possible, je prends la valeur pour l'intrant correspondant dans ECOALIM",
+          "4. Si la valeur n'existe pas, je prends la valeur d'un intrant qui a la pratique culturale la plus proche dans le GFLI"
         ]
       },
       {
         "type": "resultat",
         "actions_priorisees": [
           "1. Je prends la valeur GFLI du pays correspondant",
+          "2. Si la valeur n'existe pas : A/ Si je connais de manière fiable l'impact du process, je pars de la valeur pour la MP brute dans le GFLI et j'ajoute l'impact du process. B/ Si je ne connais pas de manière fiable l'impact du process, je prends la valeur GFLI du Mix Européen (RER) si l'intrant provient d'Europe et la valeur du Mix Monde (GLO) si l'intrant vient d'un autre continent",
+          "3. Si cela n'est pas possible, je prends la valeur pour l'intrant correspondant dans ECOALIM",
+          "4. Si la valeur n'existe pas, je prends la valeur d'un intrant qui a la pratique culturale la plus proche dans le GFLI"
         ]
       }
     ]

src/proxy_log.py ADDED Viewed

	@@ -0,0 +1,150 @@

+"""
+proxy_log.py – Persistence layer for proxy/scenario selections.
+Each time the engine returns a result (single search or formulation row),
+the chosen proxy is logged.  The CSV file lives next to app.py so it
+survives Streamlit restarts.
+Colonnes du CSV :
+    timestamp, matiere_recherchee, proxy_choisi, scenario, impact_kg_co2_t,
+    source_db, match_exact, pays_production, pays_transformation, type_mp
+"""
+from __future__ import annotations
+import csv
+import os
+from datetime import datetime
+from pathlib import Path
+from collections import Counter
+import pandas as pd
+# ---------------------------------------------------------------------------
+# Fichier de stockage
+# ---------------------------------------------------------------------------
+_LOG_DIR = Path(__file__).parent / "data"
+_LOG_FILE = _LOG_DIR / "proxy_selections.csv"
+_FIELDNAMES = [
+    "timestamp",
+    "matiere_recherchee",
+    "proxy_choisi",
+    "scenario",
+    "impact_kg_co2_t",
+    "source_db",
+    "match_exact",
+    "pays_production",
+    "pays_transformation",
+    "type_mp",
+]
+def _ensure_file() -> None:
+    """Crée le répertoire et le fichier CSV avec en-tête s'ils n'existent pas."""
+    _LOG_DIR.mkdir(parents=True, exist_ok=True)
+    if not _LOG_FILE.exists():
+        with open(_LOG_FILE, "w", newline="", encoding="utf-8") as f:
+            writer = csv.DictWriter(f, fieldnames=_FIELDNAMES)
+            writer.writeheader()
+# ---------------------------------------------------------------------------
+# Écriture
+# ---------------------------------------------------------------------------
+def log_selection(
+    matiere_recherchee: str,
+    proxy_choisi: str,
+    scenario: str,
+    impact_kg_co2_t: float | None = None,
+    source_db: str = "",
+    match_exact: bool = True,
+    pays_production: str = "",
+    pays_transformation: str = "",
+    type_mp: str = "vegetal_animal",
+) -> None:
+    """Enregistre une sélection de proxy dans le fichier CSV."""
+    _ensure_file()
+    row = {
+        "timestamp": datetime.now().isoformat(timespec="seconds"),
+        "matiere_recherchee": matiere_recherchee,
+        "proxy_choisi": proxy_choisi,
+        "scenario": scenario,
+        "impact_kg_co2_t": round(impact_kg_co2_t, 2) if impact_kg_co2_t is not None else "",
+        "source_db": source_db,
+        "match_exact": "Oui" if match_exact else "Non",
+        "pays_production": pays_production or "",
+        "pays_transformation": pays_transformation or "",
+        "type_mp": type_mp,
+    }
+    with open(_LOG_FILE, "a", newline="", encoding="utf-8") as f:
+        writer = csv.DictWriter(f, fieldnames=_FIELDNAMES)
+        writer.writerow(row)
+# ---------------------------------------------------------------------------
+# Lecture / statistiques
+# ---------------------------------------------------------------------------
+def load_log() -> pd.DataFrame:
+    """Charge le journal complet sous forme de DataFrame."""
+    _ensure_file()
+    df = pd.read_csv(_LOG_FILE, encoding="utf-8")
+    if "timestamp" in df.columns:
+        df["timestamp"] = pd.to_datetime(df["timestamp"], errors="coerce")
+    return df
+def top_proxies(n: int = 20, days: int | None = None) -> pd.DataFrame:
+    """Renvoie les *n* proxies les plus choisis (optionnel : sur les *days* derniers jours).
+    Colonnes retournées : proxy_choisi, nb_selections, dernière_utilisation
+    """
+    df = load_log()
+    if df.empty:
+        return pd.DataFrame(columns=["proxy_choisi", "nb_selections", "dernière_utilisation"])
+    if days is not None and "timestamp" in df.columns:
+        cutoff = pd.Timestamp.now() - pd.Timedelta(days=days)
+        df = df[df["timestamp"] >= cutoff]
+    if df.empty:
+        return pd.DataFrame(columns=["proxy_choisi", "nb_selections", "dernière_utilisation"])
+    stats = (
+        df.groupby("proxy_choisi", sort=False)
+        .agg(
+            nb_selections=("proxy_choisi", "size"),
+            dernière_utilisation=("timestamp", "max"),
+        )
+        .reset_index()
+        .sort_values("nb_selections", ascending=False)
+        .head(n)
+    )
+    return stats
+def top_scenarios(n: int = 20, days: int | None = None) -> pd.DataFrame:
+    """Renvoie les *n* scénarios les plus fréquents."""
+    df = load_log()
+    if df.empty:
+        return pd.DataFrame(columns=["scenario", "nb_selections", "dernière_utilisation"])
+    if days is not None and "timestamp" in df.columns:
+        cutoff = pd.Timestamp.now() - pd.Timedelta(days=days)
+        df = df[df["timestamp"] >= cutoff]
+    if df.empty:
+        return pd.DataFrame(columns=["scenario", "nb_selections", "dernière_utilisation"])
+    stats = (
+        df.groupby("scenario", sort=False)
+        .agg(
+            nb_selections=("scenario", "size"),
+            dernière_utilisation=("timestamp", "max"),
+        )
+        .reset_index()
+        .sort_values("nb_selections", ascending=False)
+        .head(n)
+    )
+    return stats