Spaces:

MMOON
/

BUSCA

Sleeping

App Files Files Community

MMOON commited on Dec 18, 2025

Commit

34e3a4a

verified ·

1 Parent(s): 5817584

Update app.py

Browse files

Files changed (1) hide show

app.py +76 -45

app.py CHANGED Viewed

@@ -32,12 +32,27 @@ st.info("Les données sont chargées depuis la Plateforme SCA. Utilisez les filt
 # 📦 Fonction pour charger les données avec cache
 @st.cache_data(ttl=3600) # Mettre en cache les données pendant 1 heure
 def load_data():
-    file_url = "https://www.plateforme-sca.fr/sites/default/files/2025-11/BuSCA-Base2.xlsx"
     try:
         response = requests.get(file_url, headers={'User-Agent': 'Mozilla/5.0'})
         response.raise_for_status()
         df = pd.read_excel(BytesIO(response.content), engine='openpyxl')
         df.columns = df.columns.str.strip().str.lower()
         return df
     except Exception as e:
         st.error(f"Erreur critique lors du chargement des données : {e}")
@@ -50,11 +65,11 @@ if df_full is None:
     st.error("Impossible de continuer car les données n'ont pas pu être chargées.")
     st.stop()
-# --- Définition des noms de colonnes ---
 COL_BUSCA = 'busca'
 COL_TITRE = 'titre'
-COL_MATRICE = 'matrices'
-COL_DANGER = 'dangers'
 COL_SECTION = 'section'
 COL_TEXTE = 'texte'
 COL_LIEN1 = 'lien'
@@ -64,9 +79,15 @@ COL_LIEN2 = 'lien2'
 essential_cols = [COL_BUSCA, COL_TITRE, COL_TEXTE, COL_MATRICE, COL_DANGER]
 missing_cols = [col for col in essential_cols if col not in df_full.columns]
 if missing_cols:
-    st.error(f"ERREUR : Les colonnes essentielles suivantes sont manquantes : {', '.join(missing_cols)}")
     st.stop()
 # Tri des données
 df_full = df_full.sort_values(by=COL_BUSCA, ascending=False)
@@ -76,7 +97,7 @@ with st.sidebar:
     if st.button("🔄 Rafraîchir les données"):
         st.cache_data.clear()
-        st.experimental_rerun()
     with st.expander("📌 Plage de numéros de BuSCA", expanded=True):
         min_val = int(df_full[COL_BUSCA].min())
@@ -84,14 +105,15 @@ with st.sidebar:
         busca_range = st.slider("Numéros de BuSCA", min_val, max_val, (max_val - 20, max_val))
     with st.expander("🌍 Matrices"):
-        unique_matrices = sorted(df_full[COL_MATRICE].dropna().unique())
         matrices = st.multiselect("Sélectionner les matrices", options=unique_matrices)
     with st.expander("⚠️ Dangers"):
-        unique_dangers = sorted(df_full[COL_DANGER].dropna().unique())
         dangers = st.multiselect("Sélectionner les dangers", options=unique_dangers)
-    # --- AJOUT DU FILTRE TEXTE LIBRE ---
     with st.expander("🔎 Recherche par mots-clés"):
         keywords = st.text_area("Mots-clés (séparés par des virgules)", placeholder="ex: listeria, lait, rappel...")
@@ -99,37 +121,40 @@ with st.sidebar:
 # Logique de filtrage
 df_display = df_full.copy()
-if apply_filter:
-    with st.spinner('Filtrage en cours...'):
-        # Filtre par plage de BuSCA
-        df_display = df_display[
-            (df_display[COL_BUSCA] >= busca_range[0]) &
-            (df_display[COL_BUSCA] <= busca_range[1])
-        ]
-        # Filtre par listes
-        if matrices:
-            df_display = df_display[df_display[COL_MATRICE].isin(matrices)]
-        if dangers:
-            df_display = df_display[df_display[COL_DANGER].isin(dangers)]
-        # --- AJOUT DE LA LOGIQUE DE FILTRAGE PAR MOTS-CLÉS ---
-        if keywords:
-            # Prépare la liste de mots-clés : minuscule, sans espaces superflus
-            keyword_list = [kw.strip().lower() for kw in keywords.split(',') if kw.strip()]
-            # Applique le filtre si des mots-clés ont été saisis
-            if keyword_list:
-                # La fonction cherche si AU MOINS UN des mots-clés est présent dans la ligne
-                df_display = df_display[df_display.apply(
-                    lambda row: any(
-                        kw in str(row[COL_TITRE]).lower() or
-                        kw in str(row[COL_TEXTE]).lower() or
-                        kw in str(row[COL_DANGER]).lower() or
-                        kw in str(row[COL_MATRICE]).lower()
-                        for kw in keyword_list
-                    ),
-                    axis=1
-                )]
 # Affichage des résultats
 st.markdown(f"### 📑 Affichage de {len(df_display)} résultats")
@@ -146,9 +171,15 @@ else:
             st.markdown(f"**Danger :** `{danger_val}` | **Matrice :** `{matrice_val}`")
             st.markdown("---")
-            st.markdown(str(row.get(COL_TEXTE, 'Texte manquant')))
-            if pd.notna(row.get(COL_LIEN1)):
-                st.markdown(f"🔗 [Lien 1]({row[COL_LIEN1]})")
-            if pd.notna(row.get(COL_LIEN2)):
-                st.markdown(f"🔗 [Lien 2]({row[COL_LIEN2]})")

 # 📦 Fonction pour charger les données avec cache
 @st.cache_data(ttl=3600) # Mettre en cache les données pendant 1 heure
 def load_data():
+    # --- MODIFICATION DE L'URL ICI ---
+    file_url = "https://www.plateforme-sca.fr/media/398/download"
     try:
+        # En Python (côté serveur), pas besoin de proxy CORS, mais on garde le User-Agent
         response = requests.get(file_url, headers={'User-Agent': 'Mozilla/5.0'})
         response.raise_for_status()
         df = pd.read_excel(BytesIO(response.content), engine='openpyxl')
+        # Nettoyage des noms de colonnes (minuscules, sans espaces)
         df.columns = df.columns.str.strip().str.lower()
+        # --- ROBUSTESSE : Renommage pour gérer Singulier/Pluriel ---
+        # Si le fichier contient "matrice" au lieu de "matrices", on normalise
+        rename_map = {
+            'matrice': 'matrices',
+            'danger': 'dangers'
+        }
+        df.rename(columns=rename_map, inplace=True)
         return df
     except Exception as e:
         st.error(f"Erreur critique lors du chargement des données : {e}")
     st.error("Impossible de continuer car les données n'ont pas pu être chargées.")
     st.stop()
+# --- Définition des noms de colonnes (Normalisés) ---
 COL_BUSCA = 'busca'
 COL_TITRE = 'titre'
+COL_MATRICE = 'matrices' # On utilise le pluriel car on a normalisé ci-dessus
+COL_DANGER = 'dangers'   # On utilise le pluriel car on a normalisé ci-dessus
 COL_SECTION = 'section'
 COL_TEXTE = 'texte'
 COL_LIEN1 = 'lien'
 essential_cols = [COL_BUSCA, COL_TITRE, COL_TEXTE, COL_MATRICE, COL_DANGER]
 missing_cols = [col for col in essential_cols if col not in df_full.columns]
 if missing_cols:
+    st.error(f"ERREUR : Les colonnes essentielles suivantes sont manquantes dans le fichier Excel : {', '.join(missing_cols)}")
+    st.write("Colonnes trouvées :", df_full.columns.tolist())
     st.stop()
+# Nettoyage des données (suppression des lignes sans N° BuSCA)
+df_full = df_full.dropna(subset=[COL_BUSCA])
+# Conversion du N° BuSCA en entier
+df_full[COL_BUSCA] = df_full[COL_BUSCA].astype(int)
 # Tri des données
 df_full = df_full.sort_values(by=COL_BUSCA, ascending=False)
     if st.button("🔄 Rafraîchir les données"):
         st.cache_data.clear()
+        st.rerun() # Utilisation de st.rerun() au lieu de experimental_rerun
     with st.expander("📌 Plage de numéros de BuSCA", expanded=True):
         min_val = int(df_full[COL_BUSCA].min())
         busca_range = st.slider("Numéros de BuSCA", min_val, max_val, (max_val - 20, max_val))
     with st.expander("🌍 Matrices"):
+        # Conversion en string pour éviter les erreurs de tri si données mixtes
+        unique_matrices = sorted(df_full[COL_MATRICE].fillna('Non spécifié').astype(str).unique())
         matrices = st.multiselect("Sélectionner les matrices", options=unique_matrices)
     with st.expander("⚠️ Dangers"):
+        unique_dangers = sorted(df_full[COL_DANGER].fillna('Non spécifié').astype(str).unique())
         dangers = st.multiselect("Sélectionner les dangers", options=unique_dangers)
+    # --- FILTRE TEXTE LIBRE ---
     with st.expander("🔎 Recherche par mots-clés"):
         keywords = st.text_area("Mots-clés (séparés par des virgules)", placeholder="ex: listeria, lait, rappel...")
 # Logique de filtrage
 df_display = df_full.copy()
+# Note: Streamlit relance le script à chaque interaction, donc si on n'appuie pas sur le bouton
+# on affiche quand même les données filtrées par défaut (tout ou dernière action).
+# Si vous voulez que rien ne change tant qu'on ne clique pas, il faut gérer le state,
+# mais ici on applique la logique standard :
+if apply_filter or True: # 'or True' permet un affichage dynamique réactif immédiat (optionnel selon préférence UX)
+    # Filtre par plage de BuSCA
+    df_display = df_display[
+        (df_display[COL_BUSCA] >= busca_range[0]) &
+        (df_display[COL_BUSCA] <= busca_range[1])
+    ]
+    # Filtre par listes
+    if matrices:
+        df_display = df_display[df_display[COL_MATRICE].astype(str).isin(matrices)]
+    if dangers:
+        df_display = df_display[df_display[COL_DANGER].astype(str).isin(dangers)]
+    # --- LOGIQUE DE FILTRAGE PAR MOTS-CLÉS ---
+    if keywords:
+        # Prépare la liste de mots-clés : minuscule, sans espaces superflus
+        keyword_list = [kw.strip().lower() for kw in keywords.split(',') if kw.strip()]
+        # Applique le filtre si des mots-clés ont été saisis
+        if keyword_list:
+            df_display = df_display[df_display.apply(
+                lambda row: any(
+                    kw in str(row[COL_TITRE]).lower() or
+                    kw in str(row[COL_TEXTE]).lower() or
+                    kw in str(row[COL_DANGER]).lower() or
+                    kw in str(row[COL_MATRICE]).lower()
+                    for kw in keyword_list
+                ),
+                axis=1
+            )]
 # Affichage des résultats
 st.markdown(f"### 📑 Affichage de {len(df_display)} résultats")
             st.markdown(f"**Danger :** `{danger_val}` | **Matrice :** `{matrice_val}`")
             st.markdown("---")
+            # Remplacement des sauts de ligne pour un affichage propre
+            texte_content = str(row.get(COL_TEXTE, 'Texte manquant')).replace('\n', '  \n')
+            st.markdown(texte_content)
+            st.markdown("---")
+            col1, col2 = st.columns(2)
+            with col1:
+                if pd.notna(row.get(COL_LIEN1)):
+                    st.link_button("🔗 Lien Principal", row[COL_LIEN1])
+            with col2:
+                if pd.notna(row.get(COL_LIEN2)):
+                    st.link_button("🔗 Lien Secondaire", row[COL_LIEN2])