Spaces:
Sleeping
Sleeping
File size: 16,008 Bytes
676811f 27281c3 676811f 27281c3 676811f 27281c3 676811f 27281c3 676811f 27281c3 676811f 27281c3 676811f 27281c3 676811f 27281c3 d9372eb 27281c3 676811f d9372eb 27281c3 d9372eb 27281c3 676811f 27281c3 676811f |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 |
"""
Module d'analyse des données agricoles et calcul des risques
"""
import pandas as pd
from config import OPTIONAL_GROUP_COLS, REQUIRED_COLUMNS, RISK_LEVELS
class AgricultureAnalyzer:
"""Classe responsable de l'analyse des données agricoles"""
def __init__(self, data=None):
self.df = data
self.risk_analysis = None
def set_data(self, data):
"""Définit les données à analyser"""
self.df = data
def analyze_data(self):
"""Analyse des données et calcul des risques"""
if self.df is None or len(self.df) == 0:
print("❌ Pas de données à analyser")
return "Erreur: Aucune donnée chargée"
try:
print(f"🔄 Début de l'analyse sur {len(self.df)} enregistrements...")
# Analyse générale
general_stats = self._calculate_general_stats()
# Analyse des herbicides
herbicide_stats = self._calculate_herbicide_stats()
# Calcul de l'analyse des risques
self.calculate_risk_analysis()
print("✅ Analyse terminée avec succès")
return general_stats, herbicide_stats
except Exception as e:
print(f"❌ Erreur lors de l'analyse: {str(e)}")
return None, None
def _calculate_general_stats(self):
"""Calcule les statistiques générales"""
return {
'total_parcelles': self.df['numparcell'].nunique(),
'total_interventions': len(self.df),
'surface_totale': self.df['surfparc'].sum(),
'surface_moyenne': self.df['surfparc'].mean(),
'periode': f"{self.df['millesime'].min()} - {self.df['millesime'].max()}"
}
def _calculate_herbicide_stats(self):
"""Calcule les statistiques sur les herbicides"""
if 'familleprod' in self.df.columns:
herbicides_df = self.df[self.df['familleprod'] == 'Herbicides'].copy()
return {
'nb_interventions_herbicides': len(herbicides_df),
'pourcentage_herbicides': (len(herbicides_df) / len(self.df)) * 100,
'parcelles_traitees': herbicides_df['numparcell'].nunique()
}
else:
return {
'nb_interventions_herbicides': 0,
'pourcentage_herbicides': 0,
'parcelles_traitees': 0
}
def calculate_risk_analysis(self):
"""Calcule l'analyse des risques par parcelle"""
try:
print("🔄 Calcul de l'analyse des risques...")
# Vérifier les colonnes nécessaires
required_group_cols = ['numparcell', 'surfparc']
# Construire la liste des colonnes de groupement disponibles
group_cols = [col for col in required_group_cols if col in self.df.columns]
group_cols.extend([col for col in OPTIONAL_GROUP_COLS if col in self.df.columns])
if len(group_cols) < 2:
print(f"❌ Colonnes insuffisantes pour le groupement: {group_cols}")
self.risk_analysis = pd.DataFrame()
return
# Construire l'agrégation selon les colonnes disponibles
agg_dict = self._build_aggregation_dict()
if not agg_dict:
print("❌ Aucune colonne disponible pour l'agrégation")
self.risk_analysis = pd.DataFrame()
return
# Groupement des données par parcelle
risk_analysis = self.df.groupby(group_cols).agg(agg_dict).round(2)
# Ajout des quantités d'herbicides spécifiques
risk_analysis = self._add_herbicide_quantities(risk_analysis, group_cols)
# Renommage des colonnes
risk_analysis = self._rename_columns(risk_analysis, agg_dict)
# Calcul de l'IFT approximatif
risk_analysis = self._calculate_ift(risk_analysis, group_cols)
# Classification du risque
risk_analysis['Risque_adventice'] = risk_analysis.apply(self._classify_risk, axis=1)
# Tri par risque
risk_analysis = self._sort_by_risk(risk_analysis)
self.risk_analysis = risk_analysis
print(f"✅ Analyse des risques terminée: {len(self.risk_analysis)} parcelles analysées")
except Exception as e:
print(f"❌ Erreur lors du calcul des risques: {str(e)}")
self.risk_analysis = pd.DataFrame()
def _build_aggregation_dict(self):
"""Construit le dictionnaire d'agrégation selon les colonnes disponibles"""
agg_dict = {}
if 'familleprod' in self.df.columns:
agg_dict['familleprod'] = lambda x: (x == 'Herbicides').sum()
if 'libevenem' in self.df.columns:
agg_dict['libevenem'] = lambda x: len(x.unique())
if 'produit' in self.df.columns:
agg_dict['produit'] = lambda x: len(x.unique())
if 'quantitetot' in self.df.columns:
agg_dict['quantitetot'] = 'sum'
return agg_dict
def _add_herbicide_quantities(self, risk_analysis, group_cols):
"""Ajoute les quantités d'herbicides spécifiques"""
if 'familleprod' in self.df.columns and 'quantitetot' in self.df.columns:
herbicides_df = self.df[self.df['familleprod'] == 'Herbicides']
if len(herbicides_df) > 0:
herbicide_quantities = herbicides_df.groupby(group_cols)['quantitetot'].sum().fillna(0)
risk_analysis['Quantite_herbicides'] = herbicide_quantities.reindex(risk_analysis.index, fill_value=0)
else:
risk_analysis['Quantite_herbicides'] = 0
else:
risk_analysis['Quantite_herbicides'] = 0
return risk_analysis
def _rename_columns(self, risk_analysis, agg_dict):
"""Renomme les colonnes de façon sécurisée"""
new_column_names = {}
if 'familleprod' in agg_dict:
new_column_names['familleprod'] = 'Nb_herbicides'
if 'libevenem' in agg_dict:
new_column_names['libevenem'] = 'Diversite_evenements'
if 'produit' in agg_dict:
new_column_names['produit'] = 'Diversite_produits'
if 'quantitetot' in agg_dict:
new_column_names['quantitetot'] = 'Quantite_totale'
return risk_analysis.rename(columns=new_column_names)
def _calculate_ift(self, risk_analysis, group_cols):
"""Calcule l'IFT approximatif"""
if 'surfparc' in group_cols:
risk_analysis['IFT_herbicide_approx'] = (
risk_analysis['Quantite_herbicides'] /
risk_analysis.index.get_level_values('surfparc')
).round(2)
else:
risk_analysis['IFT_herbicide_approx'] = 0
return risk_analysis
def _classify_risk(self, row):
"""Classification du risque pour une parcelle"""
ift = row.get('IFT_herbicide_approx', 0)
nb_herb = row.get('Nb_herbicides', 0)
if ift == 0 and nb_herb == 0:
return 'TRÈS FAIBLE'
elif ift < 1 and nb_herb <= 1:
return 'FAIBLE'
elif ift < 3 and nb_herb <= 3:
return 'MODÉRÉ'
elif ift < 5 and nb_herb <= 5:
return 'ÉLEVÉ'
else:
return 'TRÈS ÉLEVÉ'
def _sort_by_risk(self, risk_analysis):
"""Trie les résultats par niveau de risque"""
risk_order = {r: i for i, r in enumerate(RISK_LEVELS)}
risk_analysis['Risk_Score'] = risk_analysis['Risque_adventice'].map(risk_order)
return risk_analysis.sort_values(['Risk_Score', 'IFT_herbicide_approx'])
def get_summary_stats(self):
"""Retourne les statistiques de résumé avec gestion d'erreur"""
try:
if self.df is None:
return "❌ Aucune donnée disponible"
# Statistiques générales avec gestion d'erreur
try:
total_parcelles = self.df['numparcell'].nunique()
total_interventions = len(self.df)
surface_totale = self.df['surfparc'].sum()
surface_moyenne = self.df['surfparc'].mean()
periode_min = self.df['millesime'].min()
periode_max = self.df['millesime'].max()
stats_text = f"""
## 📊 Statistiques Générales
- **Nombre total de parcelles**: {total_parcelles}
- **Nombre d'interventions**: {total_interventions:,}
- **Surface totale**: {surface_totale:.2f} hectares
- **Surface moyenne par parcelle**: {surface_moyenne:.2f} hectares
- **Période**: {periode_min} - {periode_max}
## 🧪 Analyse Herbicides
"""
except Exception as e:
print(f"❌ Erreur dans les statistiques générales: {e}")
stats_text = """
## 📊 Statistiques Générales
❌ Erreur lors du calcul des statistiques générales
## 🧪 Analyse Herbicides
"""
# Analyse des herbicides avec gestion d'erreur
try:
if 'familleprod' in self.df.columns:
herbicides_df = self.df[self.df['familleprod'] == 'Herbicides']
if len(herbicides_df) > 0:
nb_herbicides = len(herbicides_df)
pct_herbicides = (nb_herbicides/len(self.df)*100)
parcelles_traitees = herbicides_df['numparcell'].nunique()
if 'produit' in herbicides_df.columns:
produits_uniques = herbicides_df['produit'].nunique()
stats_text += f"""
- **Interventions herbicides**: {nb_herbicides} ({pct_herbicides:.1f}%)
- **Parcelles traitées**: {parcelles_traitees}
- **Produits herbicides différents**: {produits_uniques}
"""
else:
stats_text += f"""
- **Interventions herbicides**: {nb_herbicides} ({pct_herbicides:.1f}%)
- **Parcelles traitées**: {parcelles_traitees}
"""
else:
stats_text += "\n- **Aucune intervention herbicide détectée**"
else:
stats_text += "\n- **Données d'herbicides non disponibles**"
except Exception as e:
print(f"❌ Erreur dans l'analyse des herbicides: {e}")
stats_text += "\n❌ Erreur lors de l'analyse des herbicides"
# Analyse des risques avec gestion d'erreur
try:
if self.risk_analysis is not None and len(self.risk_analysis) > 0:
risk_distribution = self.risk_analysis['Risque_adventice'].value_counts()
stats_text += f"""
## 🎯 Répartition des Risques Adventices
"""
for risk_level in RISK_LEVELS:
if risk_level in risk_distribution:
count = risk_distribution[risk_level]
pct = (count / len(self.risk_analysis)) * 100
stats_text += f"- **{risk_level}**: {count} parcelles ({pct:.1f}%)\n"
else:
stats_text += "\n\n❌ Analyse des risques non disponible"
except Exception as e:
print(f"❌ Erreur dans l'analyse des risques: {e}")
stats_text += "\n\n❌ Erreur lors de l'analyse des risques"
return stats_text
except Exception as e:
print(f"❌ Erreur critique dans get_summary_stats: {e}")
return "❌ Erreur critique lors de la génération des statistiques"
def get_low_risk_recommendations(self):
"""Retourne les recommandations pour les parcelles à faible risque avec gestion d'erreur"""
try:
if self.risk_analysis is None or len(self.risk_analysis) == 0:
return "❌ Analyse des risques non disponible"
try:
low_risk = self.risk_analysis[
self.risk_analysis['Risque_adventice'].isin(['TRÈS FAIBLE', 'FAIBLE'])
].head(10)
if len(low_risk) == 0:
return """## 🌾 Recommandations pour Cultures Sensibles
❌ Aucune parcelle à faible risque trouvée.
💡 **Suggestion**: Considérez une rotation plus longue ou des techniques alternatives pour réduire la pression adventice."""
recommendations = "## 🌾 TOP 10 - Parcelles Recommandées pour Cultures Sensibles (Pois, Haricot)\n\n"
for idx, row in low_risk.iterrows():
try:
if isinstance(idx, tuple) and len(idx) >= 4:
parcelle, nom, culture, surface = idx[:4]
else:
# Fallback si l'index n'est pas un tuple de 4 éléments
parcelle = str(idx)
nom = "N/A"
culture = "N/A"
surface = row.get('surfparc', 0) if hasattr(row, 'get') else 0
# Vérification des valeurs avec fallbacks
risque = row.get('Risque_adventice', 'N/A') if hasattr(row, 'get') else 'N/A'
ift = row.get('IFT_herbicide_approx', 0) if hasattr(row, 'get') else 0
nb_herb = row.get('Nb_herbicides', 0) if hasattr(row, 'get') else 0
# Conversion sécurisée pour les formats
try:
surface_formatted = f"{float(surface):.2f}" if surface != "N/A" else "N/A"
except (ValueError, TypeError):
surface_formatted = str(surface)
try:
ift_formatted = f"{float(ift):.2f}" if ift != "N/A" else "N/A"
except (ValueError, TypeError):
ift_formatted = str(ift)
recommendations += f"""
**Parcelle {parcelle}** ({nom})
- Culture actuelle: {culture}
- Surface: {surface_formatted} ha
- Niveau de risque: {risque}
- IFT herbicide: {ift_formatted}
- Nombre d'herbicides: {nb_herb}
---
"""
except Exception as e:
print(f"❌ Erreur lors du traitement d'une parcelle: {e}")
recommendations += f"""
**Parcelle {str(idx)}**
❌ Erreur lors du traitement des données de cette parcelle
---
"""
return recommendations
except Exception as e:
print(f"❌ Erreur lors de la génération des recommandations: {e}")
return """## 🌾 Recommandations pour Cultures Sensibles
❌ Erreur lors de la génération des recommandations.
💡 **Suggestion**: Vérifiez la qualité des données et relancez l'analyse."""
except Exception as e:
print(f"❌ Erreur critique dans get_low_risk_recommendations: {e}")
return "❌ Erreur critique lors de la génération des recommandations"
def get_risk_analysis(self):
"""Retourne l'analyse des risques"""
return self.risk_analysis
|