Spaces:
Sleeping
Sleeping
Tracy André
commited on
Commit
·
788567c
1
Parent(s):
ebeb919
updated
Browse files
app.py
CHANGED
|
@@ -32,20 +32,29 @@ class AgricultureAnalyzer:
|
|
| 32 |
# D'abord, essayer de charger depuis Hugging Face
|
| 33 |
try:
|
| 34 |
print(f"🤗 Tentative de chargement depuis Hugging Face: {dataset_id}")
|
| 35 |
-
dataset = load_dataset(dataset_id,
|
| 36 |
|
| 37 |
-
#
|
|
|
|
| 38 |
if 'train' in dataset:
|
| 39 |
# Convertir en DataFrame pandas
|
| 40 |
-
|
| 41 |
-
print(f"✅
|
| 42 |
|
| 43 |
-
#
|
| 44 |
-
|
| 45 |
-
|
| 46 |
-
|
| 47 |
-
|
| 48 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 49 |
|
| 50 |
return self.analyze_data()
|
| 51 |
else:
|
|
|
|
| 32 |
# D'abord, essayer de charger depuis Hugging Face
|
| 33 |
try:
|
| 34 |
print(f"🤗 Tentative de chargement depuis Hugging Face: {dataset_id}")
|
| 35 |
+
dataset = load_dataset(dataset_id, token=hf_token)
|
| 36 |
|
| 37 |
+
# Ligne 35 - Changer use_auth_token en token
|
| 38 |
+
# Lignes 37-50 - Améliorer la gestion du dataset multi-fichiers
|
| 39 |
if 'train' in dataset:
|
| 40 |
# Convertir en DataFrame pandas
|
| 41 |
+
df_raw = dataset['train'].to_pandas()
|
| 42 |
+
print(f"✅ Dataset chargé: {len(df_raw)} lignes trouvées")
|
| 43 |
|
| 44 |
+
# Le dataset HF concatène tous les CSV (2014-2025)
|
| 45 |
+
# Filtrer par année si possible
|
| 46 |
+
if 'millesime' in df_raw.columns:
|
| 47 |
+
# Prendre les données les plus récentes (2023-2025)
|
| 48 |
+
recent_data = df_raw[df_raw['millesime'] >= 2023]
|
| 49 |
+
if len(recent_data) > 0:
|
| 50 |
+
self.df = recent_data
|
| 51 |
+
print(f"✅ Données filtrées: {len(self.df)} lignes des années récentes")
|
| 52 |
+
else:
|
| 53 |
+
self.df = df_raw
|
| 54 |
+
print(f"✅ Toutes les données utilisées: {len(self.df)} lignes")
|
| 55 |
+
else:
|
| 56 |
+
self.df = df_raw
|
| 57 |
+
print(f"✅ Données chargées: {len(self.df)} lignes")
|
| 58 |
|
| 59 |
return self.analyze_data()
|
| 60 |
else:
|