Spaces:
Sleeping
Sleeping
Tracy André
commited on
Commit
·
f15c647
1
Parent(s):
b5ed585
updated
Browse files
app.py
CHANGED
|
@@ -41,41 +41,7 @@ class AgricultureAnalyzer:
|
|
| 41 |
print(f"⚠️ Aucun token HF_TOKEN trouvé, tentative sans authentification")
|
| 42 |
dataset = load_dataset(dataset_id)
|
| 43 |
|
| 44 |
-
print(f"📊 Splits disponibles: {list(dataset.keys())}")
|
| 45 |
-
|
| 46 |
-
if 'train' in dataset:
|
| 47 |
-
# Convertir en DataFrame pandas
|
| 48 |
-
df_raw = dataset['train'].to_pandas()
|
| 49 |
-
print(f"✅ Dataset chargé: {len(df_raw)} lignes, {len(df_raw.columns)} colonnes")
|
| 50 |
-
print(f"🏷️ Colonnes disponibles: {list(df_raw.columns)[:10]}...") # Afficher les 10 premières colonnes
|
| 51 |
-
|
| 52 |
-
# Filtrer par année si la colonne millesime existe
|
| 53 |
-
if 'millesime' in df_raw.columns:
|
| 54 |
-
print(f"📅 Années disponibles: {sorted(df_raw['millesime'].unique())}")
|
| 55 |
-
# Prendre les données récentes (2022-2025)
|
| 56 |
-
recent_data = df_raw[df_raw['millesime'] >= 2022]
|
| 57 |
-
if len(recent_data) > 0:
|
| 58 |
-
self.df = recent_data
|
| 59 |
-
print(f"✅ Données filtrées: {len(self.df)} lignes pour les années récentes")
|
| 60 |
-
else:
|
| 61 |
-
self.df = df_raw
|
| 62 |
-
print(f"✅ Toutes les données utilisées: {len(self.df)} lignes")
|
| 63 |
-
else:
|
| 64 |
-
self.df = df_raw
|
| 65 |
-
print(f"✅ Données chargées (pas de filtrage par année): {len(self.df)} lignes")
|
| 66 |
-
|
| 67 |
-
return self.analyze_data()
|
| 68 |
-
else:
|
| 69 |
-
# Si pas de split 'train', prendre le premier disponible
|
| 70 |
-
available_splits = list(dataset.keys())
|
| 71 |
-
if available_splits:
|
| 72 |
-
first_split = available_splits[0]
|
| 73 |
-
self.df = dataset[first_split].to_pandas()
|
| 74 |
-
print(f"✅ Données chargées depuis le split '{first_split}': {len(self.df)} lignes")
|
| 75 |
-
return self.analyze_data()
|
| 76 |
-
else:
|
| 77 |
-
raise Exception("Aucun split trouvé dans le dataset")
|
| 78 |
-
|
| 79 |
except Exception as e:
|
| 80 |
print(f"⚠️ Erreur lors du chargement depuis Hugging Face: {e}")
|
| 81 |
print("🔄 Basculement vers les fichiers locaux...")
|
|
|
|
| 41 |
print(f"⚠️ Aucun token HF_TOKEN trouvé, tentative sans authentification")
|
| 42 |
dataset = load_dataset(dataset_id)
|
| 43 |
|
| 44 |
+
print(f"📊 Splits disponibles: {list(dataset.keys())}")
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 45 |
except Exception as e:
|
| 46 |
print(f"⚠️ Erreur lors du chargement depuis Hugging Face: {e}")
|
| 47 |
print("🔄 Basculement vers les fichiers locaux...")
|