Spaces:
Sleeping
Sleeping
Tracy André
commited on
Commit
·
aa9c0ca
1
Parent(s):
e84dbef
updated
Browse files
app.py
CHANGED
|
@@ -36,11 +36,32 @@ class AgricultureAnalyzer:
|
|
| 36 |
print(f"📋 Dataset ID: {dataset_id}")
|
| 37 |
print(f"📋 Token disponible: {'Oui' if hf_token else 'Non'}")
|
| 38 |
|
| 39 |
-
|
|
|
|
| 40 |
dataset_id,
|
| 41 |
split="train",
|
| 42 |
token=hf_token
|
| 43 |
-
)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 44 |
|
| 45 |
print(f"📊 Données chargées: {len(self.df)} lignes")
|
| 46 |
print(f"📊 Colonnes disponibles: {list(self.df.columns)}")
|
|
@@ -60,18 +81,6 @@ class AgricultureAnalyzer:
|
|
| 60 |
|
| 61 |
print(f"📊 Avant nettoyage: {initial_len} lignes")
|
| 62 |
print(f"📊 Après nettoyage: {len(self.df)} lignes")
|
| 63 |
-
|
| 64 |
-
if len(self.df) > 0:
|
| 65 |
-
herbicides_count = (self.df['familleprod'] == 'Herbicides').sum() if 'familleprod' in self.df.columns else 0
|
| 66 |
-
cultures_count = self.df['libelleusag'].nunique() if 'libelleusag' in self.df.columns else 0
|
| 67 |
-
print(f"📊 Herbicides présents: {herbicides_count} interventions")
|
| 68 |
-
print(f"📊 Cultures: {cultures_count} types différents")
|
| 69 |
-
|
| 70 |
-
return f"✅ Données chargées avec succès : {len(self.df)} enregistrements"
|
| 71 |
-
else:
|
| 72 |
-
self.df = None
|
| 73 |
-
return "❌ Aucune donnée valide après nettoyage"
|
| 74 |
-
|
| 75 |
except Exception as e:
|
| 76 |
print(f"❌ Erreur lors du chargement depuis Hugging Face: {str(e)}")
|
| 77 |
print(f"❌ Type d'erreur: {type(e).__name__}")
|
|
|
|
| 36 |
print(f"📋 Dataset ID: {dataset_id}")
|
| 37 |
print(f"📋 Token disponible: {'Oui' if hf_token else 'Non'}")
|
| 38 |
|
| 39 |
+
# Tentative de chargement direct
|
| 40 |
+
dataset = load_dataset(
|
| 41 |
dataset_id,
|
| 42 |
split="train",
|
| 43 |
token=hf_token
|
| 44 |
+
)
|
| 45 |
+
|
| 46 |
+
print(f"📊 Dataset chargé: {len(dataset)} exemples")
|
| 47 |
+
|
| 48 |
+
# Conversion en pandas avec gestion d'erreur
|
| 49 |
+
try:
|
| 50 |
+
self.df = dataset.to_pandas()
|
| 51 |
+
print("✅ Conversion to_pandas() réussie")
|
| 52 |
+
except Exception as pandas_error:
|
| 53 |
+
print(f"❌ Erreur to_pandas(): {pandas_error}")
|
| 54 |
+
print("🔄 Tentative de conversion manuelle...")
|
| 55 |
+
|
| 56 |
+
# Conversion manuelle
|
| 57 |
+
data_list = []
|
| 58 |
+
for i, item in enumerate(dataset):
|
| 59 |
+
data_list.append(item)
|
| 60 |
+
if i < 5: # Afficher les 5 premiers pour debug
|
| 61 |
+
print(f"📋 Exemple {i}: {list(item.keys())}")
|
| 62 |
+
|
| 63 |
+
self.df = pd.DataFrame(data_list)
|
| 64 |
+
print(f"✅ Conversion manuelle réussie: {len(self.df)} lignes")
|
| 65 |
|
| 66 |
print(f"📊 Données chargées: {len(self.df)} lignes")
|
| 67 |
print(f"📊 Colonnes disponibles: {list(self.df.columns)}")
|
|
|
|
| 81 |
|
| 82 |
print(f"📊 Avant nettoyage: {initial_len} lignes")
|
| 83 |
print(f"📊 Après nettoyage: {len(self.df)} lignes")
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 84 |
except Exception as e:
|
| 85 |
print(f"❌ Erreur lors du chargement depuis Hugging Face: {str(e)}")
|
| 86 |
print(f"❌ Type d'erreur: {type(e).__name__}")
|