Spaces:

NIIHAAD
/

freesound-popularity

Sleeping

App Files Files Community

NIIHAAD commited on Feb 9

Commit

d0b8c26

verified ·

1 Parent(s): 6f37b35

Update app.py

Browse files

Files changed (1) hide show

app.py +32 -23

app.py CHANGED Viewed

@@ -395,31 +395,37 @@ def xgb_predict_safe(model, X, label_encoder=None):
 # -------- Gradio --------
-def predict_with_model(model, features, feat_list, le=None):
-    """Prédiction XGBoost sûre comme dans ton exemple"""
-    # Préparer la ligne
-    row = []
-    for col in feat_list:
-        val = features.get(col, 0)
-        if val is None or isinstance(val, (list, dict)):
-            val = 0
-        row.append(float(val))  # s'assurer que c'est float
-    # Créer DataFrame
-    X = pd.DataFrame([row], columns=feat_list)
-    # Transformer en DMatrix
-    dmatrix = xgb.DMatrix(X.values, feature_names=feat_list)
-    # Prédiction
-    pred_int = int(model.get_booster().predict(dmatrix)[0])
     if le:
-        return le.inverse_transform([pred_int])[0]
     return pred_int
 def predict_with_metadata(url):
     if url.strip() == "":
         return "❌ Veuillez entrer une URL FreeSound."
@@ -462,14 +468,17 @@ def predict_with_metadata(url):
     dmatrix = xgb.DMatrix(df_for_model.values, feature_names=list(df_for_model.columns))
-    # 7️ Faire les prédictions s
     NUM_DOWNLOADS_MAP = {0: "Low", 1: "Medium", 2: "High"}
-    # Utiliser la fonction simplifiée
-    pred_num_downloads = predict_with_model(model_nd, df_for_model.iloc[0].to_dict(), model_features)
-    pred_avg_rating = predict_with_model(model_ar, df_for_model.iloc[0].to_dict(), model_features, le=music_avg_rating_le if dur >= 10 else effect_avg_rating_le)
     # 8️ Affichage des features prétraitées
     processed_lines = ["\n=== Features après preprocessing ==="]
     for col in df_processed.columns:

 # -------- Gradio --------
+def predict_with_model(model, df_input, feat_list, le=None):
+    """
+    On passe directement le DataFrame filtré pour éviter les erreurs de dictionnaire
+    """
+    # 1. On s'assure de n'avoir que les colonnes attendues par le booster
+    booster_feats = model.get_booster().feature_names
+    # 2. On aligne le DataFrame sur ces colonnes précisément
+    X_aligned = df_input.reindex(columns=booster_feats, fill_value=0.0).astype(float)
+    # 3. Création de la DMatrix avec les noms de features officiels du modèle
+    dmatrix = xgb.DMatrix(X_aligned.values, feature_names=booster_feats)
+    # 4. Prédiction
+    preds = model.get_booster().predict(dmatrix)
+    pred_val = preds[0]
+    # Si c'est une classification (plusieurs probabilités), on prend l'index max
+    if len(preds.shape) > 1 and preds.shape[1] > 1:
+        pred_int = int(np.argmax(pred_val))
+    else:
+        pred_int = int(round(float(pred_val)))
     if le:
+        try:
+            return le.inverse_transform([pred_int])[0]
+        except:
+            return f"Classe inconnue ({pred_int})"
     return pred_int
 def predict_with_metadata(url):
     if url.strip() == "":
         return "❌ Veuillez entrer une URL FreeSound."
     dmatrix = xgb.DMatrix(df_for_model.values, feature_names=list(df_for_model.columns))
+    # 7️ Faire les prédictions
+    # On passe 'df_for_model' directement (qui est déjà un DataFrame)
+    pred_num_downloads_val = predict_with_model(model_nd, df_for_model, model_features)
+    # Mapping pour num_downloads si le modèle renvoie un entier
     NUM_DOWNLOADS_MAP = {0: "Low", 1: "Medium", 2: "High"}
+    pred_num_downloads = NUM_DOWNLOADS_MAP.get(pred_num_downloads_val, str(pred_num_downloads_val))
+    # Prédiction du rating avec le LabelEncoder
+    current_le = music_avg_rating_le if dur >= 10 else effect_avg_rating_le
+    pred_avg_rating = predict_with_model(model_ar, df_for_model, model_features, le=current_le)
     # 8️ Affichage des features prétraitées
     processed_lines = ["\n=== Features après preprocessing ==="]
     for col in df_processed.columns: