Spaces:

hoololi
/

novels-embeddings

Sleeping

App Files Files Community

hoololi commited on Jul 8, 2025

Commit

95258cd

verified ·

1 Parent(s): a096c72

Upload app.py

Browse files

Files changed (1) hide show

app.py +22 -81

app.py CHANGED Viewed

@@ -1,23 +1,4 @@
-# Événements - Mise à jour quand les checkboxes changent
-        checkbox_inputs = list(novel_checkboxes.values())
-        def update_from_checkboxes(*checkbox_values):
-            # Reconstruire le dictionnaire novel -> bool
-            novel_selection = {novel: value for novel, value in zip(available_novels, checkbox_values)}
-            selected_novels = [novel for novel, selected in novel_selection.items() if selected]
-            # Créer le graphique
-            fig = create_embeddings_plot(selected_novels)
-            return fig
-        # Connecter tous les checkboxes à la fonction de mise à jour
-        for checkbox in checkbox_inputs:
-            checkbox.change(
-                fn=update_from_checkboxes,
-                inputs=checkbox_inputs,
-                outputs=[plot_display]
-            )"""
 App Gradio pour visualiser les embeddings de romans français
 Interface minimaliste avec style Seaborn
 """
@@ -42,21 +23,6 @@ sns.set_palette("deep")
 # ==================== CHARGEMENT DES DONNÉES ====================
-def load_novels_dataset():
-    """Charge le dataset des romans depuis Hugging Face"""
-    try:
-        print(f"📚 Chargement du dataset {DATASET_NAME}...")
-        dataset = load_dataset(DATASET_NAME)
-        # Convertir en DataFrame pour facilité d'usage
-        df = dataset.to_pandas()
-        print(f"✅ Dataset chargé: {len(df)} phrases de {len(df['roman'].unique())} romans")
-        return df
-    except Exception as e:
-        print(f"❌ Erreur lors du chargement: {e}")
-        return None
 # Charger le dataset au démarrage
 print("🔄 Initialisation de l'application...")
 try:
@@ -133,9 +99,6 @@ except Exception as e:
         print(f"❌ Impossible de créer les données de test: {test_error}")
         dataset_df = None
         available_novels = []
-        print(f"❌ Impossible de créer les données de test: {test_error}")
-        dataset_df = None
-        available_novels = []
 # ==================== FONCTIONS DE VISUALISATION ====================
@@ -149,7 +112,6 @@ def create_embeddings_plot(selected_novels, figsize=(10, 8)):
                 ha='center', va='center', transform=ax.transAxes, fontsize=16)
         ax.set_xlim(0, 1)
         ax.set_ylim(0, 1)
-        plt.title("Visualisation des embeddings")
         return fig
     # Filtrer les données selon les romans sélectionnés
@@ -161,7 +123,6 @@ def create_embeddings_plot(selected_novels, figsize=(10, 8)):
                 ha='center', va='center', transform=ax.transAxes, fontsize=16)
         ax.set_xlim(0, 1)
         ax.set_ylim(0, 1)
-        plt.title("Visualisation des embeddings")
         return fig
     # Calculer les bornes globales pour garder l'échelle fixe
@@ -188,7 +149,6 @@ def create_embeddings_plot(selected_novels, figsize=(10, 8)):
     )
     # Configuration du graphique
-    plt.title('Embeddings des Romans Français', fontsize=16, fontweight='bold', pad=20)
     plt.xlabel('t-SNE dimension 1', fontsize=12)
     plt.ylabel('t-SNE dimension 2', fontsize=12)
@@ -215,48 +175,8 @@ def create_embeddings_plot(selected_novels, figsize=(10, 8)):
     return fig
-def get_summary_stats(selected_novels):
-    """Calcule et affiche des statistiques sur les romans sélectionnés"""
-    if dataset_df is None or not selected_novels:
-        return "Aucune donnée disponible"
-    filtered_df = dataset_df[dataset_df['roman'].isin(selected_novels)]
-    if filtered_df.empty:
-        return "Aucun roman sélectionné"
-    # Calculer les statistiques simplifiées
-    stats = []
-    stats.append(f"📊 **Statistiques des romans sélectionnés:**\n")
-    for roman in selected_novels:
-        roman_data = filtered_df[filtered_df['roman'] == roman]
-        if not roman_data.empty:
-            nb_phrases = len(roman_data)
-            stats.append(f"📚 **{roman}** : {nb_phrases} phrases")
-    # Info globale
-    stats.append(f"\n🎯 **Total: {len(filtered_df)} phrases de {len(selected_novels)} roman(s)**")
-    return "\n".join(stats)
 # ==================== INTERFACE GRADIO ====================
-def update_visualization(novel_checkboxes):
-    """Met à jour la visualisation selon les romans sélectionnés"""
-    # Extraire les romans sélectionnés des checkboxes
-    selected_novels = [novel for novel, selected in novel_checkboxes.items() if selected]
-    # Créer le graphique
-    fig = create_embeddings_plot(selected_novels)
-    # Générer les statistiques
-    stats = get_summary_stats(selected_novels)
-    return fig, stats
 def create_gradio_interface():
     """Crée l'interface Gradio minimaliste"""
@@ -310,6 +230,27 @@ def create_gradio_interface():
             label="📊 Projection t-SNE des embeddings",
             value=create_embeddings_plot(available_novels)
         )
     return demo

+"""
 App Gradio pour visualiser les embeddings de romans français
 Interface minimaliste avec style Seaborn
 """
 # ==================== CHARGEMENT DES DONNÉES ====================
 # Charger le dataset au démarrage
 print("🔄 Initialisation de l'application...")
 try:
         print(f"❌ Impossible de créer les données de test: {test_error}")
         dataset_df = None
         available_novels = []
 # ==================== FONCTIONS DE VISUALISATION ====================
                 ha='center', va='center', transform=ax.transAxes, fontsize=16)
         ax.set_xlim(0, 1)
         ax.set_ylim(0, 1)
         return fig
     # Filtrer les données selon les romans sélectionnés
                 ha='center', va='center', transform=ax.transAxes, fontsize=16)
         ax.set_xlim(0, 1)
         ax.set_ylim(0, 1)
         return fig
     # Calculer les bornes globales pour garder l'échelle fixe
     )
     # Configuration du graphique
     plt.xlabel('t-SNE dimension 1', fontsize=12)
     plt.ylabel('t-SNE dimension 2', fontsize=12)
     return fig
 # ==================== INTERFACE GRADIO ====================
 def create_gradio_interface():
     """Crée l'interface Gradio minimaliste"""
             label="📊 Projection t-SNE des embeddings",
             value=create_embeddings_plot(available_novels)
         )
+        # Événements - Mise à jour quand les checkboxes changent
+        checkbox_inputs = list(novel_checkboxes.values())
+        def update_from_checkboxes(*checkbox_values):
+            # Reconstruire le dictionnaire novel -> bool
+            novel_selection = {novel: value for novel, value in zip(available_novels, checkbox_values)}
+            selected_novels = [novel for novel, selected in novel_selection.items() if selected]
+            # Créer le graphique
+            fig = create_embeddings_plot(selected_novels)
+            return fig
+        # Connecter tous les checkboxes à la fonction de mise à jour
+        for checkbox in checkbox_inputs:
+            checkbox.change(
+                fn=update_from_checkboxes,
+                inputs=checkbox_inputs,
+                outputs=[plot_display]
+            )
     return demo