Spaces:

SergioSCA
/

Multimodal_Network_Designer

Sleeping

App Files Files Community

SergioSCA commited on Feb 17, 2025

Commit

6b3f7f3

verified ·

1 Parent(s): c7d73f9

Update app.py

Browse files

Files changed (1) hide show

app.py +12 -20

app.py CHANGED Viewed

@@ -3,7 +3,6 @@ from datasets import load_dataset, list_datasets
 import pandas as pd
 import time
-# Función para generar el esquema CSV
 def generate_csv(modalities, vision_tasks, nlp_tasks, audio_tasks, progress=gr.Progress()):
     tasks = []
     if "Visión" in modalities:
@@ -14,19 +13,18 @@ def generate_csv(modalities, vision_tasks, nlp_tasks, audio_tasks, progress=gr.P
         tasks.extend(audio_tasks)
     columns = []
-    total_steps = len(tasks)  # Simplificado para usar solo la lista de tareas
     progress(0, desc="Iniciando generación del esquema CSV...")
-    for i, task in enumerate(tasks):  # Iterar directamente sobre la lista de tareas
-        modality = get_modality(task)  # Obtener la modalidad basada en la tarea
         progress((i + 1) / total_steps, desc=f"Procesando {modality} - {task}...")
         time.sleep(1)
-        columns.extend(get_columns_for_task(task))  # Función para obtener columnas
     progress(1, desc="Esquema CSV generado con éxito.")
     return ", ".join(columns)
-# Función auxiliar para obtener la modalidad según la tarea
 def get_modality(task):
     if task in ["Detección de Objetos", "Segmentación Semántica", "Clasificación de Imágenes", "Reconocimiento Facial"]:
         return "Visión"
@@ -36,7 +34,6 @@ def get_modality(task):
         return "Audio"
     return "Desconocido"
-# Función auxiliar para obtener las columnas según la tarea
 def get_columns_for_task(task):
     column_mapping = {
         "Detección de Objetos": ["imagen", "etiqueta", "coordenadas_bbox"],
@@ -55,11 +52,9 @@ def get_columns_for_task(task):
     }
     return column_mapping.get(task, [])
-# Función para buscar datasets (sin cambios)
 def search_datasets(modalities, progress=gr.Progress()):
     # ... (sin cambios)
-# Función para analizar datasets (con manejo de errores mejorado)
 def analyze_datasets(selected_datasets, csv_schema, progress=gr.Progress()):
     datasets = []
     schema_columns = [col.strip() for col in csv_schema.split(",")]
@@ -71,33 +66,30 @@ def analyze_datasets(selected_datasets, csv_schema, progress=gr.Progress()):
             progress((i + 1) / total_steps, desc=f"Analizando dataset: {url}")
             try:
                 dataset = load_dataset(url.strip(), trust_remote_code=True)
-                df = pd.DataFrame(dataset["train"])  # Asumiendo que siempre se usa "train"
-                # Asegurar que todas las columnas del esquema estén presentes, añadiendo NaN si faltan
                 for col in schema_columns:
                     if col not in df.columns:
                         df[col] = float('nan')
-                filtered_df = df[schema_columns]  # Seleccionar y reordenar columnas
                 datasets.append(filtered_df)
                 time.sleep(2)
             except Exception as e:
                 error_message = f"Error al analizar {url}: {str(e)}"
-                print(error_message)  # Imprimir mensaje de error para diagnóstico
-                progress(1, desc=error_message)  # Mostrar mensaje de error en la interfaz
-                return error_message  # Devolver mensaje de error para detener el proceso
     combined_dataset = pd.concat(datasets, ignore_index=True)
     progress(1, desc="Análisis completado.")
     return combined_dataset.to_csv(index=False)
-# Función para reorganizar columnas (sin cambios)
 def reorder_columns(csv_schema, column_order, progress=gr.Progress()):
     # ... (sin cambios)
-# Interfaz de Usuario con Gradio (sin cambios)
 with gr.Blocks(title="Diseñador de Redes Neuronales Multimodales") as demo:
     # ... (sin cambios)
-# Lanzar la aplicación (sin cambios)
 demo.launch()

 import pandas as pd
 import time
 def generate_csv(modalities, vision_tasks, nlp_tasks, audio_tasks, progress=gr.Progress()):
     tasks = []
     if "Visión" in modalities:
         tasks.extend(audio_tasks)
     columns = []
+    total_steps = len(tasks)
     progress(0, desc="Iniciando generación del esquema CSV...")
+    for i, task in enumerate(tasks):
+        modality = get_modality(task)
         progress((i + 1) / total_steps, desc=f"Procesando {modality} - {task}...")
         time.sleep(1)
+        columns.extend(get_columns_for_task(task))
     progress(1, desc="Esquema CSV generado con éxito.")
     return ", ".join(columns)
 def get_modality(task):
     if task in ["Detección de Objetos", "Segmentación Semántica", "Clasificación de Imágenes", "Reconocimiento Facial"]:
         return "Visión"
         return "Audio"
     return "Desconocido"
 def get_columns_for_task(task):
     column_mapping = {
         "Detección de Objetos": ["imagen", "etiqueta", "coordenadas_bbox"],
     }
     return column_mapping.get(task, [])
 def search_datasets(modalities, progress=gr.Progress()):
     # ... (sin cambios)
 def analyze_datasets(selected_datasets, csv_schema, progress=gr.Progress()):
     datasets = []
     schema_columns = [col.strip() for col in csv_schema.split(",")]
             progress((i + 1) / total_steps, desc=f"Analizando dataset: {url}")
             try:
                 dataset = load_dataset(url.strip(), trust_remote_code=True)
+                df = pd.DataFrame(dataset["train"])
+                # Asegurar que todas las columnas del esquema estén presentes
                 for col in schema_columns:
                     if col not in df.columns:
                         df[col] = float('nan')
+                filtered_df = df[schema_columns]
                 datasets.append(filtered_df)
                 time.sleep(2)
             except Exception as e:
                 error_message = f"Error al analizar {url}: {str(e)}"
+                print(error_message)
+                progress(1, desc=error_message)
+                return error_message
     combined_dataset = pd.concat(datasets, ignore_index=True)
     progress(1, desc="Análisis completado.")
     return combined_dataset.to_csv(index=False)
 def reorder_columns(csv_schema, column_order, progress=gr.Progress()):
     # ... (sin cambios)
 with gr.Blocks(title="Diseñador de Redes Neuronales Multimodales") as demo:
     # ... (sin cambios)
 demo.launch()