Spaces:

SergioSCA
/

Multimodal_Network_Designer

Sleeping

App Files Files Community

SergioSCA commited on Feb 17, 2025

Commit

c7d73f9

verified ·

1 Parent(s): b956911

Update app.py

Browse files

Files changed (1) hide show

app.py +63 -127

app.py CHANGED Viewed

@@ -3,7 +3,7 @@ from datasets import load_dataset, list_datasets
 import pandas as pd
 import time
-# Función para generar el esquema CSV basado en las selecciones del usuario
 def generate_csv(modalities, vision_tasks, nlp_tasks, audio_tasks, progress=gr.Progress()):
     tasks = []
     if "Visión" in modalities:
@@ -14,154 +14,90 @@ def generate_csv(modalities, vision_tasks, nlp_tasks, audio_tasks, progress=gr.P
         tasks.extend(audio_tasks)
     columns = []
-    total_steps = len(modalities) * len(tasks)
     progress(0, desc="Iniciando generación del esquema CSV...")
-    for i, (modality, task) in enumerate(zip(modalities * len(tasks), tasks)):
-        progress(i / total_steps, desc=f"Procesando {modality} - {task}...")
-        time.sleep(1)  # Simulación de procesamiento
-        if modality == "Visión" and task == "Detección de Objetos":
-            columns.extend(["imagen", "etiqueta", "coordenadas_bbox"])
-        elif modality == "Visión" and task == "Segmentación Semántica":
-            columns.extend(["imagen", "máscara"])
-        elif modality == "Visión" and task == "Clasificación de Imágenes":
-            columns.extend(["imagen", "etiqueta"])
-        elif modality == "Visión" and task == "Reconocimiento Facial":
-            columns.extend(["imagen", "identidad"])
-        elif modality == "NLP" and task == "Clasificación de Texto":
-            columns.extend(["texto", "etiqueta"])
-        elif modality == "NLP" and task == "Generación de Texto":
-            columns.extend(["entrada", "salida"])
-        elif modality == "NLP" and task == "Traducción Automática":
-            columns.extend(["texto_original", "traducción"])
-        elif modality == "NLP" and task == "Análisis de Sentimientos":
-            columns.extend(["texto", "sentimiento"])
-        elif modality == "Audio" and task == "Clasificación de Audio":
-            columns.extend(["archivo_audio", "etiqueta"])
-        elif modality == "Audio" and task == "Transcripción de Voz":
-            columns.extend(["archivo_audio", "texto"])
-        elif modality == "Audio" and task == "Separación de Fuentes":
-            columns.extend(["archivo_audio", "fuente_separada"])
-        elif modality == "Audio" and task == "Síntesis de Voz":
-            columns.extend(["texto", "archivo_audio_generado"])
-        elif modality == "Audio" and task == "MIDI":  # Nueva tarea MIDI
-            columns.extend(["archivo_midi", "etiqueta"])
     progress(1, desc="Esquema CSV generado con éxito.")
     return ", ".join(columns)
-# Función para buscar datasets públicos relevantes en Hugging Face
-def search_datasets(modalities, progress=gr.Progress()):
-    all_datasets = list_datasets()
-    dataset_map = {
-        "Visión": [ds for ds in all_datasets if "vision" in ds or "image" in ds],
-        "NLP": [ds for ds in all_datasets if "text" in ds or "nlp" in ds],
-        "Audio": [ds for ds in all_datasets if "audio" in ds or "midi" in ds]
     }
-    results = []
-    total_steps = len(modalities)
-    progress(0, desc="Iniciando búsqueda de datasets...")
-    for i, modality in enumerate(modalities):
-        progress(i / total_steps, desc=f"Buscando datasets para {modality}...")
-        time.sleep(1)  # Simulación de procesamiento
-        if modality in dataset_map:
-            results.extend(dataset_map[modality])
-    progress(1, desc="Búsqueda de datasets completada.")
-    return "\n".join(results)
-# Función para analizar datasets seleccionados y organizarlos según el esquema CSV
 def analyze_datasets(selected_datasets, csv_schema, progress=gr.Progress()):
     datasets = []
     schema_columns = [col.strip() for col in csv_schema.split(",")]
     total_steps = len(selected_datasets.split("\n"))
     progress(0, desc="Iniciando análisis de datasets...")
     for i, url in enumerate(selected_datasets.split("\n")):
         if url.strip():
-            progress(i / total_steps, desc=f"Analizando dataset: {url}")
             try:
-                # Cargar el dataset desde Hugging Face
                 dataset = load_dataset(url.strip(), trust_remote_code=True)
-                df = pd.DataFrame(dataset["train"])
-                # Filtrar y reordenar columnas según el esquema CSV
-                filtered_df = df[[col for col in schema_columns if col in df.columns]]
                 datasets.append(filtered_df)
-                time.sleep(2)  # Simulación de procesamiento
             except Exception as e:
-                progress(1, desc=f"Error al analizar el dataset {url}: {str(e)}")
-                return f"Error al analizar el dataset {url}: {str(e)}"
     combined_dataset = pd.concat(datasets, ignore_index=True)
-    progress(1, desc="Análisis completado. Datos organizados según el esquema CSV.")
     return combined_dataset.to_csv(index=False)
-# Función para ordenar o combinar columnas del esquema CSV generado
 def reorder_columns(csv_schema, column_order, progress=gr.Progress()):
-    schema_columns = [col.strip() for col in csv_schema.split(",")]
-    reordered_columns = [col for col in column_order if col in schema_columns]
-    missing_columns = [col for col in schema_columns if col not in reordered_columns]
-    final_columns = reordered_columns + missing_columns
-    progress(1, desc="Columnas reorganizadas con éxito.")
-    return ", ".join(final_columns)
-# Interfaz de Usuario con Gradio
 with gr.Blocks(title="Diseñador de Redes Neuronales Multimodales") as demo:
-    gr.Markdown("# Diseñador de Redes Neuronales Multimodales")
-    gr.Markdown("Define tu red neuronal multimodal, genera datasets específicos y entrena modelos.")
-    with gr.Row():
-        modalities = gr.CheckboxGroup(
-            ["Visión", "NLP", "Audio"], label="Selecciona Modalidades"
-        )
-    with gr.Row():
-        vision_tasks = gr.CheckboxGroup(
-            ["Detección de Objetos", "Segmentación Semántica", "Clasificación de Imágenes", "Reconocimiento Facial"],
-            label="Tareas para Visión",
-            visible=False
-        )
-        nlp_tasks = gr.CheckboxGroup(
-            ["Clasificación de Texto", "Generación de Texto", "Traducción Automática", "Análisis de Sentimientos"],
-            label="Tareas para NLP",
-            visible=False
-        )
-        audio_tasks = gr.CheckboxGroup(
-            ["Clasificación de Audio", "Transcripción de Voz", "Separación de Fuentes", "Síntesis de Voz", "MIDI"],  # Tarea MIDI añadida
-            label="Tareas para Audio",
-            visible=False
-        )
-    def update_task_visibility(modalities):
-        return [
-            gr.update(visible="Visión" in modalities),
-            gr.update(visible="NLP" in modalities),
-            gr.update(visible="Audio" in modalities)
-        ]
-    modalities.change(update_task_visibility, inputs=[modalities], outputs=[vision_tasks, nlp_tasks, audio_tasks])
-    with gr.Row():
-        generate_csv_btn = gr.Button("Generar Esquema CSV")
-        csv_output = gr.Textbox(label="Esquema CSV Generado")
-    with gr.Row():
-        search_datasets_btn = gr.Button("Buscar Datasets Públicos")
-        datasets_output = gr.Textbox(label="Datasets Disponibles", lines=5)
-    with gr.Row():
-        analyze_datasets_btn = gr.Button("Analizar Datasets Seleccionados")
-        processed_output = gr.File(label="Dataset Procesado")
-    with gr.Row():
-        reorder_columns_btn = gr.Button("Reorganizar Columnas")
-        column_order_input = gr.Textbox(label="Orden de Columnas (separadas por comas)")
-        reordered_csv_output = gr.Textbox(label="Esquema CSV Reorganizado")
-    # Conexiones de botones a funciones
-    generate_csv_btn.click(
-        generate_csv,
-        inputs=[modalities, vision_tasks, nlp_tasks, audio_tasks],
-        outputs=csv_output
-    )
-    search_datasets_btn.click(search_datasets, inputs=[modalities], outputs=datasets_output)
-    analyze_datasets_btn.click(analyze_datasets, inputs=[datasets_output, csv_output], outputs=processed_output)
-    reorder_columns_btn.click(reorder_columns, inputs=[csv_output, column_order_input], outputs=reordered_csv_output)
-# Lanzar la aplicación
 demo.launch()

 import pandas as pd
 import time
+# Función para generar el esquema CSV
 def generate_csv(modalities, vision_tasks, nlp_tasks, audio_tasks, progress=gr.Progress()):
     tasks = []
     if "Visión" in modalities:
         tasks.extend(audio_tasks)
     columns = []
+    total_steps = len(tasks)  # Simplificado para usar solo la lista de tareas
     progress(0, desc="Iniciando generación del esquema CSV...")
+    for i, task in enumerate(tasks):  # Iterar directamente sobre la lista de tareas
+        modality = get_modality(task)  # Obtener la modalidad basada en la tarea
+        progress((i + 1) / total_steps, desc=f"Procesando {modality} - {task}...")
+        time.sleep(1)
+        columns.extend(get_columns_for_task(task))  # Función para obtener columnas
     progress(1, desc="Esquema CSV generado con éxito.")
     return ", ".join(columns)
+# Función auxiliar para obtener la modalidad según la tarea
+def get_modality(task):
+    if task in ["Detección de Objetos", "Segmentación Semántica", "Clasificación de Imágenes", "Reconocimiento Facial"]:
+        return "Visión"
+    elif task in ["Clasificación de Texto", "Generación de Texto", "Traducción Automática", "Análisis de Sentimientos"]:
+        return "NLP"
+    elif task in ["Clasificación de Audio", "Transcripción de Voz", "Separación de Fuentes", "Síntesis de Voz", "MIDI"]:
+        return "Audio"
+    return "Desconocido"
+# Función auxiliar para obtener las columnas según la tarea
+def get_columns_for_task(task):
+    column_mapping = {
+        "Detección de Objetos": ["imagen", "etiqueta", "coordenadas_bbox"],
+        "Segmentación Semántica": ["imagen", "máscara"],
+        "Clasificación de Imágenes": ["imagen", "etiqueta"],
+        "Reconocimiento Facial": ["imagen", "identidad"],
+        "Clasificación de Texto": ["texto", "etiqueta"],
+        "Generación de Texto": ["entrada", "salida"],
+        "Traducción Automática": ["texto_original", "traducción"],
+        "Análisis de Sentimientos": ["texto", "sentimiento"],
+        "Clasificación de Audio": ["archivo_audio", "etiqueta"],
+        "Transcripción de Voz": ["archivo_audio", "texto"],
+        "Separación de Fuentes": ["archivo_audio", "fuente_separada"],
+        "Síntesis de Voz": ["texto", "archivo_audio_generado"],
+        "MIDI": ["archivo_midi", "etiqueta"]
     }
+    return column_mapping.get(task, [])
+# Función para buscar datasets (sin cambios)
+def search_datasets(modalities, progress=gr.Progress()):
+    # ... (sin cambios)
+# Función para analizar datasets (con manejo de errores mejorado)
 def analyze_datasets(selected_datasets, csv_schema, progress=gr.Progress()):
     datasets = []
     schema_columns = [col.strip() for col in csv_schema.split(",")]
     total_steps = len(selected_datasets.split("\n"))
     progress(0, desc="Iniciando análisis de datasets...")
     for i, url in enumerate(selected_datasets.split("\n")):
         if url.strip():
+            progress((i + 1) / total_steps, desc=f"Analizando dataset: {url}")
             try:
                 dataset = load_dataset(url.strip(), trust_remote_code=True)
+                df = pd.DataFrame(dataset["train"])  # Asumiendo que siempre se usa "train"
+                # Asegurar que todas las columnas del esquema estén presentes, añadiendo NaN si faltan
+                for col in schema_columns:
+                    if col not in df.columns:
+                        df[col] = float('nan')
+                filtered_df = df[schema_columns]  # Seleccionar y reordenar columnas
                 datasets.append(filtered_df)
+                time.sleep(2)
             except Exception as e:
+                error_message = f"Error al analizar {url}: {str(e)}"
+                print(error_message)  # Imprimir mensaje de error para diagnóstico
+                progress(1, desc=error_message)  # Mostrar mensaje de error en la interfaz
+                return error_message  # Devolver mensaje de error para detener el proceso
     combined_dataset = pd.concat(datasets, ignore_index=True)
+    progress(1, desc="Análisis completado.")
     return combined_dataset.to_csv(index=False)
+# Función para reorganizar columnas (sin cambios)
 def reorder_columns(csv_schema, column_order, progress=gr.Progress()):
+    # ... (sin cambios)
+# Interfaz de Usuario con Gradio (sin cambios)
 with gr.Blocks(title="Diseñador de Redes Neuronales Multimodales") as demo:
+    # ... (sin cambios)
+# Lanzar la aplicación (sin cambios)
 demo.launch()