Spaces:

SergioSCA
/

Multimodal_Network_Designer

Running

App Files Files Community

SergioSCA commited on Feb 16, 2025

Commit

1c951a9

verified ·

1 Parent(s): 187ebd3

Update app.py

Browse files

Files changed (1) hide show

app.py +20 -27

app.py CHANGED Viewed

@@ -43,6 +43,8 @@ def generate_csv(modalities, vision_tasks, nlp_tasks, audio_tasks, progress=gr.P
             columns.extend(["archivo_audio", "fuente_separada"])
         elif modality == "Audio" and task == "Síntesis de Voz":
             columns.extend(["texto", "archivo_audio_generado"])
     progress(1, desc="Esquema CSV generado con éxito.")
     return ", ".join(columns)
@@ -51,7 +53,7 @@ def search_datasets(modalities, progress=gr.Progress()):
     dataset_map = {
         "Visión": ["coco", "imagenet", "openimages", "cityscapes"],
         "NLP": ["imdb", "glue", "wmt14", "sentiment140"],
-        "Audio": ["common_voice", "librispeech", "fma", "musdb18"]
     }
     results = []
     total_steps = len(modalities)
@@ -64,31 +66,27 @@ def search_datasets(modalities, progress=gr.Progress()):
     progress(1, desc="Búsqueda de datasets completada.")
     return "\n".join(results)
-# Función para seleccionar datasets y agregarlos al campo de URLs
-def select_datasets(selected_datasets, current_urls):
-    selected_datasets = selected_datasets.split("\n")
-    current_urls = current_urls.split("\n") if current_urls else []
-    updated_urls = list(set(current_urls + selected_datasets))
-    return "\n".join(updated_urls)
-# Función para procesar datasets seleccionados
-def process_datasets(dataset_urls, progress=gr.Progress()):
     datasets = []
-    urls = dataset_urls.split("\n")
-    total_steps = len(urls)
-    progress(0, desc="Iniciando procesamiento de datasets...")
-    for i, url in enumerate(urls):
         if url.strip():
-            progress(i / total_steps, desc=f"Procesando dataset: {url}")
             try:
                 dataset = load_dataset(url.strip())
-                datasets.append(pd.DataFrame(dataset["train"]))
                 time.sleep(2)  # Simulación de procesamiento
             except Exception as e:
-                progress(1, desc=f"Error al cargar el dataset {url}: {str(e)}")
-                return f"Error al cargar el dataset {url}: {str(e)}"
     combined_dataset = pd.concat(datasets, ignore_index=True)
-    progress(1, desc="Todos los datasets procesados y combinados.")
     return combined_dataset.to_csv(index=False)
 # Interfaz de Usuario con Gradio
@@ -113,7 +111,7 @@ with gr.Blocks(title="Diseñador de Redes Neuronales Multimodales") as demo:
             visible=False
         )
         audio_tasks = gr.CheckboxGroup(
-            ["Clasificación de Audio", "Transcripción de Voz", "Separación de Fuentes", "Síntesis de Voz"],
             label="Tareas para Audio",
             visible=False
         )
@@ -136,11 +134,7 @@ with gr.Blocks(title="Diseñador de Redes Neuronales Multimodales") as demo:
         datasets_output = gr.Textbox(label="Datasets Disponibles", lines=5)
     with gr.Row():
-        select_datasets_btn = gr.Button("Seleccionar Datasets")
-        dataset_urls = gr.Textbox(label="Introduce URLs de Datasets", lines=5)
-    with gr.Row():
-        process_datasets_btn = gr.Button("Procesar Datasets")
         processed_output = gr.File(label="Dataset Procesado")
     # Conexiones de botones a funciones
@@ -150,8 +144,7 @@ with gr.Blocks(title="Diseñador de Redes Neuronales Multimodales") as demo:
         outputs=csv_output
     )
     search_datasets_btn.click(search_datasets, inputs=[modalities], outputs=datasets_output)
-    select_datasets_btn.click(select_datasets, inputs=[datasets_output, dataset_urls], outputs=dataset_urls)
-    process_datasets_btn.click(process_datasets, inputs=[dataset_urls], outputs=processed_output)
 # Lanzar la aplicación
 demo.launch()

             columns.extend(["archivo_audio", "fuente_separada"])
         elif modality == "Audio" and task == "Síntesis de Voz":
             columns.extend(["texto", "archivo_audio_generado"])
+        elif modality == "Audio" and task == "MIDI":  # Nueva tarea MIDI
+            columns.extend(["archivo_midi", "etiqueta"])
     progress(1, desc="Esquema CSV generado con éxito.")
     return ", ".join(columns)
     dataset_map = {
         "Visión": ["coco", "imagenet", "openimages", "cityscapes"],
         "NLP": ["imdb", "glue", "wmt14", "sentiment140"],
+        "Audio": ["common_voice", "librispeech", "fma", "musdb18", "lmd"]  # Dataset MIDI agregado
     }
     results = []
     total_steps = len(modalities)
     progress(1, desc="Búsqueda de datasets completada.")
     return "\n".join(results)
+# Función para analizar datasets seleccionados y organizarlos según el esquema CSV
+def analyze_datasets(selected_datasets, csv_schema, progress=gr.Progress()):
     datasets = []
+    schema_columns = [col.strip() for col in csv_schema.split(",")]
+    total_steps = len(selected_datasets.split("\n"))
+    progress(0, desc="Iniciando análisis de datasets...")
+    for i, url in enumerate(selected_datasets.split("\n")):
         if url.strip():
+            progress(i / total_steps, desc=f"Analizando dataset: {url}")
             try:
                 dataset = load_dataset(url.strip())
+                df = pd.DataFrame(dataset["train"])
+                # Filtrar columnas según el esquema CSV
+                filtered_df = df[[col for col in schema_columns if col in df.columns]]
+                datasets.append(filtered_df)
                 time.sleep(2)  # Simulación de procesamiento
             except Exception as e:
+                progress(1, desc=f"Error al analizar el dataset {url}: {str(e)}")
+                return f"Error al analizar el dataset {url}: {str(e)}"
     combined_dataset = pd.concat(datasets, ignore_index=True)
+    progress(1, desc="Análisis completado. Datos organizados según el esquema CSV.")
     return combined_dataset.to_csv(index=False)
 # Interfaz de Usuario con Gradio
             visible=False
         )
         audio_tasks = gr.CheckboxGroup(
+            ["Clasificación de Audio", "Transcripción de Voz", "Separación de Fuentes", "Síntesis de Voz", "MIDI"],  # Tarea MIDI añadida
             label="Tareas para Audio",
             visible=False
         )
         datasets_output = gr.Textbox(label="Datasets Disponibles", lines=5)
     with gr.Row():
+        analyze_datasets_btn = gr.Button("Analizar Datasets Seleccionados")
         processed_output = gr.File(label="Dataset Procesado")
     # Conexiones de botones a funciones
         outputs=csv_output
     )
     search_datasets_btn.click(search_datasets, inputs=[modalities], outputs=datasets_output)
+    analyze_datasets_btn.click(analyze_datasets, inputs=[datasets_output, csv_output], outputs=processed_output)
 # Lanzar la aplicación
 demo.launch()