Spaces:

SergioSCA
/

Multimodal_Network_Designer

Sleeping

App Files Files Community

SergioSCA commited on Feb 16, 2025

Commit

b956911

verified ·

1 Parent(s): ce47802

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -7

app.py CHANGED Viewed

@@ -1,5 +1,5 @@
 import gradio as gr
-from datasets import load_dataset
 import pandas as pd
 import time
@@ -48,12 +48,13 @@ def generate_csv(modalities, vision_tasks, nlp_tasks, audio_tasks, progress=gr.P
     progress(1, desc="Esquema CSV generado con éxito.")
     return ", ".join(columns)
-# Función para buscar datasets públicos relevantes
 def search_datasets(modalities, progress=gr.Progress()):
     dataset_map = {
-        "Visión": ["coco", "imagenet", "openimages", "cityscapes"],
-        "NLP": ["imdb", "glue", "wmt14", "sentiment140"],
-        "Audio": ["common_voice", "librispeech", "fma", "musdb18", "lmd"]  # Dataset MIDI agregado
     }
     results = []
     total_steps = len(modalities)
@@ -76,10 +77,10 @@ def analyze_datasets(selected_datasets, csv_schema, progress=gr.Progress()):
         if url.strip():
             progress(i / total_steps, desc=f"Analizando dataset: {url}")
             try:
-                # Habilitar trust_remote_code para datasets que lo requieren
                 dataset = load_dataset(url.strip(), trust_remote_code=True)
                 df = pd.DataFrame(dataset["train"])
-                # Filtrar columnas según el esquema CSV
                 filtered_df = df[[col for col in schema_columns if col in df.columns]]
                 datasets.append(filtered_df)
                 time.sleep(2)  # Simulación de procesamiento
@@ -90,6 +91,15 @@ def analyze_datasets(selected_datasets, csv_schema, progress=gr.Progress()):
     progress(1, desc="Análisis completado. Datos organizados según el esquema CSV.")
     return combined_dataset.to_csv(index=False)
 # Interfaz de Usuario con Gradio
 with gr.Blocks(title="Diseñador de Redes Neuronales Multimodales") as demo:
     gr.Markdown("# Diseñador de Redes Neuronales Multimodales")
@@ -138,6 +148,11 @@ with gr.Blocks(title="Diseñador de Redes Neuronales Multimodales") as demo:
         analyze_datasets_btn = gr.Button("Analizar Datasets Seleccionados")
         processed_output = gr.File(label="Dataset Procesado")
     # Conexiones de botones a funciones
     generate_csv_btn.click(
         generate_csv,
@@ -146,6 +161,7 @@ with gr.Blocks(title="Diseñador de Redes Neuronales Multimodales") as demo:
     )
     search_datasets_btn.click(search_datasets, inputs=[modalities], outputs=datasets_output)
     analyze_datasets_btn.click(analyze_datasets, inputs=[datasets_output, csv_output], outputs=processed_output)
 # Lanzar la aplicación
 demo.launch()

 import gradio as gr
+from datasets import load_dataset, list_datasets
 import pandas as pd
 import time
     progress(1, desc="Esquema CSV generado con éxito.")
     return ", ".join(columns)
+# Función para buscar datasets públicos relevantes en Hugging Face
 def search_datasets(modalities, progress=gr.Progress()):
+    all_datasets = list_datasets()
     dataset_map = {
+        "Visión": [ds for ds in all_datasets if "vision" in ds or "image" in ds],
+        "NLP": [ds for ds in all_datasets if "text" in ds or "nlp" in ds],
+        "Audio": [ds for ds in all_datasets if "audio" in ds or "midi" in ds]
     }
     results = []
     total_steps = len(modalities)
         if url.strip():
             progress(i / total_steps, desc=f"Analizando dataset: {url}")
             try:
+                # Cargar el dataset desde Hugging Face
                 dataset = load_dataset(url.strip(), trust_remote_code=True)
                 df = pd.DataFrame(dataset["train"])
+                # Filtrar y reordenar columnas según el esquema CSV
                 filtered_df = df[[col for col in schema_columns if col in df.columns]]
                 datasets.append(filtered_df)
                 time.sleep(2)  # Simulación de procesamiento
     progress(1, desc="Análisis completado. Datos organizados según el esquema CSV.")
     return combined_dataset.to_csv(index=False)
+# Función para ordenar o combinar columnas del esquema CSV generado
+def reorder_columns(csv_schema, column_order, progress=gr.Progress()):
+    schema_columns = [col.strip() for col in csv_schema.split(",")]
+    reordered_columns = [col for col in column_order if col in schema_columns]
+    missing_columns = [col for col in schema_columns if col not in reordered_columns]
+    final_columns = reordered_columns + missing_columns
+    progress(1, desc="Columnas reorganizadas con éxito.")
+    return ", ".join(final_columns)
 # Interfaz de Usuario con Gradio
 with gr.Blocks(title="Diseñador de Redes Neuronales Multimodales") as demo:
     gr.Markdown("# Diseñador de Redes Neuronales Multimodales")
         analyze_datasets_btn = gr.Button("Analizar Datasets Seleccionados")
         processed_output = gr.File(label="Dataset Procesado")
+    with gr.Row():
+        reorder_columns_btn = gr.Button("Reorganizar Columnas")
+        column_order_input = gr.Textbox(label="Orden de Columnas (separadas por comas)")
+        reordered_csv_output = gr.Textbox(label="Esquema CSV Reorganizado")
     # Conexiones de botones a funciones
     generate_csv_btn.click(
         generate_csv,
     )
     search_datasets_btn.click(search_datasets, inputs=[modalities], outputs=datasets_output)
     analyze_datasets_btn.click(analyze_datasets, inputs=[datasets_output, csv_output], outputs=processed_output)
+    reorder_columns_btn.click(reorder_columns, inputs=[csv_output, column_order_input], outputs=reordered_csv_output)
 # Lanzar la aplicación
 demo.launch()