Spaces:

SergioSCA
/

Multimodal_Network_Designer

Sleeping

App Files Files Community

SergioSCA commited on Feb 16, 2025

Commit

b3fc81e

verified ·

1 Parent(s): efdd1f5

Update app.py

Browse files

Files changed (1) hide show

app.py +24 -14

app.py CHANGED Viewed

@@ -1,11 +1,16 @@
 import gradio as gr
 from datasets import load_dataset
 import pandas as pd
 # Función para generar el esquema CSV basado en las selecciones del usuario
-def generate_csv(modalities, tasks):
     columns = []
-    for modality, task in zip(modalities, tasks):
         if modality == "Visión" and task == "Detección de Objetos":
             columns.extend(["imagen", "etiqueta", "coordenadas_bbox"])
         elif modality == "Visión" and task == "Segmentación Semántica":
@@ -30,40 +35,45 @@ def generate_csv(modalities, tasks):
             columns.extend(["archivo_audio", "fuente_separada"])
         elif modality == "Audio" and task == "Síntesis de Voz":
             columns.extend(["texto", "archivo_audio_generado"])
     return ", ".join(columns)
 # Función para buscar datasets públicos relevantes
-def search_datasets(modalities):
-    # Simulación de búsqueda de datasets en Hugging Face
     dataset_map = {
         "Visión": ["coco", "imagenet", "openimages", "cityscapes"],
         "NLP": ["imdb", "glue", "wmt14", "sentiment140"],
         "Audio": ["common_voice", "librispeech", "fma", "musdb18"]
     }
     results = []
-    for modality in modalities:
         if modality in dataset_map:
             results.extend(dataset_map[modality])
     return "\n".join(results)
-# Función para seleccionar datasets y agregarlos al campo de URLs
-def select_datasets(selected_datasets, current_urls):
-    selected_datasets = selected_datasets.split("\n")
-    current_urls = current_urls.split("\n") if current_urls else []
-    updated_urls = list(set(current_urls + selected_datasets))
-    return "\n".join(updated_urls)
 # Función para procesar datasets seleccionados
-def process_datasets(dataset_urls):
     datasets = []
-    for url in dataset_urls.split("\n"):
         if url.strip():
             try:
                 dataset = load_dataset(url.strip())
                 datasets.append(pd.DataFrame(dataset["train"]))
             except Exception as e:
                 return f"Error al cargar el dataset {url}: {str(e)}"
     combined_dataset = pd.concat(datasets, ignore_index=True)
     return combined_dataset.to_csv(index=False)
 # Interfaz de Usuario con Gradio

 import gradio as gr
 from datasets import load_dataset
 import pandas as pd
+import time
 # Función para generar el esquema CSV basado en las selecciones del usuario
+def generate_csv(modalities, tasks, progress=gr.Progress()):
     columns = []
+    total_steps = len(modalities) * len(tasks)
+    progress(0, desc="Iniciando generación del esquema CSV...")
+    for i, (modality, task) in enumerate(zip(modalities, tasks)):
+        progress(i / total_steps, desc=f"Procesando {modality} - {task}...")
+        time.sleep(1)  # Simulación de procesamiento
         if modality == "Visión" and task == "Detección de Objetos":
             columns.extend(["imagen", "etiqueta", "coordenadas_bbox"])
         elif modality == "Visión" and task == "Segmentación Semántica":
             columns.extend(["archivo_audio", "fuente_separada"])
         elif modality == "Audio" and task == "Síntesis de Voz":
             columns.extend(["texto", "archivo_audio_generado"])
+    progress(1, desc="Esquema CSV generado con éxito.")
     return ", ".join(columns)
 # Función para buscar datasets públicos relevantes
+def search_datasets(modalities, progress=gr.Progress()):
     dataset_map = {
         "Visión": ["coco", "imagenet", "openimages", "cityscapes"],
         "NLP": ["imdb", "glue", "wmt14", "sentiment140"],
         "Audio": ["common_voice", "librispeech", "fma", "musdb18"]
     }
     results = []
+    total_steps = len(modalities)
+    progress(0, desc="Iniciando búsqueda de datasets...")
+    for i, modality in enumerate(modalities):
+        progress(i / total_steps, desc=f"Buscando datasets para {modality}...")
+        time.sleep(1)  # Simulación de procesamiento
         if modality in dataset_map:
             results.extend(dataset_map[modality])
+    progress(1, desc="Búsqueda de datasets completada.")
     return "\n".join(results)
 # Función para procesar datasets seleccionados
+def process_datasets(dataset_urls, progress=gr.Progress()):
     datasets = []
+    urls = dataset_urls.split("\n")
+    total_steps = len(urls)
+    progress(0, desc="Iniciando procesamiento de datasets...")
+    for i, url in enumerate(urls):
         if url.strip():
+            progress(i / total_steps, desc=f"Procesando dataset: {url}")
             try:
                 dataset = load_dataset(url.strip())
                 datasets.append(pd.DataFrame(dataset["train"]))
+                time.sleep(2)  # Simulación de procesamiento
             except Exception as e:
+                progress(1, desc=f"Error al cargar el dataset {url}: {str(e)}")
                 return f"Error al cargar el dataset {url}: {str(e)}"
     combined_dataset = pd.concat(datasets, ignore_index=True)
+    progress(1, desc="Todos los datasets procesados y combinados.")
     return combined_dataset.to_csv(index=False)
 # Interfaz de Usuario con Gradio