Spaces:

SergioSCA
/

Multimodal_Network_Designer

Running

File size: 7,074 Bytes

efdd1f5
 
 
b3fc81e
efdd1f5
 
187ebd3
 
 
 
 
 
 
 
 
efdd1f5
b3fc81e
 
187ebd3
b3fc81e
 
efdd1f5
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1c951a9
 
b3fc81e
efdd1f5
 
 
b3fc81e
efdd1f5
 
 
1c951a9
efdd1f5
 
b3fc81e
 
 
 
 
efdd1f5
 
b3fc81e
efdd1f5
 
1c951a9
 
efdd1f5
1c951a9
 
 
 
efdd1f5
1c951a9
efdd1f5
 
1c951a9
 
 
 
b3fc81e
efdd1f5
1c951a9
 
efdd1f5
1c951a9
efdd1f5
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1c951a9
efdd1f5
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1c951a9
efdd1f5
 
 
 
 
187ebd3
efdd1f5
 
 
1c951a9
efdd1f5
 
cba4d16

import gradio as gr
from datasets import load_dataset
import pandas as pd
import time

# Función para generar el esquema CSV basado en las selecciones del usuario
def generate_csv(modalities, vision_tasks, nlp_tasks, audio_tasks, progress=gr.Progress()):
    tasks = []
    if "Visión" in modalities:
        tasks.extend(vision_tasks)
    if "NLP" in modalities:
        tasks.extend(nlp_tasks)
    if "Audio" in modalities:
        tasks.extend(audio_tasks)

    columns = []
    total_steps = len(modalities) * len(tasks)
    progress(0, desc="Iniciando generación del esquema CSV...")
    for i, (modality, task) in enumerate(zip(modalities * len(tasks), tasks)):
        progress(i / total_steps, desc=f"Procesando {modality} - {task}...")
        time.sleep(1)  # Simulación de procesamiento
        if modality == "Visión" and task == "Detección de Objetos":
            columns.extend(["imagen", "etiqueta", "coordenadas_bbox"])
        elif modality == "Visión" and task == "Segmentación Semántica":
            columns.extend(["imagen", "máscara"])
        elif modality == "Visión" and task == "Clasificación de Imágenes":
            columns.extend(["imagen", "etiqueta"])
        elif modality == "Visión" and task == "Reconocimiento Facial":
            columns.extend(["imagen", "identidad"])
        elif modality == "NLP" and task == "Clasificación de Texto":
            columns.extend(["texto", "etiqueta"])
        elif modality == "NLP" and task == "Generación de Texto":
            columns.extend(["entrada", "salida"])
        elif modality == "NLP" and task == "Traducción Automática":
            columns.extend(["texto_original", "traducción"])
        elif modality == "NLP" and task == "Análisis de Sentimientos":
            columns.extend(["texto", "sentimiento"])
        elif modality == "Audio" and task == "Clasificación de Audio":
            columns.extend(["archivo_audio", "etiqueta"])
        elif modality == "Audio" and task == "Transcripción de Voz":
            columns.extend(["archivo_audio", "texto"])
        elif modality == "Audio" and task == "Separación de Fuentes":
            columns.extend(["archivo_audio", "fuente_separada"])
        elif modality == "Audio" and task == "Síntesis de Voz":
            columns.extend(["texto", "archivo_audio_generado"])
        elif modality == "Audio" and task == "MIDI":  # Nueva tarea MIDI
            columns.extend(["archivo_midi", "etiqueta"])
    progress(1, desc="Esquema CSV generado con éxito.")
    return ", ".join(columns)

# Función para buscar datasets públicos relevantes
def search_datasets(modalities, progress=gr.Progress()):
    dataset_map = {
        "Visión": ["coco", "imagenet", "openimages", "cityscapes"],
        "NLP": ["imdb", "glue", "wmt14", "sentiment140"],
        "Audio": ["common_voice", "librispeech", "fma", "musdb18", "lmd"]  # Dataset MIDI agregado
    }
    results = []
    total_steps = len(modalities)
    progress(0, desc="Iniciando búsqueda de datasets...")
    for i, modality in enumerate(modalities):
        progress(i / total_steps, desc=f"Buscando datasets para {modality}...")
        time.sleep(1)  # Simulación de procesamiento
        if modality in dataset_map:
            results.extend(dataset_map[modality])
    progress(1, desc="Búsqueda de datasets completada.")
    return "\n".join(results)

# Función para analizar datasets seleccionados y organizarlos según el esquema CSV
def analyze_datasets(selected_datasets, csv_schema, progress=gr.Progress()):
    datasets = []
    schema_columns = [col.strip() for col in csv_schema.split(",")]
    total_steps = len(selected_datasets.split("\n"))
    progress(0, desc="Iniciando análisis de datasets...")
    for i, url in enumerate(selected_datasets.split("\n")):
        if url.strip():
            progress(i / total_steps, desc=f"Analizando dataset: {url}")
            try:
                dataset = load_dataset(url.strip())
                df = pd.DataFrame(dataset["train"])
                # Filtrar columnas según el esquema CSV
                filtered_df = df[[col for col in schema_columns if col in df.columns]]
                datasets.append(filtered_df)
                time.sleep(2)  # Simulación de procesamiento
            except Exception as e:
                progress(1, desc=f"Error al analizar el dataset {url}: {str(e)}")
                return f"Error al analizar el dataset {url}: {str(e)}"
    combined_dataset = pd.concat(datasets, ignore_index=True)
    progress(1, desc="Análisis completado. Datos organizados según el esquema CSV.")
    return combined_dataset.to_csv(index=False)

# Interfaz de Usuario con Gradio
with gr.Blocks(title="Diseñador de Redes Neuronales Multimodales") as demo:
    gr.Markdown("# Diseñador de Redes Neuronales Multimodales")
    gr.Markdown("Define tu red neuronal multimodal, genera datasets específicos y entrena modelos.")

    with gr.Row():
        modalities = gr.CheckboxGroup(
            ["Visión", "NLP", "Audio"], label="Selecciona Modalidades"
        )

    with gr.Row():
        vision_tasks = gr.CheckboxGroup(
            ["Detección de Objetos", "Segmentación Semántica", "Clasificación de Imágenes", "Reconocimiento Facial"],
            label="Tareas para Visión",
            visible=False
        )
        nlp_tasks = gr.CheckboxGroup(
            ["Clasificación de Texto", "Generación de Texto", "Traducción Automática", "Análisis de Sentimientos"],
            label="Tareas para NLP",
            visible=False
        )
        audio_tasks = gr.CheckboxGroup(
            ["Clasificación de Audio", "Transcripción de Voz", "Separación de Fuentes", "Síntesis de Voz", "MIDI"],  # Tarea MIDI añadida
            label="Tareas para Audio",
            visible=False
        )

    def update_task_visibility(modalities):
        return [
            gr.update(visible="Visión" in modalities),
            gr.update(visible="NLP" in modalities),
            gr.update(visible="Audio" in modalities)
        ]

    modalities.change(update_task_visibility, inputs=[modalities], outputs=[vision_tasks, nlp_tasks, audio_tasks])

    with gr.Row():
        generate_csv_btn = gr.Button("Generar Esquema CSV")
        csv_output = gr.Textbox(label="Esquema CSV Generado")

    with gr.Row():
        search_datasets_btn = gr.Button("Buscar Datasets Públicos")
        datasets_output = gr.Textbox(label="Datasets Disponibles", lines=5)

    with gr.Row():
        analyze_datasets_btn = gr.Button("Analizar Datasets Seleccionados")
        processed_output = gr.File(label="Dataset Procesado")

    # Conexiones de botones a funciones
    generate_csv_btn.click(
        generate_csv,
        inputs=[modalities, vision_tasks, nlp_tasks, audio_tasks],
        outputs=csv_output
    )
    search_datasets_btn.click(search_datasets, inputs=[modalities], outputs=datasets_output)
    analyze_datasets_btn.click(analyze_datasets, inputs=[datasets_output, csv_output], outputs=processed_output)

# Lanzar la aplicación
demo.launch()