Spaces:

SergioSCA
/

Multimodal_Network_Designer

Running

App Files Files Community

Multimodal_Network_Designer / app.py

SergioSCA

Update app.py

1c951a9 verified about 1 year ago

raw

history blame

7.07 kB

	import gradio as gr
	from datasets import load_dataset
	import pandas as pd
	import time

	# Función para generar el esquema CSV basado en las selecciones del usuario
	def generate_csv(modalities, vision_tasks, nlp_tasks, audio_tasks, progress=gr.Progress()):
	tasks = []
	if "Visión" in modalities:
	tasks.extend(vision_tasks)
	if "NLP" in modalities:
	tasks.extend(nlp_tasks)
	if "Audio" in modalities:
	tasks.extend(audio_tasks)

	columns = []
	total_steps = len(modalities) * len(tasks)
	progress(0, desc="Iniciando generación del esquema CSV...")
	for i, (modality, task) in enumerate(zip(modalities * len(tasks), tasks)):
	progress(i / total_steps, desc=f"Procesando {modality} - {task}...")
	time.sleep(1) # Simulación de procesamiento
	if modality == "Visión" and task == "Detección de Objetos":
	columns.extend(["imagen", "etiqueta", "coordenadas_bbox"])
	elif modality == "Visión" and task == "Segmentación Semántica":
	columns.extend(["imagen", "máscara"])
	elif modality == "Visión" and task == "Clasificación de Imágenes":
	columns.extend(["imagen", "etiqueta"])
	elif modality == "Visión" and task == "Reconocimiento Facial":
	columns.extend(["imagen", "identidad"])
	elif modality == "NLP" and task == "Clasificación de Texto":
	columns.extend(["texto", "etiqueta"])
	elif modality == "NLP" and task == "Generación de Texto":
	columns.extend(["entrada", "salida"])
	elif modality == "NLP" and task == "Traducción Automática":
	columns.extend(["texto_original", "traducción"])
	elif modality == "NLP" and task == "Análisis de Sentimientos":
	columns.extend(["texto", "sentimiento"])
	elif modality == "Audio" and task == "Clasificación de Audio":
	columns.extend(["archivo_audio", "etiqueta"])
	elif modality == "Audio" and task == "Transcripción de Voz":
	columns.extend(["archivo_audio", "texto"])
	elif modality == "Audio" and task == "Separación de Fuentes":
	columns.extend(["archivo_audio", "fuente_separada"])
	elif modality == "Audio" and task == "Síntesis de Voz":
	columns.extend(["texto", "archivo_audio_generado"])
	elif modality == "Audio" and task == "MIDI": # Nueva tarea MIDI
	columns.extend(["archivo_midi", "etiqueta"])
	progress(1, desc="Esquema CSV generado con éxito.")
	return ", ".join(columns)

	# Función para buscar datasets públicos relevantes
	def search_datasets(modalities, progress=gr.Progress()):
	dataset_map = {
	"Visión": ["coco", "imagenet", "openimages", "cityscapes"],
	"NLP": ["imdb", "glue", "wmt14", "sentiment140"],
	"Audio": ["common_voice", "librispeech", "fma", "musdb18", "lmd"] # Dataset MIDI agregado
	}
	results = []
	total_steps = len(modalities)
	progress(0, desc="Iniciando búsqueda de datasets...")
	for i, modality in enumerate(modalities):
	progress(i / total_steps, desc=f"Buscando datasets para {modality}...")
	time.sleep(1) # Simulación de procesamiento
	if modality in dataset_map:
	results.extend(dataset_map[modality])
	progress(1, desc="Búsqueda de datasets completada.")
	return "\n".join(results)

	# Función para analizar datasets seleccionados y organizarlos según el esquema CSV
	def analyze_datasets(selected_datasets, csv_schema, progress=gr.Progress()):
	datasets = []
	schema_columns = [col.strip() for col in csv_schema.split(",")]
	total_steps = len(selected_datasets.split("\n"))
	progress(0, desc="Iniciando análisis de datasets...")
	for i, url in enumerate(selected_datasets.split("\n")):
	if url.strip():
	progress(i / total_steps, desc=f"Analizando dataset: {url}")
	try:
	dataset = load_dataset(url.strip())
	df = pd.DataFrame(dataset["train"])
	# Filtrar columnas según el esquema CSV
	filtered_df = df[[col for col in schema_columns if col in df.columns]]
	datasets.append(filtered_df)
	time.sleep(2) # Simulación de procesamiento
	except Exception as e:
	progress(1, desc=f"Error al analizar el dataset {url}: {str(e)}")
	return f"Error al analizar el dataset {url}: {str(e)}"
	combined_dataset = pd.concat(datasets, ignore_index=True)
	progress(1, desc="Análisis completado. Datos organizados según el esquema CSV.")
	return combined_dataset.to_csv(index=False)

	# Interfaz de Usuario con Gradio
	with gr.Blocks(title="Diseñador de Redes Neuronales Multimodales") as demo:
	gr.Markdown("# Diseñador de Redes Neuronales Multimodales")
	gr.Markdown("Define tu red neuronal multimodal, genera datasets específicos y entrena modelos.")

	with gr.Row():
	modalities = gr.CheckboxGroup(
	["Visión", "NLP", "Audio"], label="Selecciona Modalidades"
	)

	with gr.Row():
	vision_tasks = gr.CheckboxGroup(
	["Detección de Objetos", "Segmentación Semántica", "Clasificación de Imágenes", "Reconocimiento Facial"],
	label="Tareas para Visión",
	visible=False
	)
	nlp_tasks = gr.CheckboxGroup(
	["Clasificación de Texto", "Generación de Texto", "Traducción Automática", "Análisis de Sentimientos"],
	label="Tareas para NLP",
	visible=False
	)
	audio_tasks = gr.CheckboxGroup(
	["Clasificación de Audio", "Transcripción de Voz", "Separación de Fuentes", "Síntesis de Voz", "MIDI"], # Tarea MIDI añadida
	label="Tareas para Audio",
	visible=False
	)

	def update_task_visibility(modalities):
	return [
	gr.update(visible="Visión" in modalities),
	gr.update(visible="NLP" in modalities),
	gr.update(visible="Audio" in modalities)
	]

	modalities.change(update_task_visibility, inputs=[modalities], outputs=[vision_tasks, nlp_tasks, audio_tasks])

	with gr.Row():
	generate_csv_btn = gr.Button("Generar Esquema CSV")
	csv_output = gr.Textbox(label="Esquema CSV Generado")

	with gr.Row():
	search_datasets_btn = gr.Button("Buscar Datasets Públicos")
	datasets_output = gr.Textbox(label="Datasets Disponibles", lines=5)

	with gr.Row():
	analyze_datasets_btn = gr.Button("Analizar Datasets Seleccionados")
	processed_output = gr.File(label="Dataset Procesado")

	# Conexiones de botones a funciones
	generate_csv_btn.click(
	generate_csv,
	inputs=[modalities, vision_tasks, nlp_tasks, audio_tasks],
	outputs=csv_output
	)
	search_datasets_btn.click(search_datasets, inputs=[modalities], outputs=datasets_output)
	analyze_datasets_btn.click(analyze_datasets, inputs=[datasets_output, csv_output], outputs=processed_output)

	# Lanzar la aplicación
	demo.launch()