--- title: Multimodal Network Designer emoji: 🐠 colorFrom: red colorTo: yellow sdk: gradio sdk_version: 5.16.0 app_file: app.py pinned: false --- # Multimodal Neural Network Designer & Dataset Generator ![Hugging Face Spaces](https://img.shields.io/badge/Hugging%20Face-Spaces-blue) ![License](https://img.shields.io/badge/license-MIT-green) --- ## Descripción Este Space permite diseñar encabezados de datasets multimodales y generar CSVs combinando datasets públicos de HuggingFace. Soporta tareas de NLP, Visión, Audio, RAG y más, con una interfaz en español y lógica automatizada. --- ## Características Principales 1. **Selección de Tareas**: - Elige entre tareas multimodales (ej. "Clasificación de texto", "Detección de objetos"). - Las opciones se actualizan automáticamente desde [HuggingFace Datasets](https://huggingface.co/datasets). 2. **Generación Inteligente de Encabezados**: - Crea encabezados de CSV basados en las tareas seleccionadas. - Ejemplo: `id,text_input,text_output,label`. 3. **Búsqueda de Datasets**: - Encuentra datasets compatibles con tus tareas (ej. `imdb` para clasificación de texto). - Filtra por licencia (MIT, Apache) y tamaño (small, medium, large). 4. **Generación de CSV**: - Combina datos de múltiples datasets en un solo CSV. - Paginación para manejar grandes volúmenes de datos. 5. **Actualización Automática**: - Refresca `modalidades_tareas.json` con tareas y columnas reales de HuggingFace. --- ## Requisitos - Python 3.8+ - Dependencias: ```bash pip install -r requirements.txt ## Flujo de Trabajo Técnico - modalidades_tareas.json : Define tareas en inglés (ej. text-classification) y sus columnas asociadas. Nombres en español se mapean automáticamente usando un diccionario interno. - Búsqueda en HuggingFace : Usa tags oficiales (ej. task:text-classification) para encontrar datasets. - Mapeo de Columnas : Si un dataset no tiene una columna requerida, se rellena con valor_default. ## Problemas Conocidos - JSON Corrupto : Si modalidades_tareas.json no existe, pulsa "Actualizar Modalidades desde HuggingFace". - Datasets Incompatibles : Algunos datasets pueden no tener columnas esperadas (ej. image en lugar de imagen_path). - API Key : No es necesaria para datasets públicos, pero podría requerirse para modelos premium. Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference