|
|
--- |
|
|
title: Multimodal Network Designer |
|
|
emoji: 🐠 |
|
|
colorFrom: red |
|
|
colorTo: yellow |
|
|
sdk: gradio |
|
|
sdk_version: 5.16.0 |
|
|
app_file: app.py |
|
|
pinned: false |
|
|
--- |
|
|
|
|
|
# Multimodal Neural Network Designer & Dataset Generator |
|
|
|
|
|
 |
|
|
 |
|
|
|
|
|
--- |
|
|
|
|
|
## Descripción |
|
|
Este Space permite diseñar encabezados de datasets multimodales y generar CSVs combinando datasets públicos de HuggingFace. |
|
|
Soporta tareas de NLP, Visión, Audio, RAG y más, con una interfaz en español y lógica automatizada. |
|
|
|
|
|
--- |
|
|
|
|
|
## Características Principales |
|
|
1. **Selección de Tareas**: |
|
|
- Elige entre tareas multimodales (ej. "Clasificación de texto", "Detección de objetos"). |
|
|
- Las opciones se actualizan automáticamente desde [HuggingFace Datasets](https://huggingface.co/datasets). |
|
|
|
|
|
2. **Generación Inteligente de Encabezados**: |
|
|
- Crea encabezados de CSV basados en las tareas seleccionadas. |
|
|
- Ejemplo: `id,text_input,text_output,label`. |
|
|
|
|
|
3. **Búsqueda de Datasets**: |
|
|
- Encuentra datasets compatibles con tus tareas (ej. `imdb` para clasificación de texto). |
|
|
- Filtra por licencia (MIT, Apache) y tamaño (small, medium, large). |
|
|
|
|
|
4. **Generación de CSV**: |
|
|
- Combina datos de múltiples datasets en un solo CSV. |
|
|
- Paginación para manejar grandes volúmenes de datos. |
|
|
|
|
|
5. **Actualización Automática**: |
|
|
- Refresca `modalidades_tareas.json` con tareas y columnas reales de HuggingFace. |
|
|
|
|
|
--- |
|
|
|
|
|
## Requisitos |
|
|
- Python 3.8+ |
|
|
- Dependencias: |
|
|
```bash |
|
|
pip install -r requirements.txt |
|
|
|
|
|
|
|
|
## Flujo de Trabajo Técnico |
|
|
- modalidades_tareas.json : |
|
|
Define tareas en inglés (ej. text-classification) y sus columnas asociadas. |
|
|
Nombres en español se mapean automáticamente usando un diccionario interno. |
|
|
- Búsqueda en HuggingFace : |
|
|
Usa tags oficiales (ej. task:text-classification) para encontrar datasets. |
|
|
- Mapeo de Columnas : |
|
|
Si un dataset no tiene una columna requerida, se rellena con valor_default. |
|
|
|
|
|
|
|
|
## Problemas Conocidos |
|
|
- JSON Corrupto : Si modalidades_tareas.json no existe, pulsa "Actualizar Modalidades desde HuggingFace". |
|
|
- Datasets Incompatibles : Algunos datasets pueden no tener columnas esperadas (ej. image en lugar de imagen_path). |
|
|
- API Key : No es necesaria para datasets públicos, pero podría requerirse para modelos premium. |
|
|
|
|
|
|
|
|
Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference |
|
|
|