Update README.md
Browse files
README.md
CHANGED
|
@@ -9,4 +9,62 @@ app_file: app.py
|
|
| 9 |
pinned: false
|
| 10 |
---
|
| 11 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 12 |
Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
|
|
|
|
| 9 |
pinned: false
|
| 10 |
---
|
| 11 |
|
| 12 |
+
# Multimodal Neural Network Designer & Dataset Generator
|
| 13 |
+
|
| 14 |
+

|
| 15 |
+

|
| 16 |
+
|
| 17 |
+
---
|
| 18 |
+
|
| 19 |
+
## Descripción
|
| 20 |
+
Este Space permite diseñar encabezados de datasets multimodales y generar CSVs combinando datasets públicos de HuggingFace.
|
| 21 |
+
Soporta tareas de NLP, Visión, Audio, RAG y más, con una interfaz en español y lógica automatizada.
|
| 22 |
+
|
| 23 |
+
---
|
| 24 |
+
|
| 25 |
+
## Características Principales
|
| 26 |
+
1. **Selección de Tareas**:
|
| 27 |
+
- Elige entre tareas multimodales (ej. "Clasificación de texto", "Detección de objetos").
|
| 28 |
+
- Las opciones se actualizan automáticamente desde [HuggingFace Datasets](https://huggingface.co/datasets).
|
| 29 |
+
|
| 30 |
+
2. **Generación Inteligente de Encabezados**:
|
| 31 |
+
- Crea encabezados de CSV basados en las tareas seleccionadas.
|
| 32 |
+
- Ejemplo: `id,text_input,text_output,label`.
|
| 33 |
+
|
| 34 |
+
3. **Búsqueda de Datasets**:
|
| 35 |
+
- Encuentra datasets compatibles con tus tareas (ej. `imdb` para clasificación de texto).
|
| 36 |
+
- Filtra por licencia (MIT, Apache) y tamaño (small, medium, large).
|
| 37 |
+
|
| 38 |
+
4. **Generación de CSV**:
|
| 39 |
+
- Combina datos de múltiples datasets en un solo CSV.
|
| 40 |
+
- Paginación para manejar grandes volúmenes de datos.
|
| 41 |
+
|
| 42 |
+
5. **Actualización Automática**:
|
| 43 |
+
- Refresca `modalidades_tareas.json` con tareas y columnas reales de HuggingFace.
|
| 44 |
+
|
| 45 |
+
---
|
| 46 |
+
|
| 47 |
+
## Requisitos
|
| 48 |
+
- Python 3.8+
|
| 49 |
+
- Dependencias:
|
| 50 |
+
```bash
|
| 51 |
+
pip install -r requirements.txt
|
| 52 |
+
|
| 53 |
+
|
| 54 |
+
## Flujo de Trabajo Técnico
|
| 55 |
+
- modalidades_tareas.json :
|
| 56 |
+
Define tareas en inglés (ej. text-classification) y sus columnas asociadas.
|
| 57 |
+
Nombres en español se mapean automáticamente usando un diccionario interno.
|
| 58 |
+
- Búsqueda en HuggingFace :
|
| 59 |
+
Usa tags oficiales (ej. task:text-classification) para encontrar datasets.
|
| 60 |
+
- Mapeo de Columnas :
|
| 61 |
+
Si un dataset no tiene una columna requerida, se rellena con valor_default.
|
| 62 |
+
|
| 63 |
+
|
| 64 |
+
## Problemas Conocidos
|
| 65 |
+
- JSON Corrupto : Si modalidades_tareas.json no existe, pulsa "Actualizar Modalidades desde HuggingFace".
|
| 66 |
+
- Datasets Incompatibles : Algunos datasets pueden no tener columnas esperadas (ej. image en lugar de imagen_path).
|
| 67 |
+
- API Key : No es necesaria para datasets públicos, pero podría requerirse para modelos premium.
|
| 68 |
+
|
| 69 |
+
|
| 70 |
Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
|