SergioSCA commited on
Commit
7b8a562
·
verified ·
1 Parent(s): 309ed7a

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +58 -0
README.md CHANGED
@@ -9,4 +9,62 @@ app_file: app.py
9
  pinned: false
10
  ---
11
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
12
  Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
 
9
  pinned: false
10
  ---
11
 
12
+ # Multimodal Neural Network Designer & Dataset Generator
13
+
14
+ ![Hugging Face Spaces](https://img.shields.io/badge/Hugging%20Face-Spaces-blue)
15
+ ![License](https://img.shields.io/badge/license-MIT-green)
16
+
17
+ ---
18
+
19
+ ## Descripción
20
+ Este Space permite diseñar encabezados de datasets multimodales y generar CSVs combinando datasets públicos de HuggingFace.
21
+ Soporta tareas de NLP, Visión, Audio, RAG y más, con una interfaz en español y lógica automatizada.
22
+
23
+ ---
24
+
25
+ ## Características Principales
26
+ 1. **Selección de Tareas**:
27
+ - Elige entre tareas multimodales (ej. "Clasificación de texto", "Detección de objetos").
28
+ - Las opciones se actualizan automáticamente desde [HuggingFace Datasets](https://huggingface.co/datasets).
29
+
30
+ 2. **Generación Inteligente de Encabezados**:
31
+ - Crea encabezados de CSV basados en las tareas seleccionadas.
32
+ - Ejemplo: `id,text_input,text_output,label`.
33
+
34
+ 3. **Búsqueda de Datasets**:
35
+ - Encuentra datasets compatibles con tus tareas (ej. `imdb` para clasificación de texto).
36
+ - Filtra por licencia (MIT, Apache) y tamaño (small, medium, large).
37
+
38
+ 4. **Generación de CSV**:
39
+ - Combina datos de múltiples datasets en un solo CSV.
40
+ - Paginación para manejar grandes volúmenes de datos.
41
+
42
+ 5. **Actualización Automática**:
43
+ - Refresca `modalidades_tareas.json` con tareas y columnas reales de HuggingFace.
44
+
45
+ ---
46
+
47
+ ## Requisitos
48
+ - Python 3.8+
49
+ - Dependencias:
50
+ ```bash
51
+ pip install -r requirements.txt
52
+
53
+
54
+ ## Flujo de Trabajo Técnico
55
+ - modalidades_tareas.json :
56
+ Define tareas en inglés (ej. text-classification) y sus columnas asociadas.
57
+ Nombres en español se mapean automáticamente usando un diccionario interno.
58
+ - Búsqueda en HuggingFace :
59
+ Usa tags oficiales (ej. task:text-classification) para encontrar datasets.
60
+ - Mapeo de Columnas :
61
+ Si un dataset no tiene una columna requerida, se rellena con valor_default.
62
+
63
+
64
+ ## Problemas Conocidos
65
+ - JSON Corrupto : Si modalidades_tareas.json no existe, pulsa "Actualizar Modalidades desde HuggingFace".
66
+ - Datasets Incompatibles : Algunos datasets pueden no tener columnas esperadas (ej. image en lugar de imagen_path).
67
+ - API Key : No es necesaria para datasets públicos, pero podría requerirse para modelos premium.
68
+
69
+
70
  Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference