SergioSCA commited on
Commit
65d0047
verified
1 Parent(s): 425d4e3

Update modalidades_tareas.json

Browse files
Files changed (1) hide show
  1. modalidades_tareas.json +20 -31
modalidades_tareas.json CHANGED
@@ -1,59 +1,48 @@
1
  {
2
  "NLP": {
3
  "tareas": {
4
- "Clasificaci贸n de texto": ["texto_input", "texto_output", "clasificaci贸n_de_texto_label"],
5
- "Generaci贸n de texto": ["prompt_input", "texto_generado"],
6
- "Traducci贸n": ["texto_original", "texto_traducido", "idioma_origen", "idioma_destino"],
7
- "Resumen": ["texto_completo", "resumen_generado"]
8
  },
9
- "columnas_generales": ["nlp_input", "nlp_output"]
10
  },
11
  "Audio": {
12
  "tareas": {
13
- "Reconocimiento de voz": ["audio_path", "texto_transcrito"],
14
- "Clasificaci贸n de audio": ["audio_path", "etiqueta_emocional"],
15
- "Separaci贸n de fuentes": ["audio_mezclado", "audio_voz", "audio_instrumental"],
16
- "Clasificaci贸n Estilo M煤sical": ["audio_path", "estilo_musical_label"],
17
- "MIDI": ["audio_midi", "notas_generadas"],
18
- "Segmentaci贸n de instrumentos": ["audio_path", "instrumentos_segmentados"],
19
- "Detecci贸n de Tempo y Comp谩s": ["audio_path", "tempo", "comp谩s"],
20
- "Clasificaci贸n de Estructura M煤sical": ["audio_path", "estructura_label"]
21
  },
22
  "columnas_generales": ["audio_input", "audio_output"]
23
  },
24
  "Vision": {
25
  "tareas": {
26
- "Clasificaci贸n de im谩genes": ["imagen_path", "clasificaci贸n_imagen_label"],
27
- "Detecci贸n de objetos": ["imagen_path", "coordenadas_objetos", "etiquetas_objetos"],
28
- "Segmentaci贸n": ["imagen_path", "m谩scara_segmentaci贸n"]
29
  },
30
- "columnas_generales": ["vision_input", "vision_output"]
31
  },
32
  "RAG": {
33
  "tareas": {
34
- "Respuesta a preguntas": ["pregunta_input", "respuesta_generada"],
35
- "Recuperaci贸n de informaci贸n": ["consulta_input", "documentos_recuperados"]
36
  },
37
- "columnas_generales": ["rag_input", "rag_output"]
38
  },
39
  "Code": {
40
  "tareas": {
41
- "Generaci贸n de c贸digo": ["descripcion_codigo", "codigo_generado"],
42
- "Completado de c贸digo": ["codigo_incompleto", "codigo_completado"]
43
  },
44
  "columnas_generales": ["code_input", "code_output"]
45
  },
46
  "Tabular": {
47
  "tareas": {
48
- "Clasificaci贸n tabular": ["datos_tabulares", "clasificaci贸n_label"],
49
- "Regresi贸n tabular": ["datos_tabulares", "valor_predicho"]
50
  },
51
- "columnas_generales": ["tabular_input", "tabular_output"]
52
- },
53
- "Time Series": {
54
- "tareas": {
55
- "Predicci贸n de series temporales": ["serie_temporal", "predicci贸n_futura"]
56
- },
57
- "columnas_generales": ["timeseries_input", "timeseries_output"]
58
  }
59
  }
 
1
  {
2
  "NLP": {
3
  "tareas": {
4
+ "text-classification": ["text", "label"], # Dataset: imdb, rotten_tomatoes
5
+ "token-classification": ["tokens", "ner_tags"], # Dataset: conll2003
6
+ "translation": ["source_lang", "target_lang", "source", "target"], # Dataset: wmt14
7
+ "summarization": ["document", "summary"] # Dataset: cnn_dailymail
8
  },
9
+ "columnas_generales": ["text_input", "text_output"]
10
  },
11
  "Audio": {
12
  "tareas": {
13
+ "speech-recognition": ["audio", "text"], # Dataset: librispeech
14
+ "audio-classification": ["audio", "label"], # Dataset: emotion-speech-corpus
15
+ "music-classification": ["audio", "genre"] # Dataset: gtzan
 
 
 
 
 
16
  },
17
  "columnas_generales": ["audio_input", "audio_output"]
18
  },
19
  "Vision": {
20
  "tareas": {
21
+ "image-classification": ["image", "label"], # Dataset: imagenet
22
+ "object-detection": ["image", "objects"], # Dataset: coco
23
+ "image-segmentation": ["image", "segmentation_map"] # Dataset: oxford-iiit-pet
24
  },
25
+ "columnas_generales": ["image_input", "image_output"]
26
  },
27
  "RAG": {
28
  "tareas": {
29
+ "question-answering": ["question", "answer"], # Dataset: squad
30
+ "information-retrieval": ["query", "document"] # Dataset: msmarco
31
  },
32
+ "columnas_generales": ["query_input", "answer_output"]
33
  },
34
  "Code": {
35
  "tareas": {
36
+ "code-generation": ["prompt", "code"], # Dataset: codeparrot
37
+ "code-summarization": ["code", "summary"] # Dataset: code_x_glue
38
  },
39
  "columnas_generales": ["code_input", "code_output"]
40
  },
41
  "Tabular": {
42
  "tareas": {
43
+ "tabular-classification": ["features", "label"], # Dataset: titanic
44
+ "tabular-regression": ["features", "target"] # Dataset: california_housing
45
  },
46
+ "columnas_generales": ["data_input", "prediction_output"]
 
 
 
 
 
 
47
  }
48
  }