Spaces:

SergioSCA
/

Multimodal_Network_Designer

Running

App Files Files Community

SergioSCA commited on Mar 2, 2025

Commit

9d4bb80

verified ·

1 Parent(s): 9c39bba

Update functions.py

Browse files

Files changed (1) hide show

functions.py +20 -134

functions.py CHANGED Viewed

@@ -1,5 +1,7 @@
 # functions.py
 import json
 from datasets import load_dataset
 # Cargar modalidades y tareas
@@ -7,35 +9,24 @@ def cargar_modalidades_tareas():
     with open("modalidades_tareas.json", "r") as file:
         MODALIDAD_TAREAS = json.load(file)
     return MODALIDAD_TAREAS
-# Validar modalidades y tareas
-def validar_modalidades_tareas(modalidades_tareas):
-    try:
-        for modalidad, tareas in modalidades_tareas.items():
-            if not isinstance(modalidad, str) or not isinstance(tareas, list):
-                raise ValueError(f"Formato incorrecto para la modalidad: {modalidad}")
-            for tarea in tareas:
-                if not isinstance(tarea, str):
-                    raise ValueError(f"Formato incorrecto para la tarea: {tarea} en la modalidad {modalidad}")
-    except AttributeError:
-        raise ValueError("El objeto proporcionado no es un diccionario válido.")
 # Generar gráfica de barras
 def generar_grafica_barras(tareas_seleccionadas, MODALIDAD_TAREAS):
     try:
-        conteo_modalidades = {}
-        for modalidad, tareas in MODALIDAD_TAREAS.items():
-            conteo_modalidades[modalidad] = len([t for t in tareas if t in tareas_seleccionadas])
         fig, ax = plt.subplots(figsize=(10, 6))
-        ax.barh(list(conteo_modalidades.keys()), list(conteo_modalidades.values()), color='skyblue')
         ax.set_xlabel('Cantidad de Tareas Seleccionadas')
         ax.set_ylabel('Modalidades')
         ax.set_title('Distribución de Tareas por Modalidad')
         ax.invert_yaxis()
         return fig
     except Exception as e:
-        raise ValueError(f"Error al generar la gráfica: {str(e)}")
 # Buscar datasets en HuggingFace
 def buscar_datasets(tareas_seleccionadas, filtro_tamaño, filtro_licencia):
@@ -55,36 +46,9 @@ def buscar_datasets(tareas_seleccionadas, filtro_tamaño, filtro_licencia):
             resultados.append(f"- {dataset['id']}: {dataset['description']}")
         return "\n".join(resultados)
     except requests.exceptions.RequestException as e:
-        raise ValueError(f"Error al buscar datasets: {str(e)}")  # Eliminado el HTML <button class="citation-flag" data-index="8">
-# Función para generar el dataset
-def generar_dataset(encabezado, datasets_seleccionados, pagina_actual=1, filas_por_pagina=5):
-    try:
-        if not datasets_seleccionados:
-            raise ValueError("Debes seleccionar al menos un dataset.")
-        columnas = encabezado.split(",")
-        filas = []
-        # Cargar datos reales desde los datasets seleccionados
-        for dataset_id in datasets_seleccionados.split("\n"):
-            dataset_id = dataset_id.strip("- ").split(":")[0]  # Extraer ID del dataset
-            try:
-                dataset = load_dataset(dataset_id, split="train")
-                inicio = (pagina_actual - 1) * filas_por_pagina
-                fin = pagina_actual * filas_por_pagina
-                for i, fila in enumerate(dataset[inicio:fin]):
-                    valores = [str(fila.get(col, "valor_default")) for col in columnas[1:]]  # Ignorar 'id'
-                    filas.append(f"id_{inicio + i}," + ",".join(valores))
-            except Exception as e:
-                filas.append(f"Error cargando dataset {dataset_id}: {str(e)}")
-        contenido_csv = "\n".join([encabezado] + filas)
-        return contenido_csv
-    except Exception as e:
-        raise ValueError(f"Error al generar el dataset: {str(e)}")
-# Función para generar el encabezado
 def generar_encabezado(tareas_seleccionadas):
     MODALIDAD_TAREAS = cargar_modalidades_tareas()
@@ -98,102 +62,24 @@ def generar_encabezado(tareas_seleccionadas):
         for modalidad, datos in MODALIDAD_TAREAS.items():
             if tarea in datos["tareas"]:
                 # Añadir columnas generales de la modalidad
-                columnas_generales = datos.get("columnas_generales", [])
-                for col in columnas_generales:
                     if col not in columnas_modulos:
                         columnas.append(col)
                         columnas_modulos.add(col)
                 # Añadir columnas específicas de la tarea
-                columnas_tarea = datos["tareas"][tarea]
-                for col in columnas_tarea:
                     if col not in columnas_modulos:
                         columnas.append(col)
                         columnas_modulos.add(col)
-    # Optimizar orden (inputs primero, outputs después, labels al final)
-    columnas_ordenadas = sorted(
-        columnas,
         key=lambda x: (
-            "input" in x,  # Priorizar columnas de entrada
-            "output" in x,  # Luego columnas de salida
-            "label" in x   # Finalizar con labels
-        ),
-        reverse=True
     )
-    return ",".join(columnas_ordenadas)
-def generar_encabezado_inteligente(tareas_seleccionadas, api_key):
-    max_reintentos = 3
-    espera_entre_reintentos = 2
-    # Prompt mejorado con instrucciones estrictas <button class="citation-flag" data-index="3">
-    prompt = f"""
-    Genera SOLO el encabezado CSV para las tareas: {', '.join(tareas_seleccionadas)}.
-    Formato: id,tarea1_label,tarea2_label,...
-    Ejemplo para 'Clasificación de texto' y 'Segmentación':
-    id,clasificación_de_texto_label,segmentación_label
-    """
-    # Usar modelo especializado en generación de texto estructurado <button class="citation-flag" data-index="2">
-    API_URL = "https://api-inference.huggingface.co/models/stabilityai/stable-code-3b"
-    headers = {
-        "Authorization": f"Bearer {api_key}",
-        "Content-Type": "application/json"
-    }
-    for intento in range(max_reintentos + 1):
-        try:
-            if not tareas_seleccionadas:
-                raise ValueError("Debes seleccionar al menos una tarea.")
-            if not api_key:
-                raise ValueError("API Key no proporcionada. Ingresa una clave válida.")
-            # Enviar solicitud con parámetros ajustados <button class="citation-flag" data-index="2">
-            response = requests.post(
-                API_URL,
-                headers=headers,
-                json={
-                    "inputs": prompt,
-                    "parameters": {
-                        "max_length": 64,
-                        "temperature": 0.1,
-                        "stop": ["\n\n"]  # Detener la generación al finalizar el encabezado <button class="citation-flag" data-index="3">
-                    }
-                }
-            )
-            response.raise_for_status()
-            # Procesar respuesta
-            if response.status_code == 200:
-                encabezado = response.json()[0]["generated_text"].strip()
-                # Validar formato estricto
-                if not encabezado.startswith("id,"):
-                    raise ValueError("Formato inválido. Respuesta: " + encabezado)
-                return encabezado
-        except requests.exceptions.HTTPError as e:
-            if e.response.status_code == 503 and intento < max_reintentos:
-                time.sleep(espera_entre_reintentos)
-                continue
-            elif e.response.status_code == 401:
-                raise ValueError("API Key inválida o sin permisos.")
-            else:
-                raise ValueError(f"Error HTTP: {str(e)}")
-        except Exception as e:
-            raise ValueError(f"Error inesperado: {str(e)}")
-    # Fallback local si fallan todos los reintentos
-    return generar_encabezado_local(tareas_seleccionadas)
-# Fallback local en caso de fallo de la API
-def generar_encabezado_local(tareas_seleccionadas):
-    columnas = ["id"]
-    for tarea in tareas_seleccionadas:
-        columnas.append(f"{tarea.lower().replace(' ', '_')}_label")
-    return ",".join(columnas)

 # functions.py
 import json
+import requests  # Añadido <button class="citation-flag" data-index="1">
+import matplotlib.pyplot as plt  # Añadido <button class="citation-flag" data-index="1">
 from datasets import load_dataset
 # Cargar modalidades y tareas
     with open("modalidades_tareas.json", "r") as file:
         MODALIDAD_TAREAS = json.load(file)
     return MODALIDAD_TAREAS
 # Generar gráfica de barras
 def generar_grafica_barras(tareas_seleccionadas, MODALIDAD_TAREAS):
     try:
+        conteo = {}
+        for modalidad, datos in MODALIDAD_TAREAS.items():
+            tareas_modalidad = datos["tareas"].keys()
+            conteo[modalidad] = len([t for t in tareas_seleccionadas if t in tareas_modalidad])
         fig, ax = plt.subplots(figsize=(10, 6))
+        ax.barh(list(conteo.keys()), list(conteo.values()), color='skyblue')
         ax.set_xlabel('Cantidad de Tareas Seleccionadas')
         ax.set_ylabel('Modalidades')
         ax.set_title('Distribución de Tareas por Modalidad')
         ax.invert_yaxis()
         return fig
     except Exception as e:
+        raise ValueError(f"Error al generar gráfica: {str(e)}")
 # Buscar datasets en HuggingFace
 def buscar_datasets(tareas_seleccionadas, filtro_tamaño, filtro_licencia):
             resultados.append(f"- {dataset['id']}: {dataset['description']}")
         return "\n".join(resultados)
     except requests.exceptions.RequestException as e:
+        raise ValueError(f"Error al buscar datasets: {str(e)}")
+# Generar encabezado
 def generar_encabezado(tareas_seleccionadas):
     MODALIDAD_TAREAS = cargar_modalidades_tareas()
         for modalidad, datos in MODALIDAD_TAREAS.items():
             if tarea in datos["tareas"]:
                 # Añadir columnas generales de la modalidad
+                for col in datos["columnas_generales"]:
                     if col not in columnas_modulos:
                         columnas.append(col)
                         columnas_modulos.add(col)
                 # Añadir columnas específicas de la tarea
+                for col in datos["tareas"][tarea]:
                     if col not in columnas_modulos:
                         columnas.append(col)
                         columnas_modulos.add(col)
+    # Ordenar columnas: inputs → outputs → labels
+    columnas_ordenadas = ["id"] + sorted(
+        columnas[1:],
         key=lambda x: (
+            "input" in x,
+            "output" in x,
+            "label" in x
+        )
     )
+    return ",".join(columnas_ordenadas)