Spaces:

minoruskore
/

evaluador

Sleeping

App Files Files Community

yoel commited on Nov 19, 2025

Commit

a2dd494

1 Parent(s): 302b2b5

Refactor: mejora la interfaz de evaluación agregando campos para nombre y matrícula, y actualiza la gestión del leaderboard

Browse files

Files changed (4) hide show

.gitignore +1 -1
app.py +24 -4
evaluation.py +81 -10
utils.py +51 -0

.gitignore CHANGED Viewed

@@ -25,7 +25,7 @@ share/python-wheels/
 .installed.cfg
 *.egg
 MANIFEST
 # PyInstaller
 #  Usually these files are written by a python script from a template
 #  before PyInstaller builds the exe, so as to inject date/other infos into it.

 .installed.cfg
 *.egg
 MANIFEST
+leaderboard.json
 # PyInstaller
 #  Usually these files are written by a python script from a template
 #  before PyInstaller builds the exe, so as to inject date/other infos into it.

app.py CHANGED Viewed

@@ -10,19 +10,39 @@ etiquetas, num_clases, codigo = cargar_etiquetas()
 test_dataloader = cargar_dataset(codigo)
-def interface_wrapper(model_file):
-    return evaluate_interface(model_file, num_clases, test_dataloader)
 # Interfaz de Gradio
 demo = gr.Interface(
     fn=interface_wrapper,
     inputs=[
         gr.File(label="Archivo del modelo (.safetensor)"),
     ],
-    outputs=gr.Textbox(label="Resultado", lines=1),
     title="Evaluador de modelos",
-    description="Carga un archivo .safetensor y evalúa su precisión en el conjunto de datos de evaluación.",
 )
 if __name__ == "__main__":

 test_dataloader = cargar_dataset(codigo)
+def interface_wrapper(nombre, matricula, model_file):
+    return evaluate_interface(nombre, matricula, model_file, num_clases, test_dataloader)
 # Interfaz de Gradio
 demo = gr.Interface(
     fn=interface_wrapper,
     inputs=[
+        gr.Textbox(label="Nombre completo"),
+        gr.Textbox(label="Matrícula"),
         gr.File(label="Archivo del modelo (.safetensor)"),
     ],
+    outputs=[
+        gr.Textbox(label="Precisión"),
+        gr.Textbox(label="SHA256 del modelo"),
+        gr.Textbox(label="Calificación"),
+        gr.Dataframe(
+            headers=[
+                "Nombre",
+                "Matrícula",
+                "Accuracy",
+                "Puntaje",
+                "SHA256",
+                "Duplicado",
+                "Fecha (UTC)",
+            ],
+            datatype=["str", "str", "str", "number", "str", "str", "str"],
+            row_count=(0, "dynamic"),
+            label="Leaderboard",
+        ),
+    ],
     title="Evaluador de modelos",
+    description="Ingresa tus datos, carga un .safetensor y revisa tu lugar en el leaderboard.",
 )
 if __name__ == "__main__":

evaluation.py CHANGED Viewed

@@ -1,7 +1,14 @@
 import torch
 from safetensors.torch import load_model
 from models import FromZero
-from utils import multiclass_accuracy
 def cargar_evaluar_modelo(archivo, num_clases, test_dataloader):
@@ -27,20 +34,84 @@ def cargar_evaluar_modelo(archivo, num_clases, test_dataloader):
         return f"Error: {str(e)}"
-def evaluate_interface(model_file, num_clases, test_dataloader):
     if model_file is None:
-        return "Por favor, carga un archivo .safetensor"
-    # Verificamos que el archivo sea .safetensor
     if not model_file.name.endswith(".safetensor") and not model_file.name.endswith(
         ".safetensors"
     ):
-        return "Por favor, carga un archivo con extensión .safetensor o .safetensors"
-    # Evaluamos el modelo
     accuracy = cargar_evaluar_modelo(model_file.name, num_clases, test_dataloader)
-    if isinstance(accuracy, float):
-        return f"Precisión del modelo: {accuracy*100:.2f}%"
-    else:
-        return accuracy

 import torch
+from datetime import datetime, timezone
 from safetensors.torch import load_model
 from models import FromZero
+from utils import (
+    multiclass_accuracy,
+    calcular_puntaje,
+    cargar_leaderboard,
+    guardar_registro_leaderboard,
+    obtener_sha256,
+)
 def cargar_evaluar_modelo(archivo, num_clases, test_dataloader):
         return f"Error: {str(e)}"
+def _formatear_leaderboard(registros):
+    if not registros:
+        return []
+    ordenados = sorted(
+        registros,
+        key=lambda r: (r["puntaje"], r["accuracy"]),
+        reverse=True,
+    )
+    tabla = []
+    for entry in ordenados:
+        sha_marcado = entry["sha256"] + (" *" if entry.get("duplicado") else "")
+        duplicado = "Sí" if entry.get("duplicado") else "No"
+        tabla.append(
+            [
+                entry["nombre"],
+                entry["matricula"],
+                f"{entry['accuracy_pct']:.2f}%",
+                entry["puntaje"],
+                sha_marcado,
+                duplicado,
+                entry["timestamp"],
+            ]
+        )
+    return tabla
+def evaluate_interface(nombre, matricula, model_file, num_clases, test_dataloader):
+    nombre = (nombre or "").strip()
+    matricula = (matricula or "").strip()
+    tabla_lideres = _formatear_leaderboard(cargar_leaderboard())
+    if not nombre or not matricula:
+        return (
+            "Por favor, ingresa nombre y matrícula.",
+            "",
+            "",
+            tabla_lideres,
+        )
     if model_file is None:
+        return ("Por favor, carga un archivo .safetensor", "", "", tabla_lideres)
     if not model_file.name.endswith(".safetensor") and not model_file.name.endswith(
         ".safetensors"
     ):
+        return (
+            "Por favor, carga un archivo con extensión .safetensor o .safetensors",
+            "",
+            "",
+            tabla_lideres,
+        )
+    sha256 = obtener_sha256(model_file.name)
     accuracy = cargar_evaluar_modelo(model_file.name, num_clases, test_dataloader)
+    if isinstance(accuracy, str):
+        return (accuracy, "", "", tabla_lideres)
+    puntaje = calcular_puntaje(accuracy)
+    accuracy_pct = accuracy * 100
+    registro = {
+        "nombre": nombre,
+        "matricula": matricula,
+        "accuracy": accuracy,
+        "accuracy_pct": accuracy_pct,
+        "puntaje": puntaje,
+        "sha256": sha256,
+        "timestamp": datetime.now(timezone.utc).isoformat(),
+    }
+    registros = guardar_registro_leaderboard(registro)
+    tabla_final = _formatear_leaderboard(registros)
+    sha_marcado = sha256 + (
+        " *" if any(r["sha256"] == sha256 and r.get("duplicado") for r in registros) else ""
+    )
+    return (
+        f"Precisión del modelo: {accuracy_pct:.2f}%",
+        f"SHA256: {sha_marcado}",
+        f"Puntaje asignado: {puntaje} pts",
+        tabla_final,
+    )

utils.py CHANGED Viewed

@@ -1,4 +1,10 @@
 import torch
 def cargar_etiquetas():
@@ -21,3 +27,48 @@ def multiclass_accuracy(predictions, labels):
     accuracy = correct_predictions / labels.size(0)
     return accuracy

 import torch
+import json
+import hashlib
+from collections import Counter
+from pathlib import Path
+LEADERBOARD_PATH = Path("leaderboard.json")
 def cargar_etiquetas():
     accuracy = correct_predictions / labels.size(0)
     return accuracy
+def obtener_sha256(ruta_archivo):
+    sha256 = hashlib.sha256()
+    with open(ruta_archivo, "rb") as archivo:
+        for bloque in iter(lambda: archivo.read(8192), b""):
+            sha256.update(bloque)
+    return sha256.hexdigest()
+def calcular_puntaje(accuracy):
+    accuracy_pct = accuracy * 100
+    base = max(0, min(accuracy_pct - 55, 20))
+    extra = 10 if accuracy_pct > 95 else 0
+    return int(base + extra)
+def cargar_leaderboard():
+    if not LEADERBOARD_PATH.exists():
+        return []
+    with LEADERBOARD_PATH.open("r", encoding="utf-8") as f:
+        return json.load(f)
+def _marcar_duplicados(registros):
+    conteo = Counter(entry["sha256"] for entry in registros)
+    for entry in registros:
+        entry["duplicado"] = conteo[entry["sha256"]] > 1
+    return registros
+def guardar_registro_leaderboard(entry, max_entries=500):
+    registros = cargar_leaderboard()
+    registros.append(entry)
+    registros = registros[-max_entries:]
+    registros = _marcar_duplicados(registros)
+    LEADERBOARD_PATH.write_text(
+        json.dumps(registros, indent=2, ensure_ascii=False),
+        encoding="utf-8",
+    )
+    return registros
+def limpiar_leaderboard():
+    LEADERBOARD_PATH.write_text("[]", encoding="utf-8")