Spaces:

lmms-lab-si
/

EASI-Leaderboard

Running

App Files Files Community

yangzhitao commited on 22 days ago

Commit

7b47b0b

1 Parent(s): 6b6ce23

refactor: replace truncate function with DataFrame styling for number formatting in app.py and populate.py

Browse files

Files changed (3) hide show

app.py +17 -18
src/leaderboard/read_evals.py +4 -3
src/populate.py +0 -14

app.py CHANGED Viewed

@@ -65,26 +65,25 @@ print("///// --- Settings --- /////", settings.model_dump())
 ) = get_evaluation_queue_df(settings.EVAL_REQUESTS_PATH, EVAL_COLS)
-def truncate_to_one_decimal(value):
     """
-    将数字截断到1位小数（不四舍五入）
-    """
-    if pd.isna(value) or not isinstance(value, (int, float)):
-        return value
-    return float(int(value * 10)) / 10
-def format_dataframe_numbers(df: pd.DataFrame) -> pd.DataFrame:
-    """
-    格式化 DataFrame 中的数字列，只保留1位小数并截断
     """
     df = df.copy()
     for col in df.columns:
         if col in ['Model', 'T']:  # 跳过非数字列
             continue
         # 检查是否为数值类型
         if pd.api.types.is_numeric_dtype(df[col]):
-            df[col] = df[col].apply(truncate_to_one_decimal)
     return df
@@ -202,8 +201,8 @@ def init_leaderboard_tabs(
     precision_filtered_df = filter_dataframe_by_precision(default_precision, original_df)
     # 根据默认选择再筛选一次 DataFrame
     initial_filtered_df = filter_dataframe_by_columns(default_selected, precision_filtered_df)
-    # 格式化数字列，只保留1位小数并截断
-    initial_filtered_df = format_dataframe_numbers(initial_filtered_df)
     with gr.Row():
         with gr.Column(scale=1):
@@ -241,7 +240,7 @@ def init_leaderboard_tabs(
     with gr.Row():
         with gr.Column(scale=3):
             leaderboard = gr.Dataframe(
-                value=initial_filtered_df,  # 使用初始筛选后的 DataFrame
                 interactive=False,
                 wrap=False,
                 datatype='markdown',
@@ -256,9 +255,9 @@ def init_leaderboard_tabs(
         column_filtered_df = filter_dataframe_by_columns(selected_cols, precision_filtered_df)
         # 最后按搜索关键词筛选
         final_df = search_models_in_dataframe(search_text, column_filtered_df)
-        # 格式化数字列，只保留1位小数并截断
-        final_df = format_dataframe_numbers(final_df)
-        return final_df
     # 绑定搜索、列选择和 precision 的变化事件，动态更新 DataFrame
     search.change(

 ) = get_evaluation_queue_df(settings.EVAL_REQUESTS_PATH, EVAL_COLS)
+def format_dataframe_with_styler(df: pd.DataFrame):
     """
+    使用 pandas Styler 格式化 DataFrame 中的数字列，保留1位小数
+    返回 Styler 对象，可以直接传递给 Gradio Dataframe
     """
+    # 先截断数据（如果需要截断而不是四舍五入）
     df = df.copy()
+    numeric_cols = {}
     for col in df.columns:
         if col in ['Model', 'T']:  # 跳过非数字列
             continue
         # 检查是否为数值类型
         if pd.api.types.is_numeric_dtype(df[col]):
+            # 记录需要格式化的列: 保留1位小数
+            numeric_cols[col] = "{:.1f}"
+    # 使用 Styler 格式化显示
+    if numeric_cols:
+        return df.style.format(numeric_cols)
     return df
     precision_filtered_df = filter_dataframe_by_precision(default_precision, original_df)
     # 根据默认选择再筛选一次 DataFrame
     initial_filtered_df = filter_dataframe_by_columns(default_selected, precision_filtered_df)
+    # 使用 Styler 格式化数字列，保留1位小数
+    initial_styler = format_dataframe_with_styler(initial_filtered_df)
     with gr.Row():
         with gr.Column(scale=1):
     with gr.Row():
         with gr.Column(scale=3):
             leaderboard = gr.Dataframe(
+                value=initial_styler,  # 使用 Styler 对象格式化显示
                 interactive=False,
                 wrap=False,
                 datatype='markdown',
         column_filtered_df = filter_dataframe_by_columns(selected_cols, precision_filtered_df)
         # 最后按搜索关键词筛选
         final_df = search_models_in_dataframe(search_text, column_filtered_df)
+        # 使用 Styler 格式化数字列，保留1位小数
+        final_styler = format_dataframe_with_styler(final_df)
+        return final_styler
     # 绑定搜索、列选择和 precision 的变化事件，动态更新 DataFrame
     search.change(

src/leaderboard/read_evals.py CHANGED Viewed

@@ -73,9 +73,11 @@ class EvalResult(BaseModel):
         # Precision
         precision = Precision.from_str(config.model_dtype)
-        # Get model and org
-        org_and_model = config.model_name or config.model_args or ""
         org_and_model = org_and_model.split("/", 1)
         if len(org_and_model) == 1:
@@ -88,7 +90,6 @@ class EvalResult(BaseModel):
             result_key = f"{org}_{model}_{precision.value.name}"
         full_model = "/".join(org_and_model)
-        meta_toml = load_meta_toml()
         # update full_model from meta_toml if it exists
         if "/" not in full_model:
             full_model = meta_toml.model_title_to_repo_id.get(full_model, full_model)

         # Precision
         precision = Precision.from_str(config.model_dtype)
+        meta_toml = load_meta_toml()
+        # Get model and org
+        model_key = config.model_name or config.model_args or ""
+        org_and_model = meta_toml.model_key_to_repo_id.get(model_key, model_key)
         org_and_model = org_and_model.split("/", 1)
         if len(org_and_model) == 1:
             result_key = f"{org}_{model}_{precision.value.name}"
         full_model = "/".join(org_and_model)
         # update full_model from meta_toml if it exists
         if "/" not in full_model:
             full_model = meta_toml.model_title_to_repo_id.get(full_model, full_model)

src/populate.py CHANGED Viewed

@@ -23,15 +23,6 @@ from src.display.utils import AutoEvalColumn, EvalQueueColumn
 from src.leaderboard.read_evals import get_raw_eval_results
-def truncate_to_one_decimal(value):
-    """
-    将数字截断到1位小数（不四舍五入）
-    """
-    if pd.isna(value) or not isinstance(value, (int, float)):
-        return value
-    return float(int(value * 10)) / 10
 def get_leaderboard_df(
     results_path: str,
     requests_path: str,
@@ -68,11 +59,6 @@ def get_leaderboard_df(
     df = df.sort_values(by=[AutoEvalColumn.average.name], ascending=False)
     df = df.loc[:, cols]
-    # 截断数字列到1位小数（不四舍五入）
-    for col in df.columns:
-        if col not in ['Model', 'T'] and pd.api.types.is_numeric_dtype(df[col]):
-            df[col] = df[col].apply(truncate_to_one_decimal)
     # filter out if any of the benchmarks have not been produced
     df = df.loc[has_no_nan_values(df, benchmark_cols), :]
     return df

 from src.leaderboard.read_evals import get_raw_eval_results
 def get_leaderboard_df(
     results_path: str,
     requests_path: str,
     df = df.sort_values(by=[AutoEvalColumn.average.name], ascending=False)
     df = df.loc[:, cols]
     # filter out if any of the benchmarks have not been produced
     df = df.loc[has_no_nan_values(df, benchmark_cols), :]
     return df