LiveBench

Runtime error

App Files Files Community

pufanyi commited on Jul 14, 2024

Commit

83431d1

1 Parent(s): 35850bf

Refactor init_leaderboard function to handle multiple subsets, improve column selection and hiding, and include Dataset Version in filter_columns

Browse files

Files changed (2) hide show

app.py +22 -28
src/display/utils.py +1 -3

app.py CHANGED Viewed

@@ -3,6 +3,7 @@ from gradio_leaderboard import Leaderboard, ColumnFilter, SelectColumns
 import pandas as pd
 from apscheduler.schedulers.background import BackgroundScheduler
 from huggingface_hub import snapshot_download
 # from fastchat.serve.monitor.monitor import build_leaderboard_tab, build_basic_stats_tab, basic_component_values, leader_component_values
 from src.about import (
@@ -70,15 +71,18 @@ LEADERBOARD_DF = get_leaderboard_df(RESULTS_REPO)
 def init_leaderboard(dataframes):
     subsets = list(dataframes.keys())
     with gr.Row():
         selected_subset = gr.Dropdown(choices=subsets, label="Select Dataset Subset", value=subsets[-1])
         research_textbox = gr.Textbox(placeholder="🔍 Search Models... [press enter]", label="Filter Models by Name")
-        selected_columns = gr.CheckboxGroup(choices=[c.name for c in fields(AutoEvalColumn) if not c.hidden], label="Select Columns to Display", value=[c.name for c in fields(AutoEvalColumn) if c.displayed_by_default])
     data = dataframes[subsets[-1]]
     with gr.Row():
         datatype = [c.type for c in fields(AutoEvalColumn)]
         df = gr.Dataframe(data, datatype=datatype, type="pandas")
@@ -90,34 +94,23 @@ def init_leaderboard(dataframes):
         selected_subset.choices = subsets
         update_data(subset, research_textbox, selected_columns)
     def update_data(subset, search_term, selected_columns):
         return dataframes[subset][dataframes[subset].model.str.contains(search_term, case=False)][selected_columns]
     with gr.Row():
         refresh_button = gr.Button("Refresh")
-        refresh_button.click(refresh, inputs=[
-            selected_subset,
-        ], outputs=data, concurrency_limit=20)
-    selected_subset.change(update_data, inputs=[
-        selected_subset, research_textbox, selected_columns
-        ], outputs=data)
-    research_textbox.submit(
-        update_data,
-        inputs=[selected_subset, research_textbox, selected_columns],
-        outputs=data
-    )
-    selected_columns.change(
-        update_data,
-        inputs=[selected_subset, research_textbox, selected_columns],
-        outputs=data
-    )
     # return Leaderboard(
     #     value=dataframes,
@@ -139,7 +132,8 @@ def init_leaderboard(dataframes):
     #     ],
     #     interactive=False,
     # )
 demo = gr.Blocks(css=custom_css)
 with demo:
     gr.HTML(TITLE)

 import pandas as pd
 from apscheduler.schedulers.background import BackgroundScheduler
 from huggingface_hub import snapshot_download
 # from fastchat.serve.monitor.monitor import build_leaderboard_tab, build_basic_stats_tab, basic_component_values, leader_component_values
 from src.about import (
 def init_leaderboard(dataframes):
     subsets = list(dataframes.keys())
     with gr.Row():
         selected_subset = gr.Dropdown(choices=subsets, label="Select Dataset Subset", value=subsets[-1])
         research_textbox = gr.Textbox(placeholder="🔍 Search Models... [press enter]", label="Filter Models by Name")
+        selected_columns = gr.CheckboxGroup(
+            choices=[c.name for c in fields(AutoEvalColumn) if not c.hidden],
+            label="Select Columns to Display",
+            value=[c.name for c in fields(AutoEvalColumn) if c.displayed_by_default],
+        )
     data = dataframes[subsets[-1]]
     with gr.Row():
         datatype = [c.type for c in fields(AutoEvalColumn)]
         df = gr.Dataframe(data, datatype=datatype, type="pandas")
         selected_subset.choices = subsets
         update_data(subset, research_textbox, selected_columns)
     def update_data(subset, search_term, selected_columns):
         return dataframes[subset][dataframes[subset].model.str.contains(search_term, case=False)][selected_columns]
     with gr.Row():
         refresh_button = gr.Button("Refresh")
+        refresh_button.click(
+            refresh,
+            inputs=[
+                selected_subset,
+            ],
+            outputs=data,
+            concurrency_limit=20,
+        )
+    selected_subset.change(update_data, inputs=[selected_subset, research_textbox, selected_columns], outputs=data)
+    research_textbox.submit(update_data, inputs=[selected_subset, research_textbox, selected_columns], outputs=data)
+    selected_columns.change(update_data, inputs=[selected_subset, research_textbox, selected_columns], outputs=data)
     # return Leaderboard(
     #     value=dataframes,
     #     ],
     #     interactive=False,
     # )
 demo = gr.Blocks(css=custom_css)
 with demo:
     gr.HTML(TITLE)

src/display/utils.py CHANGED Viewed

@@ -26,9 +26,7 @@ class ColumnContent:
 auto_eval_column_dict = []
 # Init
 # auto_eval_column_dict.append(["model_type_symbol", ColumnContent, ColumnContent("T", "str", True, never_hidden=True)])
-auto_eval_column_dict.append(
-    ["model", ColumnContent, ColumnContent("Model Name", "str", True, never_hidden=True)]
-)
 # Scores
 auto_eval_column_dict.append(["Overall", ColumnContent, ColumnContent("Total", "number", True)])
 for task in Tasks:

 auto_eval_column_dict = []
 # Init
 # auto_eval_column_dict.append(["model_type_symbol", ColumnContent, ColumnContent("T", "str", True, never_hidden=True)])
+auto_eval_column_dict.append(["model", ColumnContent, ColumnContent("Model Name", "str", True, never_hidden=True)])
 # Scores
 auto_eval_column_dict.append(["Overall", ColumnContent, ColumnContent("Total", "number", True)])
 for task in Tasks: