InstruSumEval

Runtime error

App Files Files Community

henryL7 commited on May 13, 2024

Commit

9cfe6cd

1 Parent(s): 8178593

clean layout

Browse files

Files changed (3) hide show

.gitignore +1 -0
app.py +103 -87
src/envs.py +1 -1

.gitignore CHANGED Viewed

@@ -11,3 +11,4 @@ eval-results/
 eval-queue-bk/
 eval-results-bk/
 logs/

 eval-queue-bk/
 eval-results-bk/
 logs/
+envs/

app.py CHANGED Viewed

@@ -140,104 +140,120 @@ with demo:
     with gr.Tabs(elem_classes="tab-buttons") as tabs:
         with gr.TabItem("🏅 LLM Benchmark", elem_id="llm-benchmark-tab-table", id=0):
             with gr.Row():
-                with gr.Column():
-                    with gr.Row():
-                        search_bar = gr.Textbox(
-                            placeholder=" 🔍 Search for your model (separate multiple queries with `;`) and press ENTER...",
-                            show_label=False,
-                            elem_id="search-bar",
-                        )
-                    with gr.Row():
-                        shown_columns = gr.CheckboxGroup(
-                            choices=[
-                                c.name
-                                for c in fields(AutoEvalColumn)
-                                if not c.hidden and not c.never_hidden
-                            ],
-                            value=[
-                                c.name
-                                for c in fields(AutoEvalColumn)
-                                if c.displayed_by_default and not c.hidden and not c.never_hidden
-                            ],
-                            label="Select columns to show",
-                            elem_id="column-select",
-                            interactive=True,
-                        )
-                    with gr.Row():
-                        deleted_models_visibility = gr.Checkbox(
-                            value=False, label="Show gated/private/deleted models", interactive=True
-                        )
-                with gr.Column(min_width=320):
-                    #with gr.Box(elem_id="box-filter"):
-                    filter_columns_type = gr.CheckboxGroup(
-                        label="Model types",
-                        choices=[t.to_str() for t in ModelType],
-                        value=[t.to_str() for t in ModelType],
-                        interactive=True,
-                        elem_id="filter-columns-type",
-                    )
-                    filter_columns_precision = gr.CheckboxGroup(
-                        label="Precision",
-                        choices=[i.value.name for i in Precision],
-                        value=[i.value.name for i in Precision],
-                        interactive=True,
-                        elem_id="filter-columns-precision",
-                    )
-                    filter_columns_size = gr.CheckboxGroup(
-                        label="Model sizes (in billions of parameters)",
-                        choices=list(NUMERIC_INTERVALS.keys()),
-                        value=list(NUMERIC_INTERVALS.keys()),
-                        interactive=True,
-                        elem_id="filter-columns-size",
-                    )
             leaderboard_table = gr.components.Dataframe(
                 value=leaderboard_df[
                     [c.name for c in fields(AutoEvalColumn) if c.never_hidden]
-                    + shown_columns.value
                 ],
-                headers=[c.name for c in fields(AutoEvalColumn) if c.never_hidden] + shown_columns.value,
                 datatype=TYPES,
                 elem_id="leaderboard-table",
                 interactive=False,
                 visible=True,
             )
-            # Dummy leaderboard for handling the case when the user uses backspace key
-            hidden_leaderboard_table_for_search = gr.components.Dataframe(
-                value=original_df[COLS],
-                headers=COLS,
-                datatype=TYPES,
-                visible=False,
-            )
-            search_bar.submit(
-                update_table,
-                [
-                    hidden_leaderboard_table_for_search,
-                    shown_columns,
-                    filter_columns_type,
-                    filter_columns_precision,
-                    filter_columns_size,
-                    deleted_models_visibility,
-                    search_bar,
-                ],
-                leaderboard_table,
-            )
-            for selector in [shown_columns, filter_columns_type, filter_columns_precision, filter_columns_size, deleted_models_visibility]:
-                selector.change(
-                    update_table,
-                    [
-                        hidden_leaderboard_table_for_search,
-                        shown_columns,
-                        filter_columns_type,
-                        filter_columns_precision,
-                        filter_columns_size,
-                        deleted_models_visibility,
-                        search_bar,
-                    ],
-                    leaderboard_table,
-                    queue=True,
-                )
         with gr.TabItem("📝 About", elem_id="llm-benchmark-tab-table", id=2):
             gr.Markdown(LLM_BENCHMARKS_TEXT, elem_classes="markdown-text")

     with gr.Tabs(elem_classes="tab-buttons") as tabs:
         with gr.TabItem("🏅 LLM Benchmark", elem_id="llm-benchmark-tab-table", id=0):
             with gr.Row():
+                search_bar = gr.Textbox(
+                    placeholder=" 🔍 Search for the model (separate multiple queries with `;`) and press ENTER...",
+                    show_label=False,
+                    elem_id="search-bar",
+                )
+                # with gr.Column():
+                #     with gr.Row():
+                #         search_bar = gr.Textbox(
+                #             placeholder=" 🔍 Search for the model (separate multiple queries with `;`) and press ENTER...",
+                #             show_label=False,
+                #             elem_id="search-bar",
+                #         )
+                #     with gr.Row():
+                #         shown_columns = gr.CheckboxGroup(
+                #             choices=[
+                #                 c.name
+                #                 for c in fields(AutoEvalColumn)
+                #                 if not c.hidden and not c.never_hidden
+                #             ],
+                #             value=[
+                #                 c.name
+                #                 for c in fields(AutoEvalColumn)
+                #                 if c.displayed_by_default and not c.hidden and not c.never_hidden
+                #             ],
+                #             label="Select columns to show",
+                #             elem_id="column-select",
+                #             interactive=True,
+                #         )
+                #     with gr.Row():
+                #         deleted_models_visibility = gr.Checkbox(
+                #             value=False, label="Show gated/private/deleted models", interactive=True
+                #         )
+                # with gr.Column(min_width=320):
+                #     #with gr.Box(elem_id="box-filter"):
+                #     filter_columns_type = gr.CheckboxGroup(
+                #         label="Model types",
+                #         choices=[t.to_str() for t in ModelType],
+                #         value=[t.to_str() for t in ModelType],
+                #         interactive=True,
+                #         elem_id="filter-columns-type",
+                #     )
+                #     filter_columns_precision = gr.CheckboxGroup(
+                #         label="Precision",
+                #         choices=[i.value.name for i in Precision],
+                #         value=[i.value.name for i in Precision],
+                #         interactive=True,
+                #         elem_id="filter-columns-precision",
+                #     )
+                #     filter_columns_size = gr.CheckboxGroup(
+                #         label="Model sizes (in billions of parameters)",
+                #         choices=list(NUMERIC_INTERVALS.keys()),
+                #         value=list(NUMERIC_INTERVALS.keys()),
+                #         interactive=True,
+                #         elem_id="filter-columns-size",
+                #     )
+            # leaderboard_table = gr.components.Dataframe(
+            #     value=leaderboard_df[
+            #         [c.name for c in fields(AutoEvalColumn) if c.never_hidden]
+            #         + shown_columns.value
+            #     ],
+            #     headers=[c.name for c in fields(AutoEvalColumn) if c.never_hidden] + shown_columns.value,
+            #     datatype=TYPES,
+            #     elem_id="leaderboard-table",
+            #     interactive=False,
+            #     visible=True,
+            # )
             leaderboard_table = gr.components.Dataframe(
                 value=leaderboard_df[
                     [c.name for c in fields(AutoEvalColumn) if c.never_hidden]
                 ],
+                headers=[c.name for c in fields(AutoEvalColumn) if c.never_hidden],
                 datatype=TYPES,
                 elem_id="leaderboard-table",
                 interactive=False,
                 visible=True,
             )
+            # # Dummy leaderboard for handling the case when the user uses backspace key
+            # hidden_leaderboard_table_for_search = gr.components.Dataframe(
+            #     value=original_df[COLS],
+            #     headers=COLS,
+            #     datatype=TYPES,
+            #     visible=False,
+            # )
+            # search_bar.submit(
+            #     update_table,
+            #     [
+            #         hidden_leaderboard_table_for_search,
+            #         shown_columns,
+            #         filter_columns_type,
+            #         filter_columns_precision,
+            #         filter_columns_size,
+            #         deleted_models_visibility,
+            #         search_bar,
+            #     ],
+            #     leaderboard_table,
+            # )
+            # for selector in [shown_columns, filter_columns_type, filter_columns_precision, filter_columns_size, deleted_models_visibility]:
+            #     selector.change(
+            #         update_table,
+            #         [
+            #             hidden_leaderboard_table_for_search,
+            #             shown_columns,
+            #             filter_columns_type,
+            #             filter_columns_precision,
+            #             filter_columns_size,
+            #             deleted_models_visibility,
+            #             search_bar,
+            #         ],
+            #         leaderboard_table,
+            #         queue=True,
+            #     )
         with gr.TabItem("📝 About", elem_id="llm-benchmark-tab-table", id=2):
             gr.Markdown(LLM_BENCHMARKS_TEXT, elem_classes="markdown-text")

src/envs.py CHANGED Viewed

@@ -6,7 +6,7 @@ from huggingface_hub import HfApi
 # ----------------------------------
 TOKEN = os.environ.get("TOKEN") # A read/write token for your org
-OWNER = "demo-leaderboard-backend" # Change to your org - don't forget to create a results and request dataset, with the correct format!
 # ----------------------------------
 REPO_ID = f"{OWNER}/leaderboard"

 # ----------------------------------
 TOKEN = os.environ.get("TOKEN") # A read/write token for your org
+OWNER = "yale-nlp" # Change to your org - don't forget to create a results and request dataset, with the correct format!
 # ----------------------------------
 REPO_ID = f"{OWNER}/leaderboard"