Spaces:

Vchitect
/

VBench_Leaderboard

Running

App Files Files Community

ynhe commited on Aug 7

Commit

802104c

verified ·

1 Parent(s): 2491ad9

[New] Add certification column

Browse files

New Certification column:
🏅 Gold Certification:
Awarded when you submit high-quality, pre-generated video samples from your model.

💎 Platinum Certification:
Our highest honor. Achieved by submitting your open-source model or a sampling-capable API for full verification by our team.

Files changed (1) hide show

app.py +121 -50

app.py CHANGED Viewed

@@ -534,6 +534,7 @@ def get_baseline_df():
     submission_repo.git_pull()
     df = pd.read_csv(CSV_DIR)
     df = get_final_score(df, checkbox_group.value)
     df = df.sort_values(by="Selected Score", ascending=False)
     present_columns = MODEL_INFO + checkbox_group.value
     # print(present_columns)
@@ -559,6 +560,7 @@ def get_baseline_df_i2v():
     submission_repo.git_pull()
     df = pd.read_csv(I2V_DIR)
     df = get_final_score_i2v(df, checkbox_group_i2v.value)
     df = df.sort_values(by="Selected Score", ascending=False)
     present_columns = MODEL_INFO_TAB_I2V + checkbox_group_i2v.value
     # df = df[df["Sampled by"] == 'VBench Team']
@@ -571,6 +573,7 @@ def get_baseline_df_long():
     submission_repo.git_pull()
     df = pd.read_csv(LONG_DIR)
     df = get_final_score(df, checkbox_group.value)
     df = df.sort_values(by="Selected Score", ascending=False)
     present_columns = MODEL_INFO + checkbox_group.value
     # df = df[df["Sampled by"] == 'VBench Team']
@@ -582,6 +585,7 @@ def get_baseline_df_2():
     submission_repo = Repository(local_dir=SUBMISSION_NAME, clone_from=SUBMISSION_URL, use_auth_token=HF_TOKEN, repo_type="dataset")
     submission_repo.git_pull()
     df = pd.read_csv(VBENCH2_DIR)
     df = get_final_score2(df, TASK_INFO_2)
     df = df.sort_values(by="Total Score", ascending=False)
     df = df[COLUMN_NAMES_2]
@@ -643,6 +647,20 @@ def convert_scores_to_percentage(df):
             df[column] = df[column].apply(lambda x: f"{x:05.2f}%" if pd.notna(pd.to_numeric(x, errors='coerce')) else x)
     return df
 def choose_all_quailty():
     return gr.update(value=QUALITY_LIST)
@@ -655,23 +673,42 @@ def disable_all():
 def enable_all():
     return gr.update(value=TASK_INFO)
 # select function
-def on_filter_model_size_method_change(selected_columns, vbench_team_sample, vbench_team_eval=False):
     updated_data = get_all_df(selected_columns, CSV_DIR)
     if vbench_team_sample:
-        updated_data = updated_data[updated_data["Sampled by"].str.contains('VBench Team')]
     if vbench_team_eval:
-        updated_data =  updated_data[updated_data["Evaluated by"].str.contains('VBench Team')]
-    #print(updated_data)
-    # columns:
     selected_columns = [item for item in TASK_INFO if item in selected_columns]
     present_columns = MODEL_INFO + selected_columns
-    updated_data = updated_data[present_columns]
     updated_data = updated_data.sort_values(by="Selected Score", ascending=False)
     updated_data = convert_scores_to_percentage(updated_data)
-    updated_headers = present_columns
-    print(COLUMN_NAMES,updated_headers,DATA_TITILE_TYPE )
-    update_datatype = [DATA_TITILE_TYPE[COLUMN_NAMES.index(x)] for x in updated_headers]
     # print(updated_data,present_columns,update_datatype)
     filter_component = gr.components.Dataframe(
         value=updated_data,
@@ -681,7 +718,7 @@ def on_filter_model_size_method_change(selected_columns, vbench_team_sample, vbe
         interactive=False,
         visible=True,
         )
-    return filter_component#.value
 def on_filter_model_size_method_change_quality(selected_columns):
     updated_data = get_all_df_quality(selected_columns, QUALITY_DIR)
@@ -702,12 +739,13 @@ def on_filter_model_size_method_change_quality(selected_columns):
         )
     return filter_component#.value
-def on_filter_model_size_method_change_i2v(selected_columns,vbench_team_sample, vbench_team_eval=False):
     updated_data = get_all_df_i2v(selected_columns, I2V_DIR)
     if vbench_team_sample:
-        updated_data = updated_data[updated_data["Sampled by"] == 'VBench Team']
     if vbench_team_eval:
-        updated_data = updated_data[updated_data['Evaluated by'] == 'VBench Team']
     selected_columns = [item for item in I2V_TAB if item in selected_columns]
     present_columns = MODEL_INFO_TAB_I2V + selected_columns
     updated_data = updated_data[present_columns]
@@ -725,12 +763,15 @@ def on_filter_model_size_method_change_i2v(selected_columns,vbench_team_sample,
         )
     return filter_component#.value
-def on_filter_model_size_method_change_long(selected_columns, vbench_team_sample, vbench_team_eval=False):
     updated_data = get_all_df_long(selected_columns, LONG_DIR)
     if vbench_team_sample:
-        updated_data = updated_data[updated_data["Sampled by"] == 'VBench Team']
     if vbench_team_eval:
-        updated_data = updated_data[updated_data['Evaluated by'] == 'VBench Team']
     selected_columns = [item for item in TASK_INFO if item in selected_columns]
     present_columns = MODEL_INFO + selected_columns
     updated_data = updated_data[present_columns]
@@ -749,14 +790,17 @@ def on_filter_model_size_method_change_long(selected_columns, vbench_team_sample
     return filter_component#.value
-def on_filter_model_size_method_change_2(selected_columns=TASK_INFO_2, vbench_team_sample=False, vbench_team_eval=False):
     updated_data = get_all_df2(selected_columns, VBENCH2_DIR)
-    print(updated_data)
-    print(vbench_team_sample, vbench_team_eval)
     if vbench_team_sample:
-        updated_data = updated_data[updated_data["Sampled by"].str.contains('VBench Team')]
     if vbench_team_eval:
-        updated_data = updated_data[updated_data["Evaluated by"].str.contains('VBench Team')]
     present_columns = VBENCH2_MODEL_INFO_DEFAULT + selected_columns
     updated_headers = present_columns
@@ -776,16 +820,18 @@ def on_filter_model_size_method_change_2(selected_columns=TASK_INFO_2, vbench_te
         )
     return filter_component
-def on_filter_model_size_method_score_change_2(select_score, vbench_team_sample=False, vbench_team_eval=False):
     selected_columns = category_to_dimension[select_score]
-    print(select_score,"===>",selected_columns)
     updated_data = get_all_df2(selected_columns, VBENCH2_DIR)
-    print(updated_data)
     if vbench_team_sample:
-        updated_data = updated_data[updated_data["Sampled by"].str.contains('VBench Team')]
     if vbench_team_eval:
-        updated_data = updated_data[updated_data["Evaluated by"].str.contains('VBench Team')]
     present_columns = VBENCH2_MODEL_INFO_DEFAULT + [f"{select_score} Score"] + selected_columns
     updated_headers = present_columns
     updated_data = updated_data[present_columns]
@@ -843,6 +889,11 @@ with block:
                         value=True,
                         interactive=True
                     )
                     # selection for column part:
                     checkbox_group = gr.CheckboxGroup(
                         choices=TASK_INFO,
@@ -850,6 +901,7 @@ with block:
                         label="Evaluation Dimension",
                         interactive=True,
                     )
             data_component = gr.components.Dataframe(
                 value=get_baseline_df,
@@ -860,14 +912,17 @@ with block:
                 visible=True,
                 # height=700,
                 )
             choosen_q.click(choose_all_quailty, inputs=None, outputs=[checkbox_group]).then(fn=on_filter_model_size_method_change, inputs=[ checkbox_group, vbench_team_filter,vbench_validate_filter], outputs=data_component)
             choosen_s.click(choose_all_semantic, inputs=None, outputs=[checkbox_group]).then(fn=on_filter_model_size_method_change, inputs=[ checkbox_group, vbench_team_filter,vbench_validate_filter], outputs=data_component)
             # enable_b.click(enable_all, inputs=None, outputs=[checkbox_group]).then(fn=on_filter_model_size_method_change, inputs=[ checkbox_group, vbench_team_filter], outputs=data_component)
             disable_b.click(disable_all, inputs=None, outputs=[checkbox_group]).then(fn=on_filter_model_size_method_change, inputs=[ checkbox_group, vbench_team_filter, vbench_validate_filter], outputs=data_component)
-            checkbox_group.change(fn=on_filter_model_size_method_change, inputs=[ checkbox_group, vbench_team_filter, vbench_validate_filter], outputs=data_component)
-            vbench_team_filter.change(fn=on_filter_model_size_method_change, inputs=[checkbox_group, vbench_team_filter, vbench_validate_filter], outputs=data_component)
-            vbench_validate_filter.change(fn=on_filter_model_size_method_change, inputs=[checkbox_group, vbench_team_filter, vbench_validate_filter], outputs=data_component)
         # VBench 2.0
         with gr.TabItem("⭐ VBench 2.0", elem_id="vbench-tab-table", id=2):
             with gr.Row():
@@ -893,6 +948,11 @@ with block:
                     value=True,
                     interactive=True
                 )
             with gr.Row():
                 vbench2_creativity_button = gr.Button("Show Creativity Score")
                 vbench2_commonsense_button = gr.Button("Show Commonsense Score")
@@ -916,14 +976,15 @@ with block:
                 visible=True,
                 # height=700,
                 )
-            vbench_team_filter_2.change(fn=on_filter_model_size_method_change_2, inputs=[vbench2_checkgroup, vbench_team_filter_2, vbench_validate_filter_2], outputs=data_component_2)
-            vbench_validate_filter_2.change(fn=on_filter_model_size_method_change_2, inputs=[vbench2_checkgroup, vbench_team_filter_2, vbench_validate_filter_2], outputs=data_component_2)
             # vbench2_checkgroup.change(fn=on_filter_model_size_method_change_2, inputs=[vbench2_checkgroup, vbench_team_filter_2, vbench_validate_filter], outputs=data_component_2)
-            vbench2_creativity_button.click(fn=on_filter_model_size_method_score_change_2, inputs=[gr.State("Creativity"), vbench_team_filter_2, vbench_validate_filter_2], outputs=[data_component_2, vbench2_checkgroup])
-            vbench2_commonsense_button.click(fn=on_filter_model_size_method_score_change_2, inputs=[gr.State("Commonsense"), vbench_team_filter_2, vbench_validate_filter_2], outputs=[data_component_2, vbench2_checkgroup])
-            vbench2_control_button.click(fn=on_filter_model_size_method_score_change_2, inputs=[gr.State("Controllability"), vbench_team_filter_2, vbench_validate_filter_2], outputs=[data_component_2, vbench2_checkgroup])
-            vbench2_human_button.click(fn=on_filter_model_size_method_score_change_2, inputs=[gr.State("Human Fidelity"), vbench_team_filter_2, vbench_validate_filter_2], outputs=[data_component_2, vbench2_checkgroup])
-            vbench2_physics_button.click(fn=on_filter_model_size_method_score_change_2, inputs=[gr.State("Physics"), vbench_team_filter_2, vbench_validate_filter_2], outputs=[data_component_2, vbench2_checkgroup])
         with gr.TabItem("Video Quality", elem_id="vbench-tab-table", id=3):
             with gr.Accordion("INSTRUCTION", open=False):
@@ -978,6 +1039,11 @@ with block:
                                 value=False,
                                 interactive=True
                             )
                     checkbox_group_i2v = gr.CheckboxGroup(
                         choices=I2V_TAB,
                         value=I2V_TAB,
@@ -994,10 +1060,10 @@ with block:
                 visible=True,
                 )
-            checkbox_group_i2v.change(fn=on_filter_model_size_method_change_i2v, inputs=[checkbox_group_i2v, vbench_team_filter_i2v,vbench_validate_filter_i2v], outputs=data_component_i2v)
-            vbench_team_filter_i2v.change(fn=on_filter_model_size_method_change_i2v, inputs=[checkbox_group_i2v, vbench_team_filter_i2v,vbench_validate_filter_i2v], outputs=data_component_i2v)
-            vbench_validate_filter_i2v.change(fn=on_filter_model_size_method_change_i2v, inputs=[checkbox_group_i2v, vbench_team_filter_i2v,vbench_validate_filter_i2v], outputs=data_component_i2v)
         with gr.TabItem("📊 VBench-Long", elem_id="vbench-tab-table", id=5):
             with gr.Row():
                 with gr.Accordion("INSTRUCTION", open=False):
@@ -1030,6 +1096,11 @@ with block:
                             value=False,
                             interactive=True
                         )
                     checkbox_group_long = gr.CheckboxGroup(
                         choices=TASK_INFO,
                         value=DEFAULT_INFO,
@@ -1037,7 +1108,7 @@ with block:
                         interactive=True,
                     )
-            data_component = gr.components.Dataframe(
                 value=get_baseline_df_long,
                 headers=COLUMN_NAMES,
                 type="pandas",
@@ -1047,14 +1118,14 @@ with block:
                 # height=700,
                 )
-            choosen_q_long.click(choose_all_quailty, inputs=None, outputs=[checkbox_group_long]).then(fn=on_filter_model_size_method_change_long, inputs=[ checkbox_group_long, vbench_team_filter_long, vbench_validate_filter_long], outputs=data_component)
-            choosen_s_long.click(choose_all_semantic, inputs=None, outputs=[checkbox_group_long]).then(fn=on_filter_model_size_method_change_long, inputs=[ checkbox_group_long, vbench_team_filter_long, vbench_validate_filter_long], outputs=data_component)
-            enable_b_long.click(enable_all, inputs=None, outputs=[checkbox_group_long]).then(fn=on_filter_model_size_method_change_long, inputs=[ checkbox_group_long, vbench_team_filter_long, vbench_validate_filter_long], outputs=data_component)
-            disable_b_long.click(disable_all, inputs=None, outputs=[checkbox_group_long]).then(fn=on_filter_model_size_method_change_long, inputs=[ checkbox_group_long, vbench_team_filter_long, vbench_validate_filter_long], outputs=data_component)
-            checkbox_group_long.change(fn=on_filter_model_size_method_change_long, inputs=[checkbox_group_long, vbench_team_filter_long,vbench_validate_filter_long], outputs=data_component)
-            vbench_team_filter_long.change(fn=on_filter_model_size_method_change_long, inputs=[checkbox_group_long, vbench_team_filter_long,vbench_validate_filter_long], outputs=data_component)
-            vbench_validate_filter_long.change(fn=on_filter_model_size_method_change_long, inputs=[checkbox_group_long, vbench_team_filter_long,vbench_validate_filter_long], outputs=data_component)
         # table info
         with gr.TabItem("📝 About", elem_id="mvbench-tab-table", id=6):
             gr.Markdown(LEADERBORAD_INFO, elem_classes="markdown-text")

     submission_repo.git_pull()
     df = pd.read_csv(CSV_DIR)
     df = get_final_score(df, checkbox_group.value)
+    df['Certification'] = df.apply(get_certification, axis=1)
     df = df.sort_values(by="Selected Score", ascending=False)
     present_columns = MODEL_INFO + checkbox_group.value
     # print(present_columns)
     submission_repo.git_pull()
     df = pd.read_csv(I2V_DIR)
     df = get_final_score_i2v(df, checkbox_group_i2v.value)
+    df['Certification'] = df.apply(get_certification, axis=1)
     df = df.sort_values(by="Selected Score", ascending=False)
     present_columns = MODEL_INFO_TAB_I2V + checkbox_group_i2v.value
     # df = df[df["Sampled by"] == 'VBench Team']
     submission_repo.git_pull()
     df = pd.read_csv(LONG_DIR)
     df = get_final_score(df, checkbox_group.value)
+    df['Certification'] = df.apply(get_certification, axis=1)
     df = df.sort_values(by="Selected Score", ascending=False)
     present_columns = MODEL_INFO + checkbox_group.value
     # df = df[df["Sampled by"] == 'VBench Team']
     submission_repo = Repository(local_dir=SUBMISSION_NAME, clone_from=SUBMISSION_URL, use_auth_token=HF_TOKEN, repo_type="dataset")
     submission_repo.git_pull()
     df = pd.read_csv(VBENCH2_DIR)
+    df['Certification'] = df.apply(get_certification, axis=1)
     df = get_final_score2(df, TASK_INFO_2)
     df = df.sort_values(by="Total Score", ascending=False)
     df = df[COLUMN_NAMES_2]
             df[column] = df[column].apply(lambda x: f"{x:05.2f}%" if pd.notna(pd.to_numeric(x, errors='coerce')) else x)
     return df
+def convert_scores_to_percentage(df):
+    df_copy = df.copy()
+    NON_SCORE_COLS = ['Model Name (clickable)', 'Certification', 'Sampled by', 'Evaluated by', 'Accessibility', 'Date', 'Mail']
+    for col in df_copy.columns:
+        if col not in NON_SCORE_COLS:
+            numeric_series = pd.to_numeric(df_copy[col], errors='coerce')
+            if numeric_series.notna().any():
+                processed_series = round(numeric_series * 100, 2)
+                formatted_series = processed_series.apply(lambda x: f"{x:05.2f}%" if pd.notna(x) else x)
+                df_copy[col] = df_copy[col].astype(str).where(formatted_series.isna(), formatted_series)
+    return df_copy
 def choose_all_quailty():
     return gr.update(value=QUALITY_LIST)
 def enable_all():
     return gr.update(value=TASK_INFO)
+def get_certification(row):
+    is_sampled_by_vbench = 'VBench Team' in str(row.get('Sampled by', ''))
+    is_evaluated_by_vbench = 'VBench Team' in str(row.get('Evaluated by', ''))
+    if is_sampled_by_vbench and is_evaluated_by_vbench:
+        return '🥇 Platinum'
+    elif is_sampled_by_vbench or is_evaluated_by_vbench:
+        return '🏅 Gold'
+    else:
+        return ''
 # select function
+def on_filter_model_size_method_change(selected_columns, vbench_team_sample, vbench_team_eval=False, show_platinum_only=False):
     updated_data = get_all_df(selected_columns, CSV_DIR)
+    updated_data['Certification'] = updated_data.apply(get_certification, axis=1)
     if vbench_team_sample:
+        updated_data = updated_data[updated_data["Sampled by"].str.contains('VBench Team', na=False)]
     if vbench_team_eval:
+        updated_data = updated_data[updated_data["Evaluated by"].str.contains('VBench Team', na=False)]
+    if show_platinum_only:
+        updated_data = updated_data[updated_data['Certification'] == '🥇 Platinum']
     selected_columns = [item for item in TASK_INFO if item in selected_columns]
     present_columns = MODEL_INFO + selected_columns
+    final_present_columns = [col for col in present_columns if col in updated_data.columns]
+    updated_data = updated_data[final_present_columns]
     updated_data = updated_data.sort_values(by="Selected Score", ascending=False)
     updated_data = convert_scores_to_percentage(updated_data)
+    updated_headers = final_present_columns
+    type_map = {name: dtype for name, dtype in zip(COLUMN_NAMES, DATA_TITILE_TYPE)}
+    type_map['Certification'] = 'str'
+    update_datatype = [type_map.get(h, 'str') for h in updated_headers]
     # print(updated_data,present_columns,update_datatype)
     filter_component = gr.components.Dataframe(
         value=updated_data,
         interactive=False,
         visible=True,
         )
+    return filter_component
 def on_filter_model_size_method_change_quality(selected_columns):
     updated_data = get_all_df_quality(selected_columns, QUALITY_DIR)
         )
     return filter_component#.value
+def on_filter_model_size_method_change_i2v(selected_columns,vbench_team_sample, vbench_team_eval=False, show_platinum_only=False):
     updated_data = get_all_df_i2v(selected_columns, I2V_DIR)
+    updated_data['Certification'] = updated_data.apply(get_certification, axis=1)
     if vbench_team_sample:
+        updated_data = updated_data[updated_data["Sampled by"].str.contains('VBench Team', na=False)]
     if vbench_team_eval:
+        updated_data = updated_data[updated_data['Evaluated by'].str.contains('VBench Team', na=False)]
     selected_columns = [item for item in I2V_TAB if item in selected_columns]
     present_columns = MODEL_INFO_TAB_I2V + selected_columns
     updated_data = updated_data[present_columns]
         )
     return filter_component#.value
+def on_filter_model_size_method_change_long(selected_columns, vbench_team_sample, vbench_team_eval=False, show_platinum_only=False):
     updated_data = get_all_df_long(selected_columns, LONG_DIR)
+    updated_data['Certification'] = updated_data.apply(get_certification, axis=1)
     if vbench_team_sample:
+        updated_data = updated_data[updated_data["Sampled by"].str.contains('VBench Team', na=False)]
     if vbench_team_eval:
+        updated_data = updated_data[updated_data['Evaluated by'].str.contains('VBench Team', na=False)]
+    if show_platinum_only:
+        updated_data = updated_data[updated_data['Certification'] == '🥇 Platinum']
     selected_columns = [item for item in TASK_INFO if item in selected_columns]
     present_columns = MODEL_INFO + selected_columns
     updated_data = updated_data[present_columns]
     return filter_component#.value
+def on_filter_model_size_method_change_2(selected_columns=TASK_INFO_2, vbench_team_sample=False, vbench_team_eval=False, show_platinum_only=False):
     updated_data = get_all_df2(selected_columns, VBENCH2_DIR)
+    # print(updated_data)
+    # print(vbench_team_sample, vbench_team_eval)
+    updated_data['Certification'] = updated_data.apply(get_certification, axis=1)
     if vbench_team_sample:
+        updated_data = updated_data[updated_data["Sampled by"].str.contains('VBench Team', na=False)]
     if vbench_team_eval:
+        updated_data = updated_data[updated_data["Evaluated by"].str.contains('VBench Team', na=False)]
+    if show_platinum_only:
+        updated_data = updated_data[updated_data['Certification'] == '🥇 Platinum']
     present_columns = VBENCH2_MODEL_INFO_DEFAULT + selected_columns
     updated_headers = present_columns
         )
     return filter_component
+def on_filter_model_size_method_score_change_2(select_score, vbench_team_sample=False, vbench_team_eval=False, show_platinum_only=False):
     selected_columns = category_to_dimension[select_score]
+    # print(select_score,"===>",selected_columns)
     updated_data = get_all_df2(selected_columns, VBENCH2_DIR)
+    updated_data['Certification'] = updated_data.apply(get_certification, axis=1)
+    # print(updated_data)
     if vbench_team_sample:
+        updated_data = updated_data[updated_data["Sampled by"].str.contains('VBench Team', na=False)]
     if vbench_team_eval:
+        updated_data = updated_data[updated_data["Evaluated by"].str.contains('VBench Team', na=False)]
+    if show_platinum_only:
+        updated_data = updated_data[updated_data['Certification'] == '🥇 Platinum']
     present_columns = VBENCH2_MODEL_INFO_DEFAULT + [f"{select_score} Score"] + selected_columns
     updated_headers = present_columns
     updated_data = updated_data[present_columns]
                         value=True,
                         interactive=True
                     )
+                    show_platinum_button = gr.Checkbox(
+                        label="Only show 🥇 Platinum",
+                        value=False,
+                        interactive=True
+                    )
                     # selection for column part:
                     checkbox_group = gr.CheckboxGroup(
                         choices=TASK_INFO,
                         label="Evaluation Dimension",
                         interactive=True,
                     )
             data_component = gr.components.Dataframe(
                 value=get_baseline_df,
                 visible=True,
                 # height=700,
                 )
             choosen_q.click(choose_all_quailty, inputs=None, outputs=[checkbox_group]).then(fn=on_filter_model_size_method_change, inputs=[ checkbox_group, vbench_team_filter,vbench_validate_filter], outputs=data_component)
             choosen_s.click(choose_all_semantic, inputs=None, outputs=[checkbox_group]).then(fn=on_filter_model_size_method_change, inputs=[ checkbox_group, vbench_team_filter,vbench_validate_filter], outputs=data_component)
             # enable_b.click(enable_all, inputs=None, outputs=[checkbox_group]).then(fn=on_filter_model_size_method_change, inputs=[ checkbox_group, vbench_team_filter], outputs=data_component)
             disable_b.click(disable_all, inputs=None, outputs=[checkbox_group]).then(fn=on_filter_model_size_method_change, inputs=[ checkbox_group, vbench_team_filter, vbench_validate_filter], outputs=data_component)
+            checkbox_group.change(fn=on_filter_model_size_method_change, inputs=[ checkbox_group, vbench_team_filter, vbench_validate_filter, show_platinum_button], outputs=data_component)
+            vbench_team_filter.change(fn=on_filter_model_size_method_change, inputs=[checkbox_group, vbench_team_filter, vbench_validate_filter, show_platinum_button], outputs=data_component)
+            vbench_validate_filter.change(fn=on_filter_model_size_method_change, inputs=[checkbox_group, vbench_team_filter, vbench_validate_filter, show_platinum_button], outputs=data_component)
+            show_platinum_button.change(fn=on_filter_model_size_method_change, inputs=[checkbox_group, vbench_team_filter, vbench_validate_filter, show_platinum_button], outputs=data_component)
         # VBench 2.0
         with gr.TabItem("⭐ VBench 2.0", elem_id="vbench-tab-table", id=2):
             with gr.Row():
                     value=True,
                     interactive=True
                 )
+                show_platinum_button_2 = gr.Checkbox(
+                    label="Only show 🥇 Platinum",
+                    value=False,
+                    interactive=True
+                )
             with gr.Row():
                 vbench2_creativity_button = gr.Button("Show Creativity Score")
                 vbench2_commonsense_button = gr.Button("Show Commonsense Score")
                 visible=True,
                 # height=700,
                 )
+            vbench_team_filter_2.change(fn=on_filter_model_size_method_change_2, inputs=[vbench2_checkgroup, vbench_team_filter_2, vbench_validate_filter_2, show_platinum_button_2], outputs=data_component_2)
+            vbench_validate_filter_2.change(fn=on_filter_model_size_method_change_2, inputs=[vbench2_checkgroup, vbench_team_filter_2, vbench_validate_filter_2, show_platinum_button_2], outputs=data_component_2)
             # vbench2_checkgroup.change(fn=on_filter_model_size_method_change_2, inputs=[vbench2_checkgroup, vbench_team_filter_2, vbench_validate_filter], outputs=data_component_2)
+            vbench2_creativity_button.click(fn=on_filter_model_size_method_score_change_2, inputs=[gr.State("Creativity"), vbench_team_filter_2, vbench_validate_filter_2, show_platinum_button_2], outputs=[data_component_2, vbench2_checkgroup])
+            vbench2_commonsense_button.click(fn=on_filter_model_size_method_score_change_2, inputs=[gr.State("Commonsense"), vbench_team_filter_2, vbench_validate_filter_2, show_platinum_button_2], outputs=[data_component_2, vbench2_checkgroup])
+            vbench2_control_button.click(fn=on_filter_model_size_method_score_change_2, inputs=[gr.State("Controllability"), vbench_team_filter_2, vbench_validate_filter_2, show_platinum_button_2], outputs=[data_component_2, vbench2_checkgroup])
+            vbench2_human_button.click(fn=on_filter_model_size_method_score_change_2, inputs=[gr.State("Human Fidelity"), vbench_team_filter_2, vbench_validate_filter_2, show_platinum_button_2], outputs=[data_component_2, vbench2_checkgroup])
+            vbench2_physics_button.click(fn=on_filter_model_size_method_score_change_2, inputs=[gr.State("Physics"), vbench_team_filter_2, vbench_validate_filter_2, show_platinum_button_2], outputs=[data_component_2, vbench2_checkgroup])
         with gr.TabItem("Video Quality", elem_id="vbench-tab-table", id=3):
             with gr.Accordion("INSTRUCTION", open=False):
                                 value=False,
                                 interactive=True
                             )
+                        show_platinum_button_i2v = gr.Checkbox(
+                                label="Only show 🥇 Platinum",
+                                value=False,
+                                interactive=True
+                            )
                     checkbox_group_i2v = gr.CheckboxGroup(
                         choices=I2V_TAB,
                         value=I2V_TAB,
                 visible=True,
                 )
+            checkbox_group_i2v.change(fn=on_filter_model_size_method_change_i2v, inputs=[checkbox_group_i2v, vbench_team_filter_i2v, vbench_validate_filter_i2v, show_platinum_button_i2v], outputs=data_component_i2v)
+            vbench_team_filter_i2v.change(fn=on_filter_model_size_method_change_i2v, inputs=[checkbox_group_i2v, vbench_team_filter_i2v, vbench_validate_filter_i2v, show_platinum_button_i2v], outputs=data_component_i2v)
+            vbench_validate_filter_i2v.change(fn=on_filter_model_size_method_change_i2v, inputs=[checkbox_group_i2v, vbench_team_filter_i2v, vbench_validate_filter_i2v, show_platinum_button_i2v], outputs=data_component_i2v)
+            show_platinum_button_i2v.change(fn=on_filter_model_size_method_change_i2v, inputs=[checkbox_group_i2v, vbench_team_filter_i2v, vbench_validate_filter_i2v, show_platinum_button_i2v], outputs=data_component_i2v)
         with gr.TabItem("📊 VBench-Long", elem_id="vbench-tab-table", id=5):
             with gr.Row():
                 with gr.Accordion("INSTRUCTION", open=False):
                             value=False,
                             interactive=True
                         )
+                        show_platinum_button_long = gr.Checkbox(
+                            label="Only show 🥇 Platinum",
+                            value=False,
+                            interactive=True
+                        )
                     checkbox_group_long = gr.CheckboxGroup(
                         choices=TASK_INFO,
                         value=DEFAULT_INFO,
                         interactive=True,
                     )
+            data_component_long = gr.components.Dataframe(
                 value=get_baseline_df_long,
                 headers=COLUMN_NAMES,
                 type="pandas",
                 # height=700,
                 )
+            choosen_q_long.click(choose_all_quailty, inputs=None, outputs=[checkbox_group_long]).then(fn=on_filter_model_size_method_change_long, inputs=[ checkbox_group_long, vbench_team_filter_long, vbench_validate_filter_long], outputs=data_component_long)
+            choosen_s_long.click(choose_all_semantic, inputs=None, outputs=[checkbox_group_long]).then(fn=on_filter_model_size_method_change_long, inputs=[ checkbox_group_long, vbench_team_filter_long, vbench_validate_filter_long], outputs=data_component_long)
+            enable_b_long.click(enable_all, inputs=None, outputs=[checkbox_group_long]).then(fn=on_filter_model_size_method_change_long, inputs=[ checkbox_group_long, vbench_team_filter_long, vbench_validate_filter_long], outputs=data_component_long)
+            disable_b_long.click(disable_all, inputs=None, outputs=[checkbox_group_long]).then(fn=on_filter_model_size_method_change_long, inputs=[ checkbox_group_long, vbench_team_filter_long, vbench_validate_filter_long], outputs=data_component_long)
+            checkbox_group_long.change(fn=on_filter_model_size_method_change_long, inputs=[checkbox_group_long, vbench_team_filter_long, vbench_validate_filter_long, show_platinum_button_long], outputs=data_component_long)
+            vbench_team_filter_long.change(fn=on_filter_model_size_method_change_long, inputs=[checkbox_group_long, vbench_team_filter_long, vbench_validate_filter_long, show_platinum_button_long], outputs=data_component_long)
+            vbench_validate_filter_long.change(fn=on_filter_model_size_method_change_long, inputs=[checkbox_group_long, vbench_team_filter_long, vbench_validate_filter_long, show_platinum_button_long], outputs=data_component_long)
+            show_platinum_button_long.change(fn=on_filter_model_size_method_change_long, inputs=[checkbox_group_long, vbench_team_filter_long, vbench_validate_filter_long, show_platinum_button_long], outputs=data_component_long)
         # table info
         with gr.TabItem("📝 About", elem_id="mvbench-tab-table", id=6):
             gr.Markdown(LEADERBORAD_INFO, elem_classes="markdown-text")