WebApp1K-models-leaderboard

Running

App Files Files Community

onekq commited on Jan 24

Commit

3fee132

verified ·

1 Parent(s): 8fe6c77

Update app.py

Browse files

Files changed (1) hide show

app.py +4 -6

app.py CHANGED Viewed

@@ -38,7 +38,7 @@ def filter_data(model, scenario):
     return pd.DataFrame([pass_at_k])
 # Initialize the leaderboard
-def init_leaderboard(dataframe, default_selection=["Model", "pass@1", "pass@5", "pass@10"], height=600):
     if dataframe is None or dataframe.empty:
         raise ValueError("Leaderboard DataFrame is empty or None.")
     return Leaderboard(
@@ -67,10 +67,8 @@ duo_complete_pass_at_k = duo_df.groupby('Model')[['Runs', 'Successes']].apply(la
 }, index=['pass@1'])).reset_index()
 complete_pass_at_k = df.groupby('Model')[['Runs', 'Successes']].apply(lambda x: pd.Series({
-    'pass@1': estimate_pass_at_k(x['Runs'].values, x['Successes'].values, 1).mean(),
-    'pass@5': estimate_pass_at_k(x['Runs'].values, x['Successes'].values, 5).mean(),
-    'pass@10': estimate_pass_at_k(x['Runs'].values, x['Successes'].values, 10).mean()
-}, index=['pass@1', 'pass@5', 'pass@10'])).reset_index()
 with gr.Blocks() as demo:
     gr.Markdown("# 🏆 WebApp1K Models Leaderboard")
@@ -82,7 +80,7 @@ with gr.Blocks() as demo:
         "[AI Models](https://www.aimodels.fyi/papers/arxiv/webapp1k-practical-code-generation-benchmark-web-app)")
     gr.Markdown("# WebApp1K-Duo ([Benchmark](https://huggingface.co/datasets/onekq-ai/WebApp1K-Duo-React))")
-    duo_leaderboard = init_leaderboard(duo_complete_pass_at_k, default_selection = ["Model", "pass@1"], height=400)
     gr.Markdown("# WebApp1K ([Benchmark](https://huggingface.co/datasets/onekq-ai/WebApp1K-React))")
     leaderboard = init_leaderboard(complete_pass_at_k, default_selection = [], height=800)

     return pd.DataFrame([pass_at_k])
 # Initialize the leaderboard
+def init_leaderboard(dataframe, default_selection=["Model", "pass@1"], height=600):
     if dataframe is None or dataframe.empty:
         raise ValueError("Leaderboard DataFrame is empty or None.")
     return Leaderboard(
 }, index=['pass@1'])).reset_index()
 complete_pass_at_k = df.groupby('Model')[['Runs', 'Successes']].apply(lambda x: pd.Series({
+    'pass@1': estimate_pass_at_k(x['Runs'].values, x['Successes'].values, 1).mean()
+}, index=['pass@1'])).reset_index()
 with gr.Blocks() as demo:
     gr.Markdown("# 🏆 WebApp1K Models Leaderboard")
         "[AI Models](https://www.aimodels.fyi/papers/arxiv/webapp1k-practical-code-generation-benchmark-web-app)")
     gr.Markdown("# WebApp1K-Duo ([Benchmark](https://huggingface.co/datasets/onekq-ai/WebApp1K-Duo-React))")
+    duo_leaderboard = init_leaderboard(duo_complete_pass_at_k, default_selection = [], height=400)
     gr.Markdown("# WebApp1K ([Benchmark](https://huggingface.co/datasets/onekq-ai/WebApp1K-React))")
     leaderboard = init_leaderboard(complete_pass_at_k, default_selection = [], height=800)