Spaces:

tawkeed-sa
/

Arabic-LLM-Benchmark

Runtime error

saleh-alibrahim commited on Feb 9

Commit

f797f3e

verified ·

1 Parent(s): 95fd2b2

Remove Elm/STC from providers, add Eval method column (API vs HuggingFace)

Files changed (3) hide show

app.py CHANGED Viewed

@@ -60,6 +60,7 @@ def build_leaderboard_df(results: list[dict]) -> pd.DataFrame:
             "Rank": i,
             "Model": r["model_name"],
             "Provider": r.get("provider", ""),
             "Parameters": r.get("parameters", ""),
             "Score": r["average_score"],
             "Tier": score_to_tier(r["average_score"]),
@@ -201,7 +202,7 @@ def make_bar_chart(model_name: str) -> go.Figure:
 def build_leaderboard_display() -> pd.DataFrame:
     if LEADERBOARD_DF.empty:
         return pd.DataFrame()
-    df = LEADERBOARD_DF[["Rank", "Model", "Provider", "Parameters", "Score", "Tier"]].copy()
     df["Score"] = df["Score"].apply(lambda x: f"**{x:.2f}**")
     df["Tier"] = df["Tier"].apply(lambda t: f"**{t}**")
     return df
@@ -401,11 +402,11 @@ with demo:
         with gr.TabItem("Leaderboard", id=0):
             gr.Dataframe(
                 value=DISPLAY_DF,
-                datatype=["number", "markdown", "str", "str", "markdown", "markdown"],
                 interactive=False,
                 wrap=True,
                 show_search="filter",
-                column_widths=[60, 280, 160, 100, 100, 60],
             )
         # ── Tab 2: Skills Breakdown ──────────────────────────────────────

             "Rank": i,
             "Model": r["model_name"],
             "Provider": r.get("provider", ""),
+            "Eval": r.get("eval_method", ""),
             "Parameters": r.get("parameters", ""),
             "Score": r["average_score"],
             "Tier": score_to_tier(r["average_score"]),
 def build_leaderboard_display() -> pd.DataFrame:
     if LEADERBOARD_DF.empty:
         return pd.DataFrame()
+    df = LEADERBOARD_DF[["Rank", "Model", "Provider", "Eval", "Parameters", "Score", "Tier"]].copy()
     df["Score"] = df["Score"].apply(lambda x: f"**{x:.2f}**")
     df["Tier"] = df["Tier"].apply(lambda t: f"**{t}**")
     return df
         with gr.TabItem("Leaderboard", id=0):
             gr.Dataframe(
                 value=DISPLAY_DF,
+                datatype=["number", "markdown", "str", "str", "str", "markdown", "markdown"],
                 interactive=False,
                 wrap=True,
                 show_search="filter",
+                column_widths=[60, 250, 130, 110, 80, 90, 60],
             )
         # ── Tab 2: Skills Breakdown ──────────────────────────────────────

results/allam-7b-instruct.json CHANGED Viewed

@@ -1,7 +1,8 @@
 {
   "model_name": "ALLaM-7B-Instruct",
   "model_id": "humain-ai/ALLaM-7B-Instruct-preview",
-  "provider": "Humain (STC)",
   "size_category": "Small",
   "parameters": "7B",
   "open_source": true,

 {
   "model_name": "ALLaM-7B-Instruct",
   "model_id": "humain-ai/ALLaM-7B-Instruct-preview",
+  "provider": "Humain",
+  "eval_method": "HuggingFace",
   "size_category": "Small",
   "parameters": "7B",
   "open_source": true,

results/nuha_llama-3.3-70b-versatile.json CHANGED Viewed

@@ -1,7 +1,8 @@
 {
   "model_name": "Nuha (llama-3.3-70b-versatile)",
   "model_id": "llama-3.3-70b-versatile",
-  "provider": "Nuha API (Elm)",
   "size_category": "Large",
   "parameters": "70B",
   "open_source": true,

 {
   "model_name": "Nuha (llama-3.3-70b-versatile)",
   "model_id": "llama-3.3-70b-versatile",
+  "provider": "Nuha API",
+  "eval_method": "API",
   "size_category": "Large",
   "parameters": "70B",
   "open_source": true,