Spaces:

open-llm-leaderboard
/

comparator

Running on CPU Upgrade

albertvillanova HF Staff commited on Oct 11, 2024

Commit

524e209

verified ·

1 Parent(s): a4b20f4

Remove ARC task

Files changed (1) hide show

src/constants.py CHANGED Viewed

@@ -14,7 +14,7 @@ RESULTS_DATASET_ID = "datasets/open-llm-leaderboard/results"
 DETAILS_DATASET_ID = "datasets/open-llm-leaderboard/{model_name_sanitized}-details"
 DETAILS_FILENAME = "samples_{subtask}_*.json"
 TASKS = {
-    "leaderboard_arc_challenge": ("ARC", "leaderboard_arc_challenge"),
     "leaderboard_bbh": ("BBH", "leaderboard_bbh"),
     "leaderboard_gpqa": ("GPQA", "leaderboard_gpqa"),
     "leaderboard_ifeval": ("IFEval", "leaderboard_ifeval"),
@@ -23,7 +23,7 @@ TASKS = {
     "leaderboard_musr": ("MuSR", "leaderboard_musr"),
 }
 SUBTASKS = {
-    "leaderboard_arc_challenge": ["leaderboard_arc_challenge"],
     "leaderboard_bbh": [
         "leaderboard_bbh_boolean_expressions",
         "leaderboard_bbh_causal_judgement",

 DETAILS_DATASET_ID = "datasets/open-llm-leaderboard/{model_name_sanitized}-details"
 DETAILS_FILENAME = "samples_{subtask}_*.json"
 TASKS = {
+    # "leaderboard_arc_challenge": ("ARC", "leaderboard_arc_challenge"),
     "leaderboard_bbh": ("BBH", "leaderboard_bbh"),
     "leaderboard_gpqa": ("GPQA", "leaderboard_gpqa"),
     "leaderboard_ifeval": ("IFEval", "leaderboard_ifeval"),
     "leaderboard_musr": ("MuSR", "leaderboard_musr"),
 }
 SUBTASKS = {
+    # "leaderboard_arc_challenge": ["leaderboard_arc_challenge"],
     "leaderboard_bbh": [
         "leaderboard_bbh_boolean_expressions",
         "leaderboard_bbh_causal_judgement",