CAIA-Benchmark-Leaderboard

Runtime error

zhejianzhang commited on Jun 17, 2025

Commit

b72feb2

1 Parent(s): 1ea2007

bugfix

Files changed (1) hide show

app.py CHANGED Viewed

@@ -46,10 +46,10 @@ LOCAL_DEBUG=False
 TYPES = ["markdown", "number", "number", "number", "number", "str", "str", "str"]
-benchmark_internal_evaluate_dataset = load_dataset(INTERNAL_DATASET, data_files=BENCHMARK_INTERNAL_EVALUATE_DATASET_FILE, token=TOKEN, verification_mode=VerificationMode.NO_CHECKS, download_mode="force_redownload",trust_remote_code=True)
 print(EVALUATE_RESULT_DATASET_FILE)
-eval_results = load_dataset(EVALUATE_RESULT_DATASET, data_files=EVALUATE_RESULT_DATASET_FILE, token=TOKEN, verification_mode=VerificationMode.NO_CHECKS, download_mode="force_redownload",trust_remote_code=True)
 benchmark_dataset = parse_eval_dataset(benchmark_internal_evaluate_dataset) # type: ignore

 TYPES = ["markdown", "number", "number", "number", "number", "str", "str", "str"]
+benchmark_internal_evaluate_dataset = load_dataset(INTERNAL_DATASET, data_files=BENCHMARK_INTERNAL_EVALUATE_DATASET_FILE, token=TOKEN, verification_mode=VerificationMode.NO_CHECKS, download_mode="reuse_cache_if_exists",trust_remote_code=True)
 print(EVALUATE_RESULT_DATASET_FILE)
+eval_results = load_dataset(EVALUATE_RESULT_DATASET, data_files=EVALUATE_RESULT_DATASET_FILE, token=TOKEN, verification_mode=VerificationMode.NO_CHECKS, download_mode="reuse_cache_if_exists",trust_remote_code=True)
 benchmark_dataset = parse_eval_dataset(benchmark_internal_evaluate_dataset) # type: ignore