Spaces:

JetBrains-Research
/

long-code-arena

Running

saridormi commited on Dec 18, 2023

Commit

aa8b23d

1 Parent(s): adc61b7

Fix metrics formatting and add sorting

Files changed (3) hide show

app.py CHANGED Viewed

@@ -5,18 +5,11 @@ import gradio as gr  # type: ignore[import]
 from apscheduler.schedulers.background import BackgroundScheduler
 from huggingface_hub import HfApi
-from src.content import (
-    INTRODUCTION_TEXT,
-    INTRODUCTION_TITLE,
-    LEADERBOARD_TEXT,
-    LEADERBOARD_TITLE,
-    SUBMISSION_TEXT_FILES,
-    SUBMISSION_TEXT_INTRO,
-    SUBMISSION_TEXT_METADATA,
-    SUBMISSION_TEXT_SUBMIT,
-    SUBMISSION_TEXT_TASK,
-    SUBMISSION_TITLE,
-)
 from src.get_results_for_task import get_results_for_task
 from src.submission_uploader import SubmissionUploader
 from src.tasks import TASKS_DESCRIPTIONS, TASKS_PRETTY, TASKS_PRETTY_REVERSE

 from apscheduler.schedulers.background import BackgroundScheduler
 from huggingface_hub import HfApi
+from src.content import (INTRODUCTION_TEXT, INTRODUCTION_TITLE,
+                         LEADERBOARD_TEXT, LEADERBOARD_TITLE,
+                         SUBMISSION_TEXT_FILES, SUBMISSION_TEXT_INTRO,
+                         SUBMISSION_TEXT_METADATA, SUBMISSION_TEXT_SUBMIT,
+                         SUBMISSION_TEXT_TASK, SUBMISSION_TITLE)
 from src.get_results_for_task import get_results_for_task
 from src.submission_uploader import SubmissionUploader
 from src.tasks import TASKS_DESCRIPTIONS, TASKS_PRETTY, TASKS_PRETTY_REVERSE

src/get_results_for_task.py CHANGED Viewed

@@ -2,9 +2,12 @@ import logging
 import os
 import pandas as pd  # type: ignore[import]
-from datasets import get_dataset_config_names, load_dataset  # type: ignore[import]
-from .leaderboard_formatting import COLUMNS_PRETTY, get_columns_per_task
 from .tasks import TASKS_PRETTY_REVERSE
 AVAILABLE_TASKS = get_dataset_config_names(os.environ["DATASET_ID"])
@@ -48,6 +51,14 @@ def _get_results_dataset(task_id: str) -> pd.DataFrame:
     results_df["Context Size"] = results_df["Context Size"].map(
         lambda x: f"{int(x) // 1000}k" if int(x) >= 1000 else x
     )
     results_df = results_df[get_columns_per_task(task_id)]
     return results_df

 import os
 import pandas as pd  # type: ignore[import]
+from datasets import (get_dataset_config_names,  # type: ignore[import]
+                      load_dataset)
+from .leaderboard_formatting import (COLUMNS_PRETTY, METRICS_PER_TASK,
+                                     SORT_COLUMN_PER_TASK,
+                                     get_columns_per_task)
 from .tasks import TASKS_PRETTY_REVERSE
 AVAILABLE_TASKS = get_dataset_config_names(os.environ["DATASET_ID"])
     results_df["Context Size"] = results_df["Context Size"].map(
         lambda x: f"{int(x) // 1000}k" if int(x) >= 1000 else x
     )
+    results_df = results_df.sort_values(
+        by=SORT_COLUMN_PER_TASK[task_id], ascending=False
+    )
+    for metric_column in METRICS_PER_TASK[task_id]:
+        results_df[metric_column] = results_df[metric_column].map(lambda x: f"{x:.2f}")
     results_df = results_df[get_columns_per_task(task_id)]
     return results_df

src/leaderboard_formatting.py CHANGED Viewed

@@ -29,6 +29,9 @@ METRICS_PER_TASK = {
 }
 def get_columns_per_task(task_id: str) -> List[str]:
     metrics_per_task = METRICS_PER_TASK[task_id]

 }
+SORT_COLUMN_PER_TASK = {"commit_message_generation": "ROUGE-1"}
 def get_columns_per_task(task_id: str) -> List[str]:
     metrics_per_task = METRICS_PER_TASK[task_id]