Spaces:

facebook
/

bouquet

Running

App Files Files Community

David Dale commited on Nov 8, 2025

Commit

1d0b778

1 Parent(s): f7ac4d6

early column rename

Browse files

Files changed (1) hide show

leaderboard.py +7 -6

leaderboard.py CHANGED Viewed

@@ -34,8 +34,9 @@ Descriptions of the implementation of the systems will come out later.
 def leaderboard_tab():
     stats = pd.read_csv("data/benchmark_stats.tsv", sep="\t", quoting=csv.QUOTE_NONE)
-    metrics = ['score_metricx_both', 'score_xcomet_both', 'score_CHRFpp', 'score_glotlid_ref']
     systems = sorted(set(stats["system"]))
     ALL = "ALL"
     MEAN = "Average"
@@ -73,7 +74,7 @@ def leaderboard_tab():
                 filtered = filtered[filtered["src_lang"].eq(src_lang)]
             if tgt_lang != ALL:
                 filtered = filtered[filtered["tgt_lang"].eq(tgt_lang)]
-            means = filtered.groupby(['system'])[metrics].mean().reset_index().sort_values('score_metricx_both')
             means.columns = [strip_colname(c) for c in means.columns]
             styler = means.style.background_gradient().format(precision=4)
             return styler
@@ -106,7 +107,7 @@ def leaderboard_tab():
         gr.Markdown("## Languages difficulty")
         gr_system = gr.Dropdown([MEAN] + systems, value=MEAN, label="Translation system")
         gr_direction = gr.Dropdown([XX2EN, EN2XX], value=XX2EN, label="Translation direction")
-        gr_metric = gr.Dropdown(metrics, label="Quality metric", value="score_metricx_both")
         bar_controls = [gr_system, gr_direction, gr_metric]
         def get_hist(system, direction, metric):
@@ -125,12 +126,12 @@ def leaderboard_tab():
             # Compute the means and update the plot
             means = subset.groupby(lang_col)[metric].mean().sort_values(
-                ascending=(metric=="score_metricx_both")
             )
             means = means.to_frame().reset_index()
             return gr.update(
-                value=means, x=lang_col, y=metric, caption=metric, x_label_angle=-90,
-                height=300,
                 sort="y",
             )

 def leaderboard_tab():
     stats = pd.read_csv("data/benchmark_stats.tsv", sep="\t", quoting=csv.QUOTE_NONE)
+    stats.columns = [strip_colname(c) for c in stats.columns]
+    metrics = ['metricx_both', 'xcomet_both', 'CHRFpp', 'glotlid_ref']
     systems = sorted(set(stats["system"]))
     ALL = "ALL"
     MEAN = "Average"
                 filtered = filtered[filtered["src_lang"].eq(src_lang)]
             if tgt_lang != ALL:
                 filtered = filtered[filtered["tgt_lang"].eq(tgt_lang)]
+            means = filtered.groupby(['system'])[metrics].mean().reset_index().sort_values('metricx_both')
             means.columns = [strip_colname(c) for c in means.columns]
             styler = means.style.background_gradient().format(precision=4)
             return styler
         gr.Markdown("## Languages difficulty")
         gr_system = gr.Dropdown([MEAN] + systems, value=MEAN, label="Translation system")
         gr_direction = gr.Dropdown([XX2EN, EN2XX], value=XX2EN, label="Translation direction")
+        gr_metric = gr.Dropdown(metrics, label="Quality metric", value="metricx_both")
         bar_controls = [gr_system, gr_direction, gr_metric]
         def get_hist(system, direction, metric):
             # Compute the means and update the plot
             means = subset.groupby(lang_col)[metric].mean().sort_values(
+                ascending=(metric=="metricx_both")
             )
             means = means.to_frame().reset_index()
             return gr.update(
+                value=means, x=lang_col, y=metric, x_label_angle=-90,
+                height=500,
                 sort="y",
             )