Open-Financial-LLM-Leaderboard

Running

App Files Files Community

mirageco commited on Feb 4

Commit

657779b

1 Parent(s): b75c9db

Fix: Openness display, Average Score calc, Column order/headers/sorting, Horizontal scroll

Browse files

Files changed (5) hide show

frontend/src/pages/LeaderboardPage/components/Leaderboard/components/Table/Table.js +27 -39
frontend/src/pages/LeaderboardPage/components/Leaderboard/constants/defaults.js +6 -0
frontend/src/pages/LeaderboardPage/components/Leaderboard/constants/modelOpenness.js +14 -2
frontend/src/pages/LeaderboardPage/components/Leaderboard/hooks/useDataUtils.js +40 -4
frontend/src/pages/LeaderboardPage/components/Leaderboard/utils/columnUtils.js +44 -3

frontend/src/pages/LeaderboardPage/components/Leaderboard/components/Table/Table.js CHANGED Viewed

@@ -297,7 +297,7 @@ const LeaderboardTable = ({
   const paddingBottom =
     virtualRows.length > 0
       ? unpinnedRows.length * currentRowHeight -
-        virtualRows[virtualRows.length - 1].end
       : 0;
   // Handle column reset
@@ -402,8 +402,8 @@ const LeaderboardTable = ({
           backgroundColor: isSticky
             ? theme.palette.background.paper
             : (sortedIndex + 1) % 2 === 0
-            ? "transparent"
-            : alpha(theme.palette.mode === "dark" ? "#fff" : "#000", 0.02),
           position: isSticky ? "sticky" : "relative",
           top: isSticky
             ? `${headerHeight + stickyIndex * currentRowHeight}px`
@@ -411,24 +411,24 @@ const LeaderboardTable = ({
           zIndex: isSticky ? 2 : 1,
           boxShadow: isSticky
             ? `0 1px 1px ${alpha(
-                theme.palette.common.black,
-                theme.palette.mode === "dark" ? 0.1 : 0.05
-              )}`
             : "none",
           "&::after": isSticky
             ? {
-                content: '""',
-                position: "absolute",
-                left: 0,
-                right: 0,
-                height: "1px",
-                bottom: -1,
-                backgroundColor: alpha(
-                  theme.palette.divider,
-                  theme.palette.mode === "dark" ? 0.1 : 0.2
-                ),
-                zIndex: 1,
-              }
             : {},
         })}
       >
@@ -596,35 +596,23 @@ const LeaderboardTable = ({
           <Table
             sx={{
               margin: 0,
-              width: "100%",
               borderCollapse: "separate",
               borderSpacing: 0,
-              tableLayout: pinnedRows.length > 0 ? "fixed" : "fixed",
               border: "none",
-              "& td, & th":
-                pinnedRows.length > 0
-                  ? {
-                      width: `${100 / table.getAllColumns().length}%`,
-                    }
-                  : {},
             }}
           >
             <colgroup>
-              {table.getAllColumns().map((column, index) => (
                 <col
                   key={column.id}
-                  style={
-                    index < 4
-                      ? {
-                          width: column.columnDef.size,
-                          minWidth: column.columnDef.size,
-                          maxWidth: column.columnDef.size,
-                        }
-                      : {
-                          minWidth: column.columnDef.size,
-                          width: `${100 / (table.getAllColumns().length - 4)}%`,
-                        }
-                  }
                 />
               ))}
             </colgroup>

   const paddingBottom =
     virtualRows.length > 0
       ? unpinnedRows.length * currentRowHeight -
+      virtualRows[virtualRows.length - 1].end
       : 0;
   // Handle column reset
           backgroundColor: isSticky
             ? theme.palette.background.paper
             : (sortedIndex + 1) % 2 === 0
+              ? "transparent"
+              : alpha(theme.palette.mode === "dark" ? "#fff" : "#000", 0.02),
           position: isSticky ? "sticky" : "relative",
           top: isSticky
             ? `${headerHeight + stickyIndex * currentRowHeight}px`
           zIndex: isSticky ? 2 : 1,
           boxShadow: isSticky
             ? `0 1px 1px ${alpha(
+              theme.palette.common.black,
+              theme.palette.mode === "dark" ? 0.1 : 0.05
+            )}`
             : "none",
           "&::after": isSticky
             ? {
+              content: '""',
+              position: "absolute",
+              left: 0,
+              right: 0,
+              height: "1px",
+              bottom: -1,
+              backgroundColor: alpha(
+                theme.palette.divider,
+                theme.palette.mode === "dark" ? 0.1 : 0.2
+              ),
+              zIndex: 1,
+            }
             : {},
         })}
       >
           <Table
             sx={{
               margin: 0,
+              width: "max-content",
+              minWidth: "100%",
               borderCollapse: "separate",
               borderSpacing: 0,
+              tableLayout: "fixed",
               border: "none",
             }}
           >
             <colgroup>
+              {table.getAllColumns().map((column) => (
                 <col
                   key={column.id}
+                  style={{
+                    width: column.columnDef.size,
+                    minWidth: column.columnDef.size,
+                    maxWidth: column.columnDef.size,
+                  }}
                 />
               ))}
             </colgroup>

frontend/src/pages/LeaderboardPage/components/Leaderboard/constants/defaults.js CHANGED Viewed

@@ -145,6 +145,12 @@ const COLUMNS = {
       defaultVisible: true,
       label: "Greek Financial LLM Leaderboard",
     },
   },
   MODEL_INFO: {
     "metadata.co2_cost": {

       defaultVisible: true,
       label: "Greek Financial LLM Leaderboard",
     },
+    "evaluations.bloomberggpt": {
+      group: "evaluation",
+      size: COLUMN_SIZES.BENCHMARK,
+      defaultVisible: true,
+      label: "BloombergGPT",
+    },
   },
   MODEL_INFO: {
     "metadata.co2_cost": {

frontend/src/pages/LeaderboardPage/components/Leaderboard/constants/modelOpenness.js CHANGED Viewed

@@ -1,6 +1,6 @@
 export const MODEL_OPENNESS = {
-    "GPT-4o": "Unclassified",
-    "o3-Mini": "Unclassified",
     "Deepseek-V3": "Class III-Open Model",
     "meta-llama/Llama-4-Scout-17B-16E-Instruct": "Class III-Open Model",
     "meta-llama/Llama-3.1-70B-Instruct": "Class III-Open Model",
@@ -11,8 +11,20 @@ export const MODEL_OPENNESS = {
     "TheFinAI/finma-7b-full": "Class III-Open Model",
     "Duxiaoman-DI/Llama3.1-XuanYuan-FinX1-Preview": "Class III-Open Model",
     "cyberagent/DeepSeek-R1-Distill-Qwen-32B-Japanese": "Class III-Open Model",
     "TheFinAI/FinMA-ES-Bilingual": "Class III-Open Model",
     "TheFinAI/plutus-8B-instruct": "Class III-Open Model",
     "Qwen-VL-MAX": "Class III-Open Model",
     "LLaVA-1.6 Vicuna-13B": "Class III-Open Model",
     "Deepseek-VL-7B-Chat": "Class III-Open Model",

 export const MODEL_OPENNESS = {
+    "GPT-4o": "Closed",
+    "o3-Mini": "Closed",
     "Deepseek-V3": "Class III-Open Model",
     "meta-llama/Llama-4-Scout-17B-16E-Instruct": "Class III-Open Model",
     "meta-llama/Llama-3.1-70B-Instruct": "Class III-Open Model",
     "TheFinAI/finma-7b-full": "Class III-Open Model",
     "Duxiaoman-DI/Llama3.1-XuanYuan-FinX1-Preview": "Class III-Open Model",
     "cyberagent/DeepSeek-R1-Distill-Qwen-32B-Japanese": "Class III-Open Model",
+    "Trelis/Trelis-Function-Calling-V3-7B": "Class III-Open Model",
+    "Trelis/Trelis-Function-Calling-V4-7B": "Class III-Open Model",
     "TheFinAI/FinMA-ES-Bilingual": "Class III-Open Model",
     "TheFinAI/plutus-8B-instruct": "Class III-Open Model",
+    // BloombergGPT Dataset models - 按 MOF 标准分类
+    // Closed: 闭源商业模型
+    "GPT-5": "Closed",
+    "o3": "Closed",
+    "Gemini 2.5 Flash": "Closed",
+    "Grok4": "Closed",
+    "Claude 4 Sonnet": "Closed",
+    // Class III – Open Model: 开放模型架构、参数、技术报告、评估结果等
+    "Llama-3.1-8B-Instruct": "Class III-Open Model",
+    "DeepSeek Chat": "Class III-Open Model",
     "Qwen-VL-MAX": "Class III-Open Model",
     "LLaVA-1.6 Vicuna-13B": "Class III-Open Model",
     "Deepseek-VL-7B-Chat": "Class III-Open Model",

frontend/src/pages/LeaderboardPage/components/Leaderboard/hooks/useDataUtils.js CHANGED Viewed

@@ -88,6 +88,13 @@ const HARDCODED_SCORES = {
     "TheFinAI/FinMA-ES-Bilingual": 0.35, "TheFinAI/plutus-8B-instruct": 7.24, "Qwen-VL-MAX": 0.00,
     "LLaVA-1.6 Vicuna-13B": 0.00, "Deepseek-VL-7B-Chat": 0.00, "Whisper-V3": 0.00, "Qwen2-Audio-7B": 0.00,
     "Qwen2-Audio-7B-Instruct": 0.00, "SALMONN-7B": 0.00, "SALMONN-13B": 0.00
   }
 };
@@ -127,6 +134,29 @@ export const useColorGenerator = (minAverage, maxAverage) => {
   }, [minAverage, maxAverage]);
 };
 // Process data with boolean standardization
 export const useProcessedData = (data, averageMode, visibleColumns) => {
   return useMemo(() => {
@@ -154,12 +184,17 @@ export const useProcessedData = (data, averageMode, visibleColumns) => {
         spanish_average: getHardcodedScore(modelName, 'spanish'),
         greek_average: getHardcodedScore(modelName, 'greek'),
         bilingual_average: getHardcodedScore(modelName, 'bilingual'),
-        multilingual_average: getHardcodedScore(modelName, 'multilingual')
       };
-      // 计算总平均分（包含分数为0的类别）
-      const scores = Object.values(hardcodedEvaluations).filter(score => score !== null);
-      const averageScore = scores.length > 0 ? scores.reduce((a, b) => a + b, 0) / scores.length : null;
       // 创建模型数据
       modelList.push({
@@ -168,6 +203,7 @@ export const useProcessedData = (data, averageMode, visibleColumns) => {
           name: modelName,
           average_score: averageScore,
           type: "chat", // 统一设为chat类型
         },
         evaluations: hardcodedEvaluations,
         features: {

     "TheFinAI/FinMA-ES-Bilingual": 0.35, "TheFinAI/plutus-8B-instruct": 7.24, "Qwen-VL-MAX": 0.00,
     "LLaVA-1.6 Vicuna-13B": 0.00, "Deepseek-VL-7B-Chat": 0.00, "Whisper-V3": 0.00, "Qwen2-Audio-7B": 0.00,
     "Qwen2-Audio-7B-Instruct": 0.00, "SALMONN-7B": 0.00, "SALMONN-13B": 0.00
+  },
+  // BloombergGPT Dataset Leaderboard 平均分
+  bloomberggpt: {
+    "GPT-4o": 83.25, "GPT-5": 81.92, "o3-mini": 81.24, "o3": 81.28,
+    "Gemini 2.5 Flash": 80.88, "Grok4": 79.33, "Claude 4 Sonnet": 79.50,
+    "Llama-3.1-8B-Instruct": 77.75, "meta-llama/Llama-3.1-70B-Instruct": 77.75,
+    "DeepSeek Chat": 77.13, "Deepseek-V3": 77.13
   }
 };
   }, [minAverage, maxAverage]);
 };
+// Openness data from BloombergGPT Dataset Leaderboard
+const MODEL_OPENNESS = {
+  // BloombergGPT Dataset models - 按 MOF 标准分类
+  // Closed: 闭源商业模型
+  "GPT-4o": "Closed",
+  "GPT-5": "Closed",
+  "o3-mini": "Closed",
+  "o3": "Closed",
+  "Gemini 2.5 Flash": "Closed",
+  "Grok4": "Closed",
+  "Claude 4 Sonnet": "Closed",
+  // Class III – Open Model: 开放模型架构、参数、技术报告、评估结果等
+  "Llama-3.1-8B-Instruct": "Class III-Open Model",
+  "DeepSeek Chat": "Class III-Open Model",
+  "Deepseek-V3": "Class III-Open Model", // Map Deepseek-V3 to DeepSeek Chat's classification
+  "Llama-3.1-70B-Instruct": "Class III-Open Model",
+  "meta-llama/Llama-3.1-70B-Instruct": "Class III-Open Model",
+};
+const getModelOpenness = (modelName) => {
+  return MODEL_OPENNESS[modelName] || "Unclassified";
+};
 // Process data with boolean standardization
 export const useProcessedData = (data, averageMode, visibleColumns) => {
   return useMemo(() => {
         spanish_average: getHardcodedScore(modelName, 'spanish'),
         greek_average: getHardcodedScore(modelName, 'greek'),
         bilingual_average: getHardcodedScore(modelName, 'bilingual'),
+        multilingual_average: getHardcodedScore(modelName, 'multilingual'),
+        bloomberggpt: getHardcodedScore(modelName, 'bloomberggpt')
       };
+      // 计算总平均分（缺失值视为0，分母为类别总数）
+      const totalScore = Object.values(hardcodedEvaluations).reduce((acc, score) => acc + (score || 0), 0);
+      const categoryCount = Object.keys(hardcodedEvaluations).length; // 应该是 10
+      const averageScore = totalScore / categoryCount;
+      // 获取Openness
+      const openness = getModelOpenness(modelName);
       // 创建模型数据
       modelList.push({
           name: modelName,
           average_score: averageScore,
           type: "chat", // 统一设为chat类型
+          openness: openness, // 添加 openness
         },
         evaluations: hardcodedEvaluations,
         features: {

frontend/src/pages/LeaderboardPage/components/Leaderboard/utils/columnUtils.js CHANGED Viewed

@@ -20,6 +20,18 @@ import OpenInNewIcon from "@mui/icons-material/OpenInNew";
 import { alpha } from "@mui/material/styles";
 import InfoIconWithTooltip from "../../../../../components/shared/InfoIconWithTooltip";
 const DatabaseIcon = () => (
   <svg
     className="mr-1.5 text-gray-400 group-hover:text-red-500"
@@ -452,7 +464,7 @@ const createGreekLeaderboardHeader = (header) => (
     }}
   >
     <HeaderLabel
-      label="Greek Financial LLM Leaderboard"
       tooltip="Average performance on Greek financial tasks"
       className="header-label"
       isSorted={header?.column?.getIsSorted()}
@@ -511,7 +523,7 @@ const createLeaderboardHeader = (label, tooltip, linkUrl) => (header) => (
     }}
   >
     <HeaderLabel
-      label={`${label} Leaderboard`}
       tooltip={tooltip}
       className="header-label"
       isSorted={header?.column?.getIsSorted()}
@@ -837,6 +849,7 @@ export const createColumns = (
     {
       accessorKey: "model.average_score",
       header: createHeaderCell("Average", COLUMN_TOOLTIPS.AVERAGE),
       cell: ({ row, getValue }) =>
         createScoreCell(getValue, row, "model.average_score"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"],
@@ -1014,8 +1027,27 @@ export const createColumns = (
   };
   const evaluationColumns = [
     ...(showGreek ? [{
       accessorKey: "evaluations.greek_average",
       header: createGreekLeaderboardHeader,
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.greek_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
@@ -1033,6 +1065,7 @@ export const createColumns = (
     }] : []),
     {
       accessorKey: "evaluations.vision_average",
       header: createLeaderboardHeader("Vision", "Average performance on vision tasks", null),
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.vision_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
@@ -1050,6 +1083,7 @@ export const createColumns = (
     },
     {
       accessorKey: "evaluations.audio_average",
       header: createLeaderboardHeader("Audio", "Average performance on audio tasks", null),
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.audio_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
@@ -1067,6 +1101,7 @@ export const createColumns = (
     },
     {
       accessorKey: "evaluations.english_average",
       header: createLeaderboardHeader("English", "Average performance on English language tasks", null),
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.english_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
@@ -1084,6 +1119,7 @@ export const createColumns = (
     },
     {
       accessorKey: "evaluations.chinese_average",
       header: createLeaderboardHeader("Chinese", "Average performance on Chinese language tasks", null),
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.chinese_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
@@ -1101,6 +1137,7 @@ export const createColumns = (
     },
     {
       accessorKey: "evaluations.japanese_average",
       header: createLeaderboardHeader("Japanese", "Average performance on Japanese language tasks", null),
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.japanese_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
@@ -1118,6 +1155,7 @@ export const createColumns = (
     },
     {
       accessorKey: "evaluations.spanish_average",
       header: createLeaderboardHeader("Spanish", "Average performance on Spanish language tasks", null),
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.spanish_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
@@ -1135,6 +1173,7 @@ export const createColumns = (
     },
     {
       accessorKey: "evaluations.bilingual_average",
       header: createLeaderboardHeader("Bilingual", "Average performance on bilingual tasks", null),
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.bilingual_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
@@ -1152,6 +1191,7 @@ export const createColumns = (
     },
     {
       accessorKey: "evaluations.multilingual_average",
       header: createLeaderboardHeader("Multilingual", "Average performance on multilingual tasks", null),
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.multilingual_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
@@ -1166,7 +1206,8 @@ export const createColumns = (
           backgroundColor: (theme) => alpha(theme.palette.secondary.main, 0.05),
         }),
       },
-    }
   ];
   const optionalColumns = [

 import { alpha } from "@mui/material/styles";
 import InfoIconWithTooltip from "../../../../../components/shared/InfoIconWithTooltip";
+// Custom sorting function for scores handling nulls
+const scoreSort = (rowA, rowB, columnId) => {
+  const a = rowA.getValue(columnId);
+  const b = rowB.getValue(columnId);
+  // Treat null/undefined as -Infinity so they appear last in descending sort
+  const valA = (a === null || a === undefined) ? -Infinity : Number(a);
+  const valB = (b === null || b === undefined) ? -Infinity : Number(b);
+  return valA < valB ? -1 : valA > valB ? 1 : 0;
+};
 const DatabaseIcon = () => (
   <svg
     className="mr-1.5 text-gray-400 group-hover:text-red-500"
     }}
   >
     <HeaderLabel
+      label="Greek"
       tooltip="Average performance on Greek financial tasks"
       className="header-label"
       isSorted={header?.column?.getIsSorted()}
     }}
   >
     <HeaderLabel
+      label={label}
       tooltip={tooltip}
       className="header-label"
       isSorted={header?.column?.getIsSorted()}
     {
       accessorKey: "model.average_score",
       header: createHeaderCell("Average", COLUMN_TOOLTIPS.AVERAGE),
+      sortingFn: scoreSort,
       cell: ({ row, getValue }) =>
         createScoreCell(getValue, row, "model.average_score"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"],
   };
   const evaluationColumns = [
+    {
+      accessorKey: "evaluations.bloomberggpt",
+      sortingFn: scoreSort,
+      header: createLeaderboardHeader("BloombergGPT", "BloombergGPT Dataset Leaderboard - Financial sentiment analysis", "https://huggingface.co/spaces/mirageco/BloombergGPT-Dataset-Leaderboard"),
+      cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.bloomberggpt"),
+      size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
+      meta: {
+        headerStyle: {
+          backgroundColor: (theme) => alpha(theme.palette.success.main, 0.08),
+        },
+        cellStyle: (value) => ({
+          position: "relative",
+          overflow: "hidden",
+          padding: "8px 16px",
+          backgroundColor: (theme) => alpha(theme.palette.success.main, 0.08),
+        }),
+      },
+    },
     ...(showGreek ? [{
       accessorKey: "evaluations.greek_average",
+      sortingFn: scoreSort,
       header: createGreekLeaderboardHeader,
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.greek_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
     }] : []),
     {
       accessorKey: "evaluations.vision_average",
+      sortingFn: scoreSort,
       header: createLeaderboardHeader("Vision", "Average performance on vision tasks", null),
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.vision_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
     },
     {
       accessorKey: "evaluations.audio_average",
+      sortingFn: scoreSort,
       header: createLeaderboardHeader("Audio", "Average performance on audio tasks", null),
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.audio_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
     },
     {
       accessorKey: "evaluations.english_average",
+      sortingFn: scoreSort,
       header: createLeaderboardHeader("English", "Average performance on English language tasks", null),
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.english_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
     },
     {
       accessorKey: "evaluations.chinese_average",
+      sortingFn: scoreSort,
       header: createLeaderboardHeader("Chinese", "Average performance on Chinese language tasks", null),
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.chinese_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
     },
     {
       accessorKey: "evaluations.japanese_average",
+      sortingFn: scoreSort,
       header: createLeaderboardHeader("Japanese", "Average performance on Japanese language tasks", null),
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.japanese_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
     },
     {
       accessorKey: "evaluations.spanish_average",
+      sortingFn: scoreSort,
       header: createLeaderboardHeader("Spanish", "Average performance on Spanish language tasks", null),
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.spanish_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
     },
     {
       accessorKey: "evaluations.bilingual_average",
+      sortingFn: scoreSort,
       header: createLeaderboardHeader("Bilingual", "Average performance on bilingual tasks", null),
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.bilingual_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
     },
     {
       accessorKey: "evaluations.multilingual_average",
+      sortingFn: scoreSort,
       header: createLeaderboardHeader("Multilingual", "Average performance on multilingual tasks", null),
       cell: ({ row, getValue }) => createScoreCell(getValue, row, "evaluations.multilingual_average"),
       size: TABLE_DEFAULTS.COLUMNS.COLUMN_SIZES["model.average_score"] || 100,
           backgroundColor: (theme) => alpha(theme.palette.secondary.main, 0.05),
         }),
       },
+    },
   ];
   const optionalColumns = [