Danish Benchmarks

updated Feb 15

Benchmarks for evaluating Danish Models.

Running

8

EuroEval Leaderboard

📊

8

The robust European language model benchmark.

Note The de-facto benchmark for generative language models (NLG) and encoders such as BERT using Natural language understanding tasks (NLU).
ScandEval: A Benchmark for Scandinavian Natural Language Processing

Paper • 2304.00906 • Published Apr 3, 2023 • 4

Note Evaluate Scandinavian models for natural language generation (NLG) and natural language understanding (NLU). Later renamed to EuroEval and expanded to European languages
Running on CPU Upgrade

7.43k

MTEB Leaderboard

🥇

7.43k

Embedding Leaderboard

Note The de-facto leaderboard for evaluating Embeddings and search systems like BM25 and similar. Includes benchmarks targeting multiple modalities and languages, notably including a benchmark for Scandinavian languages.
The Scandinavian Embedding Benchmarks: Comprehensive Assessment of Multilingual and Monolingual Text Embedding

Paper • 2406.02396 • Published Jun 4, 2024

Note Evaluated for embeddings models, e.g. used for retrieval e.g. within retrieval augmented generation, classification such setfit models, clustering and more. It evaluated models on a representative set of tasks covering Danish, Swedish, and Norwegian (Nynorsk and Norwegian).
MMTEB: Massive Multilingual Text Embedding Benchmark

Paper • 2502.13595 • Published Feb 19, 2025 • 49