benchmark lmlmcat/cmmlu Updated Jul 13, 2023 β’ 11.3k β’ 74 nlp-waseda/JMMLU Updated Feb 27, 2024 β’ 321 β’ 11 HAERAE-HUB/KMMLU Viewer β’ Updated Mar 5, 2024 β’ 244k β’ 6.22k β’ 96 openai/openai_humaneval Viewer β’ Updated Jan 4, 2024 β’ 164 β’ 148k β’ 364
benchmark lmlmcat/cmmlu Updated Jul 13, 2023 β’ 11.3k β’ 74 nlp-waseda/JMMLU Updated Feb 27, 2024 β’ 321 β’ 11 HAERAE-HUB/KMMLU Viewer β’ Updated Mar 5, 2024 β’ 244k β’ 6.22k β’ 96 openai/openai_humaneval Viewer β’ Updated Jan 4, 2024 β’ 164 β’ 148k β’ 364