Running on CPU Upgrade 14k Open LLM Leaderboard 🏆 14k Track, rank and evaluate open LLMs and chatbots
Paused Agents 29 MT Bench PL 📊 29 Przeglądaj i porównuj odpowiedzi modeli językowych w języku polskim
Running 40 Polish Information Retrieval Benchmark (PIRB) 📈 40 View evaluation results on an interactive leaderboard
Running on CPU Upgrade Agents 78 Open PL LLM Leaderboard 🏆 78 Explore LLM benchmark leaderboard with searchable filters