Paused Agents 29 MT Bench PL 📊 29 Przeglądaj i porównuj odpowiedzi modeli językowych w języku polskim
Running 40 Polish Information Retrieval Benchmark (PIRB) 📈 40 View evaluation results on an interactive leaderboard