SLAVA / Subject.csv
sharafetdinov42's picture
Upload 4 files
94df1cf verified
model,RU_adaptation,Access,GEO_num_q_EM,GEO_num_q_CC,GEO_num_q_PM,GEO_open_q_EM,GEO_open_q_F1,GEO_open_q_LR,rank_GEO,GEO_avg,HIST_num_q_EM,HIST_num_q_CC,HIST_num_q_PM,HIST_open_q_EM,HIST_open_q_F1,HIST_open_q_LR,rank_HIST,HIST_avg,SOC_num_q_EM,SOC_num_q_CC,SOC_num_q_PM,SOC_open_q_EM,SOC_open_q_F1,SOC_open_q_LR,rank_SOC,SOC_avg,POL_num_q_EM,POL_num_q_CC,POL_num_q_PM,rank_POL,POL_avg,DOMAIN_avg
Alice AI LLM,RU,API,96.0,96.0,97.0,62.0,73.0,77.0,1.0,83.5,87.0,88.0,90.0,48.0,58.0,70.0,1.0,73.5,92.0,93.0,96.0,95.0,96.0,97.0,1.0,94.83333333333333,64.0,64.0,66.0,14.0,64.66666666666667,81.19047619047619
Gigachat 2 Max,RU,API,93.0,93.0,94.0,61.0,68.0,73.0,2.0,80.33333333333333,84.0,85.0,87.0,43.0,52.0,67.0,2.0,69.66666666666667,88.0,90.0,93.0,92.0,94.0,96.0,2.0,92.16666666666667,71.0,71.0,73.0,8.0,71.66666666666667,79.42857142857143
Gigachat 2 Pro,RU,API,89.0,89.0,90.0,52.0,59.0,70.0,3.0,74.83333333333333,73.0,73.0,78.0,30.0,40.0,57.0,14.0,58.5,86.0,89.0,91.0,79.0,82.0,87.0,5.0,85.66666666666667,71.0,71.0,73.0,8.0,71.66666666666667,72.80952380952381
YandexGPT Pro 5.1,RU,API,93.0,93.0,95.0,17.0,57.0,63.0,4.0,69.66666666666667,83.0,84.0,86.0,26.0,54.0,67.0,3.0,66.66666666666667,92.0,93.0,95.0,53.0,96.0,94.0,4.0,87.16666666666667,60.0,60.0,62.0,18.0,60.66666666666666,72.52380952380952
YandexGPT Pro 5,RU,API,89.0,89.0,92.0,21.0,58.0,65.0,5.0,69.0,77.0,78.0,81.0,26.0,46.0,60.0,13.0,61.33333333333334,89.0,90.0,93.0,79.0,96.0,96.0,3.0,90.5,58.0,58.0,61.0,19.0,59.0,71.52380952380952
Gemini 2.5 Pro,-,API,79.0,80.0,82.0,6.0,71.0,74.0,7.0,65.33333333333333,71.0,71.0,76.0,34.0,56.0,69.0,10.0,62.83333333333334,81.0,85.0,87.0,55.0,83.0,89.0,8.0,80.0,74.0,74.0,76.0,4.0,74.66666666666667,70.14285714285714
Qwen3 Max,-,API,78.0,79.0,81.0,9.0,70.0,74.0,8.0,65.16666666666667,71.0,72.0,76.0,36.0,57.0,70.0,5.0,63.66666666666666,81.0,84.0,87.0,55.0,83.0,89.0,9.0,79.83333333333333,73.0,73.0,75.0,5.0,73.66666666666667,70.14285714285714
GPT 5 mini,-,API,79.0,79.0,82.0,6.0,69.0,72.0,12.0,64.5,71.0,72.0,76.0,34.0,56.0,69.0,9.0,63.0,81.0,84.0,87.0,53.0,83.0,89.0,11.0,79.5,75.0,75.0,78.0,2.0,76.0,70.0
Deepseek R1 0528,-,API,78.0,79.0,81.0,6.0,72.0,74.0,9.0,65.0,70.0,71.0,75.0,37.0,58.0,70.0,6.0,63.5,81.0,84.0,87.0,61.0,80.0,86.0,9.0,79.83333333333333,72.0,72.0,75.0,6.0,73.0,69.95238095238095
Gemini 2.5 Flash,-,API,78.0,79.0,81.0,6.0,71.0,73.0,11.0,64.66666666666667,71.0,72.0,75.0,35.0,56.0,69.0,9.0,63.0,81.0,84.0,87.0,50.0,83.0,88.0,14.0,78.83333333333333,75.0,76.0,78.0,1.0,76.33333333333333,69.9047619047619
Claude Sonnet 4.5,-,API,79.0,79.0,82.0,8.0,69.0,73.0,9.0,65.0,70.0,71.0,75.0,38.0,57.0,69.0,7.0,63.33333333333334,81.0,85.0,88.0,50.0,80.0,86.0,16.0,78.33333333333333,75.0,75.0,77.0,3.0,75.66666666666667,69.85714285714286
GPT 4o mini,-,API,78.0,79.0,82.0,8.0,71.0,74.0,7.0,65.33333333333333,70.0,71.0,75.0,37.0,57.0,70.0,7.0,63.33333333333334,81.0,84.0,87.0,53.0,80.0,86.0,15.0,78.5,74.0,74.0,76.0,4.0,74.66666666666667,69.85714285714286
Mistral Medium 3.1,-,API,78.0,79.0,81.0,5.0,69.0,73.0,14.0,64.16666666666667,71.0,71.0,75.0,33.0,55.0,68.0,12.0,62.16666666666666,82.0,85.0,88.0,53.0,83.0,89.0,8.0,80.0,75.0,75.0,77.0,3.0,75.66666666666667,69.76190476190476
Gemini 2.5 Flash Lite,-,API,78.0,79.0,81.0,5.0,70.0,73.0,13.0,64.33333333333333,71.0,72.0,76.0,37.0,57.0,70.0,4.0,63.83333333333334,81.0,85.0,87.0,53.0,81.0,87.0,13.0,79.0,73.0,73.0,75.0,5.0,73.66666666666667,69.71428571428571
Deepseek Chat V3.1,-,API,77.0,78.0,80.0,3.0,69.0,73.0,16.0,63.33333333333334,70.0,71.0,75.0,36.0,55.0,68.0,11.0,62.5,82.0,85.0,88.0,53.0,82.0,88.0,10.0,79.66666666666667,75.0,75.0,77.0,3.0,75.66666666666667,69.52380952380952
Gemini 3 Pro Preview,-,API,78.0,79.0,81.0,5.0,70.0,73.0,13.0,64.33333333333333,71.0,72.0,76.0,35.0,56.0,69.0,8.0,63.16666666666666,81.0,85.0,87.0,53.0,81.0,87.0,13.0,79.0,73.0,73.0,75.0,5.0,73.66666666666667,69.52380952380952
GPT 5,-,API,78.0,78.0,81.0,8.0,70.0,73.0,11.0,64.66666666666667,70.0,71.0,75.0,35.0,57.0,69.0,10.0,62.83333333333334,81.0,84.0,87.0,58.0,80.0,86.0,12.0,79.33333333333333,72.0,72.0,75.0,6.0,73.0,69.52380952380952
Claude Haiku 4.5,-,API,77.0,78.0,80.0,6.0,69.0,72.0,15.0,63.66666666666666,70.0,71.0,75.0,34.0,55.0,68.0,12.0,62.16666666666666,82.0,85.0,87.0,55.0,81.0,87.0,11.0,79.5,75.0,75.0,77.0,3.0,75.66666666666667,69.47619047619048
Llama 4 Maverick,-,API,79.0,80.0,81.0,5.0,71.0,73.0,10.0,64.83333333333333,70.0,71.0,75.0,35.0,57.0,70.0,9.0,63.0,81.0,84.0,87.0,50.0,78.0,85.0,20.0,77.5,75.0,75.0,77.0,3.0,75.66666666666667,69.47619047619048
Grok 4,-,API,78.0,79.0,81.0,8.0,70.0,73.0,10.0,64.83333333333333,70.0,71.0,75.0,36.0,57.0,70.0,8.0,63.16666666666666,80.0,84.0,87.0,50.0,80.0,86.0,18.0,77.83333333333333,74.0,74.0,76.0,4.0,74.66666666666667,69.47619047619048
Deepseek V3.2 Exp,-,API,77.0,79.0,80.0,5.0,68.0,71.0,16.0,63.33333333333334,71.0,71.0,75.0,36.0,57.0,70.0,7.0,63.33333333333334,81.0,84.0,87.0,53.0,77.0,84.0,19.0,77.66666666666667,75.0,75.0,77.0,3.0,75.66666666666667,69.19047619047619
Deepseek V3.1 Terminus,-,API,77.0,78.0,80.0,5.0,72.0,74.0,13.0,64.33333333333333,71.0,71.0,76.0,33.0,56.0,68.0,11.0,62.5,81.0,84.0,87.0,55.0,77.0,84.0,17.0,78.0,74.0,74.0,76.0,4.0,74.66666666666667,69.19047619047619
Mistral Small3.2:24B Instruct,-,OS,71.0,72.0,75.0,48.0,59.0,68.0,6.0,65.5,60.0,62.0,66.0,35.0,44.0,62.0,16.0,54.83333333333334,75.0,79.0,83.0,89.0,91.0,94.0,6.0,85.16666666666667,72.0,72.0,74.0,7.0,72.66666666666667,69.0952380952381
Grok 4.1 Fast,-,API,77.0,78.0,80.0,6.0,70.0,74.0,14.0,64.16666666666667,70.0,71.0,75.0,34.0,55.0,68.0,12.0,62.16666666666666,81.0,84.0,87.0,50.0,81.0,87.0,16.0,78.33333333333333,72.0,72.0,75.0,6.0,73.0,68.9047619047619
Saiga YandexGPT 8B,RU,OS,68.0,73.0,75.0,39.0,53.0,65.0,19.0,62.16666666666666,57.0,62.0,67.0,39.0,51.0,65.0,15.0,56.83333333333334,68.0,72.0,81.0,82.0,86.0,89.0,10.0,79.66666666666667,66.0,70.0,72.0,11.0,69.33333333333333,66.66666666666667
YandexGPT Lite,RU,API,80.0,80.0,83.0,21.0,52.0,56.0,20.0,62.0,68.0,68.0,73.0,33.0,48.0,61.0,14.0,58.5,79.0,80.0,87.0,74.0,83.0,85.0,7.0,81.33333333333333,60.0,60.0,62.0,18.0,60.66666666666666,66.33333333333333
Vistral 24B Instruct,RU,OS,76.0,78.0,79.0,5.0,56.0,62.0,22.0,59.33333333333334,62.0,65.0,67.0,24.0,38.0,55.0,17.0,51.83333333333334,74.0,80.0,82.0,66.0,81.0,85.0,17.0,78.0,70.0,72.0,72.0,9.0,71.33333333333333,64.23809523809524
Qwen3:30B A3B Instruct,-,OS,79.0,80.0,82.0,33.0,45.0,58.0,17.0,62.83333333333334,57.0,57.0,64.0,17.0,25.0,46.0,20.0,44.33333333333334,74.0,78.0,84.0,74.0,77.0,84.0,15.0,78.5,71.0,71.0,72.0,9.0,71.33333333333333,63.23809523809524
Llama4:17B Scout 16E Instruct,-,OS,50.0,60.0,68.0,33.0,53.0,63.0,24.0,54.5,44.0,49.0,59.0,36.0,48.0,63.0,18.0,49.83333333333334,58.0,61.0,79.0,76.0,83.0,87.0,21.0,74.0,64.0,72.0,75.0,10.0,70.33333333333333,61.0
Gigachat 2,RU,API,66.0,71.0,72.0,39.0,50.0,64.0,21.0,60.33333333333334,50.0,51.0,56.0,24.0,30.0,51.0,21.0,43.66666666666666,73.0,76.0,81.0,61.0,66.0,84.0,22.0,73.5,64.0,64.0,66.0,14.0,64.66666666666667,59.95238095238095
Gemma3:27B It,-,OS,74.0,75.0,77.0,20.0,62.0,68.0,18.0,62.66666666666666,55.0,56.0,61.0,16.0,39.0,56.0,19.0,47.16666666666666,70.0,73.0,80.0,5.0,50.0,66.0,23.0,57.33333333333334,71.0,71.0,73.0,8.0,71.66666666666667,58.0
Gemma3:12B It,-,OS,61.0,61.0,71.0,30.0,52.0,62.0,23.0,56.16666666666666,41.0,42.0,52.0,17.0,30.0,49.0,22.0,38.5,47.0,50.0,77.0,34.0,53.0,68.0,25.0,54.83333333333334,62.0,64.0,65.0,15.0,63.66666666666666,51.80952380952381
Saiga Gemma3 12B,RU,OS,58.0,61.0,65.0,35.0,46.0,57.0,25.0,53.66666666666666,37.0,40.0,47.0,13.0,23.0,43.0,23.0,33.83333333333334,52.0,57.0,74.0,24.0,37.0,61.0,27.0,50.83333333333334,59.0,64.0,63.0,17.0,62.0,48.38095238095238
Ruadaptqwen3 4B Instruct,RU,OS,50.0,53.0,51.0,14.0,24.0,44.0,28.0,39.33333333333334,28.0,31.0,34.0,4.0,11.0,31.0,27.0,23.16666666666667,51.0,64.0,64.0,18.0,48.0,61.0,26.0,51.0,64.0,66.0,67.0,12.0,65.66666666666667,41.80952380952381
OLMo 2 32B Instruct,-,OS,42.0,42.0,54.0,35.0,45.0,58.0,26.0,46.0,26.0,26.0,41.0,9.0,13.0,35.0,24.0,25.0,32.0,33.0,67.0,24.0,29.0,56.0,29.0,40.16666666666666,62.0,62.0,63.0,16.0,62.33333333333334,40.66666666666666
Qwen3:4B Instruct,-,OS,27.0,50.0,55.0,14.0,24.0,40.0,29.0,35.0,21.0,32.0,40.0,1.0,5.0,24.0,29.0,20.5,48.0,59.0,72.0,37.0,57.0,69.0,24.0,57.0,33.0,70.0,72.0,20.0,58.33333333333334,40.47619047619047
Gemma3N:E4B It,-,OS,50.0,52.0,55.0,2.0,34.0,48.0,27.0,40.16666666666666,30.0,32.0,37.0,1.0,15.0,31.0,25.0,24.33333333333333,45.0,54.0,60.0,0.0,33.0,52.0,28.0,40.66666666666666,64.0,65.0,66.0,13.0,65.0,39.33333333333334
Gemma3N:E2B It,-,OS,35.0,36.0,45.0,0.0,23.0,37.0,31.0,29.33333333333333,21.0,21.0,31.0,0.0,11.0,27.0,30.0,18.5,26.0,28.0,55.0,5.0,49.0,60.0,30.0,37.16666666666666,60.0,64.0,63.0,16.0,62.33333333333334,33.19047619047619
Phi4:14B,-,OS,3.0,45.0,70.0,0.0,25.0,36.0,30.0,29.83333333333333,6.0,35.0,59.0,0.0,15.0,27.0,26.0,23.66666666666667,8.0,34.0,78.0,0.0,22.0,33.0,32.0,29.16666666666667,16.0,71.0,70.0,21.0,52.33333333333334,31.09523809523809
Gigachat 20B Instruct,RU,OS,0.0,74.0,67.0,0.0,12.0,19.0,32.0,28.66666666666667,0.0,55.0,52.0,0.0,10.0,18.0,28.0,22.5,0.0,70.0,72.0,0.0,17.0,21.0,31.0,30.0,0.0,78.0,64.0,22.0,47.33333333333334,29.95238095238095
OLMo 3 7B Instruct,-,OS,15.0,16.0,19.0,0.0,2.0,11.0,33.0,10.5,7.0,11.0,15.0,0.0,1.0,14.0,31.0,8.0,11.0,13.0,23.0,0.0,14.0,27.0,33.0,14.66666666666667,37.0,41.0,43.0,23.0,40.33333333333334,15.23809523809524
Magistral:24B Small,-,OS,0.0,0.0,2.0,0.0,1.0,14.0,35.0,2.833333333333333,0.0,2.0,4.0,0.0,1.0,13.0,32.0,3.333333333333333,0.0,0.0,7.0,0.0,7.0,19.0,34.0,5.5,0.0,4.0,1.0,25.0,1.666666666666667,3.571428571428572
OLMo 3 32B Think,-,OS,1.0,1.0,3.0,0.0,1.0,5.0,36.0,1.833333333333333,0.0,2.0,4.0,0.0,0.0,3.0,35.0,1.5,2.0,2.0,9.0,3.0,4.0,6.0,35.0,4.333333333333333,3.0,10.0,5.0,24.0,6.0,3.047619047619047
QVikhr 3 8B Instruction,RU,OS,0.0,0.0,2.0,0.0,1.0,15.0,34.0,3.0,0.0,0.0,4.0,0.0,1.0,12.0,33.0,2.833333333333333,0.0,0.0,7.0,0.0,0.0,15.0,36.0,3.666666666666667,0.0,0.0,1.0,28.0,0.3333333333333333,2.761904761904762
RuadaptQwen3 32B Instruct,RU,OS,0.0,0.0,2.0,0.0,2.0,13.0,35.0,2.833333333333333,0.0,0.0,4.0,0.0,1.0,12.0,33.0,2.833333333333333,0.0,0.0,7.0,0.0,1.0,13.0,37.0,3.5,0.0,1.0,1.0,27.0,0.6666666666666666,2.714285714285714
OLMo 3 7B Think,-,OS,0.0,0.0,2.0,0.0,0.0,8.0,37.0,1.666666666666667,0.0,1.0,4.0,0.0,0.0,8.0,34.0,2.166666666666667,0.0,0.0,7.0,0.0,0.0,3.0,38.0,1.666666666666667,0.0,2.0,1.0,26.0,1.0,1.714285714285714
GPT oss 20B,-,OS,0.0,0.0,2.0,0.0,0.0,0.0,38.0,0.3333333333333333,0.0,0.0,4.0,0.0,0.0,0.0,36.0,0.6666666666666666,0.0,0.0,7.0,0.0,0.0,0.0,39.0,1.166666666666667,0.0,0.0,1.0,28.0,0.3333333333333333,0.6666666666666666
,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
Среднее значение,,,,,,,,,,51.251773049645394,,,,,,,,45.138297872340424,,,,,,,,61.78368794326241,,,,,59.872340425531924,53.74569402228974