openchat-3.5-0106_eval / llmtf_eval_k1 /evaluation_results.txt
RefalMachine's picture
Upload folder using huggingface_hub
ac85578 verified
mean daru/treewayabstractive daru/treewayextractive darumeru/MultiQ darumeru/PARus darumeru/RCB darumeru/RWSD darumeru/USE darumeru/cp_para_en darumeru/cp_para_ru darumeru/cp_sent_en darumeru/cp_sent_ru darumeru/ruMMLU darumeru/ruOpenBookQA darumeru/ruTiE darumeru/ruWorldTree nlpcoreteam/enMMLU nlpcoreteam/ruMMLU russiannlp/rucola_custom
0.631 0.243 0.404 0.515 0.840 0.481 0.583 0.089 0.975 0.900 0.999 0.998 0.481 0.742 0.540 0.866 0.650 0.519 0.528