| { |
| "tasks": { |
| "gsm_hard": { |
| "domain": "math", |
| "selected": { |
| "topk8_global_ridge": [ |
| "multiarith", |
| "math_algebra_easy", |
| "math_counting_easy", |
| "mmlu_elementary_math", |
| "mmlu_high_school_biology", |
| "humaneval", |
| "mmlu_high_school_physics", |
| "mbpp" |
| ], |
| "topk8_pertensor_ridge": [ |
| "multiarith", |
| "math_algebra_easy", |
| "math_counting_easy", |
| "mmlu_elementary_math", |
| "mmlu_high_school_biology", |
| "humaneval", |
| "mmlu_high_school_physics", |
| "mbpp" |
| ] |
| }, |
| "metrics": { |
| "base_Y": 0.056666666666666664, |
| "oracle": 0.07333333333333333, |
| "mean": 0.06333333333333334, |
| "mean__cos": 0.9403474926948547, |
| "global_ridge": 0.05333333333333334, |
| "global_ridge__cos": 0.9845342636108398, |
| "pertensor_ridge": 0.056666666666666664, |
| "pertensor_ridge__cos": 0.981560230255127, |
| "pertensor_pca": 0.05333333333333334, |
| "pertensor_pca__cos": 0.9814527630805969, |
| "pertensor_mlp": 0.06666666666666667, |
| "pertensor_mlp__cos": 0.9654154777526855, |
| "procrustes": 0.06, |
| "procrustes__cos": 0.9561138153076172, |
| "topk8_global_ridge": 0.05, |
| "topk8_global_ridge__cos": 0.9844202995300293, |
| "topk8_pertensor_ridge": 0.04666666666666667, |
| "topk8_pertensor_ridge__cos": 0.9822383522987366 |
| }, |
| "main_row": { |
| "Domain": "math", |
| "Task": "gsm_hard", |
| "base_Y": 0.056666666666666664, |
| "mean": 0.06333333333333334, |
| "global_ridge": 0.05333333333333334, |
| "pertensor_ridge": 0.056666666666666664, |
| "topk8_global_ridge": 0.05, |
| "topk8_pertensor_ridge": 0.04666666666666667, |
| "pertensor_mlp": 0.06666666666666667, |
| "oracle": 0.07333333333333333, |
| "gap_recovered": 0.6 |
| } |
| }, |
| "math_algebra_medium": { |
| "domain": "math", |
| "selected": { |
| "topk8_global_ridge": [ |
| "math_algebra_easy", |
| "multiarith", |
| "math_counting_easy", |
| "mmlu_high_school_biology", |
| "mmlu_elementary_math", |
| "humaneval", |
| "mmlu_high_school_physics", |
| "mbpp" |
| ], |
| "topk8_pertensor_ridge": [ |
| "math_algebra_easy", |
| "multiarith", |
| "math_counting_easy", |
| "mmlu_high_school_biology", |
| "mmlu_elementary_math", |
| "humaneval", |
| "mmlu_high_school_physics", |
| "mbpp" |
| ] |
| }, |
| "metrics": { |
| "base_Y": 0.09333333333333334, |
| "oracle": 0.09666666666666666, |
| "mean": 0.1, |
| "mean__cos": 0.9451424479484558, |
| "global_ridge": 0.09333333333333334, |
| "global_ridge__cos": 0.994994044303894, |
| "pertensor_ridge": 0.1, |
| "pertensor_ridge__cos": 0.9946495294570923, |
| "pertensor_pca": 0.09333333333333334, |
| "pertensor_pca__cos": 0.9928159713745117, |
| "pertensor_mlp": 0.09333333333333334, |
| "pertensor_mlp__cos": 0.9720228910446167, |
| "procrustes": 0.06666666666666667, |
| "procrustes__cos": 0.9579223394393921, |
| "topk8_global_ridge": 0.10333333333333333, |
| "topk8_global_ridge__cos": 0.994929313659668, |
| "topk8_pertensor_ridge": 0.10333333333333333, |
| "topk8_pertensor_ridge__cos": 0.9947062730789185 |
| }, |
| "main_row": { |
| "Domain": "math", |
| "Task": "math_algebra_medium", |
| "base_Y": 0.09333333333333334, |
| "mean": 0.1, |
| "global_ridge": 0.09333333333333334, |
| "pertensor_ridge": 0.1, |
| "topk8_global_ridge": 0.10333333333333333, |
| "topk8_pertensor_ridge": 0.10333333333333333, |
| "pertensor_mlp": 0.09333333333333334, |
| "oracle": 0.09666666666666666, |
| "gap_recovered": 3.000000000000004 |
| } |
| }, |
| "humaneval_plus": { |
| "domain": "code", |
| "selected": { |
| "topk8_global_ridge": [ |
| "humaneval", |
| "mbpp_sanitized", |
| "mbpp", |
| "math_counting_easy", |
| "mmlu_high_school_physics", |
| "mmlu_high_school_biology", |
| "mmlu_elementary_math", |
| "multiarith" |
| ], |
| "topk8_pertensor_ridge": [ |
| "humaneval", |
| "mbpp_sanitized", |
| "mbpp", |
| "math_counting_easy", |
| "mmlu_high_school_physics", |
| "mmlu_high_school_biology", |
| "mmlu_elementary_math", |
| "multiarith" |
| ] |
| }, |
| "metrics": { |
| "base_Y": 0.07926829268292683, |
| "oracle": 0.06707317073170732, |
| "mean": 0.08536585365853659, |
| "mean__cos": 0.9547188878059387, |
| "global_ridge": 0.06707317073170732, |
| "global_ridge__cos": 0.9997959136962891, |
| "pertensor_ridge": 0.06707317073170732, |
| "pertensor_ridge__cos": 0.9997047781944275, |
| "pertensor_pca": 0.07926829268292683, |
| "pertensor_pca__cos": 0.9963724613189697, |
| "pertensor_mlp": 0.07317073170731707, |
| "pertensor_mlp__cos": 0.9848037958145142, |
| "procrustes": 0.07317073170731707, |
| "procrustes__cos": 0.98451828956604, |
| "topk8_global_ridge": 0.06707317073170732, |
| "topk8_global_ridge__cos": 0.9997950196266174, |
| "topk8_pertensor_ridge": 0.06707317073170732, |
| "topk8_pertensor_ridge__cos": 0.9997144937515259 |
| }, |
| "main_row": { |
| "Domain": "code", |
| "Task": "humaneval_plus", |
| "base_Y": 0.07926829268292683, |
| "mean": 0.08536585365853659, |
| "global_ridge": 0.06707317073170732, |
| "pertensor_ridge": 0.06707317073170732, |
| "topk8_global_ridge": 0.06707317073170732, |
| "topk8_pertensor_ridge": 0.06707317073170732, |
| "pertensor_mlp": 0.07317073170731707, |
| "oracle": 0.06707317073170732, |
| "gap_recovered": -0.5000000000000006 |
| } |
| }, |
| "mbpp_plus": { |
| "domain": "code", |
| "selected": { |
| "topk8_global_ridge": [ |
| "mbpp_sanitized", |
| "mbpp", |
| "humaneval", |
| "math_counting_easy", |
| "mmlu_high_school_physics", |
| "mmlu_high_school_biology", |
| "multiarith", |
| "mmlu_elementary_math" |
| ], |
| "topk8_pertensor_ridge": [ |
| "mbpp_sanitized", |
| "mbpp", |
| "humaneval", |
| "math_counting_easy", |
| "mmlu_high_school_physics", |
| "mmlu_high_school_biology", |
| "multiarith", |
| "mmlu_elementary_math" |
| ] |
| }, |
| "metrics": { |
| "base_Y": 0.21666666666666667, |
| "oracle": 0.22, |
| "mean": 0.20666666666666667, |
| "mean__cos": 0.9514243602752686, |
| "global_ridge": 0.21666666666666667, |
| "global_ridge__cos": 0.9871735572814941, |
| "pertensor_ridge": 0.21, |
| "pertensor_ridge__cos": 0.9867655038833618, |
| "pertensor_pca": 0.2, |
| "pertensor_pca__cos": 0.9821508526802063, |
| "pertensor_mlp": 0.2, |
| "pertensor_mlp__cos": 0.9766831994056702, |
| "procrustes": 0.20666666666666667, |
| "procrustes__cos": 0.9758116602897644, |
| "topk8_global_ridge": 0.21333333333333335, |
| "topk8_global_ridge__cos": 0.9844338893890381, |
| "topk8_pertensor_ridge": 0.20333333333333334, |
| "topk8_pertensor_ridge__cos": 0.9844347834587097 |
| }, |
| "main_row": { |
| "Domain": "code", |
| "Task": "mbpp_plus", |
| "base_Y": 0.21666666666666667, |
| "mean": 0.20666666666666667, |
| "global_ridge": 0.21666666666666667, |
| "pertensor_ridge": 0.21, |
| "topk8_global_ridge": 0.21333333333333335, |
| "topk8_pertensor_ridge": 0.20333333333333334, |
| "pertensor_mlp": 0.2, |
| "oracle": 0.22, |
| "gap_recovered": 0.0 |
| } |
| }, |
| "arc_challenge": { |
| "domain": "science", |
| "selected": { |
| "topk8_global_ridge": [ |
| "arc_easy", |
| "sciq", |
| "openbookqa", |
| "medmcqa_easy", |
| "mmlu_elementary_math", |
| "mmlu_high_school_biology", |
| "aqua_rat", |
| "mmlu_high_school_physics" |
| ], |
| "topk8_pertensor_ridge": [ |
| "arc_easy", |
| "sciq", |
| "openbookqa", |
| "medmcqa_easy", |
| "mmlu_elementary_math", |
| "mmlu_high_school_biology", |
| "aqua_rat", |
| "mmlu_high_school_physics" |
| ] |
| }, |
| "metrics": { |
| "base_Y": 0.705685618729097, |
| "oracle": 0.725752508361204, |
| "mean": 0.7324414715719063, |
| "mean__cos": 0.9541645050048828, |
| "global_ridge": 0.705685618729097, |
| "global_ridge__cos": 0.9965179562568665, |
| "pertensor_ridge": 0.705685618729097, |
| "pertensor_ridge__cos": 0.9963470101356506, |
| "pertensor_pca": 0.7090301003344481, |
| "pertensor_pca__cos": 0.9951907396316528, |
| "pertensor_mlp": 0.725752508361204, |
| "pertensor_mlp__cos": 0.9860411882400513, |
| "procrustes": 0.7123745819397993, |
| "procrustes__cos": 0.9873964786529541, |
| "topk8_global_ridge": 0.705685618729097, |
| "topk8_global_ridge__cos": 0.99649977684021, |
| "topk8_pertensor_ridge": 0.705685618729097, |
| "topk8_pertensor_ridge__cos": 0.9963691234588623 |
| }, |
| "main_row": { |
| "Domain": "science", |
| "Task": "arc_challenge", |
| "base_Y": 0.705685618729097, |
| "mean": 0.7324414715719063, |
| "global_ridge": 0.705685618729097, |
| "pertensor_ridge": 0.705685618729097, |
| "topk8_global_ridge": 0.705685618729097, |
| "topk8_pertensor_ridge": 0.705685618729097, |
| "pertensor_mlp": 0.725752508361204, |
| "oracle": 0.725752508361204, |
| "gap_recovered": 1.3333333333333333 |
| } |
| }, |
| "mmlu_college_chemistry": { |
| "domain": "science", |
| "selected": { |
| "topk8_global_ridge": [ |
| "mmlu_high_school_physics", |
| "mbpp_sanitized", |
| "mbpp", |
| "math_counting_easy", |
| "humaneval", |
| "mmlu_high_school_biology", |
| "mmlu_elementary_math", |
| "multiarith" |
| ], |
| "topk8_pertensor_ridge": [ |
| "mmlu_high_school_physics", |
| "mbpp_sanitized", |
| "mbpp", |
| "math_counting_easy", |
| "humaneval", |
| "mmlu_high_school_biology", |
| "mmlu_elementary_math", |
| "multiarith" |
| ] |
| }, |
| "metrics": { |
| "base_Y": 0.375, |
| "oracle": 0.375, |
| "mean": 0.375, |
| "mean__cos": 0.9513781070709229, |
| "global_ridge": 0.375, |
| "global_ridge__cos": 0.9985741972923279, |
| "pertensor_ridge": 0.375, |
| "pertensor_ridge__cos": 0.9986124634742737, |
| "pertensor_pca": 0.375, |
| "pertensor_pca__cos": 0.9976071119308472, |
| "pertensor_mlp": 0.25, |
| "pertensor_mlp__cos": 0.981284499168396, |
| "procrustes": 0.375, |
| "procrustes__cos": 0.9835162162780762, |
| "topk8_global_ridge": 0.375, |
| "topk8_global_ridge__cos": 0.998512327671051, |
| "topk8_pertensor_ridge": 0.375, |
| "topk8_pertensor_ridge__cos": 0.9985535144805908 |
| }, |
| "main_row": { |
| "Domain": "science", |
| "Task": "mmlu_college_chemistry", |
| "base_Y": 0.375, |
| "mean": 0.375, |
| "global_ridge": 0.375, |
| "pertensor_ridge": 0.375, |
| "topk8_global_ridge": 0.375, |
| "topk8_pertensor_ridge": 0.375, |
| "pertensor_mlp": 0.25, |
| "oracle": 0.375, |
| "gap_recovered": null |
| } |
| } |
| }, |
| "main_table": [ |
| { |
| "Domain": "math", |
| "Task": "gsm_hard", |
| "base_Y": 0.056666666666666664, |
| "mean": 0.06333333333333334, |
| "global_ridge": 0.05333333333333334, |
| "pertensor_ridge": 0.056666666666666664, |
| "topk8_global_ridge": 0.05, |
| "topk8_pertensor_ridge": 0.04666666666666667, |
| "pertensor_mlp": 0.06666666666666667, |
| "oracle": 0.07333333333333333, |
| "gap_recovered": 0.6 |
| }, |
| { |
| "Domain": "math", |
| "Task": "math_algebra_medium", |
| "base_Y": 0.09333333333333334, |
| "mean": 0.1, |
| "global_ridge": 0.09333333333333334, |
| "pertensor_ridge": 0.1, |
| "topk8_global_ridge": 0.10333333333333333, |
| "topk8_pertensor_ridge": 0.10333333333333333, |
| "pertensor_mlp": 0.09333333333333334, |
| "oracle": 0.09666666666666666, |
| "gap_recovered": 3.000000000000004 |
| }, |
| { |
| "Domain": "code", |
| "Task": "humaneval_plus", |
| "base_Y": 0.07926829268292683, |
| "mean": 0.08536585365853659, |
| "global_ridge": 0.06707317073170732, |
| "pertensor_ridge": 0.06707317073170732, |
| "topk8_global_ridge": 0.06707317073170732, |
| "topk8_pertensor_ridge": 0.06707317073170732, |
| "pertensor_mlp": 0.07317073170731707, |
| "oracle": 0.06707317073170732, |
| "gap_recovered": -0.5000000000000006 |
| }, |
| { |
| "Domain": "code", |
| "Task": "mbpp_plus", |
| "base_Y": 0.21666666666666667, |
| "mean": 0.20666666666666667, |
| "global_ridge": 0.21666666666666667, |
| "pertensor_ridge": 0.21, |
| "topk8_global_ridge": 0.21333333333333335, |
| "topk8_pertensor_ridge": 0.20333333333333334, |
| "pertensor_mlp": 0.2, |
| "oracle": 0.22, |
| "gap_recovered": 0.0 |
| }, |
| { |
| "Domain": "science", |
| "Task": "arc_challenge", |
| "base_Y": 0.705685618729097, |
| "mean": 0.7324414715719063, |
| "global_ridge": 0.705685618729097, |
| "pertensor_ridge": 0.705685618729097, |
| "topk8_global_ridge": 0.705685618729097, |
| "topk8_pertensor_ridge": 0.705685618729097, |
| "pertensor_mlp": 0.725752508361204, |
| "oracle": 0.725752508361204, |
| "gap_recovered": 1.3333333333333333 |
| }, |
| { |
| "Domain": "science", |
| "Task": "mmlu_college_chemistry", |
| "base_Y": 0.375, |
| "mean": 0.375, |
| "global_ridge": 0.375, |
| "pertensor_ridge": 0.375, |
| "topk8_global_ridge": 0.375, |
| "topk8_pertensor_ridge": 0.375, |
| "pertensor_mlp": 0.25, |
| "oracle": 0.375, |
| "gap_recovered": null |
| } |
| ], |
| "anchor_names": [ |
| "gsm8k", |
| "svamp", |
| "asdiv", |
| "mawps", |
| "multiarith", |
| "aqua_rat", |
| "math_algebra_easy", |
| "math_counting_easy", |
| "mbpp", |
| "humaneval", |
| "codealpaca_mini", |
| "mbpp_sanitized", |
| "conala_curated", |
| "livecodebench_easy", |
| "sciq", |
| "arc_easy", |
| "openbookqa", |
| "medmcqa_easy", |
| "mmlu_elementary_math", |
| "mmlu_high_school_biology", |
| "mmlu_high_school_physics", |
| "pubmedqa_pqal" |
| ] |
| } |