{ "n_proteins": 82404, "n_features": 15411, "components": [ "ESM2_L29-35 (15360 dims)", "Taxonomy_top50 (51 dims)" ], "train_n": 57686, "val_n": 12359, "test_n": 12359, "taxonomy_info": { "n_features": 51, "top50_taxa": [ "9606", "10090", "3702", "559292", "10116", "284812", "83333", "7227", "6239", "83332", "7955", "44689", "39947", "9913", "9031", "8355", "237561", "208964", "224308", "227321", "9823", "9986", "4577", "330879", "36329", "99287", "9615", "39946", "284593", "3055", "4081", "170187", "185431", "4530", "4536", "243232", "3880", "5702", "8364", "10029", "85962", "510516", "3847", "8022", "235443", "4102", "3888", "4097", "425011", "9940" ] } }