smolvla_clare_debug / adapter_config.json

Upload folder using huggingface_hub

4b4ad2c verified about 1 month ago

8.92 kB

	{
	"_module_configs": {
	".*vlm_with_expert.(?P<layer_name>lm_expert.layers.(?P<layer_id>(0\|2\|4\|6\|8\|10\|12\|14)).self_attn.(k_proj\|v_proj))": {
	"add_zero_init_conv_layer": false,
	"batch_first": true,
	"discriminator_cfg": {
	"batch_first": true,
	"feature_dim": 720,
	"feature_fusion": false,
	"fused_feature_dim": null,
	"hidden_dim": 128,
	"max_batches_tracked": 2000,
	"momentum": 0.1,
	"num_tokens": 16,
	"type": "autoencoder_small",
	"use_momentum": true
	},
	"feature_dim": 720,
	"func_adapter_cfg": {
	"hidden_dim": null,
	"lora_alpha": 32,
	"lora_rank": 32,
	"use_lora": true
	},
	"out_feature_dim": 320,
	"pattern": ".*vlm_with_expert.(?P<layer_name>lm_expert.layers.(?P<layer_id>(0\|2\|4\|6\|8\|10\|12\|14)).self_attn.(k_proj\|v_proj))",
	"use_trainable_copy": false
	},
	".*vlm_with_expert.(?P<layer_name>lm_expert.layers.(?P<layer_id>(1\|3\|5\|7\|9\|11\|13\|15)).self_attn.(k_proj\|v_proj))": {
	"add_zero_init_conv_layer": false,
	"batch_first": true,
	"discriminator_cfg": {
	"batch_first": true,
	"feature_dim": 320,
	"feature_fusion": false,
	"fused_feature_dim": null,
	"hidden_dim": 64,
	"max_batches_tracked": 2000,
	"momentum": 0.1,
	"num_tokens": 16,
	"type": "autoencoder_small",
	"use_momentum": true
	},
	"feature_dim": 320,
	"func_adapter_cfg": {
	"hidden_dim": null,
	"lora_alpha": 32,
	"lora_rank": 32,
	"use_lora": true
	},
	"out_feature_dim": 320,
	"pattern": ".*vlm_with_expert.(?P<layer_name>lm_expert.layers.(?P<layer_id>(1\|3\|5\|7\|9\|11\|13\|15)).self_attn.(k_proj\|v_proj))",
	"use_trainable_copy": false
	},
	".*vlm_with_expert.(?P<layer_name>lm_expert.layers.(?P<layer_id>\\d+).self_attn.q_proj)": {
	"add_zero_init_conv_layer": false,
	"batch_first": true,
	"discriminator_cfg": {
	"batch_first": true,
	"feature_dim": 720,
	"feature_fusion": false,
	"fused_feature_dim": null,
	"hidden_dim": 128,
	"max_batches_tracked": 2000,
	"momentum": 0.1,
	"num_tokens": 16,
	"type": "autoencoder_small",
	"use_momentum": true
	},
	"feature_dim": 720,
	"func_adapter_cfg": {
	"hidden_dim": null,
	"lora_alpha": 32,
	"lora_rank": 32,
	"use_lora": true
	},
	"out_feature_dim": 960,
	"pattern": ".*vlm_with_expert.(?P<layer_name>lm_expert.layers.(?P<layer_id>\\d+).self_attn.q_proj)",
	"use_trainable_copy": false
	}
	},
	"add_zero_init_conv_layer": false,
	"auto_mapping": {
	"base_model_class": "PeftWrapperPolicy",
	"parent_library": "__main__"
	},
	"base_model_name_or_path": null,
	"batch_first": true,
	"discriminator_cfg": null,
	"feature_dim": null,
	"func_adapter_cfg": null,
	"inference_mode": true,
	"num_learned_task": 1,
	"out_feature_dim": null,
	"peft_type": "CLARE",
	"revision": null,
	"structure": {
	"lm_expert.layers.0.self_attn.k_proj.0": [
	1,
	1
	],
	"lm_expert.layers.0.self_attn.q_proj.0": [
	1,
	1
	],
	"lm_expert.layers.0.self_attn.v_proj.0": [
	1,
	1
	],
	"lm_expert.layers.1.self_attn.k_proj.1": [
	1,
	1
	],
	"lm_expert.layers.1.self_attn.q_proj.1": [
	1,
	1
	],
	"lm_expert.layers.1.self_attn.v_proj.1": [
	1,
	1
	],
	"lm_expert.layers.10.self_attn.k_proj.10": [
	1,
	1
	],
	"lm_expert.layers.10.self_attn.q_proj.10": [
	1,
	1
	],
	"lm_expert.layers.10.self_attn.v_proj.10": [
	1,
	1
	],
	"lm_expert.layers.11.self_attn.k_proj.11": [
	1,
	1
	],
	"lm_expert.layers.11.self_attn.q_proj.11": [
	1,
	1
	],
	"lm_expert.layers.11.self_attn.v_proj.11": [
	1,
	1
	],
	"lm_expert.layers.12.self_attn.k_proj.12": [
	1,
	1
	],
	"lm_expert.layers.12.self_attn.q_proj.12": [
	1,
	1
	],
	"lm_expert.layers.12.self_attn.v_proj.12": [
	1,
	1
	],
	"lm_expert.layers.13.self_attn.k_proj.13": [
	1,
	1
	],
	"lm_expert.layers.13.self_attn.q_proj.13": [
	1,
	1
	],
	"lm_expert.layers.13.self_attn.v_proj.13": [
	1,
	1
	],
	"lm_expert.layers.14.self_attn.k_proj.14": [
	1,
	1
	],
	"lm_expert.layers.14.self_attn.q_proj.14": [
	1,
	1
	],
	"lm_expert.layers.14.self_attn.v_proj.14": [
	1,
	1
	],
	"lm_expert.layers.15.self_attn.k_proj.15": [
	1,
	1
	],
	"lm_expert.layers.15.self_attn.q_proj.15": [
	1,
	1
	],
	"lm_expert.layers.15.self_attn.v_proj.15": [
	1,
	1
	],
	"lm_expert.layers.2.self_attn.k_proj.2": [
	1,
	1
	],
	"lm_expert.layers.2.self_attn.q_proj.2": [
	1,
	1
	],
	"lm_expert.layers.2.self_attn.v_proj.2": [
	1,
	1
	],
	"lm_expert.layers.3.self_attn.k_proj.3": [
	1,
	1
	],
	"lm_expert.layers.3.self_attn.q_proj.3": [
	1,
	1
	],
	"lm_expert.layers.3.self_attn.v_proj.3": [
	1,
	1
	],
	"lm_expert.layers.4.self_attn.k_proj.4": [
	1,
	1
	],
	"lm_expert.layers.4.self_attn.q_proj.4": [
	1,
	1
	],
	"lm_expert.layers.4.self_attn.v_proj.4": [
	1,
	1
	],
	"lm_expert.layers.5.self_attn.k_proj.5": [
	1,
	1
	],
	"lm_expert.layers.5.self_attn.q_proj.5": [
	1,
	1
	],
	"lm_expert.layers.5.self_attn.v_proj.5": [
	1,
	1
	],
	"lm_expert.layers.6.self_attn.k_proj.6": [
	1,
	1
	],
	"lm_expert.layers.6.self_attn.q_proj.6": [
	1,
	1
	],
	"lm_expert.layers.6.self_attn.v_proj.6": [
	1,
	1
	],
	"lm_expert.layers.7.self_attn.k_proj.7": [
	1,
	1
	],
	"lm_expert.layers.7.self_attn.q_proj.7": [
	1,
	1
	],
	"lm_expert.layers.7.self_attn.v_proj.7": [
	1,
	1
	],
	"lm_expert.layers.8.self_attn.k_proj.8": [
	1,
	1
	],
	"lm_expert.layers.8.self_attn.q_proj.8": [
	1,
	1
	],
	"lm_expert.layers.8.self_attn.v_proj.8": [
	1,
	1
	],
	"lm_expert.layers.9.self_attn.k_proj.9": [
	1,
	1
	],
	"lm_expert.layers.9.self_attn.q_proj.9": [
	1,
	1
	],
	"lm_expert.layers.9.self_attn.v_proj.9": [
	1,
	1
	]
	},
	"target_modules": {
	".*vlm_with_expert.(?P<layer_name>lm_expert.layers.(?P<layer_id>(0\|2\|4\|6\|8\|10\|12\|14)).self_attn.(k_proj\|v_proj))": {
	"add_zero_init_conv_layer": false,
	"batch_first": true,
	"discriminator_cfg": {
	"batch_first": true,
	"feature_dim": 720,
	"feature_fusion": false,
	"fused_feature_dim": null,
	"hidden_dim": 128,
	"max_batches_tracked": 2000,
	"momentum": 0.1,
	"num_tokens": 16,
	"type": "autoencoder_small",
	"use_momentum": true
	},
	"feature_dim": 720,
	"func_adapter_cfg": {
	"hidden_dim": null,
	"lora_alpha": 32,
	"lora_rank": 32,
	"use_lora": true
	},
	"out_feature_dim": 320,
	"use_trainable_copy": false
	},
	".*vlm_with_expert.(?P<layer_name>lm_expert.layers.(?P<layer_id>(1\|3\|5\|7\|9\|11\|13\|15)).self_attn.(k_proj\|v_proj))": {
	"add_zero_init_conv_layer": false,
	"batch_first": true,
	"discriminator_cfg": {
	"batch_first": true,
	"feature_dim": 320,
	"feature_fusion": false,
	"fused_feature_dim": null,
	"hidden_dim": 64,
	"max_batches_tracked": 2000,
	"momentum": 0.1,
	"num_tokens": 16,
	"type": "autoencoder_small",
	"use_momentum": true
	},
	"feature_dim": 320,
	"func_adapter_cfg": {
	"hidden_dim": null,
	"lora_alpha": 32,
	"lora_rank": 32,
	"use_lora": true
	},
	"out_feature_dim": 320,
	"use_trainable_copy": false
	},
	".*vlm_with_expert.(?P<layer_name>lm_expert.layers.(?P<layer_id>\\d+).self_attn.q_proj)": {
	"add_zero_init_conv_layer": false,
	"batch_first": true,
	"discriminator_cfg": {
	"batch_first": true,
	"feature_dim": 720,
	"feature_fusion": false,
	"fused_feature_dim": null,
	"hidden_dim": 128,
	"max_batches_tracked": 2000,
	"momentum": 0.1,
	"num_tokens": 16,
	"type": "autoencoder_small",
	"use_momentum": true
	},
	"feature_dim": 720,
	"func_adapter_cfg": {
	"hidden_dim": null,
	"lora_alpha": 32,
	"lora_rank": 32,
	"use_lora": true
	},
	"out_feature_dim": 960,
	"use_trainable_copy": false
	}
	},
	"task_type": null,
	"use_trainable_copy": false
	}