upload model

Browse files

Files changed (5) hide show

config.json +172 -0
generation_config.json +10 -0
model-00001-of-00002.safetensors +3 -0
model-00002-of-00002.safetensors +3 -0
model.safetensors.index.json +836 -0

config.json ADDED Viewed

	@@ -0,0 +1,172 @@

+{
+  "_cfg_special_tokens": {
+    "image_end_token_id": 200031,
+    "image_start_token_id": 200030,
+    "image_token_id": 200029
+  },
+  "_cfg_vision_adapter": {
+    "activation": "gelu",
+    "checkpoint_path": "./model/mm_projector.bin",
+    "device": "cpu",
+    "freeze": false,
+    "hidden_dim": 3072,
+    "input_dim": 6144,
+    "layers": 2,
+    "num_layers": 2,
+    "output_dim": 3072
+  },
+  "_cfg_vision_tower": {
+    "freeze": false,
+    "model_params": {
+      "device_map": "cpu",
+      "trust_remote_code": true
+    },
+    "pad_to_square": true,
+    "pretrained_model_name_or_path": "kevin510/fast-vit-hd",
+    "s2_scales": "512,1024",
+    "type": "fastvit",
+    "use_s2": true
+  },
+  "architectures": [
+    "FridayForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "auto_map": {
+    "AutoConfig": "microsoft/Phi-4-mini-instruct--configuration_phi3.Phi3Config",
+    "AutoModelForCausalLM": "microsoft/Phi-4-mini-instruct--modeling_phi3.Phi3ForCausalLM",
+    "AutoTokenizer": "microsoft/Phi-4-mini-instruct--Xenova/gpt-4o"
+  },
+  "bos_token_id": 199999,
+  "delay_load": true,
+  "embd_pdrop": 0.0,
+  "eos_token_id": 199999,
+  "full_attn_mod": 1,
+  "hidden_act": "silu",
+  "hidden_size": 3072,
+  "initializer_range": 0.02,
+  "intermediate_size": 8192,
+  "interpolate_factor": 1,
+  "lm_head_bias": false,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "model_type": "friday-phi",
+  "num_attention_heads": 24,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 8,
+  "original_max_position_embeddings": 4096,
+  "pad_token_id": 199999,
+  "partial_rotary_factor": 0.75,
+  "resid_pdrop": 0.0,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "long_factor": [
+      1,
+      1.118320672,
+      1.250641126,
+      1.398617824,
+      1.564103225,
+      1.74916897,
+      1.956131817,
+      2.187582649,
+      2.446418898,
+      2.735880826,
+      3.059592084,
+      3.421605075,
+      3.826451687,
+      4.279200023,
+      4.785517845,
+      5.351743533,
+      5.984965424,
+      6.693110555,
+      7.485043894,
+      8.370679318,
+      9.36110372,
+      10.4687158,
+      11.70738129,
+      13.09260651,
+      14.64173252,
+      16.37415215,
+      18.31155283,
+      20.47818807,
+      22.90118105,
+      25.61086418,
+      28.64115884,
+      32.03,
+      32.1,
+      32.13,
+      32.23,
+      32.6,
+      32.61,
+      32.64,
+      32.66,
+      32.7,
+      32.71,
+      32.93,
+      32.97,
+      33.28,
+      33.49,
+      33.5,
+      44.16,
+      47.77
+    ],
+    "short_factor": [
+      1,
+      1.118320672,
+      1.250641126,
+      1.398617824,
+      1.564103225,
+      1.74916897,
+      1.956131817,
+      2.187582649,
+      2.446418898,
+      2.735880826,
+      3.059592084,
+      3.421605075,
+      3.826451687,
+      4.279200023,
+      4.785517845,
+      5.351743533,
+      5.984965424,
+      6.693110555,
+      7.485043894,
+      8.370679318,
+      9.36110372,
+      10.4687158,
+      11.70738129,
+      13.09260651,
+      14.64173252,
+      16.37415215,
+      18.31155283,
+      20.47818807,
+      22.90118105,
+      25.61086418,
+      28.64115884,
+      32.03,
+      32.1,
+      32.13,
+      32.23,
+      32.6,
+      32.61,
+      32.64,
+      32.66,
+      32.7,
+      32.71,
+      32.93,
+      32.97,
+      33.28,
+      33.49,
+      33.5,
+      44.16,
+      47.77
+    ],
+    "type": "longrope"
+  },
+  "rope_theta": 10000.0,
+  "sliding_window": 262144,
+  "tokenizer_model_max_length": 2048,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.51.3",
+  "use_cache": true,
+  "vocab_size": 200064
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "_from_model_config": true,
+  "bos_token_id": 199999,
+  "eos_token_id": [
+    200020,
+    199999
+  ],
+  "pad_token_id": 199999,
+  "transformers_version": "4.51.3"
+}

model-00001-of-00002.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ffd7126a7fbff3dfecc966a379e3e167429c16057e9be96d1211e528b6fea042
+size 4903858560

model-00002-of-00002.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9f33e6f858a50793e6e8cd14b77e57ff306824477eb053440acb0b1d53381ac7
+size 3094531056

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,836 @@

+{
+  "metadata": {
+    "total_size": 7998273568
+  },
+  "weight_map": {
+    "model.embed_tokens.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.18.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.18.mlp.gate_up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.18.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.18.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.19.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.19.mlp.gate_up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.19.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.19.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.19.self_attn.qkv_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.2.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.20.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.20.mlp.gate_up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.20.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.20.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.20.self_attn.qkv_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.21.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.21.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.21.mlp.gate_up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.21.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.21.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.21.self_attn.qkv_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.22.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.22.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.22.mlp.gate_up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.22.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.22.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.22.self_attn.qkv_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.23.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.23.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.23.mlp.gate_up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.23.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.23.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.23.self_attn.qkv_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.24.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.24.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.24.mlp.gate_up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.24.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.24.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.24.self_attn.qkv_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.25.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.25.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.25.mlp.gate_up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.25.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.25.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.25.self_attn.qkv_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.26.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.26.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.26.mlp.gate_up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.26.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.26.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.26.self_attn.qkv_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.27.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.27.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.27.mlp.gate_up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.27.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.27.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.27.self_attn.qkv_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.28.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.28.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.28.mlp.gate_up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.28.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.28.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.28.self_attn.qkv_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.mlp.gate_up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.self_attn.qkv_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.3.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.30.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.mlp.gate_up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.self_attn.qkv_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.mlp.gate_up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.self_attn.qkv_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.4.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.mlp.gate_up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.self_attn.qkv_proj.weight": "model-00001-of-00002.safetensors",
+    "model.mm_projector.mlp.0.bias": "model-00002-of-00002.safetensors",
+    "model.mm_projector.mlp.0.weight": "model-00002-of-00002.safetensors",
+    "model.mm_projector.mlp.2.bias": "model-00002-of-00002.safetensors",
+    "model.mm_projector.mlp.2.weight": "model-00002-of-00002.safetensors",
+    "model.mm_projector.mlp.4.bias": "model-00002-of-00002.safetensors",
+    "model.mm_projector.mlp.4.weight": "model-00002-of-00002.safetensors",
+    "model.norm.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.conv_exp.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.conv_exp.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.conv_exp.se.expand.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.conv_exp.se.expand.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.conv_exp.se.reduce.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.conv_exp.se.reduce.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.head.proj": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.0.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.0.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.0.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.0.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.0.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.0.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.0.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.0.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.0.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.0.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.0.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.0.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.0.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.1.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.1.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.1.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.1.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.1.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.1.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.1.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.1.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.1.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.1.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.1.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.1.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.0.1.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.1.proj.0.lkb_reparam.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.1.proj.0.lkb_reparam.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.1.proj.1.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.1.proj.1.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.0.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.0.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.0.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.0.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.0.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.0.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.0.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.0.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.0.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.0.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.0.layer_scale_1": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.0.layer_scale_2": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.0.norm.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.0.norm.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.0.token_mixer.proj.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.0.token_mixer.proj.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.0.token_mixer.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.1.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.1.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.1.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.1.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.1.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.1.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.1.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.1.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.1.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.1.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.1.layer_scale_1": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.1.layer_scale_2": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.1.norm.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.1.norm.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.1.token_mixer.proj.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.1.token_mixer.proj.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.10.1.token_mixer.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.0.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.0.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.0.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.0.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.0.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.0.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.0.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.0.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.0.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.0.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.0.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.0.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.0.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.1.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.1.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.1.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.1.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.1.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.1.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.1.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.1.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.1.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.1.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.1.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.1.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.1.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.10.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.10.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.10.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.10.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.10.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.10.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.10.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.10.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.10.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.10.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.10.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.10.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.10.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.11.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.11.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.11.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.11.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.11.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.11.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.11.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.11.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.11.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.11.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.11.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.11.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.11.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.2.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.2.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.2.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.2.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.2.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.2.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.2.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.2.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.2.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.2.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.2.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.2.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.2.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.3.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.3.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.3.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.3.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.3.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.3.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.3.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.3.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.3.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.3.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.3.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.3.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.3.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.4.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.4.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.4.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.4.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.4.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.4.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.4.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.4.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.4.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.4.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.4.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.4.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.4.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.5.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.5.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.5.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.5.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.5.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.5.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.5.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.5.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.5.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.5.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.5.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.5.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.5.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.6.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.6.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.6.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.6.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.6.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.6.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.6.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.6.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.6.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.6.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.6.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.6.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.6.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.7.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.7.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.7.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.7.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.7.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.7.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.7.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.7.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.7.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.7.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.7.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.7.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.7.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.8.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.8.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.8.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.8.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.8.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.8.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.8.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.8.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.8.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.8.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.8.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.8.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.8.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.9.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.9.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.9.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.9.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.9.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.9.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.9.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.9.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.9.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.9.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.9.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.9.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.2.9.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.3.proj.0.lkb_reparam.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.3.proj.0.lkb_reparam.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.3.proj.1.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.3.proj.1.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.0.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.0.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.0.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.0.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.0.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.0.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.0.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.0.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.0.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.0.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.0.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.0.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.0.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.1.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.1.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.1.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.1.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.1.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.1.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.1.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.1.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.1.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.1.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.1.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.1.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.1.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.10.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.10.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.10.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.10.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.10.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.10.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.10.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.10.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.10.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.10.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.10.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.10.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.10.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.11.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.11.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.11.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.11.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.11.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.11.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.11.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.11.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.11.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.11.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.11.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.11.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.11.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.12.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.12.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.12.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.12.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.12.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.12.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.12.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.12.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.12.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.12.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.12.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.12.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.12.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.13.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.13.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.13.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.13.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.13.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.13.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.13.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.13.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.13.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.13.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.13.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.13.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.13.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.14.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.14.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.14.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.14.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.14.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.14.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.14.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.14.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.14.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.14.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.14.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.14.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.14.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.15.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.15.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.15.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.15.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.15.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.15.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.15.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.15.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.15.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.15.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.15.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.15.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.15.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.16.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.16.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.16.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.16.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.16.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.16.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.16.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.16.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.16.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.16.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.16.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.16.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.16.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.17.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.17.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.17.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.17.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.17.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.17.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.17.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.17.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.17.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.17.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.17.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.17.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.17.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.18.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.18.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.18.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.18.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.18.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.18.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.18.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.18.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.18.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.18.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.18.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.18.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.18.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.19.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.19.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.19.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.19.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.19.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.19.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.19.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.19.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.19.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.19.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.19.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.19.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.19.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.2.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.2.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.2.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.2.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.2.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.2.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.2.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.2.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.2.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.2.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.2.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.2.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.2.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.20.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.20.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.20.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.20.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.20.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.20.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.20.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.20.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.20.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.20.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.20.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.20.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.20.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.21.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.21.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.21.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.21.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.21.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.21.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.21.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.21.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.21.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.21.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.21.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.21.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.21.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.22.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.22.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.22.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.22.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.22.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.22.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.22.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.22.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.22.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.22.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.22.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.22.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.22.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.23.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.23.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.23.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.23.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.23.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.23.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.23.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.23.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.23.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.23.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.23.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.23.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.23.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.3.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.3.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.3.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.3.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.3.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.3.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.3.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.3.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.3.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.3.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.3.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.3.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.3.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.4.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.4.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.4.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.4.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.4.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.4.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.4.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.4.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.4.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.4.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.4.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.4.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.4.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.5.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.5.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.5.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.5.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.5.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.5.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.5.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.5.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.5.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.5.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.5.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.5.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.5.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.6.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.6.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.6.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.6.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.6.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.6.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.6.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.6.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.6.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.6.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.6.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.6.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.6.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.7.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.7.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.7.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.7.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.7.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.7.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.7.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.7.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.7.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.7.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.7.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.7.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.7.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.8.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.8.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.8.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.8.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.8.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.8.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.8.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.8.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.8.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.8.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.8.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.8.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.8.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.9.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.9.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.9.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.9.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.9.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.9.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.9.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.9.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.9.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.9.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.9.layer_scale": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.9.token_mixer.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.4.9.token_mixer.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.5.proj.0.lkb_reparam.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.5.proj.0.lkb_reparam.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.5.proj.1.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.5.proj.1.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.6.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.6.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.0.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.0.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.0.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.0.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.0.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.0.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.0.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.0.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.0.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.0.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.0.layer_scale_1": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.0.layer_scale_2": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.0.norm.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.0.norm.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.0.token_mixer.proj.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.0.token_mixer.proj.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.0.token_mixer.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.1.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.1.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.1.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.1.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.1.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.1.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.1.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.1.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.1.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.1.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.1.layer_scale_1": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.1.layer_scale_2": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.1.norm.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.1.norm.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.1.token_mixer.proj.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.1.token_mixer.proj.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.1.token_mixer.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.2.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.2.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.2.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.2.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.2.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.2.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.2.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.2.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.2.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.2.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.2.layer_scale_1": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.2.layer_scale_2": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.2.norm.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.2.norm.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.2.token_mixer.proj.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.2.token_mixer.proj.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.2.token_mixer.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.3.convffn.conv.bn.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.3.convffn.conv.bn.num_batches_tracked": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.3.convffn.conv.bn.running_mean": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.3.convffn.conv.bn.running_var": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.3.convffn.conv.bn.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.3.convffn.conv.conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.3.convffn.fc1.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.3.convffn.fc1.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.3.convffn.fc2.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.3.convffn.fc2.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.3.layer_scale_1": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.3.layer_scale_2": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.3.norm.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.3.norm.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.3.token_mixer.proj.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.3.token_mixer.proj.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.7.3.token_mixer.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.8.proj.0.lkb_reparam.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.8.proj.0.lkb_reparam.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.8.proj.1.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.8.proj.1.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.9.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.network.9.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.patch_embed.0.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.patch_embed.0.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.patch_embed.1.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.patch_embed.1.reparam_conv.weight": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.patch_embed.2.reparam_conv.bias": "model-00002-of-00002.safetensors",
+    "model.vision_tower.vision_tower.backbone.patch_embed.2.reparam_conv.weight": "model-00002-of-00002.safetensors"
+  }
+}