prince-canuma commited on Aug 19, 2025

Commit

8864bb5

verified ·

1 Parent(s): a6d013e

Upload folder using huggingface_hub

Browse files

Files changed (23) hide show

.gitattributes +1 -0
README.md +41 -0
chat_template.jinja +61 -0
config.json +316 -0
generation_config.json +11 -0
model-00001-of-00013.safetensors +3 -0
model-00002-of-00013.safetensors +3 -0
model-00003-of-00013.safetensors +3 -0
model-00004-of-00013.safetensors +3 -0
model-00005-of-00013.safetensors +3 -0
model-00006-of-00013.safetensors +3 -0
model-00007-of-00013.safetensors +3 -0
model-00008-of-00013.safetensors +3 -0
model-00009-of-00013.safetensors +3 -0
model-00010-of-00013.safetensors +3 -0
model-00011-of-00013.safetensors +3 -0
model-00012-of-00013.safetensors +3 -0
model-00013-of-00013.safetensors +3 -0
model.safetensors.index.json +963 -0
preprocessor_config.json +42 -0
special_tokens_map.json +38 -0
tokenizer.json +3 -0
tokenizer_config.json +395 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,41 @@

+---
+inference: false
+library_name: transformers
+language:
+- en
+- fr
+- de
+- es
+- it
+- pt
+license: cc-by-nc-4.0
+extra_gated_prompt: By submitting this form, you agree to the [License Agreement](https://cohere.com/c4ai-cc-by-nc-license)  and
+  acknowledge that the information you provide will be collected, used, and shared
+  in accordance with Cohere’s [Privacy Policy]( https://cohere.com/privacy). You’ll
+  receive email updates about C4AI and Cohere research, events, products and services.
+  You can unsubscribe at any time.
+extra_gated_fields:
+  Name: text
+  Affiliation: text
+  Country: country
+  I agree to use this model for non-commercial use ONLY: checkbox
+pipeline_tag: image-text-to-text
+base_model:
+- CohereLabs/c4ai-command-a-03-2025
+- google/siglip2-so400m-patch16-512
+tags:
+- mlx
+---
+# mlx-community/command-a-vision-07-2025-4bit
+This model was converted to MLX format from [`CohereLabs/command-a-vision-07-2025`]() using mlx-vlm version **0.3.3**.
+Refer to the [original model card](https://huggingface.co/CohereLabs/command-a-vision-07-2025) for more details on the model.
+## Use with mlx
+```bash
+pip install -U mlx-vlm
+```
+```bash
+python -m mlx_vlm.generate --model mlx-community/command-a-vision-07-2025-4bit --max-tokens 100 --temperature 0.0 --prompt "Describe this image." --image <path_to_image>
+```

chat_template.jinja ADDED Viewed

	@@ -0,0 +1,61 @@

+{{- "<|START_OF_TURN_TOKEN|><|SYSTEM_TOKEN|># System Preamble
+You are in contextual safety mode. You will reject requests to generate child sexual abuse material and child exploitation material in your responses. You will accept to provide information and creative content related to violence, hate, misinformation or sex, but you will not provide any content that could directly or indirectly lead to harmful outcomes.
+Your information cutoff date is June 2024.
+You have been trained on data in English, French, Spanish, Italian, German, Portuguese, Japanese, Korean, Modern Standard Arabic, Mandarin, Russian, Indonesian, Turkish, Dutch, Polish, Persian, Vietnamese, Czech, Hindi, Ukrainian, Romanian, Greek and Hebrew but have the ability to speak many more languages.
+# Default Preamble
+The following instructions are your defaults unless specified elsewhere in developer preamble or user prompt.
+- Your name is Command.
+- You are a large language model built by Cohere.
+- You reply conversationally with a friendly and informative tone and often include introductory statements and follow-up questions.
+- If the input is ambiguous, ask clarifying follow-up questions.
+- Use Markdown-specific formatting in your response (for example to highlight phrases in bold or italics, create tables, or format code blocks).
+- Use LaTeX to generate mathematical notation for complex equations.
+- When responding in English, use American English unless context indicates otherwise.
+- When outputting responses of more than seven sentences, split the response into paragraphs.
+- Prefer the active voice.
+- Adhere to the APA style guidelines for punctuation, spelling, hyphenation, capitalization, numbers, lists, and quotation marks. Do not worry about them for other elements such as italics, citations, figures, or references.
+- Use gender-neutral pronouns for unspecified persons.
+- Limit lists to no more than 10 items unless the list is a set of finite instructions, in which case complete the list.
+- Use the third person when asked to write a summary.
+- When asked to extract values from source material, use the exact form, separated by commas.
+- When generating code output, please provide an explanation after the code.
+- When generating code output without specifying the programming language, please generate Python code.
+- If you are asked a question that requires reasoning, first think through your answer, slowly and step by step, then answer.<|END_OF_TURN_TOKEN|>" -}}
+{%- for message in messages -%}
+    <|START_OF_TURN_TOKEN|>{{ message.role | replace("user", "<|USER_TOKEN|>") | replace("assistant", "<|CHATBOT_TOKEN|><|START_RESPONSE|>") | replace("system", "<|SYSTEM_TOKEN|>") }}
+    {%- if message.content is defined -%}
+        {%- if message.content is string -%}
+{{ message.content }}
+        {%- else -%}
+            {%- for item in message.content -%}
+                {%- if item.type == 'image' -%}
+<|IMG_PATCH|>
+                {%- elif item.type == 'text' -%}
+{{ item.text }}
+                {%- endif -%}
+            {%- endfor -%}
+        {%- endif -%}
+    {%- elif message.message is defined -%}
+        {%- if message.message is string -%}
+{{ message.message }}
+        {%- else -%}
+            {%- for item in message.message -%}
+                {%- if item.type == 'image' -%}
+<|IMG_PATCH|>
+                {%- elif item.type == 'text' -%}
+{{ item.text }}
+                {%- endif -%}
+            {%- endfor -%}
+        {%- endif -%}
+    {%- endif -%}
+    {%- if message.role == "assistant" -%}
+<|END_RESPONSE|>
+    {%- endif -%}
+<|END_OF_TURN_TOKEN|>
+{%- endfor -%}
+{%- if add_generation_prompt -%}
+<|START_OF_TURN_TOKEN|><|CHATBOT_TOKEN|>
+{%- endif -%}

config.json ADDED Viewed

	@@ -0,0 +1,316 @@

+{
+    "adapter_layer_norm_eps": 1e-06,
+    "add_cross_attention": false,
+    "alignment_activation_fn": "swiglu",
+    "alignment_intermediate_size": 36864,
+    "architectures": [
+        "Cohere2VisionForConditionalGeneration"
+    ],
+    "bad_words_ids": null,
+    "begin_suppress_tokens": null,
+    "bos_token_id": null,
+    "chunk_size_feed_forward": 0,
+    "cross_attention_hidden_size": null,
+    "decoder_start_token_id": null,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "downsample_factor": 2,
+    "early_stopping": false,
+    "enable_adapter_layer_norm": false,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": null,
+    "exponential_decay_length_penalty": null,
+    "finetuning_task": null,
+    "forced_bos_token_id": null,
+    "forced_eos_token_id": null,
+    "id2label": {
+        "0": "LABEL_0",
+        "1": "LABEL_1"
+    },
+    "image_token": 255036,
+    "image_token_id": 255036,
+    "is_decoder": false,
+    "is_encoder_decoder": false,
+    "label2id": {
+        "LABEL_0": 0,
+        "LABEL_1": 1
+    },
+    "length_penalty": 1.0,
+    "max_length": 20,
+    "max_splits_per_img": 12,
+    "min_length": 0,
+    "model_type": "cohere2_vision",
+    "no_repeat_ngram_size": 0,
+    "num_beam_groups": 1,
+    "num_beams": 1,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_scores": false,
+    "pad_token_id": null,
+    "prefix": null,
+    "problem_type": null,
+    "pruned_heads": {},
+    "quantization": {
+        "group_size": 64,
+        "bits": 4
+    },
+    "quantization_config": {
+        "group_size": 64,
+        "bits": 4
+    },
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "sep_token_id": null,
+    "suppress_tokens": null,
+    "task_specific_params": null,
+    "temperature": 1.0,
+    "text_config": {
+        "vocab_size": 256000,
+        "max_position_embeddings": 500000,
+        "hidden_size": 12288,
+        "logit_scale": 1.0,
+        "intermediate_size": 36864,
+        "num_hidden_layers": 64,
+        "num_attention_heads": 96,
+        "num_key_value_heads": 8,
+        "hidden_act": "silu",
+        "initializer_range": 0.02,
+        "layer_norm_eps": 1e-05,
+        "use_cache": true,
+        "rope_theta": 50000,
+        "rope_scaling": null,
+        "attention_bias": false,
+        "attention_dropout": 0.0,
+        "sliding_window": 4096,
+        "layer_types": [
+            "sliding_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "full_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "full_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "full_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "full_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "full_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "full_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "full_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "full_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "full_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "full_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "full_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "full_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "full_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "full_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "full_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "sliding_attention",
+            "full_attention"
+        ],
+        "head_dim": 128,
+        "return_dict": true,
+        "output_hidden_states": false,
+        "torchscript": false,
+        "torch_dtype": null,
+        "pruned_heads": {},
+        "tie_word_embeddings": true,
+        "chunk_size_feed_forward": 0,
+        "is_encoder_decoder": false,
+        "is_decoder": false,
+        "cross_attention_hidden_size": null,
+        "add_cross_attention": false,
+        "tie_encoder_decoder": false,
+        "architectures": [
+            "Cohere2ForCausalLM"
+        ],
+        "finetuning_task": null,
+        "id2label": {
+            "0": "LABEL_0",
+            "1": "LABEL_1"
+        },
+        "label2id": {
+            "LABEL_0": 0,
+            "LABEL_1": 1
+        },
+        "task_specific_params": null,
+        "problem_type": null,
+        "tokenizer_class": null,
+        "prefix": null,
+        "bos_token_id": 5,
+        "pad_token_id": 0,
+        "eos_token_id": 255001,
+        "sep_token_id": null,
+        "decoder_start_token_id": null,
+        "max_length": 20,
+        "min_length": 0,
+        "do_sample": false,
+        "early_stopping": false,
+        "num_beams": 1,
+        "num_beam_groups": 1,
+        "diversity_penalty": 0.0,
+        "temperature": 1.0,
+        "top_k": 50,
+        "top_p": 1.0,
+        "typical_p": 1.0,
+        "repetition_penalty": 1.0,
+        "length_penalty": 1.0,
+        "no_repeat_ngram_size": 0,
+        "encoder_no_repeat_ngram_size": 0,
+        "bad_words_ids": null,
+        "num_return_sequences": 1,
+        "output_scores": false,
+        "return_dict_in_generate": false,
+        "forced_bos_token_id": null,
+        "forced_eos_token_id": null,
+        "remove_invalid_values": false,
+        "exponential_decay_length_penalty": null,
+        "suppress_tokens": null,
+        "begin_suppress_tokens": null,
+        "_name_or_path": "",
+        "_sliding_window_pattern": 4,
+        "cache_implementation": "hybrid",
+        "layer_switch": 4,
+        "model_type": "cohere2",
+        "order_of_interleaved_layers": "local_attn_first",
+        "position_embedding_type": "rope_gptj",
+        "rotary_pct": 1.0,
+        "use_embedding_sharing": true,
+        "use_gated_activation": true,
+        "use_parallel_block": true,
+        "use_parallel_embedding": true,
+        "use_qk_norm": false,
+        "tf_legacy_loss": false,
+        "use_bfloat16": false,
+        "output_attentions": false
+    },
+    "tf_legacy_loss": false,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torchscript": false,
+    "transformers_version": "4.55.2",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "vision_config": {
+        "return_dict": true,
+        "output_hidden_states": false,
+        "torchscript": false,
+        "torch_dtype": null,
+        "pruned_heads": {},
+        "tie_word_embeddings": true,
+        "chunk_size_feed_forward": 0,
+        "is_encoder_decoder": false,
+        "is_decoder": false,
+        "cross_attention_hidden_size": null,
+        "add_cross_attention": false,
+        "tie_encoder_decoder": false,
+        "architectures": null,
+        "finetuning_task": null,
+        "id2label": {
+            "0": "LABEL_0",
+            "1": "LABEL_1"
+        },
+        "label2id": {
+            "LABEL_0": 0,
+            "LABEL_1": 1
+        },
+        "task_specific_params": null,
+        "problem_type": null,
+        "tokenizer_class": null,
+        "prefix": null,
+        "bos_token_id": null,
+        "pad_token_id": null,
+        "eos_token_id": null,
+        "sep_token_id": null,
+        "decoder_start_token_id": null,
+        "max_length": 20,
+        "min_length": 0,
+        "do_sample": false,
+        "early_stopping": false,
+        "num_beams": 1,
+        "num_beam_groups": 1,
+        "diversity_penalty": 0.0,
+        "temperature": 1.0,
+        "top_k": 50,
+        "top_p": 1.0,
+        "typical_p": 1.0,
+        "repetition_penalty": 1.0,
+        "length_penalty": 1.0,
+        "no_repeat_ngram_size": 0,
+        "encoder_no_repeat_ngram_size": 0,
+        "bad_words_ids": null,
+        "num_return_sequences": 1,
+        "output_scores": false,
+        "return_dict_in_generate": false,
+        "forced_bos_token_id": null,
+        "forced_eos_token_id": null,
+        "remove_invalid_values": false,
+        "exponential_decay_length_penalty": null,
+        "suppress_tokens": null,
+        "begin_suppress_tokens": null,
+        "_name_or_path": "",
+        "model_type": "siglip_vision_model",
+        "vision_use_head": false,
+        "tf_legacy_loss": false,
+        "use_bfloat16": false,
+        "hidden_size": 1152,
+        "intermediate_size": 4304,
+        "num_hidden_layers": 27,
+        "num_attention_heads": 16,
+        "num_channels": 3,
+        "patch_size": 16,
+        "image_size": 512,
+        "attention_dropout": 0.0,
+        "layer_norm_eps": 1e-06,
+        "hidden_act": "gelu_pytorch_tanh",
+        "output_attentions": false
+    },
+    "vision_feature_layer": -1,
+    "vision_feature_select_strategy": "full"
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,11 @@

+{
+  "_from_model_config": true,
+  "bos_token_id": 5,
+  "cache_implementation": "hybrid",
+  "eos_token_id": 255001,
+  "pad_token_id": 0,
+  "transformers_version": "4.54.0.dev0",
+  "do_sample": true,
+  "temperature": 0.3,
+  "top_p": 0.75
+}

model-00001-of-00013.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aa779c55e949b329b9eb0ab1f2ff21ed733fd6ab75c582390898f9dcf9c50556
+size 5187165354

model-00002-of-00013.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:99995f68cd207fdff71b069e88a8c61fa3fe8953e1021e1add5195a4e61bc9a6
+size 5181177720

model-00003-of-00013.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1a73e55635fe46aa054c90a70dc6123f81e5bb64006507acce98c81a95d609fe
+size 5251930831

model-00004-of-00013.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c09c87402747177ee1b8f1635f8c7a8fbe67b3fba43e31a6da1fbbc355a0a6a1
+size 5181177868

model-00005-of-00013.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4dbcdc366777d70e2ec1e20c0b4e1fa6f527f86f0ce9d29bdacec1177dc9ad74
+size 5251930845

model-00006-of-00013.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:508bd34c43f478f15127db03aae25c4b0b35558abb5f7ea397e1a735be387cac
+size 5181177880

model-00007-of-00013.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f4058d27d83900cff45e26a3b8dcb166f592eeea8b8db9d57d7a174c7f925897
+size 5251930853

model-00008-of-00013.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7c6e06138a992e760d033b23dc527827b4e97436c54c87c350fc8ec013aded1f
+size 5181177874

model-00009-of-00013.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b70d182e6d4faacabf18f06d1ea4aec97a6298ffe5b7e4a757b84dbc0d420776
+size 5251930885

model-00010-of-00013.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:83b97d6cca648f83a2699ab3d6d56129b3b6ee44853687d56e81d59cfe0e7ff8
+size 5181177850

model-00011-of-00013.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cf9961478e36ae1eae0a138c0deaead01f6cfa13e0771221ca3a47261b65a3a9
+size 5251930867

model-00012-of-00013.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:34f1263082f5bdbe9900a0f1ee010949d705aab4cbc8e73dec6323218bde05c0
+size 5181177856

model-00013-of-00013.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:709cb24acb8f656cf73c22bebb149c4329b6edf37c2e245640d54400e95fb56b
+size 987515121

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,963 @@

+{
+  "metadata": {
+    "total_parameters": 111867525360,
+    "total_size": 223735050720
+  },
+  "weight_map": {
+    "model.language_model.embed_tokens.weight": "model-00001-of-00050.safetensors",
+    "model.language_model.layers.0.input_layernorm.weight": "model-00002-of-00050.safetensors",
+    "model.language_model.layers.0.mlp.down_proj.weight": "model-00002-of-00050.safetensors",
+    "model.language_model.layers.0.mlp.gate_proj.weight": "model-00002-of-00050.safetensors",
+    "model.language_model.layers.0.mlp.up_proj.weight": "model-00002-of-00050.safetensors",
+    "model.language_model.layers.0.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.language_model.layers.0.self_attn.o_proj.weight": "model-00002-of-00050.safetensors",
+    "model.language_model.layers.0.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.language_model.layers.0.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.language_model.layers.1.input_layernorm.weight": "model-00003-of-00050.safetensors",
+    "model.language_model.layers.1.mlp.down_proj.weight": "model-00003-of-00050.safetensors",
+    "model.language_model.layers.1.mlp.gate_proj.weight": "model-00003-of-00050.safetensors",
+    "model.language_model.layers.1.mlp.up_proj.weight": "model-00003-of-00050.safetensors",
+    "model.language_model.layers.1.self_attn.k_proj.weight": "model-00003-of-00050.safetensors",
+    "model.language_model.layers.1.self_attn.o_proj.weight": "model-00003-of-00050.safetensors",
+    "model.language_model.layers.1.self_attn.q_proj.weight": "model-00003-of-00050.safetensors",
+    "model.language_model.layers.1.self_attn.v_proj.weight": "model-00003-of-00050.safetensors",
+    "model.language_model.layers.10.input_layernorm.weight": "model-00010-of-00050.safetensors",
+    "model.language_model.layers.10.mlp.down_proj.weight": "model-00010-of-00050.safetensors",
+    "model.language_model.layers.10.mlp.gate_proj.weight": "model-00009-of-00050.safetensors",
+    "model.language_model.layers.10.mlp.up_proj.weight": "model-00010-of-00050.safetensors",
+    "model.language_model.layers.10.self_attn.k_proj.weight": "model-00009-of-00050.safetensors",
+    "model.language_model.layers.10.self_attn.o_proj.weight": "model-00009-of-00050.safetensors",
+    "model.language_model.layers.10.self_attn.q_proj.weight": "model-00009-of-00050.safetensors",
+    "model.language_model.layers.10.self_attn.v_proj.weight": "model-00009-of-00050.safetensors",
+    "model.language_model.layers.11.input_layernorm.weight": "model-00011-of-00050.safetensors",
+    "model.language_model.layers.11.mlp.down_proj.weight": "model-00011-of-00050.safetensors",
+    "model.language_model.layers.11.mlp.gate_proj.weight": "model-00010-of-00050.safetensors",
+    "model.language_model.layers.11.mlp.up_proj.weight": "model-00010-of-00050.safetensors",
+    "model.language_model.layers.11.self_attn.k_proj.weight": "model-00010-of-00050.safetensors",
+    "model.language_model.layers.11.self_attn.o_proj.weight": "model-00010-of-00050.safetensors",
+    "model.language_model.layers.11.self_attn.q_proj.weight": "model-00010-of-00050.safetensors",
+    "model.language_model.layers.11.self_attn.v_proj.weight": "model-00010-of-00050.safetensors",
+    "model.language_model.layers.12.input_layernorm.weight": "model-00011-of-00050.safetensors",
+    "model.language_model.layers.12.mlp.down_proj.weight": "model-00011-of-00050.safetensors",
+    "model.language_model.layers.12.mlp.gate_proj.weight": "model-00011-of-00050.safetensors",
+    "model.language_model.layers.12.mlp.up_proj.weight": "model-00011-of-00050.safetensors",
+    "model.language_model.layers.12.self_attn.k_proj.weight": "model-00011-of-00050.safetensors",
+    "model.language_model.layers.12.self_attn.o_proj.weight": "model-00011-of-00050.safetensors",
+    "model.language_model.layers.12.self_attn.q_proj.weight": "model-00011-of-00050.safetensors",
+    "model.language_model.layers.12.self_attn.v_proj.weight": "model-00011-of-00050.safetensors",
+    "model.language_model.layers.13.input_layernorm.weight": "model-00012-of-00050.safetensors",
+    "model.language_model.layers.13.mlp.down_proj.weight": "model-00012-of-00050.safetensors",
+    "model.language_model.layers.13.mlp.gate_proj.weight": "model-00012-of-00050.safetensors",
+    "model.language_model.layers.13.mlp.up_proj.weight": "model-00012-of-00050.safetensors",
+    "model.language_model.layers.13.self_attn.k_proj.weight": "model-00011-of-00050.safetensors",
+    "model.language_model.layers.13.self_attn.o_proj.weight": "model-00011-of-00050.safetensors",
+    "model.language_model.layers.13.self_attn.q_proj.weight": "model-00011-of-00050.safetensors",
+    "model.language_model.layers.13.self_attn.v_proj.weight": "model-00011-of-00050.safetensors",
+    "model.language_model.layers.14.input_layernorm.weight": "model-00013-of-00050.safetensors",
+    "model.language_model.layers.14.mlp.down_proj.weight": "model-00013-of-00050.safetensors",
+    "model.language_model.layers.14.mlp.gate_proj.weight": "model-00012-of-00050.safetensors",
+    "model.language_model.layers.14.mlp.up_proj.weight": "model-00013-of-00050.safetensors",
+    "model.language_model.layers.14.self_attn.k_proj.weight": "model-00012-of-00050.safetensors",
+    "model.language_model.layers.14.self_attn.o_proj.weight": "model-00012-of-00050.safetensors",
+    "model.language_model.layers.14.self_attn.q_proj.weight": "model-00012-of-00050.safetensors",
+    "model.language_model.layers.14.self_attn.v_proj.weight": "model-00012-of-00050.safetensors",
+    "model.language_model.layers.15.input_layernorm.weight": "model-00014-of-00050.safetensors",
+    "model.language_model.layers.15.mlp.down_proj.weight": "model-00014-of-00050.safetensors",
+    "model.language_model.layers.15.mlp.gate_proj.weight": "model-00013-of-00050.safetensors",
+    "model.language_model.layers.15.mlp.up_proj.weight": "model-00013-of-00050.safetensors",
+    "model.language_model.layers.15.self_attn.k_proj.weight": "model-00013-of-00050.safetensors",
+    "model.language_model.layers.15.self_attn.o_proj.weight": "model-00013-of-00050.safetensors",
+    "model.language_model.layers.15.self_attn.q_proj.weight": "model-00013-of-00050.safetensors",
+    "model.language_model.layers.15.self_attn.v_proj.weight": "model-00013-of-00050.safetensors",
+    "model.language_model.layers.16.input_layernorm.weight": "model-00014-of-00050.safetensors",
+    "model.language_model.layers.16.mlp.down_proj.weight": "model-00014-of-00050.safetensors",
+    "model.language_model.layers.16.mlp.gate_proj.weight": "model-00014-of-00050.safetensors",
+    "model.language_model.layers.16.mlp.up_proj.weight": "model-00014-of-00050.safetensors",
+    "model.language_model.layers.16.self_attn.k_proj.weight": "model-00014-of-00050.safetensors",
+    "model.language_model.layers.16.self_attn.o_proj.weight": "model-00014-of-00050.safetensors",
+    "model.language_model.layers.16.self_attn.q_proj.weight": "model-00014-of-00050.safetensors",
+    "model.language_model.layers.16.self_attn.v_proj.weight": "model-00014-of-00050.safetensors",
+    "model.language_model.layers.17.input_layernorm.weight": "model-00015-of-00050.safetensors",
+    "model.language_model.layers.17.mlp.down_proj.weight": "model-00015-of-00050.safetensors",
+    "model.language_model.layers.17.mlp.gate_proj.weight": "model-00015-of-00050.safetensors",
+    "model.language_model.layers.17.mlp.up_proj.weight": "model-00015-of-00050.safetensors",
+    "model.language_model.layers.17.self_attn.k_proj.weight": "model-00014-of-00050.safetensors",
+    "model.language_model.layers.17.self_attn.o_proj.weight": "model-00014-of-00050.safetensors",
+    "model.language_model.layers.17.self_attn.q_proj.weight": "model-00014-of-00050.safetensors",
+    "model.language_model.layers.17.self_attn.v_proj.weight": "model-00014-of-00050.safetensors",
+    "model.language_model.layers.18.input_layernorm.weight": "model-00016-of-00050.safetensors",
+    "model.language_model.layers.18.mlp.down_proj.weight": "model-00016-of-00050.safetensors",
+    "model.language_model.layers.18.mlp.gate_proj.weight": "model-00015-of-00050.safetensors",
+    "model.language_model.layers.18.mlp.up_proj.weight": "model-00016-of-00050.safetensors",
+    "model.language_model.layers.18.self_attn.k_proj.weight": "model-00015-of-00050.safetensors",
+    "model.language_model.layers.18.self_attn.o_proj.weight": "model-00015-of-00050.safetensors",
+    "model.language_model.layers.18.self_attn.q_proj.weight": "model-00015-of-00050.safetensors",
+    "model.language_model.layers.18.self_attn.v_proj.weight": "model-00015-of-00050.safetensors",
+    "model.language_model.layers.19.input_layernorm.weight": "model-00017-of-00050.safetensors",
+    "model.language_model.layers.19.mlp.down_proj.weight": "model-00017-of-00050.safetensors",
+    "model.language_model.layers.19.mlp.gate_proj.weight": "model-00016-of-00050.safetensors",
+    "model.language_model.layers.19.mlp.up_proj.weight": "model-00016-of-00050.safetensors",
+    "model.language_model.layers.19.self_attn.k_proj.weight": "model-00016-of-00050.safetensors",
+    "model.language_model.layers.19.self_attn.o_proj.weight": "model-00016-of-00050.safetensors",
+    "model.language_model.layers.19.self_attn.q_proj.weight": "model-00016-of-00050.safetensors",
+    "model.language_model.layers.19.self_attn.v_proj.weight": "model-00016-of-00050.safetensors",
+    "model.language_model.layers.2.input_layernorm.weight": "model-00004-of-00050.safetensors",
+    "model.language_model.layers.2.mlp.down_proj.weight": "model-00004-of-00050.safetensors",
+    "model.language_model.layers.2.mlp.gate_proj.weight": "model-00003-of-00050.safetensors",
+    "model.language_model.layers.2.mlp.up_proj.weight": "model-00004-of-00050.safetensors",
+    "model.language_model.layers.2.self_attn.k_proj.weight": "model-00003-of-00050.safetensors",
+    "model.language_model.layers.2.self_attn.o_proj.weight": "model-00003-of-00050.safetensors",
+    "model.language_model.layers.2.self_attn.q_proj.weight": "model-00003-of-00050.safetensors",
+    "model.language_model.layers.2.self_attn.v_proj.weight": "model-00003-of-00050.safetensors",
+    "model.language_model.layers.20.input_layernorm.weight": "model-00017-of-00050.safetensors",
+    "model.language_model.layers.20.mlp.down_proj.weight": "model-00017-of-00050.safetensors",
+    "model.language_model.layers.20.mlp.gate_proj.weight": "model-00017-of-00050.safetensors",
+    "model.language_model.layers.20.mlp.up_proj.weight": "model-00017-of-00050.safetensors",
+    "model.language_model.layers.20.self_attn.k_proj.weight": "model-00017-of-00050.safetensors",
+    "model.language_model.layers.20.self_attn.o_proj.weight": "model-00017-of-00050.safetensors",
+    "model.language_model.layers.20.self_attn.q_proj.weight": "model-00017-of-00050.safetensors",
+    "model.language_model.layers.20.self_attn.v_proj.weight": "model-00017-of-00050.safetensors",
+    "model.language_model.layers.21.input_layernorm.weight": "model-00018-of-00050.safetensors",
+    "model.language_model.layers.21.mlp.down_proj.weight": "model-00018-of-00050.safetensors",
+    "model.language_model.layers.21.mlp.gate_proj.weight": "model-00018-of-00050.safetensors",
+    "model.language_model.layers.21.mlp.up_proj.weight": "model-00018-of-00050.safetensors",
+    "model.language_model.layers.21.self_attn.k_proj.weight": "model-00017-of-00050.safetensors",
+    "model.language_model.layers.21.self_attn.o_proj.weight": "model-00017-of-00050.safetensors",
+    "model.language_model.layers.21.self_attn.q_proj.weight": "model-00017-of-00050.safetensors",
+    "model.language_model.layers.21.self_attn.v_proj.weight": "model-00017-of-00050.safetensors",
+    "model.language_model.layers.22.input_layernorm.weight": "model-00019-of-00050.safetensors",
+    "model.language_model.layers.22.mlp.down_proj.weight": "model-00019-of-00050.safetensors",
+    "model.language_model.layers.22.mlp.gate_proj.weight": "model-00018-of-00050.safetensors",
+    "model.language_model.layers.22.mlp.up_proj.weight": "model-00019-of-00050.safetensors",
+    "model.language_model.layers.22.self_attn.k_proj.weight": "model-00018-of-00050.safetensors",
+    "model.language_model.layers.22.self_attn.o_proj.weight": "model-00018-of-00050.safetensors",
+    "model.language_model.layers.22.self_attn.q_proj.weight": "model-00018-of-00050.safetensors",
+    "model.language_model.layers.22.self_attn.v_proj.weight": "model-00018-of-00050.safetensors",
+    "model.language_model.layers.23.input_layernorm.weight": "model-00020-of-00050.safetensors",
+    "model.language_model.layers.23.mlp.down_proj.weight": "model-00020-of-00050.safetensors",
+    "model.language_model.layers.23.mlp.gate_proj.weight": "model-00019-of-00050.safetensors",
+    "model.language_model.layers.23.mlp.up_proj.weight": "model-00019-of-00050.safetensors",
+    "model.language_model.layers.23.self_attn.k_proj.weight": "model-00019-of-00050.safetensors",
+    "model.language_model.layers.23.self_attn.o_proj.weight": "model-00019-of-00050.safetensors",
+    "model.language_model.layers.23.self_attn.q_proj.weight": "model-00019-of-00050.safetensors",
+    "model.language_model.layers.23.self_attn.v_proj.weight": "model-00019-of-00050.safetensors",
+    "model.language_model.layers.24.input_layernorm.weight": "model-00020-of-00050.safetensors",
+    "model.language_model.layers.24.mlp.down_proj.weight": "model-00020-of-00050.safetensors",
+    "model.language_model.layers.24.mlp.gate_proj.weight": "model-00020-of-00050.safetensors",
+    "model.language_model.layers.24.mlp.up_proj.weight": "model-00020-of-00050.safetensors",
+    "model.language_model.layers.24.self_attn.k_proj.weight": "model-00020-of-00050.safetensors",
+    "model.language_model.layers.24.self_attn.o_proj.weight": "model-00020-of-00050.safetensors",
+    "model.language_model.layers.24.self_attn.q_proj.weight": "model-00020-of-00050.safetensors",
+    "model.language_model.layers.24.self_attn.v_proj.weight": "model-00020-of-00050.safetensors",
+    "model.language_model.layers.25.input_layernorm.weight": "model-00021-of-00050.safetensors",
+    "model.language_model.layers.25.mlp.down_proj.weight": "model-00021-of-00050.safetensors",
+    "model.language_model.layers.25.mlp.gate_proj.weight": "model-00021-of-00050.safetensors",
+    "model.language_model.layers.25.mlp.up_proj.weight": "model-00021-of-00050.safetensors",
+    "model.language_model.layers.25.self_attn.k_proj.weight": "model-00020-of-00050.safetensors",
+    "model.language_model.layers.25.self_attn.o_proj.weight": "model-00020-of-00050.safetensors",
+    "model.language_model.layers.25.self_attn.q_proj.weight": "model-00020-of-00050.safetensors",
+    "model.language_model.layers.25.self_attn.v_proj.weight": "model-00020-of-00050.safetensors",
+    "model.language_model.layers.26.input_layernorm.weight": "model-00022-of-00050.safetensors",
+    "model.language_model.layers.26.mlp.down_proj.weight": "model-00022-of-00050.safetensors",
+    "model.language_model.layers.26.mlp.gate_proj.weight": "model-00021-of-00050.safetensors",
+    "model.language_model.layers.26.mlp.up_proj.weight": "model-00022-of-00050.safetensors",
+    "model.language_model.layers.26.self_attn.k_proj.weight": "model-00021-of-00050.safetensors",
+    "model.language_model.layers.26.self_attn.o_proj.weight": "model-00021-of-00050.safetensors",
+    "model.language_model.layers.26.self_attn.q_proj.weight": "model-00021-of-00050.safetensors",
+    "model.language_model.layers.26.self_attn.v_proj.weight": "model-00021-of-00050.safetensors",
+    "model.language_model.layers.27.input_layernorm.weight": "model-00023-of-00050.safetensors",
+    "model.language_model.layers.27.mlp.down_proj.weight": "model-00023-of-00050.safetensors",
+    "model.language_model.layers.27.mlp.gate_proj.weight": "model-00022-of-00050.safetensors",
+    "model.language_model.layers.27.mlp.up_proj.weight": "model-00022-of-00050.safetensors",
+    "model.language_model.layers.27.self_attn.k_proj.weight": "model-00022-of-00050.safetensors",
+    "model.language_model.layers.27.self_attn.o_proj.weight": "model-00022-of-00050.safetensors",
+    "model.language_model.layers.27.self_attn.q_proj.weight": "model-00022-of-00050.safetensors",
+    "model.language_model.layers.27.self_attn.v_proj.weight": "model-00022-of-00050.safetensors",
+    "model.language_model.layers.28.input_layernorm.weight": "model-00023-of-00050.safetensors",
+    "model.language_model.layers.28.mlp.down_proj.weight": "model-00023-of-00050.safetensors",
+    "model.language_model.layers.28.mlp.gate_proj.weight": "model-00023-of-00050.safetensors",
+    "model.language_model.layers.28.mlp.up_proj.weight": "model-00023-of-00050.safetensors",
+    "model.language_model.layers.28.self_attn.k_proj.weight": "model-00023-of-00050.safetensors",
+    "model.language_model.layers.28.self_attn.o_proj.weight": "model-00023-of-00050.safetensors",
+    "model.language_model.layers.28.self_attn.q_proj.weight": "model-00023-of-00050.safetensors",
+    "model.language_model.layers.28.self_attn.v_proj.weight": "model-00023-of-00050.safetensors",
+    "model.language_model.layers.29.input_layernorm.weight": "model-00024-of-00050.safetensors",
+    "model.language_model.layers.29.mlp.down_proj.weight": "model-00024-of-00050.safetensors",
+    "model.language_model.layers.29.mlp.gate_proj.weight": "model-00024-of-00050.safetensors",
+    "model.language_model.layers.29.mlp.up_proj.weight": "model-00024-of-00050.safetensors",
+    "model.language_model.layers.29.self_attn.k_proj.weight": "model-00023-of-00050.safetensors",
+    "model.language_model.layers.29.self_attn.o_proj.weight": "model-00023-of-00050.safetensors",
+    "model.language_model.layers.29.self_attn.q_proj.weight": "model-00023-of-00050.safetensors",
+    "model.language_model.layers.29.self_attn.v_proj.weight": "model-00023-of-00050.safetensors",
+    "model.language_model.layers.3.input_layernorm.weight": "model-00005-of-00050.safetensors",
+    "model.language_model.layers.3.mlp.down_proj.weight": "model-00005-of-00050.safetensors",
+    "model.language_model.layers.3.mlp.gate_proj.weight": "model-00004-of-00050.safetensors",
+    "model.language_model.layers.3.mlp.up_proj.weight": "model-00004-of-00050.safetensors",
+    "model.language_model.layers.3.self_attn.k_proj.weight": "model-00004-of-00050.safetensors",
+    "model.language_model.layers.3.self_attn.o_proj.weight": "model-00004-of-00050.safetensors",
+    "model.language_model.layers.3.self_attn.q_proj.weight": "model-00004-of-00050.safetensors",
+    "model.language_model.layers.3.self_attn.v_proj.weight": "model-00004-of-00050.safetensors",
+    "model.language_model.layers.30.input_layernorm.weight": "model-00025-of-00050.safetensors",
+    "model.language_model.layers.30.mlp.down_proj.weight": "model-00025-of-00050.safetensors",
+    "model.language_model.layers.30.mlp.gate_proj.weight": "model-00024-of-00050.safetensors",
+    "model.language_model.layers.30.mlp.up_proj.weight": "model-00025-of-00050.safetensors",
+    "model.language_model.layers.30.self_attn.k_proj.weight": "model-00024-of-00050.safetensors",
+    "model.language_model.layers.30.self_attn.o_proj.weight": "model-00024-of-00050.safetensors",
+    "model.language_model.layers.30.self_attn.q_proj.weight": "model-00024-of-00050.safetensors",
+    "model.language_model.layers.30.self_attn.v_proj.weight": "model-00024-of-00050.safetensors",
+    "model.language_model.layers.31.input_layernorm.weight": "model-00026-of-00050.safetensors",
+    "model.language_model.layers.31.mlp.down_proj.weight": "model-00026-of-00050.safetensors",
+    "model.language_model.layers.31.mlp.gate_proj.weight": "model-00025-of-00050.safetensors",
+    "model.language_model.layers.31.mlp.up_proj.weight": "model-00025-of-00050.safetensors",
+    "model.language_model.layers.31.self_attn.k_proj.weight": "model-00025-of-00050.safetensors",
+    "model.language_model.layers.31.self_attn.o_proj.weight": "model-00025-of-00050.safetensors",
+    "model.language_model.layers.31.self_attn.q_proj.weight": "model-00025-of-00050.safetensors",
+    "model.language_model.layers.31.self_attn.v_proj.weight": "model-00025-of-00050.safetensors",
+    "model.language_model.layers.32.input_layernorm.weight": "model-00026-of-00050.safetensors",
+    "model.language_model.layers.32.mlp.down_proj.weight": "model-00026-of-00050.safetensors",
+    "model.language_model.layers.32.mlp.gate_proj.weight": "model-00026-of-00050.safetensors",
+    "model.language_model.layers.32.mlp.up_proj.weight": "model-00026-of-00050.safetensors",
+    "model.language_model.layers.32.self_attn.k_proj.weight": "model-00026-of-00050.safetensors",
+    "model.language_model.layers.32.self_attn.o_proj.weight": "model-00026-of-00050.safetensors",
+    "model.language_model.layers.32.self_attn.q_proj.weight": "model-00026-of-00050.safetensors",
+    "model.language_model.layers.32.self_attn.v_proj.weight": "model-00026-of-00050.safetensors",
+    "model.language_model.layers.33.input_layernorm.weight": "model-00027-of-00050.safetensors",
+    "model.language_model.layers.33.mlp.down_proj.weight": "model-00027-of-00050.safetensors",
+    "model.language_model.layers.33.mlp.gate_proj.weight": "model-00027-of-00050.safetensors",
+    "model.language_model.layers.33.mlp.up_proj.weight": "model-00027-of-00050.safetensors",
+    "model.language_model.layers.33.self_attn.k_proj.weight": "model-00026-of-00050.safetensors",
+    "model.language_model.layers.33.self_attn.o_proj.weight": "model-00026-of-00050.safetensors",
+    "model.language_model.layers.33.self_attn.q_proj.weight": "model-00026-of-00050.safetensors",
+    "model.language_model.layers.33.self_attn.v_proj.weight": "model-00026-of-00050.safetensors",
+    "model.language_model.layers.34.input_layernorm.weight": "model-00028-of-00050.safetensors",
+    "model.language_model.layers.34.mlp.down_proj.weight": "model-00028-of-00050.safetensors",
+    "model.language_model.layers.34.mlp.gate_proj.weight": "model-00027-of-00050.safetensors",
+    "model.language_model.layers.34.mlp.up_proj.weight": "model-00028-of-00050.safetensors",
+    "model.language_model.layers.34.self_attn.k_proj.weight": "model-00027-of-00050.safetensors",
+    "model.language_model.layers.34.self_attn.o_proj.weight": "model-00027-of-00050.safetensors",
+    "model.language_model.layers.34.self_attn.q_proj.weight": "model-00027-of-00050.safetensors",
+    "model.language_model.layers.34.self_attn.v_proj.weight": "model-00027-of-00050.safetensors",
+    "model.language_model.layers.35.input_layernorm.weight": "model-00029-of-00050.safetensors",
+    "model.language_model.layers.35.mlp.down_proj.weight": "model-00029-of-00050.safetensors",
+    "model.language_model.layers.35.mlp.gate_proj.weight": "model-00028-of-00050.safetensors",
+    "model.language_model.layers.35.mlp.up_proj.weight": "model-00028-of-00050.safetensors",
+    "model.language_model.layers.35.self_attn.k_proj.weight": "model-00028-of-00050.safetensors",
+    "model.language_model.layers.35.self_attn.o_proj.weight": "model-00028-of-00050.safetensors",
+    "model.language_model.layers.35.self_attn.q_proj.weight": "model-00028-of-00050.safetensors",
+    "model.language_model.layers.35.self_attn.v_proj.weight": "model-00028-of-00050.safetensors",
+    "model.language_model.layers.36.input_layernorm.weight": "model-00029-of-00050.safetensors",
+    "model.language_model.layers.36.mlp.down_proj.weight": "model-00029-of-00050.safetensors",
+    "model.language_model.layers.36.mlp.gate_proj.weight": "model-00029-of-00050.safetensors",
+    "model.language_model.layers.36.mlp.up_proj.weight": "model-00029-of-00050.safetensors",
+    "model.language_model.layers.36.self_attn.k_proj.weight": "model-00029-of-00050.safetensors",
+    "model.language_model.layers.36.self_attn.o_proj.weight": "model-00029-of-00050.safetensors",
+    "model.language_model.layers.36.self_attn.q_proj.weight": "model-00029-of-00050.safetensors",
+    "model.language_model.layers.36.self_attn.v_proj.weight": "model-00029-of-00050.safetensors",
+    "model.language_model.layers.37.input_layernorm.weight": "model-00030-of-00050.safetensors",
+    "model.language_model.layers.37.mlp.down_proj.weight": "model-00030-of-00050.safetensors",
+    "model.language_model.layers.37.mlp.gate_proj.weight": "model-00030-of-00050.safetensors",
+    "model.language_model.layers.37.mlp.up_proj.weight": "model-00030-of-00050.safetensors",
+    "model.language_model.layers.37.self_attn.k_proj.weight": "model-00029-of-00050.safetensors",
+    "model.language_model.layers.37.self_attn.o_proj.weight": "model-00029-of-00050.safetensors",
+    "model.language_model.layers.37.self_attn.q_proj.weight": "model-00029-of-00050.safetensors",
+    "model.language_model.layers.37.self_attn.v_proj.weight": "model-00029-of-00050.safetensors",
+    "model.language_model.layers.38.input_layernorm.weight": "model-00031-of-00050.safetensors",
+    "model.language_model.layers.38.mlp.down_proj.weight": "model-00031-of-00050.safetensors",
+    "model.language_model.layers.38.mlp.gate_proj.weight": "model-00030-of-00050.safetensors",
+    "model.language_model.layers.38.mlp.up_proj.weight": "model-00031-of-00050.safetensors",
+    "model.language_model.layers.38.self_attn.k_proj.weight": "model-00030-of-00050.safetensors",
+    "model.language_model.layers.38.self_attn.o_proj.weight": "model-00030-of-00050.safetensors",
+    "model.language_model.layers.38.self_attn.q_proj.weight": "model-00030-of-00050.safetensors",
+    "model.language_model.layers.38.self_attn.v_proj.weight": "model-00030-of-00050.safetensors",
+    "model.language_model.layers.39.input_layernorm.weight": "model-00032-of-00050.safetensors",
+    "model.language_model.layers.39.mlp.down_proj.weight": "model-00032-of-00050.safetensors",
+    "model.language_model.layers.39.mlp.gate_proj.weight": "model-00031-of-00050.safetensors",
+    "model.language_model.layers.39.mlp.up_proj.weight": "model-00031-of-00050.safetensors",
+    "model.language_model.layers.39.self_attn.k_proj.weight": "model-00031-of-00050.safetensors",
+    "model.language_model.layers.39.self_attn.o_proj.weight": "model-00031-of-00050.safetensors",
+    "model.language_model.layers.39.self_attn.q_proj.weight": "model-00031-of-00050.safetensors",
+    "model.language_model.layers.39.self_attn.v_proj.weight": "model-00031-of-00050.safetensors",
+    "model.language_model.layers.4.input_layernorm.weight": "model-00005-of-00050.safetensors",
+    "model.language_model.layers.4.mlp.down_proj.weight": "model-00005-of-00050.safetensors",
+    "model.language_model.layers.4.mlp.gate_proj.weight": "model-00005-of-00050.safetensors",
+    "model.language_model.layers.4.mlp.up_proj.weight": "model-00005-of-00050.safetensors",
+    "model.language_model.layers.4.self_attn.k_proj.weight": "model-00005-of-00050.safetensors",
+    "model.language_model.layers.4.self_attn.o_proj.weight": "model-00005-of-00050.safetensors",
+    "model.language_model.layers.4.self_attn.q_proj.weight": "model-00005-of-00050.safetensors",
+    "model.language_model.layers.4.self_attn.v_proj.weight": "model-00005-of-00050.safetensors",
+    "model.language_model.layers.40.input_layernorm.weight": "model-00032-of-00050.safetensors",
+    "model.language_model.layers.40.mlp.down_proj.weight": "model-00032-of-00050.safetensors",
+    "model.language_model.layers.40.mlp.gate_proj.weight": "model-00032-of-00050.safetensors",
+    "model.language_model.layers.40.mlp.up_proj.weight": "model-00032-of-00050.safetensors",
+    "model.language_model.layers.40.self_attn.k_proj.weight": "model-00032-of-00050.safetensors",
+    "model.language_model.layers.40.self_attn.o_proj.weight": "model-00032-of-00050.safetensors",
+    "model.language_model.layers.40.self_attn.q_proj.weight": "model-00032-of-00050.safetensors",
+    "model.language_model.layers.40.self_attn.v_proj.weight": "model-00032-of-00050.safetensors",
+    "model.language_model.layers.41.input_layernorm.weight": "model-00033-of-00050.safetensors",
+    "model.language_model.layers.41.mlp.down_proj.weight": "model-00033-of-00050.safetensors",
+    "model.language_model.layers.41.mlp.gate_proj.weight": "model-00033-of-00050.safetensors",
+    "model.language_model.layers.41.mlp.up_proj.weight": "model-00033-of-00050.safetensors",
+    "model.language_model.layers.41.self_attn.k_proj.weight": "model-00032-of-00050.safetensors",
+    "model.language_model.layers.41.self_attn.o_proj.weight": "model-00032-of-00050.safetensors",
+    "model.language_model.layers.41.self_attn.q_proj.weight": "model-00032-of-00050.safetensors",
+    "model.language_model.layers.41.self_attn.v_proj.weight": "model-00032-of-00050.safetensors",
+    "model.language_model.layers.42.input_layernorm.weight": "model-00034-of-00050.safetensors",
+    "model.language_model.layers.42.mlp.down_proj.weight": "model-00034-of-00050.safetensors",
+    "model.language_model.layers.42.mlp.gate_proj.weight": "model-00033-of-00050.safetensors",
+    "model.language_model.layers.42.mlp.up_proj.weight": "model-00034-of-00050.safetensors",
+    "model.language_model.layers.42.self_attn.k_proj.weight": "model-00033-of-00050.safetensors",
+    "model.language_model.layers.42.self_attn.o_proj.weight": "model-00033-of-00050.safetensors",
+    "model.language_model.layers.42.self_attn.q_proj.weight": "model-00033-of-00050.safetensors",
+    "model.language_model.layers.42.self_attn.v_proj.weight": "model-00033-of-00050.safetensors",
+    "model.language_model.layers.43.input_layernorm.weight": "model-00035-of-00050.safetensors",
+    "model.language_model.layers.43.mlp.down_proj.weight": "model-00035-of-00050.safetensors",
+    "model.language_model.layers.43.mlp.gate_proj.weight": "model-00034-of-00050.safetensors",
+    "model.language_model.layers.43.mlp.up_proj.weight": "model-00034-of-00050.safetensors",
+    "model.language_model.layers.43.self_attn.k_proj.weight": "model-00034-of-00050.safetensors",
+    "model.language_model.layers.43.self_attn.o_proj.weight": "model-00034-of-00050.safetensors",
+    "model.language_model.layers.43.self_attn.q_proj.weight": "model-00034-of-00050.safetensors",
+    "model.language_model.layers.43.self_attn.v_proj.weight": "model-00034-of-00050.safetensors",
+    "model.language_model.layers.44.input_layernorm.weight": "model-00035-of-00050.safetensors",
+    "model.language_model.layers.44.mlp.down_proj.weight": "model-00035-of-00050.safetensors",
+    "model.language_model.layers.44.mlp.gate_proj.weight": "model-00035-of-00050.safetensors",
+    "model.language_model.layers.44.mlp.up_proj.weight": "model-00035-of-00050.safetensors",
+    "model.language_model.layers.44.self_attn.k_proj.weight": "model-00035-of-00050.safetensors",
+    "model.language_model.layers.44.self_attn.o_proj.weight": "model-00035-of-00050.safetensors",
+    "model.language_model.layers.44.self_attn.q_proj.weight": "model-00035-of-00050.safetensors",
+    "model.language_model.layers.44.self_attn.v_proj.weight": "model-00035-of-00050.safetensors",
+    "model.language_model.layers.45.input_layernorm.weight": "model-00036-of-00050.safetensors",
+    "model.language_model.layers.45.mlp.down_proj.weight": "model-00036-of-00050.safetensors",
+    "model.language_model.layers.45.mlp.gate_proj.weight": "model-00036-of-00050.safetensors",
+    "model.language_model.layers.45.mlp.up_proj.weight": "model-00036-of-00050.safetensors",
+    "model.language_model.layers.45.self_attn.k_proj.weight": "model-00035-of-00050.safetensors",
+    "model.language_model.layers.45.self_attn.o_proj.weight": "model-00035-of-00050.safetensors",
+    "model.language_model.layers.45.self_attn.q_proj.weight": "model-00035-of-00050.safetensors",
+    "model.language_model.layers.45.self_attn.v_proj.weight": "model-00035-of-00050.safetensors",
+    "model.language_model.layers.46.input_layernorm.weight": "model-00037-of-00050.safetensors",
+    "model.language_model.layers.46.mlp.down_proj.weight": "model-00037-of-00050.safetensors",
+    "model.language_model.layers.46.mlp.gate_proj.weight": "model-00036-of-00050.safetensors",
+    "model.language_model.layers.46.mlp.up_proj.weight": "model-00037-of-00050.safetensors",
+    "model.language_model.layers.46.self_attn.k_proj.weight": "model-00036-of-00050.safetensors",
+    "model.language_model.layers.46.self_attn.o_proj.weight": "model-00036-of-00050.safetensors",
+    "model.language_model.layers.46.self_attn.q_proj.weight": "model-00036-of-00050.safetensors",
+    "model.language_model.layers.46.self_attn.v_proj.weight": "model-00036-of-00050.safetensors",
+    "model.language_model.layers.47.input_layernorm.weight": "model-00038-of-00050.safetensors",
+    "model.language_model.layers.47.mlp.down_proj.weight": "model-00038-of-00050.safetensors",
+    "model.language_model.layers.47.mlp.gate_proj.weight": "model-00037-of-00050.safetensors",
+    "model.language_model.layers.47.mlp.up_proj.weight": "model-00037-of-00050.safetensors",
+    "model.language_model.layers.47.self_attn.k_proj.weight": "model-00037-of-00050.safetensors",
+    "model.language_model.layers.47.self_attn.o_proj.weight": "model-00037-of-00050.safetensors",
+    "model.language_model.layers.47.self_attn.q_proj.weight": "model-00037-of-00050.safetensors",
+    "model.language_model.layers.47.self_attn.v_proj.weight": "model-00037-of-00050.safetensors",
+    "model.language_model.layers.48.input_layernorm.weight": "model-00038-of-00050.safetensors",
+    "model.language_model.layers.48.mlp.down_proj.weight": "model-00038-of-00050.safetensors",
+    "model.language_model.layers.48.mlp.gate_proj.weight": "model-00038-of-00050.safetensors",
+    "model.language_model.layers.48.mlp.up_proj.weight": "model-00038-of-00050.safetensors",
+    "model.language_model.layers.48.self_attn.k_proj.weight": "model-00038-of-00050.safetensors",
+    "model.language_model.layers.48.self_attn.o_proj.weight": "model-00038-of-00050.safetensors",
+    "model.language_model.layers.48.self_attn.q_proj.weight": "model-00038-of-00050.safetensors",
+    "model.language_model.layers.48.self_attn.v_proj.weight": "model-00038-of-00050.safetensors",
+    "model.language_model.layers.49.input_layernorm.weight": "model-00039-of-00050.safetensors",
+    "model.language_model.layers.49.mlp.down_proj.weight": "model-00039-of-00050.safetensors",
+    "model.language_model.layers.49.mlp.gate_proj.weight": "model-00039-of-00050.safetensors",
+    "model.language_model.layers.49.mlp.up_proj.weight": "model-00039-of-00050.safetensors",
+    "model.language_model.layers.49.self_attn.k_proj.weight": "model-00038-of-00050.safetensors",
+    "model.language_model.layers.49.self_attn.o_proj.weight": "model-00038-of-00050.safetensors",
+    "model.language_model.layers.49.self_attn.q_proj.weight": "model-00038-of-00050.safetensors",
+    "model.language_model.layers.49.self_attn.v_proj.weight": "model-00038-of-00050.safetensors",
+    "model.language_model.layers.5.input_layernorm.weight": "model-00006-of-00050.safetensors",
+    "model.language_model.layers.5.mlp.down_proj.weight": "model-00006-of-00050.safetensors",
+    "model.language_model.layers.5.mlp.gate_proj.weight": "model-00006-of-00050.safetensors",
+    "model.language_model.layers.5.mlp.up_proj.weight": "model-00006-of-00050.safetensors",
+    "model.language_model.layers.5.self_attn.k_proj.weight": "model-00005-of-00050.safetensors",
+    "model.language_model.layers.5.self_attn.o_proj.weight": "model-00005-of-00050.safetensors",
+    "model.language_model.layers.5.self_attn.q_proj.weight": "model-00005-of-00050.safetensors",
+    "model.language_model.layers.5.self_attn.v_proj.weight": "model-00005-of-00050.safetensors",
+    "model.language_model.layers.50.input_layernorm.weight": "model-00040-of-00050.safetensors",
+    "model.language_model.layers.50.mlp.down_proj.weight": "model-00040-of-00050.safetensors",
+    "model.language_model.layers.50.mlp.gate_proj.weight": "model-00039-of-00050.safetensors",
+    "model.language_model.layers.50.mlp.up_proj.weight": "model-00040-of-00050.safetensors",
+    "model.language_model.layers.50.self_attn.k_proj.weight": "model-00039-of-00050.safetensors",
+    "model.language_model.layers.50.self_attn.o_proj.weight": "model-00039-of-00050.safetensors",
+    "model.language_model.layers.50.self_attn.q_proj.weight": "model-00039-of-00050.safetensors",
+    "model.language_model.layers.50.self_attn.v_proj.weight": "model-00039-of-00050.safetensors",
+    "model.language_model.layers.51.input_layernorm.weight": "model-00041-of-00050.safetensors",
+    "model.language_model.layers.51.mlp.down_proj.weight": "model-00041-of-00050.safetensors",
+    "model.language_model.layers.51.mlp.gate_proj.weight": "model-00040-of-00050.safetensors",
+    "model.language_model.layers.51.mlp.up_proj.weight": "model-00040-of-00050.safetensors",
+    "model.language_model.layers.51.self_attn.k_proj.weight": "model-00040-of-00050.safetensors",
+    "model.language_model.layers.51.self_attn.o_proj.weight": "model-00040-of-00050.safetensors",
+    "model.language_model.layers.51.self_attn.q_proj.weight": "model-00040-of-00050.safetensors",
+    "model.language_model.layers.51.self_attn.v_proj.weight": "model-00040-of-00050.safetensors",
+    "model.language_model.layers.52.input_layernorm.weight": "model-00041-of-00050.safetensors",
+    "model.language_model.layers.52.mlp.down_proj.weight": "model-00041-of-00050.safetensors",
+    "model.language_model.layers.52.mlp.gate_proj.weight": "model-00041-of-00050.safetensors",
+    "model.language_model.layers.52.mlp.up_proj.weight": "model-00041-of-00050.safetensors",
+    "model.language_model.layers.52.self_attn.k_proj.weight": "model-00041-of-00050.safetensors",
+    "model.language_model.layers.52.self_attn.o_proj.weight": "model-00041-of-00050.safetensors",
+    "model.language_model.layers.52.self_attn.q_proj.weight": "model-00041-of-00050.safetensors",
+    "model.language_model.layers.52.self_attn.v_proj.weight": "model-00041-of-00050.safetensors",
+    "model.language_model.layers.53.input_layernorm.weight": "model-00042-of-00050.safetensors",
+    "model.language_model.layers.53.mlp.down_proj.weight": "model-00042-of-00050.safetensors",
+    "model.language_model.layers.53.mlp.gate_proj.weight": "model-00042-of-00050.safetensors",
+    "model.language_model.layers.53.mlp.up_proj.weight": "model-00042-of-00050.safetensors",
+    "model.language_model.layers.53.self_attn.k_proj.weight": "model-00041-of-00050.safetensors",
+    "model.language_model.layers.53.self_attn.o_proj.weight": "model-00041-of-00050.safetensors",
+    "model.language_model.layers.53.self_attn.q_proj.weight": "model-00041-of-00050.safetensors",
+    "model.language_model.layers.53.self_attn.v_proj.weight": "model-00041-of-00050.safetensors",
+    "model.language_model.layers.54.input_layernorm.weight": "model-00043-of-00050.safetensors",
+    "model.language_model.layers.54.mlp.down_proj.weight": "model-00043-of-00050.safetensors",
+    "model.language_model.layers.54.mlp.gate_proj.weight": "model-00042-of-00050.safetensors",
+    "model.language_model.layers.54.mlp.up_proj.weight": "model-00043-of-00050.safetensors",
+    "model.language_model.layers.54.self_attn.k_proj.weight": "model-00042-of-00050.safetensors",
+    "model.language_model.layers.54.self_attn.o_proj.weight": "model-00042-of-00050.safetensors",
+    "model.language_model.layers.54.self_attn.q_proj.weight": "model-00042-of-00050.safetensors",
+    "model.language_model.layers.54.self_attn.v_proj.weight": "model-00042-of-00050.safetensors",
+    "model.language_model.layers.55.input_layernorm.weight": "model-00044-of-00050.safetensors",
+    "model.language_model.layers.55.mlp.down_proj.weight": "model-00044-of-00050.safetensors",
+    "model.language_model.layers.55.mlp.gate_proj.weight": "model-00043-of-00050.safetensors",
+    "model.language_model.layers.55.mlp.up_proj.weight": "model-00043-of-00050.safetensors",
+    "model.language_model.layers.55.self_attn.k_proj.weight": "model-00043-of-00050.safetensors",
+    "model.language_model.layers.55.self_attn.o_proj.weight": "model-00043-of-00050.safetensors",
+    "model.language_model.layers.55.self_attn.q_proj.weight": "model-00043-of-00050.safetensors",
+    "model.language_model.layers.55.self_attn.v_proj.weight": "model-00043-of-00050.safetensors",
+    "model.language_model.layers.56.input_layernorm.weight": "model-00044-of-00050.safetensors",
+    "model.language_model.layers.56.mlp.down_proj.weight": "model-00044-of-00050.safetensors",
+    "model.language_model.layers.56.mlp.gate_proj.weight": "model-00044-of-00050.safetensors",
+    "model.language_model.layers.56.mlp.up_proj.weight": "model-00044-of-00050.safetensors",
+    "model.language_model.layers.56.self_attn.k_proj.weight": "model-00044-of-00050.safetensors",
+    "model.language_model.layers.56.self_attn.o_proj.weight": "model-00044-of-00050.safetensors",
+    "model.language_model.layers.56.self_attn.q_proj.weight": "model-00044-of-00050.safetensors",
+    "model.language_model.layers.56.self_attn.v_proj.weight": "model-00044-of-00050.safetensors",
+    "model.language_model.layers.57.input_layernorm.weight": "model-00045-of-00050.safetensors",
+    "model.language_model.layers.57.mlp.down_proj.weight": "model-00045-of-00050.safetensors",
+    "model.language_model.layers.57.mlp.gate_proj.weight": "model-00045-of-00050.safetensors",
+    "model.language_model.layers.57.mlp.up_proj.weight": "model-00045-of-00050.safetensors",
+    "model.language_model.layers.57.self_attn.k_proj.weight": "model-00044-of-00050.safetensors",
+    "model.language_model.layers.57.self_attn.o_proj.weight": "model-00044-of-00050.safetensors",
+    "model.language_model.layers.57.self_attn.q_proj.weight": "model-00044-of-00050.safetensors",
+    "model.language_model.layers.57.self_attn.v_proj.weight": "model-00044-of-00050.safetensors",
+    "model.language_model.layers.58.input_layernorm.weight": "model-00046-of-00050.safetensors",
+    "model.language_model.layers.58.mlp.down_proj.weight": "model-00046-of-00050.safetensors",
+    "model.language_model.layers.58.mlp.gate_proj.weight": "model-00045-of-00050.safetensors",
+    "model.language_model.layers.58.mlp.up_proj.weight": "model-00046-of-00050.safetensors",
+    "model.language_model.layers.58.self_attn.k_proj.weight": "model-00045-of-00050.safetensors",
+    "model.language_model.layers.58.self_attn.o_proj.weight": "model-00045-of-00050.safetensors",
+    "model.language_model.layers.58.self_attn.q_proj.weight": "model-00045-of-00050.safetensors",
+    "model.language_model.layers.58.self_attn.v_proj.weight": "model-00045-of-00050.safetensors",
+    "model.language_model.layers.59.input_layernorm.weight": "model-00047-of-00050.safetensors",
+    "model.language_model.layers.59.mlp.down_proj.weight": "model-00047-of-00050.safetensors",
+    "model.language_model.layers.59.mlp.gate_proj.weight": "model-00046-of-00050.safetensors",
+    "model.language_model.layers.59.mlp.up_proj.weight": "model-00046-of-00050.safetensors",
+    "model.language_model.layers.59.self_attn.k_proj.weight": "model-00046-of-00050.safetensors",
+    "model.language_model.layers.59.self_attn.o_proj.weight": "model-00046-of-00050.safetensors",
+    "model.language_model.layers.59.self_attn.q_proj.weight": "model-00046-of-00050.safetensors",
+    "model.language_model.layers.59.self_attn.v_proj.weight": "model-00046-of-00050.safetensors",
+    "model.language_model.layers.6.input_layernorm.weight": "model-00007-of-00050.safetensors",
+    "model.language_model.layers.6.mlp.down_proj.weight": "model-00007-of-00050.safetensors",
+    "model.language_model.layers.6.mlp.gate_proj.weight": "model-00006-of-00050.safetensors",
+    "model.language_model.layers.6.mlp.up_proj.weight": "model-00007-of-00050.safetensors",
+    "model.language_model.layers.6.self_attn.k_proj.weight": "model-00006-of-00050.safetensors",
+    "model.language_model.layers.6.self_attn.o_proj.weight": "model-00006-of-00050.safetensors",
+    "model.language_model.layers.6.self_attn.q_proj.weight": "model-00006-of-00050.safetensors",
+    "model.language_model.layers.6.self_attn.v_proj.weight": "model-00006-of-00050.safetensors",
+    "model.language_model.layers.60.input_layernorm.weight": "model-00047-of-00050.safetensors",
+    "model.language_model.layers.60.mlp.down_proj.weight": "model-00047-of-00050.safetensors",
+    "model.language_model.layers.60.mlp.gate_proj.weight": "model-00047-of-00050.safetensors",
+    "model.language_model.layers.60.mlp.up_proj.weight": "model-00047-of-00050.safetensors",
+    "model.language_model.layers.60.self_attn.k_proj.weight": "model-00047-of-00050.safetensors",
+    "model.language_model.layers.60.self_attn.o_proj.weight": "model-00047-of-00050.safetensors",
+    "model.language_model.layers.60.self_attn.q_proj.weight": "model-00047-of-00050.safetensors",
+    "model.language_model.layers.60.self_attn.v_proj.weight": "model-00047-of-00050.safetensors",
+    "model.language_model.layers.61.input_layernorm.weight": "model-00048-of-00050.safetensors",
+    "model.language_model.layers.61.mlp.down_proj.weight": "model-00048-of-00050.safetensors",
+    "model.language_model.layers.61.mlp.gate_proj.weight": "model-00048-of-00050.safetensors",
+    "model.language_model.layers.61.mlp.up_proj.weight": "model-00048-of-00050.safetensors",
+    "model.language_model.layers.61.self_attn.k_proj.weight": "model-00047-of-00050.safetensors",
+    "model.language_model.layers.61.self_attn.o_proj.weight": "model-00047-of-00050.safetensors",
+    "model.language_model.layers.61.self_attn.q_proj.weight": "model-00047-of-00050.safetensors",
+    "model.language_model.layers.61.self_attn.v_proj.weight": "model-00047-of-00050.safetensors",
+    "model.language_model.layers.62.input_layernorm.weight": "model-00049-of-00050.safetensors",
+    "model.language_model.layers.62.mlp.down_proj.weight": "model-00049-of-00050.safetensors",
+    "model.language_model.layers.62.mlp.gate_proj.weight": "model-00048-of-00050.safetensors",
+    "model.language_model.layers.62.mlp.up_proj.weight": "model-00049-of-00050.safetensors",
+    "model.language_model.layers.62.self_attn.k_proj.weight": "model-00048-of-00050.safetensors",
+    "model.language_model.layers.62.self_attn.o_proj.weight": "model-00048-of-00050.safetensors",
+    "model.language_model.layers.62.self_attn.q_proj.weight": "model-00048-of-00050.safetensors",
+    "model.language_model.layers.62.self_attn.v_proj.weight": "model-00048-of-00050.safetensors",
+    "model.language_model.layers.63.input_layernorm.weight": "model-00050-of-00050.safetensors",
+    "model.language_model.layers.63.mlp.down_proj.weight": "model-00050-of-00050.safetensors",
+    "model.language_model.layers.63.mlp.gate_proj.weight": "model-00049-of-00050.safetensors",
+    "model.language_model.layers.63.mlp.up_proj.weight": "model-00049-of-00050.safetensors",
+    "model.language_model.layers.63.self_attn.k_proj.weight": "model-00049-of-00050.safetensors",
+    "model.language_model.layers.63.self_attn.o_proj.weight": "model-00049-of-00050.safetensors",
+    "model.language_model.layers.63.self_attn.q_proj.weight": "model-00049-of-00050.safetensors",
+    "model.language_model.layers.63.self_attn.v_proj.weight": "model-00049-of-00050.safetensors",
+    "model.language_model.layers.7.input_layernorm.weight": "model-00008-of-00050.safetensors",
+    "model.language_model.layers.7.mlp.down_proj.weight": "model-00008-of-00050.safetensors",
+    "model.language_model.layers.7.mlp.gate_proj.weight": "model-00007-of-00050.safetensors",
+    "model.language_model.layers.7.mlp.up_proj.weight": "model-00007-of-00050.safetensors",
+    "model.language_model.layers.7.self_attn.k_proj.weight": "model-00007-of-00050.safetensors",
+    "model.language_model.layers.7.self_attn.o_proj.weight": "model-00007-of-00050.safetensors",
+    "model.language_model.layers.7.self_attn.q_proj.weight": "model-00007-of-00050.safetensors",
+    "model.language_model.layers.7.self_attn.v_proj.weight": "model-00007-of-00050.safetensors",
+    "model.language_model.layers.8.input_layernorm.weight": "model-00008-of-00050.safetensors",
+    "model.language_model.layers.8.mlp.down_proj.weight": "model-00008-of-00050.safetensors",
+    "model.language_model.layers.8.mlp.gate_proj.weight": "model-00008-of-00050.safetensors",
+    "model.language_model.layers.8.mlp.up_proj.weight": "model-00008-of-00050.safetensors",
+    "model.language_model.layers.8.self_attn.k_proj.weight": "model-00008-of-00050.safetensors",
+    "model.language_model.layers.8.self_attn.o_proj.weight": "model-00008-of-00050.safetensors",
+    "model.language_model.layers.8.self_attn.q_proj.weight": "model-00008-of-00050.safetensors",
+    "model.language_model.layers.8.self_attn.v_proj.weight": "model-00008-of-00050.safetensors",
+    "model.language_model.layers.9.input_layernorm.weight": "model-00009-of-00050.safetensors",
+    "model.language_model.layers.9.mlp.down_proj.weight": "model-00009-of-00050.safetensors",
+    "model.language_model.layers.9.mlp.gate_proj.weight": "model-00009-of-00050.safetensors",
+    "model.language_model.layers.9.mlp.up_proj.weight": "model-00009-of-00050.safetensors",
+    "model.language_model.layers.9.self_attn.k_proj.weight": "model-00008-of-00050.safetensors",
+    "model.language_model.layers.9.self_attn.o_proj.weight": "model-00008-of-00050.safetensors",
+    "model.language_model.layers.9.self_attn.q_proj.weight": "model-00008-of-00050.safetensors",
+    "model.language_model.layers.9.self_attn.v_proj.weight": "model-00008-of-00050.safetensors",
+    "model.language_model.norm.weight": "model-00050-of-00050.safetensors",
+    "model.multi_modal_projector.linear_1.bias": "model-00002-of-00050.safetensors",
+    "model.multi_modal_projector.linear_1.weight": "model-00002-of-00050.safetensors",
+    "model.multi_modal_projector.linear_2.bias": "model-00002-of-00050.safetensors",
+    "model.multi_modal_projector.linear_2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.embeddings.patch_embedding.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.embeddings.patch_embedding.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.embeddings.position_embedding.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.0.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.0.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.0.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.0.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.0.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.0.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.0.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.0.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.0.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.0.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.0.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.0.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.0.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.0.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.0.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.0.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.1.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.1.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.1.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.1.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.1.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.1.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.1.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.1.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.1.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.1.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.1.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.1.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.1.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.1.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.1.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.1.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.10.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.10.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.10.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.10.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.10.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.10.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.10.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.10.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.10.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.10.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.10.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.10.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.10.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.10.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.10.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.10.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.11.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.11.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.11.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.11.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.11.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.11.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.11.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.11.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.11.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.11.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.11.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.11.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.11.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.11.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.11.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.11.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.12.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.12.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.12.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.12.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.12.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.12.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.12.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.12.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.12.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.12.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.12.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.12.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.12.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.12.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.12.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.12.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.13.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.13.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.13.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.13.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.13.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.13.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.13.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.13.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.13.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.13.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.13.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.13.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.13.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.13.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.13.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.13.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.14.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.14.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.14.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.14.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.14.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.14.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.14.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.14.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.14.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.14.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.14.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.14.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.14.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.14.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.14.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.14.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.15.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.15.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.15.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.15.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.15.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.15.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.15.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.15.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.15.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.15.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.15.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.15.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.15.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.15.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.15.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.15.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.16.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.16.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.16.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.16.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.16.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.16.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.16.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.16.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.16.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.16.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.16.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.16.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.16.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.16.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.16.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.16.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.17.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.17.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.17.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.17.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.17.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.17.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.17.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.17.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.17.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.17.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.17.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.17.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.17.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.17.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.17.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.17.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.18.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.18.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.18.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.18.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.18.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.18.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.18.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.18.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.18.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.18.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.18.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.18.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.18.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.18.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.18.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.18.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.19.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.19.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.19.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.19.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.19.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.19.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.19.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.19.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.19.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.19.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.19.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.19.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.19.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.19.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.19.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.19.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.2.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.2.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.2.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.2.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.2.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.2.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.2.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.2.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.2.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.2.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.2.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.2.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.2.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.2.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.2.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.2.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.20.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.20.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.20.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.20.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.20.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.20.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.20.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.20.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.20.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.20.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.20.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.20.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.20.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.20.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.20.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.20.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.21.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.21.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.21.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.21.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.21.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.21.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.21.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.21.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.21.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.21.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.21.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.21.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.21.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.21.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.21.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.21.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.22.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.22.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.22.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.22.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.22.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.22.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.22.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.22.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.22.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.22.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.22.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.22.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.22.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.22.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.22.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.22.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.23.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.23.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.23.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.23.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.23.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.23.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.23.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.23.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.23.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.23.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.23.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.23.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.23.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.23.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.23.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.23.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.24.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.24.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.24.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.24.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.24.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.24.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.24.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.24.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.24.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.24.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.24.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.24.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.24.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.24.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.24.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.24.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.25.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.25.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.25.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.25.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.25.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.25.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.25.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.25.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.25.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.25.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.25.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.25.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.25.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.25.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.25.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.25.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.26.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.26.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.26.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.26.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.26.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.26.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.26.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.26.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.26.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.26.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.26.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.26.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.26.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.26.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.26.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.26.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.3.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.3.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.3.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.3.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.3.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.3.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.3.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.3.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.3.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.3.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.3.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.3.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.3.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.3.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.3.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.3.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.4.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.4.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.4.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.4.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.4.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.4.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.4.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.4.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.4.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.4.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.4.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.4.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.4.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.4.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.4.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.4.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.5.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.5.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.5.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.5.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.5.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.5.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.5.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.5.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.5.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.5.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.5.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.5.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.5.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.5.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.5.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.5.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.6.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.6.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.6.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.6.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.6.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.6.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.6.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.6.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.6.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.6.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.6.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.6.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.6.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.6.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.6.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.6.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.7.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.7.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.7.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.7.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.7.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.7.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.7.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.7.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.7.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.7.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.7.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.7.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.7.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.7.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.7.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.7.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.8.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.8.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.8.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.8.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.8.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.8.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.8.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.8.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.8.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.8.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.8.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.8.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.8.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.8.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.8.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.8.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.9.layer_norm1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.9.layer_norm1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.9.layer_norm2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.9.layer_norm2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.9.mlp.fc1.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.9.mlp.fc1.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.9.mlp.fc2.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.9.mlp.fc2.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.9.self_attn.k_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.9.self_attn.k_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.9.self_attn.out_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.9.self_attn.out_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.9.self_attn.q_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.9.self_attn.q_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.9.self_attn.v_proj.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.encoder.layers.9.self_attn.v_proj.weight": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.post_layernorm.bias": "model-00002-of-00050.safetensors",
+    "model.vision_tower.vision_model.post_layernorm.weight": "model-00002-of-00050.safetensors"
+  }
+}

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,42 @@

+{
+  "crop_size": null,
+  "crop_to_patches": true,
+  "data_format": "channels_first",
+  "default_to_square": true,
+  "device": null,
+  "disable_grouping": null,
+  "do_center_crop": null,
+  "do_convert_rgb": true,
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "downsample_factor": 2,
+  "end_of_img_token": "<|END_OF_IMG|>",
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "Cohere2VisionImageProcessorFast",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "img_line_break_token": "<|IMG_LINE_BREAK|>",
+  "img_patch_token": "<|IMG_PATCH|>",
+  "img_size": 512,
+  "input_data_format": null,
+  "max_patches": 12,
+  "min_patches": 1,
+  "patch_size": 16,
+  "processor_class": "Cohere2VisionProcessor",
+  "resample": 3,
+  "rescale_factor": 0.00392156862745098,
+  "return_tensors": null,
+  "size": {
+    "height": 512,
+    "width": 512
+  },
+  "start_of_img_token": "<|START_OF_IMG|>"
+}

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "additional_special_tokens": [
+    "<|START_RESPONSE|>",
+    "<|END_RESPONSE|>"
+  ],
+  "boi_token": "<|START_OF_IMG|>",
+  "bos_token": {
+    "content": "<BOS_TOKEN>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eoi_token": "<|END_OF_IMG|>",
+  "eos_token": {
+    "content": "<|END_OF_TURN_TOKEN|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "image_token": "<|IMG_PATCH|>",
+  "img_line_break_token": "<|IMG_LINE_BREAK|>",
+  "pad_token": {
+    "content": "<PAD>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<UNK>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e22a9a0f4ebeea673bc56f836c0ccb462a4daf1441316a93b3197ef615a46ec8
+size 20125691

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,395 @@

+{
+  "add_bos_token": true,
+  "add_eos_token": false,
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<PAD>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<UNK>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "<CLS>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<SEP>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "4": {
+      "content": "<MASK_TOKEN>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "5": {
+      "content": "<BOS_TOKEN>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "6": {
+      "content": "<EOS_TOKEN>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "7": {
+      "content": "<EOP_TOKEN>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "255000": {
+      "content": "<|START_OF_TURN_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255001": {
+      "content": "<|END_OF_TURN_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "255002": {
+      "content": "<|YES_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255003": {
+      "content": "<|NO_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255004": {
+      "content": "<|GOOD_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255005": {
+      "content": "<|BAD_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255006": {
+      "content": "<|USER_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255007": {
+      "content": "<|CHATBOT_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255008": {
+      "content": "<|SYSTEM_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255009": {
+      "content": "<|USER_0_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255010": {
+      "content": "<|USER_1_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255011": {
+      "content": "<|USER_2_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255012": {
+      "content": "<|USER_3_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255013": {
+      "content": "<|USER_4_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255014": {
+      "content": "<|USER_5_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255015": {
+      "content": "<|USER_6_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255016": {
+      "content": "<|USER_7_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255017": {
+      "content": "<|USER_8_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255018": {
+      "content": "<|USER_9_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255019": {
+      "content": "<|START_THINKING|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255020": {
+      "content": "<|END_THINKING|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255021": {
+      "content": "<|START_RESPONSE|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "255022": {
+      "content": "<|END_RESPONSE|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "255023": {
+      "content": "<|START_ACTION|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255024": {
+      "content": "<|END_ACTION|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255025": {
+      "content": "<|START_TOOL_RESULT|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255026": {
+      "content": "<|END_TOOL_RESULT|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255027": {
+      "content": "<|EXTRA_8_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255028": {
+      "content": "<|NEW_FILE|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "255029": {
+      "content": "<|BEGINNING_OF_PREFIX_FIM_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255030": {
+      "content": "<|BEGINNING_OF_MIDDLE_FIM_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255031": {
+      "content": "<|BEGINNING_OF_SUFFIX_FIM_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255032": {
+      "content": "<|END_OF_MIDDLE_FIM_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "255033": {
+      "content": "<|START_OF_IMG|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "255034": {
+      "content": "<|END_OF_IMG|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "255035": {
+      "content": "<|IMG_LINE_BREAK|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "255036": {
+      "content": "<|IMG_PATCH|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [
+    "<|START_RESPONSE|>",
+    "<|END_RESPONSE|>"
+  ],
+  "boi_token": "<|START_OF_IMG|>",
+  "bos_token": "<BOS_TOKEN>",
+  "clean_up_tokenization_spaces": false,
+  "eoi_token": "<|END_OF_IMG|>",
+  "eos_token": "<|END_OF_TURN_TOKEN|>",
+  "extra_special_tokens": {
+    "boi_token": "<|START_OF_IMG|>",
+    "eoi_token": "<|END_OF_IMG|>",
+    "image_token": "<|IMG_PATCH|>",
+    "img_line_break_token": "<|IMG_LINE_BREAK|>"
+  },
+  "image_token": "<|IMG_PATCH|>",
+  "img_line_break_token": "<|IMG_LINE_BREAK|>",
+  "legacy": true,
+  "merges_file": null,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<PAD>",
+  "processor_class": "Cohere2VisionProcessor",
+  "sp_model_kwargs": {},
+  "spaces_between_special_tokens": false,
+  "tokenizer_class": "CohereTokenizer",
+  "unk_token": "<UNK>",
+  "use_default_system_prompt": false,
+  "vocab_file": null
+}