jazeelmohd commited on 6 days ago

Commit

ee591ea

verified ·

1 Parent(s): f97bd08

Upload 56 files

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +1 -0
connector_1.5.mlpackage/Data/com.apple.CoreML/model.mlmodel +3 -0
connector_1.5.mlpackage/Data/com.apple.CoreML/weights/weight.bin +3 -0
connector_1.5.mlpackage/Manifest.json +18 -0
llm_1.5b.bundle/added_tokens.json +8 -0
llm_1.5b.bundle/config.json +20 -0
llm_1.5b.bundle/merges.txt +0 -0
llm_1.5b.bundle/model.safetensors +3 -0
llm_1.5b.bundle/model.safetensors.index.json +747 -0
llm_1.5b.bundle/preprocessor_config.json +28 -0
llm_1.5b.bundle/special_tokens_map.json +21 -0
llm_1.5b.bundle/tokenizer.json +3 -0
llm_1.5b.bundle/tokenizer_config.json +70 -0
llm_1.5b.bundle/vocab.json +0 -0
scheduler_config.json +36 -0
transformer_ane_1.5_10c_p10_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel +3 -0
transformer_ane_1.5_10c_p10_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin +3 -0
transformer_ane_1.5_10c_p10_s77.mlpackage/Manifest.json +18 -0
transformer_ane_1.5_10c_p1_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel +3 -0
transformer_ane_1.5_10c_p1_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin +3 -0
transformer_ane_1.5_10c_p1_s77.mlpackage/Manifest.json +18 -0
transformer_ane_1.5_10c_p2_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel +3 -0
transformer_ane_1.5_10c_p2_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin +3 -0
transformer_ane_1.5_10c_p2_s77.mlpackage/Manifest.json +18 -0
transformer_ane_1.5_10c_p3_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel +3 -0
transformer_ane_1.5_10c_p3_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin +3 -0
transformer_ane_1.5_10c_p3_s77.mlpackage/Manifest.json +18 -0
transformer_ane_1.5_10c_p4_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel +3 -0
transformer_ane_1.5_10c_p4_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin +3 -0
transformer_ane_1.5_10c_p4_s77.mlpackage/Manifest.json +18 -0
transformer_ane_1.5_10c_p5_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel +3 -0
transformer_ane_1.5_10c_p5_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin +3 -0
transformer_ane_1.5_10c_p5_s77.mlpackage/Manifest.json +18 -0
transformer_ane_1.5_10c_p6_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel +3 -0
transformer_ane_1.5_10c_p6_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin +3 -0
transformer_ane_1.5_10c_p6_s77.mlpackage/Manifest.json +18 -0
transformer_ane_1.5_10c_p7_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel +3 -0
transformer_ane_1.5_10c_p7_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin +3 -0
transformer_ane_1.5_10c_p7_s77.mlpackage/Manifest.json +18 -0
transformer_ane_1.5_10c_p8_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel +3 -0
transformer_ane_1.5_10c_p8_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin +3 -0
transformer_ane_1.5_10c_p8_s77.mlpackage/Manifest.json +18 -0
transformer_ane_1.5_10c_p9_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel +3 -0
transformer_ane_1.5_10c_p9_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin +3 -0
transformer_ane_1.5_10c_p9_s77.mlpackage/Manifest.json +18 -0
transformer_ane_1.5_10c_time_embed.mlpackage/Data/com.apple.CoreML/model.mlmodel +3 -0
transformer_ane_1.5_10c_time_embed.mlpackage/Data/com.apple.CoreML/weights/weight.bin +3 -0
transformer_ane_1.5_10c_time_embed.mlpackage/Manifest.json +18 -0
vae_ane_p1_0.5.mlpackage/Data/com.apple.CoreML/model.mlmodel +3 -0
vae_ane_p1_0.5.mlpackage/Data/com.apple.CoreML/weights/weight.bin +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+llm_1.5b.bundle/tokenizer.json filter=lfs diff=lfs merge=lfs -text

connector_1.5.mlpackage/Data/com.apple.CoreML/model.mlmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ae90c0edbc51a7f6f5d375a754b86319aa4e6c1dfcf288a945a3f95df11e7206
+size 30607

connector_1.5.mlpackage/Data/com.apple.CoreML/weights/weight.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:132ccbcb7433d58fb442b2a98612a44ce0f6b703c72930c9288f5bd5b61b6135
+size 5539264

connector_1.5.mlpackage/Manifest.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+    "fileFormatVersion": "1.0.0",
+    "itemInfoEntries": {
+        "437F66A2-9003-4E49-A3A7-E580FB0DC4DB": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Weights",
+            "name": "weights",
+            "path": "com.apple.CoreML/weights"
+        },
+        "FC8E8E6C-405D-4F94-BBF9-C561397E8F1C": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Specification",
+            "name": "model.mlmodel",
+            "path": "com.apple.CoreML/model.mlmodel"
+        }
+    },
+    "rootModelIdentifier": "FC8E8E6C-405D-4F94-BBF9-C561397E8F1C"
+}

llm_1.5b.bundle/added_tokens.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+  "<image>": 151648,
+  "<|endoftext|>": 151643,
+  "<|im_end|>": 151645,
+  "<|im_start|>": 151644,
+  "[/IMG]": 151647,
+  "[IMG]": 151646
+}

llm_1.5b.bundle/config.json ADDED Viewed

	@@ -0,0 +1,20 @@

+{
+    "model_type": "llava_qwen2",
+    "hidden_size": 1536,
+    "num_hidden_layers": 28,
+    "intermediate_size": 8960,
+    "num_attention_heads": 12,
+    "num_key_value_heads": 2,
+    "rms_norm_eps": 1e-06,
+    "vocab_size": 151649,
+    "max_position_embeddings": 32768,
+    "rope_theta": 1000000,
+    "tie_word_embeddings": true,
+    "mm_hidden_size": 3072,
+    "mm_vision_tower": "mobileclip_l_1024",
+    "image_token_index": 151648,
+    "quantization": {
+        "group_size": 64,
+        "bits": 4
+    }
+}

llm_1.5b.bundle/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

llm_1.5b.bundle/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:76e00afbf5783e7540e1a27dc44d35a3c04893b1230efb4bcb246f81981f3b64
+size 872379759

llm_1.5b.bundle/model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,747 @@

+{
+    "metadata": {
+        "total_size": 872287072
+    },
+    "weight_map": {
+        "language_model.model.embed_tokens.weight": "model.safetensors",
+        "language_model.model.embed_tokens.scales": "model.safetensors",
+        "language_model.model.embed_tokens.biases": "model.safetensors",
+        "language_model.model.layers.0.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.0.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.0.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.0.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.0.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.0.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.0.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.0.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.0.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.0.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.0.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.0.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.0.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.0.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.0.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.0.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.0.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.0.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.0.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.0.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.0.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.0.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.0.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.0.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.0.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.0.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.1.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.1.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.1.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.1.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.1.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.1.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.1.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.1.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.1.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.1.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.1.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.1.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.1.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.1.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.1.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.1.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.1.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.1.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.1.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.1.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.1.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.1.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.1.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.1.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.1.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.1.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.2.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.2.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.2.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.2.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.2.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.2.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.2.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.2.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.2.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.2.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.2.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.2.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.2.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.2.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.2.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.2.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.2.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.2.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.2.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.2.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.2.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.2.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.2.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.2.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.2.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.2.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.3.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.3.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.3.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.3.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.3.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.3.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.3.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.3.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.3.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.3.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.3.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.3.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.3.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.3.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.3.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.3.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.3.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.3.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.3.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.3.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.3.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.3.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.3.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.3.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.3.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.3.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.4.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.4.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.4.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.4.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.4.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.4.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.4.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.4.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.4.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.4.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.4.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.4.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.4.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.4.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.4.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.4.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.4.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.4.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.4.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.4.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.4.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.4.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.4.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.4.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.4.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.4.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.5.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.5.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.5.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.5.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.5.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.5.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.5.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.5.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.5.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.5.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.5.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.5.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.5.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.5.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.5.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.5.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.5.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.5.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.5.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.5.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.5.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.5.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.5.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.5.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.5.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.5.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.6.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.6.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.6.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.6.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.6.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.6.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.6.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.6.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.6.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.6.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.6.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.6.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.6.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.6.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.6.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.6.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.6.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.6.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.6.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.6.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.6.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.6.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.6.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.6.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.6.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.6.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.7.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.7.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.7.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.7.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.7.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.7.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.7.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.7.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.7.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.7.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.7.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.7.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.7.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.7.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.7.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.7.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.7.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.7.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.7.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.7.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.7.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.7.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.7.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.7.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.7.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.7.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.8.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.8.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.8.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.8.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.8.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.8.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.8.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.8.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.8.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.8.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.8.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.8.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.8.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.8.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.8.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.8.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.8.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.8.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.8.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.8.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.8.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.8.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.8.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.8.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.8.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.8.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.9.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.9.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.9.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.9.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.9.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.9.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.9.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.9.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.9.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.9.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.9.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.9.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.9.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.9.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.9.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.9.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.9.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.9.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.9.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.9.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.9.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.9.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.9.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.9.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.9.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.9.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.10.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.10.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.10.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.10.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.10.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.10.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.10.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.10.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.10.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.10.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.10.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.10.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.10.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.10.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.10.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.10.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.10.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.10.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.10.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.10.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.10.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.10.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.10.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.10.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.10.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.10.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.11.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.11.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.11.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.11.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.11.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.11.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.11.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.11.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.11.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.11.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.11.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.11.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.11.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.11.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.11.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.11.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.11.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.11.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.11.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.11.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.11.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.11.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.11.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.11.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.11.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.11.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.12.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.12.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.12.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.12.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.12.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.12.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.12.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.12.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.12.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.12.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.12.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.12.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.12.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.12.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.12.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.12.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.12.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.12.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.12.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.12.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.12.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.12.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.12.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.12.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.12.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.12.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.13.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.13.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.13.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.13.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.13.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.13.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.13.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.13.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.13.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.13.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.13.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.13.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.13.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.13.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.13.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.13.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.13.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.13.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.13.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.13.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.13.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.13.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.13.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.13.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.13.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.13.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.14.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.14.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.14.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.14.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.14.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.14.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.14.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.14.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.14.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.14.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.14.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.14.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.14.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.14.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.14.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.14.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.14.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.14.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.14.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.14.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.14.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.14.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.14.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.14.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.14.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.14.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.15.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.15.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.15.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.15.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.15.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.15.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.15.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.15.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.15.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.15.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.15.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.15.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.15.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.15.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.15.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.15.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.15.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.15.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.15.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.15.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.15.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.15.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.15.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.15.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.15.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.15.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.16.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.16.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.16.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.16.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.16.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.16.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.16.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.16.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.16.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.16.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.16.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.16.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.16.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.16.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.16.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.16.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.16.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.16.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.16.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.16.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.16.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.16.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.16.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.16.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.16.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.16.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.17.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.17.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.17.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.17.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.17.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.17.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.17.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.17.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.17.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.17.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.17.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.17.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.17.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.17.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.17.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.17.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.17.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.17.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.17.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.17.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.17.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.17.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.17.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.17.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.17.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.17.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.18.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.18.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.18.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.18.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.18.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.18.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.18.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.18.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.18.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.18.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.18.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.18.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.18.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.18.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.18.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.18.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.18.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.18.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.18.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.18.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.18.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.18.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.18.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.18.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.18.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.18.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.19.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.19.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.19.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.19.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.19.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.19.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.19.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.19.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.19.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.19.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.19.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.19.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.19.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.19.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.19.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.19.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.19.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.19.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.19.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.19.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.19.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.19.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.19.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.19.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.19.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.19.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.20.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.20.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.20.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.20.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.20.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.20.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.20.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.20.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.20.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.20.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.20.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.20.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.20.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.20.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.20.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.20.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.20.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.20.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.20.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.20.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.20.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.20.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.20.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.20.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.20.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.20.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.21.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.21.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.21.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.21.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.21.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.21.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.21.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.21.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.21.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.21.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.21.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.21.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.21.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.21.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.21.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.21.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.21.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.21.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.21.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.21.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.21.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.21.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.21.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.21.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.21.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.21.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.22.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.22.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.22.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.22.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.22.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.22.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.22.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.22.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.22.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.22.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.22.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.22.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.22.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.22.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.22.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.22.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.22.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.22.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.22.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.22.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.22.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.22.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.22.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.22.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.22.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.22.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.23.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.23.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.23.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.23.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.23.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.23.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.23.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.23.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.23.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.23.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.23.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.23.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.23.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.23.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.23.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.23.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.23.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.23.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.23.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.23.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.23.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.23.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.23.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.23.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.23.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.23.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.24.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.24.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.24.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.24.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.24.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.24.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.24.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.24.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.24.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.24.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.24.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.24.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.24.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.24.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.24.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.24.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.24.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.24.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.24.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.24.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.24.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.24.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.24.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.24.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.24.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.24.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.25.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.25.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.25.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.25.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.25.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.25.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.25.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.25.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.25.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.25.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.25.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.25.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.25.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.25.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.25.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.25.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.25.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.25.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.25.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.25.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.25.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.25.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.25.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.25.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.25.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.25.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.26.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.26.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.26.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.26.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.26.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.26.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.26.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.26.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.26.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.26.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.26.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.26.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.26.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.26.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.26.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.26.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.26.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.26.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.26.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.26.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.26.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.26.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.26.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.26.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.26.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.26.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.27.self_attn.q_proj.weight": "model.safetensors",
+        "language_model.model.layers.27.self_attn.q_proj.scales": "model.safetensors",
+        "language_model.model.layers.27.self_attn.q_proj.biases": "model.safetensors",
+        "language_model.model.layers.27.self_attn.q_proj.bias": "model.safetensors",
+        "language_model.model.layers.27.self_attn.k_proj.weight": "model.safetensors",
+        "language_model.model.layers.27.self_attn.k_proj.scales": "model.safetensors",
+        "language_model.model.layers.27.self_attn.k_proj.biases": "model.safetensors",
+        "language_model.model.layers.27.self_attn.k_proj.bias": "model.safetensors",
+        "language_model.model.layers.27.self_attn.v_proj.weight": "model.safetensors",
+        "language_model.model.layers.27.self_attn.v_proj.scales": "model.safetensors",
+        "language_model.model.layers.27.self_attn.v_proj.biases": "model.safetensors",
+        "language_model.model.layers.27.self_attn.v_proj.bias": "model.safetensors",
+        "language_model.model.layers.27.self_attn.o_proj.weight": "model.safetensors",
+        "language_model.model.layers.27.self_attn.o_proj.scales": "model.safetensors",
+        "language_model.model.layers.27.self_attn.o_proj.biases": "model.safetensors",
+        "language_model.model.layers.27.mlp.gate_proj.weight": "model.safetensors",
+        "language_model.model.layers.27.mlp.gate_proj.scales": "model.safetensors",
+        "language_model.model.layers.27.mlp.gate_proj.biases": "model.safetensors",
+        "language_model.model.layers.27.mlp.up_proj.weight": "model.safetensors",
+        "language_model.model.layers.27.mlp.up_proj.scales": "model.safetensors",
+        "language_model.model.layers.27.mlp.up_proj.biases": "model.safetensors",
+        "language_model.model.layers.27.mlp.down_proj.weight": "model.safetensors",
+        "language_model.model.layers.27.mlp.down_proj.scales": "model.safetensors",
+        "language_model.model.layers.27.mlp.down_proj.biases": "model.safetensors",
+        "language_model.model.layers.27.input_layernorm.weight": "model.safetensors",
+        "language_model.model.layers.27.post_attention_layernorm.weight": "model.safetensors",
+        "language_model.model.norm.weight": "model.safetensors",
+        "multi_modal_projector.linear_0.weight": "model.safetensors",
+        "multi_modal_projector.linear_0.scales": "model.safetensors",
+        "multi_modal_projector.linear_0.biases": "model.safetensors",
+        "multi_modal_projector.linear_0.bias": "model.safetensors",
+        "multi_modal_projector.linear_2.weight": "model.safetensors",
+        "multi_modal_projector.linear_2.scales": "model.safetensors",
+        "multi_modal_projector.linear_2.biases": "model.safetensors",
+        "multi_modal_projector.linear_2.bias": "model.safetensors"
+    }
+}

llm_1.5b.bundle/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+  "crop_size": {
+    "height": 1024,
+    "width": 1024
+  },
+  "do_center_crop": true,
+  "do_convert_rgb": true,
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.0,
+    0.0,
+    0.0
+  ],
+  "image_processor_type": "CLIPImageProcessor",
+  "image_std": [
+    1.0,
+    1.0,
+    1.0
+  ],
+  "processor_class": "LlavaProcessor",
+  "resample": 3,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "shortest_edge": 1024
+  }
+}

llm_1.5b.bundle/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "additional_special_tokens": [
+    "[IMG]",
+    "[/IMG]",
+    "<image>"
+  ],
+  "eos_token": {
+    "content": "<|im_end|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

llm_1.5b.bundle/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fdd99b646b9315f486441715cc3dc39f4d3175b45b1bcc05c9aa6642b92b690a
+size 11413649

llm_1.5b.bundle/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,70 @@

+{
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "151643": {
+      "content": "<|endoftext|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151644": {
+      "content": "<|im_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151645": {
+      "content": "<|im_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151646": {
+      "content": "[IMG]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151647": {
+      "content": "[/IMG]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151648": {
+      "content": "<image>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [
+    "[IMG]",
+    "[/IMG]",
+    "<image>"
+  ],
+  "bos_token": null,
+  "chat_template": "{% for message in messages %}{% if loop.first and messages[0]['role'] != 'system' %}{{ '<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n' }}{% endif %}{{'<|im_start|>' + message['role'] + '\n' + message['content'] + '<|im_end|>' + '\n'}}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|im_end|>",
+  "errors": "replace",
+  "extra_special_tokens": {},
+  "model_max_length": 512,
+  "pad_token": "<|endoftext|>",
+  "padding_side": "right",
+  "split_special_tokens": false,
+  "tokenizer_class": "Qwen2Tokenizer",
+  "unk_token": null
+}

llm_1.5b.bundle/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

scheduler_config.json ADDED Viewed

	@@ -0,0 +1,36 @@

+{
+  "_class_name": "CustomScheduler",
+  "_diffusers_version": "0.32.0.dev0",
+  "algorithm_type": "custom_v1",
+  "beta_end": 0.02,
+  "beta_schedule": "linear",
+  "beta_start": 0.0001,
+  "dynamic_thresholding_ratio": 0.995,
+  "euler_at_final": false,
+  "final_sigmas_type": "zero",
+  "flow_shift": 3.0,
+  "lambda_min_clipped": -1000000.0,
+  "lower_order_final": true,
+  "num_train_timesteps": 1000,
+  "prediction_type": "flow_prediction",
+  "rescale_betas_zero_snr": false,
+  "sample_max_value": 1.0,
+  "solver_order": 3,
+  "solver_type": "multistep",
+  "steps_offset": 0,
+  "thresholding": false,
+  "timestep_spacing": "uniform_tau",
+  "trained_betas": null,
+  "use_beta_sigmas": false,
+  "use_exponential_sigmas": false,
+  "use_flow_sigmas": true,
+  "use_karras_sigmas": false,
+  "use_lu_lambdas": false,
+  "apply_flow_shift": false,
+  "variance_type": null,
+  "update_clamp_factor": 2.5,
+  "sigma_max": 1.0,
+  "sigma_min": 0.002,
+  "karras_rho": 7.0,
+  "use_heun_final_steps": 3
+}

transformer_ane_1.5_10c_p10_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:61c1de39d88a1ca0104c60d538411b12a68743fc2bf68170366784a70ac983f9
+size 70411

transformer_ane_1.5_10c_p10_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:33f9134e16d08cc71b32f2fab8cc9373b9c6f02eac410d3ec74b106bf044b9b7
+size 311873536

transformer_ane_1.5_10c_p10_s77.mlpackage/Manifest.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+    "fileFormatVersion": "1.0.0",
+    "itemInfoEntries": {
+        "492EAB5C-DA52-40E8-B2D5-028F357B50A4": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Weights",
+            "name": "weights",
+            "path": "com.apple.CoreML/weights"
+        },
+        "B1928844-F098-41A2-BB7E-441E983791D2": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Specification",
+            "name": "model.mlmodel",
+            "path": "com.apple.CoreML/model.mlmodel"
+        }
+    },
+    "rootModelIdentifier": "B1928844-F098-41A2-BB7E-441E983791D2"
+}

transformer_ane_1.5_10c_p1_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ab0b7b4452bce9f23a0d72dc90a7305833aeb58c8f1ba741776a6e7d7a0b799e
+size 73899

transformer_ane_1.5_10c_p1_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ad97b1d6f0873566aa2dc7fb8679e1ed12b1df0e8eb43edab7d2903d1cb4f0b4
+size 332239808

transformer_ane_1.5_10c_p1_s77.mlpackage/Manifest.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+    "fileFormatVersion": "1.0.0",
+    "itemInfoEntries": {
+        "412C7FAD-3BB6-4310-AC6B-960286E7BAE3": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Weights",
+            "name": "weights",
+            "path": "com.apple.CoreML/weights"
+        },
+        "5B3E3F72-B126-4A84-A6C1-C77E55755D15": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Specification",
+            "name": "model.mlmodel",
+            "path": "com.apple.CoreML/model.mlmodel"
+        }
+    },
+    "rootModelIdentifier": "5B3E3F72-B126-4A84-A6C1-C77E55755D15"
+}

transformer_ane_1.5_10c_p2_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0f94257c8cbf97eba9d2e842677cb9f860d7b9f5c50c239904bdcb9edf59e728
+size 64808

transformer_ane_1.5_10c_p2_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f8698bed5ba7dc707fa63d7606e61001a44325574c7b3ce52c34769b78a6da88
+size 311720960

transformer_ane_1.5_10c_p2_s77.mlpackage/Manifest.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+    "fileFormatVersion": "1.0.0",
+    "itemInfoEntries": {
+        "1DA0D7B9-396E-4DF0-B297-8749D656D2AE": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Specification",
+            "name": "model.mlmodel",
+            "path": "com.apple.CoreML/model.mlmodel"
+        },
+        "E0E5AB8F-51A8-4320-9D88-D02B1F7FB52D": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Weights",
+            "name": "weights",
+            "path": "com.apple.CoreML/weights"
+        }
+    },
+    "rootModelIdentifier": "1DA0D7B9-396E-4DF0-B297-8749D656D2AE"
+}

transformer_ane_1.5_10c_p3_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4d5e9aea0e977b092bc9b1f7aae1f5e8f6ccf3c75ec7846545b179b81eb9bfa3
+size 64808

transformer_ane_1.5_10c_p3_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1f5f3161e04a2d0e05bac8c0c1cacc1057ef94733f50a474ecd14606cbbf250e
+size 311720960

transformer_ane_1.5_10c_p3_s77.mlpackage/Manifest.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+    "fileFormatVersion": "1.0.0",
+    "itemInfoEntries": {
+        "474B24D6-A06F-470B-9181-624EC5CC5123": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Weights",
+            "name": "weights",
+            "path": "com.apple.CoreML/weights"
+        },
+        "5A9DDC2C-63D7-48A2-B119-1F842D65F83F": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Specification",
+            "name": "model.mlmodel",
+            "path": "com.apple.CoreML/model.mlmodel"
+        }
+    },
+    "rootModelIdentifier": "5A9DDC2C-63D7-48A2-B119-1F842D65F83F"
+}

transformer_ane_1.5_10c_p4_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:25dc8eeb0a91effea7961ba68d023b8abd35e243012caad43e6c7a781d50e898
+size 64808

transformer_ane_1.5_10c_p4_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:025b684d5c4b1a936acfc700130194acb0bc88e4bc6964b62934f4155db09bb8
+size 311720960

transformer_ane_1.5_10c_p4_s77.mlpackage/Manifest.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+    "fileFormatVersion": "1.0.0",
+    "itemInfoEntries": {
+        "0F037C27-12E3-4034-B623-F4C22BD64AFD": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Weights",
+            "name": "weights",
+            "path": "com.apple.CoreML/weights"
+        },
+        "82F618F2-FD43-42A1-8D89-89D25BACFAFA": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Specification",
+            "name": "model.mlmodel",
+            "path": "com.apple.CoreML/model.mlmodel"
+        }
+    },
+    "rootModelIdentifier": "82F618F2-FD43-42A1-8D89-89D25BACFAFA"
+}

transformer_ane_1.5_10c_p5_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:285948fb5e3b4f32880a889aa9c564baa3e4f8dc66e1a6b11390b210081d20af
+size 64808

transformer_ane_1.5_10c_p5_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6127a481746cb0b27619e2b6dd2b2fe2686bc0d1e72c77345909b3b2391f0c78
+size 311720960

transformer_ane_1.5_10c_p5_s77.mlpackage/Manifest.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+    "fileFormatVersion": "1.0.0",
+    "itemInfoEntries": {
+        "A9CDB08A-622F-45BB-8517-D016DB0B1691": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Weights",
+            "name": "weights",
+            "path": "com.apple.CoreML/weights"
+        },
+        "F66C2076-3F4D-4DDB-9E3C-0814816D876B": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Specification",
+            "name": "model.mlmodel",
+            "path": "com.apple.CoreML/model.mlmodel"
+        }
+    },
+    "rootModelIdentifier": "F66C2076-3F4D-4DDB-9E3C-0814816D876B"
+}

transformer_ane_1.5_10c_p6_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4e5185f58b2808ec9e7eb545820345938515e93b066c0c6844beeec7f2334185
+size 64916

transformer_ane_1.5_10c_p6_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:45c61bf06f5292a8c36ef53e1677e426a34d7a8573e908cec8390f541da84b30
+size 311720960

transformer_ane_1.5_10c_p6_s77.mlpackage/Manifest.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+    "fileFormatVersion": "1.0.0",
+    "itemInfoEntries": {
+        "1B470FB5-AD2E-4F81-93C5-78EDE0043DF5": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Specification",
+            "name": "model.mlmodel",
+            "path": "com.apple.CoreML/model.mlmodel"
+        },
+        "44FA9DE1-B29A-468E-9385-9CA893AB6B70": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Weights",
+            "name": "weights",
+            "path": "com.apple.CoreML/weights"
+        }
+    },
+    "rootModelIdentifier": "1B470FB5-AD2E-4F81-93C5-78EDE0043DF5"
+}

transformer_ane_1.5_10c_p7_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e023339a03f6d6d6ce64fa3436f969e65fd1d7361ca7fa070daa905f73ae917f
+size 64916

transformer_ane_1.5_10c_p7_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4507020594503e7dbb41438d704eccc44a95e65ff6b57455a900a4f0792cf051
+size 311720960

transformer_ane_1.5_10c_p7_s77.mlpackage/Manifest.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+    "fileFormatVersion": "1.0.0",
+    "itemInfoEntries": {
+        "9F96FCE2-4498-4D57-B588-4408C0042E9D": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Specification",
+            "name": "model.mlmodel",
+            "path": "com.apple.CoreML/model.mlmodel"
+        },
+        "F4022858-479B-4E9A-8E23-49322BD1E2B6": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Weights",
+            "name": "weights",
+            "path": "com.apple.CoreML/weights"
+        }
+    },
+    "rootModelIdentifier": "9F96FCE2-4498-4D57-B588-4408C0042E9D"
+}

transformer_ane_1.5_10c_p8_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:df3d6689d04f2e360f384eda17511cfd1e0bb60e5c0d6df8a38a9703951e5fd5
+size 64916

transformer_ane_1.5_10c_p8_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e9d977a45b7aa2ad86211572d3d11e10343cbd9c4d0348965d66f3324cacdfb9
+size 311720960

transformer_ane_1.5_10c_p8_s77.mlpackage/Manifest.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+    "fileFormatVersion": "1.0.0",
+    "itemInfoEntries": {
+        "36FE5B45-C122-414C-86E8-E2A089ADC0EF": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Weights",
+            "name": "weights",
+            "path": "com.apple.CoreML/weights"
+        },
+        "4C2667B7-E0DC-44E3-941A-715C6791CF16": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Specification",
+            "name": "model.mlmodel",
+            "path": "com.apple.CoreML/model.mlmodel"
+        }
+    },
+    "rootModelIdentifier": "4C2667B7-E0DC-44E3-941A-715C6791CF16"
+}

transformer_ane_1.5_10c_p9_s77.mlpackage/Data/com.apple.CoreML/model.mlmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:186fad55a10701148183d284c9283bd1c8e9cc2d1c3390b9716df09736518184
+size 64916

transformer_ane_1.5_10c_p9_s77.mlpackage/Data/com.apple.CoreML/weights/weight.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fc14f50218fbdbc982dcd9299ca09b58190beef0205a1940640760f47e8a67f6
+size 311720960

transformer_ane_1.5_10c_p9_s77.mlpackage/Manifest.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+    "fileFormatVersion": "1.0.0",
+    "itemInfoEntries": {
+        "A5914D82-2556-4DAC-A988-DB10178F74DF": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Specification",
+            "name": "model.mlmodel",
+            "path": "com.apple.CoreML/model.mlmodel"
+        },
+        "BF4C0C2A-0609-4416-B8BF-A06038DFB07D": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Weights",
+            "name": "weights",
+            "path": "com.apple.CoreML/weights"
+        }
+    },
+    "rootModelIdentifier": "A5914D82-2556-4DAC-A988-DB10178F74DF"
+}

transformer_ane_1.5_10c_time_embed.mlpackage/Data/com.apple.CoreML/model.mlmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d04595796723317eebb98e27d829fb1c5fa155bef542d0dcb1dff97a57ed7ea4
+size 6023

transformer_ane_1.5_10c_time_embed.mlpackage/Data/com.apple.CoreML/weights/weight.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7f59b5ee6b5159a9d7a224bec785da72845a05b738847f56790beba73b3ff867
+size 142859264

transformer_ane_1.5_10c_time_embed.mlpackage/Manifest.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+    "fileFormatVersion": "1.0.0",
+    "itemInfoEntries": {
+        "576C8C5E-4549-4992-BD55-1365C4351216": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Specification",
+            "name": "model.mlmodel",
+            "path": "com.apple.CoreML/model.mlmodel"
+        },
+        "917CAE39-6EC2-43F5-A875-4155937E3E53": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Weights",
+            "name": "weights",
+            "path": "com.apple.CoreML/weights"
+        }
+    },
+    "rootModelIdentifier": "576C8C5E-4549-4992-BD55-1365C4351216"
+}

vae_ane_p1_0.5.mlpackage/Data/com.apple.CoreML/model.mlmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:925533f97f5037c1855ca11d549365d493e10acb7c2e8920b7ac1b4a80181769
+size 51583

vae_ane_p1_0.5.mlpackage/Data/com.apple.CoreML/weights/weight.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5dbfbc1778d4b8cc02440d4596d9457fca17e9e6dfd433eecb4265dcf8075311
+size 386630784