Upload folder using huggingface_hub

Browse files

Files changed (4) hide show

consolidated.safetensors +3 -0
model.safetensors.index.json +484 -0
params.json +43 -0
tokenizer.model +3 -0

consolidated.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:74eb3f5af733f180635d68b7960b01fcfab2603fa9552a6b62fdcb43ae49a315
+size 6134156483

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,484 @@

+{
+  "metadata": {
+    "total_size": 6134099968
+  },
+  "weight_map": {
+    "layers.0.attention.wk.weight": "consolidated.safetensors",
+    "layers.0.attention.wo.weight": "consolidated.safetensors",
+    "layers.0.attention.wq.weight": "consolidated.safetensors",
+    "layers.0.attention.wv.weight": "consolidated.safetensors",
+    "layers.0.attention_norm.weight": "consolidated.safetensors",
+    "layers.0.feed_forward.w1.weight": "consolidated.safetensors",
+    "layers.0.feed_forward.w2.weight": "consolidated.safetensors",
+    "layers.0.feed_forward.w3.weight": "consolidated.safetensors",
+    "layers.0.ffn_norm.weight": "consolidated.safetensors",
+    "layers.1.attention.wk.weight": "consolidated.safetensors",
+    "layers.1.attention.wo.weight": "consolidated.safetensors",
+    "layers.1.attention.wq.weight": "consolidated.safetensors",
+    "layers.1.attention.wv.weight": "consolidated.safetensors",
+    "layers.1.attention_norm.weight": "consolidated.safetensors",
+    "layers.1.feed_forward.w1.weight": "consolidated.safetensors",
+    "layers.1.feed_forward.w2.weight": "consolidated.safetensors",
+    "layers.1.feed_forward.w3.weight": "consolidated.safetensors",
+    "layers.1.ffn_norm.weight": "consolidated.safetensors",
+    "layers.10.attention.wk.weight": "consolidated.safetensors",
+    "layers.10.attention.wo.weight": "consolidated.safetensors",
+    "layers.10.attention.wq.weight": "consolidated.safetensors",
+    "layers.10.attention.wv.weight": "consolidated.safetensors",
+    "layers.10.attention_norm.weight": "consolidated.safetensors",
+    "layers.10.feed_forward.w1.weight": "consolidated.safetensors",
+    "layers.10.feed_forward.w2.weight": "consolidated.safetensors",
+    "layers.10.feed_forward.w3.weight": "consolidated.safetensors",
+    "layers.10.ffn_norm.weight": "consolidated.safetensors",
+    "layers.11.attention.wk.weight": "consolidated.safetensors",
+    "layers.11.attention.wo.weight": "consolidated.safetensors",
+    "layers.11.attention.wq.weight": "consolidated.safetensors",
+    "layers.11.attention.wv.weight": "consolidated.safetensors",
+    "layers.11.attention_norm.weight": "consolidated.safetensors",
+    "layers.11.feed_forward.w1.weight": "consolidated.safetensors",
+    "layers.11.feed_forward.w2.weight": "consolidated.safetensors",
+    "layers.11.feed_forward.w3.weight": "consolidated.safetensors",
+    "layers.11.ffn_norm.weight": "consolidated.safetensors",
+    "layers.12.attention.wk.weight": "consolidated.safetensors",
+    "layers.12.attention.wo.weight": "consolidated.safetensors",
+    "layers.12.attention.wq.weight": "consolidated.safetensors",
+    "layers.12.attention.wv.weight": "consolidated.safetensors",
+    "layers.12.attention_norm.weight": "consolidated.safetensors",
+    "layers.12.feed_forward.w1.weight": "consolidated.safetensors",
+    "layers.12.feed_forward.w2.weight": "consolidated.safetensors",
+    "layers.12.feed_forward.w3.weight": "consolidated.safetensors",
+    "layers.12.ffn_norm.weight": "consolidated.safetensors",
+    "layers.13.attention.wk.weight": "consolidated.safetensors",
+    "layers.13.attention.wo.weight": "consolidated.safetensors",
+    "layers.13.attention.wq.weight": "consolidated.safetensors",
+    "layers.13.attention.wv.weight": "consolidated.safetensors",
+    "layers.13.attention_norm.weight": "consolidated.safetensors",
+    "layers.13.feed_forward.w1.weight": "consolidated.safetensors",
+    "layers.13.feed_forward.w2.weight": "consolidated.safetensors",
+    "layers.13.feed_forward.w3.weight": "consolidated.safetensors",
+    "layers.13.ffn_norm.weight": "consolidated.safetensors",
+    "layers.14.attention.wk.weight": "consolidated.safetensors",
+    "layers.14.attention.wo.weight": "consolidated.safetensors",
+    "layers.14.attention.wq.weight": "consolidated.safetensors",
+    "layers.14.attention.wv.weight": "consolidated.safetensors",
+    "layers.14.attention_norm.weight": "consolidated.safetensors",
+    "layers.14.feed_forward.w1.weight": "consolidated.safetensors",
+    "layers.14.feed_forward.w2.weight": "consolidated.safetensors",
+    "layers.14.feed_forward.w3.weight": "consolidated.safetensors",
+    "layers.14.ffn_norm.weight": "consolidated.safetensors",
+    "layers.15.attention.wk.weight": "consolidated.safetensors",
+    "layers.15.attention.wo.weight": "consolidated.safetensors",
+    "layers.15.attention.wq.weight": "consolidated.safetensors",
+    "layers.15.attention.wv.weight": "consolidated.safetensors",
+    "layers.15.attention_norm.weight": "consolidated.safetensors",
+    "layers.15.feed_forward.w1.weight": "consolidated.safetensors",
+    "layers.15.feed_forward.w2.weight": "consolidated.safetensors",
+    "layers.15.feed_forward.w3.weight": "consolidated.safetensors",
+    "layers.15.ffn_norm.weight": "consolidated.safetensors",
+    "layers.2.attention.wk.weight": "consolidated.safetensors",
+    "layers.2.attention.wo.weight": "consolidated.safetensors",
+    "layers.2.attention.wq.weight": "consolidated.safetensors",
+    "layers.2.attention.wv.weight": "consolidated.safetensors",
+    "layers.2.attention_norm.weight": "consolidated.safetensors",
+    "layers.2.feed_forward.w1.weight": "consolidated.safetensors",
+    "layers.2.feed_forward.w2.weight": "consolidated.safetensors",
+    "layers.2.feed_forward.w3.weight": "consolidated.safetensors",
+    "layers.2.ffn_norm.weight": "consolidated.safetensors",
+    "layers.3.attention.wk.weight": "consolidated.safetensors",
+    "layers.3.attention.wo.weight": "consolidated.safetensors",
+    "layers.3.attention.wq.weight": "consolidated.safetensors",
+    "layers.3.attention.wv.weight": "consolidated.safetensors",
+    "layers.3.attention_norm.weight": "consolidated.safetensors",
+    "layers.3.feed_forward.w1.weight": "consolidated.safetensors",
+    "layers.3.feed_forward.w2.weight": "consolidated.safetensors",
+    "layers.3.feed_forward.w3.weight": "consolidated.safetensors",
+    "layers.3.ffn_norm.weight": "consolidated.safetensors",
+    "layers.4.attention.wk.weight": "consolidated.safetensors",
+    "layers.4.attention.wo.weight": "consolidated.safetensors",
+    "layers.4.attention.wq.weight": "consolidated.safetensors",
+    "layers.4.attention.wv.weight": "consolidated.safetensors",
+    "layers.4.attention_norm.weight": "consolidated.safetensors",
+    "layers.4.feed_forward.w1.weight": "consolidated.safetensors",
+    "layers.4.feed_forward.w2.weight": "consolidated.safetensors",
+    "layers.4.feed_forward.w3.weight": "consolidated.safetensors",
+    "layers.4.ffn_norm.weight": "consolidated.safetensors",
+    "layers.5.attention.wk.weight": "consolidated.safetensors",
+    "layers.5.attention.wo.weight": "consolidated.safetensors",
+    "layers.5.attention.wq.weight": "consolidated.safetensors",
+    "layers.5.attention.wv.weight": "consolidated.safetensors",
+    "layers.5.attention_norm.weight": "consolidated.safetensors",
+    "layers.5.feed_forward.w1.weight": "consolidated.safetensors",
+    "layers.5.feed_forward.w2.weight": "consolidated.safetensors",
+    "layers.5.feed_forward.w3.weight": "consolidated.safetensors",
+    "layers.5.ffn_norm.weight": "consolidated.safetensors",
+    "layers.6.attention.wk.weight": "consolidated.safetensors",
+    "layers.6.attention.wo.weight": "consolidated.safetensors",
+    "layers.6.attention.wq.weight": "consolidated.safetensors",
+    "layers.6.attention.wv.weight": "consolidated.safetensors",
+    "layers.6.attention_norm.weight": "consolidated.safetensors",
+    "layers.6.feed_forward.w1.weight": "consolidated.safetensors",
+    "layers.6.feed_forward.w2.weight": "consolidated.safetensors",
+    "layers.6.feed_forward.w3.weight": "consolidated.safetensors",
+    "layers.6.ffn_norm.weight": "consolidated.safetensors",
+    "layers.7.attention.wk.weight": "consolidated.safetensors",
+    "layers.7.attention.wo.weight": "consolidated.safetensors",
+    "layers.7.attention.wq.weight": "consolidated.safetensors",
+    "layers.7.attention.wv.weight": "consolidated.safetensors",
+    "layers.7.attention_norm.weight": "consolidated.safetensors",
+    "layers.7.feed_forward.w1.weight": "consolidated.safetensors",
+    "layers.7.feed_forward.w2.weight": "consolidated.safetensors",
+    "layers.7.feed_forward.w3.weight": "consolidated.safetensors",
+    "layers.7.ffn_norm.weight": "consolidated.safetensors",
+    "layers.8.attention.wk.weight": "consolidated.safetensors",
+    "layers.8.attention.wo.weight": "consolidated.safetensors",
+    "layers.8.attention.wq.weight": "consolidated.safetensors",
+    "layers.8.attention.wv.weight": "consolidated.safetensors",
+    "layers.8.attention_norm.weight": "consolidated.safetensors",
+    "layers.8.feed_forward.w1.weight": "consolidated.safetensors",
+    "layers.8.feed_forward.w2.weight": "consolidated.safetensors",
+    "layers.8.feed_forward.w3.weight": "consolidated.safetensors",
+    "layers.8.ffn_norm.weight": "consolidated.safetensors",
+    "layers.9.attention.wk.weight": "consolidated.safetensors",
+    "layers.9.attention.wo.weight": "consolidated.safetensors",
+    "layers.9.attention.wq.weight": "consolidated.safetensors",
+    "layers.9.attention.wv.weight": "consolidated.safetensors",
+    "layers.9.attention_norm.weight": "consolidated.safetensors",
+    "layers.9.feed_forward.w1.weight": "consolidated.safetensors",
+    "layers.9.feed_forward.w2.weight": "consolidated.safetensors",
+    "layers.9.feed_forward.w3.weight": "consolidated.safetensors",
+    "layers.9.ffn_norm.weight": "consolidated.safetensors",
+    "norm.weight": "consolidated.safetensors",
+    "tok_embeddings.weight": "consolidated.safetensors",
+    "vision_model.class_embedding": "consolidated.safetensors",
+    "vision_model.conv1.weight": "consolidated.safetensors",
+    "vision_model.ln_pre.bias": "consolidated.safetensors",
+    "vision_model.ln_pre.weight": "consolidated.safetensors",
+    "vision_model.positional_embedding": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.0.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.0.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.0.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.0.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.0.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.0.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.0.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.0.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.0.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.0.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.0.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.0.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.0.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.0.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.1.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.1.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.1.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.1.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.1.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.1.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.1.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.1.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.1.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.1.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.1.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.1.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.1.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.1.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.10.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.10.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.10.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.10.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.10.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.10.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.10.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.10.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.10.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.10.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.10.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.10.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.10.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.10.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.11.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.11.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.11.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.11.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.11.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.11.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.11.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.11.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.11.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.11.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.11.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.11.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.11.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.11.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.12.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.12.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.12.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.12.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.12.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.12.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.12.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.12.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.12.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.12.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.12.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.12.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.12.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.12.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.13.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.13.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.13.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.13.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.13.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.13.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.13.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.13.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.13.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.13.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.13.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.13.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.13.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.13.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.14.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.14.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.14.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.14.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.14.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.14.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.14.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.14.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.14.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.14.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.14.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.14.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.14.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.14.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.15.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.15.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.15.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.15.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.15.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.15.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.15.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.15.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.15.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.15.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.15.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.15.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.15.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.15.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.16.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.16.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.16.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.16.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.16.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.16.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.16.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.16.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.16.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.16.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.16.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.16.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.16.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.16.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.17.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.17.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.17.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.17.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.17.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.17.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.17.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.17.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.17.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.17.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.17.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.17.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.17.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.17.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.18.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.18.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.18.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.18.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.18.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.18.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.18.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.18.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.18.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.18.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.18.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.18.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.18.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.18.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.19.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.19.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.19.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.19.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.19.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.19.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.19.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.19.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.19.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.19.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.19.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.19.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.19.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.19.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.2.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.2.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.2.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.2.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.2.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.2.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.2.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.2.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.2.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.2.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.2.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.2.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.2.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.2.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.20.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.20.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.20.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.20.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.20.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.20.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.20.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.20.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.20.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.20.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.20.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.20.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.20.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.20.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.21.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.21.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.21.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.21.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.21.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.21.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.21.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.21.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.21.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.21.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.21.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.21.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.21.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.21.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.22.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.22.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.22.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.22.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.22.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.22.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.22.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.22.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.22.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.22.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.22.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.22.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.22.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.22.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.3.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.3.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.3.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.3.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.3.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.3.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.3.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.3.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.3.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.3.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.3.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.3.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.3.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.3.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.4.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.4.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.4.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.4.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.4.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.4.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.4.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.4.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.4.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.4.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.4.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.4.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.4.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.4.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.5.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.5.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.5.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.5.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.5.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.5.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.5.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.5.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.5.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.5.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.5.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.5.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.5.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.5.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.6.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.6.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.6.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.6.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.6.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.6.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.6.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.6.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.6.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.6.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.6.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.6.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.6.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.6.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.7.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.7.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.7.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.7.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.7.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.7.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.7.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.7.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.7.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.7.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.7.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.7.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.7.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.7.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.8.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.8.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.8.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.8.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.8.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.8.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.8.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.8.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.8.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.8.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.8.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.8.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.8.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.8.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.9.attn.in_proj_bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.9.attn.in_proj_weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.9.attn.out_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.9.attn.out_proj.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.9.ln_1.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.9.ln_1.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.9.ln_2.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.9.ln_2.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.9.ls_1.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.9.ls_2.gamma": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.9.mlp.c_fc.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.9.mlp.c_fc.weight": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.9.mlp.c_proj.bias": "consolidated.safetensors",
+    "vision_model.transformer.resblocks.9.mlp.c_proj.weight": "consolidated.safetensors",
+    "vision_projector.projector.0.bias": "consolidated.safetensors",
+    "vision_projector.projector.0.weight": "consolidated.safetensors",
+    "vision_projector.projector.2.bias": "consolidated.safetensors",
+    "vision_projector.projector.2.weight": "consolidated.safetensors"
+  }
+}

params.json ADDED Viewed

	@@ -0,0 +1,43 @@

+{
+    "distributed": {
+        "model_dtype": "bf16"
+    },
+    "model": {
+        "dim": 2048,
+        "n_layers": 16,
+        "n_heads": 32,
+        "n_kv_heads": 8,
+        "vocab_size": 128256,
+        "ffn_dim_multiplier": 1.5,
+        "multiple_of": 256,
+        "norm_eps": 1e-05,
+        "rope_theta": 500000.0,
+        "use_scaled_rope": true,
+        "rope_scale_factor": 32,
+        "high_freq_factor": 4,
+        "max_seqlen": 11520,
+        "pooling_ratio": 2,
+        "weight_tying": true,
+        "vision_model": {
+            "image_size": 448,
+            "patch_size": 14,
+            "width": 1024,
+            "layers": 23,
+            "heads": 16,
+            "use_cls_token": true,
+            "use_abs_posemb": true,
+            "ls_init_value": 0.1,
+            "drop_path": 0.1,
+            "mlp_ratio": 4.0,
+            "use_ln_post": false,
+            "pool_type": "none"
+        }
+    },
+    "data": {
+        "tokenizer_name": "plmchat",
+        "tokenizer_path": "tokenizer.model",
+        "vision_input_type": "thumb+tile",
+        "max_num_tiles": 36,
+        "max_video_frames": 32
+    }
+}

tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:82e9d31979e92ab929cd544440f129d9ecd797b69e327f80f17e1c50d5551b55
+size 2183982