ZHANGYUXUAN-zR commited on Jan 12

Commit

9de9f71

verified ·

1 Parent(s): 545c325

Add files using upload-large-folder tool

Browse files

Files changed (26) hide show

.gitattributes +1 -0
README.md +141 -3
model_index.json +33 -0
processor/chat_template.jinja +13 -0
processor/preprocessor_config.json +16 -0
processor/tokenizer.json +3 -0
processor/tokenizer_config.json +222 -0
scheduler/scheduler_config.json +18 -0
text_encoder/config.json +32 -0
text_encoder/model.safetensors +3 -0
tokenizer/added_tokens.json +127 -0
tokenizer/special_tokens_map.json +150 -0
tokenizer/tokenizer_config.json +1163 -0
transformer/config.json +14 -0
transformer/diffusion_pytorch_model-00001-of-00003.safetensors +3 -0
transformer/diffusion_pytorch_model-00002-of-00003.safetensors +3 -0
transformer/diffusion_pytorch_model-00003-of-00003.safetensors +3 -0
transformer/diffusion_pytorch_model.safetensors.index.json +450 -0
vae/config.json +71 -0
vae/diffusion_pytorch_model.safetensors +3 -0
vision_language_encoder/config.json +61 -0
vision_language_encoder/model-00001-of-00004.safetensors +3 -0
vision_language_encoder/model-00002-of-00004.safetensors +3 -0
vision_language_encoder/model-00003-of-00004.safetensors +3 -0
vision_language_encoder/model-00004-of-00004.safetensors +3 -0
vision_language_encoder/model.safetensors.index.json +1018 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+processor/tokenizer.json filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,3 +1,141 @@
----
-license: mit
----

+---
+license: mit
+language:
+  - zh
+  - en
+library_name: diffusers
+---
+# GLM-Image
+<div align="center">
+<img src=https://raw.githubusercontent.com/zai-org/GLM-Image/refs/heads/main/resources/logo.svg width="40%"/>
+</div>
+<p align="center">
+    👋 Join our <a href="https://raw.githubusercontent.com/zai-org/GLM-Image/refs/heads/main/resources/wechat.jpeg" target="_blank">WeChat</a> and <a href="https://t.co/b6zGxJvzzS" target="_blank">Discord</a> community
+    <br>
+    📖 Check out GLM-Image's <a href="https://z.ai/blog/glm-image" target="_blank">Technical Blog</a>
+    <br>
+    📍 Use GLM-Image's <a href="https://docs.z.ai/guides/image/glm-image" target="_blank">API</a>
+</p>
+GLM-Image is an image generation model adopts a hybrid autoregressive + diffusion decoder architecture, effectively pushing the upper bound of visual fidelity and fine-grained details. In general image generation quality, it aligns with industry-standard LDM-based approaches, while demonstrating significant advantages in knowledge-intensive image generation scenarios.
+<div style="display: flex; justify-content: space-around;">
+  <img src="https://raw.githubusercontent.com/zai-org/GLM-Image/refs/heads/main/resources/show_case.jpeg" width="45%"/>
+  <img src="https://raw.githubusercontent.com/zai-org/GLM-Image/refs/heads/main/resources/show_case_t2i.jpe" width="45%"/>
+</div>
+Model architecture: a hybrid autoregressive + diffusion decoder design
++ Autoregressive generator: a 9B-parameter model initialized
+  from [GLM-4-9B-0414](https://huggingface.co/zai-org/GLM-4-9B-0414), with an expanded vocabulary to incorporate visual tokens. The model first generates a compact encoding of approximately 256 tokens, then expands to 1K–4K tokens, corresponding to 1K–2K high-resolution image outputs.
++ Diffusion Decoder: a 7B-parameter decoder based on a single-stream DiT architecture for latent-space image decoding. It is equipped with a Glyph Encoder text module, significantly improving accurate text rendering within images.
+Post-training with decoupled reinforcement learning: the model introduces a fine-grained, modular feedback strategy using the GRPO algorithm, substantially enhancing both semantic understanding and visual detail quality.
++ Autoregressive module: provides low-frequency feedback signals focused on aesthetics and semantic alignment, improving instruction following and artistic expressiveness.
++ Decoder module: delivers high-frequency feedback targeting detail fidelity and text accuracy, resulting in highly realistic textures, lighting, and color reproduction, as well as more precise text rendering.
+GLM-Image supports both text-to-image and image-to-image generation within a single model
++ Text-to-image: generates high-detail images from textual descriptions, with particularly strong performance in information-dense scenarios.
++ Image-to-image: supports a wide range of tasks, including image editing, style transfer, multi-subject consistency, and identity-preserving generation for people and objects.
+## Quick Start
+### transformers + diffusers Pipeline
+Install transformers and diffusers from source:
+```shell
+pip install git+https://github.com/huggingface/transformers.git
+pip install git+https://github.com/huggingface/diffusers.git
+```
++ Text to Image Generation
+```python
+import torch
+from diffusers.pipelines.glm_image import GlmImagePipeline
+pipe = GlmImagePipeline.from_pretrained("zai-org/GLM-Image", torch_dtype=torch.bfloat16, device_map="cuda")
+prompt = "A beautifully designed modern food magazine style dessert recipe illustration, themed around a raspberry mousse cake. The overall layout is clean and bright, divided into four main areas: the top left features a bold black title 'Raspberry Mousse Cake Recipe Guide', with a soft-lit close-up photo of the finished cake on the right, showcasing a light pink cake adorned with fresh raspberries and mint leaves; the bottom left contains an ingredient list section, titled 'Ingredients' in a simple font, listing 'Flour 150g', 'Eggs 3', 'Sugar 120g', 'Raspberry puree 200g', 'Gelatin sheets 10g', 'Whipping cream 300ml', and 'Fresh raspberries', each accompanied by minimalist line icons (like a flour bag, eggs, sugar jar, etc.); the bottom right displays four equally sized step boxes, each containing high-definition macro photos and corresponding instructions, arranged from top to bottom as follows: Step 1 shows a whisk whipping white foam (with the instruction 'Whip egg whites to stiff peaks'), Step 2 shows a red-and-white mixture being folded with a spatula (with the instruction 'Gently fold in the puree and batter'), Step 3 shows pink liquid being poured into a round mold (with the instruction 'Pour into mold and chill for 4 hours'), Step 4 shows the finished cake decorated with raspberries and mint leaves (with the instruction 'Decorate with raspberries and mint'); a light brown information bar runs along the bottom edge, with icons on the left representing 'Preparation time: 30 minutes', 'Cooking time: 20 minutes', and 'Servings: 8'. The overall color scheme is dominated by creamy white and light pink, with a subtle paper texture in the background, featuring compact and orderly text and image layout with clear information hierarchy."
+image = pipe(
+    prompt=prompt,
+    height=32 * 32,
+    width=36 * 32,
+    num_inference_steps=30,
+    guidance_scale=1.5,
+    generator=torch.Generator(device="cuda").manual_seed(42),
+).images[0]
+image.save("output_t2i.png")
+```
++ Image to Image Generation
+```python
+import torch
+from diffusers.pipelines.glm_image import GlmImagePipeline
+from PIL import Image
+pipe = GlmImagePipeline.from_pretrained("zai-org/GLM-Image", torch_dtype=torch.bfloat16, device_map="cuda")
+image_path = "cond.jpg"
+prompt = "Replace the background of the snow forest with an underground station featuring an automatic escalator."
+image = Image.open(image_path).convert("RGB")
+image = pipe(
+    prompt=prompt,
+    image=[image],  # can input multiple images for multi-image-to-image generation such as [image, image1]
+    height=33 * 32,
+    width=32 * 32,
+    num_inference_steps=30,
+    guidance_scale=1.5,
+    generator=torch.Generator(device="cuda").manual_seed(42),
+).images[0]
+image.save("output_i2i.png")
+```
++ Since the AR model used in GLM-Image is configured with `do_sample=True` and a temperature of `0.95` by default, the generated images can vary significantly across runs. We do not recommend setting do_sample=False, as this may lead to incorrect or degenerate outputs from the AR model.
+### Prompt Enhancement for Generation
+We use GLM-4.7 to improve prompt, Please check our [github script](https://github.com/zai-org/GLM-Image/blob/main/examples/prompt_utils.py) for more details.
+## Model Performance
+### Text Rendering
+|     **Model**      | **Open Source** | **LongText-Bench-EN** | **LongText-Bench-ZH** | **CVTG-2K (Acc)** | **CVTG-2K (NED)** | **CVTG-2K (CLIPScore)** |
+|:------------------:|:---------------:|:---------------------:|:---------------------:|:-----------------:|:-----------------:|:-----------------------:|
+|    Seedream 4.5    |        ✗        |         0.989         |         0.987         |      0.8990       |      0.9483       |       **0.8069**        |
+|    Seedream 4.0    |        ✗        |         0.921         |         0.926         |      0.8451       |      0.9224       |         0.7975          |
+|  Nano Banana 2.0   |        ✗        |         0.981         |         0.949         |      0.7788       |      0.8754       |         0.7372          |
+| GPT Image 1 [High] |        ✗        |         0.956         |         0.619         |      0.8569       |      0.9478       |         0.7982          |
+|     Qwen-Image     |        ✓        |         0.943         |         0.946         |      0.8288       |      0.9116       |         0.8017          |
+|  Qwen-Image-2512   |        ✓        |         0.956         |         0.965         |      0.8604       |      0.9290       |         0.7819          |
+|      Z-Image       |        ✓        |         0.935         |         0.936         |      0.8671       |      0.9367       |         0.7969          |
+|   Z-Image-Turbo    |        ✓        |         0.917         |         0.926         |      0.8585       |      0.9281       |         0.8048          |
+|   **GLM-Image**    |        ✓        |         0.952         |         0.979         |    **0.9116**     |    **0.9557**     |         0.7877          |
+### Text-to-Image Benchmarks
+| **Model**          | **Open Source** | **OneIG-Bench-EN** | **OneIG-Bench-ZH** | **TIIF-Bench short** | **TIIF-Bench long** | **DPG-Bench** |
+|--------------------|:---------------:|:------------------:|:------------------:|:--------------------:|:-------------------:|:-------------:|
+| Seedream 4.5       |        ✗        |       0.576        |       0.551        |        90.49         |      **88.52**      |   **88.63**   |
+| Seedream 4.0       |        ✗        |       0.576        |       0.553        |        90.45         |        88.08        |     88.54     |
+| Nano Banana 2.0    |        ✗        |     **0.578**      |     **0.567**      |      **91.00**       |        88.26        |     87.16     |
+| GPT Image 1 [High] |        ✗        |       0.533        |       0.474        |        89.15         |        88.29        |     85.15     |
+| DALL-E 3           |        ✗        |         -          |         -          |        74.96         |        70.81        |     83.50     |
+| Qwen-Image         |        ✓        |       0.539        |       0.548        |        86.14         |        86.83        |     88.32     |
+| Qwen-Image-2512    |        ✓        |       0.530        |       0.515        |        83.24         |        84.93        |     87.20     |
+| Z-Image            |        ✓        |       0.546        |       0.535        |        80.20         |        83.01        |     88.14     |
+| Z-Image-Turbo      |        ✓        |       0.528        |       0.507        |        77.73         |        80.05        |     84.86     |
+| FLUX.1 [Dev]       |        ✓        |       0.434        |         -          |        71.09         |        71.78        |     83.52     |
+| SD3 Medium         |        ✓        |         -          |         -          |        67.46         |        66.09        |     84.08     |
+| SD XL              |        ✓        |       0.316        |         -          |        54.96         |        42.13        |     74.65     |
+| BAGEL              |        ✓        |       0.361        |       0.370        |        71.50         |        71.70        |       -       |
+| Janus-Pro          |        ✓        |       0.267        |       0.240        |        66.50         |        65.01        |     84.19     |
+| Show-o2            |        ✓        |       0.308        |         -          |        59.72         |        58.86        |       -       |
+| **GLM-Image**      |        ✓        |       0.528        |       0.511        |        81.01         |        81.02        |     84.78     |

model_index.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "_class_name": "GlmImagePipeline",
+  "_diffusers_version": "0.37.0.dev0",
+  "_name_or_path": "zai-org/GLM-Image-Decoder",
+  "text_encoder": [
+    "transformers",
+    "T5EncoderModel"
+  ],
+  "vision_language_encoder": [
+    "transformers",
+    "GlmImageForConditionalGeneration"
+  ],
+  "scheduler": [
+    "diffusers",
+    "FlowMatchEulerDiscreteScheduler"
+  ],
+  "tokenizer": [
+    "transformers",
+    "ByT5Tokenizer"
+  ],
+  "processor":[
+    "transformers",
+    "GlmImageProcessor"
+  ],
+  "transformer": [
+    "diffusers",
+    "GlmImageTransformer2DModel"
+  ],
+  "vae": [
+    "diffusers",
+    "AutoencoderKL"
+  ]
+}

processor/chat_template.jinja ADDED Viewed

	@@ -0,0 +1,13 @@

+{%- for m in messages -%}
+    {%- if m.content is string -%}
+        {{ m.content }}
+    {%- else -%}
+        {%- for item in m.content -%}
+            {%- if item.type == 'image' or item.get('image') is not none -%}
+            <|dit_token_16384|><|image|><|dit_token_16385|>
+            {%- elif item.type == 'text' -%}
+                {{ item.text }}
+            {%- endif -%}
+        {%- endfor -%}
+    {%- endif -%}
+{%- endfor -%}

processor/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+    "min_pixels": 262144,
+    "max_pixels": 4194304,
+    "do_rescale": true,
+    "do_normalize": true,
+    "do_resize": true,
+    "patch_size": 16,
+    "temporal_patch_size": 1,
+    "merge_size": 1,
+    "image_mean": [0.5, 0.5, 0.5],
+    "image_std": [0.5, 0.5, 0.5],
+    "image_processor_type": "GlmImageImageProcessor",
+    "processor_class": "GlmImageProcessor",
+    "resample": 3,
+    "rescale_factor": 0.00392156862745098
+}

processor/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7626ee04802e81cadec0dbb983f2278aa24240b3b5c86a0b7831199ef25c6652
+size 23763950

processor/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,222 @@

+{
+  "added_tokens_decoder": {
+    "167841": {
+      "content": "<|endoftext|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "167842": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "167843": {
+      "content": "[gMASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "167844": {
+      "content": "[sMASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "167845": {
+      "content": "<sop>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "167846": {
+      "content": "<eop>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "167847": {
+      "content": "<|system|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "167848": {
+      "content": "<|user|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "167849": {
+      "content": "<|assistant|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "167850": {
+      "content": "<|observation|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "167851": {
+      "content": "<|begin_of_image|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "167852": {
+      "content": "<|end_of_image|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "167853": {
+      "content": "<|begin_of_video|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "167854": {
+      "content": "<|end_of_video|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "167855": {
+      "content": "<|image|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "167856": {
+      "content": "<|video|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "167857": {
+      "content": "<think>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "167858": {
+      "content": "</think>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "167859": {
+      "content": "<answer>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "167860": {
+      "content": "</answer>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "167861": {
+      "content": "<|begin_of_box|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "167862": {
+      "content": "<|end_of_box|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "167863": {
+      "content": "<|sep|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    }
+  },
+  "additional_special_tokens": [
+    "<|endoftext|>",
+    "[MASK]",
+    "[gMASK]",
+    "[sMASK]",
+    "<sop>",
+    "<eop>",
+    "<|system|>",
+    "<|user|>",
+    "<|assistant|>",
+    "<|observation|>",
+    "<|begin_of_image|>",
+    "<|end_of_image|>",
+    "<|begin_of_video|>",
+    "<|end_of_video|>",
+    "<|image|>",
+    "<|video|>"
+  ],
+  "clean_up_tokenization_spaces": false,
+  "do_lower_case": false,
+  "eos_token": "<|dit_token_16385|>",
+  "bos_token": "<|dit_token_16384|>",
+  "pad_token": "<|dit_token_16385|>",
+  "image_token": "<|image|>",
+  "grid_bos_token": "<sop>",
+  "grid_eos_token": "<eop>",
+  "model_input_names": [
+    "input_ids",
+    "attention_mask"
+  ],
+  "model_max_length": 65536,
+  "padding_side": "left",
+  "remove_space": false,
+  "tokenizer_class": "PreTrainedTokenizer"
+}

scheduler/scheduler_config.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+  "_class_name": "FlowMatchEulerDiscreteScheduler",
+  "_diffusers_version": "0.37.0.dev0",
+  "base_image_seq_len": 256,
+  "base_shift": 0.25,
+  "invert_sigmas": false,
+  "max_image_seq_len": 4096,
+  "max_shift": 0.75,
+  "num_train_timesteps": 1000,
+  "shift": 1.0,
+  "shift_terminal": null,
+  "stochastic_sampling": false,
+  "time_shift_type": "linear",
+  "use_beta_sigmas": false,
+  "use_dynamic_shifting": true,
+  "use_exponential_sigmas": false,
+  "use_karras_sigmas": false
+}

text_encoder/config.json ADDED Viewed

	@@ -0,0 +1,32 @@

+{
+  "architectures": [
+    "T5EncoderModel"
+  ],
+  "classifier_dropout": 0.0,
+  "d_ff": 3584,
+  "d_kv": 64,
+  "d_model": 1472,
+  "decoder_start_token_id": 0,
+  "dense_act_fn": "gelu_new",
+  "dropout_rate": 0.1,
+  "dtype": "float32",
+  "eos_token_id": 1,
+  "feed_forward_proj": "gated-gelu",
+  "gradient_checkpointing": false,
+  "initializer_factor": 1.0,
+  "is_encoder_decoder": false,
+  "is_gated_act": true,
+  "layer_norm_epsilon": 1e-06,
+  "model_type": "t5",
+  "num_decoder_layers": 4,
+  "num_heads": 6,
+  "num_layers": 12,
+  "pad_token_id": 0,
+  "relative_attention_max_distance": 128,
+  "relative_attention_num_buckets": 32,
+  "tie_word_embeddings": false,
+  "tokenizer_class": "ByT5Tokenizer",
+  "transformers_version": "4.57.3",
+  "use_cache": false,
+  "vocab_size": 384
+}

text_encoder/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aa1ce00ffb0fe8912dfe32c11ba235b87511604298b605ef95314668a02f2bbf
+size 870643240

tokenizer/added_tokens.json ADDED Viewed

	@@ -0,0 +1,127 @@

+{
+  "<extra_id_0>": 259,
+  "<extra_id_100>": 359,
+  "<extra_id_101>": 360,
+  "<extra_id_102>": 361,
+  "<extra_id_103>": 362,
+  "<extra_id_104>": 363,
+  "<extra_id_105>": 364,
+  "<extra_id_106>": 365,
+  "<extra_id_107>": 366,
+  "<extra_id_108>": 367,
+  "<extra_id_109>": 368,
+  "<extra_id_10>": 269,
+  "<extra_id_110>": 369,
+  "<extra_id_111>": 370,
+  "<extra_id_112>": 371,
+  "<extra_id_113>": 372,
+  "<extra_id_114>": 373,
+  "<extra_id_115>": 374,
+  "<extra_id_116>": 375,
+  "<extra_id_117>": 376,
+  "<extra_id_118>": 377,
+  "<extra_id_119>": 378,
+  "<extra_id_11>": 270,
+  "<extra_id_120>": 379,
+  "<extra_id_121>": 380,
+  "<extra_id_122>": 381,
+  "<extra_id_123>": 382,
+  "<extra_id_124>": 383,
+  "<extra_id_12>": 271,
+  "<extra_id_13>": 272,
+  "<extra_id_14>": 273,
+  "<extra_id_15>": 274,
+  "<extra_id_16>": 275,
+  "<extra_id_17>": 276,
+  "<extra_id_18>": 277,
+  "<extra_id_19>": 278,
+  "<extra_id_1>": 260,
+  "<extra_id_20>": 279,
+  "<extra_id_21>": 280,
+  "<extra_id_22>": 281,
+  "<extra_id_23>": 282,
+  "<extra_id_24>": 283,
+  "<extra_id_25>": 284,
+  "<extra_id_26>": 285,
+  "<extra_id_27>": 286,
+  "<extra_id_28>": 287,
+  "<extra_id_29>": 288,
+  "<extra_id_2>": 261,
+  "<extra_id_30>": 289,
+  "<extra_id_31>": 290,
+  "<extra_id_32>": 291,
+  "<extra_id_33>": 292,
+  "<extra_id_34>": 293,
+  "<extra_id_35>": 294,
+  "<extra_id_36>": 295,
+  "<extra_id_37>": 296,
+  "<extra_id_38>": 297,
+  "<extra_id_39>": 298,
+  "<extra_id_3>": 262,
+  "<extra_id_40>": 299,
+  "<extra_id_41>": 300,
+  "<extra_id_42>": 301,
+  "<extra_id_43>": 302,
+  "<extra_id_44>": 303,
+  "<extra_id_45>": 304,
+  "<extra_id_46>": 305,
+  "<extra_id_47>": 306,
+  "<extra_id_48>": 307,
+  "<extra_id_49>": 308,
+  "<extra_id_4>": 263,
+  "<extra_id_50>": 309,
+  "<extra_id_51>": 310,
+  "<extra_id_52>": 311,
+  "<extra_id_53>": 312,
+  "<extra_id_54>": 313,
+  "<extra_id_55>": 314,
+  "<extra_id_56>": 315,
+  "<extra_id_57>": 316,
+  "<extra_id_58>": 317,
+  "<extra_id_59>": 318,
+  "<extra_id_5>": 264,
+  "<extra_id_60>": 319,
+  "<extra_id_61>": 320,
+  "<extra_id_62>": 321,
+  "<extra_id_63>": 322,
+  "<extra_id_64>": 323,
+  "<extra_id_65>": 324,
+  "<extra_id_66>": 325,
+  "<extra_id_67>": 326,
+  "<extra_id_68>": 327,
+  "<extra_id_69>": 328,
+  "<extra_id_6>": 265,
+  "<extra_id_70>": 329,
+  "<extra_id_71>": 330,
+  "<extra_id_72>": 331,
+  "<extra_id_73>": 332,
+  "<extra_id_74>": 333,
+  "<extra_id_75>": 334,
+  "<extra_id_76>": 335,
+  "<extra_id_77>": 336,
+  "<extra_id_78>": 337,
+  "<extra_id_79>": 338,
+  "<extra_id_7>": 266,
+  "<extra_id_80>": 339,
+  "<extra_id_81>": 340,
+  "<extra_id_82>": 341,
+  "<extra_id_83>": 342,
+  "<extra_id_84>": 343,
+  "<extra_id_85>": 344,
+  "<extra_id_86>": 345,
+  "<extra_id_87>": 346,
+  "<extra_id_88>": 347,
+  "<extra_id_89>": 348,
+  "<extra_id_8>": 267,
+  "<extra_id_90>": 349,
+  "<extra_id_91>": 350,
+  "<extra_id_92>": 351,
+  "<extra_id_93>": 352,
+  "<extra_id_94>": 353,
+  "<extra_id_95>": 354,
+  "<extra_id_96>": 355,
+  "<extra_id_97>": 356,
+  "<extra_id_98>": 357,
+  "<extra_id_99>": 358,
+  "<extra_id_9>": 268
+}

tokenizer/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,150 @@

+{
+  "additional_special_tokens": [
+    "<extra_id_0>",
+    "<extra_id_1>",
+    "<extra_id_2>",
+    "<extra_id_3>",
+    "<extra_id_4>",
+    "<extra_id_5>",
+    "<extra_id_6>",
+    "<extra_id_7>",
+    "<extra_id_8>",
+    "<extra_id_9>",
+    "<extra_id_10>",
+    "<extra_id_11>",
+    "<extra_id_12>",
+    "<extra_id_13>",
+    "<extra_id_14>",
+    "<extra_id_15>",
+    "<extra_id_16>",
+    "<extra_id_17>",
+    "<extra_id_18>",
+    "<extra_id_19>",
+    "<extra_id_20>",
+    "<extra_id_21>",
+    "<extra_id_22>",
+    "<extra_id_23>",
+    "<extra_id_24>",
+    "<extra_id_25>",
+    "<extra_id_26>",
+    "<extra_id_27>",
+    "<extra_id_28>",
+    "<extra_id_29>",
+    "<extra_id_30>",
+    "<extra_id_31>",
+    "<extra_id_32>",
+    "<extra_id_33>",
+    "<extra_id_34>",
+    "<extra_id_35>",
+    "<extra_id_36>",
+    "<extra_id_37>",
+    "<extra_id_38>",
+    "<extra_id_39>",
+    "<extra_id_40>",
+    "<extra_id_41>",
+    "<extra_id_42>",
+    "<extra_id_43>",
+    "<extra_id_44>",
+    "<extra_id_45>",
+    "<extra_id_46>",
+    "<extra_id_47>",
+    "<extra_id_48>",
+    "<extra_id_49>",
+    "<extra_id_50>",
+    "<extra_id_51>",
+    "<extra_id_52>",
+    "<extra_id_53>",
+    "<extra_id_54>",
+    "<extra_id_55>",
+    "<extra_id_56>",
+    "<extra_id_57>",
+    "<extra_id_58>",
+    "<extra_id_59>",
+    "<extra_id_60>",
+    "<extra_id_61>",
+    "<extra_id_62>",
+    "<extra_id_63>",
+    "<extra_id_64>",
+    "<extra_id_65>",
+    "<extra_id_66>",
+    "<extra_id_67>",
+    "<extra_id_68>",
+    "<extra_id_69>",
+    "<extra_id_70>",
+    "<extra_id_71>",
+    "<extra_id_72>",
+    "<extra_id_73>",
+    "<extra_id_74>",
+    "<extra_id_75>",
+    "<extra_id_76>",
+    "<extra_id_77>",
+    "<extra_id_78>",
+    "<extra_id_79>",
+    "<extra_id_80>",
+    "<extra_id_81>",
+    "<extra_id_82>",
+    "<extra_id_83>",
+    "<extra_id_84>",
+    "<extra_id_85>",
+    "<extra_id_86>",
+    "<extra_id_87>",
+    "<extra_id_88>",
+    "<extra_id_89>",
+    "<extra_id_90>",
+    "<extra_id_91>",
+    "<extra_id_92>",
+    "<extra_id_93>",
+    "<extra_id_94>",
+    "<extra_id_95>",
+    "<extra_id_96>",
+    "<extra_id_97>",
+    "<extra_id_98>",
+    "<extra_id_99>",
+    "<extra_id_100>",
+    "<extra_id_101>",
+    "<extra_id_102>",
+    "<extra_id_103>",
+    "<extra_id_104>",
+    "<extra_id_105>",
+    "<extra_id_106>",
+    "<extra_id_107>",
+    "<extra_id_108>",
+    "<extra_id_109>",
+    "<extra_id_110>",
+    "<extra_id_111>",
+    "<extra_id_112>",
+    "<extra_id_113>",
+    "<extra_id_114>",
+    "<extra_id_115>",
+    "<extra_id_116>",
+    "<extra_id_117>",
+    "<extra_id_118>",
+    "<extra_id_119>",
+    "<extra_id_120>",
+    "<extra_id_121>",
+    "<extra_id_122>",
+    "<extra_id_123>",
+    "<extra_id_124>"
+  ],
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,1163 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "259": {
+      "content": "<extra_id_0>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "260": {
+      "content": "<extra_id_1>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "261": {
+      "content": "<extra_id_2>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "262": {
+      "content": "<extra_id_3>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "263": {
+      "content": "<extra_id_4>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "264": {
+      "content": "<extra_id_5>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "265": {
+      "content": "<extra_id_6>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "266": {
+      "content": "<extra_id_7>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "267": {
+      "content": "<extra_id_8>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "268": {
+      "content": "<extra_id_9>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "269": {
+      "content": "<extra_id_10>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "270": {
+      "content": "<extra_id_11>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "271": {
+      "content": "<extra_id_12>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "272": {
+      "content": "<extra_id_13>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "273": {
+      "content": "<extra_id_14>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "274": {
+      "content": "<extra_id_15>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "275": {
+      "content": "<extra_id_16>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "276": {
+      "content": "<extra_id_17>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "277": {
+      "content": "<extra_id_18>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "278": {
+      "content": "<extra_id_19>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "279": {
+      "content": "<extra_id_20>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "280": {
+      "content": "<extra_id_21>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "281": {
+      "content": "<extra_id_22>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "282": {
+      "content": "<extra_id_23>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "283": {
+      "content": "<extra_id_24>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "284": {
+      "content": "<extra_id_25>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "285": {
+      "content": "<extra_id_26>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "286": {
+      "content": "<extra_id_27>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "287": {
+      "content": "<extra_id_28>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "288": {
+      "content": "<extra_id_29>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "289": {
+      "content": "<extra_id_30>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "290": {
+      "content": "<extra_id_31>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "291": {
+      "content": "<extra_id_32>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "292": {
+      "content": "<extra_id_33>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "293": {
+      "content": "<extra_id_34>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "294": {
+      "content": "<extra_id_35>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "295": {
+      "content": "<extra_id_36>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "296": {
+      "content": "<extra_id_37>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "297": {
+      "content": "<extra_id_38>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "298": {
+      "content": "<extra_id_39>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "299": {
+      "content": "<extra_id_40>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "300": {
+      "content": "<extra_id_41>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "301": {
+      "content": "<extra_id_42>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "302": {
+      "content": "<extra_id_43>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "303": {
+      "content": "<extra_id_44>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "304": {
+      "content": "<extra_id_45>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "305": {
+      "content": "<extra_id_46>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "306": {
+      "content": "<extra_id_47>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "307": {
+      "content": "<extra_id_48>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "308": {
+      "content": "<extra_id_49>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "309": {
+      "content": "<extra_id_50>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "310": {
+      "content": "<extra_id_51>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "311": {
+      "content": "<extra_id_52>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "312": {
+      "content": "<extra_id_53>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "313": {
+      "content": "<extra_id_54>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "314": {
+      "content": "<extra_id_55>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "315": {
+      "content": "<extra_id_56>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "316": {
+      "content": "<extra_id_57>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "317": {
+      "content": "<extra_id_58>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "318": {
+      "content": "<extra_id_59>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "319": {
+      "content": "<extra_id_60>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "320": {
+      "content": "<extra_id_61>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "321": {
+      "content": "<extra_id_62>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "322": {
+      "content": "<extra_id_63>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "323": {
+      "content": "<extra_id_64>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "324": {
+      "content": "<extra_id_65>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "325": {
+      "content": "<extra_id_66>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "326": {
+      "content": "<extra_id_67>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "327": {
+      "content": "<extra_id_68>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "328": {
+      "content": "<extra_id_69>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "329": {
+      "content": "<extra_id_70>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "330": {
+      "content": "<extra_id_71>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "331": {
+      "content": "<extra_id_72>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "332": {
+      "content": "<extra_id_73>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "333": {
+      "content": "<extra_id_74>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "334": {
+      "content": "<extra_id_75>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "335": {
+      "content": "<extra_id_76>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "336": {
+      "content": "<extra_id_77>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "337": {
+      "content": "<extra_id_78>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "338": {
+      "content": "<extra_id_79>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "339": {
+      "content": "<extra_id_80>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "340": {
+      "content": "<extra_id_81>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "341": {
+      "content": "<extra_id_82>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "342": {
+      "content": "<extra_id_83>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "343": {
+      "content": "<extra_id_84>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "344": {
+      "content": "<extra_id_85>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "345": {
+      "content": "<extra_id_86>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "346": {
+      "content": "<extra_id_87>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "347": {
+      "content": "<extra_id_88>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "348": {
+      "content": "<extra_id_89>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "349": {
+      "content": "<extra_id_90>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "350": {
+      "content": "<extra_id_91>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "351": {
+      "content": "<extra_id_92>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "352": {
+      "content": "<extra_id_93>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "353": {
+      "content": "<extra_id_94>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "354": {
+      "content": "<extra_id_95>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "355": {
+      "content": "<extra_id_96>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "356": {
+      "content": "<extra_id_97>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "357": {
+      "content": "<extra_id_98>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "358": {
+      "content": "<extra_id_99>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "359": {
+      "content": "<extra_id_100>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "360": {
+      "content": "<extra_id_101>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "361": {
+      "content": "<extra_id_102>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "362": {
+      "content": "<extra_id_103>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "363": {
+      "content": "<extra_id_104>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "364": {
+      "content": "<extra_id_105>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "365": {
+      "content": "<extra_id_106>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "366": {
+      "content": "<extra_id_107>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "367": {
+      "content": "<extra_id_108>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "368": {
+      "content": "<extra_id_109>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "369": {
+      "content": "<extra_id_110>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "370": {
+      "content": "<extra_id_111>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "371": {
+      "content": "<extra_id_112>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "372": {
+      "content": "<extra_id_113>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "373": {
+      "content": "<extra_id_114>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "374": {
+      "content": "<extra_id_115>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "375": {
+      "content": "<extra_id_116>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "376": {
+      "content": "<extra_id_117>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "377": {
+      "content": "<extra_id_118>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "378": {
+      "content": "<extra_id_119>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "379": {
+      "content": "<extra_id_120>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "380": {
+      "content": "<extra_id_121>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "381": {
+      "content": "<extra_id_122>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "382": {
+      "content": "<extra_id_123>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "383": {
+      "content": "<extra_id_124>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [
+    "<extra_id_0>",
+    "<extra_id_1>",
+    "<extra_id_2>",
+    "<extra_id_3>",
+    "<extra_id_4>",
+    "<extra_id_5>",
+    "<extra_id_6>",
+    "<extra_id_7>",
+    "<extra_id_8>",
+    "<extra_id_9>",
+    "<extra_id_10>",
+    "<extra_id_11>",
+    "<extra_id_12>",
+    "<extra_id_13>",
+    "<extra_id_14>",
+    "<extra_id_15>",
+    "<extra_id_16>",
+    "<extra_id_17>",
+    "<extra_id_18>",
+    "<extra_id_19>",
+    "<extra_id_20>",
+    "<extra_id_21>",
+    "<extra_id_22>",
+    "<extra_id_23>",
+    "<extra_id_24>",
+    "<extra_id_25>",
+    "<extra_id_26>",
+    "<extra_id_27>",
+    "<extra_id_28>",
+    "<extra_id_29>",
+    "<extra_id_30>",
+    "<extra_id_31>",
+    "<extra_id_32>",
+    "<extra_id_33>",
+    "<extra_id_34>",
+    "<extra_id_35>",
+    "<extra_id_36>",
+    "<extra_id_37>",
+    "<extra_id_38>",
+    "<extra_id_39>",
+    "<extra_id_40>",
+    "<extra_id_41>",
+    "<extra_id_42>",
+    "<extra_id_43>",
+    "<extra_id_44>",
+    "<extra_id_45>",
+    "<extra_id_46>",
+    "<extra_id_47>",
+    "<extra_id_48>",
+    "<extra_id_49>",
+    "<extra_id_50>",
+    "<extra_id_51>",
+    "<extra_id_52>",
+    "<extra_id_53>",
+    "<extra_id_54>",
+    "<extra_id_55>",
+    "<extra_id_56>",
+    "<extra_id_57>",
+    "<extra_id_58>",
+    "<extra_id_59>",
+    "<extra_id_60>",
+    "<extra_id_61>",
+    "<extra_id_62>",
+    "<extra_id_63>",
+    "<extra_id_64>",
+    "<extra_id_65>",
+    "<extra_id_66>",
+    "<extra_id_67>",
+    "<extra_id_68>",
+    "<extra_id_69>",
+    "<extra_id_70>",
+    "<extra_id_71>",
+    "<extra_id_72>",
+    "<extra_id_73>",
+    "<extra_id_74>",
+    "<extra_id_75>",
+    "<extra_id_76>",
+    "<extra_id_77>",
+    "<extra_id_78>",
+    "<extra_id_79>",
+    "<extra_id_80>",
+    "<extra_id_81>",
+    "<extra_id_82>",
+    "<extra_id_83>",
+    "<extra_id_84>",
+    "<extra_id_85>",
+    "<extra_id_86>",
+    "<extra_id_87>",
+    "<extra_id_88>",
+    "<extra_id_89>",
+    "<extra_id_90>",
+    "<extra_id_91>",
+    "<extra_id_92>",
+    "<extra_id_93>",
+    "<extra_id_94>",
+    "<extra_id_95>",
+    "<extra_id_96>",
+    "<extra_id_97>",
+    "<extra_id_98>",
+    "<extra_id_99>",
+    "<extra_id_100>",
+    "<extra_id_101>",
+    "<extra_id_102>",
+    "<extra_id_103>",
+    "<extra_id_104>",
+    "<extra_id_105>",
+    "<extra_id_106>",
+    "<extra_id_107>",
+    "<extra_id_108>",
+    "<extra_id_109>",
+    "<extra_id_110>",
+    "<extra_id_111>",
+    "<extra_id_112>",
+    "<extra_id_113>",
+    "<extra_id_114>",
+    "<extra_id_115>",
+    "<extra_id_116>",
+    "<extra_id_117>",
+    "<extra_id_118>",
+    "<extra_id_119>",
+    "<extra_id_120>",
+    "<extra_id_121>",
+    "<extra_id_122>",
+    "<extra_id_123>",
+    "<extra_id_124>"
+  ],
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "extra_ids": 0,
+  "extra_special_tokens": {},
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<pad>",
+  "tokenizer_class": "ByT5Tokenizer",
+  "unk_token": "<unk>"
+}

transformer/config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "_class_name": "GlmImageTransformer2DModel",
+  "_diffusers_version": "0.37.0.dev0",
+  "attention_head_dim": 128,
+  "condition_dim": 256,
+  "in_channels": 16,
+  "num_attention_heads": 32,
+  "num_layers": 30,
+  "out_channels": 16,
+  "patch_size": 2,
+  "prior_vq_quantizer_codebook_size": 16384,
+  "text_embed_dim": 1472,
+  "time_embed_dim": 512
+}

transformer/diffusion_pytorch_model-00001-of-00003.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f58e49fd4f181d80aa4ea22de425e7f49a9e1d0f35415fe53634e722670eec55
+size 4966398856

transformer/diffusion_pytorch_model-00002-of-00003.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:828d8aa45a4ded6d32e5018d36af9f234929966df3066cbc2b77afe22e4fa59a
+size 4984743304

transformer/diffusion_pytorch_model-00003-of-00003.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:209b6fa82bd9632e44e9a2daea8727bd3f8206331dd20d784f5cdc39a65a035f
+size 3902674480

transformer/diffusion_pytorch_model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,450 @@

+{
+  "metadata": {
+    "total_size": 13853765760
+  },
+  "weight_map": {
+    "glyph_projector.net.0.proj.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "glyph_projector.net.0.proj.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "glyph_projector.net.2.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "glyph_projector.net.2.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "image_projector.proj.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "image_projector.proj.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "norm_out.linear.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "norm_out.linear.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "prior_projector.net.0.proj.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "prior_projector.net.0.proj.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "prior_projector.net.2.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "prior_projector.net.2.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "prior_token_embedding.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "proj_out.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "proj_out.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "time_condition_embed.condition_embedder.linear_1.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "time_condition_embed.condition_embedder.linear_1.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "time_condition_embed.condition_embedder.linear_2.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "time_condition_embed.condition_embedder.linear_2.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "time_condition_embed.timestep_embedder.linear_1.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "time_condition_embed.timestep_embedder.linear_1.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "time_condition_embed.timestep_embedder.linear_2.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "time_condition_embed.timestep_embedder.linear_2.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.0.attn1.to_k.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.0.attn1.to_k.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.0.attn1.to_out.0.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.0.attn1.to_out.0.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.0.attn1.to_q.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.0.attn1.to_q.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.0.attn1.to_v.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.0.attn1.to_v.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.0.ff.net.0.proj.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.0.ff.net.0.proj.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.0.ff.net.2.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.0.ff.net.2.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.0.norm1.linear.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.0.norm1.linear.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.1.attn1.to_k.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.1.attn1.to_k.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.1.attn1.to_out.0.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.1.attn1.to_out.0.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.1.attn1.to_q.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.1.attn1.to_q.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.1.attn1.to_v.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.1.attn1.to_v.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.1.ff.net.0.proj.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.1.ff.net.0.proj.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.1.ff.net.2.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.1.ff.net.2.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.1.norm1.linear.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.1.norm1.linear.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.10.attn1.to_k.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.10.attn1.to_k.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.10.attn1.to_out.0.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.10.attn1.to_out.0.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.10.attn1.to_q.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.10.attn1.to_q.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.10.attn1.to_v.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.10.attn1.to_v.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.10.ff.net.0.proj.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.10.ff.net.0.proj.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.10.ff.net.2.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.10.ff.net.2.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.10.norm1.linear.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.10.norm1.linear.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.11.attn1.to_k.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.11.attn1.to_k.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.11.attn1.to_out.0.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.11.attn1.to_out.0.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.11.attn1.to_q.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.11.attn1.to_q.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.11.attn1.to_v.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.11.attn1.to_v.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.11.ff.net.0.proj.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.11.ff.net.0.proj.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.11.ff.net.2.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.11.ff.net.2.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.11.norm1.linear.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.11.norm1.linear.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.12.attn1.to_k.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.12.attn1.to_k.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.12.attn1.to_out.0.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.12.attn1.to_out.0.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.12.attn1.to_q.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.12.attn1.to_q.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.12.attn1.to_v.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.12.attn1.to_v.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.12.ff.net.0.proj.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.12.ff.net.0.proj.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.12.ff.net.2.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.12.ff.net.2.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.12.norm1.linear.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.12.norm1.linear.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.13.attn1.to_k.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.13.attn1.to_k.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.13.attn1.to_out.0.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.13.attn1.to_out.0.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.13.attn1.to_q.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.13.attn1.to_q.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.13.attn1.to_v.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.13.attn1.to_v.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.13.ff.net.0.proj.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.13.ff.net.0.proj.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.13.ff.net.2.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.13.ff.net.2.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.13.norm1.linear.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.13.norm1.linear.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.14.attn1.to_k.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.14.attn1.to_k.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.14.attn1.to_out.0.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.14.attn1.to_out.0.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.14.attn1.to_q.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.14.attn1.to_q.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.14.attn1.to_v.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.14.attn1.to_v.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.14.ff.net.0.proj.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.14.ff.net.0.proj.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.14.ff.net.2.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.14.ff.net.2.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.14.norm1.linear.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.14.norm1.linear.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.15.attn1.to_k.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.15.attn1.to_k.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.15.attn1.to_out.0.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.15.attn1.to_out.0.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.15.attn1.to_q.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.15.attn1.to_q.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.15.attn1.to_v.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.15.attn1.to_v.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.15.ff.net.0.proj.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.15.ff.net.0.proj.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.15.ff.net.2.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.15.ff.net.2.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.15.norm1.linear.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.15.norm1.linear.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.16.attn1.to_k.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.16.attn1.to_k.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.16.attn1.to_out.0.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.16.attn1.to_out.0.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.16.attn1.to_q.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.16.attn1.to_q.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.16.attn1.to_v.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.16.attn1.to_v.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.16.ff.net.0.proj.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.16.ff.net.0.proj.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.16.ff.net.2.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.16.ff.net.2.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.16.norm1.linear.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.16.norm1.linear.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.17.attn1.to_k.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.17.attn1.to_k.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.17.attn1.to_out.0.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.17.attn1.to_out.0.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.17.attn1.to_q.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.17.attn1.to_q.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.17.attn1.to_v.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.17.attn1.to_v.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.17.ff.net.0.proj.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.17.ff.net.0.proj.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.17.ff.net.2.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.17.ff.net.2.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.17.norm1.linear.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.17.norm1.linear.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.18.attn1.to_k.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.18.attn1.to_k.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.18.attn1.to_out.0.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.18.attn1.to_out.0.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.18.attn1.to_q.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.18.attn1.to_q.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.18.attn1.to_v.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.18.attn1.to_v.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.18.ff.net.0.proj.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.18.ff.net.0.proj.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.18.ff.net.2.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.18.ff.net.2.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.18.norm1.linear.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.18.norm1.linear.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.19.attn1.to_k.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.19.attn1.to_k.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.19.attn1.to_out.0.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.19.attn1.to_out.0.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.19.attn1.to_q.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.19.attn1.to_q.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.19.attn1.to_v.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.19.attn1.to_v.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.19.ff.net.0.proj.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.19.ff.net.0.proj.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.19.ff.net.2.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.19.ff.net.2.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.19.norm1.linear.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.19.norm1.linear.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.2.attn1.to_k.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.2.attn1.to_k.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.2.attn1.to_out.0.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.2.attn1.to_out.0.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.2.attn1.to_q.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.2.attn1.to_q.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.2.attn1.to_v.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.2.attn1.to_v.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.2.ff.net.0.proj.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.2.ff.net.0.proj.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.2.ff.net.2.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.2.ff.net.2.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.2.norm1.linear.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.2.norm1.linear.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.20.attn1.to_k.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.20.attn1.to_k.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.20.attn1.to_out.0.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.20.attn1.to_out.0.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.20.attn1.to_q.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.20.attn1.to_q.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.20.attn1.to_v.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.20.attn1.to_v.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.20.ff.net.0.proj.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.20.ff.net.0.proj.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.20.ff.net.2.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.20.ff.net.2.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.20.norm1.linear.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.20.norm1.linear.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.21.attn1.to_k.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.21.attn1.to_k.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.21.attn1.to_out.0.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.21.attn1.to_out.0.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.21.attn1.to_q.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.21.attn1.to_q.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.21.attn1.to_v.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.21.attn1.to_v.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.21.ff.net.0.proj.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.21.ff.net.0.proj.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.21.ff.net.2.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.21.ff.net.2.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.21.norm1.linear.bias": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.21.norm1.linear.weight": "diffusion_pytorch_model-00002-of-00003.safetensors",
+    "transformer_blocks.22.attn1.to_k.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.22.attn1.to_k.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.22.attn1.to_out.0.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.22.attn1.to_out.0.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.22.attn1.to_q.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.22.attn1.to_q.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.22.attn1.to_v.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.22.attn1.to_v.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.22.ff.net.0.proj.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.22.ff.net.0.proj.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.22.ff.net.2.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.22.ff.net.2.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.22.norm1.linear.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.22.norm1.linear.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.23.attn1.to_k.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.23.attn1.to_k.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.23.attn1.to_out.0.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.23.attn1.to_out.0.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.23.attn1.to_q.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.23.attn1.to_q.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.23.attn1.to_v.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.23.attn1.to_v.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.23.ff.net.0.proj.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.23.ff.net.0.proj.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.23.ff.net.2.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.23.ff.net.2.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.23.norm1.linear.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.23.norm1.linear.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.24.attn1.to_k.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.24.attn1.to_k.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.24.attn1.to_out.0.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.24.attn1.to_out.0.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.24.attn1.to_q.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.24.attn1.to_q.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.24.attn1.to_v.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.24.attn1.to_v.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.24.ff.net.0.proj.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.24.ff.net.0.proj.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.24.ff.net.2.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.24.ff.net.2.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.24.norm1.linear.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.24.norm1.linear.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.25.attn1.to_k.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.25.attn1.to_k.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.25.attn1.to_out.0.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.25.attn1.to_out.0.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.25.attn1.to_q.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.25.attn1.to_q.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.25.attn1.to_v.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.25.attn1.to_v.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.25.ff.net.0.proj.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.25.ff.net.0.proj.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.25.ff.net.2.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.25.ff.net.2.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.25.norm1.linear.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.25.norm1.linear.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.26.attn1.to_k.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.26.attn1.to_k.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.26.attn1.to_out.0.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.26.attn1.to_out.0.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.26.attn1.to_q.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.26.attn1.to_q.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.26.attn1.to_v.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.26.attn1.to_v.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.26.ff.net.0.proj.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.26.ff.net.0.proj.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.26.ff.net.2.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.26.ff.net.2.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.26.norm1.linear.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.26.norm1.linear.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.27.attn1.to_k.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.27.attn1.to_k.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.27.attn1.to_out.0.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.27.attn1.to_out.0.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.27.attn1.to_q.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.27.attn1.to_q.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.27.attn1.to_v.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.27.attn1.to_v.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.27.ff.net.0.proj.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.27.ff.net.0.proj.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.27.ff.net.2.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.27.ff.net.2.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.27.norm1.linear.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.27.norm1.linear.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.28.attn1.to_k.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.28.attn1.to_k.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.28.attn1.to_out.0.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.28.attn1.to_out.0.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.28.attn1.to_q.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.28.attn1.to_q.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.28.attn1.to_v.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.28.attn1.to_v.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.28.ff.net.0.proj.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.28.ff.net.0.proj.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.28.ff.net.2.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.28.ff.net.2.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.28.norm1.linear.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.28.norm1.linear.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.29.attn1.to_k.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.29.attn1.to_k.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.29.attn1.to_out.0.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.29.attn1.to_out.0.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.29.attn1.to_q.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.29.attn1.to_q.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.29.attn1.to_v.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.29.attn1.to_v.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.29.ff.net.0.proj.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.29.ff.net.0.proj.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.29.ff.net.2.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.29.ff.net.2.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.29.norm1.linear.bias": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.29.norm1.linear.weight": "diffusion_pytorch_model-00003-of-00003.safetensors",
+    "transformer_blocks.3.attn1.to_k.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.3.attn1.to_k.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.3.attn1.to_out.0.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.3.attn1.to_out.0.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.3.attn1.to_q.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.3.attn1.to_q.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.3.attn1.to_v.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.3.attn1.to_v.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.3.ff.net.0.proj.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.3.ff.net.0.proj.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.3.ff.net.2.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.3.ff.net.2.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.3.norm1.linear.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.3.norm1.linear.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.4.attn1.to_k.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.4.attn1.to_k.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.4.attn1.to_out.0.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.4.attn1.to_out.0.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.4.attn1.to_q.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.4.attn1.to_q.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.4.attn1.to_v.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.4.attn1.to_v.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.4.ff.net.0.proj.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.4.ff.net.0.proj.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.4.ff.net.2.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.4.ff.net.2.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.4.norm1.linear.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.4.norm1.linear.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.5.attn1.to_k.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.5.attn1.to_k.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.5.attn1.to_out.0.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.5.attn1.to_out.0.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.5.attn1.to_q.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.5.attn1.to_q.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.5.attn1.to_v.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.5.attn1.to_v.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.5.ff.net.0.proj.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.5.ff.net.0.proj.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.5.ff.net.2.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.5.ff.net.2.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.5.norm1.linear.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.5.norm1.linear.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.6.attn1.to_k.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.6.attn1.to_k.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.6.attn1.to_out.0.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.6.attn1.to_out.0.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.6.attn1.to_q.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.6.attn1.to_q.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.6.attn1.to_v.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.6.attn1.to_v.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.6.ff.net.0.proj.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.6.ff.net.0.proj.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.6.ff.net.2.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.6.ff.net.2.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.6.norm1.linear.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.6.norm1.linear.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.7.attn1.to_k.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.7.attn1.to_k.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.7.attn1.to_out.0.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.7.attn1.to_out.0.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.7.attn1.to_q.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.7.attn1.to_q.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.7.attn1.to_v.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.7.attn1.to_v.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.7.ff.net.0.proj.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.7.ff.net.0.proj.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.7.ff.net.2.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.7.ff.net.2.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.7.norm1.linear.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.7.norm1.linear.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.8.attn1.to_k.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.8.attn1.to_k.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.8.attn1.to_out.0.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.8.attn1.to_out.0.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.8.attn1.to_q.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.8.attn1.to_q.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.8.attn1.to_v.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.8.attn1.to_v.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.8.ff.net.0.proj.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.8.ff.net.0.proj.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.8.ff.net.2.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.8.ff.net.2.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.8.norm1.linear.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.8.norm1.linear.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.9.attn1.to_k.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.9.attn1.to_k.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.9.attn1.to_out.0.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.9.attn1.to_out.0.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.9.attn1.to_q.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.9.attn1.to_q.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.9.attn1.to_v.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.9.attn1.to_v.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.9.ff.net.0.proj.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.9.ff.net.0.proj.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.9.ff.net.2.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.9.ff.net.2.weight": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.9.norm1.linear.bias": "diffusion_pytorch_model-00001-of-00003.safetensors",
+    "transformer_blocks.9.norm1.linear.weight": "diffusion_pytorch_model-00001-of-00003.safetensors"
+  }
+}

vae/config.json ADDED Viewed

	@@ -0,0 +1,71 @@

+{
+  "_class_name": "AutoencoderKL",
+  "_diffusers_version": "0.37.0.dev0",
+  "act_fn": "silu",
+  "block_out_channels": [
+    128,
+    512,
+    1024,
+    1024
+  ],
+  "down_block_types": [
+    "DownEncoderBlock2D",
+    "DownEncoderBlock2D",
+    "DownEncoderBlock2D",
+    "DownEncoderBlock2D"
+  ],
+  "force_upcast": true,
+  "in_channels": 3,
+  "latent_channels": 16,
+  "latents_mean": [
+    -0.2080078125,
+    1.875,
+    -0.470703125,
+    -1.265625,
+    -1.421875,
+    0.77734375,
+    -0.3671875,
+    -0.9453125,
+    0.318359375,
+    0.7734375,
+    -0.1884765625,
+    -0.022216796875,
+    -0.220703125,
+    -1.59375,
+    -0.81640625,
+    -0.255859375
+  ],
+  "latents_std": [
+    3.0625,
+    2.203125,
+    2.265625,
+    4.84375,
+    2.5,
+    3.9375,
+    2.203125,
+    3.03125,
+    2.1875,
+    2.046875,
+    2.71875,
+    2.390625,
+    2.390625,
+    2.453125,
+    2.25,
+    2.15625
+  ],
+  "layers_per_block": 3,
+  "mid_block_add_attention": false,
+  "norm_num_groups": 32,
+  "out_channels": 3,
+  "sample_size": 1024,
+  "scaling_factor": 0.18215,
+  "shift_factor": null,
+  "up_block_types": [
+    "UpDecoderBlock2D",
+    "UpDecoderBlock2D",
+    "UpDecoderBlock2D",
+    "UpDecoderBlock2D"
+  ],
+  "use_post_quant_conv": false,
+  "use_quant_conv": false
+}

vae/diffusion_pytorch_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a80a129b649cdb6d74d9c2b5bb060f3b882b7826b63a732306a7d3393deedbc0
+size 812234342

vision_language_encoder/config.json ADDED Viewed

	@@ -0,0 +1,61 @@

+{
+  "architectures": [
+    "GlmImageForConditionalGeneration"
+  ],
+  "image_start_token_id": 16384,
+  "image_end_token_id": 16385,
+  "image_token_id": 167855,
+  "model_type": "glm_image",
+  "text_config": {
+    "attention_dropout": 0.0,
+    "eos_token_id": 16385,
+    "pad_token_id": 167841,
+    "hidden_act": "silu",
+    "hidden_size": 4096,
+    "initializer_range": 0.02,
+    "intermediate_size": 13696,
+    "max_position_embeddings": 131072,
+    "model_type": "glm_image_text",
+    "num_attention_heads": 32,
+    "num_hidden_layers": 40,
+    "num_key_value_heads": 2,
+    "rms_norm_eps": 1e-05,
+    "dtype": "bfloat16",
+    "rope_parameters": {
+      "rope_theta": 10000,
+      "rope_type": "default",
+      "mrope_section": [
+        8,
+        12,
+        12
+      ],
+      "partial_rotary_factor": 0.5
+    },
+    "use_cache": true,
+    "vision_vocab_size": 16512,
+    "vocab_size": 168064
+  },
+  "transformers_version": "5.0.0.dev0",
+  "vision_config": {
+    "attention_bias": true,
+    "attention_dropout": 0.0,
+    "depth": 40,
+    "hidden_act": "gelu",
+    "hidden_size": 1536,
+    "image_size": 2048,
+    "in_channels": 3,
+    "intermediate_size": 6144,
+    "layer_norm_eps": 1e-06,
+    "model_type": "glm_image_vision",
+    "num_heads": 16,
+    "patch_size": 16
+  },
+  "vq_config": {
+    "embed_dim": 2048,
+    "in_channels": 3,
+    "initializer_range": 0.02,
+    "latent_channels": 1536,
+    "model_type": "glm_image_vqmodel",
+    "num_embeddings": 16384
+  }
+}

vision_language_encoder/model-00001-of-00004.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8575ed7148893c4fb390ad84c51d9c3800b0f960af6f977c6f6fd6d1708c8c4d
+size 5295710600

vision_language_encoder/model-00002-of-00004.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d074e03e7bf01b4a3150adec5afb968303a0310ce701c3eae47f3e78e58b0fc5
+size 5303216664

vision_language_encoder/model-00003-of-00004.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c0b8360e705e473233b2f176bfee7ced2f1654e38d24215ae8f5515891312300
+size 5303216648

vision_language_encoder/model-00004-of-00004.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:24ba0474ffbb11163465a2961c45f2a12d88e91840214f93f355851d7d303d0a
+size 4326469720

vision_language_encoder/model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,1018 @@

+{
+  "metadata": {
+    "total_size": 20228491264
+  },
+  "weight_map": {
+    "lm_head.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.embed_tokens.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.0.input_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.0.mlp.down_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.0.mlp.gate_up_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.0.post_attention_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.0.post_mlp_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.0.post_self_attn_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.0.self_attn.k_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.0.self_attn.k_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.0.self_attn.o_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.0.self_attn.q_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.0.self_attn.q_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.0.self_attn.v_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.0.self_attn.v_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.1.input_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.1.mlp.down_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.1.mlp.gate_up_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.1.post_attention_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.1.post_mlp_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.1.post_self_attn_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.1.self_attn.k_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.1.self_attn.k_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.1.self_attn.o_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.1.self_attn.q_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.1.self_attn.q_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.1.self_attn.v_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.1.self_attn.v_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.10.input_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.10.mlp.down_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.10.mlp.gate_up_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.10.post_attention_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.10.post_mlp_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.10.post_self_attn_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.10.self_attn.k_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.10.self_attn.k_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.10.self_attn.o_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.10.self_attn.q_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.10.self_attn.q_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.10.self_attn.v_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.10.self_attn.v_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.11.input_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.11.mlp.down_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.11.mlp.gate_up_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.11.post_attention_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.11.post_mlp_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.11.post_self_attn_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.11.self_attn.k_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.11.self_attn.k_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.11.self_attn.o_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.11.self_attn.q_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.11.self_attn.q_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.11.self_attn.v_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.11.self_attn.v_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.12.input_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.12.mlp.down_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.12.mlp.gate_up_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.12.post_attention_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.12.post_mlp_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.12.post_self_attn_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.12.self_attn.k_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.12.self_attn.k_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.12.self_attn.o_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.12.self_attn.q_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.12.self_attn.q_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.12.self_attn.v_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.12.self_attn.v_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.13.input_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.13.mlp.down_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.13.mlp.gate_up_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.13.post_attention_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.13.post_mlp_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.13.post_self_attn_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.13.self_attn.k_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.13.self_attn.k_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.13.self_attn.o_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.13.self_attn.q_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.13.self_attn.q_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.13.self_attn.v_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.13.self_attn.v_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.14.input_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.14.mlp.down_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.14.mlp.gate_up_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.14.post_attention_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.14.post_mlp_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.14.post_self_attn_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.14.self_attn.k_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.14.self_attn.k_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.14.self_attn.o_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.14.self_attn.q_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.14.self_attn.q_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.14.self_attn.v_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.14.self_attn.v_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.15.input_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.15.mlp.down_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.15.mlp.gate_up_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.15.post_attention_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.15.post_mlp_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.15.post_self_attn_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.15.self_attn.k_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.15.self_attn.k_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.15.self_attn.o_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.15.self_attn.q_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.15.self_attn.q_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.15.self_attn.v_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.15.self_attn.v_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.16.input_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.16.mlp.down_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.16.mlp.gate_up_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.16.post_attention_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.16.post_mlp_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.16.post_self_attn_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.16.self_attn.k_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.16.self_attn.k_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.16.self_attn.o_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.16.self_attn.q_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.16.self_attn.q_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.16.self_attn.v_proj.bias": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.16.self_attn.v_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.17.input_layernorm.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.17.mlp.down_proj.weight": "model-00001-of-00004.safetensors",
+    "model.language_model.layers.17.mlp.gate_up_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.17.post_attention_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.17.post_mlp_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.17.post_self_attn_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.17.self_attn.k_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.17.self_attn.k_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.17.self_attn.o_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.17.self_attn.q_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.17.self_attn.q_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.17.self_attn.v_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.17.self_attn.v_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.18.input_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.18.mlp.down_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.18.mlp.gate_up_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.18.post_attention_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.18.post_mlp_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.18.post_self_attn_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.18.self_attn.k_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.18.self_attn.k_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.18.self_attn.o_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.18.self_attn.q_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.18.self_attn.q_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.18.self_attn.v_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.18.self_attn.v_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.19.input_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.19.mlp.down_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.19.mlp.gate_up_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.19.post_attention_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.19.post_mlp_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.19.post_self_attn_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.19.self_attn.k_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.19.self_attn.k_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.19.self_attn.o_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.19.self_attn.q_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.19.self_attn.q_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.19.self_attn.v_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.19.self_attn.v_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.2.input_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.2.mlp.down_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.2.mlp.gate_up_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.2.post_attention_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.2.post_mlp_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.2.post_self_attn_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.2.self_attn.k_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.2.self_attn.k_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.2.self_attn.o_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.2.self_attn.q_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.2.self_attn.q_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.2.self_attn.v_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.2.self_attn.v_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.20.input_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.20.mlp.down_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.20.mlp.gate_up_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.20.post_attention_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.20.post_mlp_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.20.post_self_attn_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.20.self_attn.k_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.20.self_attn.k_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.20.self_attn.o_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.20.self_attn.q_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.20.self_attn.q_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.20.self_attn.v_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.20.self_attn.v_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.21.input_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.21.mlp.down_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.21.mlp.gate_up_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.21.post_attention_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.21.post_mlp_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.21.post_self_attn_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.21.self_attn.k_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.21.self_attn.k_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.21.self_attn.o_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.21.self_attn.q_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.21.self_attn.q_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.21.self_attn.v_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.21.self_attn.v_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.22.input_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.22.mlp.down_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.22.mlp.gate_up_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.22.post_attention_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.22.post_mlp_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.22.post_self_attn_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.22.self_attn.k_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.22.self_attn.k_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.22.self_attn.o_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.22.self_attn.q_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.22.self_attn.q_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.22.self_attn.v_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.22.self_attn.v_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.23.input_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.23.mlp.down_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.23.mlp.gate_up_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.23.post_attention_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.23.post_mlp_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.23.post_self_attn_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.23.self_attn.k_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.23.self_attn.k_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.23.self_attn.o_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.23.self_attn.q_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.23.self_attn.q_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.23.self_attn.v_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.23.self_attn.v_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.24.input_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.24.mlp.down_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.24.mlp.gate_up_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.24.post_attention_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.24.post_mlp_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.24.post_self_attn_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.24.self_attn.k_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.24.self_attn.k_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.24.self_attn.o_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.24.self_attn.q_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.24.self_attn.q_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.24.self_attn.v_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.24.self_attn.v_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.25.input_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.25.mlp.down_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.25.mlp.gate_up_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.25.post_attention_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.25.post_mlp_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.25.post_self_attn_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.25.self_attn.k_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.25.self_attn.k_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.25.self_attn.o_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.25.self_attn.q_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.25.self_attn.q_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.25.self_attn.v_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.25.self_attn.v_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.26.input_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.26.mlp.down_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.26.mlp.gate_up_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.26.post_attention_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.26.post_mlp_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.26.post_self_attn_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.26.self_attn.k_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.26.self_attn.k_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.26.self_attn.o_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.26.self_attn.q_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.26.self_attn.q_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.26.self_attn.v_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.26.self_attn.v_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.27.input_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.27.mlp.down_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.27.mlp.gate_up_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.27.post_attention_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.27.post_mlp_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.27.post_self_attn_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.27.self_attn.k_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.27.self_attn.k_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.27.self_attn.o_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.27.self_attn.q_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.27.self_attn.q_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.27.self_attn.v_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.27.self_attn.v_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.28.input_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.28.mlp.down_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.28.mlp.gate_up_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.28.post_attention_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.28.post_mlp_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.28.post_self_attn_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.28.self_attn.k_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.28.self_attn.k_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.28.self_attn.o_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.28.self_attn.q_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.28.self_attn.q_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.28.self_attn.v_proj.bias": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.28.self_attn.v_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.29.input_layernorm.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.29.mlp.down_proj.weight": "model-00002-of-00004.safetensors",
+    "model.language_model.layers.29.mlp.gate_up_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.29.post_attention_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.29.post_mlp_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.29.post_self_attn_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.29.self_attn.k_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.29.self_attn.k_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.29.self_attn.o_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.29.self_attn.q_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.29.self_attn.q_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.29.self_attn.v_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.29.self_attn.v_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.3.input_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.3.mlp.down_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.3.mlp.gate_up_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.3.post_attention_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.3.post_mlp_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.3.post_self_attn_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.3.self_attn.k_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.3.self_attn.k_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.3.self_attn.o_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.3.self_attn.q_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.3.self_attn.q_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.3.self_attn.v_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.3.self_attn.v_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.30.input_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.30.mlp.down_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.30.mlp.gate_up_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.30.post_attention_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.30.post_mlp_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.30.post_self_attn_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.30.self_attn.k_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.30.self_attn.k_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.30.self_attn.o_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.30.self_attn.q_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.30.self_attn.q_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.30.self_attn.v_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.30.self_attn.v_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.31.input_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.31.mlp.down_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.31.mlp.gate_up_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.31.post_attention_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.31.post_mlp_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.31.post_self_attn_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.31.self_attn.k_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.31.self_attn.k_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.31.self_attn.o_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.31.self_attn.q_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.31.self_attn.q_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.31.self_attn.v_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.31.self_attn.v_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.32.input_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.32.mlp.down_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.32.mlp.gate_up_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.32.post_attention_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.32.post_mlp_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.32.post_self_attn_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.32.self_attn.k_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.32.self_attn.k_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.32.self_attn.o_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.32.self_attn.q_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.32.self_attn.q_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.32.self_attn.v_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.32.self_attn.v_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.33.input_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.33.mlp.down_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.33.mlp.gate_up_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.33.post_attention_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.33.post_mlp_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.33.post_self_attn_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.33.self_attn.k_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.33.self_attn.k_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.33.self_attn.o_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.33.self_attn.q_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.33.self_attn.q_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.33.self_attn.v_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.33.self_attn.v_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.34.input_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.34.mlp.down_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.34.mlp.gate_up_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.34.post_attention_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.34.post_mlp_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.34.post_self_attn_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.34.self_attn.k_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.34.self_attn.k_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.34.self_attn.o_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.34.self_attn.q_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.34.self_attn.q_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.34.self_attn.v_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.34.self_attn.v_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.35.input_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.35.mlp.down_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.35.mlp.gate_up_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.35.post_attention_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.35.post_mlp_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.35.post_self_attn_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.35.self_attn.k_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.35.self_attn.k_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.35.self_attn.o_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.35.self_attn.q_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.35.self_attn.q_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.35.self_attn.v_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.35.self_attn.v_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.36.input_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.36.mlp.down_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.36.mlp.gate_up_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.36.post_attention_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.36.post_mlp_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.36.post_self_attn_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.36.self_attn.k_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.36.self_attn.k_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.36.self_attn.o_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.36.self_attn.q_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.36.self_attn.q_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.36.self_attn.v_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.36.self_attn.v_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.37.input_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.37.mlp.down_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.37.mlp.gate_up_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.37.post_attention_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.37.post_mlp_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.37.post_self_attn_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.37.self_attn.k_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.37.self_attn.k_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.37.self_attn.o_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.37.self_attn.q_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.37.self_attn.q_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.37.self_attn.v_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.37.self_attn.v_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.38.input_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.38.mlp.down_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.38.mlp.gate_up_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.38.post_attention_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.38.post_mlp_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.38.post_self_attn_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.38.self_attn.k_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.38.self_attn.k_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.38.self_attn.o_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.38.self_attn.q_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.38.self_attn.q_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.38.self_attn.v_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.38.self_attn.v_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.39.input_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.39.mlp.down_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.39.mlp.gate_up_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.39.post_attention_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.39.post_mlp_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.39.post_self_attn_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.39.self_attn.k_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.39.self_attn.k_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.39.self_attn.o_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.39.self_attn.q_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.39.self_attn.q_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.39.self_attn.v_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.39.self_attn.v_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.4.input_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.4.mlp.down_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.4.mlp.gate_up_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.4.post_attention_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.4.post_mlp_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.4.post_self_attn_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.4.self_attn.k_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.4.self_attn.k_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.4.self_attn.o_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.4.self_attn.q_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.4.self_attn.q_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.4.self_attn.v_proj.bias": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.4.self_attn.v_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.5.input_layernorm.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.5.mlp.down_proj.weight": "model-00003-of-00004.safetensors",
+    "model.language_model.layers.5.mlp.gate_up_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.5.post_attention_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.5.post_mlp_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.5.post_self_attn_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.5.self_attn.k_proj.bias": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.5.self_attn.k_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.5.self_attn.o_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.5.self_attn.q_proj.bias": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.5.self_attn.q_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.5.self_attn.v_proj.bias": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.5.self_attn.v_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.6.input_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.6.mlp.down_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.6.mlp.gate_up_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.6.post_attention_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.6.post_mlp_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.6.post_self_attn_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.6.self_attn.k_proj.bias": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.6.self_attn.k_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.6.self_attn.o_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.6.self_attn.q_proj.bias": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.6.self_attn.q_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.6.self_attn.v_proj.bias": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.6.self_attn.v_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.7.input_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.7.mlp.down_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.7.mlp.gate_up_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.7.post_attention_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.7.post_mlp_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.7.post_self_attn_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.7.self_attn.k_proj.bias": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.7.self_attn.k_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.7.self_attn.o_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.7.self_attn.q_proj.bias": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.7.self_attn.q_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.7.self_attn.v_proj.bias": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.7.self_attn.v_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.8.input_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.8.mlp.down_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.8.mlp.gate_up_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.8.post_attention_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.8.post_mlp_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.8.post_self_attn_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.8.self_attn.k_proj.bias": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.8.self_attn.k_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.8.self_attn.o_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.8.self_attn.q_proj.bias": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.8.self_attn.q_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.8.self_attn.v_proj.bias": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.8.self_attn.v_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.9.input_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.9.mlp.down_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.9.mlp.gate_up_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.9.post_attention_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.9.post_mlp_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.9.post_self_attn_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.9.self_attn.k_proj.bias": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.9.self_attn.k_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.9.self_attn.o_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.9.self_attn.q_proj.bias": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.9.self_attn.q_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.9.self_attn.v_proj.bias": "model-00004-of-00004.safetensors",
+    "model.language_model.layers.9.self_attn.v_proj.weight": "model-00004-of-00004.safetensors",
+    "model.language_model.norm.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.0.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.0.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.0.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.0.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.0.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.0.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.0.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.0.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.0.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.0.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.0.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.0.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.1.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.1.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.1.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.1.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.1.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.1.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.1.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.1.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.1.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.1.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.1.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.1.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.10.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.10.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.10.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.10.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.10.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.10.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.10.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.10.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.10.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.10.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.10.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.10.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.11.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.11.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.11.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.11.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.11.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.11.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.11.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.11.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.11.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.11.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.11.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.11.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.12.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.12.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.12.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.12.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.12.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.12.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.12.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.12.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.12.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.12.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.12.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.12.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.13.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.13.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.13.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.13.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.13.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.13.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.13.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.13.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.13.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.13.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.13.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.13.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.14.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.14.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.14.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.14.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.14.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.14.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.14.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.14.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.14.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.14.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.14.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.14.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.15.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.15.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.15.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.15.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.15.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.15.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.15.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.15.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.15.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.15.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.15.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.15.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.16.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.16.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.16.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.16.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.16.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.16.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.16.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.16.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.16.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.16.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.16.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.16.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.17.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.17.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.17.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.17.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.17.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.17.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.17.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.17.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.17.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.17.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.17.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.17.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.18.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.18.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.18.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.18.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.18.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.18.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.18.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.18.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.18.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.18.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.18.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.18.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.19.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.19.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.19.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.19.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.19.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.19.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.19.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.19.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.19.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.19.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.19.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.19.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.2.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.2.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.2.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.2.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.2.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.2.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.2.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.2.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.2.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.2.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.2.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.2.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.20.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.20.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.20.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.20.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.20.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.20.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.20.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.20.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.20.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.20.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.20.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.20.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.21.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.21.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.21.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.21.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.21.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.21.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.21.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.21.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.21.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.21.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.21.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.21.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.22.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.22.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.22.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.22.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.22.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.22.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.22.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.22.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.22.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.22.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.22.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.22.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.23.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.23.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.23.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.23.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.23.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.23.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.23.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.23.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.23.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.23.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.23.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.23.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.24.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.24.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.24.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.24.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.24.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.24.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.24.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.24.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.24.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.24.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.24.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.24.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.25.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.25.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.25.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.25.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.25.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.25.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.25.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.25.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.25.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.25.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.25.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.25.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.26.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.26.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.26.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.26.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.26.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.26.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.26.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.26.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.26.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.26.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.26.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.26.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.27.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.27.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.27.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.27.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.27.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.27.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.27.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.27.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.27.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.27.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.27.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.27.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.28.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.28.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.28.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.28.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.28.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.28.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.28.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.28.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.28.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.28.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.28.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.28.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.29.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.29.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.29.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.29.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.29.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.29.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.29.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.29.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.29.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.29.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.29.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.29.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.3.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.3.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.3.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.3.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.3.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.3.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.3.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.3.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.3.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.3.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.3.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.3.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.30.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.30.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.30.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.30.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.30.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.30.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.30.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.30.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.30.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.30.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.30.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.30.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.31.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.31.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.31.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.31.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.31.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.31.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.31.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.31.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.31.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.31.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.31.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.31.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.32.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.32.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.32.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.32.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.32.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.32.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.32.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.32.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.32.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.32.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.32.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.32.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.33.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.33.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.33.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.33.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.33.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.33.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.33.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.33.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.33.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.33.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.33.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.33.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.34.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.34.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.34.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.34.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.34.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.34.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.34.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.34.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.34.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.34.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.34.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.34.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.35.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.35.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.35.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.35.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.35.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.35.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.35.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.35.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.35.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.35.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.35.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.35.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.36.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.36.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.36.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.36.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.36.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.36.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.36.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.36.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.36.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.36.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.36.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.36.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.37.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.37.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.37.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.37.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.37.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.37.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.37.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.37.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.37.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.37.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.37.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.37.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.38.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.38.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.38.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.38.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.38.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.38.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.38.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.38.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.38.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.38.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.38.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.38.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.39.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.39.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.39.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.39.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.39.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.39.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.39.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.39.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.39.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.39.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.39.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.39.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.4.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.4.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.4.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.4.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.4.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.4.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.4.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.4.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.4.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.4.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.4.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.4.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.5.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.5.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.5.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.5.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.5.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.5.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.5.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.5.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.5.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.5.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.5.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.5.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.6.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.6.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.6.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.6.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.6.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.6.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.6.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.6.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.6.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.6.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.6.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.6.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.7.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.7.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.7.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.7.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.7.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.7.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.7.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.7.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.7.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.7.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.7.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.7.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.8.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.8.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.8.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.8.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.8.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.8.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.8.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.8.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.8.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.8.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.8.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.8.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.9.attn.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.9.attn.proj.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.9.attn.qkv.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.9.attn.qkv.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.9.mlp.fc1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.9.mlp.fc1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.9.mlp.fc2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.9.mlp.fc2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.9.norm1.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.9.norm1.weight": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.9.norm2.bias": "model-00004-of-00004.safetensors",
+    "model.visual.blocks.9.norm2.weight": "model-00004-of-00004.safetensors",
+    "model.visual.embeddings.position_embedding.weight": "model-00004-of-00004.safetensors",
+    "model.visual.patch_embed.proj.bias": "model-00004-of-00004.safetensors",
+    "model.visual.patch_embed.proj.weight": "model-00004-of-00004.safetensors",
+    "model.vqmodel.post_quant_conv.bias": "model-00004-of-00004.safetensors",
+    "model.vqmodel.post_quant_conv.weight": "model-00004-of-00004.safetensors",
+    "model.vqmodel.quant_conv.bias": "model-00004-of-00004.safetensors",
+    "model.vqmodel.quant_conv.weight": "model-00004-of-00004.safetensors",
+    "model.vqmodel.quantize.embedding.weight": "model-00004-of-00004.safetensors"
+  }
+}