lpalbou commited on May 27

Commit

0627bf7

verified ·

1 Parent(s): 7f2035a

Upload folder using huggingface_hub

Browse files

Files changed (17) hide show

.gitattributes +1 -0
README.md +77 -0
model_index.json +30 -0
scheduler/scheduler_config.json +30 -0
text_encoder/config.json +34 -0
text_encoder/model-00001-of-00003.safetensors +3 -0
text_encoder/model-00002-of-00003.safetensors +3 -0
text_encoder/model-00003-of-00003.safetensors +3 -0
text_encoder/model.safetensors.index.json +249 -0
tokenizer/tokenizer.json +3 -0
tokenizer/tokenizer_config.json +317 -0
transformer/0.safetensors +3 -0
transformer/1.safetensors +3 -0
transformer/2.safetensors +3 -0
transformer/model.safetensors.index.json +1447 -0
vae/0.safetensors +3 -0
vae/model.safetensors.index.json +204 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+tokenizer/tokenizer.json filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,77 @@

+---
+license: apache-2.0
+base_model: Wan-AI/Wan2.2-TI2V-5B-Diffusers
+pipeline_tag: text-to-video
+library_name: mlx-gen
+tags:
+- mlx
+- mlx-gen
+- mflux
+- apple-silicon
+- 8-bit
+- wan
+- wan2.2
+- video-generation
+- text-to-video
+- image-to-video
+---
+# wan2.2-ti2v-5b-diffusers-8bit
+This repository contains MLX-Gen saved weights for `Wan-AI/Wan2.2-TI2V-5B-Diffusers`. The checkpoint is designed for local Apple Silicon inference with [`mlx-gen`](https://github.com/lpalbou/mlx-gen).
+It uses the mflux/MLX saved-weight layout and MLX quantization tensors. It is not a Diffusers or Transformers `from_pretrained()` checkpoint.
+## Source Model
+Original model: [`Wan-AI/Wan2.2-TI2V-5B-Diffusers`](https://huggingface.co/Wan-AI/Wan2.2-TI2V-5B-Diffusers).
+## License and Access
+This quantized derivative follows the Apache 2.0 license of the source model.
+## Quantization
+This is an MLX q8 checkpoint for Wan2.2 TI2V. MLX-Gen uses 8-bit quantization for Wan modules where MLX supports quantization:
+- q8 for quantizable Wan transformer modules.
+- q8 for quantizable Wan VAE modules.
+- BF16 for the UMT5 text encoder, scheduler metadata, tokenizer files, norms, and other non-quantizable parameters.
+Wan q4 quality and any possible mixed q4/q8 policy are still under validation. Prefer q8 for publishable Wan checkpoints until the q4 policy is documented.
+See the [MLX-Gen quantization docs](https://github.com/lpalbou/mlx-gen/blob/main/docs/quantization.md) for compatibility notes.
+## Compatibility
+Requires `mlx-gen >= 0.18.6`.
+Generated with `mlx-gen 0.18.6`.
+Use the `mlxgen` command and Python import path for new MLX-Gen projects.
+## Usage
+```bash
+python -m pip install -U mlx-gen
+mlxgen download --model AbstractFramework/wan2.2-ti2v-5b-diffusers-8bit
+mlxgen generate \
+  --model AbstractFramework/wan2.2-ti2v-5b-diffusers-8bit \
+  --task text-to-video \
+  --prompt "Your video prompt here" \
+  --width 1280 \
+  --height 704 \
+  --frames 121 \
+  --steps 50 \
+  --guidance 5 \
+  --fps 24 \
+  --seed 42 \
+  --output video.mp4
+```
+## Attribution
+MLX-Gen is based on [mflux](https://github.com/filipstrand/mflux) by Filip Strand and the original mflux contributors. This model card is generated by MLX-Gen so derived checkpoints keep that attribution visible.
+Quantized and contributed by [@lpalbou](https://huggingface.co/lpalbou).

model_index.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "_class_name": "WanPipeline",
+  "_diffusers_version": "0.35.0.dev0",
+  "boundary_ratio": null,
+  "expand_timesteps": true,
+  "scheduler": [
+    "diffusers",
+    "UniPCMultistepScheduler"
+  ],
+  "text_encoder": [
+    "transformers",
+    "UMT5EncoderModel"
+  ],
+  "tokenizer": [
+    "transformers",
+    "T5TokenizerFast"
+  ],
+  "transformer": [
+    "diffusers",
+    "WanTransformer3DModel"
+  ],
+  "transformer_2": [
+    null,
+    null
+  ],
+  "vae": [
+    "diffusers",
+    "AutoencoderKLWan"
+  ]
+}

scheduler/scheduler_config.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "_class_name": "UniPCMultistepScheduler",
+  "_diffusers_version": "0.35.0.dev0",
+  "beta_end": 0.02,
+  "beta_schedule": "linear",
+  "beta_start": 0.0001,
+  "disable_corrector": [],
+  "dynamic_thresholding_ratio": 0.995,
+  "final_sigmas_type": "zero",
+  "flow_shift": 5.0,
+  "lower_order_final": true,
+  "num_train_timesteps": 1000,
+  "predict_x0": true,
+  "prediction_type": "flow_prediction",
+  "rescale_betas_zero_snr": false,
+  "sample_max_value": 1.0,
+  "solver_order": 2,
+  "solver_p": null,
+  "solver_type": "bh2",
+  "steps_offset": 0,
+  "thresholding": false,
+  "time_shift_type": "exponential",
+  "timestep_spacing": "linspace",
+  "trained_betas": null,
+  "use_beta_sigmas": false,
+  "use_dynamic_shifting": false,
+  "use_exponential_sigmas": false,
+  "use_flow_sigmas": true,
+  "use_karras_sigmas": false
+}

text_encoder/config.json ADDED Viewed

	@@ -0,0 +1,34 @@

+{
+  "_name_or_path": "google/umt5-xxl",
+  "architectures": [
+    "UMT5EncoderModel"
+  ],
+  "classifier_dropout": 0.0,
+  "d_ff": 10240,
+  "d_kv": 64,
+  "d_model": 4096,
+  "decoder_start_token_id": 0,
+  "dense_act_fn": "gelu_new",
+  "dropout_rate": 0.1,
+  "eos_token_id": 1,
+  "feed_forward_proj": "gated-gelu",
+  "initializer_factor": 1.0,
+  "is_encoder_decoder": true,
+  "is_gated_act": true,
+  "layer_norm_epsilon": 1e-06,
+  "model_type": "umt5",
+  "num_decoder_layers": 24,
+  "num_heads": 64,
+  "num_layers": 24,
+  "output_past": true,
+  "pad_token_id": 0,
+  "relative_attention_max_distance": 128,
+  "relative_attention_num_buckets": 32,
+  "scalable_attention": true,
+  "tie_word_embeddings": false,
+  "tokenizer_class": "T5Tokenizer",
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.48.0.dev0",
+  "use_cache": true,
+  "vocab_size": 256384
+}

text_encoder/model-00001-of-00003.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a8e861969c7433e707cc5a74065d795d36cca07ec96eb6763eb4083df7248f58
+size 4935812536

text_encoder/model-00002-of-00003.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d57d948ece4837d850b7a859a4415121d57cacf8b9ee1d4db200c67f592902d7
+size 4983103192

text_encoder/model-00003-of-00003.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0da9ee284e21d1406df708788db1d502d95d75f69faa25cd26151bf8829b7c5f
+size 1442935480

text_encoder/model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,249 @@

+{
+  "metadata": {
+    "total_size": 11361820672
+  },
+  "weight_map": {
+    "encoder.block.0.layer.0.SelfAttention.k.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.0.layer.0.SelfAttention.o.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.0.layer.0.SelfAttention.q.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.0.layer.0.SelfAttention.relative_attention_bias.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.0.layer.0.SelfAttention.v.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.0.layer.0.layer_norm.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.0.layer.1.DenseReluDense.wi_0.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.0.layer.1.DenseReluDense.wi_1.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.0.layer.1.DenseReluDense.wo.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.0.layer.1.layer_norm.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.1.layer.0.SelfAttention.k.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.1.layer.0.SelfAttention.o.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.1.layer.0.SelfAttention.q.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.1.layer.0.SelfAttention.relative_attention_bias.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.1.layer.0.SelfAttention.v.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.1.layer.0.layer_norm.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.1.layer.1.DenseReluDense.wi_0.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.1.layer.1.DenseReluDense.wi_1.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.1.layer.1.DenseReluDense.wo.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.1.layer.1.layer_norm.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.10.layer.0.SelfAttention.k.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.10.layer.0.SelfAttention.o.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.10.layer.0.SelfAttention.q.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.10.layer.0.SelfAttention.relative_attention_bias.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.10.layer.0.SelfAttention.v.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.10.layer.0.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.10.layer.1.DenseReluDense.wi_0.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.10.layer.1.DenseReluDense.wi_1.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.10.layer.1.DenseReluDense.wo.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.10.layer.1.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.11.layer.0.SelfAttention.k.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.11.layer.0.SelfAttention.o.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.11.layer.0.SelfAttention.q.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.11.layer.0.SelfAttention.relative_attention_bias.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.11.layer.0.SelfAttention.v.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.11.layer.0.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.11.layer.1.DenseReluDense.wi_0.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.11.layer.1.DenseReluDense.wi_1.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.11.layer.1.DenseReluDense.wo.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.11.layer.1.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.12.layer.0.SelfAttention.k.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.12.layer.0.SelfAttention.o.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.12.layer.0.SelfAttention.q.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.12.layer.0.SelfAttention.relative_attention_bias.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.12.layer.0.SelfAttention.v.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.12.layer.0.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.12.layer.1.DenseReluDense.wi_0.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.12.layer.1.DenseReluDense.wi_1.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.12.layer.1.DenseReluDense.wo.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.12.layer.1.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.13.layer.0.SelfAttention.k.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.13.layer.0.SelfAttention.o.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.13.layer.0.SelfAttention.q.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.13.layer.0.SelfAttention.relative_attention_bias.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.13.layer.0.SelfAttention.v.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.13.layer.0.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.13.layer.1.DenseReluDense.wi_0.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.13.layer.1.DenseReluDense.wi_1.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.13.layer.1.DenseReluDense.wo.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.13.layer.1.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.14.layer.0.SelfAttention.k.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.14.layer.0.SelfAttention.o.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.14.layer.0.SelfAttention.q.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.14.layer.0.SelfAttention.relative_attention_bias.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.14.layer.0.SelfAttention.v.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.14.layer.0.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.14.layer.1.DenseReluDense.wi_0.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.14.layer.1.DenseReluDense.wi_1.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.14.layer.1.DenseReluDense.wo.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.14.layer.1.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.15.layer.0.SelfAttention.k.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.15.layer.0.SelfAttention.o.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.15.layer.0.SelfAttention.q.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.15.layer.0.SelfAttention.relative_attention_bias.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.15.layer.0.SelfAttention.v.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.15.layer.0.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.15.layer.1.DenseReluDense.wi_0.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.15.layer.1.DenseReluDense.wi_1.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.15.layer.1.DenseReluDense.wo.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.15.layer.1.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.16.layer.0.SelfAttention.k.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.16.layer.0.SelfAttention.o.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.16.layer.0.SelfAttention.q.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.16.layer.0.SelfAttention.relative_attention_bias.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.16.layer.0.SelfAttention.v.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.16.layer.0.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.16.layer.1.DenseReluDense.wi_0.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.16.layer.1.DenseReluDense.wi_1.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.16.layer.1.DenseReluDense.wo.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.16.layer.1.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.17.layer.0.SelfAttention.k.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.17.layer.0.SelfAttention.o.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.17.layer.0.SelfAttention.q.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.17.layer.0.SelfAttention.relative_attention_bias.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.17.layer.0.SelfAttention.v.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.17.layer.0.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.17.layer.1.DenseReluDense.wi_0.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.17.layer.1.DenseReluDense.wi_1.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.17.layer.1.DenseReluDense.wo.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.17.layer.1.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.18.layer.0.SelfAttention.k.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.18.layer.0.SelfAttention.o.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.18.layer.0.SelfAttention.q.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.18.layer.0.SelfAttention.relative_attention_bias.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.18.layer.0.SelfAttention.v.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.18.layer.0.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.18.layer.1.DenseReluDense.wi_0.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.18.layer.1.DenseReluDense.wi_1.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.18.layer.1.DenseReluDense.wo.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.18.layer.1.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.19.layer.0.SelfAttention.k.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.19.layer.0.SelfAttention.o.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.19.layer.0.SelfAttention.q.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.19.layer.0.SelfAttention.relative_attention_bias.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.19.layer.0.SelfAttention.v.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.19.layer.0.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.19.layer.1.DenseReluDense.wi_0.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.19.layer.1.DenseReluDense.wi_1.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.19.layer.1.DenseReluDense.wo.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.19.layer.1.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.2.layer.0.SelfAttention.k.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.2.layer.0.SelfAttention.o.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.2.layer.0.SelfAttention.q.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.2.layer.0.SelfAttention.relative_attention_bias.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.2.layer.0.SelfAttention.v.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.2.layer.0.layer_norm.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.2.layer.1.DenseReluDense.wi_0.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.2.layer.1.DenseReluDense.wi_1.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.2.layer.1.DenseReluDense.wo.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.2.layer.1.layer_norm.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.20.layer.0.SelfAttention.k.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.20.layer.0.SelfAttention.o.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.20.layer.0.SelfAttention.q.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.20.layer.0.SelfAttention.relative_attention_bias.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.20.layer.0.SelfAttention.v.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.20.layer.0.layer_norm.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.20.layer.1.DenseReluDense.wi_0.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.20.layer.1.DenseReluDense.wi_1.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.20.layer.1.DenseReluDense.wo.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.20.layer.1.layer_norm.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.21.layer.0.SelfAttention.k.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.21.layer.0.SelfAttention.o.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.21.layer.0.SelfAttention.q.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.21.layer.0.SelfAttention.relative_attention_bias.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.21.layer.0.SelfAttention.v.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.21.layer.0.layer_norm.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.21.layer.1.DenseReluDense.wi_0.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.21.layer.1.DenseReluDense.wi_1.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.21.layer.1.DenseReluDense.wo.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.21.layer.1.layer_norm.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.22.layer.0.SelfAttention.k.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.22.layer.0.SelfAttention.o.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.22.layer.0.SelfAttention.q.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.22.layer.0.SelfAttention.relative_attention_bias.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.22.layer.0.SelfAttention.v.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.22.layer.0.layer_norm.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.22.layer.1.DenseReluDense.wi_0.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.22.layer.1.DenseReluDense.wi_1.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.22.layer.1.DenseReluDense.wo.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.22.layer.1.layer_norm.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.23.layer.0.SelfAttention.k.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.23.layer.0.SelfAttention.o.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.23.layer.0.SelfAttention.q.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.23.layer.0.SelfAttention.relative_attention_bias.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.23.layer.0.SelfAttention.v.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.23.layer.0.layer_norm.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.23.layer.1.DenseReluDense.wi_0.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.23.layer.1.DenseReluDense.wi_1.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.23.layer.1.DenseReluDense.wo.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.23.layer.1.layer_norm.weight": "model-00003-of-00003.safetensors",
+    "encoder.block.3.layer.0.SelfAttention.k.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.3.layer.0.SelfAttention.o.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.3.layer.0.SelfAttention.q.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.3.layer.0.SelfAttention.relative_attention_bias.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.3.layer.0.SelfAttention.v.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.3.layer.0.layer_norm.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.3.layer.1.DenseReluDense.wi_0.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.3.layer.1.DenseReluDense.wi_1.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.3.layer.1.DenseReluDense.wo.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.3.layer.1.layer_norm.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.4.layer.0.SelfAttention.k.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.4.layer.0.SelfAttention.o.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.4.layer.0.SelfAttention.q.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.4.layer.0.SelfAttention.relative_attention_bias.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.4.layer.0.SelfAttention.v.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.4.layer.0.layer_norm.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.4.layer.1.DenseReluDense.wi_0.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.4.layer.1.DenseReluDense.wi_1.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.4.layer.1.DenseReluDense.wo.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.4.layer.1.layer_norm.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.5.layer.0.SelfAttention.k.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.5.layer.0.SelfAttention.o.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.5.layer.0.SelfAttention.q.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.5.layer.0.SelfAttention.relative_attention_bias.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.5.layer.0.SelfAttention.v.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.5.layer.0.layer_norm.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.5.layer.1.DenseReluDense.wi_0.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.5.layer.1.DenseReluDense.wi_1.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.5.layer.1.DenseReluDense.wo.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.5.layer.1.layer_norm.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.6.layer.0.SelfAttention.k.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.6.layer.0.SelfAttention.o.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.6.layer.0.SelfAttention.q.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.6.layer.0.SelfAttention.relative_attention_bias.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.6.layer.0.SelfAttention.v.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.6.layer.0.layer_norm.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.6.layer.1.DenseReluDense.wi_0.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.6.layer.1.DenseReluDense.wi_1.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.6.layer.1.DenseReluDense.wo.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.6.layer.1.layer_norm.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.7.layer.0.SelfAttention.k.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.7.layer.0.SelfAttention.o.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.7.layer.0.SelfAttention.q.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.7.layer.0.SelfAttention.relative_attention_bias.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.7.layer.0.SelfAttention.v.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.7.layer.0.layer_norm.weight": "model-00001-of-00003.safetensors",
+    "encoder.block.7.layer.1.DenseReluDense.wi_0.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.7.layer.1.DenseReluDense.wi_1.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.7.layer.1.DenseReluDense.wo.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.7.layer.1.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.8.layer.0.SelfAttention.k.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.8.layer.0.SelfAttention.o.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.8.layer.0.SelfAttention.q.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.8.layer.0.SelfAttention.relative_attention_bias.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.8.layer.0.SelfAttention.v.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.8.layer.0.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.8.layer.1.DenseReluDense.wi_0.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.8.layer.1.DenseReluDense.wi_1.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.8.layer.1.DenseReluDense.wo.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.8.layer.1.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.9.layer.0.SelfAttention.k.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.9.layer.0.SelfAttention.o.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.9.layer.0.SelfAttention.q.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.9.layer.0.SelfAttention.relative_attention_bias.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.9.layer.0.SelfAttention.v.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.9.layer.0.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.9.layer.1.DenseReluDense.wi_0.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.9.layer.1.DenseReluDense.wi_1.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.9.layer.1.DenseReluDense.wo.weight": "model-00002-of-00003.safetensors",
+    "encoder.block.9.layer.1.layer_norm.weight": "model-00002-of-00003.safetensors",
+    "encoder.final_layer_norm.weight": "model-00003-of-00003.safetensors",
+    "shared.weight": "model-00001-of-00003.safetensors"
+  }
+}

tokenizer/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e87c960c36d5fbf4e7e76c2469b7eab877be7f8c5992efbf97e44d3123cc6521
+size 16837418

tokenizer/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,317 @@

+{
+  "backend": "tokenizers",
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "eos_token": "</s>",
+  "extra_ids": 300,
+  "extra_special_tokens": [
+    "<extra_id_0>",
+    "<extra_id_1>",
+    "<extra_id_2>",
+    "<extra_id_3>",
+    "<extra_id_4>",
+    "<extra_id_5>",
+    "<extra_id_6>",
+    "<extra_id_7>",
+    "<extra_id_8>",
+    "<extra_id_9>",
+    "<extra_id_10>",
+    "<extra_id_11>",
+    "<extra_id_12>",
+    "<extra_id_13>",
+    "<extra_id_14>",
+    "<extra_id_15>",
+    "<extra_id_16>",
+    "<extra_id_17>",
+    "<extra_id_18>",
+    "<extra_id_19>",
+    "<extra_id_20>",
+    "<extra_id_21>",
+    "<extra_id_22>",
+    "<extra_id_23>",
+    "<extra_id_24>",
+    "<extra_id_25>",
+    "<extra_id_26>",
+    "<extra_id_27>",
+    "<extra_id_28>",
+    "<extra_id_29>",
+    "<extra_id_30>",
+    "<extra_id_31>",
+    "<extra_id_32>",
+    "<extra_id_33>",
+    "<extra_id_34>",
+    "<extra_id_35>",
+    "<extra_id_36>",
+    "<extra_id_37>",
+    "<extra_id_38>",
+    "<extra_id_39>",
+    "<extra_id_40>",
+    "<extra_id_41>",
+    "<extra_id_42>",
+    "<extra_id_43>",
+    "<extra_id_44>",
+    "<extra_id_45>",
+    "<extra_id_46>",
+    "<extra_id_47>",
+    "<extra_id_48>",
+    "<extra_id_49>",
+    "<extra_id_50>",
+    "<extra_id_51>",
+    "<extra_id_52>",
+    "<extra_id_53>",
+    "<extra_id_54>",
+    "<extra_id_55>",
+    "<extra_id_56>",
+    "<extra_id_57>",
+    "<extra_id_58>",
+    "<extra_id_59>",
+    "<extra_id_60>",
+    "<extra_id_61>",
+    "<extra_id_62>",
+    "<extra_id_63>",
+    "<extra_id_64>",
+    "<extra_id_65>",
+    "<extra_id_66>",
+    "<extra_id_67>",
+    "<extra_id_68>",
+    "<extra_id_69>",
+    "<extra_id_70>",
+    "<extra_id_71>",
+    "<extra_id_72>",
+    "<extra_id_73>",
+    "<extra_id_74>",
+    "<extra_id_75>",
+    "<extra_id_76>",
+    "<extra_id_77>",
+    "<extra_id_78>",
+    "<extra_id_79>",
+    "<extra_id_80>",
+    "<extra_id_81>",
+    "<extra_id_82>",
+    "<extra_id_83>",
+    "<extra_id_84>",
+    "<extra_id_85>",
+    "<extra_id_86>",
+    "<extra_id_87>",
+    "<extra_id_88>",
+    "<extra_id_89>",
+    "<extra_id_90>",
+    "<extra_id_91>",
+    "<extra_id_92>",
+    "<extra_id_93>",
+    "<extra_id_94>",
+    "<extra_id_95>",
+    "<extra_id_96>",
+    "<extra_id_97>",
+    "<extra_id_98>",
+    "<extra_id_99>",
+    "<extra_id_100>",
+    "<extra_id_101>",
+    "<extra_id_102>",
+    "<extra_id_103>",
+    "<extra_id_104>",
+    "<extra_id_105>",
+    "<extra_id_106>",
+    "<extra_id_107>",
+    "<extra_id_108>",
+    "<extra_id_109>",
+    "<extra_id_110>",
+    "<extra_id_111>",
+    "<extra_id_112>",
+    "<extra_id_113>",
+    "<extra_id_114>",
+    "<extra_id_115>",
+    "<extra_id_116>",
+    "<extra_id_117>",
+    "<extra_id_118>",
+    "<extra_id_119>",
+    "<extra_id_120>",
+    "<extra_id_121>",
+    "<extra_id_122>",
+    "<extra_id_123>",
+    "<extra_id_124>",
+    "<extra_id_125>",
+    "<extra_id_126>",
+    "<extra_id_127>",
+    "<extra_id_128>",
+    "<extra_id_129>",
+    "<extra_id_130>",
+    "<extra_id_131>",
+    "<extra_id_132>",
+    "<extra_id_133>",
+    "<extra_id_134>",
+    "<extra_id_135>",
+    "<extra_id_136>",
+    "<extra_id_137>",
+    "<extra_id_138>",
+    "<extra_id_139>",
+    "<extra_id_140>",
+    "<extra_id_141>",
+    "<extra_id_142>",
+    "<extra_id_143>",
+    "<extra_id_144>",
+    "<extra_id_145>",
+    "<extra_id_146>",
+    "<extra_id_147>",
+    "<extra_id_148>",
+    "<extra_id_149>",
+    "<extra_id_150>",
+    "<extra_id_151>",
+    "<extra_id_152>",
+    "<extra_id_153>",
+    "<extra_id_154>",
+    "<extra_id_155>",
+    "<extra_id_156>",
+    "<extra_id_157>",
+    "<extra_id_158>",
+    "<extra_id_159>",
+    "<extra_id_160>",
+    "<extra_id_161>",
+    "<extra_id_162>",
+    "<extra_id_163>",
+    "<extra_id_164>",
+    "<extra_id_165>",
+    "<extra_id_166>",
+    "<extra_id_167>",
+    "<extra_id_168>",
+    "<extra_id_169>",
+    "<extra_id_170>",
+    "<extra_id_171>",
+    "<extra_id_172>",
+    "<extra_id_173>",
+    "<extra_id_174>",
+    "<extra_id_175>",
+    "<extra_id_176>",
+    "<extra_id_177>",
+    "<extra_id_178>",
+    "<extra_id_179>",
+    "<extra_id_180>",
+    "<extra_id_181>",
+    "<extra_id_182>",
+    "<extra_id_183>",
+    "<extra_id_184>",
+    "<extra_id_185>",
+    "<extra_id_186>",
+    "<extra_id_187>",
+    "<extra_id_188>",
+    "<extra_id_189>",
+    "<extra_id_190>",
+    "<extra_id_191>",
+    "<extra_id_192>",
+    "<extra_id_193>",
+    "<extra_id_194>",
+    "<extra_id_195>",
+    "<extra_id_196>",
+    "<extra_id_197>",
+    "<extra_id_198>",
+    "<extra_id_199>",
+    "<extra_id_200>",
+    "<extra_id_201>",
+    "<extra_id_202>",
+    "<extra_id_203>",
+    "<extra_id_204>",
+    "<extra_id_205>",
+    "<extra_id_206>",
+    "<extra_id_207>",
+    "<extra_id_208>",
+    "<extra_id_209>",
+    "<extra_id_210>",
+    "<extra_id_211>",
+    "<extra_id_212>",
+    "<extra_id_213>",
+    "<extra_id_214>",
+    "<extra_id_215>",
+    "<extra_id_216>",
+    "<extra_id_217>",
+    "<extra_id_218>",
+    "<extra_id_219>",
+    "<extra_id_220>",
+    "<extra_id_221>",
+    "<extra_id_222>",
+    "<extra_id_223>",
+    "<extra_id_224>",
+    "<extra_id_225>",
+    "<extra_id_226>",
+    "<extra_id_227>",
+    "<extra_id_228>",
+    "<extra_id_229>",
+    "<extra_id_230>",
+    "<extra_id_231>",
+    "<extra_id_232>",
+    "<extra_id_233>",
+    "<extra_id_234>",
+    "<extra_id_235>",
+    "<extra_id_236>",
+    "<extra_id_237>",
+    "<extra_id_238>",
+    "<extra_id_239>",
+    "<extra_id_240>",
+    "<extra_id_241>",
+    "<extra_id_242>",
+    "<extra_id_243>",
+    "<extra_id_244>",
+    "<extra_id_245>",
+    "<extra_id_246>",
+    "<extra_id_247>",
+    "<extra_id_248>",
+    "<extra_id_249>",
+    "<extra_id_250>",
+    "<extra_id_251>",
+    "<extra_id_252>",
+    "<extra_id_253>",
+    "<extra_id_254>",
+    "<extra_id_255>",
+    "<extra_id_256>",
+    "<extra_id_257>",
+    "<extra_id_258>",
+    "<extra_id_259>",
+    "<extra_id_260>",
+    "<extra_id_261>",
+    "<extra_id_262>",
+    "<extra_id_263>",
+    "<extra_id_264>",
+    "<extra_id_265>",
+    "<extra_id_266>",
+    "<extra_id_267>",
+    "<extra_id_268>",
+    "<extra_id_269>",
+    "<extra_id_270>",
+    "<extra_id_271>",
+    "<extra_id_272>",
+    "<extra_id_273>",
+    "<extra_id_274>",
+    "<extra_id_275>",
+    "<extra_id_276>",
+    "<extra_id_277>",
+    "<extra_id_278>",
+    "<extra_id_279>",
+    "<extra_id_280>",
+    "<extra_id_281>",
+    "<extra_id_282>",
+    "<extra_id_283>",
+    "<extra_id_284>",
+    "<extra_id_285>",
+    "<extra_id_286>",
+    "<extra_id_287>",
+    "<extra_id_288>",
+    "<extra_id_289>",
+    "<extra_id_290>",
+    "<extra_id_291>",
+    "<extra_id_292>",
+    "<extra_id_293>",
+    "<extra_id_294>",
+    "<extra_id_295>",
+    "<extra_id_296>",
+    "<extra_id_297>",
+    "<extra_id_298>",
+    "<extra_id_299>"
+  ],
+  "is_local": true,
+  "model_max_length": 1000000000000000019884624838656,
+  "model_specific_special_tokens": {},
+  "pad_token": "<pad>",
+  "sp_model_kwargs": {},
+  "spaces_between_special_tokens": false,
+  "tokenizer_class": "T5Tokenizer",
+  "unk_token": "<unk>"
+}

transformer/0.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba9f08cfc6b9e245483c0d91ee5088205f7ceaa302f3326c5e29b3c831b02b97
+size 2137450610

transformer/1.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:16b8e7120b9ba90bc1976fd16bdb88b1a09f002f429bc5e8f335845ff10a4a49
+size 2144437513

transformer/2.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:da4867a6c46f7fa1f6dcd2642ae2a7bb9520759bd56a2ed09396266322446d9f
+size 1034389766

transformer/model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,1447 @@

+{
+  "metadata": {
+    "quantization_level": "8",
+    "mflux_version": "0.18.6"
+  },
+  "weight_map": {
+    "rope.freqs_cos": "0.safetensors",
+    "rope.freqs_sin": "0.safetensors",
+    "patch_embedding.weight": "0.safetensors",
+    "patch_embedding.bias": "0.safetensors",
+    "condition_embedder.time_embedder.linear_1.weight": "0.safetensors",
+    "condition_embedder.time_embedder.linear_1.scales": "0.safetensors",
+    "condition_embedder.time_embedder.linear_1.biases": "0.safetensors",
+    "condition_embedder.time_embedder.linear_1.bias": "0.safetensors",
+    "condition_embedder.time_embedder.linear_2.weight": "0.safetensors",
+    "condition_embedder.time_embedder.linear_2.scales": "0.safetensors",
+    "condition_embedder.time_embedder.linear_2.biases": "0.safetensors",
+    "condition_embedder.time_embedder.linear_2.bias": "0.safetensors",
+    "condition_embedder.time_proj.weight": "0.safetensors",
+    "condition_embedder.time_proj.scales": "0.safetensors",
+    "condition_embedder.time_proj.biases": "0.safetensors",
+    "condition_embedder.time_proj.bias": "0.safetensors",
+    "condition_embedder.text_embedder.linear_1.weight": "0.safetensors",
+    "condition_embedder.text_embedder.linear_1.scales": "0.safetensors",
+    "condition_embedder.text_embedder.linear_1.biases": "0.safetensors",
+    "condition_embedder.text_embedder.linear_1.bias": "0.safetensors",
+    "condition_embedder.text_embedder.linear_2.weight": "0.safetensors",
+    "condition_embedder.text_embedder.linear_2.scales": "0.safetensors",
+    "condition_embedder.text_embedder.linear_2.biases": "0.safetensors",
+    "condition_embedder.text_embedder.linear_2.bias": "0.safetensors",
+    "blocks.0.attn1.to_q.weight": "0.safetensors",
+    "blocks.0.attn1.to_q.scales": "0.safetensors",
+    "blocks.0.attn1.to_q.biases": "0.safetensors",
+    "blocks.0.attn1.to_q.bias": "0.safetensors",
+    "blocks.0.attn1.to_k.weight": "0.safetensors",
+    "blocks.0.attn1.to_k.scales": "0.safetensors",
+    "blocks.0.attn1.to_k.biases": "0.safetensors",
+    "blocks.0.attn1.to_k.bias": "0.safetensors",
+    "blocks.0.attn1.to_v.weight": "0.safetensors",
+    "blocks.0.attn1.to_v.scales": "0.safetensors",
+    "blocks.0.attn1.to_v.biases": "0.safetensors",
+    "blocks.0.attn1.to_v.bias": "0.safetensors",
+    "blocks.0.attn1.to_out.0.weight": "0.safetensors",
+    "blocks.0.attn1.to_out.0.scales": "0.safetensors",
+    "blocks.0.attn1.to_out.0.biases": "0.safetensors",
+    "blocks.0.attn1.to_out.0.bias": "0.safetensors",
+    "blocks.0.attn1.norm_q.weight": "0.safetensors",
+    "blocks.0.attn1.norm_k.weight": "0.safetensors",
+    "blocks.0.attn2.to_q.weight": "0.safetensors",
+    "blocks.0.attn2.to_q.scales": "0.safetensors",
+    "blocks.0.attn2.to_q.biases": "0.safetensors",
+    "blocks.0.attn2.to_q.bias": "0.safetensors",
+    "blocks.0.attn2.to_k.weight": "0.safetensors",
+    "blocks.0.attn2.to_k.scales": "0.safetensors",
+    "blocks.0.attn2.to_k.biases": "0.safetensors",
+    "blocks.0.attn2.to_k.bias": "0.safetensors",
+    "blocks.0.attn2.to_v.weight": "0.safetensors",
+    "blocks.0.attn2.to_v.scales": "0.safetensors",
+    "blocks.0.attn2.to_v.biases": "0.safetensors",
+    "blocks.0.attn2.to_v.bias": "0.safetensors",
+    "blocks.0.attn2.to_out.0.weight": "0.safetensors",
+    "blocks.0.attn2.to_out.0.scales": "0.safetensors",
+    "blocks.0.attn2.to_out.0.biases": "0.safetensors",
+    "blocks.0.attn2.to_out.0.bias": "0.safetensors",
+    "blocks.0.attn2.norm_q.weight": "0.safetensors",
+    "blocks.0.attn2.norm_k.weight": "0.safetensors",
+    "blocks.0.norm2.weight": "0.safetensors",
+    "blocks.0.norm2.bias": "0.safetensors",
+    "blocks.0.ffn.net.0.weight": "0.safetensors",
+    "blocks.0.ffn.net.0.scales": "0.safetensors",
+    "blocks.0.ffn.net.0.biases": "0.safetensors",
+    "blocks.0.ffn.net.0.bias": "0.safetensors",
+    "blocks.0.ffn.net.1.weight": "0.safetensors",
+    "blocks.0.ffn.net.1.scales": "0.safetensors",
+    "blocks.0.ffn.net.1.biases": "0.safetensors",
+    "blocks.0.ffn.net.1.bias": "0.safetensors",
+    "blocks.0.scale_shift_table": "0.safetensors",
+    "blocks.1.attn1.to_q.weight": "0.safetensors",
+    "blocks.1.attn1.to_q.scales": "0.safetensors",
+    "blocks.1.attn1.to_q.biases": "0.safetensors",
+    "blocks.1.attn1.to_q.bias": "0.safetensors",
+    "blocks.1.attn1.to_k.weight": "0.safetensors",
+    "blocks.1.attn1.to_k.scales": "0.safetensors",
+    "blocks.1.attn1.to_k.biases": "0.safetensors",
+    "blocks.1.attn1.to_k.bias": "0.safetensors",
+    "blocks.1.attn1.to_v.weight": "0.safetensors",
+    "blocks.1.attn1.to_v.scales": "0.safetensors",
+    "blocks.1.attn1.to_v.biases": "0.safetensors",
+    "blocks.1.attn1.to_v.bias": "0.safetensors",
+    "blocks.1.attn1.to_out.0.weight": "0.safetensors",
+    "blocks.1.attn1.to_out.0.scales": "0.safetensors",
+    "blocks.1.attn1.to_out.0.biases": "0.safetensors",
+    "blocks.1.attn1.to_out.0.bias": "0.safetensors",
+    "blocks.1.attn1.norm_q.weight": "0.safetensors",
+    "blocks.1.attn1.norm_k.weight": "0.safetensors",
+    "blocks.1.attn2.to_q.weight": "0.safetensors",
+    "blocks.1.attn2.to_q.scales": "0.safetensors",
+    "blocks.1.attn2.to_q.biases": "0.safetensors",
+    "blocks.1.attn2.to_q.bias": "0.safetensors",
+    "blocks.1.attn2.to_k.weight": "0.safetensors",
+    "blocks.1.attn2.to_k.scales": "0.safetensors",
+    "blocks.1.attn2.to_k.biases": "0.safetensors",
+    "blocks.1.attn2.to_k.bias": "0.safetensors",
+    "blocks.1.attn2.to_v.weight": "0.safetensors",
+    "blocks.1.attn2.to_v.scales": "0.safetensors",
+    "blocks.1.attn2.to_v.biases": "0.safetensors",
+    "blocks.1.attn2.to_v.bias": "0.safetensors",
+    "blocks.1.attn2.to_out.0.weight": "0.safetensors",
+    "blocks.1.attn2.to_out.0.scales": "0.safetensors",
+    "blocks.1.attn2.to_out.0.biases": "0.safetensors",
+    "blocks.1.attn2.to_out.0.bias": "0.safetensors",
+    "blocks.1.attn2.norm_q.weight": "0.safetensors",
+    "blocks.1.attn2.norm_k.weight": "0.safetensors",
+    "blocks.1.norm2.weight": "0.safetensors",
+    "blocks.1.norm2.bias": "0.safetensors",
+    "blocks.1.ffn.net.0.weight": "0.safetensors",
+    "blocks.1.ffn.net.0.scales": "0.safetensors",
+    "blocks.1.ffn.net.0.biases": "0.safetensors",
+    "blocks.1.ffn.net.0.bias": "0.safetensors",
+    "blocks.1.ffn.net.1.weight": "0.safetensors",
+    "blocks.1.ffn.net.1.scales": "0.safetensors",
+    "blocks.1.ffn.net.1.biases": "0.safetensors",
+    "blocks.1.ffn.net.1.bias": "0.safetensors",
+    "blocks.1.scale_shift_table": "0.safetensors",
+    "blocks.2.attn1.to_q.weight": "0.safetensors",
+    "blocks.2.attn1.to_q.scales": "0.safetensors",
+    "blocks.2.attn1.to_q.biases": "0.safetensors",
+    "blocks.2.attn1.to_q.bias": "0.safetensors",
+    "blocks.2.attn1.to_k.weight": "0.safetensors",
+    "blocks.2.attn1.to_k.scales": "0.safetensors",
+    "blocks.2.attn1.to_k.biases": "0.safetensors",
+    "blocks.2.attn1.to_k.bias": "0.safetensors",
+    "blocks.2.attn1.to_v.weight": "0.safetensors",
+    "blocks.2.attn1.to_v.scales": "0.safetensors",
+    "blocks.2.attn1.to_v.biases": "0.safetensors",
+    "blocks.2.attn1.to_v.bias": "0.safetensors",
+    "blocks.2.attn1.to_out.0.weight": "0.safetensors",
+    "blocks.2.attn1.to_out.0.scales": "0.safetensors",
+    "blocks.2.attn1.to_out.0.biases": "0.safetensors",
+    "blocks.2.attn1.to_out.0.bias": "0.safetensors",
+    "blocks.2.attn1.norm_q.weight": "0.safetensors",
+    "blocks.2.attn1.norm_k.weight": "0.safetensors",
+    "blocks.2.attn2.to_q.weight": "0.safetensors",
+    "blocks.2.attn2.to_q.scales": "0.safetensors",
+    "blocks.2.attn2.to_q.biases": "0.safetensors",
+    "blocks.2.attn2.to_q.bias": "0.safetensors",
+    "blocks.2.attn2.to_k.weight": "0.safetensors",
+    "blocks.2.attn2.to_k.scales": "0.safetensors",
+    "blocks.2.attn2.to_k.biases": "0.safetensors",
+    "blocks.2.attn2.to_k.bias": "0.safetensors",
+    "blocks.2.attn2.to_v.weight": "0.safetensors",
+    "blocks.2.attn2.to_v.scales": "0.safetensors",
+    "blocks.2.attn2.to_v.biases": "0.safetensors",
+    "blocks.2.attn2.to_v.bias": "0.safetensors",
+    "blocks.2.attn2.to_out.0.weight": "0.safetensors",
+    "blocks.2.attn2.to_out.0.scales": "0.safetensors",
+    "blocks.2.attn2.to_out.0.biases": "0.safetensors",
+    "blocks.2.attn2.to_out.0.bias": "0.safetensors",
+    "blocks.2.attn2.norm_q.weight": "0.safetensors",
+    "blocks.2.attn2.norm_k.weight": "0.safetensors",
+    "blocks.2.norm2.weight": "0.safetensors",
+    "blocks.2.norm2.bias": "0.safetensors",
+    "blocks.2.ffn.net.0.weight": "0.safetensors",
+    "blocks.2.ffn.net.0.scales": "0.safetensors",
+    "blocks.2.ffn.net.0.biases": "0.safetensors",
+    "blocks.2.ffn.net.0.bias": "0.safetensors",
+    "blocks.2.ffn.net.1.weight": "0.safetensors",
+    "blocks.2.ffn.net.1.scales": "0.safetensors",
+    "blocks.2.ffn.net.1.biases": "0.safetensors",
+    "blocks.2.ffn.net.1.bias": "0.safetensors",
+    "blocks.2.scale_shift_table": "0.safetensors",
+    "blocks.3.attn1.to_q.weight": "0.safetensors",
+    "blocks.3.attn1.to_q.scales": "0.safetensors",
+    "blocks.3.attn1.to_q.biases": "0.safetensors",
+    "blocks.3.attn1.to_q.bias": "0.safetensors",
+    "blocks.3.attn1.to_k.weight": "0.safetensors",
+    "blocks.3.attn1.to_k.scales": "0.safetensors",
+    "blocks.3.attn1.to_k.biases": "0.safetensors",
+    "blocks.3.attn1.to_k.bias": "0.safetensors",
+    "blocks.3.attn1.to_v.weight": "0.safetensors",
+    "blocks.3.attn1.to_v.scales": "0.safetensors",
+    "blocks.3.attn1.to_v.biases": "0.safetensors",
+    "blocks.3.attn1.to_v.bias": "0.safetensors",
+    "blocks.3.attn1.to_out.0.weight": "0.safetensors",
+    "blocks.3.attn1.to_out.0.scales": "0.safetensors",
+    "blocks.3.attn1.to_out.0.biases": "0.safetensors",
+    "blocks.3.attn1.to_out.0.bias": "0.safetensors",
+    "blocks.3.attn1.norm_q.weight": "0.safetensors",
+    "blocks.3.attn1.norm_k.weight": "0.safetensors",
+    "blocks.3.attn2.to_q.weight": "0.safetensors",
+    "blocks.3.attn2.to_q.scales": "0.safetensors",
+    "blocks.3.attn2.to_q.biases": "0.safetensors",
+    "blocks.3.attn2.to_q.bias": "0.safetensors",
+    "blocks.3.attn2.to_k.weight": "0.safetensors",
+    "blocks.3.attn2.to_k.scales": "0.safetensors",
+    "blocks.3.attn2.to_k.biases": "0.safetensors",
+    "blocks.3.attn2.to_k.bias": "0.safetensors",
+    "blocks.3.attn2.to_v.weight": "0.safetensors",
+    "blocks.3.attn2.to_v.scales": "0.safetensors",
+    "blocks.3.attn2.to_v.biases": "0.safetensors",
+    "blocks.3.attn2.to_v.bias": "0.safetensors",
+    "blocks.3.attn2.to_out.0.weight": "0.safetensors",
+    "blocks.3.attn2.to_out.0.scales": "0.safetensors",
+    "blocks.3.attn2.to_out.0.biases": "0.safetensors",
+    "blocks.3.attn2.to_out.0.bias": "0.safetensors",
+    "blocks.3.attn2.norm_q.weight": "0.safetensors",
+    "blocks.3.attn2.norm_k.weight": "0.safetensors",
+    "blocks.3.norm2.weight": "0.safetensors",
+    "blocks.3.norm2.bias": "0.safetensors",
+    "blocks.3.ffn.net.0.weight": "0.safetensors",
+    "blocks.3.ffn.net.0.scales": "0.safetensors",
+    "blocks.3.ffn.net.0.biases": "0.safetensors",
+    "blocks.3.ffn.net.0.bias": "0.safetensors",
+    "blocks.3.ffn.net.1.weight": "0.safetensors",
+    "blocks.3.ffn.net.1.scales": "0.safetensors",
+    "blocks.3.ffn.net.1.biases": "0.safetensors",
+    "blocks.3.ffn.net.1.bias": "0.safetensors",
+    "blocks.3.scale_shift_table": "0.safetensors",
+    "blocks.4.attn1.to_q.weight": "0.safetensors",
+    "blocks.4.attn1.to_q.scales": "0.safetensors",
+    "blocks.4.attn1.to_q.biases": "0.safetensors",
+    "blocks.4.attn1.to_q.bias": "0.safetensors",
+    "blocks.4.attn1.to_k.weight": "0.safetensors",
+    "blocks.4.attn1.to_k.scales": "0.safetensors",
+    "blocks.4.attn1.to_k.biases": "0.safetensors",
+    "blocks.4.attn1.to_k.bias": "0.safetensors",
+    "blocks.4.attn1.to_v.weight": "0.safetensors",
+    "blocks.4.attn1.to_v.scales": "0.safetensors",
+    "blocks.4.attn1.to_v.biases": "0.safetensors",
+    "blocks.4.attn1.to_v.bias": "0.safetensors",
+    "blocks.4.attn1.to_out.0.weight": "0.safetensors",
+    "blocks.4.attn1.to_out.0.scales": "0.safetensors",
+    "blocks.4.attn1.to_out.0.biases": "0.safetensors",
+    "blocks.4.attn1.to_out.0.bias": "0.safetensors",
+    "blocks.4.attn1.norm_q.weight": "0.safetensors",
+    "blocks.4.attn1.norm_k.weight": "0.safetensors",
+    "blocks.4.attn2.to_q.weight": "0.safetensors",
+    "blocks.4.attn2.to_q.scales": "0.safetensors",
+    "blocks.4.attn2.to_q.biases": "0.safetensors",
+    "blocks.4.attn2.to_q.bias": "0.safetensors",
+    "blocks.4.attn2.to_k.weight": "0.safetensors",
+    "blocks.4.attn2.to_k.scales": "0.safetensors",
+    "blocks.4.attn2.to_k.biases": "0.safetensors",
+    "blocks.4.attn2.to_k.bias": "0.safetensors",
+    "blocks.4.attn2.to_v.weight": "0.safetensors",
+    "blocks.4.attn2.to_v.scales": "0.safetensors",
+    "blocks.4.attn2.to_v.biases": "0.safetensors",
+    "blocks.4.attn2.to_v.bias": "0.safetensors",
+    "blocks.4.attn2.to_out.0.weight": "0.safetensors",
+    "blocks.4.attn2.to_out.0.scales": "0.safetensors",
+    "blocks.4.attn2.to_out.0.biases": "0.safetensors",
+    "blocks.4.attn2.to_out.0.bias": "0.safetensors",
+    "blocks.4.attn2.norm_q.weight": "0.safetensors",
+    "blocks.4.attn2.norm_k.weight": "0.safetensors",
+    "blocks.4.norm2.weight": "0.safetensors",
+    "blocks.4.norm2.bias": "0.safetensors",
+    "blocks.4.ffn.net.0.weight": "0.safetensors",
+    "blocks.4.ffn.net.0.scales": "0.safetensors",
+    "blocks.4.ffn.net.0.biases": "0.safetensors",
+    "blocks.4.ffn.net.0.bias": "0.safetensors",
+    "blocks.4.ffn.net.1.weight": "0.safetensors",
+    "blocks.4.ffn.net.1.scales": "0.safetensors",
+    "blocks.4.ffn.net.1.biases": "0.safetensors",
+    "blocks.4.ffn.net.1.bias": "0.safetensors",
+    "blocks.4.scale_shift_table": "0.safetensors",
+    "blocks.5.attn1.to_q.weight": "0.safetensors",
+    "blocks.5.attn1.to_q.scales": "0.safetensors",
+    "blocks.5.attn1.to_q.biases": "0.safetensors",
+    "blocks.5.attn1.to_q.bias": "0.safetensors",
+    "blocks.5.attn1.to_k.weight": "0.safetensors",
+    "blocks.5.attn1.to_k.scales": "0.safetensors",
+    "blocks.5.attn1.to_k.biases": "0.safetensors",
+    "blocks.5.attn1.to_k.bias": "0.safetensors",
+    "blocks.5.attn1.to_v.weight": "0.safetensors",
+    "blocks.5.attn1.to_v.scales": "0.safetensors",
+    "blocks.5.attn1.to_v.biases": "0.safetensors",
+    "blocks.5.attn1.to_v.bias": "0.safetensors",
+    "blocks.5.attn1.to_out.0.weight": "0.safetensors",
+    "blocks.5.attn1.to_out.0.scales": "0.safetensors",
+    "blocks.5.attn1.to_out.0.biases": "0.safetensors",
+    "blocks.5.attn1.to_out.0.bias": "0.safetensors",
+    "blocks.5.attn1.norm_q.weight": "0.safetensors",
+    "blocks.5.attn1.norm_k.weight": "0.safetensors",
+    "blocks.5.attn2.to_q.weight": "0.safetensors",
+    "blocks.5.attn2.to_q.scales": "0.safetensors",
+    "blocks.5.attn2.to_q.biases": "0.safetensors",
+    "blocks.5.attn2.to_q.bias": "0.safetensors",
+    "blocks.5.attn2.to_k.weight": "0.safetensors",
+    "blocks.5.attn2.to_k.scales": "0.safetensors",
+    "blocks.5.attn2.to_k.biases": "0.safetensors",
+    "blocks.5.attn2.to_k.bias": "0.safetensors",
+    "blocks.5.attn2.to_v.weight": "0.safetensors",
+    "blocks.5.attn2.to_v.scales": "0.safetensors",
+    "blocks.5.attn2.to_v.biases": "0.safetensors",
+    "blocks.5.attn2.to_v.bias": "0.safetensors",
+    "blocks.5.attn2.to_out.0.weight": "0.safetensors",
+    "blocks.5.attn2.to_out.0.scales": "0.safetensors",
+    "blocks.5.attn2.to_out.0.biases": "0.safetensors",
+    "blocks.5.attn2.to_out.0.bias": "0.safetensors",
+    "blocks.5.attn2.norm_q.weight": "0.safetensors",
+    "blocks.5.attn2.norm_k.weight": "0.safetensors",
+    "blocks.5.norm2.weight": "0.safetensors",
+    "blocks.5.norm2.bias": "0.safetensors",
+    "blocks.5.ffn.net.0.weight": "0.safetensors",
+    "blocks.5.ffn.net.0.scales": "0.safetensors",
+    "blocks.5.ffn.net.0.biases": "0.safetensors",
+    "blocks.5.ffn.net.0.bias": "0.safetensors",
+    "blocks.5.ffn.net.1.weight": "0.safetensors",
+    "blocks.5.ffn.net.1.scales": "0.safetensors",
+    "blocks.5.ffn.net.1.biases": "0.safetensors",
+    "blocks.5.ffn.net.1.bias": "0.safetensors",
+    "blocks.5.scale_shift_table": "0.safetensors",
+    "blocks.6.attn1.to_q.weight": "0.safetensors",
+    "blocks.6.attn1.to_q.scales": "0.safetensors",
+    "blocks.6.attn1.to_q.biases": "0.safetensors",
+    "blocks.6.attn1.to_q.bias": "0.safetensors",
+    "blocks.6.attn1.to_k.weight": "0.safetensors",
+    "blocks.6.attn1.to_k.scales": "0.safetensors",
+    "blocks.6.attn1.to_k.biases": "0.safetensors",
+    "blocks.6.attn1.to_k.bias": "0.safetensors",
+    "blocks.6.attn1.to_v.weight": "0.safetensors",
+    "blocks.6.attn1.to_v.scales": "0.safetensors",
+    "blocks.6.attn1.to_v.biases": "0.safetensors",
+    "blocks.6.attn1.to_v.bias": "0.safetensors",
+    "blocks.6.attn1.to_out.0.weight": "0.safetensors",
+    "blocks.6.attn1.to_out.0.scales": "0.safetensors",
+    "blocks.6.attn1.to_out.0.biases": "0.safetensors",
+    "blocks.6.attn1.to_out.0.bias": "0.safetensors",
+    "blocks.6.attn1.norm_q.weight": "0.safetensors",
+    "blocks.6.attn1.norm_k.weight": "0.safetensors",
+    "blocks.6.attn2.to_q.weight": "0.safetensors",
+    "blocks.6.attn2.to_q.scales": "0.safetensors",
+    "blocks.6.attn2.to_q.biases": "0.safetensors",
+    "blocks.6.attn2.to_q.bias": "0.safetensors",
+    "blocks.6.attn2.to_k.weight": "0.safetensors",
+    "blocks.6.attn2.to_k.scales": "0.safetensors",
+    "blocks.6.attn2.to_k.biases": "0.safetensors",
+    "blocks.6.attn2.to_k.bias": "0.safetensors",
+    "blocks.6.attn2.to_v.weight": "0.safetensors",
+    "blocks.6.attn2.to_v.scales": "0.safetensors",
+    "blocks.6.attn2.to_v.biases": "0.safetensors",
+    "blocks.6.attn2.to_v.bias": "0.safetensors",
+    "blocks.6.attn2.to_out.0.weight": "0.safetensors",
+    "blocks.6.attn2.to_out.0.scales": "0.safetensors",
+    "blocks.6.attn2.to_out.0.biases": "0.safetensors",
+    "blocks.6.attn2.to_out.0.bias": "0.safetensors",
+    "blocks.6.attn2.norm_q.weight": "0.safetensors",
+    "blocks.6.attn2.norm_k.weight": "0.safetensors",
+    "blocks.6.norm2.weight": "0.safetensors",
+    "blocks.6.norm2.bias": "0.safetensors",
+    "blocks.6.ffn.net.0.weight": "0.safetensors",
+    "blocks.6.ffn.net.0.scales": "0.safetensors",
+    "blocks.6.ffn.net.0.biases": "0.safetensors",
+    "blocks.6.ffn.net.0.bias": "0.safetensors",
+    "blocks.6.ffn.net.1.weight": "0.safetensors",
+    "blocks.6.ffn.net.1.scales": "0.safetensors",
+    "blocks.6.ffn.net.1.biases": "0.safetensors",
+    "blocks.6.ffn.net.1.bias": "0.safetensors",
+    "blocks.6.scale_shift_table": "0.safetensors",
+    "blocks.7.attn1.to_q.weight": "0.safetensors",
+    "blocks.7.attn1.to_q.scales": "0.safetensors",
+    "blocks.7.attn1.to_q.biases": "0.safetensors",
+    "blocks.7.attn1.to_q.bias": "0.safetensors",
+    "blocks.7.attn1.to_k.weight": "0.safetensors",
+    "blocks.7.attn1.to_k.scales": "0.safetensors",
+    "blocks.7.attn1.to_k.biases": "0.safetensors",
+    "blocks.7.attn1.to_k.bias": "0.safetensors",
+    "blocks.7.attn1.to_v.weight": "0.safetensors",
+    "blocks.7.attn1.to_v.scales": "0.safetensors",
+    "blocks.7.attn1.to_v.biases": "0.safetensors",
+    "blocks.7.attn1.to_v.bias": "0.safetensors",
+    "blocks.7.attn1.to_out.0.weight": "0.safetensors",
+    "blocks.7.attn1.to_out.0.scales": "0.safetensors",
+    "blocks.7.attn1.to_out.0.biases": "0.safetensors",
+    "blocks.7.attn1.to_out.0.bias": "0.safetensors",
+    "blocks.7.attn1.norm_q.weight": "0.safetensors",
+    "blocks.7.attn1.norm_k.weight": "0.safetensors",
+    "blocks.7.attn2.to_q.weight": "0.safetensors",
+    "blocks.7.attn2.to_q.scales": "0.safetensors",
+    "blocks.7.attn2.to_q.biases": "0.safetensors",
+    "blocks.7.attn2.to_q.bias": "0.safetensors",
+    "blocks.7.attn2.to_k.weight": "0.safetensors",
+    "blocks.7.attn2.to_k.scales": "0.safetensors",
+    "blocks.7.attn2.to_k.biases": "0.safetensors",
+    "blocks.7.attn2.to_k.bias": "0.safetensors",
+    "blocks.7.attn2.to_v.weight": "0.safetensors",
+    "blocks.7.attn2.to_v.scales": "0.safetensors",
+    "blocks.7.attn2.to_v.biases": "0.safetensors",
+    "blocks.7.attn2.to_v.bias": "0.safetensors",
+    "blocks.7.attn2.to_out.0.weight": "0.safetensors",
+    "blocks.7.attn2.to_out.0.scales": "0.safetensors",
+    "blocks.7.attn2.to_out.0.biases": "0.safetensors",
+    "blocks.7.attn2.to_out.0.bias": "0.safetensors",
+    "blocks.7.attn2.norm_q.weight": "0.safetensors",
+    "blocks.7.attn2.norm_k.weight": "0.safetensors",
+    "blocks.7.norm2.weight": "0.safetensors",
+    "blocks.7.norm2.bias": "0.safetensors",
+    "blocks.7.ffn.net.0.weight": "0.safetensors",
+    "blocks.7.ffn.net.0.scales": "0.safetensors",
+    "blocks.7.ffn.net.0.biases": "0.safetensors",
+    "blocks.7.ffn.net.0.bias": "0.safetensors",
+    "blocks.7.ffn.net.1.weight": "0.safetensors",
+    "blocks.7.ffn.net.1.scales": "0.safetensors",
+    "blocks.7.ffn.net.1.biases": "0.safetensors",
+    "blocks.7.ffn.net.1.bias": "0.safetensors",
+    "blocks.7.scale_shift_table": "0.safetensors",
+    "blocks.8.attn1.to_q.weight": "0.safetensors",
+    "blocks.8.attn1.to_q.scales": "0.safetensors",
+    "blocks.8.attn1.to_q.biases": "0.safetensors",
+    "blocks.8.attn1.to_q.bias": "0.safetensors",
+    "blocks.8.attn1.to_k.weight": "0.safetensors",
+    "blocks.8.attn1.to_k.scales": "0.safetensors",
+    "blocks.8.attn1.to_k.biases": "0.safetensors",
+    "blocks.8.attn1.to_k.bias": "0.safetensors",
+    "blocks.8.attn1.to_v.weight": "0.safetensors",
+    "blocks.8.attn1.to_v.scales": "0.safetensors",
+    "blocks.8.attn1.to_v.biases": "0.safetensors",
+    "blocks.8.attn1.to_v.bias": "0.safetensors",
+    "blocks.8.attn1.to_out.0.weight": "0.safetensors",
+    "blocks.8.attn1.to_out.0.scales": "0.safetensors",
+    "blocks.8.attn1.to_out.0.biases": "0.safetensors",
+    "blocks.8.attn1.to_out.0.bias": "0.safetensors",
+    "blocks.8.attn1.norm_q.weight": "0.safetensors",
+    "blocks.8.attn1.norm_k.weight": "0.safetensors",
+    "blocks.8.attn2.to_q.weight": "0.safetensors",
+    "blocks.8.attn2.to_q.scales": "0.safetensors",
+    "blocks.8.attn2.to_q.biases": "0.safetensors",
+    "blocks.8.attn2.to_q.bias": "0.safetensors",
+    "blocks.8.attn2.to_k.weight": "0.safetensors",
+    "blocks.8.attn2.to_k.scales": "0.safetensors",
+    "blocks.8.attn2.to_k.biases": "0.safetensors",
+    "blocks.8.attn2.to_k.bias": "0.safetensors",
+    "blocks.8.attn2.to_v.weight": "0.safetensors",
+    "blocks.8.attn2.to_v.scales": "0.safetensors",
+    "blocks.8.attn2.to_v.biases": "0.safetensors",
+    "blocks.8.attn2.to_v.bias": "0.safetensors",
+    "blocks.8.attn2.to_out.0.weight": "0.safetensors",
+    "blocks.8.attn2.to_out.0.scales": "0.safetensors",
+    "blocks.8.attn2.to_out.0.biases": "0.safetensors",
+    "blocks.8.attn2.to_out.0.bias": "0.safetensors",
+    "blocks.8.attn2.norm_q.weight": "0.safetensors",
+    "blocks.8.attn2.norm_k.weight": "0.safetensors",
+    "blocks.8.norm2.weight": "0.safetensors",
+    "blocks.8.norm2.bias": "0.safetensors",
+    "blocks.8.ffn.net.0.weight": "0.safetensors",
+    "blocks.8.ffn.net.0.scales": "0.safetensors",
+    "blocks.8.ffn.net.0.biases": "0.safetensors",
+    "blocks.8.ffn.net.0.bias": "0.safetensors",
+    "blocks.8.ffn.net.1.weight": "0.safetensors",
+    "blocks.8.ffn.net.1.scales": "0.safetensors",
+    "blocks.8.ffn.net.1.biases": "0.safetensors",
+    "blocks.8.ffn.net.1.bias": "0.safetensors",
+    "blocks.8.scale_shift_table": "0.safetensors",
+    "blocks.9.attn1.to_q.weight": "0.safetensors",
+    "blocks.9.attn1.to_q.scales": "0.safetensors",
+    "blocks.9.attn1.to_q.biases": "0.safetensors",
+    "blocks.9.attn1.to_q.bias": "0.safetensors",
+    "blocks.9.attn1.to_k.weight": "0.safetensors",
+    "blocks.9.attn1.to_k.scales": "0.safetensors",
+    "blocks.9.attn1.to_k.biases": "0.safetensors",
+    "blocks.9.attn1.to_k.bias": "0.safetensors",
+    "blocks.9.attn1.to_v.weight": "0.safetensors",
+    "blocks.9.attn1.to_v.scales": "0.safetensors",
+    "blocks.9.attn1.to_v.biases": "0.safetensors",
+    "blocks.9.attn1.to_v.bias": "0.safetensors",
+    "blocks.9.attn1.to_out.0.weight": "0.safetensors",
+    "blocks.9.attn1.to_out.0.scales": "0.safetensors",
+    "blocks.9.attn1.to_out.0.biases": "0.safetensors",
+    "blocks.9.attn1.to_out.0.bias": "0.safetensors",
+    "blocks.9.attn1.norm_q.weight": "0.safetensors",
+    "blocks.9.attn1.norm_k.weight": "0.safetensors",
+    "blocks.9.attn2.to_q.weight": "0.safetensors",
+    "blocks.9.attn2.to_q.scales": "0.safetensors",
+    "blocks.9.attn2.to_q.biases": "0.safetensors",
+    "blocks.9.attn2.to_q.bias": "0.safetensors",
+    "blocks.9.attn2.to_k.weight": "0.safetensors",
+    "blocks.9.attn2.to_k.scales": "0.safetensors",
+    "blocks.9.attn2.to_k.biases": "0.safetensors",
+    "blocks.9.attn2.to_k.bias": "0.safetensors",
+    "blocks.9.attn2.to_v.weight": "0.safetensors",
+    "blocks.9.attn2.to_v.scales": "0.safetensors",
+    "blocks.9.attn2.to_v.biases": "0.safetensors",
+    "blocks.9.attn2.to_v.bias": "0.safetensors",
+    "blocks.9.attn2.to_out.0.weight": "0.safetensors",
+    "blocks.9.attn2.to_out.0.scales": "0.safetensors",
+    "blocks.9.attn2.to_out.0.biases": "0.safetensors",
+    "blocks.9.attn2.to_out.0.bias": "0.safetensors",
+    "blocks.9.attn2.norm_q.weight": "0.safetensors",
+    "blocks.9.attn2.norm_k.weight": "0.safetensors",
+    "blocks.9.norm2.weight": "0.safetensors",
+    "blocks.9.norm2.bias": "0.safetensors",
+    "blocks.9.ffn.net.0.weight": "0.safetensors",
+    "blocks.9.ffn.net.0.scales": "0.safetensors",
+    "blocks.9.ffn.net.0.biases": "0.safetensors",
+    "blocks.9.ffn.net.0.bias": "0.safetensors",
+    "blocks.9.ffn.net.1.weight": "0.safetensors",
+    "blocks.9.ffn.net.1.scales": "0.safetensors",
+    "blocks.9.ffn.net.1.biases": "0.safetensors",
+    "blocks.9.ffn.net.1.bias": "0.safetensors",
+    "blocks.9.scale_shift_table": "0.safetensors",
+    "blocks.10.attn1.to_q.weight": "0.safetensors",
+    "blocks.10.attn1.to_q.scales": "0.safetensors",
+    "blocks.10.attn1.to_q.biases": "0.safetensors",
+    "blocks.10.attn1.to_q.bias": "0.safetensors",
+    "blocks.10.attn1.to_k.weight": "0.safetensors",
+    "blocks.10.attn1.to_k.scales": "0.safetensors",
+    "blocks.10.attn1.to_k.biases": "0.safetensors",
+    "blocks.10.attn1.to_k.bias": "0.safetensors",
+    "blocks.10.attn1.to_v.weight": "0.safetensors",
+    "blocks.10.attn1.to_v.scales": "0.safetensors",
+    "blocks.10.attn1.to_v.biases": "0.safetensors",
+    "blocks.10.attn1.to_v.bias": "0.safetensors",
+    "blocks.10.attn1.to_out.0.weight": "0.safetensors",
+    "blocks.10.attn1.to_out.0.scales": "0.safetensors",
+    "blocks.10.attn1.to_out.0.biases": "0.safetensors",
+    "blocks.10.attn1.to_out.0.bias": "0.safetensors",
+    "blocks.10.attn1.norm_q.weight": "0.safetensors",
+    "blocks.10.attn1.norm_k.weight": "0.safetensors",
+    "blocks.10.attn2.to_q.weight": "0.safetensors",
+    "blocks.10.attn2.to_q.scales": "0.safetensors",
+    "blocks.10.attn2.to_q.biases": "0.safetensors",
+    "blocks.10.attn2.to_q.bias": "0.safetensors",
+    "blocks.10.attn2.to_k.weight": "0.safetensors",
+    "blocks.10.attn2.to_k.scales": "0.safetensors",
+    "blocks.10.attn2.to_k.biases": "0.safetensors",
+    "blocks.10.attn2.to_k.bias": "0.safetensors",
+    "blocks.10.attn2.to_v.weight": "0.safetensors",
+    "blocks.10.attn2.to_v.scales": "0.safetensors",
+    "blocks.10.attn2.to_v.biases": "0.safetensors",
+    "blocks.10.attn2.to_v.bias": "0.safetensors",
+    "blocks.10.attn2.to_out.0.weight": "0.safetensors",
+    "blocks.10.attn2.to_out.0.scales": "0.safetensors",
+    "blocks.10.attn2.to_out.0.biases": "0.safetensors",
+    "blocks.10.attn2.to_out.0.bias": "0.safetensors",
+    "blocks.10.attn2.norm_q.weight": "0.safetensors",
+    "blocks.10.attn2.norm_k.weight": "0.safetensors",
+    "blocks.10.norm2.weight": "0.safetensors",
+    "blocks.10.norm2.bias": "0.safetensors",
+    "blocks.10.ffn.net.0.weight": "0.safetensors",
+    "blocks.10.ffn.net.0.scales": "0.safetensors",
+    "blocks.10.ffn.net.0.biases": "0.safetensors",
+    "blocks.10.ffn.net.0.bias": "0.safetensors",
+    "blocks.10.ffn.net.1.weight": "0.safetensors",
+    "blocks.10.ffn.net.1.scales": "0.safetensors",
+    "blocks.10.ffn.net.1.biases": "0.safetensors",
+    "blocks.10.ffn.net.1.bias": "0.safetensors",
+    "blocks.10.scale_shift_table": "0.safetensors",
+    "blocks.11.attn1.to_q.weight": "0.safetensors",
+    "blocks.11.attn1.to_q.scales": "0.safetensors",
+    "blocks.11.attn1.to_q.biases": "0.safetensors",
+    "blocks.11.attn1.to_q.bias": "0.safetensors",
+    "blocks.11.attn1.to_k.weight": "0.safetensors",
+    "blocks.11.attn1.to_k.scales": "0.safetensors",
+    "blocks.11.attn1.to_k.biases": "0.safetensors",
+    "blocks.11.attn1.to_k.bias": "0.safetensors",
+    "blocks.11.attn1.to_v.weight": "0.safetensors",
+    "blocks.11.attn1.to_v.scales": "0.safetensors",
+    "blocks.11.attn1.to_v.biases": "0.safetensors",
+    "blocks.11.attn1.to_v.bias": "0.safetensors",
+    "blocks.11.attn1.to_out.0.weight": "0.safetensors",
+    "blocks.11.attn1.to_out.0.scales": "0.safetensors",
+    "blocks.11.attn1.to_out.0.biases": "0.safetensors",
+    "blocks.11.attn1.to_out.0.bias": "0.safetensors",
+    "blocks.11.attn1.norm_q.weight": "0.safetensors",
+    "blocks.11.attn1.norm_k.weight": "0.safetensors",
+    "blocks.11.attn2.to_q.weight": "0.safetensors",
+    "blocks.11.attn2.to_q.scales": "0.safetensors",
+    "blocks.11.attn2.to_q.biases": "0.safetensors",
+    "blocks.11.attn2.to_q.bias": "0.safetensors",
+    "blocks.11.attn2.to_k.weight": "0.safetensors",
+    "blocks.11.attn2.to_k.scales": "0.safetensors",
+    "blocks.11.attn2.to_k.biases": "0.safetensors",
+    "blocks.11.attn2.to_k.bias": "0.safetensors",
+    "blocks.11.attn2.to_v.weight": "0.safetensors",
+    "blocks.11.attn2.to_v.scales": "0.safetensors",
+    "blocks.11.attn2.to_v.biases": "0.safetensors",
+    "blocks.11.attn2.to_v.bias": "0.safetensors",
+    "blocks.11.attn2.to_out.0.weight": "0.safetensors",
+    "blocks.11.attn2.to_out.0.scales": "0.safetensors",
+    "blocks.11.attn2.to_out.0.biases": "0.safetensors",
+    "blocks.11.attn2.to_out.0.bias": "0.safetensors",
+    "blocks.11.attn2.norm_q.weight": "0.safetensors",
+    "blocks.11.attn2.norm_k.weight": "0.safetensors",
+    "blocks.11.norm2.weight": "0.safetensors",
+    "blocks.11.norm2.bias": "0.safetensors",
+    "blocks.11.ffn.net.0.weight": "0.safetensors",
+    "blocks.11.ffn.net.0.scales": "0.safetensors",
+    "blocks.11.ffn.net.0.biases": "0.safetensors",
+    "blocks.11.ffn.net.0.bias": "0.safetensors",
+    "blocks.11.ffn.net.1.weight": "1.safetensors",
+    "blocks.11.ffn.net.1.scales": "1.safetensors",
+    "blocks.11.ffn.net.1.biases": "1.safetensors",
+    "blocks.11.ffn.net.1.bias": "1.safetensors",
+    "blocks.11.scale_shift_table": "1.safetensors",
+    "blocks.12.attn1.to_q.weight": "1.safetensors",
+    "blocks.12.attn1.to_q.scales": "1.safetensors",
+    "blocks.12.attn1.to_q.biases": "1.safetensors",
+    "blocks.12.attn1.to_q.bias": "1.safetensors",
+    "blocks.12.attn1.to_k.weight": "1.safetensors",
+    "blocks.12.attn1.to_k.scales": "1.safetensors",
+    "blocks.12.attn1.to_k.biases": "1.safetensors",
+    "blocks.12.attn1.to_k.bias": "1.safetensors",
+    "blocks.12.attn1.to_v.weight": "1.safetensors",
+    "blocks.12.attn1.to_v.scales": "1.safetensors",
+    "blocks.12.attn1.to_v.biases": "1.safetensors",
+    "blocks.12.attn1.to_v.bias": "1.safetensors",
+    "blocks.12.attn1.to_out.0.weight": "1.safetensors",
+    "blocks.12.attn1.to_out.0.scales": "1.safetensors",
+    "blocks.12.attn1.to_out.0.biases": "1.safetensors",
+    "blocks.12.attn1.to_out.0.bias": "1.safetensors",
+    "blocks.12.attn1.norm_q.weight": "1.safetensors",
+    "blocks.12.attn1.norm_k.weight": "1.safetensors",
+    "blocks.12.attn2.to_q.weight": "1.safetensors",
+    "blocks.12.attn2.to_q.scales": "1.safetensors",
+    "blocks.12.attn2.to_q.biases": "1.safetensors",
+    "blocks.12.attn2.to_q.bias": "1.safetensors",
+    "blocks.12.attn2.to_k.weight": "1.safetensors",
+    "blocks.12.attn2.to_k.scales": "1.safetensors",
+    "blocks.12.attn2.to_k.biases": "1.safetensors",
+    "blocks.12.attn2.to_k.bias": "1.safetensors",
+    "blocks.12.attn2.to_v.weight": "1.safetensors",
+    "blocks.12.attn2.to_v.scales": "1.safetensors",
+    "blocks.12.attn2.to_v.biases": "1.safetensors",
+    "blocks.12.attn2.to_v.bias": "1.safetensors",
+    "blocks.12.attn2.to_out.0.weight": "1.safetensors",
+    "blocks.12.attn2.to_out.0.scales": "1.safetensors",
+    "blocks.12.attn2.to_out.0.biases": "1.safetensors",
+    "blocks.12.attn2.to_out.0.bias": "1.safetensors",
+    "blocks.12.attn2.norm_q.weight": "1.safetensors",
+    "blocks.12.attn2.norm_k.weight": "1.safetensors",
+    "blocks.12.norm2.weight": "1.safetensors",
+    "blocks.12.norm2.bias": "1.safetensors",
+    "blocks.12.ffn.net.0.weight": "1.safetensors",
+    "blocks.12.ffn.net.0.scales": "1.safetensors",
+    "blocks.12.ffn.net.0.biases": "1.safetensors",
+    "blocks.12.ffn.net.0.bias": "1.safetensors",
+    "blocks.12.ffn.net.1.weight": "1.safetensors",
+    "blocks.12.ffn.net.1.scales": "1.safetensors",
+    "blocks.12.ffn.net.1.biases": "1.safetensors",
+    "blocks.12.ffn.net.1.bias": "1.safetensors",
+    "blocks.12.scale_shift_table": "1.safetensors",
+    "blocks.13.attn1.to_q.weight": "1.safetensors",
+    "blocks.13.attn1.to_q.scales": "1.safetensors",
+    "blocks.13.attn1.to_q.biases": "1.safetensors",
+    "blocks.13.attn1.to_q.bias": "1.safetensors",
+    "blocks.13.attn1.to_k.weight": "1.safetensors",
+    "blocks.13.attn1.to_k.scales": "1.safetensors",
+    "blocks.13.attn1.to_k.biases": "1.safetensors",
+    "blocks.13.attn1.to_k.bias": "1.safetensors",
+    "blocks.13.attn1.to_v.weight": "1.safetensors",
+    "blocks.13.attn1.to_v.scales": "1.safetensors",
+    "blocks.13.attn1.to_v.biases": "1.safetensors",
+    "blocks.13.attn1.to_v.bias": "1.safetensors",
+    "blocks.13.attn1.to_out.0.weight": "1.safetensors",
+    "blocks.13.attn1.to_out.0.scales": "1.safetensors",
+    "blocks.13.attn1.to_out.0.biases": "1.safetensors",
+    "blocks.13.attn1.to_out.0.bias": "1.safetensors",
+    "blocks.13.attn1.norm_q.weight": "1.safetensors",
+    "blocks.13.attn1.norm_k.weight": "1.safetensors",
+    "blocks.13.attn2.to_q.weight": "1.safetensors",
+    "blocks.13.attn2.to_q.scales": "1.safetensors",
+    "blocks.13.attn2.to_q.biases": "1.safetensors",
+    "blocks.13.attn2.to_q.bias": "1.safetensors",
+    "blocks.13.attn2.to_k.weight": "1.safetensors",
+    "blocks.13.attn2.to_k.scales": "1.safetensors",
+    "blocks.13.attn2.to_k.biases": "1.safetensors",
+    "blocks.13.attn2.to_k.bias": "1.safetensors",
+    "blocks.13.attn2.to_v.weight": "1.safetensors",
+    "blocks.13.attn2.to_v.scales": "1.safetensors",
+    "blocks.13.attn2.to_v.biases": "1.safetensors",
+    "blocks.13.attn2.to_v.bias": "1.safetensors",
+    "blocks.13.attn2.to_out.0.weight": "1.safetensors",
+    "blocks.13.attn2.to_out.0.scales": "1.safetensors",
+    "blocks.13.attn2.to_out.0.biases": "1.safetensors",
+    "blocks.13.attn2.to_out.0.bias": "1.safetensors",
+    "blocks.13.attn2.norm_q.weight": "1.safetensors",
+    "blocks.13.attn2.norm_k.weight": "1.safetensors",
+    "blocks.13.norm2.weight": "1.safetensors",
+    "blocks.13.norm2.bias": "1.safetensors",
+    "blocks.13.ffn.net.0.weight": "1.safetensors",
+    "blocks.13.ffn.net.0.scales": "1.safetensors",
+    "blocks.13.ffn.net.0.biases": "1.safetensors",
+    "blocks.13.ffn.net.0.bias": "1.safetensors",
+    "blocks.13.ffn.net.1.weight": "1.safetensors",
+    "blocks.13.ffn.net.1.scales": "1.safetensors",
+    "blocks.13.ffn.net.1.biases": "1.safetensors",
+    "blocks.13.ffn.net.1.bias": "1.safetensors",
+    "blocks.13.scale_shift_table": "1.safetensors",
+    "blocks.14.attn1.to_q.weight": "1.safetensors",
+    "blocks.14.attn1.to_q.scales": "1.safetensors",
+    "blocks.14.attn1.to_q.biases": "1.safetensors",
+    "blocks.14.attn1.to_q.bias": "1.safetensors",
+    "blocks.14.attn1.to_k.weight": "1.safetensors",
+    "blocks.14.attn1.to_k.scales": "1.safetensors",
+    "blocks.14.attn1.to_k.biases": "1.safetensors",
+    "blocks.14.attn1.to_k.bias": "1.safetensors",
+    "blocks.14.attn1.to_v.weight": "1.safetensors",
+    "blocks.14.attn1.to_v.scales": "1.safetensors",
+    "blocks.14.attn1.to_v.biases": "1.safetensors",
+    "blocks.14.attn1.to_v.bias": "1.safetensors",
+    "blocks.14.attn1.to_out.0.weight": "1.safetensors",
+    "blocks.14.attn1.to_out.0.scales": "1.safetensors",
+    "blocks.14.attn1.to_out.0.biases": "1.safetensors",
+    "blocks.14.attn1.to_out.0.bias": "1.safetensors",
+    "blocks.14.attn1.norm_q.weight": "1.safetensors",
+    "blocks.14.attn1.norm_k.weight": "1.safetensors",
+    "blocks.14.attn2.to_q.weight": "1.safetensors",
+    "blocks.14.attn2.to_q.scales": "1.safetensors",
+    "blocks.14.attn2.to_q.biases": "1.safetensors",
+    "blocks.14.attn2.to_q.bias": "1.safetensors",
+    "blocks.14.attn2.to_k.weight": "1.safetensors",
+    "blocks.14.attn2.to_k.scales": "1.safetensors",
+    "blocks.14.attn2.to_k.biases": "1.safetensors",
+    "blocks.14.attn2.to_k.bias": "1.safetensors",
+    "blocks.14.attn2.to_v.weight": "1.safetensors",
+    "blocks.14.attn2.to_v.scales": "1.safetensors",
+    "blocks.14.attn2.to_v.biases": "1.safetensors",
+    "blocks.14.attn2.to_v.bias": "1.safetensors",
+    "blocks.14.attn2.to_out.0.weight": "1.safetensors",
+    "blocks.14.attn2.to_out.0.scales": "1.safetensors",
+    "blocks.14.attn2.to_out.0.biases": "1.safetensors",
+    "blocks.14.attn2.to_out.0.bias": "1.safetensors",
+    "blocks.14.attn2.norm_q.weight": "1.safetensors",
+    "blocks.14.attn2.norm_k.weight": "1.safetensors",
+    "blocks.14.norm2.weight": "1.safetensors",
+    "blocks.14.norm2.bias": "1.safetensors",
+    "blocks.14.ffn.net.0.weight": "1.safetensors",
+    "blocks.14.ffn.net.0.scales": "1.safetensors",
+    "blocks.14.ffn.net.0.biases": "1.safetensors",
+    "blocks.14.ffn.net.0.bias": "1.safetensors",
+    "blocks.14.ffn.net.1.weight": "1.safetensors",
+    "blocks.14.ffn.net.1.scales": "1.safetensors",
+    "blocks.14.ffn.net.1.biases": "1.safetensors",
+    "blocks.14.ffn.net.1.bias": "1.safetensors",
+    "blocks.14.scale_shift_table": "1.safetensors",
+    "blocks.15.attn1.to_q.weight": "1.safetensors",
+    "blocks.15.attn1.to_q.scales": "1.safetensors",
+    "blocks.15.attn1.to_q.biases": "1.safetensors",
+    "blocks.15.attn1.to_q.bias": "1.safetensors",
+    "blocks.15.attn1.to_k.weight": "1.safetensors",
+    "blocks.15.attn1.to_k.scales": "1.safetensors",
+    "blocks.15.attn1.to_k.biases": "1.safetensors",
+    "blocks.15.attn1.to_k.bias": "1.safetensors",
+    "blocks.15.attn1.to_v.weight": "1.safetensors",
+    "blocks.15.attn1.to_v.scales": "1.safetensors",
+    "blocks.15.attn1.to_v.biases": "1.safetensors",
+    "blocks.15.attn1.to_v.bias": "1.safetensors",
+    "blocks.15.attn1.to_out.0.weight": "1.safetensors",
+    "blocks.15.attn1.to_out.0.scales": "1.safetensors",
+    "blocks.15.attn1.to_out.0.biases": "1.safetensors",
+    "blocks.15.attn1.to_out.0.bias": "1.safetensors",
+    "blocks.15.attn1.norm_q.weight": "1.safetensors",
+    "blocks.15.attn1.norm_k.weight": "1.safetensors",
+    "blocks.15.attn2.to_q.weight": "1.safetensors",
+    "blocks.15.attn2.to_q.scales": "1.safetensors",
+    "blocks.15.attn2.to_q.biases": "1.safetensors",
+    "blocks.15.attn2.to_q.bias": "1.safetensors",
+    "blocks.15.attn2.to_k.weight": "1.safetensors",
+    "blocks.15.attn2.to_k.scales": "1.safetensors",
+    "blocks.15.attn2.to_k.biases": "1.safetensors",
+    "blocks.15.attn2.to_k.bias": "1.safetensors",
+    "blocks.15.attn2.to_v.weight": "1.safetensors",
+    "blocks.15.attn2.to_v.scales": "1.safetensors",
+    "blocks.15.attn2.to_v.biases": "1.safetensors",
+    "blocks.15.attn2.to_v.bias": "1.safetensors",
+    "blocks.15.attn2.to_out.0.weight": "1.safetensors",
+    "blocks.15.attn2.to_out.0.scales": "1.safetensors",
+    "blocks.15.attn2.to_out.0.biases": "1.safetensors",
+    "blocks.15.attn2.to_out.0.bias": "1.safetensors",
+    "blocks.15.attn2.norm_q.weight": "1.safetensors",
+    "blocks.15.attn2.norm_k.weight": "1.safetensors",
+    "blocks.15.norm2.weight": "1.safetensors",
+    "blocks.15.norm2.bias": "1.safetensors",
+    "blocks.15.ffn.net.0.weight": "1.safetensors",
+    "blocks.15.ffn.net.0.scales": "1.safetensors",
+    "blocks.15.ffn.net.0.biases": "1.safetensors",
+    "blocks.15.ffn.net.0.bias": "1.safetensors",
+    "blocks.15.ffn.net.1.weight": "1.safetensors",
+    "blocks.15.ffn.net.1.scales": "1.safetensors",
+    "blocks.15.ffn.net.1.biases": "1.safetensors",
+    "blocks.15.ffn.net.1.bias": "1.safetensors",
+    "blocks.15.scale_shift_table": "1.safetensors",
+    "blocks.16.attn1.to_q.weight": "1.safetensors",
+    "blocks.16.attn1.to_q.scales": "1.safetensors",
+    "blocks.16.attn1.to_q.biases": "1.safetensors",
+    "blocks.16.attn1.to_q.bias": "1.safetensors",
+    "blocks.16.attn1.to_k.weight": "1.safetensors",
+    "blocks.16.attn1.to_k.scales": "1.safetensors",
+    "blocks.16.attn1.to_k.biases": "1.safetensors",
+    "blocks.16.attn1.to_k.bias": "1.safetensors",
+    "blocks.16.attn1.to_v.weight": "1.safetensors",
+    "blocks.16.attn1.to_v.scales": "1.safetensors",
+    "blocks.16.attn1.to_v.biases": "1.safetensors",
+    "blocks.16.attn1.to_v.bias": "1.safetensors",
+    "blocks.16.attn1.to_out.0.weight": "1.safetensors",
+    "blocks.16.attn1.to_out.0.scales": "1.safetensors",
+    "blocks.16.attn1.to_out.0.biases": "1.safetensors",
+    "blocks.16.attn1.to_out.0.bias": "1.safetensors",
+    "blocks.16.attn1.norm_q.weight": "1.safetensors",
+    "blocks.16.attn1.norm_k.weight": "1.safetensors",
+    "blocks.16.attn2.to_q.weight": "1.safetensors",
+    "blocks.16.attn2.to_q.scales": "1.safetensors",
+    "blocks.16.attn2.to_q.biases": "1.safetensors",
+    "blocks.16.attn2.to_q.bias": "1.safetensors",
+    "blocks.16.attn2.to_k.weight": "1.safetensors",
+    "blocks.16.attn2.to_k.scales": "1.safetensors",
+    "blocks.16.attn2.to_k.biases": "1.safetensors",
+    "blocks.16.attn2.to_k.bias": "1.safetensors",
+    "blocks.16.attn2.to_v.weight": "1.safetensors",
+    "blocks.16.attn2.to_v.scales": "1.safetensors",
+    "blocks.16.attn2.to_v.biases": "1.safetensors",
+    "blocks.16.attn2.to_v.bias": "1.safetensors",
+    "blocks.16.attn2.to_out.0.weight": "1.safetensors",
+    "blocks.16.attn2.to_out.0.scales": "1.safetensors",
+    "blocks.16.attn2.to_out.0.biases": "1.safetensors",
+    "blocks.16.attn2.to_out.0.bias": "1.safetensors",
+    "blocks.16.attn2.norm_q.weight": "1.safetensors",
+    "blocks.16.attn2.norm_k.weight": "1.safetensors",
+    "blocks.16.norm2.weight": "1.safetensors",
+    "blocks.16.norm2.bias": "1.safetensors",
+    "blocks.16.ffn.net.0.weight": "1.safetensors",
+    "blocks.16.ffn.net.0.scales": "1.safetensors",
+    "blocks.16.ffn.net.0.biases": "1.safetensors",
+    "blocks.16.ffn.net.0.bias": "1.safetensors",
+    "blocks.16.ffn.net.1.weight": "1.safetensors",
+    "blocks.16.ffn.net.1.scales": "1.safetensors",
+    "blocks.16.ffn.net.1.biases": "1.safetensors",
+    "blocks.16.ffn.net.1.bias": "1.safetensors",
+    "blocks.16.scale_shift_table": "1.safetensors",
+    "blocks.17.attn1.to_q.weight": "1.safetensors",
+    "blocks.17.attn1.to_q.scales": "1.safetensors",
+    "blocks.17.attn1.to_q.biases": "1.safetensors",
+    "blocks.17.attn1.to_q.bias": "1.safetensors",
+    "blocks.17.attn1.to_k.weight": "1.safetensors",
+    "blocks.17.attn1.to_k.scales": "1.safetensors",
+    "blocks.17.attn1.to_k.biases": "1.safetensors",
+    "blocks.17.attn1.to_k.bias": "1.safetensors",
+    "blocks.17.attn1.to_v.weight": "1.safetensors",
+    "blocks.17.attn1.to_v.scales": "1.safetensors",
+    "blocks.17.attn1.to_v.biases": "1.safetensors",
+    "blocks.17.attn1.to_v.bias": "1.safetensors",
+    "blocks.17.attn1.to_out.0.weight": "1.safetensors",
+    "blocks.17.attn1.to_out.0.scales": "1.safetensors",
+    "blocks.17.attn1.to_out.0.biases": "1.safetensors",
+    "blocks.17.attn1.to_out.0.bias": "1.safetensors",
+    "blocks.17.attn1.norm_q.weight": "1.safetensors",
+    "blocks.17.attn1.norm_k.weight": "1.safetensors",
+    "blocks.17.attn2.to_q.weight": "1.safetensors",
+    "blocks.17.attn2.to_q.scales": "1.safetensors",
+    "blocks.17.attn2.to_q.biases": "1.safetensors",
+    "blocks.17.attn2.to_q.bias": "1.safetensors",
+    "blocks.17.attn2.to_k.weight": "1.safetensors",
+    "blocks.17.attn2.to_k.scales": "1.safetensors",
+    "blocks.17.attn2.to_k.biases": "1.safetensors",
+    "blocks.17.attn2.to_k.bias": "1.safetensors",
+    "blocks.17.attn2.to_v.weight": "1.safetensors",
+    "blocks.17.attn2.to_v.scales": "1.safetensors",
+    "blocks.17.attn2.to_v.biases": "1.safetensors",
+    "blocks.17.attn2.to_v.bias": "1.safetensors",
+    "blocks.17.attn2.to_out.0.weight": "1.safetensors",
+    "blocks.17.attn2.to_out.0.scales": "1.safetensors",
+    "blocks.17.attn2.to_out.0.biases": "1.safetensors",
+    "blocks.17.attn2.to_out.0.bias": "1.safetensors",
+    "blocks.17.attn2.norm_q.weight": "1.safetensors",
+    "blocks.17.attn2.norm_k.weight": "1.safetensors",
+    "blocks.17.norm2.weight": "1.safetensors",
+    "blocks.17.norm2.bias": "1.safetensors",
+    "blocks.17.ffn.net.0.weight": "1.safetensors",
+    "blocks.17.ffn.net.0.scales": "1.safetensors",
+    "blocks.17.ffn.net.0.biases": "1.safetensors",
+    "blocks.17.ffn.net.0.bias": "1.safetensors",
+    "blocks.17.ffn.net.1.weight": "1.safetensors",
+    "blocks.17.ffn.net.1.scales": "1.safetensors",
+    "blocks.17.ffn.net.1.biases": "1.safetensors",
+    "blocks.17.ffn.net.1.bias": "1.safetensors",
+    "blocks.17.scale_shift_table": "1.safetensors",
+    "blocks.18.attn1.to_q.weight": "1.safetensors",
+    "blocks.18.attn1.to_q.scales": "1.safetensors",
+    "blocks.18.attn1.to_q.biases": "1.safetensors",
+    "blocks.18.attn1.to_q.bias": "1.safetensors",
+    "blocks.18.attn1.to_k.weight": "1.safetensors",
+    "blocks.18.attn1.to_k.scales": "1.safetensors",
+    "blocks.18.attn1.to_k.biases": "1.safetensors",
+    "blocks.18.attn1.to_k.bias": "1.safetensors",
+    "blocks.18.attn1.to_v.weight": "1.safetensors",
+    "blocks.18.attn1.to_v.scales": "1.safetensors",
+    "blocks.18.attn1.to_v.biases": "1.safetensors",
+    "blocks.18.attn1.to_v.bias": "1.safetensors",
+    "blocks.18.attn1.to_out.0.weight": "1.safetensors",
+    "blocks.18.attn1.to_out.0.scales": "1.safetensors",
+    "blocks.18.attn1.to_out.0.biases": "1.safetensors",
+    "blocks.18.attn1.to_out.0.bias": "1.safetensors",
+    "blocks.18.attn1.norm_q.weight": "1.safetensors",
+    "blocks.18.attn1.norm_k.weight": "1.safetensors",
+    "blocks.18.attn2.to_q.weight": "1.safetensors",
+    "blocks.18.attn2.to_q.scales": "1.safetensors",
+    "blocks.18.attn2.to_q.biases": "1.safetensors",
+    "blocks.18.attn2.to_q.bias": "1.safetensors",
+    "blocks.18.attn2.to_k.weight": "1.safetensors",
+    "blocks.18.attn2.to_k.scales": "1.safetensors",
+    "blocks.18.attn2.to_k.biases": "1.safetensors",
+    "blocks.18.attn2.to_k.bias": "1.safetensors",
+    "blocks.18.attn2.to_v.weight": "1.safetensors",
+    "blocks.18.attn2.to_v.scales": "1.safetensors",
+    "blocks.18.attn2.to_v.biases": "1.safetensors",
+    "blocks.18.attn2.to_v.bias": "1.safetensors",
+    "blocks.18.attn2.to_out.0.weight": "1.safetensors",
+    "blocks.18.attn2.to_out.0.scales": "1.safetensors",
+    "blocks.18.attn2.to_out.0.biases": "1.safetensors",
+    "blocks.18.attn2.to_out.0.bias": "1.safetensors",
+    "blocks.18.attn2.norm_q.weight": "1.safetensors",
+    "blocks.18.attn2.norm_k.weight": "1.safetensors",
+    "blocks.18.norm2.weight": "1.safetensors",
+    "blocks.18.norm2.bias": "1.safetensors",
+    "blocks.18.ffn.net.0.weight": "1.safetensors",
+    "blocks.18.ffn.net.0.scales": "1.safetensors",
+    "blocks.18.ffn.net.0.biases": "1.safetensors",
+    "blocks.18.ffn.net.0.bias": "1.safetensors",
+    "blocks.18.ffn.net.1.weight": "1.safetensors",
+    "blocks.18.ffn.net.1.scales": "1.safetensors",
+    "blocks.18.ffn.net.1.biases": "1.safetensors",
+    "blocks.18.ffn.net.1.bias": "1.safetensors",
+    "blocks.18.scale_shift_table": "1.safetensors",
+    "blocks.19.attn1.to_q.weight": "1.safetensors",
+    "blocks.19.attn1.to_q.scales": "1.safetensors",
+    "blocks.19.attn1.to_q.biases": "1.safetensors",
+    "blocks.19.attn1.to_q.bias": "1.safetensors",
+    "blocks.19.attn1.to_k.weight": "1.safetensors",
+    "blocks.19.attn1.to_k.scales": "1.safetensors",
+    "blocks.19.attn1.to_k.biases": "1.safetensors",
+    "blocks.19.attn1.to_k.bias": "1.safetensors",
+    "blocks.19.attn1.to_v.weight": "1.safetensors",
+    "blocks.19.attn1.to_v.scales": "1.safetensors",
+    "blocks.19.attn1.to_v.biases": "1.safetensors",
+    "blocks.19.attn1.to_v.bias": "1.safetensors",
+    "blocks.19.attn1.to_out.0.weight": "1.safetensors",
+    "blocks.19.attn1.to_out.0.scales": "1.safetensors",
+    "blocks.19.attn1.to_out.0.biases": "1.safetensors",
+    "blocks.19.attn1.to_out.0.bias": "1.safetensors",
+    "blocks.19.attn1.norm_q.weight": "1.safetensors",
+    "blocks.19.attn1.norm_k.weight": "1.safetensors",
+    "blocks.19.attn2.to_q.weight": "1.safetensors",
+    "blocks.19.attn2.to_q.scales": "1.safetensors",
+    "blocks.19.attn2.to_q.biases": "1.safetensors",
+    "blocks.19.attn2.to_q.bias": "1.safetensors",
+    "blocks.19.attn2.to_k.weight": "1.safetensors",
+    "blocks.19.attn2.to_k.scales": "1.safetensors",
+    "blocks.19.attn2.to_k.biases": "1.safetensors",
+    "blocks.19.attn2.to_k.bias": "1.safetensors",
+    "blocks.19.attn2.to_v.weight": "1.safetensors",
+    "blocks.19.attn2.to_v.scales": "1.safetensors",
+    "blocks.19.attn2.to_v.biases": "1.safetensors",
+    "blocks.19.attn2.to_v.bias": "1.safetensors",
+    "blocks.19.attn2.to_out.0.weight": "1.safetensors",
+    "blocks.19.attn2.to_out.0.scales": "1.safetensors",
+    "blocks.19.attn2.to_out.0.biases": "1.safetensors",
+    "blocks.19.attn2.to_out.0.bias": "1.safetensors",
+    "blocks.19.attn2.norm_q.weight": "1.safetensors",
+    "blocks.19.attn2.norm_k.weight": "1.safetensors",
+    "blocks.19.norm2.weight": "1.safetensors",
+    "blocks.19.norm2.bias": "1.safetensors",
+    "blocks.19.ffn.net.0.weight": "1.safetensors",
+    "blocks.19.ffn.net.0.scales": "1.safetensors",
+    "blocks.19.ffn.net.0.biases": "1.safetensors",
+    "blocks.19.ffn.net.0.bias": "1.safetensors",
+    "blocks.19.ffn.net.1.weight": "1.safetensors",
+    "blocks.19.ffn.net.1.scales": "1.safetensors",
+    "blocks.19.ffn.net.1.biases": "1.safetensors",
+    "blocks.19.ffn.net.1.bias": "1.safetensors",
+    "blocks.19.scale_shift_table": "1.safetensors",
+    "blocks.20.attn1.to_q.weight": "1.safetensors",
+    "blocks.20.attn1.to_q.scales": "1.safetensors",
+    "blocks.20.attn1.to_q.biases": "1.safetensors",
+    "blocks.20.attn1.to_q.bias": "1.safetensors",
+    "blocks.20.attn1.to_k.weight": "1.safetensors",
+    "blocks.20.attn1.to_k.scales": "1.safetensors",
+    "blocks.20.attn1.to_k.biases": "1.safetensors",
+    "blocks.20.attn1.to_k.bias": "1.safetensors",
+    "blocks.20.attn1.to_v.weight": "1.safetensors",
+    "blocks.20.attn1.to_v.scales": "1.safetensors",
+    "blocks.20.attn1.to_v.biases": "1.safetensors",
+    "blocks.20.attn1.to_v.bias": "1.safetensors",
+    "blocks.20.attn1.to_out.0.weight": "1.safetensors",
+    "blocks.20.attn1.to_out.0.scales": "1.safetensors",
+    "blocks.20.attn1.to_out.0.biases": "1.safetensors",
+    "blocks.20.attn1.to_out.0.bias": "1.safetensors",
+    "blocks.20.attn1.norm_q.weight": "1.safetensors",
+    "blocks.20.attn1.norm_k.weight": "1.safetensors",
+    "blocks.20.attn2.to_q.weight": "1.safetensors",
+    "blocks.20.attn2.to_q.scales": "1.safetensors",
+    "blocks.20.attn2.to_q.biases": "1.safetensors",
+    "blocks.20.attn2.to_q.bias": "1.safetensors",
+    "blocks.20.attn2.to_k.weight": "1.safetensors",
+    "blocks.20.attn2.to_k.scales": "1.safetensors",
+    "blocks.20.attn2.to_k.biases": "1.safetensors",
+    "blocks.20.attn2.to_k.bias": "1.safetensors",
+    "blocks.20.attn2.to_v.weight": "1.safetensors",
+    "blocks.20.attn2.to_v.scales": "1.safetensors",
+    "blocks.20.attn2.to_v.biases": "1.safetensors",
+    "blocks.20.attn2.to_v.bias": "1.safetensors",
+    "blocks.20.attn2.to_out.0.weight": "1.safetensors",
+    "blocks.20.attn2.to_out.0.scales": "1.safetensors",
+    "blocks.20.attn2.to_out.0.biases": "1.safetensors",
+    "blocks.20.attn2.to_out.0.bias": "1.safetensors",
+    "blocks.20.attn2.norm_q.weight": "1.safetensors",
+    "blocks.20.attn2.norm_k.weight": "1.safetensors",
+    "blocks.20.norm2.weight": "1.safetensors",
+    "blocks.20.norm2.bias": "1.safetensors",
+    "blocks.20.ffn.net.0.weight": "1.safetensors",
+    "blocks.20.ffn.net.0.scales": "1.safetensors",
+    "blocks.20.ffn.net.0.biases": "1.safetensors",
+    "blocks.20.ffn.net.0.bias": "1.safetensors",
+    "blocks.20.ffn.net.1.weight": "1.safetensors",
+    "blocks.20.ffn.net.1.scales": "1.safetensors",
+    "blocks.20.ffn.net.1.biases": "1.safetensors",
+    "blocks.20.ffn.net.1.bias": "1.safetensors",
+    "blocks.20.scale_shift_table": "1.safetensors",
+    "blocks.21.attn1.to_q.weight": "1.safetensors",
+    "blocks.21.attn1.to_q.scales": "1.safetensors",
+    "blocks.21.attn1.to_q.biases": "1.safetensors",
+    "blocks.21.attn1.to_q.bias": "1.safetensors",
+    "blocks.21.attn1.to_k.weight": "1.safetensors",
+    "blocks.21.attn1.to_k.scales": "1.safetensors",
+    "blocks.21.attn1.to_k.biases": "1.safetensors",
+    "blocks.21.attn1.to_k.bias": "1.safetensors",
+    "blocks.21.attn1.to_v.weight": "1.safetensors",
+    "blocks.21.attn1.to_v.scales": "1.safetensors",
+    "blocks.21.attn1.to_v.biases": "1.safetensors",
+    "blocks.21.attn1.to_v.bias": "1.safetensors",
+    "blocks.21.attn1.to_out.0.weight": "1.safetensors",
+    "blocks.21.attn1.to_out.0.scales": "1.safetensors",
+    "blocks.21.attn1.to_out.0.biases": "1.safetensors",
+    "blocks.21.attn1.to_out.0.bias": "1.safetensors",
+    "blocks.21.attn1.norm_q.weight": "1.safetensors",
+    "blocks.21.attn1.norm_k.weight": "1.safetensors",
+    "blocks.21.attn2.to_q.weight": "1.safetensors",
+    "blocks.21.attn2.to_q.scales": "1.safetensors",
+    "blocks.21.attn2.to_q.biases": "1.safetensors",
+    "blocks.21.attn2.to_q.bias": "1.safetensors",
+    "blocks.21.attn2.to_k.weight": "1.safetensors",
+    "blocks.21.attn2.to_k.scales": "1.safetensors",
+    "blocks.21.attn2.to_k.biases": "1.safetensors",
+    "blocks.21.attn2.to_k.bias": "1.safetensors",
+    "blocks.21.attn2.to_v.weight": "1.safetensors",
+    "blocks.21.attn2.to_v.scales": "1.safetensors",
+    "blocks.21.attn2.to_v.biases": "1.safetensors",
+    "blocks.21.attn2.to_v.bias": "1.safetensors",
+    "blocks.21.attn2.to_out.0.weight": "1.safetensors",
+    "blocks.21.attn2.to_out.0.scales": "1.safetensors",
+    "blocks.21.attn2.to_out.0.biases": "1.safetensors",
+    "blocks.21.attn2.to_out.0.bias": "1.safetensors",
+    "blocks.21.attn2.norm_q.weight": "1.safetensors",
+    "blocks.21.attn2.norm_k.weight": "1.safetensors",
+    "blocks.21.norm2.weight": "1.safetensors",
+    "blocks.21.norm2.bias": "1.safetensors",
+    "blocks.21.ffn.net.0.weight": "1.safetensors",
+    "blocks.21.ffn.net.0.scales": "1.safetensors",
+    "blocks.21.ffn.net.0.biases": "1.safetensors",
+    "blocks.21.ffn.net.0.bias": "1.safetensors",
+    "blocks.21.ffn.net.1.weight": "1.safetensors",
+    "blocks.21.ffn.net.1.scales": "1.safetensors",
+    "blocks.21.ffn.net.1.biases": "1.safetensors",
+    "blocks.21.ffn.net.1.bias": "1.safetensors",
+    "blocks.21.scale_shift_table": "1.safetensors",
+    "blocks.22.attn1.to_q.weight": "1.safetensors",
+    "blocks.22.attn1.to_q.scales": "1.safetensors",
+    "blocks.22.attn1.to_q.biases": "1.safetensors",
+    "blocks.22.attn1.to_q.bias": "1.safetensors",
+    "blocks.22.attn1.to_k.weight": "1.safetensors",
+    "blocks.22.attn1.to_k.scales": "1.safetensors",
+    "blocks.22.attn1.to_k.biases": "1.safetensors",
+    "blocks.22.attn1.to_k.bias": "1.safetensors",
+    "blocks.22.attn1.to_v.weight": "1.safetensors",
+    "blocks.22.attn1.to_v.scales": "1.safetensors",
+    "blocks.22.attn1.to_v.biases": "1.safetensors",
+    "blocks.22.attn1.to_v.bias": "1.safetensors",
+    "blocks.22.attn1.to_out.0.weight": "1.safetensors",
+    "blocks.22.attn1.to_out.0.scales": "1.safetensors",
+    "blocks.22.attn1.to_out.0.biases": "1.safetensors",
+    "blocks.22.attn1.to_out.0.bias": "1.safetensors",
+    "blocks.22.attn1.norm_q.weight": "1.safetensors",
+    "blocks.22.attn1.norm_k.weight": "1.safetensors",
+    "blocks.22.attn2.to_q.weight": "1.safetensors",
+    "blocks.22.attn2.to_q.scales": "1.safetensors",
+    "blocks.22.attn2.to_q.biases": "1.safetensors",
+    "blocks.22.attn2.to_q.bias": "1.safetensors",
+    "blocks.22.attn2.to_k.weight": "1.safetensors",
+    "blocks.22.attn2.to_k.scales": "1.safetensors",
+    "blocks.22.attn2.to_k.biases": "1.safetensors",
+    "blocks.22.attn2.to_k.bias": "1.safetensors",
+    "blocks.22.attn2.to_v.weight": "1.safetensors",
+    "blocks.22.attn2.to_v.scales": "1.safetensors",
+    "blocks.22.attn2.to_v.biases": "1.safetensors",
+    "blocks.22.attn2.to_v.bias": "1.safetensors",
+    "blocks.22.attn2.to_out.0.weight": "1.safetensors",
+    "blocks.22.attn2.to_out.0.scales": "1.safetensors",
+    "blocks.22.attn2.to_out.0.biases": "1.safetensors",
+    "blocks.22.attn2.to_out.0.bias": "1.safetensors",
+    "blocks.22.attn2.norm_q.weight": "1.safetensors",
+    "blocks.22.attn2.norm_k.weight": "1.safetensors",
+    "blocks.22.norm2.weight": "1.safetensors",
+    "blocks.22.norm2.bias": "1.safetensors",
+    "blocks.22.ffn.net.0.weight": "1.safetensors",
+    "blocks.22.ffn.net.0.scales": "1.safetensors",
+    "blocks.22.ffn.net.0.biases": "1.safetensors",
+    "blocks.22.ffn.net.0.bias": "1.safetensors",
+    "blocks.22.ffn.net.1.weight": "1.safetensors",
+    "blocks.22.ffn.net.1.scales": "1.safetensors",
+    "blocks.22.ffn.net.1.biases": "1.safetensors",
+    "blocks.22.ffn.net.1.bias": "1.safetensors",
+    "blocks.22.scale_shift_table": "1.safetensors",
+    "blocks.23.attn1.to_q.weight": "1.safetensors",
+    "blocks.23.attn1.to_q.scales": "1.safetensors",
+    "blocks.23.attn1.to_q.biases": "1.safetensors",
+    "blocks.23.attn1.to_q.bias": "1.safetensors",
+    "blocks.23.attn1.to_k.weight": "1.safetensors",
+    "blocks.23.attn1.to_k.scales": "1.safetensors",
+    "blocks.23.attn1.to_k.biases": "1.safetensors",
+    "blocks.23.attn1.to_k.bias": "1.safetensors",
+    "blocks.23.attn1.to_v.weight": "1.safetensors",
+    "blocks.23.attn1.to_v.scales": "1.safetensors",
+    "blocks.23.attn1.to_v.biases": "1.safetensors",
+    "blocks.23.attn1.to_v.bias": "1.safetensors",
+    "blocks.23.attn1.to_out.0.weight": "1.safetensors",
+    "blocks.23.attn1.to_out.0.scales": "1.safetensors",
+    "blocks.23.attn1.to_out.0.biases": "1.safetensors",
+    "blocks.23.attn1.to_out.0.bias": "1.safetensors",
+    "blocks.23.attn1.norm_q.weight": "1.safetensors",
+    "blocks.23.attn1.norm_k.weight": "1.safetensors",
+    "blocks.23.attn2.to_q.weight": "1.safetensors",
+    "blocks.23.attn2.to_q.scales": "1.safetensors",
+    "blocks.23.attn2.to_q.biases": "1.safetensors",
+    "blocks.23.attn2.to_q.bias": "1.safetensors",
+    "blocks.23.attn2.to_k.weight": "1.safetensors",
+    "blocks.23.attn2.to_k.scales": "1.safetensors",
+    "blocks.23.attn2.to_k.biases": "1.safetensors",
+    "blocks.23.attn2.to_k.bias": "1.safetensors",
+    "blocks.23.attn2.to_v.weight": "1.safetensors",
+    "blocks.23.attn2.to_v.scales": "1.safetensors",
+    "blocks.23.attn2.to_v.biases": "1.safetensors",
+    "blocks.23.attn2.to_v.bias": "1.safetensors",
+    "blocks.23.attn2.to_out.0.weight": "1.safetensors",
+    "blocks.23.attn2.to_out.0.scales": "1.safetensors",
+    "blocks.23.attn2.to_out.0.biases": "1.safetensors",
+    "blocks.23.attn2.to_out.0.bias": "1.safetensors",
+    "blocks.23.attn2.norm_q.weight": "1.safetensors",
+    "blocks.23.attn2.norm_k.weight": "1.safetensors",
+    "blocks.23.norm2.weight": "1.safetensors",
+    "blocks.23.norm2.bias": "1.safetensors",
+    "blocks.23.ffn.net.0.weight": "1.safetensors",
+    "blocks.23.ffn.net.0.scales": "1.safetensors",
+    "blocks.23.ffn.net.0.biases": "1.safetensors",
+    "blocks.23.ffn.net.0.bias": "1.safetensors",
+    "blocks.23.ffn.net.1.weight": "1.safetensors",
+    "blocks.23.ffn.net.1.scales": "1.safetensors",
+    "blocks.23.ffn.net.1.biases": "1.safetensors",
+    "blocks.23.ffn.net.1.bias": "1.safetensors",
+    "blocks.23.scale_shift_table": "1.safetensors",
+    "blocks.24.attn1.to_q.weight": "1.safetensors",
+    "blocks.24.attn1.to_q.scales": "1.safetensors",
+    "blocks.24.attn1.to_q.biases": "1.safetensors",
+    "blocks.24.attn1.to_q.bias": "1.safetensors",
+    "blocks.24.attn1.to_k.weight": "2.safetensors",
+    "blocks.24.attn1.to_k.scales": "2.safetensors",
+    "blocks.24.attn1.to_k.biases": "2.safetensors",
+    "blocks.24.attn1.to_k.bias": "2.safetensors",
+    "blocks.24.attn1.to_v.weight": "2.safetensors",
+    "blocks.24.attn1.to_v.scales": "2.safetensors",
+    "blocks.24.attn1.to_v.biases": "2.safetensors",
+    "blocks.24.attn1.to_v.bias": "2.safetensors",
+    "blocks.24.attn1.to_out.0.weight": "2.safetensors",
+    "blocks.24.attn1.to_out.0.scales": "2.safetensors",
+    "blocks.24.attn1.to_out.0.biases": "2.safetensors",
+    "blocks.24.attn1.to_out.0.bias": "2.safetensors",
+    "blocks.24.attn1.norm_q.weight": "2.safetensors",
+    "blocks.24.attn1.norm_k.weight": "2.safetensors",
+    "blocks.24.attn2.to_q.weight": "2.safetensors",
+    "blocks.24.attn2.to_q.scales": "2.safetensors",
+    "blocks.24.attn2.to_q.biases": "2.safetensors",
+    "blocks.24.attn2.to_q.bias": "2.safetensors",
+    "blocks.24.attn2.to_k.weight": "2.safetensors",
+    "blocks.24.attn2.to_k.scales": "2.safetensors",
+    "blocks.24.attn2.to_k.biases": "2.safetensors",
+    "blocks.24.attn2.to_k.bias": "2.safetensors",
+    "blocks.24.attn2.to_v.weight": "2.safetensors",
+    "blocks.24.attn2.to_v.scales": "2.safetensors",
+    "blocks.24.attn2.to_v.biases": "2.safetensors",
+    "blocks.24.attn2.to_v.bias": "2.safetensors",
+    "blocks.24.attn2.to_out.0.weight": "2.safetensors",
+    "blocks.24.attn2.to_out.0.scales": "2.safetensors",
+    "blocks.24.attn2.to_out.0.biases": "2.safetensors",
+    "blocks.24.attn2.to_out.0.bias": "2.safetensors",
+    "blocks.24.attn2.norm_q.weight": "2.safetensors",
+    "blocks.24.attn2.norm_k.weight": "2.safetensors",
+    "blocks.24.norm2.weight": "2.safetensors",
+    "blocks.24.norm2.bias": "2.safetensors",
+    "blocks.24.ffn.net.0.weight": "2.safetensors",
+    "blocks.24.ffn.net.0.scales": "2.safetensors",
+    "blocks.24.ffn.net.0.biases": "2.safetensors",
+    "blocks.24.ffn.net.0.bias": "2.safetensors",
+    "blocks.24.ffn.net.1.weight": "2.safetensors",
+    "blocks.24.ffn.net.1.scales": "2.safetensors",
+    "blocks.24.ffn.net.1.biases": "2.safetensors",
+    "blocks.24.ffn.net.1.bias": "2.safetensors",
+    "blocks.24.scale_shift_table": "2.safetensors",
+    "blocks.25.attn1.to_q.weight": "2.safetensors",
+    "blocks.25.attn1.to_q.scales": "2.safetensors",
+    "blocks.25.attn1.to_q.biases": "2.safetensors",
+    "blocks.25.attn1.to_q.bias": "2.safetensors",
+    "blocks.25.attn1.to_k.weight": "2.safetensors",
+    "blocks.25.attn1.to_k.scales": "2.safetensors",
+    "blocks.25.attn1.to_k.biases": "2.safetensors",
+    "blocks.25.attn1.to_k.bias": "2.safetensors",
+    "blocks.25.attn1.to_v.weight": "2.safetensors",
+    "blocks.25.attn1.to_v.scales": "2.safetensors",
+    "blocks.25.attn1.to_v.biases": "2.safetensors",
+    "blocks.25.attn1.to_v.bias": "2.safetensors",
+    "blocks.25.attn1.to_out.0.weight": "2.safetensors",
+    "blocks.25.attn1.to_out.0.scales": "2.safetensors",
+    "blocks.25.attn1.to_out.0.biases": "2.safetensors",
+    "blocks.25.attn1.to_out.0.bias": "2.safetensors",
+    "blocks.25.attn1.norm_q.weight": "2.safetensors",
+    "blocks.25.attn1.norm_k.weight": "2.safetensors",
+    "blocks.25.attn2.to_q.weight": "2.safetensors",
+    "blocks.25.attn2.to_q.scales": "2.safetensors",
+    "blocks.25.attn2.to_q.biases": "2.safetensors",
+    "blocks.25.attn2.to_q.bias": "2.safetensors",
+    "blocks.25.attn2.to_k.weight": "2.safetensors",
+    "blocks.25.attn2.to_k.scales": "2.safetensors",
+    "blocks.25.attn2.to_k.biases": "2.safetensors",
+    "blocks.25.attn2.to_k.bias": "2.safetensors",
+    "blocks.25.attn2.to_v.weight": "2.safetensors",
+    "blocks.25.attn2.to_v.scales": "2.safetensors",
+    "blocks.25.attn2.to_v.biases": "2.safetensors",
+    "blocks.25.attn2.to_v.bias": "2.safetensors",
+    "blocks.25.attn2.to_out.0.weight": "2.safetensors",
+    "blocks.25.attn2.to_out.0.scales": "2.safetensors",
+    "blocks.25.attn2.to_out.0.biases": "2.safetensors",
+    "blocks.25.attn2.to_out.0.bias": "2.safetensors",
+    "blocks.25.attn2.norm_q.weight": "2.safetensors",
+    "blocks.25.attn2.norm_k.weight": "2.safetensors",
+    "blocks.25.norm2.weight": "2.safetensors",
+    "blocks.25.norm2.bias": "2.safetensors",
+    "blocks.25.ffn.net.0.weight": "2.safetensors",
+    "blocks.25.ffn.net.0.scales": "2.safetensors",
+    "blocks.25.ffn.net.0.biases": "2.safetensors",
+    "blocks.25.ffn.net.0.bias": "2.safetensors",
+    "blocks.25.ffn.net.1.weight": "2.safetensors",
+    "blocks.25.ffn.net.1.scales": "2.safetensors",
+    "blocks.25.ffn.net.1.biases": "2.safetensors",
+    "blocks.25.ffn.net.1.bias": "2.safetensors",
+    "blocks.25.scale_shift_table": "2.safetensors",
+    "blocks.26.attn1.to_q.weight": "2.safetensors",
+    "blocks.26.attn1.to_q.scales": "2.safetensors",
+    "blocks.26.attn1.to_q.biases": "2.safetensors",
+    "blocks.26.attn1.to_q.bias": "2.safetensors",
+    "blocks.26.attn1.to_k.weight": "2.safetensors",
+    "blocks.26.attn1.to_k.scales": "2.safetensors",
+    "blocks.26.attn1.to_k.biases": "2.safetensors",
+    "blocks.26.attn1.to_k.bias": "2.safetensors",
+    "blocks.26.attn1.to_v.weight": "2.safetensors",
+    "blocks.26.attn1.to_v.scales": "2.safetensors",
+    "blocks.26.attn1.to_v.biases": "2.safetensors",
+    "blocks.26.attn1.to_v.bias": "2.safetensors",
+    "blocks.26.attn1.to_out.0.weight": "2.safetensors",
+    "blocks.26.attn1.to_out.0.scales": "2.safetensors",
+    "blocks.26.attn1.to_out.0.biases": "2.safetensors",
+    "blocks.26.attn1.to_out.0.bias": "2.safetensors",
+    "blocks.26.attn1.norm_q.weight": "2.safetensors",
+    "blocks.26.attn1.norm_k.weight": "2.safetensors",
+    "blocks.26.attn2.to_q.weight": "2.safetensors",
+    "blocks.26.attn2.to_q.scales": "2.safetensors",
+    "blocks.26.attn2.to_q.biases": "2.safetensors",
+    "blocks.26.attn2.to_q.bias": "2.safetensors",
+    "blocks.26.attn2.to_k.weight": "2.safetensors",
+    "blocks.26.attn2.to_k.scales": "2.safetensors",
+    "blocks.26.attn2.to_k.biases": "2.safetensors",
+    "blocks.26.attn2.to_k.bias": "2.safetensors",
+    "blocks.26.attn2.to_v.weight": "2.safetensors",
+    "blocks.26.attn2.to_v.scales": "2.safetensors",
+    "blocks.26.attn2.to_v.biases": "2.safetensors",
+    "blocks.26.attn2.to_v.bias": "2.safetensors",
+    "blocks.26.attn2.to_out.0.weight": "2.safetensors",
+    "blocks.26.attn2.to_out.0.scales": "2.safetensors",
+    "blocks.26.attn2.to_out.0.biases": "2.safetensors",
+    "blocks.26.attn2.to_out.0.bias": "2.safetensors",
+    "blocks.26.attn2.norm_q.weight": "2.safetensors",
+    "blocks.26.attn2.norm_k.weight": "2.safetensors",
+    "blocks.26.norm2.weight": "2.safetensors",
+    "blocks.26.norm2.bias": "2.safetensors",
+    "blocks.26.ffn.net.0.weight": "2.safetensors",
+    "blocks.26.ffn.net.0.scales": "2.safetensors",
+    "blocks.26.ffn.net.0.biases": "2.safetensors",
+    "blocks.26.ffn.net.0.bias": "2.safetensors",
+    "blocks.26.ffn.net.1.weight": "2.safetensors",
+    "blocks.26.ffn.net.1.scales": "2.safetensors",
+    "blocks.26.ffn.net.1.biases": "2.safetensors",
+    "blocks.26.ffn.net.1.bias": "2.safetensors",
+    "blocks.26.scale_shift_table": "2.safetensors",
+    "blocks.27.attn1.to_q.weight": "2.safetensors",
+    "blocks.27.attn1.to_q.scales": "2.safetensors",
+    "blocks.27.attn1.to_q.biases": "2.safetensors",
+    "blocks.27.attn1.to_q.bias": "2.safetensors",
+    "blocks.27.attn1.to_k.weight": "2.safetensors",
+    "blocks.27.attn1.to_k.scales": "2.safetensors",
+    "blocks.27.attn1.to_k.biases": "2.safetensors",
+    "blocks.27.attn1.to_k.bias": "2.safetensors",
+    "blocks.27.attn1.to_v.weight": "2.safetensors",
+    "blocks.27.attn1.to_v.scales": "2.safetensors",
+    "blocks.27.attn1.to_v.biases": "2.safetensors",
+    "blocks.27.attn1.to_v.bias": "2.safetensors",
+    "blocks.27.attn1.to_out.0.weight": "2.safetensors",
+    "blocks.27.attn1.to_out.0.scales": "2.safetensors",
+    "blocks.27.attn1.to_out.0.biases": "2.safetensors",
+    "blocks.27.attn1.to_out.0.bias": "2.safetensors",
+    "blocks.27.attn1.norm_q.weight": "2.safetensors",
+    "blocks.27.attn1.norm_k.weight": "2.safetensors",
+    "blocks.27.attn2.to_q.weight": "2.safetensors",
+    "blocks.27.attn2.to_q.scales": "2.safetensors",
+    "blocks.27.attn2.to_q.biases": "2.safetensors",
+    "blocks.27.attn2.to_q.bias": "2.safetensors",
+    "blocks.27.attn2.to_k.weight": "2.safetensors",
+    "blocks.27.attn2.to_k.scales": "2.safetensors",
+    "blocks.27.attn2.to_k.biases": "2.safetensors",
+    "blocks.27.attn2.to_k.bias": "2.safetensors",
+    "blocks.27.attn2.to_v.weight": "2.safetensors",
+    "blocks.27.attn2.to_v.scales": "2.safetensors",
+    "blocks.27.attn2.to_v.biases": "2.safetensors",
+    "blocks.27.attn2.to_v.bias": "2.safetensors",
+    "blocks.27.attn2.to_out.0.weight": "2.safetensors",
+    "blocks.27.attn2.to_out.0.scales": "2.safetensors",
+    "blocks.27.attn2.to_out.0.biases": "2.safetensors",
+    "blocks.27.attn2.to_out.0.bias": "2.safetensors",
+    "blocks.27.attn2.norm_q.weight": "2.safetensors",
+    "blocks.27.attn2.norm_k.weight": "2.safetensors",
+    "blocks.27.norm2.weight": "2.safetensors",
+    "blocks.27.norm2.bias": "2.safetensors",
+    "blocks.27.ffn.net.0.weight": "2.safetensors",
+    "blocks.27.ffn.net.0.scales": "2.safetensors",
+    "blocks.27.ffn.net.0.biases": "2.safetensors",
+    "blocks.27.ffn.net.0.bias": "2.safetensors",
+    "blocks.27.ffn.net.1.weight": "2.safetensors",
+    "blocks.27.ffn.net.1.scales": "2.safetensors",
+    "blocks.27.ffn.net.1.biases": "2.safetensors",
+    "blocks.27.ffn.net.1.bias": "2.safetensors",
+    "blocks.27.scale_shift_table": "2.safetensors",
+    "blocks.28.attn1.to_q.weight": "2.safetensors",
+    "blocks.28.attn1.to_q.scales": "2.safetensors",
+    "blocks.28.attn1.to_q.biases": "2.safetensors",
+    "blocks.28.attn1.to_q.bias": "2.safetensors",
+    "blocks.28.attn1.to_k.weight": "2.safetensors",
+    "blocks.28.attn1.to_k.scales": "2.safetensors",
+    "blocks.28.attn1.to_k.biases": "2.safetensors",
+    "blocks.28.attn1.to_k.bias": "2.safetensors",
+    "blocks.28.attn1.to_v.weight": "2.safetensors",
+    "blocks.28.attn1.to_v.scales": "2.safetensors",
+    "blocks.28.attn1.to_v.biases": "2.safetensors",
+    "blocks.28.attn1.to_v.bias": "2.safetensors",
+    "blocks.28.attn1.to_out.0.weight": "2.safetensors",
+    "blocks.28.attn1.to_out.0.scales": "2.safetensors",
+    "blocks.28.attn1.to_out.0.biases": "2.safetensors",
+    "blocks.28.attn1.to_out.0.bias": "2.safetensors",
+    "blocks.28.attn1.norm_q.weight": "2.safetensors",
+    "blocks.28.attn1.norm_k.weight": "2.safetensors",
+    "blocks.28.attn2.to_q.weight": "2.safetensors",
+    "blocks.28.attn2.to_q.scales": "2.safetensors",
+    "blocks.28.attn2.to_q.biases": "2.safetensors",
+    "blocks.28.attn2.to_q.bias": "2.safetensors",
+    "blocks.28.attn2.to_k.weight": "2.safetensors",
+    "blocks.28.attn2.to_k.scales": "2.safetensors",
+    "blocks.28.attn2.to_k.biases": "2.safetensors",
+    "blocks.28.attn2.to_k.bias": "2.safetensors",
+    "blocks.28.attn2.to_v.weight": "2.safetensors",
+    "blocks.28.attn2.to_v.scales": "2.safetensors",
+    "blocks.28.attn2.to_v.biases": "2.safetensors",
+    "blocks.28.attn2.to_v.bias": "2.safetensors",
+    "blocks.28.attn2.to_out.0.weight": "2.safetensors",
+    "blocks.28.attn2.to_out.0.scales": "2.safetensors",
+    "blocks.28.attn2.to_out.0.biases": "2.safetensors",
+    "blocks.28.attn2.to_out.0.bias": "2.safetensors",
+    "blocks.28.attn2.norm_q.weight": "2.safetensors",
+    "blocks.28.attn2.norm_k.weight": "2.safetensors",
+    "blocks.28.norm2.weight": "2.safetensors",
+    "blocks.28.norm2.bias": "2.safetensors",
+    "blocks.28.ffn.net.0.weight": "2.safetensors",
+    "blocks.28.ffn.net.0.scales": "2.safetensors",
+    "blocks.28.ffn.net.0.biases": "2.safetensors",
+    "blocks.28.ffn.net.0.bias": "2.safetensors",
+    "blocks.28.ffn.net.1.weight": "2.safetensors",
+    "blocks.28.ffn.net.1.scales": "2.safetensors",
+    "blocks.28.ffn.net.1.biases": "2.safetensors",
+    "blocks.28.ffn.net.1.bias": "2.safetensors",
+    "blocks.28.scale_shift_table": "2.safetensors",
+    "blocks.29.attn1.to_q.weight": "2.safetensors",
+    "blocks.29.attn1.to_q.scales": "2.safetensors",
+    "blocks.29.attn1.to_q.biases": "2.safetensors",
+    "blocks.29.attn1.to_q.bias": "2.safetensors",
+    "blocks.29.attn1.to_k.weight": "2.safetensors",
+    "blocks.29.attn1.to_k.scales": "2.safetensors",
+    "blocks.29.attn1.to_k.biases": "2.safetensors",
+    "blocks.29.attn1.to_k.bias": "2.safetensors",
+    "blocks.29.attn1.to_v.weight": "2.safetensors",
+    "blocks.29.attn1.to_v.scales": "2.safetensors",
+    "blocks.29.attn1.to_v.biases": "2.safetensors",
+    "blocks.29.attn1.to_v.bias": "2.safetensors",
+    "blocks.29.attn1.to_out.0.weight": "2.safetensors",
+    "blocks.29.attn1.to_out.0.scales": "2.safetensors",
+    "blocks.29.attn1.to_out.0.biases": "2.safetensors",
+    "blocks.29.attn1.to_out.0.bias": "2.safetensors",
+    "blocks.29.attn1.norm_q.weight": "2.safetensors",
+    "blocks.29.attn1.norm_k.weight": "2.safetensors",
+    "blocks.29.attn2.to_q.weight": "2.safetensors",
+    "blocks.29.attn2.to_q.scales": "2.safetensors",
+    "blocks.29.attn2.to_q.biases": "2.safetensors",
+    "blocks.29.attn2.to_q.bias": "2.safetensors",
+    "blocks.29.attn2.to_k.weight": "2.safetensors",
+    "blocks.29.attn2.to_k.scales": "2.safetensors",
+    "blocks.29.attn2.to_k.biases": "2.safetensors",
+    "blocks.29.attn2.to_k.bias": "2.safetensors",
+    "blocks.29.attn2.to_v.weight": "2.safetensors",
+    "blocks.29.attn2.to_v.scales": "2.safetensors",
+    "blocks.29.attn2.to_v.biases": "2.safetensors",
+    "blocks.29.attn2.to_v.bias": "2.safetensors",
+    "blocks.29.attn2.to_out.0.weight": "2.safetensors",
+    "blocks.29.attn2.to_out.0.scales": "2.safetensors",
+    "blocks.29.attn2.to_out.0.biases": "2.safetensors",
+    "blocks.29.attn2.to_out.0.bias": "2.safetensors",
+    "blocks.29.attn2.norm_q.weight": "2.safetensors",
+    "blocks.29.attn2.norm_k.weight": "2.safetensors",
+    "blocks.29.norm2.weight": "2.safetensors",
+    "blocks.29.norm2.bias": "2.safetensors",
+    "blocks.29.ffn.net.0.weight": "2.safetensors",
+    "blocks.29.ffn.net.0.scales": "2.safetensors",
+    "blocks.29.ffn.net.0.biases": "2.safetensors",
+    "blocks.29.ffn.net.0.bias": "2.safetensors",
+    "blocks.29.ffn.net.1.weight": "2.safetensors",
+    "blocks.29.ffn.net.1.scales": "2.safetensors",
+    "blocks.29.ffn.net.1.biases": "2.safetensors",
+    "blocks.29.ffn.net.1.bias": "2.safetensors",
+    "blocks.29.scale_shift_table": "2.safetensors",
+    "proj_out.weight": "2.safetensors",
+    "proj_out.scales": "2.safetensors",
+    "proj_out.biases": "2.safetensors",
+    "proj_out.bias": "2.safetensors",
+    "scale_shift_table": "2.safetensors"
+  }
+}

vae/0.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c5de7cc01b4737345a64908c281a46b95a1b5a97ef0942f60df6ff1c7e851beb
+size 1409401417

vae/model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,204 @@

+{
+  "metadata": {
+    "quantization_level": "8",
+    "mflux_version": "0.18.6"
+  },
+  "weight_map": {
+    "encoder.conv_in.conv3d.weight": "0.safetensors",
+    "encoder.conv_in.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.0.resnets.0.norm1.weight": "0.safetensors",
+    "encoder.down_blocks.0.resnets.0.conv1.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.0.resnets.0.conv1.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.0.resnets.0.norm2.weight": "0.safetensors",
+    "encoder.down_blocks.0.resnets.0.conv2.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.0.resnets.0.conv2.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.0.resnets.1.norm1.weight": "0.safetensors",
+    "encoder.down_blocks.0.resnets.1.conv1.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.0.resnets.1.conv1.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.0.resnets.1.norm2.weight": "0.safetensors",
+    "encoder.down_blocks.0.resnets.1.conv2.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.0.resnets.1.conv2.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.0.downsampler.resample_conv.weight": "0.safetensors",
+    "encoder.down_blocks.0.downsampler.resample_conv.bias": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.norm1.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.conv1.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.conv1.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.norm2.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.conv2.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.conv2.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.conv_shortcut.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.conv_shortcut.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.1.resnets.1.norm1.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.1.conv1.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.1.conv1.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.1.resnets.1.norm2.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.1.conv2.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.1.conv2.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.1.downsampler.resample_conv.weight": "0.safetensors",
+    "encoder.down_blocks.1.downsampler.resample_conv.bias": "0.safetensors",
+    "encoder.down_blocks.1.downsampler.time_conv.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.1.downsampler.time_conv.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.norm1.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.conv1.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.conv1.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.norm2.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.conv2.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.conv2.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.conv_shortcut.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.conv_shortcut.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.2.resnets.1.norm1.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.1.conv1.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.1.conv1.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.2.resnets.1.norm2.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.1.conv2.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.1.conv2.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.2.downsampler.resample_conv.weight": "0.safetensors",
+    "encoder.down_blocks.2.downsampler.resample_conv.bias": "0.safetensors",
+    "encoder.down_blocks.2.downsampler.time_conv.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.2.downsampler.time_conv.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.3.resnets.0.norm1.weight": "0.safetensors",
+    "encoder.down_blocks.3.resnets.0.conv1.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.3.resnets.0.conv1.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.3.resnets.0.norm2.weight": "0.safetensors",
+    "encoder.down_blocks.3.resnets.0.conv2.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.3.resnets.0.conv2.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.3.resnets.1.norm1.weight": "0.safetensors",
+    "encoder.down_blocks.3.resnets.1.conv1.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.3.resnets.1.conv1.conv3d.bias": "0.safetensors",
+    "encoder.down_blocks.3.resnets.1.norm2.weight": "0.safetensors",
+    "encoder.down_blocks.3.resnets.1.conv2.conv3d.weight": "0.safetensors",
+    "encoder.down_blocks.3.resnets.1.conv2.conv3d.bias": "0.safetensors",
+    "encoder.mid_block.resnets.0.norm1.weight": "0.safetensors",
+    "encoder.mid_block.resnets.0.conv1.conv3d.weight": "0.safetensors",
+    "encoder.mid_block.resnets.0.conv1.conv3d.bias": "0.safetensors",
+    "encoder.mid_block.resnets.0.norm2.weight": "0.safetensors",
+    "encoder.mid_block.resnets.0.conv2.conv3d.weight": "0.safetensors",
+    "encoder.mid_block.resnets.0.conv2.conv3d.bias": "0.safetensors",
+    "encoder.mid_block.resnets.1.norm1.weight": "0.safetensors",
+    "encoder.mid_block.resnets.1.conv1.conv3d.weight": "0.safetensors",
+    "encoder.mid_block.resnets.1.conv1.conv3d.bias": "0.safetensors",
+    "encoder.mid_block.resnets.1.norm2.weight": "0.safetensors",
+    "encoder.mid_block.resnets.1.conv2.conv3d.weight": "0.safetensors",
+    "encoder.mid_block.resnets.1.conv2.conv3d.bias": "0.safetensors",
+    "encoder.mid_block.attentions.0.norm.weight": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_qkv.weight": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_qkv.bias": "0.safetensors",
+    "encoder.mid_block.attentions.0.proj.weight": "0.safetensors",
+    "encoder.mid_block.attentions.0.proj.bias": "0.safetensors",
+    "encoder.norm_out.weight": "0.safetensors",
+    "encoder.conv_out.conv3d.weight": "0.safetensors",
+    "encoder.conv_out.conv3d.bias": "0.safetensors",
+    "quant_conv.conv3d.weight": "0.safetensors",
+    "quant_conv.conv3d.bias": "0.safetensors",
+    "post_quant_conv.conv3d.weight": "0.safetensors",
+    "post_quant_conv.conv3d.bias": "0.safetensors",
+    "decoder.conv_in.conv3d.weight": "0.safetensors",
+    "decoder.conv_in.conv3d.bias": "0.safetensors",
+    "decoder.mid_block.resnets.0.norm1.weight": "0.safetensors",
+    "decoder.mid_block.resnets.0.conv1.conv3d.weight": "0.safetensors",
+    "decoder.mid_block.resnets.0.conv1.conv3d.bias": "0.safetensors",
+    "decoder.mid_block.resnets.0.norm2.weight": "0.safetensors",
+    "decoder.mid_block.resnets.0.conv2.conv3d.weight": "0.safetensors",
+    "decoder.mid_block.resnets.0.conv2.conv3d.bias": "0.safetensors",
+    "decoder.mid_block.resnets.1.norm1.weight": "0.safetensors",
+    "decoder.mid_block.resnets.1.conv1.conv3d.weight": "0.safetensors",
+    "decoder.mid_block.resnets.1.conv1.conv3d.bias": "0.safetensors",
+    "decoder.mid_block.resnets.1.norm2.weight": "0.safetensors",
+    "decoder.mid_block.resnets.1.conv2.conv3d.weight": "0.safetensors",
+    "decoder.mid_block.resnets.1.conv2.conv3d.bias": "0.safetensors",
+    "decoder.mid_block.attentions.0.norm.weight": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_qkv.weight": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_qkv.bias": "0.safetensors",
+    "decoder.mid_block.attentions.0.proj.weight": "0.safetensors",
+    "decoder.mid_block.attentions.0.proj.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.0.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.0.conv1.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.0.conv1.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.0.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.0.conv2.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.0.conv2.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.1.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.1.conv1.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.1.conv1.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.1.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.1.conv2.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.1.conv2.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.2.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.2.conv1.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.2.conv1.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.2.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.2.conv2.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.2.conv2.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.0.upsampler.time_conv.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.0.upsampler.time_conv.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.0.upsampler.resample_conv.weight": "0.safetensors",
+    "decoder.up_blocks.0.upsampler.resample_conv.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.0.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.0.conv1.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.0.conv1.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.0.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.0.conv2.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.0.conv2.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.1.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.1.conv1.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.1.conv1.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.1.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.1.conv2.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.1.conv2.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.2.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.2.conv1.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.2.conv1.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.2.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.2.conv2.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.2.conv2.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.1.upsampler.time_conv.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.1.upsampler.time_conv.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.1.upsampler.resample_conv.weight": "0.safetensors",
+    "decoder.up_blocks.1.upsampler.resample_conv.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.conv1.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.conv1.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.conv2.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.conv2.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.conv_shortcut.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.conv_shortcut.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.1.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.1.conv1.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.1.conv1.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.1.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.1.conv2.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.1.conv2.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.2.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.2.conv1.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.2.conv1.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.2.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.2.conv2.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.2.conv2.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.2.upsampler.resample_conv.weight": "0.safetensors",
+    "decoder.up_blocks.2.upsampler.resample_conv.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.conv1.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.conv1.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.conv2.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.conv2.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.conv_shortcut.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.conv_shortcut.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.1.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.1.conv1.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.1.conv1.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.1.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.1.conv2.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.1.conv2.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.2.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.2.conv1.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.2.conv1.conv3d.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.2.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.2.conv2.conv3d.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.2.conv2.conv3d.bias": "0.safetensors",
+    "decoder.norm_out.weight": "0.safetensors",
+    "decoder.conv_out.conv3d.weight": "0.safetensors",
+    "decoder.conv_out.conv3d.bias": "0.safetensors"
+  }
+}