ailuntz commited on May 30

Commit

5ab2334

verified ·

1 Parent(s): 795cb26

Add files using upload-large-folder tool

Browse files

Files changed (36) hide show

README.md +114 -0
config.json +64 -0
config.official.yaml +141 -0
mlx_manifest.json +64 -0
model-00001-of-00024.safetensors +3 -0
model-00002-of-00024.safetensors +3 -0
model-00003-of-00024.safetensors +3 -0
model-00004-of-00024.safetensors +3 -0
model-00005-of-00024.safetensors +3 -0
model-00006-of-00024.safetensors +3 -0
model-00007-of-00024.safetensors +3 -0
model-00008-of-00024.safetensors +3 -0
model-00009-of-00024.safetensors +3 -0
model-00010-of-00024.safetensors +3 -0
model-00011-of-00024.safetensors +3 -0
model-00012-of-00024.safetensors +3 -0
model-00013-of-00024.safetensors +3 -0
model-00014-of-00024.safetensors +3 -0
model-00015-of-00024.safetensors +3 -0
model-00016-of-00024.safetensors +3 -0
model-00017-of-00024.safetensors +3 -0
model-00018-of-00024.safetensors +3 -0
model-00019-of-00024.safetensors +3 -0
model-00020-of-00024.safetensors +3 -0
model-00021-of-00024.safetensors +3 -0
model-00022-of-00024.safetensors +3 -0
model-00023-of-00024.safetensors +3 -0
model-00024-of-00024.safetensors +3 -0
model.safetensors.index.json +984 -0
qwen2_tokenizer/config.json +27 -0
qwen2_tokenizer/generation_config.json +7 -0
qwen2_tokenizer/merges.txt +0 -0
qwen2_tokenizer/tokenizer.json +0 -0
qwen2_tokenizer/tokenizer_config.json +40 -0
qwen2_tokenizer/vocab.json +0 -0
vocab.yaml +13 -0

README.md ADDED Viewed

	@@ -0,0 +1,114 @@

+---
+license: other
+library_name: mlx
+pipeline_tag: text-to-audio
+base_model:
+- tencent/SongGeneration
+tags:
+- mlx
+- apple-silicon
+- music-generation
+- song-generation
+- audiolm
+---
+Part of the SongGeneration MLX conversion set.
+# SongGeneration-v2-medium-4bit
+Apple MLX weights for the autoregressive `audiolm` token generator from Tencent SongGeneration v2-medium.
+This is not a full-stack pure MLX audio pipeline yet: token generation runs with MLX, while FLAC decoding currently uses the official PyTorch Flow1dVAE / separate-tokenizer bridge in [`ailuntx/SongGeneration-MLX`](https://github.com/ailuntx/SongGeneration-MLX).
+## TL;DR
+| | |
+|---|---|
+| **Variant** | `v2-medium` |
+| **Precision** | `4bit` |
+| **Converted component** | SongGeneration `audiolm` token generator |
+| **Runtime** | [`ailuntx/SongGeneration-MLX`](https://github.com/ailuntx/SongGeneration-MLX) |
+| **Official model** | [`tencent/SongGeneration`](https://huggingface.co/tencent/SongGeneration) |
+| **Official code** | [`tencent-ailab/songgeneration`](https://github.com/tencent-ailab/songgeneration) |
+## Quick Start
+```bash
+hf download mlx-community/SongGeneration-v2-medium-4bit --local-dir ./models/SongGeneration-v2-medium-4bit
+git clone https://github.com/ailuntx/SongGeneration-MLX.git
+cd SongGeneration-MLX
+python -m venv .venv
+.venv/bin/pip install -e .
+PYTHONPATH=. .venv/bin/python -m songgeneration_mlx.cli \
+  --model ./models/SongGeneration-v2-medium-4bit \
+  --lyrics '[verse] hello from mlx [chorus] sing it again' \
+  --description 'Pop, female vocal, bright production, [Musicality-medium].' \
+  --duration 2 \
+  --top-k 50 \
+  --temperature 0.9 \
+  --output tokens_2s.npz
+```
+To decode tokens to FLAC, use the official decoder bridge documented in the GitHub README. The bridge requires the official SongGeneration runtime assets.
+## Variants
+| Variant | Disk | Notes |
+|---|---:|---|
+| `SongGeneration-v2-medium-fp32` | 10G | high-precision medium baseline |
+| `SongGeneration-v2-medium-bfloat16` | 5.2G | recommended medium quality baseline |
+| `SongGeneration-v2-medium-8bit` | 2.8G | smaller medium checkpoint |
+| `SongGeneration-v2-medium-4bit` | 1.5G | smallest medium checkpoint |
+| `SongGeneration-v2-large-fp32` | 19G | high-precision large baseline |
+| `SongGeneration-v2-large-bfloat16` | 9.5G | large quality baseline |
+| `SongGeneration-v2-large-8bit` | 5.0G | smaller large checkpoint |
+| `SongGeneration-v2-large-4bit` | 2.7G | smallest large checkpoint |
+## Layout
+```text
+SongGeneration-v2-medium-4bit/
+|-- model-00001-of-000xx.safetensors
+|-- model.safetensors.index.json
+|-- config.json
+|-- mlx_manifest.json
+|-- config.official.yaml
+|-- vocab.yaml
+`-- qwen2_tokenizer/
+```
+## Validation
+Local Apple Silicon validation was run on the medium bfloat16 path:
+| Test | Result |
+|---|---|
+| 12s MLX token generation | 550 pattern steps, about 1 minute wall time |
+| 12s official decoder bridge | 73.27s wall time |
+| 12s FLAC | 48kHz stereo, 12.000s, RMS about `0.163` |
+The official recent-token repetition penalty is implemented in the MLX runtime. Without it, 12s generations collapse into repeated tokens and decode close to silence.
+## License
+License follows the upstream SongGeneration release. Check the official model card and repository for the authoritative model license.
+## Citation
+```bibtex
+@misc{songgeneration-mlx,
+  title  = {SongGeneration-MLX: Apple MLX port of SongGeneration},
+  author = {ailuntx},
+  year   = {2026},
+  url    = {https://github.com/ailuntx/SongGeneration-MLX},
+}
+@article{lei2025levo,
+  title   = {LeVo: High-Quality Song Generation with Multi-Preference Alignment},
+  author  = {Lei, Shun and Xu, Yaoxun and Lin, Zhiwei and Zhang, Huaicheng and Tan, Wei and Chen, Hangting and Yu, Jianwei and Zhang, Yixuan and Yang, Chenyu and Zhu, Haina and Wang, Shuai and Wu, Zhiyong and Yu, Dong},
+  journal = {arXiv preprint arXiv:2506.07520},
+  year    = {2025},
+}
+```

config.json ADDED Viewed

	@@ -0,0 +1,64 @@

+{
+  "format": "songgeneration-mlx-audiolm",
+  "source": "tencent/SongGeneration",
+  "official_code": "https://github.com/tencent-ailab/songgeneration",
+  "variant": "v2-medium",
+  "precision": "4bit",
+  "runtime": {
+    "hidden_size": 1536,
+    "intermediate_size": 8960,
+    "num_heads": 12,
+    "num_layers": 28,
+    "num_layers_sub": 12,
+    "code_depth": 3,
+    "code_size": 16384,
+    "prompt_len": 10,
+    "frame_rate": 25,
+    "max_position_embeddings": 10000,
+    "max_position_embeddings_sub": 10000,
+    "rope_theta": 500000.0,
+    "rope_theta_sub": 500000.0,
+    "cfg_coef": 1.5
+  },
+  "components": {
+    "audiolm": "converted to MLX safetensors",
+    "qwen_tokenizer": "copied for lyric/style tokenization",
+    "audio_decoder": "use official PyTorch Flow1dVAE/separate tokenizer bridge for now"
+  },
+  "skipped_keys": [
+    "audiolm.out_norm.weight",
+    "audiolm.out_norm.bias",
+    "audiolm.transformer2.lm_head.weight"
+  ],
+  "quantization": {
+    "bits": 4,
+    "group_size": 64,
+    "mode": "affine"
+  },
+  "weight_files": [
+    "model-00001-of-00024.safetensors",
+    "model-00002-of-00024.safetensors",
+    "model-00003-of-00024.safetensors",
+    "model-00004-of-00024.safetensors",
+    "model-00005-of-00024.safetensors",
+    "model-00006-of-00024.safetensors",
+    "model-00007-of-00024.safetensors",
+    "model-00008-of-00024.safetensors",
+    "model-00009-of-00024.safetensors",
+    "model-00010-of-00024.safetensors",
+    "model-00011-of-00024.safetensors",
+    "model-00012-of-00024.safetensors",
+    "model-00013-of-00024.safetensors",
+    "model-00014-of-00024.safetensors",
+    "model-00015-of-00024.safetensors",
+    "model-00016-of-00024.safetensors",
+    "model-00017-of-00024.safetensors",
+    "model-00018-of-00024.safetensors",
+    "model-00019-of-00024.safetensors",
+    "model-00020-of-00024.safetensors",
+    "model-00021-of-00024.safetensors",
+    "model-00022-of-00024.safetensors",
+    "model-00023-of-00024.safetensors",
+    "model-00024-of-00024.safetensors"
+  ]
+}

config.official.yaml ADDED Viewed

	@@ -0,0 +1,141 @@

+# ================ Train Config ================ #
+lyric_processor:
+max_dur: 270
+min_dur: 30
+prompt_len: 10
+pad_to_max: true
+# ================ Audio tokenzier ================ #
+audio_tokenizer_checkpoint: Flow1dVAE1rvq_./ckpt/model_1rvq/model_2_fixed.safetensors
+audio_tokenizer_frame_rate: 25
+audio_tokenizer_code_depth: 1
+sample_rate: 48000
+audio_tokenizer_checkpoint_sep: Flow1dVAESeparate_./ckpt/model_septoken/model_2.safetensors
+audio_tokenizer_frame_rate_sep: 25
+audio_tokenizer_code_depth_sep: 2
+sample_rate_sep: 48000
+# ================ VAE ================ #
+vae_config: ./ckpt/vae/stable_audio_1920_vae.json
+vae_model: ./ckpt/vae/autoencoder_music_1320k.ckpt
+# ================== LM =========================== #
+lm:
+  lm_type: Llama # [Llama]
+  dim: 1536
+  intermediate_size: 8960
+  num_heads: 12
+  num_layers: 28
+  num_layers_sub: 12
+  code_depth: 3
+  code_size: 16384
+  max_position_embeddings: 10000
+  max_position_embeddings_sub: 10000
+  rope_theta: 500000.0
+  rope_theta_sub: 500000.0
+  dropout: 0.0
+  use_flash_attn_2: true
+  activation: gelu
+  norm_first: true
+  bias_ff: false
+  bias_attn: false
+  causal: true
+  custom: false
+  memory_efficient: true
+  attention_as_float32: false
+  layer_scale: null
+  positional_embedding: sin
+  xpos: false
+  checkpointing: torch
+  weight_init: gaussian
+  depthwise_init: current
+  zero_bias_init: true
+  norm: layer_norm
+  cross_attention: false
+  qk_layer_norm: false
+  qk_layer_norm_cross: false
+  attention_dropout: null
+  kv_repeat: 1
+codebooks_pattern:
+  modeling: delay
+  delay:
+    delays: [ 0, 250, 250 ]
+    flatten_first: 0
+    empty_initial: 0
+# ================ Conditioners ===================== #
+classifier_free_guidance:
+  # drop all conditions simultaneously
+  training_dropout: 0.15
+  inference_coef: 1.5
+attribute_dropout:
+  # drop each condition separately
+  args:
+    active_on_eval: false
+  text:
+    description: 0.0
+    type_info: 0.2
+  audio:
+    prompt_audio: 0.5
+use_text_training: True
+fuser:
+  sum: []
+  prepend: [ description, prompt_audio, type_info ] # this order is the SAME with the input concatenation order
+conditioners:
+  prompt_audio:
+    model: qt_embedding
+    qt_embedding:
+      code_size: 16384
+      code_depth: 3
+      max_len: ${eval:${prompt_len}*${audio_tokenizer_frame_rate}+2} # 25*10+2+1
+  description:
+    model: QwTokenizer
+    QwTokenizer:
+      token_path: third_party/Qwen2-7B
+      max_len: 600
+      add_token_list: ${load_yaml:conf/vocab.yaml}
+  type_info:
+    model: QwTextTokenizer
+    QwTextTokenizer:
+      token_path: third_party/Qwen2-7B
+      max_len: 100
+offload:
+  audiolm:
+    offload_module: self
+    cpu_mem_gb: 0
+    pre_copy_step: 1
+    clean_cache_after_forward: false
+    dtype: torch.float16
+    offload_layer_dict:
+      transformer: 4
+      transformer2: 4
+    ignore_layer_list: []
+    clean_cache_wrapper:
+      module: self
+      method_name: _sample_next_token
+      diff_mem_gb_thre: 2
+    debug: false
+  wav_tokenizer_diffusion:
+    offload_module: self.model.model
+    pre_copy_step: 1
+    clean_cache_after_forward: false
+    cpu_mem_gb: -1
+    dtype: null
+    offload_layer_dict:
+      cfm_wrapper: 5
+      hubert: 4
+    ignore_layer_list: []
+    clean_cache_wrapper:
+      module: self.model.model.cfm_wrapper.estimator
+      method_name: forward
+      diff_mem_gb_thre: 1
+    debug: false

mlx_manifest.json ADDED Viewed

	@@ -0,0 +1,64 @@

+{
+  "format": "songgeneration-mlx-audiolm",
+  "source": "tencent/SongGeneration",
+  "official_code": "https://github.com/tencent-ailab/songgeneration",
+  "variant": "v2-medium",
+  "precision": "4bit",
+  "runtime": {
+    "hidden_size": 1536,
+    "intermediate_size": 8960,
+    "num_heads": 12,
+    "num_layers": 28,
+    "num_layers_sub": 12,
+    "code_depth": 3,
+    "code_size": 16384,
+    "prompt_len": 10,
+    "frame_rate": 25,
+    "max_position_embeddings": 10000,
+    "max_position_embeddings_sub": 10000,
+    "rope_theta": 500000.0,
+    "rope_theta_sub": 500000.0,
+    "cfg_coef": 1.5
+  },
+  "components": {
+    "audiolm": "converted to MLX safetensors",
+    "qwen_tokenizer": "copied for lyric/style tokenization",
+    "audio_decoder": "use official PyTorch Flow1dVAE/separate tokenizer bridge for now"
+  },
+  "skipped_keys": [
+    "audiolm.out_norm.weight",
+    "audiolm.out_norm.bias",
+    "audiolm.transformer2.lm_head.weight"
+  ],
+  "quantization": {
+    "bits": 4,
+    "group_size": 64,
+    "mode": "affine"
+  },
+  "weight_files": [
+    "model-00001-of-00024.safetensors",
+    "model-00002-of-00024.safetensors",
+    "model-00003-of-00024.safetensors",
+    "model-00004-of-00024.safetensors",
+    "model-00005-of-00024.safetensors",
+    "model-00006-of-00024.safetensors",
+    "model-00007-of-00024.safetensors",
+    "model-00008-of-00024.safetensors",
+    "model-00009-of-00024.safetensors",
+    "model-00010-of-00024.safetensors",
+    "model-00011-of-00024.safetensors",
+    "model-00012-of-00024.safetensors",
+    "model-00013-of-00024.safetensors",
+    "model-00014-of-00024.safetensors",
+    "model-00015-of-00024.safetensors",
+    "model-00016-of-00024.safetensors",
+    "model-00017-of-00024.safetensors",
+    "model-00018-of-00024.safetensors",
+    "model-00019-of-00024.safetensors",
+    "model-00020-of-00024.safetensors",
+    "model-00021-of-00024.safetensors",
+    "model-00022-of-00024.safetensors",
+    "model-00023-of-00024.safetensors",
+    "model-00024-of-00024.safetensors"
+  ]
+}

model-00001-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8fc91af414b31fa862530a36c707a5c342a82eacf1dfb667ad7cc7a0b98049ed
+size 14559480

model-00002-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7e9cab73947c4bdb735e543065290f19cd60fd1523518c7a1796fbb2a8af5013
+size 116474224

model-00003-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6dfe514be85f92267347d2dfeff183fc1d96d63a3d68a949038a75cc4524f85c
+size 58377352

model-00004-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0d08991a7a4aae48edb3806f1f79af45250425d219bb701f8a266d016015a022
+size 60617704

model-00005-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:05355c61954554223b18c839dd4cd264da993150c56fb0bf78ae71a3ef6b0ec8
+size 63894736

model-00006-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d65038727a45139c28d5ea08a93003f58822f2d868769d8c87ba9e7730402a31
+size 64824896

model-00007-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4ffd0b32a23fc53291c54c751b258a97fe201af4325122d97af1c93bee1dc184
+size 66770328

model-00008-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ed35d56205f74a321ed0d181c2afea0b167cdef8040b87eaa0ea21fc1bef2bdb
+size 60453928

model-00009-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d917f8e3797bb70b8f187c1f67c2ee79abb826101ee6d7344b90a5202868c49d
+size 64824920

model-00010-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:28455144472660ab476354be97c1bf141e7b3f4754e58ef3052d6becdb67ae45
+size 64824904

model-00011-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1a98f34b65bb6807fc5353bc6811d119e4d802d0bce5d1a08cd319ea44a0d5bf
+size 66770312

model-00012-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1ddb3425d4f5ca110079255a89632f5fd2135c56f8145783511e8f1aa6076ceb
+size 60453928

model-00013-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:59ab43548f038468e9fda3c0deeff2c82c046d465b3ffdcde9edf311d33dea9b
+size 64824920

model-00014-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b117cf4c162e2186b7589c27c1c45013b839993c77ec74112dc54336babec062
+size 64824904

model-00015-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a113cab19c645aec3a240b1a92f4be92cc3017289191e9e64a16b62f0fb3ffe7
+size 66770272

model-00016-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:84d8c266bb0c6d53f1642699a4287d9206a4e9db624a0abdbaa11b11926af11e
+size 60453880

model-00017-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:10bccf197ec87f76ae45b883e404bc00d0229b718164cc3eb82484eabf8eb429
+size 57795848

model-00018-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:82a7296f417d76b6f54f588bce5c005264fa9d0500b076ea1cca92dee8852ccc
+size 67085848

model-00019-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6c90acd63798fd1dfc16e5a6841b2fa535bcde51714ad683ddeb30eb15f6e992
+size 60527824

model-00020-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5d5a533b95f5e00c997fe14450eb93ee1463579cf1c01bb12a3ed9eb0a30bdc0
+size 64824920

model-00021-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4596f5656191f0ab8c3d809ee0bc3ee72fde9b37fb23a0a669ea630639e2ad2e
+size 64824912

model-00022-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a8210bd3d1b7097bcfcf470548f36602197736d37c3f829268586648fc3e8d25
+size 66770328

model-00023-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e6b0a6cac45aaadf251eac74e6c04ea6270062240275f784a1578e948129073d
+size 59767696

model-00024-of-00024.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:05b164197bd01d9bb0c548e13523a3df5b1faa348ce5b9d66beae8a3ee7678e3
+size 116468848

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,984 @@

+{
+  "metadata": {
+    "total_size": 1577674176
+  },
+  "weight_map": {
+    "description_output_proj.biases": "model-00001-of-00024.safetensors",
+    "description_output_proj.scales": "model-00001-of-00024.safetensors",
+    "description_output_proj.weight": "model-00002-of-00024.safetensors",
+    "description_structure_emb.biases": "model-00003-of-00024.safetensors",
+    "description_structure_emb.scales": "model-00003-of-00024.safetensors",
+    "description_structure_emb.weight": "model-00003-of-00024.safetensors",
+    "emb0.biases": "model-00003-of-00024.safetensors",
+    "emb0.scales": "model-00003-of-00024.safetensors",
+    "emb0.weight": "model-00003-of-00024.safetensors",
+    "layer2_emb0.biases": "model-00003-of-00024.safetensors",
+    "layer2_emb0.scales": "model-00003-of-00024.safetensors",
+    "layer2_emb0.weight": "model-00003-of-00024.safetensors",
+    "layer2_emb1.biases": "model-00003-of-00024.safetensors",
+    "layer2_emb1.scales": "model-00003-of-00024.safetensors",
+    "layer2_emb1.weight": "model-00003-of-00024.safetensors",
+    "layer2_emb2.biases": "model-00003-of-00024.safetensors",
+    "layer2_emb2.scales": "model-00003-of-00024.safetensors",
+    "layer2_emb2.weight": "model-00003-of-00024.safetensors",
+    "linears0.biases": "model-00003-of-00024.safetensors",
+    "linears0.scales": "model-00003-of-00024.safetensors",
+    "linears0.weight": "model-00004-of-00024.safetensors",
+    "linears1.biases": "model-00004-of-00024.safetensors",
+    "linears1.scales": "model-00004-of-00024.safetensors",
+    "linears1.weight": "model-00004-of-00024.safetensors",
+    "mlp.linear0.bias": "model-00004-of-00024.safetensors",
+    "mlp.linear0.biases": "model-00004-of-00024.safetensors",
+    "mlp.linear0.scales": "model-00004-of-00024.safetensors",
+    "mlp.linear0.weight": "model-00004-of-00024.safetensors",
+    "mlp.linear2.bias": "model-00004-of-00024.safetensors",
+    "mlp.linear2.biases": "model-00004-of-00024.safetensors",
+    "mlp.linear2.scales": "model-00004-of-00024.safetensors",
+    "mlp.linear2.weight": "model-00004-of-00024.safetensors",
+    "prompt_audio_emb0.biases": "model-00004-of-00024.safetensors",
+    "prompt_audio_emb0.scales": "model-00004-of-00024.safetensors",
+    "prompt_audio_emb0.weight": "model-00004-of-00024.safetensors",
+    "prompt_audio_emb1.biases": "model-00004-of-00024.safetensors",
+    "prompt_audio_emb1.scales": "model-00004-of-00024.safetensors",
+    "prompt_audio_emb1.weight": "model-00004-of-00024.safetensors",
+    "prompt_audio_emb2.biases": "model-00004-of-00024.safetensors",
+    "prompt_audio_emb2.scales": "model-00004-of-00024.safetensors",
+    "prompt_audio_emb2.weight": "model-00005-of-00024.safetensors",
+    "prompt_audio_eot": "model-00005-of-00024.safetensors",
+    "prompt_audio_layer2_eot": "model-00005-of-00024.safetensors",
+    "transformer.embed_tokens.biases": "model-00005-of-00024.safetensors",
+    "transformer.embed_tokens.scales": "model-00005-of-00024.safetensors",
+    "transformer.embed_tokens.weight": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.input_layernorm.weight": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.mlp.down_proj.biases": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.mlp.down_proj.scales": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.mlp.down_proj.weight": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.mlp.gate_proj.biases": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.mlp.gate_proj.scales": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.mlp.gate_proj.weight": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.mlp.up_proj.biases": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.mlp.up_proj.scales": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.mlp.up_proj.weight": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.post_attention_layernorm.weight": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.self_attn.k_proj.biases": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.self_attn.k_proj.scales": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.self_attn.k_proj.weight": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.self_attn.o_proj.biases": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.self_attn.o_proj.scales": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.self_attn.o_proj.weight": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.self_attn.q_proj.biases": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.self_attn.q_proj.scales": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.self_attn.q_proj.weight": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.self_attn.v_proj.biases": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.self_attn.v_proj.scales": "model-00005-of-00024.safetensors",
+    "transformer.layers.0.self_attn.v_proj.weight": "model-00005-of-00024.safetensors",
+    "transformer.layers.1.input_layernorm.weight": "model-00005-of-00024.safetensors",
+    "transformer.layers.1.mlp.down_proj.biases": "model-00005-of-00024.safetensors",
+    "transformer.layers.1.mlp.down_proj.scales": "model-00005-of-00024.safetensors",
+    "transformer.layers.1.mlp.down_proj.weight": "model-00005-of-00024.safetensors",
+    "transformer.layers.1.mlp.gate_proj.biases": "model-00005-of-00024.safetensors",
+    "transformer.layers.1.mlp.gate_proj.scales": "model-00005-of-00024.safetensors",
+    "transformer.layers.1.mlp.gate_proj.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.1.mlp.up_proj.biases": "model-00006-of-00024.safetensors",
+    "transformer.layers.1.mlp.up_proj.scales": "model-00006-of-00024.safetensors",
+    "transformer.layers.1.mlp.up_proj.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.1.post_attention_layernorm.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.1.self_attn.k_proj.biases": "model-00006-of-00024.safetensors",
+    "transformer.layers.1.self_attn.k_proj.scales": "model-00006-of-00024.safetensors",
+    "transformer.layers.1.self_attn.k_proj.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.1.self_attn.o_proj.biases": "model-00006-of-00024.safetensors",
+    "transformer.layers.1.self_attn.o_proj.scales": "model-00006-of-00024.safetensors",
+    "transformer.layers.1.self_attn.o_proj.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.1.self_attn.q_proj.biases": "model-00006-of-00024.safetensors",
+    "transformer.layers.1.self_attn.q_proj.scales": "model-00006-of-00024.safetensors",
+    "transformer.layers.1.self_attn.q_proj.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.1.self_attn.v_proj.biases": "model-00006-of-00024.safetensors",
+    "transformer.layers.1.self_attn.v_proj.scales": "model-00006-of-00024.safetensors",
+    "transformer.layers.1.self_attn.v_proj.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.input_layernorm.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.mlp.down_proj.biases": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.mlp.down_proj.scales": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.mlp.down_proj.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.mlp.gate_proj.biases": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.mlp.gate_proj.scales": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.mlp.gate_proj.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.mlp.up_proj.biases": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.mlp.up_proj.scales": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.mlp.up_proj.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.post_attention_layernorm.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.self_attn.k_proj.biases": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.self_attn.k_proj.scales": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.self_attn.k_proj.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.self_attn.o_proj.biases": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.self_attn.o_proj.scales": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.self_attn.o_proj.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.self_attn.q_proj.biases": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.self_attn.q_proj.scales": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.self_attn.q_proj.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.self_attn.v_proj.biases": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.self_attn.v_proj.scales": "model-00006-of-00024.safetensors",
+    "transformer.layers.10.self_attn.v_proj.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.11.input_layernorm.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.11.mlp.down_proj.biases": "model-00006-of-00024.safetensors",
+    "transformer.layers.11.mlp.down_proj.scales": "model-00006-of-00024.safetensors",
+    "transformer.layers.11.mlp.down_proj.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.11.mlp.gate_proj.biases": "model-00006-of-00024.safetensors",
+    "transformer.layers.11.mlp.gate_proj.scales": "model-00006-of-00024.safetensors",
+    "transformer.layers.11.mlp.gate_proj.weight": "model-00006-of-00024.safetensors",
+    "transformer.layers.11.mlp.up_proj.biases": "model-00006-of-00024.safetensors",
+    "transformer.layers.11.mlp.up_proj.scales": "model-00006-of-00024.safetensors",
+    "transformer.layers.11.mlp.up_proj.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.11.post_attention_layernorm.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.11.self_attn.k_proj.biases": "model-00007-of-00024.safetensors",
+    "transformer.layers.11.self_attn.k_proj.scales": "model-00007-of-00024.safetensors",
+    "transformer.layers.11.self_attn.k_proj.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.11.self_attn.o_proj.biases": "model-00007-of-00024.safetensors",
+    "transformer.layers.11.self_attn.o_proj.scales": "model-00007-of-00024.safetensors",
+    "transformer.layers.11.self_attn.o_proj.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.11.self_attn.q_proj.biases": "model-00007-of-00024.safetensors",
+    "transformer.layers.11.self_attn.q_proj.scales": "model-00007-of-00024.safetensors",
+    "transformer.layers.11.self_attn.q_proj.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.11.self_attn.v_proj.biases": "model-00007-of-00024.safetensors",
+    "transformer.layers.11.self_attn.v_proj.scales": "model-00007-of-00024.safetensors",
+    "transformer.layers.11.self_attn.v_proj.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.input_layernorm.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.mlp.down_proj.biases": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.mlp.down_proj.scales": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.mlp.down_proj.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.mlp.gate_proj.biases": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.mlp.gate_proj.scales": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.mlp.gate_proj.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.mlp.up_proj.biases": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.mlp.up_proj.scales": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.mlp.up_proj.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.post_attention_layernorm.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.self_attn.k_proj.biases": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.self_attn.k_proj.scales": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.self_attn.k_proj.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.self_attn.o_proj.biases": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.self_attn.o_proj.scales": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.self_attn.o_proj.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.self_attn.q_proj.biases": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.self_attn.q_proj.scales": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.self_attn.q_proj.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.self_attn.v_proj.biases": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.self_attn.v_proj.scales": "model-00007-of-00024.safetensors",
+    "transformer.layers.12.self_attn.v_proj.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.input_layernorm.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.mlp.down_proj.biases": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.mlp.down_proj.scales": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.mlp.down_proj.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.mlp.gate_proj.biases": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.mlp.gate_proj.scales": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.mlp.gate_proj.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.mlp.up_proj.biases": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.mlp.up_proj.scales": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.mlp.up_proj.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.post_attention_layernorm.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.self_attn.k_proj.biases": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.self_attn.k_proj.scales": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.self_attn.k_proj.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.self_attn.o_proj.biases": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.self_attn.o_proj.scales": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.self_attn.o_proj.weight": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.self_attn.q_proj.biases": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.self_attn.q_proj.scales": "model-00007-of-00024.safetensors",
+    "transformer.layers.13.self_attn.q_proj.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.13.self_attn.v_proj.biases": "model-00008-of-00024.safetensors",
+    "transformer.layers.13.self_attn.v_proj.scales": "model-00008-of-00024.safetensors",
+    "transformer.layers.13.self_attn.v_proj.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.input_layernorm.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.mlp.down_proj.biases": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.mlp.down_proj.scales": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.mlp.down_proj.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.mlp.gate_proj.biases": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.mlp.gate_proj.scales": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.mlp.gate_proj.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.mlp.up_proj.biases": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.mlp.up_proj.scales": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.mlp.up_proj.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.post_attention_layernorm.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.self_attn.k_proj.biases": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.self_attn.k_proj.scales": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.self_attn.k_proj.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.self_attn.o_proj.biases": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.self_attn.o_proj.scales": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.self_attn.o_proj.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.self_attn.q_proj.biases": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.self_attn.q_proj.scales": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.self_attn.q_proj.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.self_attn.v_proj.biases": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.self_attn.v_proj.scales": "model-00008-of-00024.safetensors",
+    "transformer.layers.14.self_attn.v_proj.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.input_layernorm.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.mlp.down_proj.biases": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.mlp.down_proj.scales": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.mlp.down_proj.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.mlp.gate_proj.biases": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.mlp.gate_proj.scales": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.mlp.gate_proj.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.mlp.up_proj.biases": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.mlp.up_proj.scales": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.mlp.up_proj.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.post_attention_layernorm.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.self_attn.k_proj.biases": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.self_attn.k_proj.scales": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.self_attn.k_proj.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.self_attn.o_proj.biases": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.self_attn.o_proj.scales": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.self_attn.o_proj.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.self_attn.q_proj.biases": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.self_attn.q_proj.scales": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.self_attn.q_proj.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.self_attn.v_proj.biases": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.self_attn.v_proj.scales": "model-00008-of-00024.safetensors",
+    "transformer.layers.15.self_attn.v_proj.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.16.input_layernorm.weight": "model-00008-of-00024.safetensors",
+    "transformer.layers.16.mlp.down_proj.biases": "model-00008-of-00024.safetensors",
+    "transformer.layers.16.mlp.down_proj.scales": "model-00008-of-00024.safetensors",
+    "transformer.layers.16.mlp.down_proj.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.mlp.gate_proj.biases": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.mlp.gate_proj.scales": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.mlp.gate_proj.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.mlp.up_proj.biases": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.mlp.up_proj.scales": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.mlp.up_proj.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.post_attention_layernorm.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.self_attn.k_proj.biases": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.self_attn.k_proj.scales": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.self_attn.k_proj.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.self_attn.o_proj.biases": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.self_attn.o_proj.scales": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.self_attn.o_proj.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.self_attn.q_proj.biases": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.self_attn.q_proj.scales": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.self_attn.q_proj.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.self_attn.v_proj.biases": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.self_attn.v_proj.scales": "model-00009-of-00024.safetensors",
+    "transformer.layers.16.self_attn.v_proj.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.input_layernorm.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.mlp.down_proj.biases": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.mlp.down_proj.scales": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.mlp.down_proj.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.mlp.gate_proj.biases": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.mlp.gate_proj.scales": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.mlp.gate_proj.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.mlp.up_proj.biases": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.mlp.up_proj.scales": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.mlp.up_proj.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.post_attention_layernorm.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.self_attn.k_proj.biases": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.self_attn.k_proj.scales": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.self_attn.k_proj.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.self_attn.o_proj.biases": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.self_attn.o_proj.scales": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.self_attn.o_proj.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.self_attn.q_proj.biases": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.self_attn.q_proj.scales": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.self_attn.q_proj.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.self_attn.v_proj.biases": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.self_attn.v_proj.scales": "model-00009-of-00024.safetensors",
+    "transformer.layers.17.self_attn.v_proj.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.18.input_layernorm.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.18.mlp.down_proj.biases": "model-00009-of-00024.safetensors",
+    "transformer.layers.18.mlp.down_proj.scales": "model-00009-of-00024.safetensors",
+    "transformer.layers.18.mlp.down_proj.weight": "model-00009-of-00024.safetensors",
+    "transformer.layers.18.mlp.gate_proj.biases": "model-00009-of-00024.safetensors",
+    "transformer.layers.18.mlp.gate_proj.scales": "model-00009-of-00024.safetensors",
+    "transformer.layers.18.mlp.gate_proj.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.18.mlp.up_proj.biases": "model-00010-of-00024.safetensors",
+    "transformer.layers.18.mlp.up_proj.scales": "model-00010-of-00024.safetensors",
+    "transformer.layers.18.mlp.up_proj.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.18.post_attention_layernorm.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.18.self_attn.k_proj.biases": "model-00010-of-00024.safetensors",
+    "transformer.layers.18.self_attn.k_proj.scales": "model-00010-of-00024.safetensors",
+    "transformer.layers.18.self_attn.k_proj.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.18.self_attn.o_proj.biases": "model-00010-of-00024.safetensors",
+    "transformer.layers.18.self_attn.o_proj.scales": "model-00010-of-00024.safetensors",
+    "transformer.layers.18.self_attn.o_proj.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.18.self_attn.q_proj.biases": "model-00010-of-00024.safetensors",
+    "transformer.layers.18.self_attn.q_proj.scales": "model-00010-of-00024.safetensors",
+    "transformer.layers.18.self_attn.q_proj.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.18.self_attn.v_proj.biases": "model-00010-of-00024.safetensors",
+    "transformer.layers.18.self_attn.v_proj.scales": "model-00010-of-00024.safetensors",
+    "transformer.layers.18.self_attn.v_proj.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.input_layernorm.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.mlp.down_proj.biases": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.mlp.down_proj.scales": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.mlp.down_proj.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.mlp.gate_proj.biases": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.mlp.gate_proj.scales": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.mlp.gate_proj.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.mlp.up_proj.biases": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.mlp.up_proj.scales": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.mlp.up_proj.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.post_attention_layernorm.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.self_attn.k_proj.biases": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.self_attn.k_proj.scales": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.self_attn.k_proj.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.self_attn.o_proj.biases": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.self_attn.o_proj.scales": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.self_attn.o_proj.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.self_attn.q_proj.biases": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.self_attn.q_proj.scales": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.self_attn.q_proj.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.self_attn.v_proj.biases": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.self_attn.v_proj.scales": "model-00010-of-00024.safetensors",
+    "transformer.layers.19.self_attn.v_proj.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.2.input_layernorm.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.2.mlp.down_proj.biases": "model-00010-of-00024.safetensors",
+    "transformer.layers.2.mlp.down_proj.scales": "model-00010-of-00024.safetensors",
+    "transformer.layers.2.mlp.down_proj.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.2.mlp.gate_proj.biases": "model-00010-of-00024.safetensors",
+    "transformer.layers.2.mlp.gate_proj.scales": "model-00010-of-00024.safetensors",
+    "transformer.layers.2.mlp.gate_proj.weight": "model-00010-of-00024.safetensors",
+    "transformer.layers.2.mlp.up_proj.biases": "model-00010-of-00024.safetensors",
+    "transformer.layers.2.mlp.up_proj.scales": "model-00010-of-00024.safetensors",
+    "transformer.layers.2.mlp.up_proj.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.2.post_attention_layernorm.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.2.self_attn.k_proj.biases": "model-00011-of-00024.safetensors",
+    "transformer.layers.2.self_attn.k_proj.scales": "model-00011-of-00024.safetensors",
+    "transformer.layers.2.self_attn.k_proj.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.2.self_attn.o_proj.biases": "model-00011-of-00024.safetensors",
+    "transformer.layers.2.self_attn.o_proj.scales": "model-00011-of-00024.safetensors",
+    "transformer.layers.2.self_attn.o_proj.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.2.self_attn.q_proj.biases": "model-00011-of-00024.safetensors",
+    "transformer.layers.2.self_attn.q_proj.scales": "model-00011-of-00024.safetensors",
+    "transformer.layers.2.self_attn.q_proj.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.2.self_attn.v_proj.biases": "model-00011-of-00024.safetensors",
+    "transformer.layers.2.self_attn.v_proj.scales": "model-00011-of-00024.safetensors",
+    "transformer.layers.2.self_attn.v_proj.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.input_layernorm.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.mlp.down_proj.biases": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.mlp.down_proj.scales": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.mlp.down_proj.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.mlp.gate_proj.biases": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.mlp.gate_proj.scales": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.mlp.gate_proj.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.mlp.up_proj.biases": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.mlp.up_proj.scales": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.mlp.up_proj.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.post_attention_layernorm.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.self_attn.k_proj.biases": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.self_attn.k_proj.scales": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.self_attn.k_proj.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.self_attn.o_proj.biases": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.self_attn.o_proj.scales": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.self_attn.o_proj.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.self_attn.q_proj.biases": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.self_attn.q_proj.scales": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.self_attn.q_proj.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.self_attn.v_proj.biases": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.self_attn.v_proj.scales": "model-00011-of-00024.safetensors",
+    "transformer.layers.20.self_attn.v_proj.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.input_layernorm.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.mlp.down_proj.biases": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.mlp.down_proj.scales": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.mlp.down_proj.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.mlp.gate_proj.biases": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.mlp.gate_proj.scales": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.mlp.gate_proj.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.mlp.up_proj.biases": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.mlp.up_proj.scales": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.mlp.up_proj.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.post_attention_layernorm.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.self_attn.k_proj.biases": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.self_attn.k_proj.scales": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.self_attn.k_proj.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.self_attn.o_proj.biases": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.self_attn.o_proj.scales": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.self_attn.o_proj.weight": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.self_attn.q_proj.biases": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.self_attn.q_proj.scales": "model-00011-of-00024.safetensors",
+    "transformer.layers.21.self_attn.q_proj.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.21.self_attn.v_proj.biases": "model-00012-of-00024.safetensors",
+    "transformer.layers.21.self_attn.v_proj.scales": "model-00012-of-00024.safetensors",
+    "transformer.layers.21.self_attn.v_proj.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.input_layernorm.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.mlp.down_proj.biases": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.mlp.down_proj.scales": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.mlp.down_proj.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.mlp.gate_proj.biases": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.mlp.gate_proj.scales": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.mlp.gate_proj.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.mlp.up_proj.biases": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.mlp.up_proj.scales": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.mlp.up_proj.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.post_attention_layernorm.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.self_attn.k_proj.biases": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.self_attn.k_proj.scales": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.self_attn.k_proj.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.self_attn.o_proj.biases": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.self_attn.o_proj.scales": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.self_attn.o_proj.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.self_attn.q_proj.biases": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.self_attn.q_proj.scales": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.self_attn.q_proj.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.self_attn.v_proj.biases": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.self_attn.v_proj.scales": "model-00012-of-00024.safetensors",
+    "transformer.layers.22.self_attn.v_proj.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.input_layernorm.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.mlp.down_proj.biases": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.mlp.down_proj.scales": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.mlp.down_proj.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.mlp.gate_proj.biases": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.mlp.gate_proj.scales": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.mlp.gate_proj.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.mlp.up_proj.biases": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.mlp.up_proj.scales": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.mlp.up_proj.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.post_attention_layernorm.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.self_attn.k_proj.biases": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.self_attn.k_proj.scales": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.self_attn.k_proj.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.self_attn.o_proj.biases": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.self_attn.o_proj.scales": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.self_attn.o_proj.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.self_attn.q_proj.biases": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.self_attn.q_proj.scales": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.self_attn.q_proj.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.self_attn.v_proj.biases": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.self_attn.v_proj.scales": "model-00012-of-00024.safetensors",
+    "transformer.layers.23.self_attn.v_proj.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.24.input_layernorm.weight": "model-00012-of-00024.safetensors",
+    "transformer.layers.24.mlp.down_proj.biases": "model-00012-of-00024.safetensors",
+    "transformer.layers.24.mlp.down_proj.scales": "model-00012-of-00024.safetensors",
+    "transformer.layers.24.mlp.down_proj.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.mlp.gate_proj.biases": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.mlp.gate_proj.scales": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.mlp.gate_proj.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.mlp.up_proj.biases": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.mlp.up_proj.scales": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.mlp.up_proj.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.post_attention_layernorm.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.self_attn.k_proj.biases": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.self_attn.k_proj.scales": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.self_attn.k_proj.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.self_attn.o_proj.biases": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.self_attn.o_proj.scales": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.self_attn.o_proj.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.self_attn.q_proj.biases": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.self_attn.q_proj.scales": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.self_attn.q_proj.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.self_attn.v_proj.biases": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.self_attn.v_proj.scales": "model-00013-of-00024.safetensors",
+    "transformer.layers.24.self_attn.v_proj.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.input_layernorm.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.mlp.down_proj.biases": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.mlp.down_proj.scales": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.mlp.down_proj.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.mlp.gate_proj.biases": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.mlp.gate_proj.scales": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.mlp.gate_proj.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.mlp.up_proj.biases": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.mlp.up_proj.scales": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.mlp.up_proj.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.post_attention_layernorm.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.self_attn.k_proj.biases": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.self_attn.k_proj.scales": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.self_attn.k_proj.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.self_attn.o_proj.biases": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.self_attn.o_proj.scales": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.self_attn.o_proj.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.self_attn.q_proj.biases": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.self_attn.q_proj.scales": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.self_attn.q_proj.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.self_attn.v_proj.biases": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.self_attn.v_proj.scales": "model-00013-of-00024.safetensors",
+    "transformer.layers.25.self_attn.v_proj.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.26.input_layernorm.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.26.mlp.down_proj.biases": "model-00013-of-00024.safetensors",
+    "transformer.layers.26.mlp.down_proj.scales": "model-00013-of-00024.safetensors",
+    "transformer.layers.26.mlp.down_proj.weight": "model-00013-of-00024.safetensors",
+    "transformer.layers.26.mlp.gate_proj.biases": "model-00013-of-00024.safetensors",
+    "transformer.layers.26.mlp.gate_proj.scales": "model-00013-of-00024.safetensors",
+    "transformer.layers.26.mlp.gate_proj.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.26.mlp.up_proj.biases": "model-00014-of-00024.safetensors",
+    "transformer.layers.26.mlp.up_proj.scales": "model-00014-of-00024.safetensors",
+    "transformer.layers.26.mlp.up_proj.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.26.post_attention_layernorm.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.26.self_attn.k_proj.biases": "model-00014-of-00024.safetensors",
+    "transformer.layers.26.self_attn.k_proj.scales": "model-00014-of-00024.safetensors",
+    "transformer.layers.26.self_attn.k_proj.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.26.self_attn.o_proj.biases": "model-00014-of-00024.safetensors",
+    "transformer.layers.26.self_attn.o_proj.scales": "model-00014-of-00024.safetensors",
+    "transformer.layers.26.self_attn.o_proj.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.26.self_attn.q_proj.biases": "model-00014-of-00024.safetensors",
+    "transformer.layers.26.self_attn.q_proj.scales": "model-00014-of-00024.safetensors",
+    "transformer.layers.26.self_attn.q_proj.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.26.self_attn.v_proj.biases": "model-00014-of-00024.safetensors",
+    "transformer.layers.26.self_attn.v_proj.scales": "model-00014-of-00024.safetensors",
+    "transformer.layers.26.self_attn.v_proj.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.input_layernorm.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.mlp.down_proj.biases": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.mlp.down_proj.scales": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.mlp.down_proj.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.mlp.gate_proj.biases": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.mlp.gate_proj.scales": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.mlp.gate_proj.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.mlp.up_proj.biases": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.mlp.up_proj.scales": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.mlp.up_proj.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.post_attention_layernorm.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.self_attn.k_proj.biases": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.self_attn.k_proj.scales": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.self_attn.k_proj.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.self_attn.o_proj.biases": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.self_attn.o_proj.scales": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.self_attn.o_proj.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.self_attn.q_proj.biases": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.self_attn.q_proj.scales": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.self_attn.q_proj.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.self_attn.v_proj.biases": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.self_attn.v_proj.scales": "model-00014-of-00024.safetensors",
+    "transformer.layers.27.self_attn.v_proj.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.3.input_layernorm.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.3.mlp.down_proj.biases": "model-00014-of-00024.safetensors",
+    "transformer.layers.3.mlp.down_proj.scales": "model-00014-of-00024.safetensors",
+    "transformer.layers.3.mlp.down_proj.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.3.mlp.gate_proj.biases": "model-00014-of-00024.safetensors",
+    "transformer.layers.3.mlp.gate_proj.scales": "model-00014-of-00024.safetensors",
+    "transformer.layers.3.mlp.gate_proj.weight": "model-00014-of-00024.safetensors",
+    "transformer.layers.3.mlp.up_proj.biases": "model-00014-of-00024.safetensors",
+    "transformer.layers.3.mlp.up_proj.scales": "model-00014-of-00024.safetensors",
+    "transformer.layers.3.mlp.up_proj.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.3.post_attention_layernorm.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.3.self_attn.k_proj.biases": "model-00015-of-00024.safetensors",
+    "transformer.layers.3.self_attn.k_proj.scales": "model-00015-of-00024.safetensors",
+    "transformer.layers.3.self_attn.k_proj.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.3.self_attn.o_proj.biases": "model-00015-of-00024.safetensors",
+    "transformer.layers.3.self_attn.o_proj.scales": "model-00015-of-00024.safetensors",
+    "transformer.layers.3.self_attn.o_proj.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.3.self_attn.q_proj.biases": "model-00015-of-00024.safetensors",
+    "transformer.layers.3.self_attn.q_proj.scales": "model-00015-of-00024.safetensors",
+    "transformer.layers.3.self_attn.q_proj.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.3.self_attn.v_proj.biases": "model-00015-of-00024.safetensors",
+    "transformer.layers.3.self_attn.v_proj.scales": "model-00015-of-00024.safetensors",
+    "transformer.layers.3.self_attn.v_proj.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.input_layernorm.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.mlp.down_proj.biases": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.mlp.down_proj.scales": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.mlp.down_proj.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.mlp.gate_proj.biases": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.mlp.gate_proj.scales": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.mlp.gate_proj.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.mlp.up_proj.biases": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.mlp.up_proj.scales": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.mlp.up_proj.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.post_attention_layernorm.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.self_attn.k_proj.biases": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.self_attn.k_proj.scales": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.self_attn.k_proj.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.self_attn.o_proj.biases": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.self_attn.o_proj.scales": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.self_attn.o_proj.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.self_attn.q_proj.biases": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.self_attn.q_proj.scales": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.self_attn.q_proj.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.self_attn.v_proj.biases": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.self_attn.v_proj.scales": "model-00015-of-00024.safetensors",
+    "transformer.layers.4.self_attn.v_proj.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.input_layernorm.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.mlp.down_proj.biases": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.mlp.down_proj.scales": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.mlp.down_proj.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.mlp.gate_proj.biases": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.mlp.gate_proj.scales": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.mlp.gate_proj.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.mlp.up_proj.biases": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.mlp.up_proj.scales": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.mlp.up_proj.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.post_attention_layernorm.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.self_attn.k_proj.biases": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.self_attn.k_proj.scales": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.self_attn.k_proj.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.self_attn.o_proj.biases": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.self_attn.o_proj.scales": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.self_attn.o_proj.weight": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.self_attn.q_proj.biases": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.self_attn.q_proj.scales": "model-00015-of-00024.safetensors",
+    "transformer.layers.5.self_attn.q_proj.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.5.self_attn.v_proj.biases": "model-00016-of-00024.safetensors",
+    "transformer.layers.5.self_attn.v_proj.scales": "model-00016-of-00024.safetensors",
+    "transformer.layers.5.self_attn.v_proj.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.input_layernorm.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.mlp.down_proj.biases": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.mlp.down_proj.scales": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.mlp.down_proj.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.mlp.gate_proj.biases": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.mlp.gate_proj.scales": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.mlp.gate_proj.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.mlp.up_proj.biases": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.mlp.up_proj.scales": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.mlp.up_proj.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.post_attention_layernorm.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.self_attn.k_proj.biases": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.self_attn.k_proj.scales": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.self_attn.k_proj.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.self_attn.o_proj.biases": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.self_attn.o_proj.scales": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.self_attn.o_proj.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.self_attn.q_proj.biases": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.self_attn.q_proj.scales": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.self_attn.q_proj.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.self_attn.v_proj.biases": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.self_attn.v_proj.scales": "model-00016-of-00024.safetensors",
+    "transformer.layers.6.self_attn.v_proj.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.input_layernorm.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.mlp.down_proj.biases": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.mlp.down_proj.scales": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.mlp.down_proj.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.mlp.gate_proj.biases": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.mlp.gate_proj.scales": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.mlp.gate_proj.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.mlp.up_proj.biases": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.mlp.up_proj.scales": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.mlp.up_proj.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.post_attention_layernorm.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.self_attn.k_proj.biases": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.self_attn.k_proj.scales": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.self_attn.k_proj.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.self_attn.o_proj.biases": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.self_attn.o_proj.scales": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.self_attn.o_proj.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.self_attn.q_proj.biases": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.self_attn.q_proj.scales": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.self_attn.q_proj.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.self_attn.v_proj.biases": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.self_attn.v_proj.scales": "model-00016-of-00024.safetensors",
+    "transformer.layers.7.self_attn.v_proj.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.8.input_layernorm.weight": "model-00016-of-00024.safetensors",
+    "transformer.layers.8.mlp.down_proj.biases": "model-00016-of-00024.safetensors",
+    "transformer.layers.8.mlp.down_proj.scales": "model-00016-of-00024.safetensors",
+    "transformer.layers.8.mlp.down_proj.weight": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.mlp.gate_proj.biases": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.mlp.gate_proj.scales": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.mlp.gate_proj.weight": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.mlp.up_proj.biases": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.mlp.up_proj.scales": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.mlp.up_proj.weight": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.post_attention_layernorm.weight": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.self_attn.k_proj.biases": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.self_attn.k_proj.scales": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.self_attn.k_proj.weight": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.self_attn.o_proj.biases": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.self_attn.o_proj.scales": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.self_attn.o_proj.weight": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.self_attn.q_proj.biases": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.self_attn.q_proj.scales": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.self_attn.q_proj.weight": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.self_attn.v_proj.biases": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.self_attn.v_proj.scales": "model-00017-of-00024.safetensors",
+    "transformer.layers.8.self_attn.v_proj.weight": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.input_layernorm.weight": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.mlp.down_proj.biases": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.mlp.down_proj.scales": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.mlp.down_proj.weight": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.mlp.gate_proj.biases": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.mlp.gate_proj.scales": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.mlp.gate_proj.weight": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.mlp.up_proj.biases": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.mlp.up_proj.scales": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.mlp.up_proj.weight": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.post_attention_layernorm.weight": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.self_attn.k_proj.biases": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.self_attn.k_proj.scales": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.self_attn.k_proj.weight": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.self_attn.o_proj.biases": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.self_attn.o_proj.scales": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.self_attn.o_proj.weight": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.self_attn.q_proj.biases": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.self_attn.q_proj.scales": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.self_attn.q_proj.weight": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.self_attn.v_proj.biases": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.self_attn.v_proj.scales": "model-00017-of-00024.safetensors",
+    "transformer.layers.9.self_attn.v_proj.weight": "model-00017-of-00024.safetensors",
+    "transformer.norm.weight": "model-00017-of-00024.safetensors",
+    "transformer2.embed_tokens.biases": "model-00017-of-00024.safetensors",
+    "transformer2.embed_tokens.scales": "model-00017-of-00024.safetensors",
+    "transformer2.embed_tokens.weight": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.input_layernorm.weight": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.mlp.down_proj.biases": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.mlp.down_proj.scales": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.mlp.down_proj.weight": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.mlp.gate_proj.biases": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.mlp.gate_proj.scales": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.mlp.gate_proj.weight": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.mlp.up_proj.biases": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.mlp.up_proj.scales": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.mlp.up_proj.weight": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.post_attention_layernorm.weight": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.self_attn.k_proj.biases": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.self_attn.k_proj.scales": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.self_attn.k_proj.weight": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.self_attn.o_proj.biases": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.self_attn.o_proj.scales": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.self_attn.o_proj.weight": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.self_attn.q_proj.biases": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.self_attn.q_proj.scales": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.self_attn.q_proj.weight": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.self_attn.v_proj.biases": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.self_attn.v_proj.scales": "model-00018-of-00024.safetensors",
+    "transformer2.layers.0.self_attn.v_proj.weight": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.input_layernorm.weight": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.mlp.down_proj.biases": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.mlp.down_proj.scales": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.mlp.down_proj.weight": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.mlp.gate_proj.biases": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.mlp.gate_proj.scales": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.mlp.gate_proj.weight": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.mlp.up_proj.biases": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.mlp.up_proj.scales": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.mlp.up_proj.weight": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.post_attention_layernorm.weight": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.self_attn.k_proj.biases": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.self_attn.k_proj.scales": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.self_attn.k_proj.weight": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.self_attn.o_proj.biases": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.self_attn.o_proj.scales": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.self_attn.o_proj.weight": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.self_attn.q_proj.biases": "model-00018-of-00024.safetensors",
+    "transformer2.layers.1.self_attn.q_proj.scales": "model-00019-of-00024.safetensors",
+    "transformer2.layers.1.self_attn.q_proj.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.1.self_attn.v_proj.biases": "model-00019-of-00024.safetensors",
+    "transformer2.layers.1.self_attn.v_proj.scales": "model-00019-of-00024.safetensors",
+    "transformer2.layers.1.self_attn.v_proj.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.input_layernorm.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.mlp.down_proj.biases": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.mlp.down_proj.scales": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.mlp.down_proj.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.mlp.gate_proj.biases": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.mlp.gate_proj.scales": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.mlp.gate_proj.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.mlp.up_proj.biases": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.mlp.up_proj.scales": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.mlp.up_proj.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.post_attention_layernorm.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.self_attn.k_proj.biases": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.self_attn.k_proj.scales": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.self_attn.k_proj.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.self_attn.o_proj.biases": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.self_attn.o_proj.scales": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.self_attn.o_proj.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.self_attn.q_proj.biases": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.self_attn.q_proj.scales": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.self_attn.q_proj.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.self_attn.v_proj.biases": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.self_attn.v_proj.scales": "model-00019-of-00024.safetensors",
+    "transformer2.layers.10.self_attn.v_proj.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.input_layernorm.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.mlp.down_proj.biases": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.mlp.down_proj.scales": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.mlp.down_proj.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.mlp.gate_proj.biases": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.mlp.gate_proj.scales": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.mlp.gate_proj.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.mlp.up_proj.biases": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.mlp.up_proj.scales": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.mlp.up_proj.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.post_attention_layernorm.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.self_attn.k_proj.biases": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.self_attn.k_proj.scales": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.self_attn.k_proj.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.self_attn.o_proj.biases": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.self_attn.o_proj.scales": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.self_attn.o_proj.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.self_attn.q_proj.biases": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.self_attn.q_proj.scales": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.self_attn.q_proj.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.self_attn.v_proj.biases": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.self_attn.v_proj.scales": "model-00019-of-00024.safetensors",
+    "transformer2.layers.11.self_attn.v_proj.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.2.input_layernorm.weight": "model-00019-of-00024.safetensors",
+    "transformer2.layers.2.mlp.down_proj.biases": "model-00019-of-00024.safetensors",
+    "transformer2.layers.2.mlp.down_proj.scales": "model-00019-of-00024.safetensors",
+    "transformer2.layers.2.mlp.down_proj.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.mlp.gate_proj.biases": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.mlp.gate_proj.scales": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.mlp.gate_proj.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.mlp.up_proj.biases": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.mlp.up_proj.scales": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.mlp.up_proj.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.post_attention_layernorm.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.self_attn.k_proj.biases": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.self_attn.k_proj.scales": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.self_attn.k_proj.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.self_attn.o_proj.biases": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.self_attn.o_proj.scales": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.self_attn.o_proj.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.self_attn.q_proj.biases": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.self_attn.q_proj.scales": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.self_attn.q_proj.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.self_attn.v_proj.biases": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.self_attn.v_proj.scales": "model-00020-of-00024.safetensors",
+    "transformer2.layers.2.self_attn.v_proj.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.input_layernorm.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.mlp.down_proj.biases": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.mlp.down_proj.scales": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.mlp.down_proj.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.mlp.gate_proj.biases": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.mlp.gate_proj.scales": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.mlp.gate_proj.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.mlp.up_proj.biases": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.mlp.up_proj.scales": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.mlp.up_proj.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.post_attention_layernorm.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.self_attn.k_proj.biases": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.self_attn.k_proj.scales": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.self_attn.k_proj.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.self_attn.o_proj.biases": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.self_attn.o_proj.scales": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.self_attn.o_proj.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.self_attn.q_proj.biases": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.self_attn.q_proj.scales": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.self_attn.q_proj.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.self_attn.v_proj.biases": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.self_attn.v_proj.scales": "model-00020-of-00024.safetensors",
+    "transformer2.layers.3.self_attn.v_proj.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.4.input_layernorm.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.4.mlp.down_proj.biases": "model-00020-of-00024.safetensors",
+    "transformer2.layers.4.mlp.down_proj.scales": "model-00020-of-00024.safetensors",
+    "transformer2.layers.4.mlp.down_proj.weight": "model-00020-of-00024.safetensors",
+    "transformer2.layers.4.mlp.gate_proj.biases": "model-00020-of-00024.safetensors",
+    "transformer2.layers.4.mlp.gate_proj.scales": "model-00020-of-00024.safetensors",
+    "transformer2.layers.4.mlp.gate_proj.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.4.mlp.up_proj.biases": "model-00021-of-00024.safetensors",
+    "transformer2.layers.4.mlp.up_proj.scales": "model-00021-of-00024.safetensors",
+    "transformer2.layers.4.mlp.up_proj.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.4.post_attention_layernorm.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.4.self_attn.k_proj.biases": "model-00021-of-00024.safetensors",
+    "transformer2.layers.4.self_attn.k_proj.scales": "model-00021-of-00024.safetensors",
+    "transformer2.layers.4.self_attn.k_proj.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.4.self_attn.o_proj.biases": "model-00021-of-00024.safetensors",
+    "transformer2.layers.4.self_attn.o_proj.scales": "model-00021-of-00024.safetensors",
+    "transformer2.layers.4.self_attn.o_proj.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.4.self_attn.q_proj.biases": "model-00021-of-00024.safetensors",
+    "transformer2.layers.4.self_attn.q_proj.scales": "model-00021-of-00024.safetensors",
+    "transformer2.layers.4.self_attn.q_proj.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.4.self_attn.v_proj.biases": "model-00021-of-00024.safetensors",
+    "transformer2.layers.4.self_attn.v_proj.scales": "model-00021-of-00024.safetensors",
+    "transformer2.layers.4.self_attn.v_proj.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.input_layernorm.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.mlp.down_proj.biases": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.mlp.down_proj.scales": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.mlp.down_proj.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.mlp.gate_proj.biases": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.mlp.gate_proj.scales": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.mlp.gate_proj.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.mlp.up_proj.biases": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.mlp.up_proj.scales": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.mlp.up_proj.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.post_attention_layernorm.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.self_attn.k_proj.biases": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.self_attn.k_proj.scales": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.self_attn.k_proj.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.self_attn.o_proj.biases": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.self_attn.o_proj.scales": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.self_attn.o_proj.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.self_attn.q_proj.biases": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.self_attn.q_proj.scales": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.self_attn.q_proj.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.self_attn.v_proj.biases": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.self_attn.v_proj.scales": "model-00021-of-00024.safetensors",
+    "transformer2.layers.5.self_attn.v_proj.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.6.input_layernorm.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.6.mlp.down_proj.biases": "model-00021-of-00024.safetensors",
+    "transformer2.layers.6.mlp.down_proj.scales": "model-00021-of-00024.safetensors",
+    "transformer2.layers.6.mlp.down_proj.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.6.mlp.gate_proj.biases": "model-00021-of-00024.safetensors",
+    "transformer2.layers.6.mlp.gate_proj.scales": "model-00021-of-00024.safetensors",
+    "transformer2.layers.6.mlp.gate_proj.weight": "model-00021-of-00024.safetensors",
+    "transformer2.layers.6.mlp.up_proj.biases": "model-00021-of-00024.safetensors",
+    "transformer2.layers.6.mlp.up_proj.scales": "model-00021-of-00024.safetensors",
+    "transformer2.layers.6.mlp.up_proj.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.6.post_attention_layernorm.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.6.self_attn.k_proj.biases": "model-00022-of-00024.safetensors",
+    "transformer2.layers.6.self_attn.k_proj.scales": "model-00022-of-00024.safetensors",
+    "transformer2.layers.6.self_attn.k_proj.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.6.self_attn.o_proj.biases": "model-00022-of-00024.safetensors",
+    "transformer2.layers.6.self_attn.o_proj.scales": "model-00022-of-00024.safetensors",
+    "transformer2.layers.6.self_attn.o_proj.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.6.self_attn.q_proj.biases": "model-00022-of-00024.safetensors",
+    "transformer2.layers.6.self_attn.q_proj.scales": "model-00022-of-00024.safetensors",
+    "transformer2.layers.6.self_attn.q_proj.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.6.self_attn.v_proj.biases": "model-00022-of-00024.safetensors",
+    "transformer2.layers.6.self_attn.v_proj.scales": "model-00022-of-00024.safetensors",
+    "transformer2.layers.6.self_attn.v_proj.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.input_layernorm.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.mlp.down_proj.biases": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.mlp.down_proj.scales": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.mlp.down_proj.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.mlp.gate_proj.biases": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.mlp.gate_proj.scales": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.mlp.gate_proj.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.mlp.up_proj.biases": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.mlp.up_proj.scales": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.mlp.up_proj.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.post_attention_layernorm.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.self_attn.k_proj.biases": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.self_attn.k_proj.scales": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.self_attn.k_proj.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.self_attn.o_proj.biases": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.self_attn.o_proj.scales": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.self_attn.o_proj.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.self_attn.q_proj.biases": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.self_attn.q_proj.scales": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.self_attn.q_proj.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.self_attn.v_proj.biases": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.self_attn.v_proj.scales": "model-00022-of-00024.safetensors",
+    "transformer2.layers.7.self_attn.v_proj.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.input_layernorm.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.mlp.down_proj.biases": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.mlp.down_proj.scales": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.mlp.down_proj.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.mlp.gate_proj.biases": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.mlp.gate_proj.scales": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.mlp.gate_proj.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.mlp.up_proj.biases": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.mlp.up_proj.scales": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.mlp.up_proj.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.post_attention_layernorm.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.self_attn.k_proj.biases": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.self_attn.k_proj.scales": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.self_attn.k_proj.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.self_attn.o_proj.biases": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.self_attn.o_proj.scales": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.self_attn.o_proj.weight": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.self_attn.q_proj.biases": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.self_attn.q_proj.scales": "model-00022-of-00024.safetensors",
+    "transformer2.layers.8.self_attn.q_proj.weight": "model-00023-of-00024.safetensors",
+    "transformer2.layers.8.self_attn.v_proj.biases": "model-00023-of-00024.safetensors",
+    "transformer2.layers.8.self_attn.v_proj.scales": "model-00023-of-00024.safetensors",
+    "transformer2.layers.8.self_attn.v_proj.weight": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.input_layernorm.weight": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.mlp.down_proj.biases": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.mlp.down_proj.scales": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.mlp.down_proj.weight": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.mlp.gate_proj.biases": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.mlp.gate_proj.scales": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.mlp.gate_proj.weight": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.mlp.up_proj.biases": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.mlp.up_proj.scales": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.mlp.up_proj.weight": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.post_attention_layernorm.weight": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.self_attn.k_proj.biases": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.self_attn.k_proj.scales": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.self_attn.k_proj.weight": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.self_attn.o_proj.biases": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.self_attn.o_proj.scales": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.self_attn.o_proj.weight": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.self_attn.q_proj.biases": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.self_attn.q_proj.scales": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.self_attn.q_proj.weight": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.self_attn.v_proj.biases": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.self_attn.v_proj.scales": "model-00023-of-00024.safetensors",
+    "transformer2.layers.9.self_attn.v_proj.weight": "model-00023-of-00024.safetensors",
+    "transformer2.norm.weight": "model-00023-of-00024.safetensors",
+    "transformer_lm_head.biases": "model-00023-of-00024.safetensors",
+    "transformer_lm_head.scales": "model-00023-of-00024.safetensors",
+    "transformer_lm_head.weight": "model-00023-of-00024.safetensors",
+    "type_info_output_proj.biases": "model-00023-of-00024.safetensors",
+    "type_info_output_proj.scales": "model-00023-of-00024.safetensors",
+    "type_info_output_proj.weight": "model-00024-of-00024.safetensors"
+  }
+}

qwen2_tokenizer/config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "architectures": [
+    "Qwen2ForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "eos_token_id": 151643,
+  "hidden_act": "silu",
+  "hidden_size": 3584,
+  "initializer_range": 0.02,
+  "intermediate_size": 18944,
+  "max_position_embeddings": 131072,
+  "max_window_layers": 28,
+  "model_type": "qwen2",
+  "num_attention_heads": 28,
+  "num_hidden_layers": 28,
+  "num_key_value_heads": 4,
+  "rms_norm_eps": 1e-06,
+  "rope_theta": 1000000.0,
+  "sliding_window": 131072,
+  "tie_word_embeddings": false,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.37.2",
+  "use_cache": true,
+  "use_sliding_window": false,
+  "vocab_size": 152064
+}

qwen2_tokenizer/generation_config.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "bos_token_id": 151643,
+  "do_sample": false,
+  "eos_token_id": 151643,
+  "max_new_tokens": 2048,
+  "transformers_version": "4.37.0"
+}

qwen2_tokenizer/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

qwen2_tokenizer/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

qwen2_tokenizer/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,40 @@

+{
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "151643": {
+      "content": "<|endoftext|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151644": {
+      "content": "<|im_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151645": {
+      "content": "<|im_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": ["<|im_start|>", "<|im_end|>"],
+  "bos_token": null,
+  "chat_template": "{% for message in messages %}{% if loop.first and messages[0]['role'] != 'system' %}{{ '<|im_start|>system\nYou are a helpful assistant<|im_end|>\n' }}{% endif %}{{'<|im_start|>' + message['role'] + '\n' + message['content'] + '<|im_end|>' + '\n'}}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|endoftext|>",
+  "errors": "replace",
+  "model_max_length": 32768,
+  "pad_token": "<|endoftext|>",
+  "split_special_tokens": false,
+  "tokenizer_class": "Qwen2Tokenizer",
+  "unk_token": null
+}

qwen2_tokenizer/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

vocab.yaml ADDED Viewed

	@@ -0,0 +1,13 @@

+- '[verse]'
+- '[chorus]'
+- '[bridge]'
+- '[intro-short]'
+- '[intro-medium]'
+- '[intro-long]'
+- '[outro-short]'
+- '[outro-medium]'
+- '[outro-long]'
+- '[inst-short]'
+- '[inst-medium]'
+- '[inst-long]'
+- '[silence]'