Instructions to use BennyDaBall/Z-Image-Engineer-V6 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

Libraries

How to use BennyDaBall/Z-Image-Engineer-V6 with Transformers:

# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("text-generation", model="BennyDaBall/Z-Image-Engineer-V6")
messages = [
    {"role": "user", "content": "Who are you?"},
]
pipe(messages)

# Load model directly
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("BennyDaBall/Z-Image-Engineer-V6")
model = AutoModelForCausalLM.from_pretrained("BennyDaBall/Z-Image-Engineer-V6", device_map="auto")
messages = [
    {"role": "user", "content": "Who are you?"},
]
inputs = tokenizer.apply_chat_template(
	messages,
	add_generation_prompt=True,
	tokenize=True,
	return_dict=True,
	return_tensors="pt",
).to(model.device)

outputs = model.generate(**inputs, max_new_tokens=40)
print(tokenizer.decode(outputs[0][inputs["input_ids"].shape[-1]:]))

Inference
Notebooks
Google Colab
Kaggle
Local Apps Settings

vLLM

How to use BennyDaBall/Z-Image-Engineer-V6 with vLLM:

Install from pip and serve model

# Install vLLM from pip:
pip install vllm
# Start the vLLM server:
vllm serve "BennyDaBall/Z-Image-Engineer-V6"
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:8000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "BennyDaBall/Z-Image-Engineer-V6",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker

docker model run hf.co/BennyDaBall/Z-Image-Engineer-V6

SGLang

How to use BennyDaBall/Z-Image-Engineer-V6 with SGLang:

Install from pip and serve model

# Install SGLang from pip:
pip install sglang
# Start the SGLang server:
python3 -m sglang.launch_server \
    --model-path "BennyDaBall/Z-Image-Engineer-V6" \
    --host 0.0.0.0 \
    --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "BennyDaBall/Z-Image-Engineer-V6",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker images

docker run --gpus all \
    --shm-size 32g \
    -p 30000:30000 \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    --env "HF_TOKEN=<secret>" \
    --ipc=host \
    lmsysorg/sglang:latest \
    python3 -m sglang.launch_server \
        --model-path "BennyDaBall/Z-Image-Engineer-V6" \
        --host 0.0.0.0 \
        --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "BennyDaBall/Z-Image-Engineer-V6",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Docker Model Runner
How to use BennyDaBall/Z-Image-Engineer-V6 with Docker Model Runner:
```
docker model run hf.co/BennyDaBall/Z-Image-Engineer-V6
```

BennyDaBall commited on Jun 6

Commit

c8fcd3f

verified ·

1 Parent(s): 2722b8d

Add files using upload-large-folder tool

Browse files

Files changed (22) hide show

.gitattributes +9 -0
HASHES.sha256 +19 -0
README.md +185 -0
RELEASE_MANIFEST.json +204 -0
V6_SYSTEM_PROMPT.md +11 -0
Z-Image-Engineer-V6-F16.gguf +3 -0
Z-Image-Engineer-V6-MXFP4.gguf +3 -0
Z-Image-Engineer-V6-Q3_K_M.gguf +3 -0
Z-Image-Engineer-V6-Q4_K_M.gguf +3 -0
Z-Image-Engineer-V6-Q5_K_M.gguf +3 -0
Z-Image-Engineer-V6-Q6_K.gguf +3 -0
Z-Image-Engineer-V6-Q8_0.gguf +3 -0
chat_template.jinja +89 -0
config.json +71 -0
evidence/gallery_z_image_engineer_v6_simple_ab_with_rewrites_CONTACT.png +3 -0
generation_config.json +10 -0
model-00001-of-00003.safetensors +3 -0
model-00002-of-00003.safetensors +3 -0
model-00003-of-00003.safetensors +3 -0
model.safetensors.index.json +406 -0
tokenizer.json +3 -0
tokenizer_config.json +30 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,12 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+Z-Image-Engineer-V6-Q6_K.gguf filter=lfs diff=lfs merge=lfs -text
+Z-Image-Engineer-V6-F16.gguf filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text
+Z-Image-Engineer-V6-MXFP4.gguf filter=lfs diff=lfs merge=lfs -text
+Z-Image-Engineer-V6-Q3_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+Z-Image-Engineer-V6-Q4_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+Z-Image-Engineer-V6-Q5_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+evidence/gallery_z_image_engineer_v6_simple_ab_with_rewrites_CONTACT.png filter=lfs diff=lfs merge=lfs -text
+Z-Image-Engineer-V6-Q8_0.gguf filter=lfs diff=lfs merge=lfs -text

HASHES.sha256 ADDED Viewed

	@@ -0,0 +1,19 @@

+51FA65C79BB57F058DC7EF8734884BD325FE9D45BB03A61BFEF59785D3BC2DA9  chat_template.jinja
+FABBE298983E905E68B64645E76712189C07776F6D4124648B09C66FA8F6E9CB  config.json
+D8AD1C43FD8C76F1EBDAD11C85D494A474F9CFE9F83AF5F72F590AE3852315A2  evidence/gallery_z_image_engineer_v6_simple_ab_with_rewrites_CONTACT.png
+4667A99763A8A867921429B113A4BDC0E9942D878A51C95F673CCD12355C471D  generation_config.json
+646973887378A236D3CF81292DE5CD631218B940EC0AECF03A16F57890572EFC  model.safetensors.index.json
+C4D12692AE5CEFA9B7E61C2A581062F6B4B06183165EB2BCEEE9E11F26B82308  model-00001-of-00003.safetensors
+93A4CAF2F35B815178DB5CE43C9FD5E06E3EF836F5CBEEE7C690961D95DA653B  model-00002-of-00003.safetensors
+4B3EF3D52BCAD649213FD2035D94DF48CBF2FD670250EC1FD8E1748072ECDBF2  model-00003-of-00003.safetensors
+BF31DA5A1F64F1D7F9AF7C692C82296ED9B2AD59076588BF297E446D6FF54C1C  README.md
+BE75606093DB2094D7CD20F3C2F385C212750648BD6EA4FB2BF507A6A4C55506  tokenizer.json
+154E5FF1E7C152D964EDF30DA854EA62465C767719AC8E97E58BABF2D4FA9079  tokenizer_config.json
+34126E2486E389F28C11693C2E51641199FB5B53E3E7D6BFA75A6E967C11D3CF  V6_SYSTEM_PROMPT.md
+20DAB6305B76B28808FAD740C7107878DEEC63688E1B318F7BB3A7F707220B0D  Z-Image-Engineer-V6-F16.gguf
+A39695B6714FC4A0A86965F5B2FB8B0CBEF774165EEC8FB9B2379FBEDD86838A  Z-Image-Engineer-V6-MXFP4.gguf
+E3F493D971677BA181F67C888AD41E25FD34448BF7EEA03A84F4114EE021B9E3  Z-Image-Engineer-V6-Q3_K_M.gguf
+D666E619EDB2D6DCF2DF013540B22E2592C4FBADB9007B3FB89D4BBE0C4C7C67  Z-Image-Engineer-V6-Q4_K_M.gguf
+0FAB79F032AA34BAAC8607FF8BA720DFB95A0D9A44026DE79288F3FD25A66A05  Z-Image-Engineer-V6-Q5_K_M.gguf
+A27D6723816462EA1368093A76E9013E996BD4B731EF87327334D50D6DD9534C  Z-Image-Engineer-V6-Q6_K.gguf
+DC4F5476A0F804A7DB73EDA164C0503CDA93858F3EABDE9EA36C68EEDCBA306C  Z-Image-Engineer-V6-Q8_0.gguf

README.md ADDED Viewed

	@@ -0,0 +1,185 @@

+---
+license: apache-2.0
+language:
+  - en
+base_model:
+  - Tongyi-MAI/Z-Image-Turbo
+library_name: transformers
+pipeline_tag: text-generation
+tags:
+  - text-generation
+  - prompt-engineering
+  - image-generation
+  - z-image
+  - z-image-turbo
+  - qwen3
+  - gguf
+  - text-encoder
+  - comfyui
+  - lm-studio
+  - conversational
+---
+# Z-Image-Engineer V6 (4B)
+## Model Metadata
+| Key | Value |
+|---|---|
+| **License** | Apache-2.0 |
+| **Language** | English (`en`) |
+| **Base Model** | `Tongyi-MAI/Z-Image-Turbo` |
+| **Library** | `transformers` |
+| **Pipeline Tag** | `text-generation` |
+| **Format** | GGUF, HF Safetensors |
+---
+The **Z-Engineer** returns, fully rebuilt around the **SMART DoRA** training system for Z-Image Turbo.
+Yes, we jump from V4 to V6. Unlike the usual guy math, this one actually brought the extra two inches.
+**Z-Image-Engineer V6** is a fine-tuned 4B Qwen text encoder (`Tongyi-MAI/Z-Image-Turbo`) optimized for dual-role performance: a local prompt-enhancement model for LM Studio, and a direct drop-in replacement text encoder for ComfyUI.
+![Z-Image-Engineer V6 simple A/B with rewrites](evidence/gallery_z_image_engineer_v6_simple_ab_with_rewrites_CONTACT.png)
+---
+## What is Z-Image-Engineer V6?
+V6 transforms minimal seed prompts into rich, highly structured visual narratives. It adds explicit scene composition, lighting direction, material texture, and depth separation while stripping out empty prompt sludge like *"8k, masterpiece, trending on ArtStation."*
+It can also be used directly as a Z-Image text encoder. Drop the GGUF into ComfyUI, load it with `CLIPLoaderGGUF`, set the type to `lumina2`, and compare it against the stock `qwen_3_4b.safetensors`.
+### Key Use Cases
+- **Prompt Enhancement:** Upgrade simple concepts into descriptive, high-fidelity visual prompts locally.
+- **Text Encoder Swap:** Replace the stock Z-Image Qwen text encoder in ComfyUI to generate different conditioning from the same seed.
+- **Hybrid Mode:** Use V6 to rewrite your prompt, then use V6 again to encode it. It writes the scene and drives the image model.
+- **Private Local Workflow:** Built for LM Studio, ComfyUI, and `llama.cpp`. No API logs, no external telemetry.
+---
+## Under the Hood: SMART DoRA
+V4 pioneered SMART training. V6 adapts that system into a **Weight-Decomposed Low-Rank Adaptation (DoRA)** framework.
+DoRA provides surgical adapter updates by decoupling directional and magnitude adjustments. SMART adds auxiliary pressure so the model does not collapse into repetitive prompt loops or superficial sentence patterns.
+| Regularizer | What it Does | Why it Matters |
+|---|---|---|
+| **Entropic** | Broadens output probability diversity. | Reduces repetitive loops and generic vocabulary. |
+| **Holographic** | Enforces structured, depth-wise feature logic. | Improves foreground/background hierarchy. |
+| **Topological** | Stabilizes coherent latent trajectories. | Keeps prompts flowing naturally instead of stalling out. |
+| **Manifold** | Regulates overall weight distributions. | Keeps model behavior stable under high-pressure refinement. |
+### The Refinement Pipeline
+V6 was not a simple one-and-done training run. The final architecture is a blended composite:
+1. **Base Pass:** Master-corpus SMART DoRA training on the native Z-Image Turbo text encoder.
+2. **Retention Pass:** Preservation pressure for numbers, color accuracy, text signage, named objects, actions, and spatial tracking.
+3. **SceneClean SFT32:** Supervised refinement to restore the cinematic V4/base-V6 voice.
+4. **AntiRepeat Binary24:** Binary anti-repeat refinement to reduce loops, abrupt fragments, and bad endings.
+5. **Final Blend:** A 25% style-restoration / 75% anti-repeat DoRA adapter blend, balancing vivid descriptions with tighter syntax.
+---
+## Quick Start
+### LM Studio: Prompt Enhancement
+Download your preferred GGUF quant, load the model, and prompt it directly. No complex system prompt is required.
+```text
+Enhance this image prompt for Z-Image Turbo: a unicorn
+```
+The comparison examples were generated from direct LM Studio user requests like this, with no separate system prompt. `V6_SYSTEM_PROMPT.md` is included only as an optional preset for people who want a stricter prompt-only chat setup.
+### ComfyUI: Direct Encoder Swap
+1. Place the GGUF file into `ComfyUI/models/text_encoders/`.
+2. Add a `CLIPLoaderGGUF` node.
+3. Set model type to `lumina2`.
+4. Use it where the stock Z-Image Qwen text encoder would normally go.
+Optional workflow repo:
+- [ComfyUI-Z-Engineer](https://github.com/BennyDaBall930/ComfyUI-Z-Engineer)
+The raw GGUF works without the node.
+### Verified Image Settings
+```text
+UNET: z_image_turbo_bf16.safetensors
+VAE: ae.safetensors
+Text Encoder: Z-Image-Engineer-V6-Q8_0.gguf
+Resolution: 1024x1024
+Steps: 8
+CFG: 1.0
+Sampler: res_multistep
+Scheduler: simple
+Shift: 3.0
+```
+---
+## Training Specifics
+| Parameter | Specification |
+|---|---|
+| **Base Text Encoder** | `Tongyi-MAI/Z-Image-Turbo/text_encoder` |
+| **Tokenizer** | `Tongyi-MAI/Z-Image-Turbo/tokenizer` |
+| **Method** | SMART DoRA / PEFT Adapter Training |
+| **Rank / Alpha / Dropout** | 64 / 64 / 0.03 |
+| **Target Modules** | `q_proj`, `k_proj`, `v_proj`, `o_proj`, `gate_proj`, `down_proj`, `up_proj` |
+| **Refinement Stack** | Supervised Style SFT + Binary Anti-Repeat |
+| **Final Packaging** | Merged HF safetensors + full GGUF ladder |
+---
+## GGUF Quantization Ladder
+All weights are locally hashed. Full recursive validation hashes are in `HASHES.sha256`.
+| Filename | Size | Target Use Case |
+|---|---:|---|
+| `Z-Image-Engineer-V6-F16.gguf` | 7.498 GiB | Full precision reference. |
+| `Z-Image-Engineer-V6-Q8_0.gguf` | 3.986 GiB | Near-lossless; used for local A/B testing. |
+| `Z-Image-Engineer-V6-Q6_K.gguf` | 3.079 GiB | High-fidelity balanced footprint. |
+| `Z-Image-Engineer-V6-Q5_K_M.gguf` | 2.697 GiB | Daily-driver performance-to-size ratio. |
+| `Z-Image-Engineer-V6-Q4_K_M.gguf` | 2.331 GiB | Reliable 4-bit standard. |
+| `Z-Image-Engineer-V6-Q3_K_M.gguf` | 1.933 GiB | Lightweight option for tighter setups. |
+| `Z-Image-Engineer-V6-MXFP4.gguf` | 2.101 GiB | Alternative compact quantization. |
+---
+## Verification & Proof
+The bundled comparison image is:
+```text
+evidence/gallery_z_image_engineer_v6_simple_ab_with_rewrites_CONTACT.png
+```
+It compares foundational prompts across four isolated control paths:
+1. Stock Encoder + Raw Prompt
+2. V6 Encoder + Raw Prompt
+3. Stock Encoder + V6 LM Studio Rewrite
+4. V6 Encoder + V6 LM Studio Rewrite
+---
+## Disclaimer & Acknowledgements
+This model is a prompt engineer and text encoder. Diffusion is still diffusion; structural expansion improves compositional adherence, but it does not mathematically guarantee a perfect seed every single time. Use creative judgment locally.
+- **Tongyi-MAI** for the Z-Image Turbo ecosystem.
+- **Qwen** for the adaptable text encoder backbone.
+- The open-source maintainers behind **LM Studio**, **ComfyUI**, **llama.cpp**, **PEFT**, and **Transformers**.
+- My local power utility provider, for sustaining the research grid.
+**Built & trained locally with care by BennyDaBall.**

RELEASE_MANIFEST.json ADDED Viewed

	@@ -0,0 +1,204 @@

+{
+    "status":  "upload_ready_user_approved",
+    "public_model_name":  "Z-Image-Engineer-V6",
+    "repo_id":  "BennyDaBall/Z-Image-Engineer-V6",
+    "base_model":  "Tongyi-MAI/Z-Image-Turbo/text_encoder",
+    "tokenizer":  "Tongyi-MAI/Z-Image-Turbo/tokenizer",
+    "files":  [
+                  {
+                      "path":  "chat_template.jinja",
+                      "size_bytes":  4256,
+                      "size_gib":  0,
+                      "sha256":  "51FA65C79BB57F058DC7EF8734884BD325FE9D45BB03A61BFEF59785D3BC2DA9",
+                      "last_write_time":  "2026-06-05T13:35:46"
+                  },
+                  {
+                      "path":  "config.json",
+                      "size_bytes":  1662,
+                      "size_gib":  0,
+                      "sha256":  "FABBE298983E905E68B64645E76712189C07776F6D4124648B09C66FA8F6E9CB",
+                      "last_write_time":  "2026-06-05T13:35:41"
+                  },
+                  {
+                      "path":  "evidence/gallery_z_image_engineer_v6_simple_ab_with_rewrites_CONTACT.png",
+                      "size_bytes":  6174098,
+                      "size_gib":  0.006,
+                      "sha256":  "D8AD1C43FD8C76F1EBDAD11C85D494A474F9CFE9F83AF5F72F590AE3852315A2",
+                      "last_write_time":  "2026-06-05T23:31:26"
+                  },
+                  {
+                      "path":  "generation_config.json",
+                      "size_bytes":  199,
+                      "size_gib":  0,
+                      "sha256":  "4667A99763A8A867921429B113A4BDC0E9942D878A51C95F673CCD12355C471D",
+                      "last_write_time":  "2026-06-05T13:35:46"
+                  },
+                  {
+                      "path":  "model.safetensors.index.json",
+                      "size_bytes":  33261,
+                      "size_gib":  0,
+                      "sha256":  "646973887378A236D3CF81292DE5CD631218B940EC0AECF03A16F57890572EFC",
+                      "last_write_time":  "2026-06-05T13:35:46"
+                  },
+                  {
+                      "path":  "model-00001-of-00003.safetensors",
+                      "size_bytes":  3981503976,
+                      "size_gib":  3.708,
+                      "sha256":  "C4D12692AE5CEFA9B7E61C2A581062F6B4B06183165EB2BCEEE9E11F26B82308",
+                      "last_write_time":  "2026-06-05T13:35:43"
+                  },
+                  {
+                      "path":  "model-00002-of-00003.safetensors",
+                      "size_bytes":  3961229704,
+                      "size_gib":  3.689,
+                      "sha256":  "93A4CAF2F35B815178DB5CE43C9FD5E06E3EF836F5CBEEE7C690961D95DA653B",
+                      "last_write_time":  "2026-06-05T13:35:46"
+                  },
+                  {
+                      "path":  "model-00003-of-00003.safetensors",
+                      "size_bytes":  102247928,
+                      "size_gib":  0.095,
+                      "sha256":  "4B3EF3D52BCAD649213FD2035D94DF48CBF2FD670250EC1FD8E1748072ECDBF2",
+                      "last_write_time":  "2026-06-05T13:35:46"
+                  },
+                  {
+                      "path":  "README.md",
+                      "size_bytes":  7151,
+                      "size_gib":  0,
+                      "sha256":  "BF31DA5A1F64F1D7F9AF7C692C82296ED9B2AD59076588BF297E446D6FF54C1C",
+                      "last_write_time":  "2026-06-06T01:33:41"
+                  },
+                  {
+                      "path":  "tokenizer.json",
+                      "size_bytes":  11422650,
+                      "size_gib":  0.011,
+                      "sha256":  "BE75606093DB2094D7CD20F3C2F385C212750648BD6EA4FB2BF507A6A4C55506",
+                      "last_write_time":  "2026-06-05T13:35:46"
+                  },
+                  {
+                      "path":  "tokenizer_config.json",
+                      "size_bytes":  724,
+                      "size_gib":  0,
+                      "sha256":  "154E5FF1E7C152D964EDF30DA854EA62465C767719AC8E97E58BABF2D4FA9079",
+                      "last_write_time":  "2026-06-05T13:35:46"
+                  },
+                  {
+                      "path":  "V6_SYSTEM_PROMPT.md",
+                      "size_bytes":  1617,
+                      "size_gib":  0,
+                      "sha256":  "34126E2486E389F28C11693C2E51641199FB5B53E3E7D6BFA75A6E967C11D3CF",
+                      "last_write_time":  "2026-05-30T07:33:27"
+                  },
+                  {
+                      "path":  "Z-Image-Engineer-V6-F16.gguf",
+                      "size_bytes":  8051284960,
+                      "size_gib":  7.498,
+                      "sha256":  "20DAB6305B76B28808FAD740C7107878DEEC63688E1B318F7BB3A7F707220B0D",
+                      "last_write_time":  "2026-06-05T13:36:01"
+                  },
+                  {
+                      "path":  "Z-Image-Engineer-V6-MXFP4.gguf",
+                      "size_bytes":  2256005600,
+                      "size_gib":  2.101,
+                      "sha256":  "A39695B6714FC4A0A86965F5B2FB8B0CBEF774165EEC8FB9B2379FBEDD86838A",
+                      "last_write_time":  "2026-06-05T22:48:03"
+                  },
+                  {
+                      "path":  "Z-Image-Engineer-V6-Q3_K_M.gguf",
+                      "size_bytes":  2075617760,
+                      "size_gib":  1.933,
+                      "sha256":  "E3F493D971677BA181F67C888AD41E25FD34448BF7EEA03A84F4114EE021B9E3",
+                      "last_write_time":  "2026-06-05T22:47:54"
+                  },
+                  {
+                      "path":  "Z-Image-Engineer-V6-Q4_K_M.gguf",
+                      "size_bytes":  2503178720,
+                      "size_gib":  2.331,
+                      "sha256":  "D666E619EDB2D6DCF2DF013540B22E2592C4FBADB9007B3FB89D4BBE0C4C7C67",
+                      "last_write_time":  "2026-06-05T22:47:42"
+                  },
+                  {
+                      "path":  "Z-Image-Engineer-V6-Q5_K_M.gguf",
+                      "size_bytes":  2895780320,
+                      "size_gib":  2.697,
+                      "sha256":  "0FAB79F032AA34BAAC8607FF8BA720DFB95A0D9A44026DE79288F3FD25A66A05",
+                      "last_write_time":  "2026-06-05T22:47:26"
+                  },
+                  {
+                      "path":  "Z-Image-Engineer-V6-Q6_K.gguf",
+                      "size_bytes":  3306260960,
+                      "size_gib":  3.079,
+                      "sha256":  "A27D6723816462EA1368093A76E9013E996BD4B731EF87327334D50D6DD9534C",
+                      "last_write_time":  "2026-06-05T22:47:11"
+                  },
+                  {
+                      "path":  "Z-Image-Engineer-V6-Q8_0.gguf",
+                      "size_bytes":  4280404960,
+                      "size_gib":  3.986,
+                      "sha256":  "DC4F5476A0F804A7DB73EDA164C0503CDA93858F3EABDE9EA36C68EEDCBA306C",
+                      "last_write_time":  "2026-06-05T22:46:50"
+                  }
+              ],
+    "ggufs":  [
+                  {
+                      "path":  "Z-Image-Engineer-V6-F16.gguf",
+                      "size_bytes":  8051284960,
+                      "size_gib":  7.498,
+                      "sha256":  "20DAB6305B76B28808FAD740C7107878DEEC63688E1B318F7BB3A7F707220B0D",
+                      "last_write_time":  "2026-06-05T13:36:01"
+                  },
+                  {
+                      "path":  "Z-Image-Engineer-V6-MXFP4.gguf",
+                      "size_bytes":  2256005600,
+                      "size_gib":  2.101,
+                      "sha256":  "A39695B6714FC4A0A86965F5B2FB8B0CBEF774165EEC8FB9B2379FBEDD86838A",
+                      "last_write_time":  "2026-06-05T22:48:03"
+                  },
+                  {
+                      "path":  "Z-Image-Engineer-V6-Q3_K_M.gguf",
+                      "size_bytes":  2075617760,
+                      "size_gib":  1.933,
+                      "sha256":  "E3F493D971677BA181F67C888AD41E25FD34448BF7EEA03A84F4114EE021B9E3",
+                      "last_write_time":  "2026-06-05T22:47:54"
+                  },
+                  {
+                      "path":  "Z-Image-Engineer-V6-Q4_K_M.gguf",
+                      "size_bytes":  2503178720,
+                      "size_gib":  2.331,
+                      "sha256":  "D666E619EDB2D6DCF2DF013540B22E2592C4FBADB9007B3FB89D4BBE0C4C7C67",
+                      "last_write_time":  "2026-06-05T22:47:42"
+                  },
+                  {
+                      "path":  "Z-Image-Engineer-V6-Q5_K_M.gguf",
+                      "size_bytes":  2895780320,
+                      "size_gib":  2.697,
+                      "sha256":  "0FAB79F032AA34BAAC8607FF8BA720DFB95A0D9A44026DE79288F3FD25A66A05",
+                      "last_write_time":  "2026-06-05T22:47:26"
+                  },
+                  {
+                      "path":  "Z-Image-Engineer-V6-Q6_K.gguf",
+                      "size_bytes":  3306260960,
+                      "size_gib":  3.079,
+                      "sha256":  "A27D6723816462EA1368093A76E9013E996BD4B731EF87327334D50D6DD9534C",
+                      "last_write_time":  "2026-06-05T22:47:11"
+                  },
+                  {
+                      "path":  "Z-Image-Engineer-V6-Q8_0.gguf",
+                      "size_bytes":  4280404960,
+                      "size_gib":  3.986,
+                      "sha256":  "DC4F5476A0F804A7DB73EDA164C0503CDA93858F3EABDE9EA36C68EEDCBA306C",
+                      "last_write_time":  "2026-06-05T22:46:50"
+                  }
+              ],
+    "evidence":  [
+                     {
+                         "path":  "evidence/gallery_z_image_engineer_v6_simple_ab_with_rewrites_CONTACT.png",
+                         "size_bytes":  6174098,
+                         "size_gib":  0.006,
+                         "sha256":  "D8AD1C43FD8C76F1EBDAD11C85D494A474F9CFE9F83AF5F72F590AE3852315A2",
+                         "last_write_time":  "2026-06-05T23:31:26"
+                     }
+                 ],
+    "generated_at_local":  "2026-06-06T01:35:03",
+    "upload_approved_by_user":  true
+}

V6_SYSTEM_PROMPT.md ADDED Viewed

	@@ -0,0 +1,11 @@

+# Z-Image-Engineer V6 System Prompt
+Base model: `Tongyi-MAI/Z-Image-Turbo/text_encoder`
+Tokenizer: `Tongyi-MAI/Z-Image-Turbo/tokenizer`
+Output contract: one prompt-only paragraph.
+```text
+You are Z-Image-Engineer V6, a prompt-only cinematography and visual-language specialist for the Tongyi-MAI Z-Image-Turbo Qwen text encoder. Convert the user's seed into one polished natural-language image prompt that the text encoder can bind cleanly to the diffusion model. Preserve every explicit subject, object, relationship, count, name, written word, action, style request, composition constraint, and safety constraint from the seed. Use positive constraints: describe what must appear and how it should look, instead of writing negative-prompt fragments. Keep compact constraint phrases contiguous when possible, such as written text, counts, colors, named objects, and spatial terms; do not hide them by inserting extra adjectives inside the phrase. Build the prompt around semantic cinematography: clear visual hierarchy, foreground/midground/background relationships, lens and depth cues, lighting direction and quality, material texture, color palette, atmosphere, era, medium, and controlled style language. Prefer coherent sentences over tag soup, keyword stacks, markdown, analysis, or meta commentary. Never include camera body brands, prompt labels, alternatives, apologies, reasoning traces, assistant chatter, or negative prompt sections. Aim for roughly 180-250 words unless the user explicitly asks for a shorter or longer prompt. Return only the final image prompt as one self-contained paragraph.
+```

Z-Image-Engineer-V6-F16.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:20dab6305b76b28808fad740c7107878deec63688e1b318f7bb3a7f707220b0d
+size 8051284960

Z-Image-Engineer-V6-MXFP4.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a39695b6714fc4a0a86965f5b2fb8b0cbef774165eec8fb9b2379fbedd86838a
+size 2256005600

Z-Image-Engineer-V6-Q3_K_M.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e3f493d971677ba181f67c888ad41e25fd34448bf7eea03a84f4114ee021b9e3
+size 2075617760

Z-Image-Engineer-V6-Q4_K_M.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d666e619edb2d6dcf2df013540b22e2592c4fbadb9007b3fb89d4bbe0c4c7c67
+size 2503178720

Z-Image-Engineer-V6-Q5_K_M.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0fab79f032aa34baac8607ff8ba720dfb95a0d9a44026de79288f3fd25a66a05
+size 2895780320

Z-Image-Engineer-V6-Q6_K.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a27d6723816462ea1368093a76e9013e996bd4b731ef87327334d50d6dd9534c
+size 3306260960

Z-Image-Engineer-V6-Q8_0.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dc4f5476a0f804a7db73eda164c0503cda93858f3eabde9ea36c68eedcba306c
+size 4280404960

chat_template.jinja ADDED Viewed

	@@ -0,0 +1,89 @@

+{%- if tools %}
+    {{- '<|im_start|>system\n' }}
+    {%- if messages[0].role == 'system' %}
+        {{- messages[0].content + '\n\n' }}
+    {%- endif %}
+    {{- "# Tools\n\nYou may call one or more functions to assist with the user query.\n\nYou are provided with function signatures within <tools></tools> XML tags:\n<tools>" }}
+    {%- for tool in tools %}
+        {{- "\n" }}
+        {{- tool | tojson }}
+    {%- endfor %}
+    {{- "\n</tools>\n\nFor each function call, return a json object with function name and arguments within <tool_call></tool_call> XML tags:\n<tool_call>\n{\"name\": <function-name>, \"arguments\": <args-json-object>}\n</tool_call><|im_end|>\n" }}
+{%- else %}
+    {%- if messages[0].role == 'system' %}
+        {{- '<|im_start|>system\n' + messages[0].content + '<|im_end|>\n' }}
+    {%- endif %}
+{%- endif %}
+{%- set ns = namespace(multi_step_tool=true, last_query_index=messages|length - 1) %}
+{%- for message in messages[::-1] %}
+    {%- set index = (messages|length - 1) - loop.index0 %}
+    {%- if ns.multi_step_tool and message.role == "user" and message.content is string and not(message.content.startswith('<tool_response>') and message.content.endswith('</tool_response>')) %}
+        {%- set ns.multi_step_tool = false %}
+        {%- set ns.last_query_index = index %}
+    {%- endif %}
+{%- endfor %}
+{%- for message in messages %}
+    {%- if message.content is string %}
+        {%- set content = message.content %}
+    {%- else %}
+        {%- set content = '' %}
+    {%- endif %}
+    {%- if (message.role == "user") or (message.role == "system" and not loop.first) %}
+        {{- '<|im_start|>' + message.role + '\n' + content + '<|im_end|>' + '\n' }}
+    {%- elif message.role == "assistant" %}
+        {%- set reasoning_content = '' %}
+        {%- if message.reasoning_content is string %}
+            {%- set reasoning_content = message.reasoning_content %}
+        {%- else %}
+            {%- if '</think>' in content %}
+                {%- set reasoning_content = content.split('</think>')[0].rstrip('\n').split('<think>')[-1].lstrip('\n') %}
+                {%- set content = content.split('</think>')[-1].lstrip('\n') %}
+            {%- endif %}
+        {%- endif %}
+        {%- if loop.index0 > ns.last_query_index %}
+            {%- if loop.last or (not loop.last and reasoning_content) %}
+                {{- '<|im_start|>' + message.role + '\n<think>\n' + reasoning_content.strip('\n') + '\n</think>\n\n' + content.lstrip('\n') }}
+            {%- else %}
+                {{- '<|im_start|>' + message.role + '\n' + content }}
+            {%- endif %}
+        {%- else %}
+            {{- '<|im_start|>' + message.role + '\n' + content }}
+        {%- endif %}
+        {%- if message.tool_calls %}
+            {%- for tool_call in message.tool_calls %}
+                {%- if (loop.first and content) or (not loop.first) %}
+                    {{- '\n' }}
+                {%- endif %}
+                {%- if tool_call.function %}
+                    {%- set tool_call = tool_call.function %}
+                {%- endif %}
+                {{- '<tool_call>\n{"name": "' }}
+                {{- tool_call.name }}
+                {{- '", "arguments": ' }}
+                {%- if tool_call.arguments is string %}
+                    {{- tool_call.arguments }}
+                {%- else %}
+                    {{- tool_call.arguments | tojson }}
+                {%- endif %}
+                {{- '}\n</tool_call>' }}
+            {%- endfor %}
+        {%- endif %}
+        {{- '<|im_end|>\n' }}
+    {%- elif message.role == "tool" %}
+        {%- if loop.first or (messages[loop.index0 - 1].role != "tool") %}
+            {{- '<|im_start|>user' }}
+        {%- endif %}
+        {{- '\n<tool_response>\n' }}
+        {{- content }}
+        {{- '\n</tool_response>' }}
+        {%- if loop.last or (messages[loop.index0 + 1].role != "tool") %}
+            {{- '<|im_end|>\n' }}
+        {%- endif %}
+    {%- endif %}
+{%- endfor %}
+{%- if add_generation_prompt %}
+    {{- '<|im_start|>assistant\n' }}
+    {%- if enable_thinking is defined and enable_thinking is false %}
+        {{- '<think>\n\n</think>\n\n' }}
+    {%- endif %}
+{%- endif %}

config.json ADDED Viewed

	@@ -0,0 +1,71 @@

+{
+  "architectures": [
+    "Qwen3ForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "dtype": "float16",
+  "eos_token_id": 151645,
+  "head_dim": 128,
+  "hidden_act": "silu",
+  "hidden_size": 2560,
+  "initializer_range": 0.02,
+  "intermediate_size": 9728,
+  "layer_types": [
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention"
+  ],
+  "max_position_embeddings": 40960,
+  "max_window_layers": 36,
+  "model_type": "qwen3",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 36,
+  "num_key_value_heads": 8,
+  "pad_token_id": null,
+  "rms_norm_eps": 1e-06,
+  "rope_parameters": {
+    "rope_theta": 1000000,
+    "rope_type": "default"
+  },
+  "sliding_window": null,
+  "tie_word_embeddings": true,
+  "transformers_version": "5.7.0",
+  "use_cache": true,
+  "use_sliding_window": false,
+  "vocab_size": 151936
+}

evidence/gallery_z_image_engineer_v6_simple_ab_with_rewrites_CONTACT.png ADDED Viewed

Git LFS Details

SHA256: d8ad1c43fd8c76f1ebdad11c85d494a474f9cfe9f83af5f72f590ae3852315a2
Pointer size: 132 Bytes
Size of remote file: 6.17 MB

generation_config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "do_sample": true,
+  "eos_token_id": 151645,
+  "max_new_tokens": 320,
+  "pad_token_id": 151643,
+  "temperature": 0.2,
+  "top_k": 40,
+  "top_p": 0.9,
+  "transformers_version": "5.7.0"
+}

model-00001-of-00003.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c4d12692ae5cefa9b7e61c2a581062f6b4b06183165eb2bceee9e11f26b82308
+size 3981503976

model-00002-of-00003.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:93a4caf2f35b815178db5ce43c9fd5e06e3ef836f5cbeee7c690961d95da653b
+size 3961229704

model-00003-of-00003.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4b3ef3d52bcad649213fd2035d94df48cbf2fd670250ec1fd8e1748072ecdbf2
+size 102247928

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,406 @@

+{
+  "metadata": {
+    "total_parameters": 4022468096,
+    "total_size": 8044936192
+  },
+  "weight_map": {
+    "model.embed_tokens.weight": "model-00001-of-00003.safetensors",
+    "model.layers.0.input_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.0.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.0.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.0.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.0.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.0.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.0.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.0.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.0.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.0.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.0.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.1.input_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.1.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.1.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.1.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.1.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.1.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.1.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.1.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.1.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.1.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.1.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.10.input_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.10.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.10.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.10.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.10.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.10.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.10.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.10.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.10.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.10.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.10.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.11.input_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.11.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.11.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.11.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.11.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.11.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.11.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.11.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.11.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.11.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.11.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.12.input_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.12.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.12.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.12.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.12.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.12.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.12.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.12.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.12.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.12.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.12.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.13.input_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.13.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.13.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.13.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.13.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.13.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.13.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.13.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.13.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.13.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.13.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.14.input_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.14.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.14.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.14.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.14.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.14.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.14.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.14.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.14.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.14.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.14.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.15.input_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.15.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.15.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.15.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.15.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.15.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.15.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.15.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.15.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.15.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.15.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.16.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.16.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.16.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.16.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.16.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.16.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.16.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.16.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.16.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.16.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.16.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.17.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.17.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.17.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.17.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.17.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.17.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.17.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.17.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.17.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.17.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.17.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.18.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.18.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.18.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.18.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.18.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.18.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.18.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.18.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.18.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.18.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.18.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.19.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.19.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.19.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.19.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.19.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.19.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.19.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.19.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.19.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.19.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.19.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.2.input_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.2.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.2.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.2.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.2.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.2.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.2.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.2.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.2.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.2.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.2.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.20.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.20.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.20.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.20.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.20.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.20.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.20.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.20.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.20.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.20.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.20.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.21.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.21.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.21.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.21.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.21.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.21.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.21.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.21.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.21.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.21.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.21.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.22.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.22.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.22.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.22.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.22.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.22.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.22.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.22.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.22.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.22.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.22.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.23.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.23.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.23.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.23.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.23.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.23.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.23.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.23.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.23.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.23.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.23.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.24.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.24.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.24.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.24.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.24.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.24.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.24.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.24.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.24.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.24.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.24.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.25.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.25.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.25.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.25.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.25.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.25.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.25.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.25.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.25.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.25.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.25.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.26.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.26.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.26.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.26.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.26.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.26.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.26.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.26.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.26.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.26.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.26.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.27.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.27.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.27.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.27.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.27.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.27.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.27.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.27.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.27.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.27.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.27.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.28.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.28.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.28.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.28.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.28.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.28.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.28.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.28.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.28.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.28.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.28.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.29.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.29.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.29.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.29.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.29.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.29.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.29.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.29.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.29.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.29.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.29.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.3.input_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.3.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.3.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.3.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.3.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.3.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.3.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.3.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.3.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.3.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.3.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.30.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.30.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.30.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.30.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.30.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.30.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.30.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.30.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.30.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.30.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.30.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.31.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.31.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.31.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.31.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.31.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.31.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.31.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.31.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.31.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.31.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.31.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.32.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.32.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.32.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.32.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.32.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.32.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.32.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.32.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.32.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.32.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.32.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.33.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.33.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.33.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.33.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.33.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.33.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.33.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.33.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.33.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.33.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.33.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.34.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.34.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.34.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.34.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.34.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.34.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.34.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.34.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.34.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.34.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.34.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.35.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "model.layers.35.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.35.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "model.layers.35.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
+    "model.layers.35.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
+    "model.layers.35.self_attn.k_norm.weight": "model-00003-of-00003.safetensors",
+    "model.layers.35.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
+    "model.layers.35.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
+    "model.layers.35.self_attn.q_norm.weight": "model-00003-of-00003.safetensors",
+    "model.layers.35.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
+    "model.layers.35.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
+    "model.layers.4.input_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.4.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.4.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.4.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.4.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.4.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.4.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.4.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.4.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.4.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.4.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.5.input_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.5.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.5.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.5.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.5.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.5.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.5.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.5.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.5.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.5.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.5.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.6.input_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.6.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.6.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.6.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.6.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.6.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.6.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.6.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.6.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.6.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.6.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.7.input_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.7.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.7.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.7.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.7.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.7.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.7.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.7.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.7.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.7.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.7.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.8.input_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.8.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.8.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.8.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.8.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.8.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.8.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.8.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.8.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.8.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.8.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.9.input_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.9.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.9.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.9.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.9.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.9.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.9.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.9.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.9.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
+    "model.layers.9.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
+    "model.layers.9.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
+    "model.norm.weight": "model-00003-of-00003.safetensors"
+  }
+}

tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:be75606093db2094d7cd20f3c2f385c212750648bd6ea4fb2bf507a6a4c55506
+size 11422650

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "add_prefix_space": false,
+  "backend": "tokenizers",
+  "bos_token": null,
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|im_end|>",
+  "errors": "replace",
+  "extra_special_tokens": [
+    "<|im_start|>",
+    "<|im_end|>",
+    "<|object_ref_start|>",
+    "<|object_ref_end|>",
+    "<|box_start|>",
+    "<|box_end|>",
+    "<|quad_start|>",
+    "<|quad_end|>",
+    "<|vision_start|>",
+    "<|vision_end|>",
+    "<|vision_pad|>",
+    "<|image_pad|>",
+    "<|video_pad|>"
+  ],
+  "is_local": false,
+  "local_files_only": false,
+  "model_max_length": 131072,
+  "pad_token": "<|endoftext|>",
+  "split_special_tokens": false,
+  "tokenizer_class": "Qwen2Tokenizer",
+  "unk_token": null
+}