Upload 2 files
Browse files- .gitattributes +1 -0
- 0.png +3 -0
- README.md +64 -3
.gitattributes
CHANGED
|
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
|
|
| 33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
| 34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
| 35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
|
|
|
|
|
| 33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
| 34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
| 35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
| 36 |
+
0.png filter=lfs diff=lfs merge=lfs -text
|
0.png
ADDED
|
Git LFS Details
|
README.md
CHANGED
|
@@ -1,3 +1,64 @@
|
|
| 1 |
-
---
|
| 2 |
-
|
| 3 |
-
---
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
---
|
| 2 |
+
base_model:
|
| 3 |
+
- Tongyi-MAI/Z-Image
|
| 4 |
+
base_model_relation: finetune
|
| 5 |
+
frameworks: PyTorch
|
| 6 |
+
language:
|
| 7 |
+
- en
|
| 8 |
+
- zh
|
| 9 |
+
library_name: diffusers
|
| 10 |
+
license: apache-2.0
|
| 11 |
+
pipeline_tag: text-to-image
|
| 12 |
+
tasks:
|
| 13 |
+
- text-to-image-synthesis
|
| 14 |
+
tags:
|
| 15 |
+
- Z
|
| 16 |
+
---
|
| 17 |
+
## Z-Image-Distilled
|
| 18 |
+
|
| 19 |
+
本模型为基于 **Z-Image** 源版本(非Turbo)的**直接蒸馏加速版**,旨在测试Z-Image(non-turbo)版本上训练的LoRA效果,并显著提高推理/测试速度。模型**完全没有融入Z-Image-Turbo的任何权重与风格**,属于基于Z-Image的**纯血版本**,较好地保持了原版Z-Image的适配性、出图随机多样性以及整体图像风格。
|
| 20 |
+
|
| 21 |
+
相比官方Z-Image,推理速度更快(推荐10–20步即可获得较好效果);相比官方Z-Image-Turbo,本模型保留了更强的多样性、更好的LoRA兼容性与可微调潜力,但速度略慢于Turbo(仍远快于原始Z-Image的28~50步)。
|
| 22 |
+
|
| 23 |
+
模型主要适用于:
|
| 24 |
+
- 希望在Z-Image非Turbo基底上训练/测试LoRA的用户
|
| 25 |
+
- 需要比原版更快、但又不想牺牲太多多样性与风格自由度的场景
|
| 26 |
+
- 艺术、插画、概念设计等对随机性与风格多样性有一定要求的生成任务
|
| 27 |
+
- 适配ComfyUI推理 layer prefix == model.diffusion_model
|
| 28 |
+
|
| 29 |
+
<p align="center">
|
| 30 |
+
<img src="0.png" width="1200"/>
|
| 31 |
+
</p>
|
| 32 |
+
|
| 33 |
+
### 使用方法:
|
| 34 |
+
|
| 35 |
+
basic workflow pls refer to: Z-Image-Turbo offical workflow(兼容官方Z-Image-Turbo工作流)
|
| 36 |
+
|
| 37 |
+
推荐推理参数:
|
| 38 |
+
- inference **cfg**: 1.0–2.5(建议1.0~1.8区间,较高值可增强提示贴合度)
|
| 39 |
+
- inference **steps**: 10–20(10步快速预览,15–20步品质更稳定)
|
| 40 |
+
- sampler / scheduler: **Euler / simple**,或 **res_m**,或其他兼容sampler
|
| 41 |
+
|
| 42 |
+
LoRA兼容性良好,权重建议0.6~1.0,根据需求微调。
|
| 43 |
+
|
| 44 |
+
Also on: [Civitai](https://civitai.com/models/958009/redcraft-or-redzimage-or-updated-jan30-or-latest-redzib-dx1)
|
| 45 |
+
#### RedCraft | 红潮造相⚡️REDZimage | Updated-JAN30 | Latest - RedZiB⚡️ DX1蒸馏加速
|
| 46 |
+
|
| 47 |
+
### 当前不足与更新方向
|
| 48 |
+
|
| 49 |
+
**当前主要不足:**
|
| 50 |
+
- 蒸馏过程对**文本(特别是极小尺寸文字)**有一定程度的破坏,渲染清晰度与完整性不如原版Z-Image
|
| 51 |
+
- 色调整体与原版ZI保持一致,但在**个别采样器**下会出现偏色现象(特别是偏蓝色调的表现较为明显)
|
| 52 |
+
|
| 53 |
+
**接下来优化方向:**
|
| 54 |
+
- 进一步稳定 **CFG=1** 情况下 **10步以内** 的生成质量,争取在极低步数下获得更可用、更接近原版风格的结果
|
| 55 |
+
- 优化 **CFG>1** 时的负向提示词遵循表现,提升对负面描述的控制力,减少不需要的元素干扰
|
| 56 |
+
- 持续改善小文字区域的清晰度与可读性,同时尽量维持蒸馏带来的速度优势
|
| 57 |
+
|
| 58 |
+
欢迎各位使用者提供反馈与生成示例,一起推动这个纯血加速方向的迭代!
|
| 59 |
+
|
| 60 |
+
### 模型许可:
|
| 61 |
+
|
| 62 |
+
请遵循 Z-Image 模型的 **Apache-2.0** 许可。
|
| 63 |
+
|
| 64 |
+
Please follow the **Apache-2.0** open source license for the Z-Image model.
|