Upload folder using huggingface_hub

Browse files

Files changed (3) hide show

README.md +63 -0
config.json +16 -0
diffusion_pytorch_model.safetensors +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,63 @@

+---
+license: apache-2.0
+base_model: Tongyi-MAI/Z-Image-Turbo
+tags:
+- diffusers
+- text-to-image
+- z-image
+library_name: diffusers
+pipeline_tag: text-to-image
+---
+# beyond-reality-z-image-diffusers
+This is a converted version of the Beyond Reality Z-Image transformer, converted to diffusers format for use with the `ZImagePipeline`.
+## Model Description
+This transformer is based on [Beyond Reality Z-Image](https://huggingface.co/Nurburgring/BEYOND_REALITY_Z_IMAGE), converted from ComfyUI format to diffusers format.
+## Usage
+```python
+import torch
+from diffusers import ZImagePipeline, ZImageTransformer2DModel
+# Load the custom transformer
+transformer = ZImageTransformer2DModel.from_pretrained(
+    "linoyts/beyond-reality-z-image-diffusers",
+    torch_dtype=torch.bfloat16
+)
+# Load the pipeline with custom transformer
+pipe = ZImagePipeline.from_pretrained(
+    "Tongyi-MAI/Z-Image-Turbo",
+    transformer=transformer,
+    torch_dtype=torch.bfloat16,
+)
+pipe.to("cuda")
+# Generate an image
+prompt = "A beautiful landscape with mountains and a lake, photorealistic, 8k"
+image = pipe(
+    prompt=prompt,
+    num_inference_steps=8,
+    guidance_scale=0.0,  # Z-Image-Turbo uses guidance_scale=0
+    width=1024,
+    height=1024,
+).images[0]
+image.save("output.png")
+```
+## Original Model
+- **Source**: [Nurburgring/BEYOND_REALITY_Z_IMAGE](https://huggingface.co/Nurburgring/BEYOND_REALITY_Z_IMAGE)
+- **Base Architecture**: [Tongyi-MAI/Z-Image-Turbo](https://huggingface.co/Tongyi-MAI/Z-Image-Turbo)
+## Conversion Details
+The model was converted from ComfyUI format to diffusers format with the following key transformations:
+- Split combined `attention.qkv` weights into separate `to_q`, `to_k`, `to_v`
+- Renamed `attention.out` to `attention.to_out.0`
+- Renamed normalization layers to match diffusers conventions

config.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "_class_name": "ZImageTransformer2DModel",
+  "_diffusers_version": "0.32.0",
+  "attention_head_dim": 128,
+  "cap_embed_dim": 4096,
+  "in_channels": 16,
+  "joint_attention_dim": 4096,
+  "mlp_ratio": 4.0,
+  "num_attention_heads": 32,
+  "num_layers": 30,
+  "out_channels": 16,
+  "patch_size": 2,
+  "pooled_projection_dim": 4096,
+  "qk_norm": "rms_norm",
+  "text_embed_dim": 4096
+}

diffusion_pytorch_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7798f17b3a89b70ac59ad15ab7c855a43d1e77e48f28d14c2e77f8701951d586
+size 12309893352