Tonera
/

FLUX.2-klein-4B-int8-diffusers

Diffusion Single File

Flux2KleinPipeline

Model card Files Files and versions

Tonera commited on 4 days ago

Commit

ed078b8

·

verified ·

1 Parent(s): ae4c1a2

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -24,7 +24,7 @@ For more information, please read our [blog post](https://bfl.ai/blog/flux2-klei
 This model is a quantized version optimized for efficient inference:
-- **Transformer**: Quantized using TorchAo fp8  (float8wo) quantization, significantly reducing model size while maintaining generation quality.
 - **Text Encoder**: Replaced with `unsloth/Qwen3-4B-unsloth-bnb-4bit`, a 4-bit quantized version that further reduces memory requirements.
 - **Memory Usage**: Peak VRAM consumption is approximately **9GB**.
 - **Performance**: Generates images in approximately **0.1 seconds** (4 steps)on RTX 5090 GPUs.

 This model is a quantized version optimized for efficient inference:
+- **Transformer**: Quantized using TorchAo int8  (int8wo) quantization, significantly reducing model size while maintaining generation quality.
 - **Text Encoder**: Replaced with `unsloth/Qwen3-4B-unsloth-bnb-4bit`, a 4-bit quantized version that further reduces memory requirements.
 - **Memory Usage**: Peak VRAM consumption is approximately **9GB**.
 - **Performance**: Generates images in approximately **0.1 seconds** (4 steps)on RTX 5090 GPUs.