Buckets:

hf-doc-build
/

doc

Files

xet

hf-doc-build/doc / optimum-neuron /v0.4.0 /en /model_doc /diffusers /flux.md

rtrm

about 2 months ago

preview code

download

raw

14.1 kB

	# Flux

	Flux is a series of text-to-image generation models based on diffusion transformers.

	> [!TIP]
	> We recommend using a `inf2.24xlarge` instance with tensor parallel size 8 for the model compilation and inference.

	### Export to Neuron

	* Option 1: CLI

	```bash
	optimum-cli export neuron --model black-forest-labs/FLUX.1-dev --tensor_parallel_size 8 --batch_size 1 --height 1024 --width 1024 --num_images_per_prompt 1 --torch_dtype bfloat16 flux_dev_neuron/
	```

	* Option 2: Python API

	```python
	from optimum.neuron import NeuronFluxPipeline

	if __name__ == "__main__":
	compiler_args = {"auto_cast": "none"}
	input_shapes = {"batch_size": 1, "height": 1024, "width": 1024}

	pipe = NeuronFluxPipeline.from_pretrained(
	"black-forest-labs/FLUX.1-dev",
	torch_dtype=torch.bfloat16,
	export=True,
	tensor_parallel_size=8,
	**compiler_args,
	**input_shapes
	)

	# Save locally
	pipe.save_pretrained("flux_dev_neuron_1024_tp8/")

	# Upload to the HuggingFace Hub
	pipe.push_to_hub(
	"flux_dev_neuron_1024_tp8/", repository_id="Jingya/FLUX.1-dev-neuronx-1024x1024-tp8" # Replace with your HF Hub repo id
	)
	```

	## Guidance-distilled

	* The guidance-distilled variant takes about 50 sampling steps for good-quality generation.

	```python
	from optimum.neuron import NeuronFluxPipeline

	pipe = NeuronFluxPipeline.from_pretrained("flux_dev_neuron_1024_tp8/")
	prompt = "A cat holding a sign that says hello world"
	out = pipe(
	prompt,
	guidance_scale=3.5,
	num_inference_steps=50,
	generator=torch.Generator("cpu").manual_seed(0)
	).images[0]
	out.save("flux_optimum.png")
	```

	<img
	src="https://huggingface.co/datasets/Jingya/document_images/resolve/main/optimum/neuron/flux_optimum.png"
	width="256"
	height="256"
	alt="Flux dev generated image."
	/>

	## Timestep-distilled

	* max_sequence_length cannot be more than 256.
	* guidance_scale needs to be 0.
	* As this is a timestep-distilled model, it benefits from fewer sampling steps.

	```bash
	optimum-cli export neuron --model black-forest-labs/FLUX.1-schnell --tensor_parallel_size 8 --batch_size 1 --height 1024 --width 1024 --num_images_per_prompt 1 --sequence_length 256 --torch_dtype bfloat16 flux_schnell_neuron_1024_tp8/
	```

	```python
	import torch
	from optimum.neuron import NeuronFluxPipeline

	pipe = NeuronFluxPipeline.from_pretrained("flux_schnell_neuron_1024_tp8")
	prompt = "A cat holding a sign that says hello world"
	out = pipe(prompt, max_sequence_length=256, num_inference_steps=4).images[0]
	```

	<img
	src="https://huggingface.co/datasets/Jingya/document_images/resolve/main/optimum/neuron/flux_schnell_optimum.png"
	width="256"
	height="256"
	alt="Flux schnell generated image."
	/>

	## NeuronFluxPipeline[[optimum.neuron.NeuronFluxPipeline]]

	The Flux pipeline for text-to-image generation.

	<div class="docstring border-l-2 border-t-2 pl-4 pt-3.5 border-gray-100 rounded-tl-xl mb-6 mt-8">


	<docstring><name>class optimum.neuron.NeuronFluxPipeline</name><anchor>optimum.neuron.NeuronFluxPipeline</anchor><source>https://github.com/huggingface/optimum-neuron/blob/v0.4.0/optimum/neuron/modeling_diffusion.py#L1631</source><parameters>[{"name": "config", "val": ": dict[str, typing.Any]"}, {"name": "configs", "val": ": dict[str, 'PretrainedConfig']"}, {"name": "neuron_configs", "val": ": dict[str, 'NeuronDefaultConfig']"}, {"name": "data_parallel_mode", "val": ": typing.Literal['none', 'unet', 'transformer', 'all']"}, {"name": "scheduler", "val": ": diffusers.schedulers.scheduling_utils.SchedulerMixin \| None"}, {"name": "vae_decoder", "val": ": torch.jit._script.ScriptModule \| NeuronModelVaeDecoder"}, {"name": "text_encoder", "val": ": torch.jit._script.ScriptModule \| NeuronModelTextEncoder \| None = None"}, {"name": "text_encoder_2", "val": ": torch.jit._script.ScriptModule \| NeuronModelTextEncoder \| None = None"}, {"name": "unet", "val": ": torch.jit._script.ScriptModule \| NeuronModelUnet \| None = None"}, {"name": "transformer", "val": ": torch.jit._script.ScriptModule \| NeuronModelTransformer \| None = None"}, {"name": "vae_encoder", "val": ": torch.jit._script.ScriptModule \| NeuronModelVaeEncoder \| None = None"}, {"name": "image_encoder", "val": ": torch.jit._script.ScriptModule \| None = None"}, {"name": "safety_checker", "val": ": torch.jit._script.ScriptModule \| None = None"}, {"name": "tokenizer", "val": ": transformers.models.clip.tokenization_clip.CLIPTokenizer \| transformers.models.t5.tokenization_t5.T5Tokenizer \| None = None"}, {"name": "tokenizer_2", "val": ": transformers.models.clip.tokenization_clip.CLIPTokenizer \| None = None"}, {"name": "feature_extractor", "val": ": transformers.models.clip.feature_extraction_clip.CLIPFeatureExtractor \| None = None"}, {"name": "controlnet", "val": ": torch.jit._script.ScriptModule \| list[torch.jit._script.ScriptModule]\| NeuronControlNetModel \| NeuronMultiControlNetModel \| None = None"}, {"name": "requires_aesthetics_score", "val": ": bool = False"}, {"name": "force_zeros_for_empty_prompt", "val": ": bool = True"}, {"name": "add_watermarker", "val": ": bool \| None = None"}, {"name": "model_save_dir", "val": ": str \| pathlib.Path \| tempfile.TemporaryDirectory \| None = None"}, {"name": "model_and_config_save_paths", "val": ": dict[str, tuple[str, pathlib.Path]] \| None = None"}]</parameters></docstring>



	<div class="docstring border-l-2 border-t-2 pl-4 pt-3.5 border-gray-100 rounded-tl-xl mb-6 mt-8">


	<docstring><name>__call__</name><anchor>optimum.neuron.NeuronFluxPipeline.__call__</anchor><source>https://github.com/huggingface/optimum-neuron/blob/v0.4.0/optimum/neuron/modeling_diffusion.py#L1106</source><parameters>[{"name": "args", "val": ""}, {"name": "*kwargs", "val": ""}]</parameters></docstring>


	</div></div>

	## NeuronFluxInpaintPipeline[[optimum.neuron.NeuronFluxInpaintPipeline]]

	The Flux pipeline for image inpainting.

	<div class="docstring border-l-2 border-t-2 pl-4 pt-3.5 border-gray-100 rounded-tl-xl mb-6 mt-8">


	<docstring><name>class optimum.neuron.NeuronFluxInpaintPipeline</name><anchor>optimum.neuron.NeuronFluxInpaintPipeline</anchor><source>https://github.com/huggingface/optimum-neuron/blob/v0.4.0/optimum/neuron/modeling_diffusion.py#L1641</source><parameters>[{"name": "config", "val": ": dict[str, typing.Any]"}, {"name": "configs", "val": ": dict[str, 'PretrainedConfig']"}, {"name": "neuron_configs", "val": ": dict[str, 'NeuronDefaultConfig']"}, {"name": "data_parallel_mode", "val": ": typing.Literal['none', 'unet', 'transformer', 'all']"}, {"name": "scheduler", "val": ": diffusers.schedulers.scheduling_utils.SchedulerMixin \| None"}, {"name": "vae_decoder", "val": ": torch.jit._script.ScriptModule \| NeuronModelVaeDecoder"}, {"name": "text_encoder", "val": ": torch.jit._script.ScriptModule \| NeuronModelTextEncoder \| None = None"}, {"name": "text_encoder_2", "val": ": torch.jit._script.ScriptModule \| NeuronModelTextEncoder \| None = None"}, {"name": "unet", "val": ": torch.jit._script.ScriptModule \| NeuronModelUnet \| None = None"}, {"name": "transformer", "val": ": torch.jit._script.ScriptModule \| NeuronModelTransformer \| None = None"}, {"name": "vae_encoder", "val": ": torch.jit._script.ScriptModule \| NeuronModelVaeEncoder \| None = None"}, {"name": "image_encoder", "val": ": torch.jit._script.ScriptModule \| None = None"}, {"name": "safety_checker", "val": ": torch.jit._script.ScriptModule \| None = None"}, {"name": "tokenizer", "val": ": transformers.models.clip.tokenization_clip.CLIPTokenizer \| transformers.models.t5.tokenization_t5.T5Tokenizer \| None = None"}, {"name": "tokenizer_2", "val": ": transformers.models.clip.tokenization_clip.CLIPTokenizer \| None = None"}, {"name": "feature_extractor", "val": ": transformers.models.clip.feature_extraction_clip.CLIPFeatureExtractor \| None = None"}, {"name": "controlnet", "val": ": torch.jit._script.ScriptModule \| list[torch.jit._script.ScriptModule]\| NeuronControlNetModel \| NeuronMultiControlNetModel \| None = None"}, {"name": "requires_aesthetics_score", "val": ": bool = False"}, {"name": "force_zeros_for_empty_prompt", "val": ": bool = True"}, {"name": "add_watermarker", "val": ": bool \| None = None"}, {"name": "model_save_dir", "val": ": str \| pathlib.Path \| tempfile.TemporaryDirectory \| None = None"}, {"name": "model_and_config_save_paths", "val": ": dict[str, tuple[str, pathlib.Path]] \| None = None"}]</parameters></docstring>



	<div class="docstring border-l-2 border-t-2 pl-4 pt-3.5 border-gray-100 rounded-tl-xl mb-6 mt-8">


	<docstring><name>__call__</name><anchor>optimum.neuron.NeuronFluxInpaintPipeline.__call__</anchor><source>https://github.com/huggingface/optimum-neuron/blob/v0.4.0/optimum/neuron/modeling_diffusion.py#L1106</source><parameters>[{"name": "args", "val": ""}, {"name": "*kwargs", "val": ""}]</parameters></docstring>


	</div></div>

	With `NeuronFluxInpaintPipeline`, pass the original image and a mask of what you want to replace in the original image. Then replace the masked area with content described in a prompt.

	```python
	from diffusers.utils import load_image
	from optimum.neuron import NeuronFluxInpaintPipeline


	pipe = NeuronFluxInpaintPipeline.from_pretrained("Jingya/Flux.1-Schnell-1024x1024-neuronx-tp8")
	prompt = "Face of a yellow cat, high resolution, sitting on a park bench"
	img_url = "https://raw.githubusercontent.com/CompVis/latent-diffusion/main/data/inpainting_examples/overture-creations-5sI6fQgYIuo.png"
	mask_url = "https://raw.githubusercontent.com/CompVis/latent-diffusion/main/data/inpainting_examples/overture-creations-5sI6fQgYIuo_mask.png"
	source = load_image(img_url)
	mask = load_image(mask_url)
	images = pipe(prompt=prompt, image=source, mask_image=mask, max_sequence_length=256)
	```

	## NeuronFluxKontextPipeline[[optimum.neuron.NeuronFluxKontextPipeline]]

	The Flux pipeline for image editing.

	<div class="docstring border-l-2 border-t-2 pl-4 pt-3.5 border-gray-100 rounded-tl-xl mb-6 mt-8">


	<docstring><name>class optimum.neuron.NeuronFluxKontextPipeline</name><anchor>optimum.neuron.NeuronFluxKontextPipeline</anchor><source>https://github.com/huggingface/optimum-neuron/blob/v0.4.0/optimum/neuron/modeling_diffusion.py#L1636</source><parameters>[{"name": "config", "val": ": dict[str, typing.Any]"}, {"name": "configs", "val": ": dict[str, 'PretrainedConfig']"}, {"name": "neuron_configs", "val": ": dict[str, 'NeuronDefaultConfig']"}, {"name": "data_parallel_mode", "val": ": typing.Literal['none', 'unet', 'transformer', 'all']"}, {"name": "scheduler", "val": ": diffusers.schedulers.scheduling_utils.SchedulerMixin \| None"}, {"name": "vae_decoder", "val": ": torch.jit._script.ScriptModule \| NeuronModelVaeDecoder"}, {"name": "text_encoder", "val": ": torch.jit._script.ScriptModule \| NeuronModelTextEncoder \| None = None"}, {"name": "text_encoder_2", "val": ": torch.jit._script.ScriptModule \| NeuronModelTextEncoder \| None = None"}, {"name": "unet", "val": ": torch.jit._script.ScriptModule \| NeuronModelUnet \| None = None"}, {"name": "transformer", "val": ": torch.jit._script.ScriptModule \| NeuronModelTransformer \| None = None"}, {"name": "vae_encoder", "val": ": torch.jit._script.ScriptModule \| NeuronModelVaeEncoder \| None = None"}, {"name": "image_encoder", "val": ": torch.jit._script.ScriptModule \| None = None"}, {"name": "safety_checker", "val": ": torch.jit._script.ScriptModule \| None = None"}, {"name": "tokenizer", "val": ": transformers.models.clip.tokenization_clip.CLIPTokenizer \| transformers.models.t5.tokenization_t5.T5Tokenizer \| None = None"}, {"name": "tokenizer_2", "val": ": transformers.models.clip.tokenization_clip.CLIPTokenizer \| None = None"}, {"name": "feature_extractor", "val": ": transformers.models.clip.feature_extraction_clip.CLIPFeatureExtractor \| None = None"}, {"name": "controlnet", "val": ": torch.jit._script.ScriptModule \| list[torch.jit._script.ScriptModule]\| NeuronControlNetModel \| NeuronMultiControlNetModel \| None = None"}, {"name": "requires_aesthetics_score", "val": ": bool = False"}, {"name": "force_zeros_for_empty_prompt", "val": ": bool = True"}, {"name": "add_watermarker", "val": ": bool \| None = None"}, {"name": "model_save_dir", "val": ": str \| pathlib.Path \| tempfile.TemporaryDirectory \| None = None"}, {"name": "model_and_config_save_paths", "val": ": dict[str, tuple[str, pathlib.Path]] \| None = None"}]</parameters></docstring>



	<div class="docstring border-l-2 border-t-2 pl-4 pt-3.5 border-gray-100 rounded-tl-xl mb-6 mt-8">


	<docstring><name>__call__</name><anchor>optimum.neuron.NeuronFluxKontextPipeline.__call__</anchor><source>https://github.com/huggingface/optimum-neuron/blob/v0.4.0/optimum/neuron/modeling_diffusion.py#L1106</source><parameters>[{"name": "args", "val": ""}, {"name": "*kwargs", "val": ""}]</parameters></docstring>


	</div></div>

	With `NeuronFluxKontextPipeline`, pass the original image and a prompt describing what you want to change about the original image.

	```python
	from diffusers.utils import load_image
	from optimum.neuron import NeuronFluxKontextPipeline


	pipe = NeuronFluxKontextPipeline.from_pretrained("Jlonge4/FLUX.1-kontext-neuronx-1024x1024-tp8")
	prompt = "Change the cushions in the chair from red to green"
	img_url = "https://huggingface.co/datasets/Jlonge4/document_images/resolve/main/flux_optimum.png"
	source = load_image(img_url)
	images = pipe(prompt=prompt, image=source, guidance_scale=2.5)
	```

	\| Image \| Prompt \| Output \|
	\|:-----:\|:------:\|:------:\|
	\| <img src="https://huggingface.co/datasets/Jlonge4/document_images/resolve/main/flux_optimum.png" alt="red_cushions" width="250"/> \| *Change the cushions in the chair from red to green* \| <img src="https://huggingface.co/datasets/Jlonge4/document_images/resolve/main/flux_optimum_edit.png" alt="green_cushions" width="250"/> \|

	Are there any other diffusion features that you want us to support in 🤗`Optimum-neuron`? Please file an issue to [`Optimum-neuron` Github repo](https://github.com/huggingface/optimum-neuron) or discuss with us on [HuggingFace’s community forum](https://discuss.huggingface.co/c/optimum/), cheers 🤗 !

Xet Storage Details

Size:: 14.1 kB
Xet hash:: 206fe03b881ba007ded351f488b74c9e3588ffb6bf85f378aaecce9934f017ed

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.