Spaces:

yingzhac
/

Qwen_edit

Sleeping

App Files Files Community

yingzhac-research commited on Dec 4, 2025

Commit

4ecea9e

1 Parent(s): 921baab

Expose steps and guidance controls in UI

Browse files

Files changed (1) hide show

app.py +56 -8

app.py CHANGED Viewed

@@ -3,9 +3,10 @@ import numpy as np
 import torch
 from PIL import Image
-import spaces  # [uncomment to use ZeroGPU]
 from diffusers import QwenImageEditPlusPipeline
 device = "cuda" if torch.cuda.is_available() else "cpu"
 if device == "cuda":
@@ -22,12 +23,16 @@ pipe.set_progress_bar_config(disable=None)
 MAX_SEED = np.iinfo(np.int32).max
-@spaces.GPU  # [uncomment to use ZeroGPU]
 def edit_images(
     image1: Image.Image,
     image2: Image.Image,
     prompt: str,
     seed: int,
     progress=gr.Progress(track_tqdm=True),
 ):
     # 必须有 prompt，且至少有一张图片
@@ -44,6 +49,12 @@ def edit_images(
     if len(images) == 0:
         return None, seed
     generator = torch.Generator(device=device).manual_seed(seed)
     inputs = {
@@ -51,10 +62,10 @@ def edit_images(
         "image": images,
         "prompt": prompt,
         "generator": generator,
-        "true_cfg_scale": 4.0,
-        "negative_prompt": " ",
-        "num_inference_steps": 40,
-        "guidance_scale": 1.0,
         "num_images_per_prompt": 1,
     }
@@ -91,7 +102,12 @@ with gr.Blocks(css=css) as demo:
                 prompt = gr.Textbox(
                     label="Text Prompt",
                     lines=4,
-                    placeholder="Describe how the two bears should appear...",
                 )
                 seed = gr.Slider(
                     label="Seed",
@@ -100,6 +116,27 @@ with gr.Blocks(css=css) as demo:
                     step=1,
                     value=0,
                 )
                 run_button = gr.Button("Generate", variant="primary")
         result = gr.Image(label="Edited Image", show_label=True)
@@ -107,9 +144,20 @@ with gr.Blocks(css=css) as demo:
     gr.on(
         triggers=[run_button.click, prompt.submit],
         fn=edit_images,
-        inputs=[image1, image2, prompt, seed],
         outputs=[result, seed],
     )
 if __name__ == "__main__":
     demo.launch()

 import torch
 from PIL import Image
+import spaces  # use ZeroGPU on Spaces
 from diffusers import QwenImageEditPlusPipeline
 device = "cuda" if torch.cuda.is_available() else "cpu"
 if device == "cuda":
 MAX_SEED = np.iinfo(np.int32).max
+@spaces.GPU
 def edit_images(
     image1: Image.Image,
     image2: Image.Image,
     prompt: str,
+    negative_prompt: str,
     seed: int,
+    num_inference_steps: int,
+    guidance_scale: float,
+    true_cfg_scale: float,
     progress=gr.Progress(track_tqdm=True),
 ):
     # 必须有 prompt，且至少有一张图片
     if len(images) == 0:
         return None, seed
+    # gr.Slider 返回的是 float/int，这里确保为 int
+    num_inference_steps = int(num_inference_steps)
+    # 负向提示为空时，用一个空格占位以兼容管线
+    negative_prompt_value = negative_prompt if negative_prompt else " "
     generator = torch.Generator(device=device).manual_seed(seed)
     inputs = {
         "image": images,
         "prompt": prompt,
         "generator": generator,
+        "true_cfg_scale": true_cfg_scale,
+        "negative_prompt": negative_prompt_value,
+        "num_inference_steps": num_inference_steps,
+        "guidance_scale": guidance_scale,
         "num_images_per_prompt": 1,
     }
                 prompt = gr.Textbox(
                     label="Text Prompt",
                     lines=4,
+                    placeholder="Describe how the image(s) should be edited...",
+                )
+                negative_prompt = gr.Textbox(
+                    label="Negative Prompt (optional)",
+                    lines=2,
+                    placeholder="Describe what you want to avoid...",
                 )
                 seed = gr.Slider(
                     label="Seed",
                     step=1,
                     value=0,
                 )
+                num_inference_steps = gr.Slider(
+                    label="Number of inference steps",
+                    minimum=5,
+                    maximum=60,
+                    step=1,
+                    value=40,
+                )
+                guidance_scale = gr.Slider(
+                    label="Guidance scale",
+                    minimum=0.0,
+                    maximum=5.0,
+                    step=0.1,
+                    value=1.0,
+                )
+                true_cfg_scale = gr.Slider(
+                    label="True CFG scale",
+                    minimum=1.0,
+                    maximum=8.0,
+                    step=0.5,
+                    value=4.0,
+                )
                 run_button = gr.Button("Generate", variant="primary")
         result = gr.Image(label="Edited Image", show_label=True)
     gr.on(
         triggers=[run_button.click, prompt.submit],
         fn=edit_images,
+        inputs=[
+            image1,
+            image2,
+            prompt,
+            negative_prompt,
+            seed,
+            num_inference_steps,
+            guidance_scale,
+            true_cfg_scale,
+        ],
         outputs=[result, seed],
     )
 if __name__ == "__main__":
     demo.launch()