You need to agree to share your contact information to access this model

This repository is publicly accessible, but you have to accept the conditions to access its files and content.

Is This Edit Correct? A Multi-Dimensional Benchmark for Reasoning-Aware Image Editing

Yixuan Ding¹ · Wei Huang² · Ruijie Quan¹ · Xiaojun Qi² · Yang Yi¹

¹ReLER Lab, CCAI, Zhejiang University, Hangzhou, China
²The University of Hong Kong, Hong Kong SAR

🔥 News

[2026.2.12] 📄 RE-Edit paper released on arXiv.
[2026.2.12] 📊 RE-Edit benchmark released on huggingface.
[2026.2.12] 📊 EditRefine model weight released on huggingface.
More updates coming soon – stay tuned and ⭐ star the repo!

TODO

Release paper.
Release RE-Edit benchmark.
Release EditRefine model weight.
Release evaluation pipeline & inference repo.
Release project page.

📖 Abstract

In this work, we introduce RE-Edit, a benchmark for REasoning-aware image Editing that evaluates image editing systems across five complementary reasoning dimensions: physical, environmental, cultural, causal, and referential. RE-Edit comprises 1,000 carefully curated samples, each designed such that visual plausibility alone is insufficient and correct editing requires satisfying implicit logical constraints. We further present a lightweight reasoning-guided post-edit baseline (EditRefine) as an initial exploration, illustrating how inserting explicit reasoning can help mitigate such failures in a model-agnostic manner.

📊 Primary Evaluation on RE-Edit

Representative open-source and commercial editors evaluated on five reasoning dimensions and two general metrics (IF, SC) by Qwen3-VL-30B; Executor-F and Executor-Q denote the FLUX.2 Dev and Qwen-Image-Edit executors, respectively.

🚀 Usage

Project Structure
Quick Start
RE-Edit Pipeline
EditRefine Standalone Inference
Configuration Reference
Extension Guide

Project Structure

RE-Edit_EditRefine/
├── README.md                                 # Documentation
├── requirements.txt                          # Dependencies
├── main.py                                   # RE-Edit Pipeline entry
├── run_editrefine_inference.py               # EditRefine Inference entry
│
├── config/                                   # EditRefine standalone module
│   ├── config_iterative_refinement.yaml      # RE-Edit Pipeline config
│   ├── config_editrefine_inference.yaml      # EditRefine Inference config
│   └── DIFFUSION_FRAMEWORK_ENV_SUMMARY.md
│
├── editrefine_inference/                     # EditRefine standalone module
│   ├── __init__.py
│   ├── config_loader.py
│   └── runner.py
│
└── src/                                      # Source code
    ├── pipeline.py
    ├── iterative_pipeline_v7.py              # Pipeline implementation
    ├── data/                                 # Data loading
    │   ├── benchmark_loader.py
    │   ├── iterative_data.py
    │   └── data_types.py
    ├── models/                               # Models
    │   ├── diffusion/                        # Image editing models (11 types)
    │   │   ├── base_diffusion.py
    │   │   └── implementations/
    │   ├── mllm/                             # MLLM for analysis cot & re-edit
    │   │   ├── base_mllm.py
    │   │   └── implementations/
    │   └── reward/                           # Reward models
    │       ├── base_reward.py
    │       └── implementations/
    ├── evaluation/                           # Evaluation & reporting
    │   ├── scorer.py
    │   └── reporter.py
    └── utils/                                # Utilities
        ├── image_utils.py
        ├── logger.py
        └── prompt_manager.py

Quick Start

1. Install Dependencies

git clone https://github.com/Yixuan-Ding-ZJU/RE-Edit.git
conda create -n RE-Edit python==3.12
conda activate RE-Edit
cd RE-Edit
pip install -r requirements.txt

2. Download RE-Edit & EditRefine

Download RE-Edit:

hf download Yixuan-Ding-ZJU/RE-Edit --repo-type dataset

After downloading, locate RE-Edit.json in the downloaded directory (typically datasets--Yixuan-Ding-ZJU--RE-Edit/RE-Edit.json) and fill the path into config/config_iterative_refinement.yaml → data-path.

Download EditRefine:

hf download Yixuan-Ding-ZJU/EditRefine

Fill the downloaded path into config/config_iterative_refinement.yaml → mllm.

3. RE-Edit Pipeline (Full Evaluation)

# Edit config to select model & settings
nano config/config_iterative_refinement.yaml

# Run evaluation
python main.py --config config/config_iterative_refinement.yaml --mode iterative

4. EditRefine Standalone Inference (Single Image)

python run_editrefine_inference.py \
  --editrefine-config config/config_editrefine_inference.yaml \
  --image /path/to/image.png \
  --instruction "Add a red hat"

RE-Edit Pipeline

Full evaluation pipeline for RE-Edit benchmark with 5 stages.

Pipeline Stages

Stage	Description
Stage 1	Primary Editing: initial edit with target diffusion model
Stage 2	EditRefine Reasoning Agent: analyze result, generate CoT reasoning & re-edit instruction
Stage 3	EditRefine Executor Engine: refine with re-edit instruction
Stage 4	Comparative Scoring: evaluate both primary & refined images
Stage 5	Statistics: aggregate metrics & generate report

Key Configuration

Evaluation Settings:

evaluation:
  output_dir: "./results_iterative"
  save_images: true
  primary_images_dir: null              # Skip Stage 1 if non-empty , load primary image from dir 
  primary_image_suffix: "_primary.png"
  skip_stage4: false                     # Skip scoring if true
  ############################# Key Point #############################
  skip_refinement: false                 # Skip EditRefine (Stage 2-3) if true, just perform evaluation of specific image edit model on RE-Edit

Diffusion Models (11 types supported, detailed see config/DIFFUSION_FRAMEWORK_ENV_SUMMARY.md):

diffusion_model:
  primary:                               # Model under evaluation
    type: step1x_edit_v1p1               # Options: multi_gpu_qwen_edit, flux2_dev,
                                         #   step1x_edit_v1p1, step1x_edit_v1p2_preview,
                                         #   janus, ovis_u1, hidream_e1, omnigen2,
                                         #   flux_kontext, dreamomni2, qwen_image_edit_2511
    params:
      model_name: "/path/to/model"
      device_ids: [0, 1, 2, 3]
      seed: 42
      num_inference_steps: 28

  refinement:                            # Fixed two EditRefine Executor Engines
    type: multi_gpu_qwen_edit
    params:
      model_name: "/path/to/qwen-edit"
      device_ids: [0, 1, 2, 3]
      seed: 42
      num_inference_steps: 1

MLLM (Reasoning Agent):

mllm:
  type: qwen25_vl
  params:
    model_name: "/path/to/qwen2.5-vl"
    device: "auto"
    batch_size: 16
    max_new_tokens: 512

Reward Model (vLLM recommended for speed):

reward_model:
  type: qwen3_vl_vllm_subprocess
  params:
    model_name: "/path/to/Qwen3-VL-30B"
    tensor_parallel_size: 4               # Must be divisor of 32 (attn heads)
    batch_size: 8
    conda_env: "yx_vllm"
    timeout: 1200

EditRefine Standalone Inference

Single-image inference: Image + Instruction → Primary Edit → EditRefine Reasoning Agent Analysis → EditRefine Execution Engine One-step Refinement → Save 4 outputs.

Features

Config: config_editrefine_inference.yaml references base_config: config_iterative_refinement.yaml (reuses diffusion_model, mllm)
Outputs: 4 files per run
- {prefix}_primary.png - primary edited image
- {prefix}_refined.png - refined edited image by EditRefine
- {prefix}_cot.txt - chain-of-thought reasoning
- {prefix}_re_edit.txt - re-edit instruction
Module: editrefine_inference/ (config_loader, runner)

Usage

With Custom Output:

python run_editrefine_inference.py \
  --editrefine-config config/config_editrefine_inference.yaml \
  --image img.png \
  --instruction "Change the sky to sunset" \
  --output-dir ./my_output \
  --output-prefix experiment_01

Optional Arguments:

--output-dir - override editrefine.output_dir in config
--output-prefix - output filename prefix (default: "editrefine")

How to Switch Image Edit Model

Edit config/config_iterative_refinement.yaml and uncomment desired model in diffusion_model.primary section. 11 models supported (see config/DIFFUSION_FRAMEWORK_ENV_SUMMARY.md for environment requirements).

Configuration Reference

Diffusion Models

11 models supported:

multi_gpu_qwen_edit - Qwen-Image-Edit
qwen_image_edit_2511 - Qwen-Image-Edit-2511
step1x_edit_v1p1 - Step1X-Edit v1p1
step1x_edit_v1p2_preview - Step1X-Edit v1p2
flux_kontext - FLUX.1-Kontext
flux2_dev - FLUX.2-dev
janus - Janus-4o-7B
ovis_u1 - Ovis-U1-3B
hidream_e1 - HiDream-E1.1
omnigen2 - OmniGen2
dreamomni2 - DreamOmni2

Evaluation Metrics

Control which metrics to evaluate:

evaluation:
  enable_sc_metric: true                 # Semantic Consistency
  enable_instruction_following_metric: true  # Instruction Following
  enable_primary_scoring: true          # Score primary images (compute improvement_rate)

Extension Guide

Add New Diffusion Model

Create implementation in src/models/diffusion/implementations/
Inherit from BaseDiffusionModel
Implement edit_image() and optionally batch_edit()
Register in iterative_pipeline_v7.py loaders
Add config template to config/config_iterative_refinement.yaml

Add New Reward Model

Create implementation in src/models/reward/implementations/
Inherit from BaseRewardModel
Implement score() method
Register in pipeline loader

License

MIT License

Downloads last month: -

Safetensors

Model size

8B params

Tensor type

BF16

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Paper for Yixuan-Ding-ZJU/EditRefine

Is This Edit Correct? A Multi-Dimensional Benchmark for Reasoning-Aware Image Editing

Paper • 2606.05172 • Published Apr 16 • 1

Yixuan-Ding-ZJU
/

EditRefine

You need to agree to share your contact information to access this model

Is This Edit Correct? A Multi-Dimensional Benchmark for Reasoning-Aware Image Editing

🔥 News

TODO

📖 Abstract

📊 Primary Evaluation on RE-Edit

🚀 Usage

Table of Contents

Project Structure

Quick Start

1. Install Dependencies

2. Download RE-Edit & EditRefine

3. RE-Edit Pipeline (Full Evaluation)

4. EditRefine Standalone Inference (Single Image)

RE-Edit Pipeline

Pipeline Stages

Key Configuration

EditRefine Standalone Inference

Features

Usage

How to Switch Image Edit Model

Configuration Reference

Diffusion Models

Evaluation Metrics

Extension Guide

Add New Diffusion Model

Add New Reward Model

License

Paper for Yixuan-Ding-ZJU/EditRefine

Is This Edit Correct? A Multi-Dimensional Benchmark for Reasoning-Aware Image Editing