Spaces:

Gerchegg
/

Qwen-Image-Sampler-Advanced

Paused

App Files Files Community

Gerchegg commited on Oct 24, 2025

Commit

c0fe752

verified ·

1 Parent(s): 9efb67d

Update app.py

Browse files

Files changed (1) hide show

app.py +814 -814

app.py CHANGED Viewed

@@ -1,814 +1,814 @@
-import gradio as gr
-import numpy as np
-import random
-import json
-import torch
-from PIL import Image
-import os
-import time
-import logging
-# Опциональный импорт spaces для работы в Runpod
-try:
-    import spaces
-    SPACES_AVAILABLE = True
-except ImportError:
-    SPACES_AVAILABLE = False
-from diffusers import (
-    DiffusionPipeline,
-    QwenImageImg2ImgPipeline
-)
-from huggingface_hub import hf_hub_download
-# Настройка логирования
-from io import StringIO
-# Создаем буфер для логов
-log_buffer = StringIO()
-# Настраиваем логирование с выводом в консоль и буфер
-logging.basicConfig(
-    level=logging.INFO,
-    format='%(asctime)s | %(levelname)s | %(message)s',
-    datefmt='%Y-%m-%d %H:%M:%S',
-    handlers=[
-        logging.StreamHandler(),  # Вывод в консоль
-        logging.StreamHandler(log_buffer)  # Вывод в буфер для UI
-    ]
-)
-logger = logging.getLogger(__name__)
-# Логируем если spaces не доступен
-if not SPACES_AVAILABLE:
-    logger.warning("⚠️ spaces module not available - running without ZeroGPU support")
-def get_logs():
-    """Получить накопленные логи"""
-    return log_buffer.getvalue()
-def clear_logs():
-    """Очистить буфер логов"""
-    global log_buffer
-    log_buffer = StringIO()
-    # Обновляем handlers
-    for handler in logger.handlers:
-        if isinstance(handler.stream, StringIO):
-            logger.removeHandler(handler)
-    new_handler = logging.StreamHandler(log_buffer)
-    new_handler.setFormatter(logging.Formatter('%(asctime)s | %(levelname)s | %(message)s', '%Y-%m-%d %H:%M:%S'))
-    logger.addHandler(new_handler)
-    return ""
-logger.info("=" * 60)
-logger.info("LOADING QWEN-SOLOBAND ADVANCED v2.1")
-logger.info("With detailed logging and fixed img2img resize")
-logger.info("=" * 60)
-hf_token = os.environ.get("HF_TOKEN")
-device = "cuda" if torch.cuda.is_available() else "cpu"
-dtype = torch.bfloat16
-# Логируем GPU
-logger.info(f"CUDA available: {torch.cuda.is_available()}")
-if torch.cuda.is_available():
-    gpu_count = torch.cuda.device_count()
-    logger.info(f"Number of GPUs: {gpu_count}")
-    for i in range(gpu_count):
-        logger.info(f"  GPU {i}: {torch.cuda.get_device_name(i)}")
-        logger.info(f"    Memory: {torch.cuda.get_device_properties(i).total_memory / 1024**3:.1f} GB")
-else:
-    gpu_count = 0
-    logger.info("Running on CPU - no GPUs available")
-# =================================================================
-# ЗАГРУЗКА МОДЕЛЕЙ
-# =================================================================
-# 1. Базовая модель для Text-to-Image
-logger.info("\n[1/3] Loading base Text2Image model...")
-model_id = os.environ.get("MODEL_ID", "Gerchegg/Qwen-Soloband-Diffusers")
-model_revision = os.environ.get("MODEL_REVISION", "main")
-try:
-    start_time = time.time()
-    # Определяем device_map
-    if gpu_count > 1:
-        device_map = "balanced"
-        logger.info(f"  Device map: balanced ({gpu_count} GPUs)")
-    else:
-        device_map = None
-        logger.info("  Device map: single GPU")
-    # Загружаем базовую модель
-    load_kwargs = {
-        "torch_dtype": dtype,
-        "device_map": device_map,
-        "token": hf_token,
-        "cache_dir": os.environ.get("HF_HOME", "/workspace/.cache/huggingface")
-    }
-    if model_revision:
-        load_kwargs["revision"] = model_revision
-    logger.info(f"  Loading model: {model_id}")
-    logger.info(f"  Device map: {device_map}")
-    logger.info(f"  Dtype: {dtype}")
-    pipe_txt2img = DiffusionPipeline.from_pretrained(model_id, **load_kwargs)
-    if device_map is None:
-        pipe_txt2img.to(device)
-    load_time = time.time() - start_time
-    logger.info(f"  ✓ Text2Image loaded in {load_time:.1f}s")
-except Exception as e:
-    logger.error(f"  ❌ Error loading Text2Image: {e}")
-    raise
-# 2. Image-to-Image модель (используем те же компоненты)
-logger.info("\n[2/3] Creating Image2Image pipeline...")
-try:
-    # Создаем QwenImageImg2ImgPipeline переиспользуя компоненты Text2Image pipeline
-    # Это правильный способ для Qwen-Image архитектуры
-    pipe_img2img = QwenImageImg2ImgPipeline(
-        vae=pipe_txt2img.vae,
-        text_encoder=pipe_txt2img.text_encoder,
-        tokenizer=pipe_txt2img.tokenizer,
-        transformer=pipe_txt2img.transformer,
-        scheduler=pipe_txt2img.scheduler
-    )
-    logger.info("  ✓ Image2Image pipeline created (reusing components)")
-except Exception as e:
-    logger.error(f"  ❌ Error creating Image2Image: {e}")
-    pipe_img2img = None
-# ControlNet не используется - убран для упрощения
-# Оптимизации памяти
-logger.info("\nApplying memory optimizations...")
-for pipe in [pipe_txt2img, pipe_img2img]:
-    if pipe and hasattr(pipe, 'vae'):
-        if hasattr(pipe.vae, 'enable_tiling'):
-            pipe.vae.enable_tiling()
-        if hasattr(pipe.vae, 'enable_slicing'):
-            pipe.vae.enable_slicing()
-logger.info("  ✓ VAE tiling and slicing enabled")
-logger.info("\n" + "=" * 60)
-logger.info("✓ ALL MODELS LOADED")
-logger.info("=" * 60)
-# =================================================================
-# HELPER FUNCTIONS
-# =================================================================
-def resize_image(input_image, max_size=2048):
-    """
-    Изменяет размер изображения с сохранением пропорций (кратно 16).
-    Если изображение меньше max_size, оставляет оригинальный размер (с округлением до 16).
-    """
-    w, h = input_image.size
-    logger.info(f"[RESIZE] Входное изображение: {w}×{h}, max_size={max_size}")
-    # Если изображение уже меньше max_size, просто округляем до 16
-    if w <= max_size and h <= max_size:
-        new_w = w - (w % 16)
-        new_h = h - (h % 16)
-        if new_w == 0: new_w = 16
-        if new_h == 0: new_h = 16
-        if new_w != w or new_h != h:
-            logger.info(f"[RESIZE] Округление до кратного 16: {w}×{h} → {new_w}×{new_h}")
-            return input_image.resize((new_w, new_h), Image.Resampling.LANCZOS)
-        logger.info(f"[RESIZE] Размер уже кратен 16, изменение не требуется")
-        return input_image
-    # Определяем масштабирование с сохранением пропорций
-    scale = min(max_size / w, max_size / h)
-    new_w = int(w * scale)
-    new_h = int(h * scale)
-    logger.info(f"[RESIZE] Масштабирование: scale={scale:.3f}, промежуточный размер: {new_w}×{new_h}")
-    # Округляем до ближайшего кратного 16
-    new_w = new_w - (new_w % 16)
-    new_h = new_h - (new_h % 16)
-    # Минимальные размеры
-    if new_w < 16: new_w = 16
-    if new_h < 16: new_h = 16
-    logger.info(f"[RESIZE] Финальный размер после округления: {new_w}×{new_h}")
-    aspect_original = w / h
-    aspect_new = new_w / new_h
-    logger.info(f"[RESIZE] Соотношение сторон: {aspect_original:.3f} → {aspect_new:.3f} (разница: {abs(aspect_original - aspect_new):.3f})")
-    return input_image.resize((new_w, new_h), Image.Resampling.LANCZOS)
-# =================================================================
-# LORA FUNCTIONS
-# =================================================================
-# Папка для локальных LoRA
-LOCAL_LORA_DIR = "/workspace/loras"
-# Базовые LoRA из HuggingFace Hub (загружаются по требованию)
-HUB_LORAS = {
-    "Realism": {
-        "repo": "flymy-ai/qwen-image-realism-lora",
-        "trigger": "Super Realism portrait of",
-        "weights": "pytorch_lora_weights.safetensors",
-        "source": "hub"
-    },
-    "Anime": {
-        "repo": "alfredplpl/qwen-image-modern-anime-lora",
-        "trigger": "Japanese modern anime style, ",
-        "weights": "pytorch_lora_weights.safetensors",
-        "source": "hub"
-    }
-    # Другие LoRA положите в /workspace/loras/ как .safetensors файлы
-}
-def scan_local_loras():
-    """
-    Сканирует папку /workspace/loras на наличие .safetensors файлов
-    Возвращает dict с найденными LoRA
-    """
-    local_loras = {}
-    if not os.path.exists(LOCAL_LORA_DIR):
-        logger.info(f"  Local LoRA directory not found: {LOCAL_LORA_DIR}")
-        return local_loras
-    logger.info(f"  Scanning local LoRA directory: {LOCAL_LORA_DIR}")
-    try:
-        for file in os.listdir(LOCAL_LORA_DIR):
-            if file.endswith('.safetensors'):
-                lora_name = os.path.splitext(file)[0]  # Имя без расширения
-                local_path = os.path.join(LOCAL_LORA_DIR, file)
-                # Добавляем в список
-                local_loras[lora_name] = {
-                    "path": local_path,
-                    "trigger": "",  # Без trigger word для локальных
-                    "weights": file,
-                    "source": "local"
-                }
-                logger.info(f"    ✓ Found local LoRA: {lora_name} ({file})")
-    except Exception as e:
-        logger.warning(f"  Error scanning local LoRA directory: {e}")
-    return local_loras
-# Сканируем локальные LoRA
-logger.info("\nScanning for LoRA models...")
-LOCAL_LORAS = scan_local_loras()
-# Объединяем Hub и локальные LoRA
-AVAILABLE_LORAS = {**HUB_LORAS, **LOCAL_LORAS}
-if LOCAL_LORAS:
-    logger.info(f"  ✓ Found {len(LOCAL_LORAS)} local LoRA(s)")
-logger.info(f"  Total available LoRAs: {len(AVAILABLE_LORAS)}")
-def load_lora_weights(pipeline, lora_name, lora_scale, hf_token):
-    """
-    Загружает LoRA веса в pipeline (ленивая загрузка)
-    Hub LoRA скачиваются только при использовании
-    Локальные LoRA загружаются из /workspace/loras/
-    """
-    if lora_name == "None" or lora_name not in AVAILABLE_LORAS:
-        logger.info(f"[LORA] Пропуск загрузки: lora_name='{lora_name}'")
-        return None
-    lora_info = AVAILABLE_LORAS[lora_name]
-    logger.info(f"[LORA] Начало загрузки: {lora_name}")
-    logger.info(f"[LORA]   Source: {lora_info['source']}")
-    logger.info(f"[LORA]   Scale: {lora_scale}")
-    try:
-        load_start = time.time()
-        if lora_info['source'] == 'hub':
-            # Ленивая загрузка с HuggingFace Hub (скачивается при первом использовании)
-            logger.info(f"[LORA] Загрузка из Hub: {lora_info['repo']}")
-            logger.info(f"[LORA]   Weight file: {lora_info.get('weights', 'pytorch_lora_weights.safetensors')}")
-            logger.info(f"[LORA]   (Скачивается если не в кэше...)")
-            pipeline.load_lora_weights(
-                lora_info['repo'],
-                weight_name=lora_info.get('weights', 'pytorch_lora_weights.safetensors'),
-                token=hf_token
-            )
-            load_time = time.time() - load_start
-            logger.info(f"[LORA] ✓ Hub LoRA загружена за {load_time:.2f}s (закэширована)")
-        else:
-            # Загрузка локального файла из /workspace/loras/
-            logger.info(f"[LORA] Загрузка локальной LoRA: {lora_info['path']}")
-            logger.info(f"[LORA]   File: {lora_info['weights']}")
-            pipeline.load_lora_weights(
-                lora_info['path'],
-                adapter_name=lora_name
-            )
-            load_time = time.time() - load_start
-            logger.info(f"[LORA] ✓ Локальная LoRA загружена за {load_time:.2f}s")
-        # Устанавливаем scale
-        if hasattr(pipeline, 'set_adapters'):
-            logger.info(f"[LORA] Установка adapter scale: {lora_scale}")
-            pipeline.set_adapters([lora_name], adapter_weights=[lora_scale])
-        trigger = lora_info.get('trigger', '')
-        if trigger:
-            logger.info(f"[LORA] Trigger word: '{trigger}'")
-        return trigger
-    except Exception as e:
-        logger.error(f"[LORA] ❌ Ошибка загрузки {lora_name}: {e}")
-        import traceback
-        logger.error(f"[LORA] Traceback:\n{traceback.format_exc()}")
-        return None
-# =================================================================
-# GENERATION FUNCTIONS
-# =================================================================
-MAX_SEED = np.iinfo(np.int32).max
-# Декоратор для spaces если доступен
-def gpu_decorator(duration=180):
-    def decorator(func):
-        if SPACES_AVAILABLE:
-            return spaces.GPU(duration=duration)(func)
-        return func
-    return decorator
-@gpu_decorator(duration=180)
-def generate_text2img(
-    prompt,
-    negative_prompt=" ",
-    width=1664,
-    height=928,
-    seed=42,
-    randomize_seed=False,
-    guidance_scale=2.5,
-    num_inference_steps=40,
-    lora_name="None",
-    lora_scale=1.0,
-    progress=gr.Progress(track_tqdm=True)
-):
-    """Text-to-Image генерация"""
-    generation_start = time.time()
-    logger.info("\n" + "=" * 60)
-    logger.info("TEXT-TO-IMAGE GENERATION")
-    logger.info("=" * 60)
-    # Генерация seed
-    if randomize_seed:
-        original_seed = seed
-        seed = random.randint(0, MAX_SEED)
-        logger.info(f"[SEED] Random seed: {original_seed} → {seed}")
-    else:
-        logger.info(f"[SEED] Fixed seed: {seed}")
-    # Логирование параметров
-    logger.info(f"[PARAMS] Prompt length: {len(prompt)} chars")
-    logger.info(f"[PARAMS] Prompt: {prompt[:150]}{'...' if len(prompt) > 150 else ''}")
-    if negative_prompt and negative_prompt != " ":
-        logger.info(f"[PARAMS] Negative prompt: {negative_prompt[:100]}{'...' if len(negative_prompt) > 100 else ''}")
-    logger.info(f"[PARAMS] Resolution: {width}×{height} = {width*height:,} pixels")
-    logger.info(f"[PARAMS] Steps: {num_inference_steps}")
-    logger.info(f"[PARAMS] CFG Scale: {guidance_scale}")
-    logger.info(f"[PARAMS] LoRA: {lora_name} (scale: {lora_scale})")
-    try:
-        # Загружаем LoRA если выбрана
-        trigger_word = None
-        original_prompt = prompt
-        if lora_name != "None":
-            logger.info(f"[T2I STAGE 1/3] Загрузка LoRA...")
-            lora_start = time.time()
-            trigger_word = load_lora_weights(pipe_txt2img, lora_name, lora_scale, hf_token)
-            lora_time = time.time() - lora_start
-            logger.info(f"[T2I STAGE 1/3] ✓ LoRA загружена за {lora_time:.2f}s")
-            # Добавляем trigger word если есть
-            if trigger_word:
-                prompt = trigger_word + prompt
-                logger.info(f"[PROMPT] Добавлен trigger: '{trigger_word}'")
-                logger.info(f"[PROMPT] Финальный промпт: {prompt[:150]}...")
-        else:
-            logger.info(f"[T2I STAGE 1/3] LoRA не используется")
-        # Создание генератора
-        logger.info(f"[T2I STAGE 2/3] Подготовка генератора...")
-        generator = torch.Generator(device=device).manual_seed(seed)
-        logger.info(f"[T2I STAGE 2/3] ✓ Generator готов на устройстве: {device}")
-        # Генерация изображения
-        logger.info(f"[T2I STAGE 3/3] Начало генерации изображения...")
-        logger.info(f"[T2I STAGE 3/3] Pipeline: DiffusionPipeline (Text2Img)")
-        logger.info(f"[T2I STAGE 3/3] Ожидаемое время: ~{num_inference_steps * 0.9:.1f}s")
-        gen_start = time.time()
-        image = pipe_txt2img(
-            prompt=prompt,
-            negative_prompt=negative_prompt,
-            width=width,
-            height=height,
-            num_inference_steps=num_inference_steps,
-            true_cfg_scale=guidance_scale,
-            generator=generator
-        ).images[0]
-        gen_time = time.time() - gen_start
-        logger.info(f"[T2I STAGE 3/3] ✓ Изображение сгенерировано за {gen_time:.2f}s")
-        logger.info(f"[T2I STAGE 3/3] Скорость: {gen_time/num_inference_steps:.3f}s на шаг")
-        # Выгружаем LoRA после генерации
-        if lora_name != "None":
-            logger.info(f"[CLEANUP] Выгрузка LoRA...")
-            unload_start = time.time()
-            pipe_txt2img.unload_lora_weights()
-            unload_time = time.time() - unload_start
-            logger.info(f"[CLEANUP] ✓ LoRA выгружена за {unload_time:.2f}s")
-        # Итоговая статистика
-        total_time = time.time() - generation_start
-        logger.info(f"[РЕЗУЛЬТАТ] Финальное изображение: {image.size[0]}×{image.size[1]}")
-        logger.info(f"[РЕЗУЛЬТАТ] Использованный seed: {seed}")
-        logger.info(f"[РЕЗУЛЬТАТ] Общее время генерации: {total_time:.2f}s")
-        logger.info("=" * 60)
-        logger.info("✓ TEXT-TO-IMAGE ЗАВЕРШЕНА УСПЕШНО")
-        logger.info("=" * 60 + "\n")
-        return image, seed, get_logs()
-    except Exception as e:
-        logger.error(f"[ERROR] ❌ Ошибка при генерации: {e}")
-        import traceback
-        logger.error(f"[ERROR] Traceback:\n{traceback.format_exc()}")
-        raise gr.Error(f"Ошибка генерации: {e}")
-@gpu_decorator(duration=180)
-def generate_img2img(
-    input_image,
-    prompt,
-    negative_prompt=" ",
-    strength=0.75,
-    seed=42,
-    randomize_seed=False,
-    guidance_scale=2.5,
-    num_inference_steps=40,
-    lora_name="None",
-    lora_scale=1.0,
-    progress=gr.Progress(track_tqdm=True)
-):
-    """Image-to-Image генерация"""
-    generation_start = time.time()
-    logger.info("\n" + "=" * 60)
-    logger.info("IMAGE-TO-IMAGE GENERATION")
-    logger.info("=" * 60)
-    # Проверка входного изображения
-    if input_image is None:
-        logger.error("[ERROR] Входное изображение отсутствует!")
-        raise gr.Error("Please upload an input image")
-    # КРИТИЧНО: Сохраняем оригинальные размеры ДО любых преобразований
-    original_width, original_height = input_image.size
-    logger.info(f"[INPUT] ОРИГИНАЛЬНОЕ изображение: {original_width}×{original_height}")
-    logger.info(f"[INPUT] Формат: {input_image.format if hasattr(input_image, 'format') else 'N/A'}")
-    logger.info(f"[INPUT] Режим: {input_image.mode}")
-    logger.info(f"[INPUT] Соотношение сторон: {original_width/original_height:.3f}")
-    # Генерация seed
-    if randomize_seed:
-        original_seed = seed
-        seed = random.randint(0, MAX_SEED)
-        logger.info(f"[SEED] Random seed: {original_seed} → {seed}")
-    else:
-        logger.info(f"[SEED] Fixed seed: {seed}")
-    # Изменяем размер изображения (max 3072 для поддержки больших изображений)
-    logger.info(f"[I2I STAGE 1/4] Предобработка изображения...")
-    resize_start = time.time()
-    resized = resize_image(input_image, max_size=3072)
-    resize_time = time.time() - resize_start
-    logger.info(f"[I2I STAGE 1/4] ✓ Изображение подготовлено за {resize_time:.2f}s")
-    # Логирование параметров
-    logger.info(f"[PARAMS] Prompt length: {len(prompt)} chars")
-    logger.info(f"[PARAMS] Prompt: {prompt[:150]}{'...' if len(prompt) > 150 else ''}")
-    if negative_prompt and negative_prompt != " ":
-        logger.info(f"[PARAMS] Negative prompt: {negative_prompt[:100]}{'...' if len(negative_prompt) > 100 else ''}")
-    logger.info(f"[PARAMS] Strength: {strength} (0=оригинал, 1=полная перерисовка)")
-    logger.info(f"[PARAMS] Effective steps: {int(num_inference_steps * strength)} из {num_inference_steps}")
-    logger.info(f"[PARAMS] CFG Scale: {guidance_scale}")
-    logger.info(f"[PARAMS] LoRA: {lora_name} (scale: {lora_scale})")
-    try:
-        if pipe_img2img is None:
-            logger.error("[ERROR] Image2Image pipeline не доступен!")
-            raise gr.Error("Image2Image pipeline not available")
-        # Загружаем LoRA если выбрана
-        trigger_word = None
-        original_prompt = prompt
-        if lora_name != "None":
-            logger.info(f"[I2I STAGE 2/4] Загрузка LoRA...")
-            lora_start = time.time()
-            trigger_word = load_lora_weights(pipe_img2img, lora_name, lora_scale, hf_token)
-            lora_time = time.time() - lora_start
-            logger.info(f"[I2I STAGE 2/4] ✓ LoRA загружена за {lora_time:.2f}s")
-            # Добавляем trigger word если есть
-            if trigger_word:
-                prompt = trigger_word + prompt
-                logger.info(f"[PROMPT] Добавлен trigger: '{trigger_word}'")
-                logger.info(f"[PROMPT] Финальный промпт: {prompt[:150]}...")
-        else:
-            logger.info(f"[I2I STAGE 2/4] LoRA не используется")
-        # Создание генератора
-        logger.info(f"[I2I STAGE 3/4] Подготовка генератора...")
-        generator = torch.Generator(device=device).manual_seed(seed)
-        logger.info(f"[I2I STAGE 3/4] ✓ Generator готов на устройстве: {device}")
-        # КРИТИЧНО: Передаем width и height явно, иначе пайплайн использует дефолтные 1024x1024!
-        img_width, img_height = resized.size
-        logger.info(f"[I2I STAGE 3/4] Финальное разрешение для генерации: {img_width}×{img_height}")
-        logger.info(f"[I2I STAGE 3/4] Соотношение сторон: {img_width/img_height:.3f}")
-        # Генерация изображения
-        logger.info(f"[I2I STAGE 4/4] Начало генерации изображения...")
-        logger.info(f"[I2I STAGE 4/4] Pipeline: QwenImageImg2ImgPipeline")
-        effective_steps = int(num_inference_steps * strength)
-        logger.info(f"[I2I STAGE 4/4] Реальных шагов денойзинга: {effective_steps}")
-        logger.info(f"[I2I STAGE 4/4] Ожидаемое время: ~{effective_steps * 0.9:.1f}s")
-        logger.info(f"[DEBUG] 🔍 ПЕРЕДАЕМ В PIPELINE: width={img_width}, height={img_height}")
-        gen_start = time.time()
-        image = pipe_img2img(
-            prompt=prompt,
-            negative_prompt=negative_prompt,
-            image=resized,
-            width=img_width,
-            height=img_height,
-            strength=strength,
-            num_inference_steps=num_inference_steps,
-            true_cfg_scale=guidance_scale,
-            generator=generator
-        ).images[0]
-        gen_time = time.time() - gen_start
-        # КРИТИЧНО: Проверяем финальный размер результата
-        final_width, final_height = image.size
-        logger.info(f"[DEBUG] 🔍 ПОЛУЧИЛИ ИЗ PIPELINE: width={final_width}, height={final_height}")
-        if final_width != img_width or final_height != img_height:
-            logger.error(f"[BUG] ⚠️⚠️⚠️ РАЗМЕР ИЗМЕНИЛСЯ! ⚠️⚠️⚠️")
-            logger.error(f"[BUG] Ожидалось: {img_width}×{img_height}")
-            logger.error(f"[BUG] Получено: {final_width}×{final_height}")
-            logger.error(f"[BUG] Соотношение: {final_width/final_height:.3f}")
-            logger.error(f"[BUG] Это указывает на проблему в pipeline или diffusers!")
-        else:
-            logger.info(f"[I2I STAGE 4/4] ✓ Размер результата корректен: {final_width}×{final_height}")
-        logger.info(f"[I2I STAGE 4/4] ✓ Изображение сгенерировано за {gen_time:.2f}s")
-        logger.info(f"[I2I STAGE 4/4] Скорость: {gen_time/effective_steps:.3f}s на шаг")
-        # Выгружаем LoRA
-        if lora_name != "None":
-            logger.info(f"[CLEANUP] Выгрузка LoRA...")
-            unload_start = time.time()
-            pipe_img2img.unload_lora_weights()
-            unload_time = time.time() - unload_start
-            logger.info(f"[CLEANUP] ✓ LoRA выгружена за {unload_time:.2f}s")
-        # Итоговая статистика
-        total_time = time.time() - generation_start
-        logger.info(f"[РЕЗУЛЬТАТ] Финальное изображение: {image.size[0]}×{image.size[1]}")
-        logger.info(f"[РЕЗУЛЬТАТ] Использованный seed: {seed}")
-        logger.info(f"[РЕЗУЛЬТАТ] Общее время генерации: {total_time:.2f}s")
-        logger.info(f"[РЕЗУЛЬТАТ] Разбивка времени:")
-        logger.info(f"[РЕЗУЛЬТАТ]   - Ресайз: {resize_time:.2f}s ({resize_time/total_time*100:.1f}%)")
-        logger.info(f"[РЕЗУЛЬТАТ]   - Генерация: {gen_time:.2f}s ({gen_time/total_time*100:.1f}%)")
-        logger.info("=" * 60)
-        logger.info("✓ IMAGE-TO-IMAGE ЗАВЕРШЕНА УСПЕШНО")
-        logger.info("=" * 60 + "\n")
-        return image, seed, get_logs()
-    except Exception as e:
-        logger.error(f"[ERROR] ❌ Ошибка при генерации: {e}")
-        import traceback
-        logger.error(f"[ERROR] Traceback:\n{traceback.format_exc()}")
-        raise gr.Error(f"Ошибка генерации: {e}")
-# ControlNet функция убрана - не используется
-# =================================================================
-# GRADIO INTERFACE
-# =================================================================
-MAX_SEED = np.iinfo(np.int32).max
-css = """
-#col-container {
-    margin: 0 auto;
-    max-width: 1400px;
-}
-"""
-with gr.Blocks(css=css, theme=gr.themes.Soft()) as demo:
-    lora_choices = ["None"] + list(AVAILABLE_LORAS.keys())
-    gr.Markdown(f"""
-    # 🎨 Qwen Soloband - Image2Image + LoRA v2.2
-    **Продвинутая модель генерации** с поддержкой Text-to-Image, Image-to-Image и LoRA стилей.
-    ### ✨ Возможности:
-    - 🖼️ **Text-to-Image** - Генерация из текста, разрешения до 2048×2048
-    - 🔄 **Image-to-Image** - Модификация изображений с контролем strength (0.0-1.0, до 3072×3072)
-    - 🎭 **LoRA Support** - {len(AVAILABLE_LORAS)} доступных стилей (Hub + локальные)
-    - 🔌 **Full API** - Все функции доступны через API
-    - ⚡ **Optimized** - VAE tiling/slicing, правильный QwenImageImg2ImgPipeline
-    - 📋 **Detailed Logs** - Подробное логирование всех этапов генерации
-    **Модель**: [Gerchegg/Qwen-Soloband-Diffusers](https://huggingface.co/Gerchegg/Qwen-Soloband-Diffusers)
-    💡 **Local LoRAs**: Положите .safetensors файлы в `/workspace/loras/` - они появятся автоматически!
-    """)
-    with gr.Tabs() as tabs:
-        # TAB 1: Text-to-Image
-        with gr.Tab("📝 Text-to-Image"):
-            with gr.Row():
-                with gr.Column(scale=1):
-                    t2i_prompt = gr.Text(
-                        label="Prompt",
-                        placeholder="SB_AI, a beautiful landscape...",
-                        lines=3
-                    )
-                    t2i_run = gr.Button("Generate", variant="primary")
-                    with gr.Accordion("Advanced Settings", open=False):
-                        t2i_negative = gr.Text(label="Negative Prompt", value="blurry, low quality")
-                        with gr.Row():
-                            t2i_width = gr.Slider(label="Width", minimum=512, maximum=2048, step=64, value=1664)
-                            t2i_height = gr.Slider(label="Height", minimum=512, maximum=2048, step=64, value=928)
-                        with gr.Row():
-                            t2i_steps = gr.Slider(label="Steps", minimum=1, maximum=50, step=1, value=40)
-                            t2i_cfg = gr.Slider(label="CFG", minimum=0.0, maximum=7.5, step=0.1, value=2.5)
-                        with gr.Row():
-                            t2i_seed = gr.Slider(label="Seed", minimum=0, maximum=MAX_SEED, step=1, value=0)
-                            t2i_random_seed = gr.Checkbox(label="Random", value=True)
-                        t2i_lora = gr.Radio(
-                            label="LoRA Style",
-                            choices=lora_choices,
-                            value="None",
-                            info=f"Hub: {len(HUB_LORAS)}, Local: {len(LOCAL_LORAS)}"
-                        )
-                        t2i_lora_scale = gr.Slider(label="LoRA Strength", minimum=0.0, maximum=2.0, step=0.1, value=1.0)
-                with gr.Column(scale=1):
-                    t2i_output = gr.Image(label="Generated Image")
-                    t2i_seed_output = gr.Number(label="Used Seed")
-        # TAB 2: Image-to-Image
-        with gr.Tab("🔄 Image-to-Image"):
-            with gr.Row():
-                with gr.Column(scale=1):
-                    i2i_input = gr.Image(type="pil", label="Input Image")
-                    i2i_prompt = gr.Text(
-                        label="Prompt",
-                        placeholder="Transform this image into...",
-                        lines=3
-                    )
-                    i2i_strength = gr.Slider(
-                        label="Denoising Strength",
-                        info="0.0 = original image, 1.0 = complete redraw",
-                        minimum=0.0,
-                        maximum=1.0,
-                        step=0.05,
-                        value=0.75
-                    )
-                    i2i_run = gr.Button("Generate", variant="primary")
-                    with gr.Accordion("Advanced Settings", open=False):
-                        i2i_negative = gr.Text(label="Negative Prompt", value="blurry, low quality")
-                        with gr.Row():
-                            i2i_steps = gr.Slider(label="Steps", minimum=1, maximum=50, step=1, value=40)
-                            i2i_cfg = gr.Slider(label="CFG", minimum=0.0, maximum=7.5, step=0.1, value=2.5)
-                        with gr.Row():
-                            i2i_seed = gr.Slider(label="Seed", minimum=0, maximum=MAX_SEED, step=1, value=0)
-                            i2i_random_seed = gr.Checkbox(label="Random", value=True)
-                        i2i_lora = gr.Radio(
-                            label="LoRA Style",
-                            choices=lora_choices,
-                            value="None",
-                            info=f"Hub: {len(HUB_LORAS)}, Local: {len(LOCAL_LORAS)}"
-                        )
-                        i2i_lora_scale = gr.Slider(label="LoRA Strength", minimum=0.0, maximum=2.0, step=0.1, value=1.0)
-                with gr.Column(scale=1):
-                    i2i_output = gr.Image(label="Generated Image")
-                    i2i_seed_output = gr.Number(label="Used Seed")
-        # TAB 3: Logs
-        with gr.Tab("📋 Logs"):
-            gr.Markdown("""
-            ## 📋 Логи генерации
-            Здесь отображаются подробные логи последней генерации:
-            - 🔍 Параметры запроса (prompt, size, seed, etc.)
-            - ⚙️ Этапы обработки (resize, LoRA loading, generation)
-            - ⏱️ Время выполнения каждого этапа
-            - 📊 Финальная статистика и разбивка времени
-            💡 Логи автоматически обновляются после каждой генерации
-            """)
-            log_output = gr.Textbox(
-                label="Логи",
-                lines=25,
-                max_lines=50,
-                show_copy_button=True,
-                interactive=False,
-                placeholder="Логи появятся после первой генерации..."
-            )
-            with gr.Row():
-                refresh_logs_btn = gr.Button("🔄 Обновить логи", size="sm")
-                clear_logs_btn = gr.Button("🗑️ Очистить логи", size="sm", variant="stop")
-            # Кнопка обновления логов
-            refresh_logs_btn.click(
-                fn=get_logs,
-                inputs=None,
-                outputs=log_output
-            )
-            # Кнопка очистки логов
-            clear_logs_btn.click(
-                fn=clear_logs,
-                inputs=None,
-                outputs=log_output
-            )
-    # Event handlers
-    t2i_run.click(
-        fn=generate_text2img,
-        inputs=[
-            t2i_prompt, t2i_negative, t2i_width, t2i_height,
-            t2i_seed, t2i_random_seed, t2i_cfg, t2i_steps,
-            t2i_lora, t2i_lora_scale
-        ],
-        outputs=[t2i_output, t2i_seed_output, log_output],
-        api_name="text2img"
-    )
-    i2i_run.click(
-        fn=generate_img2img,
-        inputs=[
-            i2i_input, i2i_prompt, i2i_negative, i2i_strength,
-            i2i_seed, i2i_random_seed, i2i_cfg, i2i_steps,
-            i2i_lora, i2i_lora_scale
-        ],
-        outputs=[i2i_output, i2i_seed_output, log_output],
-        api_name="img2img"
-    )
-if __name__ == "__main__":
-    demo.launch(
-        show_api=True,
-        share=False,
-        show_error=True  # Показывать подробные ошибки в API
-    )

+import gradio as gr
+import numpy as np
+import random
+import json
+import torch
+from PIL import Image
+import os
+import time
+import logging
+# Опциональный импорт spaces для работы в Runpod
+try:
+    import spaces
+    SPACES_AVAILABLE = True
+except ImportError:
+    SPACES_AVAILABLE = False
+from diffusers import (
+    DiffusionPipeline,
+    QwenImageImg2ImgPipeline
+)
+from huggingface_hub import hf_hub_download
+# Настройка логирования
+from io import StringIO
+# Создаем буфер для логов
+log_buffer = StringIO()
+# Настраиваем логирование с выводом в консоль и буфер
+logging.basicConfig(
+    level=logging.INFO,
+    format='%(asctime)s | %(levelname)s | %(message)s',
+    datefmt='%Y-%m-%d %H:%M:%S',
+    handlers=[
+        logging.StreamHandler(),  # Вывод в консоль
+        logging.StreamHandler(log_buffer)  # Вывод в буфер для UI
+    ]
+)
+logger = logging.getLogger(__name__)
+# Логируем если spaces не доступен
+if not SPACES_AVAILABLE:
+    logger.warning("⚠️ spaces module not available - running without ZeroGPU support")
+def get_logs():
+    """Получить накопленные логи"""
+    return log_buffer.getvalue()
+def clear_logs():
+    """Очистить буфер логов"""
+    global log_buffer
+    log_buffer = StringIO()
+    # Обновляем handlers
+    for handler in logger.handlers:
+        if isinstance(handler.stream, StringIO):
+            logger.removeHandler(handler)
+    new_handler = logging.StreamHandler(log_buffer)
+    new_handler.setFormatter(logging.Formatter('%(asctime)s | %(levelname)s | %(message)s', '%Y-%m-%d %H:%M:%S'))
+    logger.addHandler(new_handler)
+    return ""
+logger.info("=" * 60)
+logger.info("LOADING QWEN-SOLOBAND ADVANCED v2.1")
+logger.info("With detailed logging and fixed img2img resize")
+logger.info("=" * 60)
+hf_token = os.environ.get("HF_TOKEN")
+device = "cuda" if torch.cuda.is_available() else "cpu"
+dtype = torch.bfloat16
+# Логируем GPU
+logger.info(f"CUDA available: {torch.cuda.is_available()}")
+if torch.cuda.is_available():
+    gpu_count = torch.cuda.device_count()
+    logger.info(f"Number of GPUs: {gpu_count}")
+    for i in range(gpu_count):
+        logger.info(f"  GPU {i}: {torch.cuda.get_device_name(i)}")
+        logger.info(f"    Memory: {torch.cuda.get_device_properties(i).total_memory / 1024**3:.1f} GB")
+else:
+    gpu_count = 0
+    logger.info("Running on CPU - no GPUs available")
+# =================================================================
+# ЗАГРУЗКА МОДЕЛЕЙ
+# =================================================================
+# 1. Базовая модель для Text-to-Image
+logger.info("\n[1/3] Loading base Text2Image model...")
+model_id = os.environ.get("MODEL_ID", "Gerchegg/Qwen-Soloband-Diffusers")
+model_revision = os.environ.get("MODEL_REVISION", "main")
+try:
+    start_time = time.time()
+    # Определяем device_map
+    if gpu_count > 1:
+        device_map = "balanced"
+        logger.info(f"  Device map: balanced ({gpu_count} GPUs)")
+    else:
+        device_map = None
+        logger.info("  Device map: single GPU")
+    # Загружаем базовую модель
+    load_kwargs = {
+        "torch_dtype": dtype,
+        "device_map": device_map,
+        "token": hf_token,
+        "cache_dir": os.environ.get("HF_HOME", "/workspace/.cache/huggingface")
+    }
+    if model_revision:
+        load_kwargs["revision"] = model_revision
+    logger.info(f"  Loading model: {model_id}")
+    logger.info(f"  Device map: {device_map}")
+    logger.info(f"  Dtype: {dtype}")
+    pipe_txt2img = DiffusionPipeline.from_pretrained(model_id, **load_kwargs)
+    if device_map is None:
+        pipe_txt2img.to(device)
+    load_time = time.time() - start_time
+    logger.info(f"  ✓ Text2Image loaded in {load_time:.1f}s")
+except Exception as e:
+    logger.error(f"  ❌ Error loading Text2Image: {e}")
+    raise
+# 2. Image-to-Image модель (используем те же компоненты)
+logger.info("\n[2/3] Creating Image2Image pipeline...")
+try:
+    # Создаем QwenImageImg2ImgPipeline переиспользуя компоненты Text2Image pipeline
+    # Это правильный способ для Qwen-Image архитектуры
+    pipe_img2img = QwenImageImg2ImgPipeline(
+        vae=pipe_txt2img.vae,
+        text_encoder=pipe_txt2img.text_encoder,
+        tokenizer=pipe_txt2img.tokenizer,
+        transformer=pipe_txt2img.transformer,
+        scheduler=pipe_txt2img.scheduler
+    )
+    logger.info("  ✓ Image2Image pipeline created (reusing components)")
+except Exception as e:
+    logger.error(f"  ❌ Error creating Image2Image: {e}")
+    pipe_img2img = None
+# ControlNet не используется - убран для упрощения
+# Оптимизации памяти
+logger.info("\nApplying memory optimizations...")
+for pipe in [pipe_txt2img, pipe_img2img]:
+    if pipe and hasattr(pipe, 'vae'):
+        if hasattr(pipe.vae, 'enable_tiling'):
+            pipe.vae.enable_tiling()
+        if hasattr(pipe.vae, 'enable_slicing'):
+            pipe.vae.enable_slicing()
+logger.info("  ✓ VAE tiling and slicing enabled")
+logger.info("\n" + "=" * 60)
+logger.info("✓ ALL MODELS LOADED")
+logger.info("=" * 60)
+# =================================================================
+# HELPER FUNCTIONS
+# =================================================================
+def resize_image(input_image, max_size=2048):
+    """
+    Изменяет размер изображения с сохранением пропорций (кратно 16).
+    Если изображение меньше max_size, оставляет оригинальный размер (с округлением до 16).
+    """
+    w, h = input_image.size
+    logger.info(f"[RESIZE] Входное изображение: {w}×{h}, max_size={max_size}")
+    # Если изображение уже меньше max_size, просто округляем до 16
+    if w <= max_size and h <= max_size:
+        new_w = w - (w % 16)
+        new_h = h - (h % 16)
+        if new_w == 0: new_w = 16
+        if new_h == 0: new_h = 16
+        if new_w != w or new_h != h:
+            logger.info(f"[RESIZE] Округление до кратного 16: {w}×{h} → {new_w}×{new_h}")
+            return input_image.resize((new_w, new_h), Image.Resampling.LANCZOS)
+        logger.info(f"[RESIZE] Размер уже кратен 16, изменение не требуется")
+        return input_image
+    # Определяем масштабирование с сохранением пропорций
+    scale = min(max_size / w, max_size / h)
+    new_w = int(w * scale)
+    new_h = int(h * scale)
+    logger.info(f"[RESIZE] Масштабирование: scale={scale:.3f}, промежуточный размер: {new_w}×{new_h}")
+    # Округляем до ближайшего кратного 16
+    new_w = new_w - (new_w % 16)
+    new_h = new_h - (new_h % 16)
+    # Минимальные размеры
+    if new_w < 16: new_w = 16
+    if new_h < 16: new_h = 16
+    logger.info(f"[RESIZE] Финальный размер после округления: {new_w}×{new_h}")
+    aspect_original = w / h
+    aspect_new = new_w / new_h
+    logger.info(f"[RESIZE] Соотношение сторон: {aspect_original:.3f} → {aspect_new:.3f} (разница: {abs(aspect_original - aspect_new):.3f})")
+    return input_image.resize((new_w, new_h), Image.Resampling.LANCZOS)
+# =================================================================
+# LORA FUNCTIONS
+# =================================================================
+# Папка для локальных LoRA
+LOCAL_LORA_DIR = "/workspace/loras"
+# Базовые LoRA из HuggingFace Hub (загружаются по требованию)
+HUB_LORAS = {
+    "Realism": {
+        "repo": "flymy-ai/qwen-image-realism-lora",
+        "trigger": "Super Realism portrait of",
+        "weights": "pytorch_lora_weights.safetensors",
+        "source": "hub"
+    },
+    "Anime": {
+        "repo": "alfredplpl/qwen-image-modern-anime-lora",
+        "trigger": "Japanese modern anime style, ",
+        "weights": "pytorch_lora_weights.safetensors",
+        "source": "hub"
+    }
+    # Другие LoRA положите в /workspace/loras/ как .safetensors файлы
+}
+def scan_local_loras():
+    """
+    Сканирует папку /workspace/loras на наличие .safetensors файлов
+    Возвращает dict с найденными LoRA
+    """
+    local_loras = {}
+    if not os.path.exists(LOCAL_LORA_DIR):
+        logger.info(f"  Local LoRA directory not found: {LOCAL_LORA_DIR}")
+        return local_loras
+    logger.info(f"  Scanning local LoRA directory: {LOCAL_LORA_DIR}")
+    try:
+        for file in os.listdir(LOCAL_LORA_DIR):
+            if file.endswith('.safetensors'):
+                lora_name = os.path.splitext(file)[0]  # Имя без расширения
+                local_path = os.path.join(LOCAL_LORA_DIR, file)
+                # Добавляем в список
+                local_loras[lora_name] = {
+                    "path": local_path,
+                    "trigger": "",  # Без trigger word для локальных
+                    "weights": file,
+                    "source": "local"
+                }
+                logger.info(f"    ✓ Found local LoRA: {lora_name} ({file})")
+    except Exception as e:
+        logger.warning(f"  Error scanning local LoRA directory: {e}")
+    return local_loras
+# Сканируем локальные LoRA
+logger.info("\nScanning for LoRA models...")
+LOCAL_LORAS = scan_local_loras()
+# Объединяем Hub и локальные LoRA
+AVAILABLE_LORAS = {**HUB_LORAS, **LOCAL_LORAS}
+if LOCAL_LORAS:
+    logger.info(f"  ✓ Found {len(LOCAL_LORAS)} local LoRA(s)")
+logger.info(f"  Total available LoRAs: {len(AVAILABLE_LORAS)}")
+def load_lora_weights(pipeline, lora_name, lora_scale, hf_token):
+    """
+    Загружает LoRA веса в pipeline (ленивая загрузка)
+    Hub LoRA скачиваются только при использовании
+    Локальные LoRA загружаются из /workspace/loras/
+    """
+    if lora_name == "None" or lora_name not in AVAILABLE_LORAS:
+        logger.info(f"[LORA] Пропуск загрузки: lora_name='{lora_name}'")
+        return None
+    lora_info = AVAILABLE_LORAS[lora_name]
+    logger.info(f"[LORA] Начало загрузки: {lora_name}")
+    logger.info(f"[LORA]   Source: {lora_info['source']}")
+    logger.info(f"[LORA]   Scale: {lora_scale}")
+    try:
+        load_start = time.time()
+        if lora_info['source'] == 'hub':
+            # Ленивая загрузка с HuggingFace Hub (скачивается при первом использовании)
+            logger.info(f"[LORA] Загрузка из Hub: {lora_info['repo']}")
+            logger.info(f"[LORA]   Weight file: {lora_info.get('weights', 'pytorch_lora_weights.safetensors')}")
+            logger.info(f"[LORA]   (Скачивается если не в кэше...)")
+            pipeline.load_lora_weights(
+                lora_info['repo'],
+                weight_name=lora_info.get('weights', 'pytorch_lora_weights.safetensors'),
+                token=hf_token
+            )
+            load_time = time.time() - load_start
+            logger.info(f"[LORA] ✓ Hub LoRA загружена за {load_time:.2f}s (закэширована)")
+        else:
+            # Загрузка локального файла из /workspace/loras/
+            logger.info(f"[LORA] Загрузка локальной LoRA: {lora_info['path']}")
+            logger.info(f"[LORA]   File: {lora_info['weights']}")
+            pipeline.load_lora_weights(
+                lora_info['path'],
+                adapter_name=lora_name
+            )
+            load_time = time.time() - load_start
+            logger.info(f"[LORA] ✓ Локальная LoRA загружена за {load_time:.2f}s")
+        # Устанавливаем scale
+        if hasattr(pipeline, 'set_adapters'):
+            logger.info(f"[LORA] Установка adapter scale: {lora_scale}")
+            pipeline.set_adapters([lora_name], adapter_weights=[lora_scale])
+        trigger = lora_info.get('trigger', '')
+        if trigger:
+            logger.info(f"[LORA] Trigger word: '{trigger}'")
+        return trigger
+    except Exception as e:
+        logger.error(f"[LORA] ❌ Ошибка загрузки {lora_name}: {e}")
+        import traceback
+        logger.error(f"[LORA] Traceback:\n{traceback.format_exc()}")
+        return None
+# =================================================================
+# GENERATION FUNCTIONS
+# =================================================================
+MAX_SEED = np.iinfo(np.int32).max
+# Декоратор для spaces если доступен
+def gpu_decorator(duration=180):
+    def decorator(func):
+        if SPACES_AVAILABLE:
+            return spaces.GPU(duration=duration)(func)
+        return func
+    return decorator
+@gpu_decorator(duration=180)
+def generate_text2img(
+    prompt,
+    negative_prompt=" ",
+    width=1664,
+    height=928,
+    seed=42,
+    randomize_seed=False,
+    guidance_scale=2.5,
+    num_inference_steps=40,
+    lora_name="None",
+    lora_scale=1.0,
+    progress=gr.Progress(track_tqdm=True)
+):
+    """Text-to-Image генерация"""
+    generation_start = time.time()
+    logger.info("\n" + "=" * 60)
+    logger.info("TEXT-TO-IMAGE GENERATION")
+    logger.info("=" * 60)
+    # Генерация seed
+    if randomize_seed:
+        original_seed = seed
+        seed = random.randint(0, MAX_SEED)
+        logger.info(f"[SEED] Random seed: {original_seed} → {seed}")
+    else:
+        logger.info(f"[SEED] Fixed seed: {seed}")
+    # Логирование параметров
+    logger.info(f"[PARAMS] Prompt length: {len(prompt)} chars")
+    logger.info(f"[PARAMS] Prompt: {prompt[:150]}{'...' if len(prompt) > 150 else ''}")
+    if negative_prompt and negative_prompt != " ":
+        logger.info(f"[PARAMS] Negative prompt: {negative_prompt[:100]}{'...' if len(negative_prompt) > 100 else ''}")
+    logger.info(f"[PARAMS] Resolution: {width}×{height} = {width*height:,} pixels")
+    logger.info(f"[PARAMS] Steps: {num_inference_steps}")
+    logger.info(f"[PARAMS] CFG Scale: {guidance_scale}")
+    logger.info(f"[PARAMS] LoRA: {lora_name} (scale: {lora_scale})")
+    try:
+        # Загружаем LoRA если выбрана
+        trigger_word = None
+        original_prompt = prompt
+        if lora_name != "None":
+            logger.info(f"[T2I STAGE 1/3] Загрузка LoRA...")
+            lora_start = time.time()
+            trigger_word = load_lora_weights(pipe_txt2img, lora_name, lora_scale, hf_token)
+            lora_time = time.time() - lora_start
+            logger.info(f"[T2I STAGE 1/3] ✓ LoRA загружена за {lora_time:.2f}s")
+            # Добавляем trigger word если есть
+            if trigger_word:
+                prompt = trigger_word + prompt
+                logger.info(f"[PROMPT] Добавлен trigger: '{trigger_word}'")
+                logger.info(f"[PROMPT] Финальный промпт: {prompt[:150]}...")
+        else:
+            logger.info(f"[T2I STAGE 1/3] LoRA не используется")
+        # Создание генератора
+        logger.info(f"[T2I STAGE 2/3] Подготовка генератора...")
+        generator = torch.Generator(device=device).manual_seed(seed)
+        logger.info(f"[T2I STAGE 2/3] ✓ Generator готов на устройстве: {device}")
+        # Генерация изображения
+        logger.info(f"[T2I STAGE 3/3] Начало генерации изображения...")
+        logger.info(f"[T2I STAGE 3/3] Pipeline: DiffusionPipeline (Text2Img)")
+        logger.info(f"[T2I STAGE 3/3] Ожидаемое время: ~{num_inference_steps * 0.9:.1f}s")
+        gen_start = time.time()
+        image = pipe_txt2img(
+            prompt=prompt,
+            negative_prompt=negative_prompt,
+            width=width,
+            height=height,
+            num_inference_steps=num_inference_steps,
+            true_cfg_scale=guidance_scale,
+            generator=generator
+        ).images[0]
+        gen_time = time.time() - gen_start
+        logger.info(f"[T2I STAGE 3/3] ✓ Изображение сгенерировано за {gen_time:.2f}s")
+        logger.info(f"[T2I STAGE 3/3] Скорость: {gen_time/num_inference_steps:.3f}s на шаг")
+        # Выгружаем LoRA после генерации
+        if lora_name != "None":
+            logger.info(f"[CLEANUP] Выгрузка LoRA...")
+            unload_start = time.time()
+            pipe_txt2img.unload_lora_weights()
+            unload_time = time.time() - unload_start
+            logger.info(f"[CLEANUP] ✓ LoRA выгружена за {unload_time:.2f}s")
+        # Итоговая статистика
+        total_time = time.time() - generation_start
+        logger.info(f"[РЕЗУЛЬТАТ] Финальное изображение: {image.size[0]}×{image.size[1]}")
+        logger.info(f"[РЕЗУЛЬТАТ] Использованный seed: {seed}")
+        logger.info(f"[РЕЗУЛЬТАТ] Общее время генерации: {total_time:.2f}s")
+        logger.info("=" * 60)
+        logger.info("✓ TEXT-TO-IMAGE ЗАВЕРШЕНА УСПЕШНО")
+        logger.info("=" * 60 + "\n")
+        return image, seed, get_logs()
+    except Exception as e:
+        logger.error(f"[ERROR] ❌ Ошибка при генерации: {e}")
+        import traceback
+        logger.error(f"[ERROR] Traceback:\n{traceback.format_exc()}")
+        raise gr.Error(f"Ошибка генерации: {e}")
+@gpu_decorator(duration=180)
+def generate_img2img(
+    input_image,
+    prompt,
+    negative_prompt=" ",
+    strength=0.75,
+    seed=42,
+    randomize_seed=False,
+    guidance_scale=2.5,
+    num_inference_steps=40,
+    lora_name="None",
+    lora_scale=1.0,
+    progress=gr.Progress(track_tqdm=True)
+):
+    """Image-to-Image ��енерация"""
+    generation_start = time.time()
+    logger.info("\n" + "=" * 60)
+    logger.info("IMAGE-TO-IMAGE GENERATION")
+    logger.info("=" * 60)
+    # Проверка входного изображения
+    if input_image is None:
+        logger.error("[ERROR] Входное изображение отсутствует!")
+        raise gr.Error("Please upload an input image")
+    # КРИТИЧНО: Сохраняем оригинальные размеры ДО любых преобразований
+    original_width, original_height = input_image.size
+    logger.info(f"[INPUT] ОРИГИНАЛЬНОЕ изображение: {original_width}×{original_height}")
+    logger.info(f"[INPUT] Формат: {input_image.format if hasattr(input_image, 'format') else 'N/A'}")
+    logger.info(f"[INPUT] Режим: {input_image.mode}")
+    logger.info(f"[INPUT] Соотношение сторон: {original_width/original_height:.3f}")
+    # Генерация seed
+    if randomize_seed:
+        original_seed = seed
+        seed = random.randint(0, MAX_SEED)
+        logger.info(f"[SEED] Random seed: {original_seed} → {seed}")
+    else:
+        logger.info(f"[SEED] Fixed seed: {seed}")
+    # Изменяем размер изображения (max 3072 для поддержки больших изображений)
+    logger.info(f"[I2I STAGE 1/4] Предобработка изображения...")
+    resize_start = time.time()
+    resized = resize_image(input_image, max_size=3072)
+    resize_time = time.time() - resize_start
+    logger.info(f"[I2I STAGE 1/4] ✓ Изображение подготовлено за {resize_time:.2f}s")
+    # Логирование параметров
+    logger.info(f"[PARAMS] Prompt length: {len(prompt)} chars")
+    logger.info(f"[PARAMS] Prompt: {prompt[:150]}{'...' if len(prompt) > 150 else ''}")
+    if negative_prompt and negative_prompt != " ":
+        logger.info(f"[PARAMS] Negative prompt: {negative_prompt[:100]}{'...' if len(negative_prompt) > 100 else ''}")
+    logger.info(f"[PARAMS] Strength: {strength} (0=оригинал, 1=полная перерисовка)")
+    logger.info(f"[PARAMS] Effective steps: {int(num_inference_steps * strength)} из {num_inference_steps}")
+    logger.info(f"[PARAMS] CFG Scale: {guidance_scale}")
+    logger.info(f"[PARAMS] LoRA: {lora_name} (scale: {lora_scale})")
+    try:
+        if pipe_img2img is None:
+            logger.error("[ERROR] Image2Image pipeline не доступен!")
+            raise gr.Error("Image2Image pipeline not available")
+        # Загружаем LoRA если выбрана
+        trigger_word = None
+        original_prompt = prompt
+        if lora_name != "None":
+            logger.info(f"[I2I STAGE 2/4] Загрузка LoRA...")
+            lora_start = time.time()
+            trigger_word = load_lora_weights(pipe_img2img, lora_name, lora_scale, hf_token)
+            lora_time = time.time() - lora_start
+            logger.info(f"[I2I STAGE 2/4] ✓ LoRA загружена за {lora_time:.2f}s")
+            # Добавляем trigger word если есть
+            if trigger_word:
+                prompt = trigger_word + prompt
+                logger.info(f"[PROMPT] Добавлен trigger: '{trigger_word}'")
+                logger.info(f"[PROMPT] Финальный промпт: {prompt[:150]}...")
+        else:
+            logger.info(f"[I2I STAGE 2/4] LoRA не используется")
+        # Создание генератора
+        logger.info(f"[I2I STAGE 3/4] Подготовка генератора...")
+        generator = torch.Generator(device=device).manual_seed(seed)
+        logger.info(f"[I2I STAGE 3/4] ✓ Generator готов на устройстве: {device}")
+        # КРИТИЧНО: Передаем width и height явно, иначе пайплайн использует дефолтные 1024x1024!
+        img_width, img_height = resized.size
+        logger.info(f"[I2I STAGE 3/4] Финальное разрешение для генерации: {img_width}×{img_height}")
+        logger.info(f"[I2I STAGE 3/4] Соотношение сторон: {img_width/img_height:.3f}")
+        # Генерация изображения
+        logger.info(f"[I2I STAGE 4/4] Начало генерации изображения...")
+        logger.info(f"[I2I STAGE 4/4] Pipeline: QwenImageImg2ImgPipeline")
+        effective_steps = int(num_inference_steps * strength)
+        logger.info(f"[I2I STAGE 4/4] Реальных шагов денойзинга: {effective_steps}")
+        logger.info(f"[I2I STAGE 4/4] Ожидаемое время: ~{effective_steps * 0.9:.1f}s")
+        logger.info(f"[DEBUG] 🔍 ПЕРЕДАЕМ В PIPELINE: width={img_width}, height={img_height}")
+        gen_start = time.time()
+        image = pipe_img2img(
+            prompt=prompt,
+            negative_prompt=negative_prompt,
+            image=resized,
+            width=img_width,
+            height=img_height,
+            strength=strength,
+            num_inference_steps=num_inference_steps,
+            true_cfg_scale=guidance_scale,
+            generator=generator
+        ).images[0]
+        gen_time = time.time() - gen_start
+        # КРИТИЧНО: Проверяем финальный размер результата
+        final_width, final_height = image.size
+        logger.info(f"[DEBUG] 🔍 ПОЛУЧИЛИ ИЗ PIPELINE: width={final_width}, height={final_height}")
+        if final_width != img_width or final_height != img_height:
+            logger.error(f"[BUG] ⚠️⚠️⚠️ РАЗМЕР ИЗМЕНИЛСЯ! ⚠️⚠️⚠️")
+            logger.error(f"[BUG] Ожидалось: {img_width}×{img_height}")
+            logger.error(f"[BUG] Получено: {final_width}×{final_height}")
+            logger.error(f"[BUG] Соотношение: {final_width/final_height:.3f}")
+            logger.error(f"[BUG] Это указывает на проблему в pipeline или diffusers!")
+        else:
+            logger.info(f"[I2I STAGE 4/4] ✓ Размер результата корректен: {final_width}×{final_height}")
+        logger.info(f"[I2I STAGE 4/4] ✓ Изображение сгенерировано за {gen_time:.2f}s")
+        logger.info(f"[I2I STAGE 4/4] Скорость: {gen_time/effective_steps:.3f}s на шаг")
+        # Выгружаем LoRA
+        if lora_name != "None":
+            logger.info(f"[CLEANUP] Выгрузка LoRA...")
+            unload_start = time.time()
+            pipe_img2img.unload_lora_weights()
+            unload_time = time.time() - unload_start
+            logger.info(f"[CLEANUP] ✓ LoRA выгружена за {unload_time:.2f}s")
+        # Итоговая статистика
+        total_time = time.time() - generation_start
+        logger.info(f"[РЕЗУЛЬТАТ] Финальное изображение: {image.size[0]}×{image.size[1]}")
+        logger.info(f"[РЕЗУЛЬТАТ] Использованный seed: {seed}")
+        logger.info(f"[РЕЗУЛЬТАТ] Общее время генерации: {total_time:.2f}s")
+        logger.info(f"[РЕЗУЛЬТАТ] Разбивка времени:")
+        logger.info(f"[РЕЗУЛЬТАТ]   - Ресайз: {resize_time:.2f}s ({resize_time/total_time*100:.1f}%)")
+        logger.info(f"[РЕЗУЛЬТАТ]   - Генерация: {gen_time:.2f}s ({gen_time/total_time*100:.1f}%)")
+        logger.info("=" * 60)
+        logger.info("✓ IMAGE-TO-IMAGE ЗАВЕРШЕНА УСПЕШНО")
+        logger.info("=" * 60 + "\n")
+        return image, seed, get_logs()
+    except Exception as e:
+        logger.error(f"[ERROR] ❌ Ошибка при генерации: {e}")
+        import traceback
+        logger.error(f"[ERROR] Traceback:\n{traceback.format_exc()}")
+        raise gr.Error(f"Ошибка генерации: {e}")
+# ControlNet функция убрана - не используется
+# =================================================================
+# GRADIO INTERFACE
+# =================================================================
+MAX_SEED = np.iinfo(np.int32).max
+css = """
+#col-container {
+    margin: 0 auto;
+    max-width: 1400px;
+}
+"""
+with gr.Blocks(css=css, theme=gr.themes.Soft()) as demo:
+    lora_choices = ["None"] + list(AVAILABLE_LORAS.keys())
+    gr.Markdown(f"""
+    # 🎨 Qwen Soloband - Image2Image + LoRA v2.2
+    **Продвинутая модель генерации** с поддержкой Text-to-Image, Image-to-Image и LoRA стилей.
+    ### ✨ Возможности:
+    - 🖼️ **Text-to-Image** - Генерация из текста, разрешения до 2048×2048
+    - 🔄 **Image-to-Image** - Модификация изображений с контролем strength (0.0-1.0, до 3072×3072)
+    - 🎭 **LoRA Support** - {len(AVAILABLE_LORAS)} доступных стилей (Hub + локальные)
+    - 🔌 **Full API** - Все функции доступны через API
+    - ⚡ **Optimized** - VAE tiling/slicing, правильный QwenImageImg2ImgPipeline
+    - 📋 **Detailed Logs** - Подробное логирование всех этапов генерации
+    **Модель**: [Gerchegg/Qwen-Soloband-Diffusers](https://huggingface.co/Gerchegg/Qwen-Soloband-Diffusers)
+    💡 **Local LoRAs**: Положите .safetensors файлы в `/workspace/loras/` - они появятся автоматически!
+    """)
+    with gr.Tabs() as tabs:
+        # TAB 1: Text-to-Image
+        with gr.Tab("📝 Text-to-Image"):
+            with gr.Row():
+                with gr.Column(scale=1):
+                    t2i_prompt = gr.Text(
+                        label="Prompt",
+                        placeholder="SB_AI, a beautiful landscape...",
+                        lines=3
+                    )
+                    t2i_run = gr.Button("Generate", variant="primary")
+                    with gr.Accordion("Advanced Settings", open=False):
+                        t2i_negative = gr.Text(label="Negative Prompt", value="blurry, low quality")
+                        with gr.Row():
+                            t2i_width = gr.Slider(label="Width", minimum=512, maximum=2048, step=64, value=1664)
+                            t2i_height = gr.Slider(label="Height", minimum=512, maximum=2048, step=64, value=928)
+                        with gr.Row():
+                            t2i_steps = gr.Slider(label="Steps", minimum=1, maximum=50, step=1, value=40)
+                            t2i_cfg = gr.Slider(label="CFG", minimum=0.0, maximum=7.5, step=0.1, value=2.5)
+                        with gr.Row():
+                            t2i_seed = gr.Slider(label="Seed", minimum=0, maximum=MAX_SEED, step=1, value=0)
+                            t2i_random_seed = gr.Checkbox(label="Random", value=True)
+                        t2i_lora = gr.Radio(
+                            label="LoRA Style",
+                            choices=lora_choices,
+                            value="None",
+                            info=f"Hub: {len(HUB_LORAS)}, Local: {len(LOCAL_LORAS)}"
+                        )
+                        t2i_lora_scale = gr.Slider(label="LoRA Strength", minimum=0.0, maximum=2.0, step=0.1, value=1.0)
+                with gr.Column(scale=1):
+                    t2i_output = gr.Image(label="Generated Image")
+                    t2i_seed_output = gr.Number(label="Used Seed")
+        # TAB 2: Image-to-Image
+        with gr.Tab("🔄 Image-to-Image"):
+            with gr.Row():
+                with gr.Column(scale=1):
+                    i2i_input = gr.Image(type="pil", label="Input Image")
+                    i2i_prompt = gr.Text(
+                        label="Prompt",
+                        placeholder="Transform this image into...",
+                        lines=3
+                    )
+                    i2i_strength = gr.Slider(
+                        label="Denoising Strength",
+                        info="0.0 = original image, 1.0 = complete redraw",
+                        minimum=0.0,
+                        maximum=1.0,
+                        step=0.05,
+                        value=0.75
+                    )
+                    i2i_run = gr.Button("Generate", variant="primary")
+                    with gr.Accordion("Advanced Settings", open=False):
+                        i2i_negative = gr.Text(label="Negative Prompt", value="blurry, low quality")
+                        with gr.Row():
+                            i2i_steps = gr.Slider(label="Steps", minimum=1, maximum=50, step=1, value=40)
+                            i2i_cfg = gr.Slider(label="CFG", minimum=0.0, maximum=7.5, step=0.1, value=2.5)
+                        with gr.Row():
+                            i2i_seed = gr.Slider(label="Seed", minimum=0, maximum=MAX_SEED, step=1, value=0)
+                            i2i_random_seed = gr.Checkbox(label="Random", value=True)
+                        i2i_lora = gr.Radio(
+                            label="LoRA Style",
+                            choices=lora_choices,
+                            value="None",
+                            info=f"Hub: {len(HUB_LORAS)}, Local: {len(LOCAL_LORAS)}"
+                        )
+                        i2i_lora_scale = gr.Slider(label="LoRA Strength", minimum=0.0, maximum=2.0, step=0.1, value=1.0)
+                with gr.Column(scale=1):
+                    i2i_output = gr.Image(label="Generated Image")
+                    i2i_seed_output = gr.Number(label="Used Seed")
+        # TAB 3: Logs
+        with gr.Tab("📋 Logs"):
+            gr.Markdown("""
+            ## 📋 Логи генерации
+            Здесь отображаются подробные логи последней генерации:
+            - 🔍 Параметры запроса (prompt, size, seed, etc.)
+            - ⚙️ Этапы обработки (resize, LoRA loading, generation)
+            - ⏱️ Время выполнения каждого этапа
+            - 📊 Финальная статистика и разбивка времени
+            💡 Логи автоматически обновляются после каждой генерации
+            """)
+            log_output = gr.Textbox(
+                label="Логи",
+                lines=25,
+                max_lines=50,
+                show_copy_button=True,
+                interactive=False,
+                placeholder="Логи появятся после первой генерации..."
+            )
+            with gr.Row():
+                refresh_logs_btn = gr.Button("🔄 Обновить логи", size="sm")
+                clear_logs_btn = gr.Button("🗑️ Очистить логи", size="sm", variant="stop")
+            # Кнопка обновления логов
+            refresh_logs_btn.click(
+                fn=get_logs,
+                inputs=None,
+                outputs=log_output
+            )
+            # Кнопка очистки логов
+            clear_logs_btn.click(
+                fn=clear_logs,
+                inputs=None,
+                outputs=log_output
+            )
+    # Event handlers
+    t2i_run.click(
+        fn=generate_text2img,
+        inputs=[
+            t2i_prompt, t2i_negative, t2i_width, t2i_height,
+            t2i_seed, t2i_random_seed, t2i_cfg, t2i_steps,
+            t2i_lora, t2i_lora_scale
+        ],
+        outputs=[t2i_output, t2i_seed_output, log_output],
+        api_name="text2img"
+    )
+    i2i_run.click(
+        fn=generate_img2img,
+        inputs=[
+            i2i_input, i2i_prompt, i2i_negative, i2i_strength,
+            i2i_seed, i2i_random_seed, i2i_cfg, i2i_steps,
+            i2i_lora, i2i_lora_scale
+        ],
+        outputs=[i2i_output, i2i_seed_output, log_output],
+        api_name="img2img"
+    )
+if __name__ == "__main__":
+    demo.launch(
+        show_api=True,
+        share=False,
+        show_error=True  # Показывать подробные ошибки в API
+    )