Aniimage-1 / generate_hf.py

Upload generate_hf.py

5dbc62b verified 1 day ago

52 kB

	"""
	Aniimage Generator — Generate anime images from text prompts.
	https://huggingface.co/8BitStudio/Aniimage-1

	Usage:
	pip install torch torchvision diffusers transformers safetensors pillow huggingface_hub
	python generate_hf.py
	"""

	import os
	import sys
	import torch
	import torch.nn.functional as F
	import numpy as np
	import tkinter as tk
	from tkinter import ttk, simpledialog
	from pathlib import Path
	from PIL import Image, ImageTk, ImageEnhance, ImageFilter
	from threading import Thread

	# ── Paths ─────────────────────────────────────────────────────────────────────
	SCRIPT_DIR = Path(__file__).resolve().parent
	MODEL_DIR = SCRIPT_DIR / "models"
	OUTPUT_DIR = SCRIPT_DIR / "generated"

	# ── HuggingFace repo ─────────────────────────────────────────────────────────
	HF_REPO_ID = "8BitStudio/Aniimage-1"

	# ── UNet config (must match training) ─────────────────────────────────────────
	UNET_CONFIG = dict(
	sample_size=32,
	in_channels=4,
	out_channels=4,
	block_out_channels=(256, 512, 768, 1024),
	layers_per_block=2,
	cross_attention_dim=768,
	attention_head_dim=8,
	down_block_types=("DownBlock2D", "CrossAttnDownBlock2D",
	"CrossAttnDownBlock2D", "DownBlock2D"),
	up_block_types=("UpBlock2D", "CrossAttnUpBlock2D",
	"CrossAttnUpBlock2D", "UpBlock2D"),
	)

	VAE_ID = "stabilityai/sd-vae-ft-mse"
	CLIP_ID = "openai/clip-vit-large-patch14"

	SCHEDULER_LIST = [
	"DPM++ 2M Karras",
	"DPM++ SDE Karras",
	"Euler a",
	"Euler",
	"DDIM",
	]

	DEFAULT_NEGATIVE = (
	"low quality, ugly, blurry, distorted, deformed, bad anatomy, "
	"bad proportions, extra limbs, missing limbs, watermark, text, "
	"signature, washed out, flat colors, manga panel, disfigured, "
	"poorly drawn, jpeg artifacts, cropped, out of frame"
	)


	# ── Model discovery ───────────────────────────────────────────────────────────

	def download_from_hf():
	"""Download model weights from HuggingFace if not already cached."""
	try:
	from huggingface_hub import hf_hub_download
	except ImportError:
	print("Install huggingface_hub: pip install huggingface_hub")
	return None

	MODEL_DIR.mkdir(parents=True, exist_ok=True)
	aniimage_dir = MODEL_DIR / "Aniimage-1"
	weights_path = aniimage_dir / "diffusion_pytorch_model.safetensors"

	if weights_path.exists():
	print("Aniimage-1 weights already downloaded.")
	return aniimage_dir

	print(f"Downloading Aniimage-1 from {HF_REPO_ID}...")
	aniimage_dir.mkdir(parents=True, exist_ok=True)

	import shutil
	dl_weights = hf_hub_download(repo_id=HF_REPO_ID,
	filename="diffusion_pytorch_model.safetensors")
	shutil.copy2(dl_weights, weights_path)

	try:
	dl_config = hf_hub_download(repo_id=HF_REPO_ID, filename="config.json")
	shutil.copy2(dl_config, aniimage_dir / "config.json")
	except Exception:
	pass

	print("Download complete!")
	return aniimage_dir


	def find_models():
	"""Find all available models."""
	options = []
	if MODEL_DIR.exists():
	for d in sorted(MODEL_DIR.iterdir()):
	if d.is_dir():
	safetensors = d / "diffusion_pytorch_model.safetensors"
	ema_path = d / "ema_unet.pt"
	unet_path = d / "unet.pt"
	if safetensors.exists():
	options.append(("safetensors", d.name, d, "256"))
	elif ema_path.exists() or unet_path.exists():
	options.append(("checkpoint", d.name, d, "256"))
	return options


	# ── Theme ─────────────────────────────────────────────────────────────────────

	C = {
	"bg": "#111119",
	"panel": "#1b1b2f",
	"card": "#24243e",
	"card_sel": "#3a3a6e",
	"border": "#2e2e52",
	"accent": "#6c5ce7",
	"accent_h": "#8577ed",
	"red": "#e74c3c",
	"green": "#2ecc71",
	"text": "#eaeaea",
	"text2": "#a0a0b8",
	"text3": "#60607a",
	"input": "#16162a",
	"input_fg": "#dcdcf0",
	}


	class Generator:
	def __init__(self, device="cuda"):
	self.device = device if device == "cuda" and torch.cuda.is_available() else "cpu"
	self.vae = None
	self.text_encoder = None
	self.tokenizer = None
	self.unet = None
	self.scheduler = None
	self.loaded_checkpoint = None
	self.latent_size = 32
	self.output_size = 256
	self.cancelled = False

	def switch_device(self, new_device):
	"""Move all loaded models to a new device."""
	new_device = new_device if new_device == "cuda" and torch.cuda.is_available() else "cpu"
	if new_device == self.device:
	return
	self.device = new_device
	if self.vae is not None:
	self.vae = self.vae.to(self.device)
	if self.text_encoder is not None:
	self.text_encoder = self.text_encoder.to(self.device)
	if self.unet is not None:
	self.unet = self.unet.to(self.device)
	self.loaded_checkpoint = None # force reload on next generate
	print(f"Switched to {self.device.upper()}")

	def load_shared(self):
	if self.vae is not None:
	return
	from diffusers import AutoencoderKL
	from transformers import CLIPTextModel, CLIPTokenizer

	print("Loading VAE...")
	self.vae = AutoencoderKL.from_pretrained(VAE_ID).to(self.device)
	self.vae.eval()

	print("Loading CLIP text encoder...")
	self.tokenizer = CLIPTokenizer.from_pretrained(CLIP_ID)
	self.text_encoder = CLIPTextModel.from_pretrained(CLIP_ID).to(self.device)
	self.text_encoder.eval()

	self.scheduler = self._make_scheduler("DPM++ 2M Karras")
	self.scheduler_name = "DPM++ 2M Karras"
	print("Shared models loaded.")

	def _make_scheduler(self, name="DPM++ 2M Karras"):
	from diffusers import (DDIMScheduler, DPMSolverMultistepScheduler,
	EulerAncestralDiscreteScheduler,
	EulerDiscreteScheduler)
	base = dict(num_train_timesteps=1000, beta_schedule="scaled_linear",
	prediction_type="epsilon")
	if name == "DPM++ 2M Karras":
	return DPMSolverMultistepScheduler(
	**base, algorithm_type="dpmsolver++",
	solver_order=2, use_karras_sigmas=True)
	elif name == "DPM++ SDE Karras":
	return DPMSolverMultistepScheduler(
	**base, algorithm_type="sde-dpmsolver++",
	use_karras_sigmas=True)
	elif name == "Euler a":
	return EulerAncestralDiscreteScheduler(**base)
	elif name == "Euler":
	return EulerDiscreteScheduler(**base)
	else:
	return DDIMScheduler(**base, clip_sample=False,
	set_alpha_to_one=False)

	def set_scheduler(self, name):
	self.scheduler = self._make_scheduler(name)
	self.scheduler_name = name

	def load_model(self, model_path: Path, res_label: str = "256"):
	if str(model_path) == self.loaded_checkpoint:
	return
	from diffusers import UNet2DConditionModel

	self.load_shared()

	if res_label == "512":
	self.latent_size = 64
	self.output_size = 512
	else:
	self.latent_size = 32
	self.output_size = 256

	unet_cfg = dict(UNET_CONFIG)
	unet_cfg["sample_size"] = self.latent_size

	print(f"Loading UNet from {model_path.name} ({res_label}px)...")
	self.unet = UNet2DConditionModel(**unet_cfg).to(self.device)

	safetensors_path = model_path / "diffusion_pytorch_model.safetensors"
	ema_path = model_path / "ema_unet.pt"
	unet_path = model_path / "unet.pt"

	if safetensors_path.exists():
	from safetensors.torch import load_file
	state = load_file(str(safetensors_path), device=str(self.device))
	self.unet.load_state_dict(state)
	print("Loaded safetensors weights.")
	elif ema_path.exists():
	state = torch.load(ema_path, map_location=self.device, weights_only=True)
	if "shadow_params" in state:
	params = dict(self.unet.named_parameters())
	keys = list(params.keys())
	for i, sp in enumerate(state["shadow_params"]):
	params[keys[i]].data.copy_(sp)
	else:
	self.unet.load_state_dict(state)
	print("Loaded EMA weights.")
	elif unet_path.exists():
	self.unet.load_state_dict(
	torch.load(unet_path, map_location=self.device, weights_only=True))
	print("Loaded UNet weights.")
	else:
	raise FileNotFoundError(f"No weights found in {model_path}")

	self.unet.eval()
	self.loaded_checkpoint = str(model_path)
	print(f"Ready to generate at {self.output_size}x{self.output_size}!")

	def _decode_latents(self, latents, post_process=False):
	scaled = latents / self.vae.config.scaling_factor
	with torch.no_grad():
	image = self.vae.decode(scaled.float()).sample
	image = (image.float() / 2 + 0.5).clamp(0, 1)
	image = image.cpu().permute(0, 2, 3, 1).numpy()[0]
	image = (image * 255).round().astype("uint8")
	img = Image.fromarray(image)
	if post_process:
	img = self._post_process(img)
	return img

	def _sharpen_latents(self, latents, amount=0.08):
	blurred = F.avg_pool2d(latents, kernel_size=3, stride=1, padding=1)
	return latents + amount * (latents - blurred)

	def _post_process(self, img):
	img = img.filter(ImageFilter.UnsharpMask(radius=1.5, percent=40, threshold=2))
	img = ImageEnhance.Contrast(img).enhance(1.06)
	img = ImageEnhance.Color(img).enhance(1.10)
	return img

	def _image_quality_score(self, img: Image.Image) -> float:
	arr = np.array(img.convert("L"), dtype=np.float32)
	lap = (np.roll(arr, 1, 0) + np.roll(arr, -1, 0)
	+ np.roll(arr, 1, 1) + np.roll(arr, -1, 1) - 4.0 * arr)
	sharpness = float(np.var(lap))
	arr_rgb = np.array(img, dtype=np.float32)
	color_var = float(np.mean(np.var(arr_rgb, axis=(0, 1))))
	score = (sharpness * 0.6 + color_var * 0.4)
	return min(100.0, score / 10.0)

	@torch.no_grad()
	def generate(self, prompt: str, negative_prompt: str = "",
	steps: int = 25, guidance_scale: float = 7.5,
	seed: int = -1, preview_callback=None,
	preview_every: int = 5) -> tuple:

	if seed < 0:
	seed = torch.randint(0, 2**32, (1,)).item()
	gen = torch.Generator(device=self.device).manual_seed(seed)

	tok = self.tokenizer(prompt, padding="max_length",
	max_length=self.tokenizer.model_max_length,
	truncation=True, return_tensors="pt")
	text_emb = self.text_encoder(tok.input_ids.to(self.device))[0]

	tok_neg = self.tokenizer(negative_prompt if negative_prompt else "",
	padding="max_length",
	max_length=self.tokenizer.model_max_length,
	truncation=True, return_tensors="pt")
	neg_emb = self.text_encoder(tok_neg.input_ids.to(self.device))[0]

	text_emb_combined = torch.cat([neg_emb, text_emb])

	scheduler = self._make_scheduler(self.scheduler_name)
	scheduler.set_timesteps(steps, device=self.device)

	latents = torch.randn(1, 4, self.latent_size, self.latent_size,
	generator=gen, device=self.device)
	latents = latents * scheduler.init_noise_sigma

	timesteps = scheduler.timesteps
	total_steps = len(timesteps)

	for step_i, t in enumerate(timesteps):
	if self.cancelled:
	return None, seed

	latent_input = torch.cat([latents] * 2)
	latent_input = scheduler.scale_model_input(latent_input, t)

	with torch.autocast(device_type="cuda", dtype=torch.bfloat16,
	enabled=(self.device == "cuda")):
	pred = self.unet(latent_input, t,
	encoder_hidden_states=text_emb_combined).sample

	pred_neg, pred_text = pred.chunk(2)
	pred = pred_neg + guidance_scale * (pred_text - pred_neg)

	latents = scheduler.step(pred, t, latents).prev_sample

	if (preview_callback and step_i > 0
	and step_i % preview_every == 0
	and step_i < total_steps - 1):
	preview = self._decode_latents(latents, post_process=False)
	preview_callback(preview, step_i + 1, total_steps)

	latents = self._sharpen_latents(latents)
	final = self._decode_latents(latents, post_process=True)
	return final, seed

	@torch.no_grad()
	def generate_adaptive(self, prompt: str, negative_prompt: str = "",
	base_steps: int = 25, max_steps: int = 85,
	guidance_scale: float = 7.5,
	quality_threshold: float = 45.0,
	preview_callback=None, preview_every: int = 5,
	status_callback=None) -> tuple:

	result = self.generate(
	prompt=prompt, negative_prompt=negative_prompt,
	steps=base_steps, guidance_scale=guidance_scale,
	preview_callback=preview_callback, preview_every=preview_every)

	if result[0] is None:
	return result

	image, seed = result
	quality = self._image_quality_score(image)

	if status_callback:
	status_callback(f"Quality: {quality:.1f}/100")

	if quality >= quality_threshold:
	return image, seed

	rounds = 0
	max_rounds = (max_steps - base_steps) // 20

	while quality < quality_threshold and rounds < max_rounds:
	if self.cancelled:
	return image, seed
	rounds += 1
	if status_callback:
	status_callback(f"Refining +20 steps (round {rounds})...")

	refined = self.refine(
	source_image=image, prompt=prompt,
	negative_prompt=negative_prompt,
	extra_steps=20, strength=0.3,
	guidance_scale=guidance_scale,
	preview_callback=preview_callback, preview_every=5)

	if refined is None:
	return image, seed
	image = refined
	quality = self._image_quality_score(image)

	if status_callback:
	status_callback(f"Quality after round {rounds}: {quality:.1f}/100")

	return image, seed

	@torch.no_grad()
	def refine(self, source_image: Image.Image, prompt: str,
	negative_prompt: str = "", extra_steps: int = 20,
	strength: float = 0.35, guidance_scale: float = 7.5,
	preview_callback=None, preview_every: int = 5) -> Image.Image:

	img = source_image.resize((self.output_size, self.output_size), Image.LANCZOS)
	img_tensor = torch.from_numpy(np.array(img)).float().div(127.5).sub(1.0)
	img_tensor = img_tensor.permute(2, 0, 1).unsqueeze(0).to(self.device)

	with torch.no_grad():
	latents = self.vae.encode(img_tensor.float()).latent_dist.sample()
	latents = latents * self.vae.config.scaling_factor

	tok = self.tokenizer(prompt, padding="max_length",
	max_length=self.tokenizer.model_max_length,
	truncation=True, return_tensors="pt")
	text_emb = self.text_encoder(tok.input_ids.to(self.device))[0]

	tok_neg = self.tokenizer(negative_prompt if negative_prompt else "",
	padding="max_length",
	max_length=self.tokenizer.model_max_length,
	truncation=True, return_tensors="pt")
	neg_emb = self.text_encoder(tok_neg.input_ids.to(self.device))[0]
	text_emb_combined = torch.cat([neg_emb, text_emb])

	scheduler = self._make_scheduler(self.scheduler_name)
	scheduler.set_timesteps(extra_steps, device=self.device)
	start_step = max(0, int(len(scheduler.timesteps) * (1 - strength)))
	timesteps = scheduler.timesteps[start_step:]

	noise = torch.randn_like(latents)
	latents = scheduler.add_noise(latents, noise, timesteps[:1])

	total_steps = len(timesteps)
	for step_i, t in enumerate(timesteps):
	if self.cancelled:
	return None
	latent_input = torch.cat([latents] * 2)
	latent_input = scheduler.scale_model_input(latent_input, t)
	with torch.autocast(device_type="cuda", dtype=torch.bfloat16,
	enabled=(self.device == "cuda")):
	pred = self.unet(latent_input, t,
	encoder_hidden_states=text_emb_combined).sample
	pred_neg, pred_text = pred.chunk(2)
	pred = pred_neg + guidance_scale * (pred_text - pred_neg)
	latents = scheduler.step(pred, t, latents).prev_sample

	if (preview_callback and step_i > 0
	and step_i % preview_every == 0
	and step_i < total_steps - 1):
	preview = self._decode_latents(latents, post_process=False)
	preview_callback(preview, step_i + 1, total_steps)

	latents = self._sharpen_latents(latents)
	return self._decode_latents(latents, post_process=True)


	# ── GUI ───────────────────────────────────────────────────────────────────────

	class App:
	def __init__(self):
	self.gen = Generator()
	self.models = find_models()
	self.generated_images = []
	self.generated_seeds = []
	self.photo_refs = []
	self.generating = False
	self.selected_index = None

	self.root = tk.Tk()
	self.root.title("Aniimage")
	self.root.configure(bg=C["bg"])
	self.root.resizable(True, True)
	self.root.geometry("900x780")
	self.root.minsize(640, 500)

	self._setup_styles()
	self._build_ui()

	def _setup_styles(self):
	s = ttk.Style()
	s.theme_use("clam")

	# Base
	s.configure(".", background=C["bg"], foreground=C["text"], font=("Segoe UI", 10))
	s.configure("TFrame", background=C["bg"])
	s.configure("TLabel", background=C["bg"], foreground=C["text"])
	s.configure("TCheckbutton", background=C["bg"], foreground=C["text"])

	# Combobox — readable text
	s.configure("TCombobox", fieldbackground=C["input"], foreground=C["input_fg"],
	selectbackground=C["accent"], selectforeground="#ffffff",
	arrowcolor=C["text2"], padding=4)
	s.map("TCombobox",
	fieldbackground=[("readonly", C["input"])],
	foreground=[("readonly", C["input_fg"])],
	selectbackground=[("readonly", C["accent"])],
	selectforeground=[("readonly", "#ffffff")])
	# Combobox dropdown list colors
	self.root.option_add("TComboboxListbox.background", C["input"])
	self.root.option_add("TComboboxListbox.foreground", C["input_fg"])
	self.root.option_add("TComboboxListbox.selectBackground", C["accent"])
	self.root.option_add("TComboboxListbox.selectForeground", "#ffffff")
	self.root.option_add("TComboboxListbox.font", ("Segoe UI", 10))

	# Spinbox
	s.configure("TSpinbox", fieldbackground=C["input"], foreground=C["input_fg"],
	arrowcolor=C["text2"], padding=3)

	# Buttons
	s.configure("TButton", font=("Segoe UI", 10), padding=(14, 7),
	background=C["card"], foreground=C["text"])
	s.map("TButton", background=[("active", C["card_sel"]), ("disabled", C["bg"])],
	foreground=[("disabled", C["text3"])])

	s.configure("Go.TButton", font=("Segoe UI", 11, "bold"), padding=(20, 9),
	background=C["accent"], foreground="#ffffff")
	s.map("Go.TButton", background=[("active", C["accent_h"]),
	("disabled", C["border"])])

	s.configure("Stop.TButton", font=("Segoe UI", 10, "bold"), padding=(14, 7),
	background=C["red"], foreground="#ffffff")
	s.map("Stop.TButton", background=[("active", "#c0392b"),
	("disabled", C["border"])])

	# Labelframe
	s.configure("TLabelframe", background=C["bg"], foreground=C["text2"])
	s.configure("TLabelframe.Label", background=C["bg"],
	foreground=C["text2"], font=("Segoe UI", 9, "bold"))

	# Scrollbar
	s.configure("Vertical.TScrollbar", background=C["card"],
	troughcolor=C["bg"], arrowcolor=C["text3"])

	def _make_entry(self, parent, font_size=11, dim=False):
	"""Create a styled tk.Entry with readable text."""
	return tk.Entry(parent, font=("Segoe UI", font_size),
	bg=C["input"], fg=C["input_fg"] if not dim else C["text2"],
	insertbackground=C["input_fg"],
	relief="flat", bd=6,
	selectbackground=C["accent"], selectforeground="#ffffff",
	highlightthickness=1, highlightcolor=C["accent"],
	highlightbackground=C["border"])

	def _build_ui(self):
	# ── Header ────────────────────────────────────────────────────────
	header = tk.Frame(self.root, bg=C["panel"], padx=20, pady=12)
	header.pack(fill=tk.X)

	tk.Label(header, text="Aniimage", bg=C["panel"], fg=C["accent"],
	font=("Segoe UI", 20, "bold")).pack(side=tk.LEFT)
	tk.Label(header, text="by 8BitStudio", bg=C["panel"], fg=C["text3"],
	font=("Segoe UI", 10)).pack(side=tk.LEFT, padx=(10, 0), pady=(6, 0))

	# Device switch — right side of header
	device_frame = tk.Frame(header, bg=C["panel"])
	device_frame.pack(side=tk.RIGHT)

	tk.Label(device_frame, text="Device:", bg=C["panel"], fg=C["text2"],
	font=("Segoe UI", 9)).pack(side=tk.LEFT, padx=(0, 5))

	self.device_var = tk.StringVar(value="GPU" if self.gen.device == "cuda" else "CPU")
	devices = ["GPU", "CPU"] if torch.cuda.is_available() else ["CPU"]
	device_combo = ttk.Combobox(device_frame, textvariable=self.device_var,
	values=devices, state="readonly", width=5)
	device_combo.pack(side=tk.LEFT)
	device_combo.bind("<<ComboboxSelected>>", self._on_device_change)

	# ── Main content — two-column: controls left, images right ────────
	main = tk.Frame(self.root, bg=C["bg"])
	main.pack(fill=tk.BOTH, expand=True, padx=12, pady=(8, 12))

	# Left panel (controls)
	left = tk.Frame(main, bg=C["panel"], width=340, padx=16, pady=12)
	left.pack(side=tk.LEFT, fill=tk.Y, padx=(0, 8))
	left.pack_propagate(False)

	# Right panel (image grid)
	right = tk.Frame(main, bg=C["bg"])
	right.pack(side=tk.LEFT, fill=tk.BOTH, expand=True)

	self._build_controls(left)
	self._build_grid(right)

	def _build_controls(self, parent):
	# ── Model ─────────────────────────────────────────────────────────
	tk.Label(parent, text="Model", bg=C["panel"], fg=C["text2"],
	font=("Segoe UI", 9, "bold")).pack(anchor=tk.W)

	self.model_var = tk.StringVar()
	model_names = [m[1] for m in self.models] or ["No models found"]
	self.model_combo = ttk.Combobox(parent, textvariable=self.model_var,
	values=model_names, state="readonly", width=32)
	self.model_combo.pack(fill=tk.X, pady=(3, 12))
	self.model_combo.current(len(model_names) - 1)

	# ── Prompt ────────────────────────────────────────────────────────
	tk.Label(parent, text="Prompt", bg=C["panel"], fg=C["text2"],
	font=("Segoe UI", 9, "bold")).pack(anchor=tk.W)
	self.prompt_entry = self._make_entry(parent)
	self.prompt_entry.pack(fill=tk.X, pady=(3, 8))
	self.prompt_entry.insert(0, "a smiling anime girl with long blue hair")
	self.prompt_entry.bind("<Return>", lambda e: self.on_generate())

	# ── Negative prompt ───────────────────────────────────────────────
	tk.Label(parent, text="Negative prompt", bg=C["panel"], fg=C["text3"],
	font=("Segoe UI", 9)).pack(anchor=tk.W)
	self.neg_entry = self._make_entry(parent, font_size=9, dim=True)
	self.neg_entry.pack(fill=tk.X, pady=(3, 12))
	self.neg_entry.insert(0, DEFAULT_NEGATIVE)

	# ── Settings grid ─────────────────────────────────────────────────
	grid = tk.Frame(parent, bg=C["panel"])
	grid.pack(fill=tk.X, pady=(0, 8))

	# Row 1: Scheduler
	tk.Label(grid, text="Scheduler", bg=C["panel"], fg=C["text2"],
	font=("Segoe UI", 9)).grid(row=0, column=0, sticky="w", pady=(0, 6))
	self.scheduler_var = tk.StringVar(value="DPM++ 2M Karras")
	sched_combo = ttk.Combobox(grid, textvariable=self.scheduler_var,
	values=SCHEDULER_LIST, state="readonly", width=18)
	sched_combo.grid(row=0, column=1, columnspan=3, sticky="ew", padx=(8, 0), pady=(0, 6))
	sched_combo.bind("<<ComboboxSelected>>", self._on_scheduler_change)

	# Row 2: Steps, CFG, Count
	tk.Label(grid, text="Steps", bg=C["panel"], fg=C["text2"],
	font=("Segoe UI", 9)).grid(row=1, column=0, sticky="w", pady=(0, 6))
	self.steps_var = tk.StringVar(value="25")
	tk.Entry(grid, textvariable=self.steps_var, width=5, font=("Segoe UI", 10),
	bg=C["input"], fg=C["input_fg"], insertbackground=C["input_fg"],
	relief="flat", bd=4).grid(row=1, column=1, sticky="w", padx=(8, 12), pady=(0, 6))

	tk.Label(grid, text="CFG", bg=C["panel"], fg=C["text2"],
	font=("Segoe UI", 9)).grid(row=1, column=2, sticky="w", pady=(0, 6))
	self.cfg_var = tk.StringVar(value="7.5")
	tk.Entry(grid, textvariable=self.cfg_var, width=5, font=("Segoe UI", 10),
	bg=C["input"], fg=C["input_fg"], insertbackground=C["input_fg"],
	relief="flat", bd=4).grid(row=1, column=3, sticky="w", padx=(8, 0), pady=(0, 6))

	# Row 3: Count, Live preview
	tk.Label(grid, text="Count", bg=C["panel"], fg=C["text2"],
	font=("Segoe UI", 9)).grid(row=2, column=0, sticky="w", pady=(0, 6))
	self.count_var = tk.StringVar(value="4")
	ttk.Spinbox(grid, from_=1, to=12, textvariable=self.count_var, width=4,
	font=("Segoe UI", 10)).grid(row=2, column=1, sticky="w", padx=(8, 12), pady=(0, 6))

	self.live_preview_var = tk.BooleanVar(value=False)
	ttk.Checkbutton(grid, text="Live preview",
	variable=self.live_preview_var).grid(
	row=2, column=2, columnspan=2, sticky="w", pady=(0, 6))

	grid.columnconfigure(1, weight=1)
	grid.columnconfigure(3, weight=1)

	# ── Auto quality ──────────────────────────────────────────────────
	self.auto_quality_var = tk.BooleanVar(value=False)
	ttk.Checkbutton(parent, text="Auto quality (refine if undercooked)",
	variable=self.auto_quality_var).pack(anchor=tk.W, pady=(0, 12))

	# ── Buttons ───────────────────────────────────────────────────────
	btn_frame = tk.Frame(parent, bg=C["panel"])
	btn_frame.pack(fill=tk.X, pady=(0, 10))

	self.gen_btn = ttk.Button(btn_frame, text="Generate", command=self.on_generate,
	style="Go.TButton")
	self.gen_btn.pack(fill=tk.X, pady=(0, 5))

	btn_row = tk.Frame(btn_frame, bg=C["panel"])
	btn_row.pack(fill=tk.X)

	self.stop_btn = ttk.Button(btn_row, text="Stop", command=self.on_stop,
	state=tk.DISABLED, style="Stop.TButton")
	self.stop_btn.pack(side=tk.LEFT, fill=tk.X, expand=True, padx=(0, 3))

	self.save_btn = ttk.Button(btn_row, text="Save Selected", command=self.on_save,
	state=tk.DISABLED)
	self.save_btn.pack(side=tk.LEFT, fill=tk.X, expand=True, padx=(3, 3))

	self.save_all_btn = ttk.Button(btn_row, text="Save All", command=self.on_save_all,
	state=tk.DISABLED)
	self.save_all_btn.pack(side=tk.LEFT, fill=tk.X, expand=True, padx=(3, 0))

	# ── Prompt queue ─────────────────────────────────────────────────
	sep = tk.Frame(parent, height=1, bg=C["border"])
	sep.pack(fill=tk.X, pady=(8, 10))

	tk.Label(parent, text="Prompt Queue", bg=C["panel"], fg=C["text2"],
	font=("Segoe UI", 9, "bold")).pack(anchor=tk.W)

	queue_input = tk.Frame(parent, bg=C["panel"])
	queue_input.pack(fill=tk.X, pady=(4, 0))

	self.queue_entry = self._make_entry(queue_input, font_size=9)
	self.queue_entry.pack(side=tk.LEFT, fill=tk.X, expand=True, padx=(0, 4))
	self.queue_entry.bind("<Return>", lambda e: self._queue_add())

	ttk.Button(queue_input, text="Add", width=4,
	command=self._queue_add).pack(side=tk.LEFT)

	self.queue_listbox = tk.Listbox(
	parent, height=4, bg=C["input"], fg=C["input_fg"],
	selectbackground=C["accent"], selectforeground="#fff",
	font=("Segoe UI", 9), activestyle="none",
	relief="flat", bd=4, highlightthickness=0)
	self.queue_listbox.pack(fill=tk.X, pady=(5, 0))

	queue_btns = tk.Frame(parent, bg=C["panel"])
	queue_btns.pack(fill=tk.X, pady=(4, 0))

	self.queue_run_btn = ttk.Button(queue_btns, text="Run Queue",
	command=self.on_run_queue, style="Go.TButton")
	self.queue_run_btn.pack(side=tk.LEFT, padx=(0, 4))

	for txt, cmd in [("Remove", self._queue_remove), ("Clear", self._queue_clear),
	("Up", self._queue_move_up), ("Down", self._queue_move_down),
	("+ Current", self._queue_add_current)]:
	ttk.Button(queue_btns, text=txt, command=cmd).pack(side=tk.LEFT, padx=2)

	# ── Status bar ────────────────────────────────────────────────────
	status_frame = tk.Frame(parent, bg=C["bg"], padx=8, pady=6)
	status_frame.pack(fill=tk.X, side=tk.BOTTOM)

	self.status_var = tk.StringVar(value="Ready")
	tk.Label(status_frame, textvariable=self.status_var,
	bg=C["bg"], fg=C["green"], font=("Segoe UI", 9),
	anchor="w").pack(fill=tk.X)

	def _build_grid(self, parent):
	self.canvas = tk.Canvas(parent, bg=C["bg"], highlightthickness=0)
	scrollbar = ttk.Scrollbar(parent, orient=tk.VERTICAL, command=self.canvas.yview)
	self.grid_frame = tk.Frame(self.canvas, bg=C["bg"])

	self.grid_frame.bind("<Configure>",
	lambda e: self.canvas.configure(
	scrollregion=self.canvas.bbox("all")))
	self.canvas_window = self.canvas.create_window((0, 0), window=self.grid_frame,
	anchor="nw")
	self.canvas.configure(yscrollcommand=scrollbar.set)

	self.canvas.pack(side=tk.LEFT, fill=tk.BOTH, expand=True)
	scrollbar.pack(side=tk.RIGHT, fill=tk.Y)

	self.canvas.bind("<Configure>", self._on_canvas_resize)
	self.canvas.bind_all("<MouseWheel>",
	lambda e: self.canvas.yview_scroll(
	int(-1 * (e.delta / 120)), "units"))

	self.placeholder = tk.Label(self.grid_frame,
	text="Generated images\nwill appear here",
	bg=C["bg"], fg=C["text3"],
	font=("Segoe UI", 13), justify="center")
	self.placeholder.grid(row=0, column=0, pady=80)

	# ── Event handlers ────────────────────────────────────────────────────

	def _on_device_change(self, event=None):
	choice = self.device_var.get()
	new_dev = "cuda" if choice == "GPU" else "cpu"
	self.status_var.set(f"Switching to {choice}...")
	self.root.update()
	self.gen.switch_device(new_dev)
	self.status_var.set(f"Now using {choice}")

	def _on_scheduler_change(self, event=None):
	name = self.scheduler_var.get()
	self.gen.set_scheduler(name)
	self.status_var.set(f"Scheduler: {name}")

	def _on_canvas_resize(self, event):
	self.canvas.itemconfig(self.canvas_window, width=event.width)
	if self.generated_images:
	self._layout_grid()

	def _get_grid_cols(self):
	canvas_w = self.canvas.winfo_width()
	if canvas_w < 50:
	canvas_w = 560
	tile_size = self._get_tile_size()
	return max(1, canvas_w // (tile_size + 16))

	def _get_tile_size(self):
	n = len(self.generated_images)
	if n <= 2: return 260
	elif n <= 4: return 220
	elif n <= 6: return 180
	else: return 160

	def _layout_grid(self):
	for w in self.grid_frame.winfo_children():
	w.destroy()
	self.photo_refs.clear()

	if not self.generated_images:
	return

	tile_size = self._get_tile_size()
	cols = self._get_grid_cols()

	for i, (img, seed) in enumerate(zip(self.generated_images, self.generated_seeds)):
	row, col = divmod(i, cols)
	is_selected = (i == self.selected_index)

	card_bg = C["accent"] if is_selected else C["card"]
	card = tk.Frame(self.grid_frame, bg=card_bg, padx=3, pady=3)
	card.grid(row=row, column=col, padx=5, pady=5, sticky="nsew")

	display = img.resize((tile_size, tile_size), Image.LANCZOS)
	photo = ImageTk.PhotoImage(display)
	self.photo_refs.append(photo)

	img_label = tk.Label(card, image=photo, bg=card_bg, bd=0)
	img_label.pack()
	img_label.bind("<Button-1>", lambda e, idx=i: self._select_image(idx))
	img_label.bind("<Button-3>", lambda e, idx=i: self._show_refine_menu(e, idx))

	tk.Label(card, text=f"seed: {seed}", bg=card_bg,
	fg=C["text3"], font=("Segoe UI", 8)).pack()

	for c in range(cols):
	self.grid_frame.columnconfigure(c, weight=1)

	def _select_image(self, idx):
	if idx >= len(self.generated_images):
	return
	self.selected_index = idx
	self.save_btn.configure(state=tk.NORMAL)
	self.status_var.set(f"Selected image {idx + 1} (seed: {self.generated_seeds[idx]})")
	self._layout_grid()

	def _show_refine_menu(self, event, idx):
	if self.generating:
	return
	menu = tk.Menu(self.root, tearoff=0, bg=C["card"], fg=C["text"],
	activebackground=C["accent"], activeforeground="#fff",
	font=("Segoe UI", 10), bd=0)
	menu.add_command(label=" Refine (more steps)... ",
	command=lambda: self._ask_refine(idx))
	menu.tk_popup(event.x_root, event.y_root)

	def _ask_refine(self, idx):
	extra = simpledialog.askinteger(
	"Refine Image", "Extra denoising steps:",
	initialvalue=20, minvalue=5, maxvalue=200, parent=self.root)
	if extra is None:
	return
	self._select_image(idx)
	self.generating = True
	self.gen.cancelled = False
	self.gen_btn.configure(state=tk.DISABLED)
	self.stop_btn.configure(state=tk.NORMAL)
	self.status_var.set(f"Refining image {idx + 1}...")
	self.root.update()
	Thread(target=self._refine_thread, args=(idx, extra), daemon=True).start()

	def _refine_thread(self, idx, extra_steps):
	try:
	source = self.generated_images[idx]
	prompt = self.prompt_entry.get().strip()
	neg = self.neg_entry.get().strip()
	cfg = float(self.cfg_var.get())
	callback = self._show_preview if self.live_preview_var.get() else None

	refined = self.gen.refine(
	source_image=source, prompt=prompt, negative_prompt=neg,
	extra_steps=extra_steps, guidance_scale=cfg,
	preview_callback=callback, preview_every=5)

	if refined is not None:
	self.generated_images[idx] = refined
	self.generated_seeds[idx] = f"{self.generated_seeds[idx]}+R{extra_steps}"
	self._layout_grid()
	self.status_var.set(f"Refined image {idx + 1}")
	else:
	self.status_var.set("Refine stopped.")
	self.root.update()
	except Exception as e:
	self.status_var.set(f"Refine error: {e}")
	import traceback; traceback.print_exc()
	finally:
	self.generating = False
	self.gen.cancelled = False
	self.gen_btn.configure(state=tk.NORMAL)
	self.stop_btn.configure(state=tk.DISABLED)

	# ── Queue ─────────────────────────────────────────────────────────────

	def _queue_add(self):
	text = self.queue_entry.get().strip()
	if text:
	self.queue_listbox.insert(tk.END, text)
	self.queue_entry.delete(0, tk.END)

	def _queue_add_current(self):
	text = self.prompt_entry.get().strip()
	if text:
	self.queue_listbox.insert(tk.END, text)

	def _queue_remove(self):
	sel = self.queue_listbox.curselection()
	if sel:
	self.queue_listbox.delete(sel[0])

	def _queue_clear(self):
	self.queue_listbox.delete(0, tk.END)

	def _queue_move_up(self):
	sel = self.queue_listbox.curselection()
	if sel and sel[0] > 0:
	idx = sel[0]
	text = self.queue_listbox.get(idx)
	self.queue_listbox.delete(idx)
	self.queue_listbox.insert(idx - 1, text)
	self.queue_listbox.selection_set(idx - 1)

	def _queue_move_down(self):
	sel = self.queue_listbox.curselection()
	if sel and sel[0] < self.queue_listbox.size() - 1:
	idx = sel[0]
	text = self.queue_listbox.get(idx)
	self.queue_listbox.delete(idx)
	self.queue_listbox.insert(idx + 1, text)
	self.queue_listbox.selection_set(idx + 1)

	def on_run_queue(self):
	if self.generating or not self.models:
	return
	prompts = list(self.queue_listbox.get(0, tk.END))
	if not prompts:
	self.status_var.set("Queue is empty")
	return
	self.generating = True
	self.gen.cancelled = False
	self.gen_btn.configure(state=tk.DISABLED)
	self.queue_run_btn.configure(state=tk.DISABLED)
	self.stop_btn.configure(state=tk.NORMAL)
	Thread(target=self._queue_thread, args=(prompts,), daemon=True).start()

	def _queue_thread(self, prompts):
	try:
	idx = self.model_combo.current()
	mdl = self.models[idx]
	self.status_var.set(f"Loading {mdl[1]}...")
	self.root.update()
	self.gen.load_model(mdl[2], mdl[3])

	neg = self.neg_entry.get().strip()
	steps = int(self.steps_var.get())
	cfg = float(self.cfg_var.get())
	num_images = max(1, min(12, int(self.count_var.get())))
	live_preview = self.live_preview_var.get()
	auto_quality = self.auto_quality_var.get()

	self.generated_images.clear()
	self.generated_seeds.clear()
	self.selected_index = None
	if self.placeholder:
	self.placeholder.destroy()
	self.placeholder = None

	for p_idx, prompt in enumerate(prompts):
	if self.gen.cancelled:
	break
	self.queue_listbox.selection_clear(0, tk.END)
	self.queue_listbox.selection_set(p_idx)
	self.queue_listbox.see(p_idx)

	for img_i in range(num_images):
	if self.gen.cancelled:
	break
	self.status_var.set(
	f"[{p_idx + 1}/{len(prompts)}] image {img_i + 1}/{num_images}")
	self.root.update()

	callback = None
	if live_preview:
	self._setup_preview_card()
	callback = self._show_preview

	if auto_quality:
	image, used_seed = self.gen.generate_adaptive(
	prompt=prompt, negative_prompt=neg,
	base_steps=steps, max_steps=steps + 60,
	guidance_scale=cfg,
	preview_callback=callback, preview_every=5,
	status_callback=lambda m: (
	self.status_var.set(m), self.root.update()))
	else:
	image, used_seed = self.gen.generate(
	prompt=prompt, negative_prompt=neg,
	steps=steps, guidance_scale=cfg,
	preview_callback=callback, preview_every=5)

	if image is None:
	break
	self.generated_images.append(image)
	self.generated_seeds.append(used_seed)
	save_path = self._next_save_path(prompt)
	image.save(save_path)
	self._layout_grid()
	self.root.update()

	if self.gen.cancelled:
	break

	done = len(self.generated_images)
	self.status_var.set(
	f"Queue {'stopped' if self.gen.cancelled else 'done'}! {done} images saved.")
	if done > 0:
	self.save_all_btn.configure(state=tk.NORMAL)

	except Exception as e:
	self.status_var.set(f"Queue error: {e}")
	import traceback; traceback.print_exc()
	finally:
	self.generating = False
	self.gen.cancelled = False
	self.gen_btn.configure(state=tk.NORMAL)
	self.queue_run_btn.configure(state=tk.NORMAL)
	self.stop_btn.configure(state=tk.DISABLED)

	# ── Generation ────────────────────────────────────────────────────────

	def on_stop(self):
	if self.generating:
	self.gen.cancelled = True
	self.status_var.set("Stopping...")
	self.root.update()

	def on_generate(self):
	if self.generating or not self.models:
	return
	self.generating = True
	self.gen.cancelled = False
	self.gen_btn.configure(state=tk.DISABLED)
	self.stop_btn.configure(state=tk.NORMAL)
	self.status_var.set("Loading model...")
	self.root.update()
	Thread(target=self._generate_thread, daemon=True).start()

	def _setup_preview_card(self):
	tile_size = self._get_tile_size()
	cols = self._get_grid_cols()
	row, col = divmod(len(self.generated_images), cols)
	card = tk.Frame(self.grid_frame, bg=C["card"], padx=3, pady=3)
	card.grid(row=row, column=col, padx=5, pady=5, sticky="nsew")
	self._preview_label = tk.Label(card, bg=C["card"],
	width=tile_size, height=tile_size)
	self._preview_label.pack()
	self.root.update()

	def _show_preview(self, preview_img, step, total):
	tile_size = self._get_tile_size()
	display = preview_img.resize((tile_size, tile_size), Image.LANCZOS)
	photo = ImageTk.PhotoImage(display)
	self._preview_photo = photo
	if hasattr(self, '_preview_label') and self._preview_label.winfo_exists():
	self._preview_label.configure(image=photo)
	self.status_var.set(f"Step {step}/{total}")
	self.root.update()

	def _generate_thread(self):
	try:
	idx = self.model_combo.current()
	mdl = self.models[idx]
	self.status_var.set(f"Loading {mdl[1]}...")
	self.root.update()
	self.gen.load_model(mdl[2], mdl[3])

	prompt = self.prompt_entry.get().strip()
	neg = self.neg_entry.get().strip()
	steps = int(self.steps_var.get())
	cfg = float(self.cfg_var.get())
	num_images = max(1, min(12, int(self.count_var.get())))
	live_preview = self.live_preview_var.get()
	auto_quality = self.auto_quality_var.get()

	self.generated_images.clear()
	self.generated_seeds.clear()
	self.selected_index = None
	if self.placeholder:
	self.placeholder.destroy()
	self.placeholder = None

	for i in range(num_images):
	if self.gen.cancelled:
	break
	self.status_var.set(f"Generating {i + 1}/{num_images}...")
	self.root.update()

	callback = None
	if live_preview:
	self._setup_preview_card()
	callback = self._show_preview

	if auto_quality:
	image, used_seed = self.gen.generate_adaptive(
	prompt=prompt, negative_prompt=neg,
	base_steps=steps, max_steps=steps + 60,
	guidance_scale=cfg,
	preview_callback=callback, preview_every=5,
	status_callback=lambda m: (
	self.status_var.set(m), self.root.update()))
	else:
	image, used_seed = self.gen.generate(
	prompt=prompt, negative_prompt=neg,
	steps=steps, guidance_scale=cfg,
	preview_callback=callback, preview_every=5)

	if image is None:
	break
	self.generated_images.append(image)
	self.generated_seeds.append(used_seed)
	self._layout_grid()
	self.root.update()

	done = len(self.generated_images)
	if self.gen.cancelled:
	self.status_var.set(f"Stopped. {done} image(s) kept.")
	else:
	self.status_var.set(f"Done! {done} images. Click to select.")
	if done > 0:
	self.save_all_btn.configure(state=tk.NORMAL)
	self.save_btn.configure(state=tk.DISABLED)

	except Exception as e:
	self.status_var.set(f"Error: {e}")
	import traceback; traceback.print_exc()
	finally:
	self.generating = False
	self.gen.cancelled = False
	self.gen_btn.configure(state=tk.NORMAL)
	self.stop_btn.configure(state=tk.DISABLED)

	# ── Save ──────────────────────────────────────────────────────────────

	def _next_save_path(self, prompt_text):
	OUTPUT_DIR.mkdir(parents=True, exist_ok=True)
	slug = prompt_text.strip()[:50] if prompt_text.strip() else "untitled"
	base = OUTPUT_DIR / f"{slug}.png"
	if not base.exists():
	return base
	n = 1
	while True:
	path = OUTPUT_DIR / f"{slug} {n}.png"
	if not path.exists():
	return path
	n += 1

	def on_save(self):
	if self.selected_index is None or not self.generated_images:
	return
	img = self.generated_images[self.selected_index]
	path = self._next_save_path(self.prompt_entry.get().strip())
	img.save(path)
	self.status_var.set(f"Saved: {path.name}")

	def on_save_all(self):
	if not self.generated_images:
	return
	prompt_text = self.prompt_entry.get().strip()
	for img in self.generated_images:
	path = self._next_save_path(prompt_text)
	img.save(path)
	self.status_var.set(f"Saved {len(self.generated_images)} images")

	def run(self):
	self.root.mainloop()


	# ── Entry point ───────────────────────────────────────────────────────────────

	if __name__ == "__main__":
	models = find_models()
	if not models:
	print("No models found locally. Downloading from HuggingFace...")
	result = download_from_hf()
	if result:
	models = find_models()

	if not models:
	print("No models found!")
	print(f"Place model weights in: {MODEL_DIR}/YourModelName/")
	print("Expected files: diffusion_pytorch_model.safetensors or ema_unet.pt")
	sys.exit(1)

	print(f"Found {len(models)} model(s): {', '.join(m[1] for m in models)}")
	print(f"Device: {'CUDA (GPU)' if torch.cuda.is_available() else 'CPU'}")
	print("Starting Aniimage...")

	app = App()
	app.run()