Qwen-Image-Edit-2509-LoRAs-Fast

Running on Zero

App Files Files Community

Qwen-Image-Edit-2509-LoRAs-Fast / app.py

Opera8

Update app.py

96412e0 verified 8 days ago

raw

history blame

25.3 kB

	import os
	import gradio as gr
	import numpy as np
	import spaces
	import torch
	import random
	from PIL import Image, ImageFilter
	from typing import Iterable
	from gradio.themes import Soft
	from gradio.themes.utils import colors, fonts, sizes
	from deep_translator import GoogleTranslator
	from transformers import pipeline

	# --- تعریف تم ---
	colors.steel_blue = colors.Color(
	name="steel_blue",
	c50="#EBF3F8",
	c100="#D3E5F0",
	c200="#A8CCE1",
	c300="#7DB3D2",
	c400="#529AC3",
	c500="#4682B4",
	c600="#3E72A0",
	c700="#36638C",
	c800="#2E5378",
	c900="#264364",
	c950="#1E3450",
	)

	device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

	# --- بارگذاری مدل تشخیص محتوای نامناسب (NSFW) ---
	print("Loading Safety Checker...")
	safety_classifier = pipeline("image-classification", model="Falconsai/nsfw_image_detection", device=-1)

	def is_image_nsfw(image):
	if image is None: return False
	try:
	results = safety_classifier(image)
	for result in results:
	if result['label'] == 'nsfw' and result['score'] > 0.75:
	return True
	return False
	except Exception as e:
	print(f"Safety check error: {e}")
	return False

	# --- بارگذاری مدل اصلی ---
	from diffusers import FlowMatchEulerDiscreteScheduler
	from qwenimage.pipeline_qwenimage_edit_plus import QwenImageEditPlusPipeline
	from qwenimage.transformer_qwenimage import QwenImageTransformer2DModel
	from qwenimage.qwen_fa3_processor import QwenDoubleStreamAttnProcessorFA3

	dtype = torch.bfloat16
	device = "cuda" if torch.cuda.is_available() else "cpu"

	print("Loading pipeline...")
	pipe = QwenImageEditPlusPipeline.from_pretrained(
	"Qwen/Qwen-Image-Edit-2509",
	transformer=QwenImageTransformer2DModel.from_pretrained(
	"linoyts/Qwen-Image-Edit-Rapid-AIO",
	subfolder='transformer',
	torch_dtype=dtype,
	device_map='cuda'
	),
	torch_dtype=dtype
	).to(device)

	# بارگذاری LoRA ها
	pipe.load_lora_weights("autoweeb/Qwen-Image-Edit-2509-Photo-to-Anime", weight_name="Qwen-Image-Edit-2509-Photo-to-Anime_000001000.safetensors", adapter_name="anime")
	pipe.load_lora_weights("dx8152/Qwen-Edit-2509-Multiple-angles", weight_name="镜头转换.safetensors", adapter_name="multiple-angles")
	pipe.load_lora_weights("dx8152/Qwen-Image-Edit-2509-Light_restoration", weight_name="移除光影.safetensors", adapter_name="light-restoration")
	pipe.load_lora_weights("dx8152/Qwen-Image-Edit-2509-Relight", weight_name="Qwen-Edit-Relight.safetensors", adapter_name="relight")
	pipe.load_lora_weights("dx8152/Qwen-Edit-2509-Multi-Angle-Lighting", weight_name="多角度灯光-251116.safetensors", adapter_name="multi-angle-lighting")
	pipe.load_lora_weights("tlennon-ie/qwen-edit-skin", weight_name="qwen-edit-skin_1.1_000002750.safetensors", adapter_name="edit-skin")
	pipe.load_lora_weights("lovis93/next-scene-qwen-image-lora-2509", weight_name="next-scene_lora-v2-3000.safetensors", adapter_name="next-scene")
	pipe.load_lora_weights("vafipas663/Qwen-Edit-2509-Upscale-LoRA", weight_name="qwen-edit-enhance_64-v3_000001000.safetensors", adapter_name="upscale-image")

	pipe.transformer.set_attn_processor(QwenDoubleStreamAttnProcessorFA3())
	MAX_SEED = np.iinfo(np.int32).max

	LORA_MAPPING = {
	"تبدیل عکس به انیمه": "anime",
	"تغییر زاویه دید": "multiple-angles",
	"اصلاح نور و سایه": "light-restoration",
	"نورپردازی مجدد (Relight)": "relight",
	"نورپردازی چند زاویه‌ای": "multi-angle-lighting",
	"روتوش پوست": "edit-skin",
	"صحنه بعدی (سینمایی)": "next-scene",
	"افزایش کیفیت (Upscale)": "upscale-image"
	}

	ASPECT_RATIOS_LIST = [
	"خودکار (پیش‌فرض)",
	"۱:۱ (مربع - 1024x1024)",
	"۱۶:۹ (افقی - 1344x768)",
	"۹:۱۶ (عمودی - 768x1344)",
	"شخصی‌سازی (Custom)"
	]

	ASPECT_RATIOS_MAP = {
	"خودکار (پیش‌فرض)": "Auto",
	"۱:۱ (مربع - 1024x1024)": (1024, 1024),
	"۱۶:۹ (افقی - 1344x768)": (1344, 768),
	"۹:۱۶ (عمودی - 768x1344)": (768, 1344),
	"شخصی‌سازی (Custom)": "Custom"
	}

	BANNED_WORDS = [
	"nude", "naked", "sex", "porn", "undressed", "nsfw", "erotic", "xxx",
	"breast", "nipple", "genital", "vagina", "penis", "ass", "butt", "sexual",
	"lingerie", "bikini", "swimwear", "underwear", "fetish", "topless",
	"exhibitionism", "hentai", "ecchi", "18+"
	]

	def check_text_safety(text):
	text_lower = text.lower()
	for word in BANNED_WORDS:
	if f" {word} " in f" {text_lower} ":
	return False
	return True

	def translate_prompt(text):
	if not text:
	return ""
	try:
	translated = GoogleTranslator(source='auto', target='en').translate(text)
	return translated
	except Exception as e:
	print(f"Translation Error: {e}")
	return text

	def update_dimensions_on_upload(image):
	if image is None:
	return 1024, 1024
	original_width, original_height = image.size
	if original_width > original_height:
	new_width = 1024
	aspect_ratio = original_height / original_width
	new_height = int(new_width * aspect_ratio)
	else:
	new_height = 1024
	aspect_ratio = original_width / original_height
	new_width = int(new_height * aspect_ratio)
	new_width = (new_width // 8) * 8
	new_height = (new_height // 8) * 8
	return new_width, new_height

	def update_sliders_visibility(choice):
	if choice == "شخصی‌سازی (Custom)":
	return gr.update(visible=True), gr.update(visible=True)
	else:
	return gr.update(visible=False), gr.update(visible=False)

	def get_error_html(message):
	return f"""
	<div style="background-color: #fee2e2; border: 1px solid #ef4444; color: #b91c1c; padding: 12px; border-radius: 8px; text-align: center; margin-bottom: 10px; font-weight: bold; display: flex; align-items: center; justify-content: center; gap: 8px;">
	<span style="font-size: 1.2em;">⛔</span>
	{message}
	</div>
	"""

	def get_success_html(message):
	return f"""
	<div style="background-color: #dcfce7; border: 1px solid #22c55e; color: #15803d; padding: 12px; border-radius: 8px; text-align: center; margin-bottom: 10px; font-weight: bold; display: flex; align-items: center; justify-content: center; gap: 8px;">
	<span style="font-size: 1.2em;">✅</span>
	{message}
	</div>
	"""

	@spaces.GPU(duration=30)
	def infer(
	input_image,
	prompt,
	lora_adapter_persian,
	seed,
	randomize_seed,
	guidance_scale,
	steps,
	aspect_ratio_selection,
	custom_width,
	custom_height,
	progress=gr.Progress(track_tqdm=True)
	):
	if input_image is None:
	return None, seed, get_error_html("لطفاً ابتدا یک تصویر بارگذاری کنید.")

	if is_image_nsfw(input_image):
	return None, seed, get_error_html("تصویر ورودی دارای محتوای نامناسب است و پردازش نمی‌شود.")

	english_prompt = translate_prompt(prompt)
	if not check_text_safety(english_prompt):
	return None, seed, get_error_html("متن درخواست شامل کلمات غیرمجاز یا غیراخلاقی است.")

	adapter_internal_name = LORA_MAPPING.get(lora_adapter_persian)
	if adapter_internal_name:
	pipe.set_adapters([adapter_internal_name], adapter_weights=[1.0])

	if randomize_seed:
	seed = random.randint(0, MAX_SEED)

	generator = torch.Generator(device=device).manual_seed(seed)

	safety_negative = "nsfw, nude, naked, porn, sexual, xxx, breast, nipple, genital, vagina, penis, ass, lingerie, bikini, swimwear, underwear, fetish, topless, gore, violence, blood"
	base_negative = "worst quality, low quality, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, jpeg artifacts, signature, watermark, username, blurry"
	final_negative_prompt = f"{safety_negative}, {base_negative}"

	original_image = input_image.convert("RGB")

	selection_value = ASPECT_RATIOS_MAP.get(aspect_ratio_selection)

	if selection_value == "Custom":
	width = (int(custom_width) // 8) * 8
	height = (int(custom_height) // 8) * 8
	elif selection_value == "Auto" or selection_value is None:
	width, height = update_dimensions_on_upload(original_image)
	else:
	width, height = selection_value

	try:
	result = pipe(
	image=original_image,
	prompt=english_prompt,
	negative_prompt=final_negative_prompt,
	height=height,
	width=width,
	num_inference_steps=steps,
	generator=generator,
	true_cfg_scale=guidance_scale,
	).images[0]

	if is_image_nsfw(result):
	return None, seed, get_error_html("تصویر تولید شده حاوی محتوای نامناسب بود و حذف شد.")

	return result, seed, get_success_html("تصویر با موفقیت ویرایش شد.")

	except Exception as e:
	# اگر خطا مربوط به Quota باشد، اجازه می‌دهیم خود سیستم خطا را تولید کند تا JS آن را بگیرد
	# یا اگر Exception معمولی باشد آن را نشان می‌دهیم
	error_str = str(e)
	if "quota" in error_str.lower() or "exceeded" in error_str.lower():
	raise e # اجازه می‌دهیم خطای اصلی بالا برود تا شامل اعداد زمان باشد
	return None, seed, get_error_html(f"خطا در پردازش: {error_str}")

	@spaces.GPU(duration=30)
	def infer_example(input_image, prompt, lora_adapter):
	res, s, status = infer(input_image, prompt, lora_adapter, 0, True, 1.0, 4, "خودکار (پیش‌فرض)", 1024, 1024)
	return res, s, status

	# --- جاوااسکریپت برای دکمه دانلود ---
	js_download_func = """
	async (image) => {
	if (!image) {
	alert("لطفاً ابتدا تصویر را تولید کنید.");
	return;
	}
	let fileUrl = image.url;
	if (fileUrl && !fileUrl.startsWith('http')) {
	fileUrl = window.location.origin + fileUrl;
	} else if (!fileUrl && image.path) {
	fileUrl = window.location.origin + "/file=" + image.path;
	}
	window.parent.postMessage({
	type: 'DOWNLOAD_REQUEST',
	url: fileUrl
	}, '*');
	}
	"""

	# --- جاوااسکریپت سراسری (تزریق پیام خطای جدید و تم روشن) ---
	js_global_content = """
	<script>
	document.addEventListener('DOMContentLoaded', () => {
	// 1. Force Light Mode
	const forceLight = () => {
	const body = document.querySelector('body');
	if (body) {
	body.classList.remove('dark');
	body.style.backgroundColor = '#f5f7fa';
	body.style.color = '#333333';
	}
	document.querySelectorAll('.dark').forEach(el => el.classList.remove('dark'));
	};
	forceLight();
	setInterval(forceLight, 1000);

	// 2. NEW GPU Quota Replacer (Hourglass Style)
	const observer = new MutationObserver((mutations) => {
	mutations.forEach((mutation) => {
	if (mutation.addedNodes.length) {
	mutation.addedNodes.forEach((node) => {
	// فقط روی المان‌های مربوط به خطای گرادیو کار کن
	if (node.nodeType === 1 && (node.classList.contains('toast-body') \|\| node.classList.contains('error'))) {
	const originalText = node.innerText;

	// Regex برای پیدا کردن اعداد زمان
	const regex = /(\d+)s requested vs. (\d+)s left/;
	const match = originalText.match(regex);

	// اگر متن خطا مربوط به Quota بود و قبلا ترجمه نشده بود
	if (match && !node.dataset.translated) {
	const requested = match[1];
	const left = match[2];

	// ساخت کارت HTML زیبا
	const prettyHtml = `
	<div style="display: flex; align-items: center; gap: 15px; font-family: 'Tahoma', sans-serif; direction: rtl; padding: 10px;">
	<div style="font-size: 2.5em; color: #dc3545;">⏳</div>
	<div>
	<h4 style="margin: 0; color: #5a6268; font-weight: bold;">ظرفیت سرور تکمیل است!</h4>
	<p style="margin: 5px 0 0 0; color: #6c757d; font-size: 0.9em;">
	سهمیه رایگان GPU شما برای پردازش یک ویدیوی <b>${requested} ثانیه‌ای</b> کافی نیست.
	</p>
	<div style="background-color: #f8d7da; border: 1px solid #f5c6cb; border-radius: 5px; padding: 5px 8px; margin-top: 10px; font-size: 0.85em;">
	اعتبار باقیمانده: <b>${left} ثانیه</b>
	</div>
	</div>
	</div>
	`;

	// جایگزینی محتوای قدیمی با کارت جدید
	node.innerHTML = prettyHtml;

	// جلوگیری از ترجمه مجدد
	node.dataset.translated = 'true';
	}
	}
	});
	}
	});
	});

	observer.observe(document.body, { childList: true, subtree: true });
	});
	</script>
	"""

	# --- CSS ---
	css_code = """
	<style>
	@import url('https://fonts.googleapis.com/css2?family=Vazirmatn:wght@300;400;500;700&display=swap');

	:root, .dark, body, .gradio-container {
	--body-background-fill: #f5f7fa !important;
	--body-text-color: #1f2937 !important;
	--background-fill-primary: #ffffff !important;
	--background-fill-secondary: #f3f4f6 !important;
	--border-color-primary: #e5e7eb !important;
	--block-background-fill: #ffffff !important;
	--block-label-text-color: #374151 !important;
	--block-title-text-color: #111827 !important;
	--input-background-fill: #ffffff !important;
	color-scheme: light !important;
	}

	body {
	font-family: 'Vazirmatn', sans-serif !important;
	background-color: #f5f7fa !important;
	margin: 0;
	padding: 10px;
	}

	#col-container {
	margin: 0 auto;
	max-width: 980px;
	direction: rtl;
	text-align: right;
	padding: 30px;
	background: #ffffff !important;
	border-radius: 24px;
	box-shadow: 0 10px 40px -10px rgba(0,0,0,0.08);
	border: 1px solid rgba(255,255,255,0.8);
	}

	#main-title h1 {
	font-size: 2.4em !important;
	text-align: center;
	color: #1a202c !important;
	margin-bottom: 15px;
	font-weight: 800;
	background: -webkit-linear-gradient(45deg, #2563eb, #1e40af);
	-webkit-background-clip: text;
	-webkit-text-fill-color: transparent;
	}

	#main-description {
	text-align: center;
	font-size: 1.15em;
	color: #4b5563 !important;
	margin-bottom: 40px;
	line-height: 1.6;
	}

	.gr-input-label, span.label-wrap, label span {
	font-weight: 700 !important;
	color: #374151 !important;
	font-size: 0.95em !important;
	margin-bottom: 8px !important;
	}

	textarea, input[type="text"] {
	border: 2px solid #e2e8f0 !important;
	border-radius: 12px !important;
	background-color: #ffffff !important;
	color: #111827 !important;
	padding: 12px !important;
	transition: all 0.3s ease;
	font-family: 'Vazirmatn', sans-serif !important;
	}

	textarea:focus, input[type="text"]:focus {
	border-color: #3b82f6 !important;
	box-shadow: 0 0 0 4px rgba(59, 130, 246, 0.1) !important;
	outline: none;
	}

	.gr-dropdown {
	background: #ffffff !important;
	border-radius: 12px !important;
	}

	.primary-btn, button.primary {
	background: linear-gradient(135deg, #10b981 0%, #059669 100%) !important;
	border: none !important;
	color: white !important;
	font-weight: 700 !important;
	font-size: 1.1em !important;
	padding: 14px 28px !important;
	border-radius: 14px !important;
	box-shadow: 0 4px 15px rgba(16, 185, 129, 0.3) !important;
	transition: all 0.3s cubic-bezier(0.4, 0, 0.2, 1) !important;
	cursor: pointer !important;
	width: 100%;
	margin-top: 15px;
	}

	.primary-btn:hover, button.primary:hover {
	transform: translateY(-2px);
	box-shadow: 0 8px 25px rgba(16, 185, 129, 0.45) !important;
	}

	.primary-btn:active, button.primary:active {
	transform: translateY(1px);
	}

	#download-btn {
	background: linear-gradient(135deg, #3b82f6 0%, #2563eb 100%) !important;
	box-shadow: 0 4px 15px rgba(59, 130, 246, 0.3) !important;
	}
	#download-btn:hover {
	box-shadow: 0 8px 25px rgba(59, 130, 246, 0.45) !important;
	}

	.gradio-container .prose table,
	.gradio-container table {
	background-color: #ffffff !important;
	color: #111827 !important;
	border: 1px solid #e5e7eb !important;
	border-radius: 12px !important;
	overflow: hidden !important;
	width: 100% !important;
	margin-top: 20px !important;
	}

	.gradio-container thead th {
	background-color: #f3f4f6 !important;
	color: #374151 !important;
	font-weight: 700 !important;
	border-bottom: 2px solid #e5e7eb !important;
	padding: 12px !important;
	text-align: right !important;
	}

	.gradio-container tbody tr {
	background-color: #ffffff !important;
	border-bottom: 1px solid #f3f4f6 !important;
	}

	.gradio-container tbody tr:hover {
	background-color: #f9fafb !important;
	}

	.gradio-container tbody td {
	background-color: #ffffff !important;
	color: #374151 !important;
	padding: 10px !important;
	}

	.gradio-container tbody td span,
	.gradio-container tbody td p {
	color: #374151 !important;
	}

	footer { display: none !important; }
	.flagging { display: none !important; }

	/* استایل Toast برای راست چین کردن */
	.toast-body {
	direction: rtl !important;
	text-align: right !important;
	}

	@media (prefers-color-scheme: dark) {
	body, .gradio-container, .prose, table, tr, td, th {
	background-color: #ffffff !important;
	color: #333333 !important;
	}
	}
	</style>
	"""

	# ادغام CSS و JS
	combined_html = css_code + js_global_content

	# استفاده از gr.Blocks بدون پارامتر js
	with gr.Blocks() as demo:
	# تزریق کدها به عنوان HTML
	gr.HTML(combined_html)

	with gr.Column(elem_id="col-container"):
	gr.Markdown("# ویرایشگر هوشمند آلفا", elem_id="main-title")
	gr.Markdown(
	"با هوش مصنوعی آلفا تصاویر تونو به مدل های مختلف ویرایش کنید.",
	elem_id="main-description"
	)

	with gr.Row(equal_height=True):
	with gr.Column():
	input_image = gr.Image(label="بارگذاری تصویر", type="pil", height=320)

	prompt = gr.Text(
	label="دستور ویرایش (به فارسی)",
	show_label=True,
	placeholder="مثال: تصویر را به سبک انیمه تبدیل کن...",
	rtl=True,
	lines=3
	)

	status_box = gr.HTML(label="وضعیت")

	run_button = gr.Button("✨ شروع پردازش و ساخت تصویر", variant="primary", elem_classes="primary-btn")

	with gr.Column():
	output_image = gr.Image(label="تصویر نهایی", interactive=False, format="png", height=380)

	download_button = gr.Button("📥 دانلود و ذخیره تصویر", variant="secondary", elem_id="download-btn", elem_classes="primary-btn")

	with gr.Row():
	lora_adapter = gr.Dropdown(
	label="انتخاب سبک ویرایش (LoRA)",
	choices=list(LORA_MAPPING.keys()),
	value="تبدیل عکس به انیمه"
	)

	with gr.Accordion("تنظیمات پیشرفته", open=False, visible=True):
	aspect_ratio_selection = gr.Dropdown(
	label="ابعاد تصویر خروجی",
	choices=ASPECT_RATIOS_LIST,
	value="خودکار (پیش‌فرض)",
	interactive=True
	)

	with gr.Row(visible=False) as custom_dims_row:
	custom_width = gr.Slider(
	label="عرض دلخواه (Width)",
	minimum=256, maximum=2048, step=8, value=1024
	)
	custom_height = gr.Slider(
	label="ارتفاع دلخواه (Height)",
	minimum=256, maximum=2048, step=8, value=1024
	)

	seed = gr.Slider(label="دانه تصادفی (Seed)", minimum=0, maximum=MAX_SEED, step=1, value=0)
	randomize_seed = gr.Checkbox(label="استفاده از Seed تصادفی", value=True)
	guidance_scale = gr.Slider(label="میزان وفاداری به متن (Guidance Scale)", minimum=1.0, maximum=10.0, step=0.1, value=1.0)
	steps = gr.Slider(label="تعداد مراحل پردازش (Steps)", minimum=1, maximum=50, step=1, value=4)

	# اصلاح تابع نمایش ردیف اسلایدرها
	def toggle_row(choice):
	if choice == "شخصی‌سازی (Custom)":
	return gr.update(visible=True)
	return gr.update(visible=False)

	aspect_ratio_selection.change(
	fn=toggle_row,
	inputs=aspect_ratio_selection,
	outputs=custom_dims_row
	)

	gr.Examples(
	examples=[
	["examples/1.jpg", "تبدیل به انیمه کن.", "تبدیل عکس به انیمه"],
	["examples/5.jpg", "سایه‌ها را حذف کن و نورپردازی نرم به تصویر بده.", "اصلاح نور و سایه"],
	["examples/4.jpg", "از فیلتر ساعت طلایی با پخش نور ملایم استفاده کن.", "نورپردازی مجدد (Relight)"],
	["examples/2.jpeg", "دوربین را ۴۵ درجه به سمت چپ بچرخان.", "تغییر زاویه دید"],
	["examples/7.jpg", "منبع نور را از سمت راست عقب قرار بده.", "نورپردازی چند زاویه‌ای"],
	["examples/10.jpeg", "کیفیت تصویر را افزایش بده (Upscale).", "افزایش کیفیت (Upscale)"],
	["examples/7.jpg", "منبع نور را از پایین بتابان.", "نورپردازی چند زاویه‌ای"],
	["examples/2.jpeg", "زاویه دوربین را به نمای بالا گوشه راست تغییر بده.", "تغییر زاویه دید"],
	["examples/9.jpg", "دوربین کمی به جلو حرکت می‌کند در حالی که نور خورشید از میان ابرها می‌تابد و درخششی نرم اطراف شبح شخصیت در مه ایجاد می‌کند. سبک سینمایی واقعی.", "صحنه بعدی (سینمایی)"],
	["examples/8.jpg", "جزئیات پوست سوژه را برجسته‌تر و طبیعی‌تر کن.", "روتوش پوست"],
	["examples/6.jpg", "دوربین را به نمای پایین به بالا تغییر بده.", "تغییر زاویه دید"],
	],
	inputs=[input_image, prompt, lora_adapter],
	outputs=[output_image, seed, status_box],
	fn=infer_example,
	cache_examples=False,
	label="نمونه‌ها (برای تست کلیک کنید)"
	)

	run_button.click(
	fn=infer,
	inputs=[input_image, prompt, lora_adapter, seed, randomize_seed, guidance_scale, steps, aspect_ratio_selection, custom_width, custom_height],
	outputs=[output_image, seed, status_box],
	api_name="predict"
	)

	download_button.click(
	fn=None,
	inputs=[output_image],
	outputs=None,
	js=js_download_func
	)

	if __name__ == "__main__":
	demo.queue(max_size=30).launch(show_error=True)