Spaces:

P01yH3dr0n
/

client

Running

App Files Files Community

client / utils.py

P01yH3dr0n

api update

6cbf3fa 25 days ago

raw

history blame contribute delete

13.3 kB

	import random
	import io
	import zipfile
	import requests
	import json
	import base64
	import math
	import gradio as gr
	import hashlib
	import time

	from PIL import Image

	jwt_token = ''
	url = "https://image.novelai.net/ai/generate-image"
	headers = {}

	def set_token(token):
	global jwt_token, headers
	if jwt_token == token:
	return
	jwt_token = token
	headers = {
	"Authorization": f"Bearer {jwt_token}",
	"Content-Type": "application/json",
	"Origin": "https://novelai.net",
	"Referer": "https://novelai.net/"
	}

	def get_remain_anlas():
	try:
	data = requests.get("https://api.novelai.net/user/data", headers=headers).content
	anlas = json.loads(data)['subscription']['trainingStepsLeft']
	return anlas['fixedTrainingStepsLeft'] + anlas['purchasedTrainingSteps']
	except:
	return '获取失败，err:' + str(data)

	def calculate_cost(width, height, steps=28, sm=False, dyn=False, strength=1, rmbg=False):
	pixels = width * height
	if pixels <= 1048576 and steps <= 28 and not rmbg:
	return 0
	dyn = sm and dyn
	L = math.ceil(2951823174884865e-21 * pixels + 5.753298233447344e-7 * pixels * steps)
	L *= 1.4 if dyn else (1.2 if sm else 1)
	L = max(math.ceil(L * strength), 2)
	return L * 3 + 5 if rmbg else L

	def generate_novelai_image(
	model="nai-diffusion-3",
	input_text="",
	negative_prompt="",
	seed=-1,
	scale=5.0,
	width=1024,
	height=1024,
	steps=28,
	sampler="k_euler",
	schedule='native',
	smea=False,
	dyn=False,
	dyn_threshold=False,
	cfg_rescale=0,
	variety=False,
	ref_images=None,
	info_extracts=[],
	ref_strs=[],
	vibe_files=[],
	str_norm=True,
	i2i_image=None,
	i2i_str=0.7,
	i2i_noise=0,
	overlay=True,
	inp_img=None,
	inp_str=1,
	selection='i2i',
	auto_pos=True,
	char_prompts=[],
	char_ucs=[],
	char_coords_x=[],
	char_coords_y=[],
	legacy=False,
	chr_image=None,
	fidelity=1,
	style_aware=True
	):
	# Assign a random seed if seed is -1
	if seed == -1:
	seed = random.randint(0, 2 ** 32 - 1)

	characterPrompts = []
	for i in range(len(char_prompts)):
	characterPrompts.append({"prompt": char_prompts[i], "uc": char_ucs[i], "center": {'x': round(char_coords_x[i] * 0.2 - 0.1, 1), 'y': round(char_coords_y[i] * 0.2 - 0.1, 1)}})

	# Define the payload
	payload = {
	"action": "generate",
	"input": input_text,
	"model": model,
	"parameters": {
	"width": width,
	"height": height,
	"scale": scale,
	"sampler": sampler,
	"steps": steps,
	"n_samples": 1,
	"ucPreset": 0,
	"cfg_rescale": cfg_rescale,
	"controlnet_strength": 1,
	"dynamic_thresholding": dyn_threshold,
	"params_version": 3,
	"legacy": False,
	"legacy_uc": legacy,
	"legacy_v3_extend": False,
	"negative_prompt": negative_prompt,
	"noise_schedule": schedule,
	"qualityToggle": True,
	"reference_strength_multiple": ref_strs,
	"normalize_reference_strength_multiple": str_norm,
	"seed": seed,
	"skip_cfg_above_sigma": (58 if model.startswith('nai-diffusion-4-5') else 19) if variety else None,
	"sm": smea,
	"sm_dyn": dyn,
	"add_original_image": overlay,
	"characterPrompts": characterPrompts,
	"use_coords": not auto_pos,
	"deliberate_euler_ancestral_bug": False,
	"prefer_brownian": True
	}
	}
	if model.startswith("nai-diffusion-4"):
	payload["parameters"]["v4_prompt"] = {"caption": {"base_caption": input_text, "char_captions": []}, "use_coords": not auto_pos, "use_order": True}
	payload["parameters"]["v4_negative_prompt"] = {"caption": {"base_caption": negative_prompt, "char_captions": []}}
	for i in range(len(char_prompts)):
	payload["parameters"]["v4_prompt"]["caption"]["char_captions"].append({"char_caption": char_prompts[i], "centers": [{'x': round(char_coords_x[i] * 0.2 - 0.1, 1), 'y': round(char_coords_y[i] * 0.2 - 0.1, 1)}]})
	payload["parameters"]["v4_negative_prompt"]["caption"]["char_captions"].append({"char_caption": char_ucs[i], "centers": [{'x': round(char_coords_x[i] * 0.2 - 0.1, 1), 'y': round(char_coords_y[i] * 0.2 - 0.1, 1)}]})
	if ref_images != None:
	payload['parameters']['reference_image_multiple'] = [image2base64(image[0]) for image in ref_images]
	payload['parameters']['reference_information_extracted_multiple'] = info_extracts
	if vibe_files != None and model.startswith('nai-diffusion-4'):
	vibes = []
	for v in vibe_files:
	with open(v) as f:
	data = json.load(f)['encodings']
	vibes.append(data.popitem()[1].popitem()[1]['encoding'])
	payload['parameters']['reference_image_multiple'] = vibes
	if selection == 'inp' and inp_img['background'] != None:
	payload['action'] = "infill"
	payload['model'] = model.replace('-preview', '') + '-inpainting'
	mask = inp_img['layers'][0].resize((width, height))
	mask = mask.resize((mask.size[0] // 8, mask.size[1] // 8), resample=Image.NEAREST).resize(mask.size, resample=Image.NEAREST).point(lambda x: 0 if x < 255 else 255)
	payload['parameters']['mask'] = image2base64(mask)
	payload['parameters']['image'] = image2base64(inp_img['background'])
	payload['parameters']['extra_noise_seed'] = seed
	payload['parameters']['inpaintImg2ImgStrength'] = inp_str
	payload['parameters']['img2img'] = {'strength': inp_str, 'color_correct': True}
	if i2i_image != None and selection == 'i2i':
	payload['action'] = "img2img"
	payload['parameters']['image'] = image2base64(i2i_image)
	payload['parameters']['strength'] = i2i_str
	payload['parameters']['extra_noise_seed'] = seed
	payload["parameters"]['noise'] = i2i_noise
	if chr_image != None:
	payload['parameters']['director_reference_images'] = [image2base64(resize_and_pad_image(chr_image))]
	payload['parameters']['director_reference_descriptions'] = [{'caption': {'base_caption': 'character&style' if style_aware else 'character', 'char_captions': []}, 'legacy_uc': False}]
	payload['parameters']['director_reference_secondary_strength_values'] = [1 - fidelity]
	payload['parameters']['director_reference_strength_values'] = [1]
	payload['parameters']['director_reference_information_extracted'] = [1]
	# Send the POST request
	try:
	response = requests.post(url, json=payload, headers=headers, timeout=180)
	except:
	raise gr.Error('NAI response timeout')

	# Process the response
	if response.headers.get('Content-Type') == 'binary/octet-stream':
	zipfile_in_memory = io.BytesIO(response.content)
	with zipfile.ZipFile(zipfile_in_memory, 'r') as zip_ref:
	file_names = zip_ref.namelist()
	if file_names:
	with zip_ref.open(file_names[0]) as file:
	return file.read(), payload
	else:
	messages = json.loads(response.content)
	raise gr.Error(str(messages["statusCode"]) + ": " + messages["message"])
	else:
	messages = json.loads(response.content)
	raise gr.Error(str(messages["statusCode"]) + ": " + messages["message"])

	def image_from_bytes(data):
	img_file = io.BytesIO(data)
	img_file.seek(0)
	return Image.open(img_file)

	def image2base64(img):
	output_buffer = io.BytesIO()
	img.save(output_buffer, format='PNG' if img.mode=='RGBA' else 'JPEG')
	byte_data = output_buffer.getvalue()
	base64_str = base64.b64encode(byte_data).decode()
	return base64_str

	def base642image(b64):
	image_bytes = base64.b64decode(b64)
	read_buffer = io.BytesIO(image_bytes)
	img = Image.open(read_buffer)
	return img

	def resize_and_pad_image(chr_image):
	"""
	根据图像宽高比选择最接近的尺寸，等比缩放并用黑边填充

	Args:
	chr_image: PIL Image对象

	Returns:
	处理后的PIL Image对象
	"""
	# 定义三种目标尺寸
	target_sizes = [
	(1024, 1536), # 竖版
	(1472, 1472), # 正方形
	(1536, 1024) # 横版
	]

	# 获取原图尺寸
	original_width, original_height = chr_image.size
	original_ratio = original_width / original_height

	# 计算每个目标尺寸的宽高比，并找出最接近的
	min_diff = float('inf')
	best_size = None

	for size in target_sizes:
	target_ratio = size[0] / size[1]
	diff = abs(original_ratio - target_ratio)
	if diff < min_diff:
	min_diff = diff
	best_size = size

	# 目标尺寸
	target_width, target_height = best_size

	# 计算缩放比例（保持宽高比）
	scale_x = target_width / original_width
	scale_y = target_height / original_height
	scale = min(scale_x, scale_y) # 选择较小的缩放比例以确保图像完全显示

	# 计算缩放后的尺寸
	new_width = int(original_width * scale)
	new_height = int(original_height * scale)

	# 缩放图像
	resized_image = chr_image.resize((new_width, new_height), Image.Resampling.LANCZOS)

	# 创建目标尺寸的黑色背景
	padded_image = Image.new('RGBA', (target_width, target_height), color='black')

	# 计算居中位置
	x_offset = (target_width - new_width) // 2
	y_offset = (target_height - new_height) // 2

	# 将缩放后的图像粘贴到黑色背景上
	padded_image.paste(resized_image, (x_offset, y_offset))

	return padded_image

	def augment_image(image, width, height, req_type, selection, factor=1, defry=0, prompt=''):
	if selection == "scale":
	width = int(width * factor)
	height = int(height * factor)
	image = image.resize((width, height))
	req_type = {"移除背景": "bg-removal", "素描": "sketch", "线稿": "lineart", "上色": "colorize", "更改表情": "emotion", "去聊天框": "declutter"}[req_type]
	base64img = image2base64(image)
	payload = {"image": base64img, "width": width, "height": height, "req_type": req_type}
	if req_type == "colorize" or req_type == "emotion":
	payload["defry"] = defry
	payload["prompt"] = prompt

	try:
	response = requests.post("https://image.novelai.net/ai/augment-image", json=payload, headers=headers, timeout=60)
	except:
	raise gr.Error('NAI response timeout')

	# Process the response
	if response.headers.get('Content-Type') == 'binary/octet-stream':
	zipfile_in_memory = io.BytesIO(response.content)
	with zipfile.ZipFile(zipfile_in_memory, 'r') as zip_ref:
	if len(zip_ref.namelist()):
	images = []
	for file_name in zip_ref.namelist():
	with zip_ref.open(file_name) as file:
	images.append(image_from_bytes(file.read()))
	return images
	else:
	messages = json.loads(response.content)
	raise gr.Error(str(messages["statusCode"]) + ": " + messages["message"])
	else:
	messages = json.loads(response.content)
	raise gr.Error(str(messages["statusCode"]) + ": " + messages["message"])

	def vibe_encode(model, images, extracts):
	b64 = [image2base64(i[0]) for i in images]
	vibes = []
	for i, e in zip(b64, extracts):
	try:
	response = requests.post("https://image.novelai.net/ai/encode-vibe", json={'image': i, 'information_extracted': e, 'model': model}, headers=headers, timeout=60)
	except:
	raise gr.Error('NAI response timeout')
	if response.headers.get('Content-Type') == 'application/binary':
	vibe = base64.b64encode(response.content).decode()
	vibes.append(vibe)
	else:
	messages = json.loads(response.content)
	raise gr.Error(str(messages["statusCode"]) + ": " + messages["message"])
	return b64, vibes

	def vibe_to_json(model, ref_image, info_extract, b64img, b64enc):
	data = {"identifier": "novelai-vibe-transfer", "version": 1, "type": "image", "image": b64img}
	data['id'] = hashlib.sha256(b64img.encode()).hexdigest()
	data['encodings'] = {}
	data['encodings']['v4full' if model.endswith('full') else 'v4curated'] = {hashlib.sha256(b64enc.encode()).hexdigest(): {'encoding': b64enc, 'params': {'information_extracted': info_extract}}}
	data['name'] = data['id'][:6] + '-' + data['id'][-6:]
	w, h = ref_image.size
	scale = 256 / max(w, h)
	resized_w = math.floor(w * scale)
	resized_h = math.floor(h * scale)
	thumbnail = image2base64(ref_image.resize((resized_w, resized_h)))
	data['thumbnail'] = 'data:image/jpeg;base64,' + thumbnail
	data['createdAt'] = round(time.time())
	data['importInfo'] = {'model': model, 'infomation_extracted': info_extract, 'strength': 0.6}
	return json.dumps(data), data['name']