Spaces:

hkayabilisim
/

hdmr

Sleeping

App Files Files Community

hdmr / app.py

hkayabilisim

Live update enabled for range sliders

c6bb2d8 over 2 years ago

raw

history blame contribute delete

9.53 kB

	import numpy as np
	import gradio as gd
	import pandas as pd
	from sklearn.metrics import r2_score

	global df_trn, df_hat_trn, df_tst, df_hat_tst
	# Vanilla Legendre between [0,1]
	def Pn(m, x):
	if m == 0:
	return np.ones_like(x)
	elif m == 1:
	return x
	else:
	return (2m-1)xPn(m-1, x)/m - (m-1)Pn(m-2, x)/m

	# Legendre between [a,b]
	def L(a,b,m,x):
	return np.sqrt((2m+1)/(b-a))Pn(m, 2*(x-b)/(b-a)+1)

	def sobol(x, y, m, range_min, range_max):
	print(x.shape, y.shape)
	N, n = x.shape
	f0 = np.mean(y)
	print(f'f0:{f0}')
	alpha = np.zeros((m, n))

	for r in range(m):
	for i in range(n):
	alpha[r, i] = (range_max-range_min) * np.mean((y-f0) * L(range_min, range_max, r+1, np.array(x[:, [i]])))

	global_D = (range_max-range_min)np.mean(y * 2) - ((range_max-range_min)np.mean(y)) * 2
	D_first_order = np.zeros((n))
	S_first_order = np.zeros((n))
	for k in range(n):
	D_first_order[k] = sum(alpha[r,k] ** 2 for r in range(m))
	S_first_order[k] = D_first_order[k]/global_D

	return S_first_order, f0, alpha

	def evalute_hdmr(x, f0, alpha, range_min, range_max):
	N, n = x.shape
	m, _ = alpha.shape
	y = f0 * np.ones((N,1))
	for r in range(m):
	for i in range(n):
	y = y + alpha[r, i] * L(range_min, range_max, r+1, np.array(x[:, [i]]))
	return y

	def f(x):
	return np.sum((x-0.5)**2,axis=1,keepdims=True)

	def optimize(N,n,m,func_code,trn_ratio,range_min,range_max):
	global df_trn, df_hat_trn, df_tst, df_hat_tst
	print(func_code)
	print(N)
	N_trn = round(N*trn_ratio)
	N_tst = N - N_trn
	print(f'N:{N} N_trn:{N_trn} N_tst:{N_tst}')
	x_trn = np.random.uniform(range_min,range_max,size=(N_trn,n))
	y_trn = eval(func_code, {'x': x_trn,'np':np})
	x_tst = np.random.uniform(range_min,range_max,size=(N_tst,n))
	y_tst = eval(func_code, {'x': x_tst,'np':np})

	si, f0, alpha = sobol(x_trn, y_trn, m, range_min, range_max)
	yhat_trn = evalute_hdmr(x_trn, f0, alpha, range_min, range_max)
	yhat_tst = evalute_hdmr(x_tst, f0, alpha, range_min, range_max)
	out = ''
	out += f'trn x:{x_trn.shape} y:{y_trn.shape}'
	out += f'tst x:{x_tst.shape} y:{y_tst.shape}'
	out += f'{si}'

	# Input/Output data concatenated
	xy_trn = np.concatenate([x_trn,y_trn],axis=1)
	xyhat_trn = np.concatenate([x_trn,yhat_trn],axis=1)
	y_vs_yhat_trn = np.concatenate([y_trn,yhat_trn],axis=1)
	r2_trn = r2_score(y_trn, yhat_trn)

	xy_tst = np.concatenate([x_tst,y_tst],axis=1)
	xyhat_tst = np.concatenate([x_tst,yhat_tst],axis=1)
	y_vs_yhat_tst = np.concatenate([y_tst,yhat_tst],axis=1)
	r2_tst = r2_score(y_tst, yhat_tst)


	# x1, x2, ... , xn, y
	columns = [f'x{id+1}' for id in range(n)] + ['y']
	print(columns)
	df_trn = pd.DataFrame(xy_trn, columns=columns)
	df_hat_trn = pd.DataFrame(xyhat_trn, columns=columns)
	df_corr_trn = pd.DataFrame(y_vs_yhat_trn, columns=['y','yhat'])

	df_tst = pd.DataFrame(xy_tst, columns=columns)
	df_hat_tst = pd.DataFrame(xyhat_tst, columns=columns)
	df_corr_tst = pd.DataFrame(y_vs_yhat_tst, columns=['y','yhat'])

	return (out,
	gd.Dropdown.update(choices=[f'x{id+1}' for id in range(n)]),
	gd.ScatterPlot.update(value=df_trn,x='x1',y='y'),
	gd.ScatterPlot.update(value=df_hat_trn,x='x1',y='y'),
	gd.ScatterPlot.update(value=df_corr_trn,x='y',y='yhat'),
	gd.Markdown.update(value=f'R2:{r2_trn}'),
	gd.ScatterPlot.update(value=df_tst,x='x1',y='y'),
	gd.ScatterPlot.update(value=df_hat_tst,x='x1',y='y'),
	gd.ScatterPlot.update(value=df_corr_tst,x='y',y='yhat'),
	gd.Markdown.update(value=f'R2:{r2_tst}'))


	def change_pdp(pdp_x):
	print(pdp_x, type(pdp_x))
	global df_trn, df_hat_trn, df_tst, df_hat_tst
	return (gd.ScatterPlot.update(value=df_trn, x=pdp_x, y='y'),
	gd.ScatterPlot.update(value=df_hat_trn, x=pdp_x, y='y'),
	gd.ScatterPlot.update(value=df_tst, x=pdp_x, y='y'),
	gd.ScatterPlot.update(value=df_hat_tst, x=pdp_x, y='y'))


	with gd.Blocks() as demo:
	with gd.Row():
	with gd.Column():
	N = gd.Slider(10, 5000, value=1000, step=100, label="Number of samples",
	info="""
	Please specify how many sample points you want to
	generate to generate meta-model.
	""")
	n = gd.Slider(2, 10, step=1, label="Number of variables",
	info="""
	Please specify how many variables you have
	in the optimized function.
	""")
	m = gd.Slider(1, 20, step=1, value=3, label="Number of bases",
	info="""
	Please specify how many base functions you use
	to construct the meta-model.
	""")
	trn_ratio = gd.Slider(0.1, 0.9, value=0.2, step=0.1, label="Training ratio")
	range_min = gd.Slider(-10.0, 10.0, step=0.01, value=-5, label="Minimum value of the range",
	info="""
	Please choose the lowest value of the range. Make sure the range_min is less than
	range_max.
	""")
	range_max = gd.Slider(-10.0, 10.0, step=0.01, value=5, label="Maximum value of the range",
	info="""
	Please choose the highest value of the range. Make sure the range_max is greate than
	range_min.
	""")

	with gd.Column():
	func_disp = gd.Markdown()
	func_code = gd.Code(
	value="np.sum((10x-5)2 - 10np.cos(23.14(10x-5)),axis=1,keepdims=True) +10x.shape[1]",
	language="python",
	lines=1,
	label="Model function: input is x with shape (N,n) and output is y with shape (N,1)",
	interactive=True
	)
	btn = gd.Button('Create FEOM')
	gd.Examples([["np.sum((10x-5)2 - 10np.cos(23.14(10x-5)),axis=1,keepdims=True) +10x.shape[1]",
	"$$\mathbf{y} = 10n+\sum_{i=1}^n[\mathbf{x}_i^2-10 \cos(2 \pi x_i)] \;\; \mathbf{x}_i \in R^{N}$$",
	0,1],
	["np.sum((x-0.5)**2,axis=1,keepdims=True)","$$\mathbf{y} = \sum_i^n(\mathbf{x}_i-0.5)^2,\;\; \mathbf{x}_i \in R^{N}$$",0,1],
	["np.sum(x,axis=1,keepdims=True)","$$\mathbf{y} = \sum_i^n \mathbf{x}_i \;\; \mathbf{x}_i \in R^{N}$$",0,1],
	["np.sum((x-0.5)**3,axis=1,keepdims=True)","$$\mathbf{y} = \sum_i^n (\mathbf{x}_i-0.5)^3 \;\; \mathbf{x}_i \in R^{N}$$",0,1]],
	inputs=[func_code,func_disp,range_min,range_max])
	with gd.Row():
	gd.Markdown('Original Training Data')
	gd.Markdown('HDMR Approximation applied to Training Data')
	r2_out_trn = gd.Markdown('R2 Score on Training')
	with gd.Row():
	pdp_trn = gd.ScatterPlot(label='Scatter plot of input data').style(container=True)
	feom_trn = gd.ScatterPlot(label='Scatter plot of FEOM').style(container=True)
	corr_trn = gd.ScatterPlot(label='y versus feom')
	with gd.Row():
	gd.Markdown('Original Testing Data')
	gd.Markdown('HDMR Approximation applied to Testing Data')
	r2_out_tst = gd.Markdown('R2 Score on Testing')
	with gd.Row():
	pdp_tst = gd.ScatterPlot(label='Scatter plot of input data').style(container=True)
	feom_tst = gd.ScatterPlot(label='Scatter plot of FEOM').style(container=True)
	corr_tst = gd.ScatterPlot(label='y versus feom')

	pdp_x = gd.Dropdown(['x1','x2'], label="Choose input variable to show in scatter plots")
	out = gd.TextArea()
	btn.click(optimize, inputs=[N,n,m,func_code, trn_ratio,range_min,range_max],
	outputs=[out, pdp_x, pdp_trn, feom_trn,corr_trn,r2_out_trn,
	pdp_tst, feom_tst,corr_tst,r2_out_tst])
	n.change(optimize, inputs=[N,n,m,func_code,trn_ratio,range_min,range_max],
	outputs=[out, pdp_x, pdp_trn, feom_trn,corr_trn,r2_out_trn,
	pdp_tst, feom_tst,corr_tst,r2_out_tst])
	N.change(optimize, inputs=[N,n,m,func_code,trn_ratio,range_min,range_max],
	outputs=[out, pdp_x, pdp_trn, feom_trn,corr_trn,r2_out_trn,
	pdp_tst, feom_tst,corr_tst,r2_out_tst])
	m.change(optimize, inputs=[N,n,m,func_code,trn_ratio,range_min, range_max],
	outputs=[out, pdp_x, pdp_trn, feom_trn,corr_trn,r2_out_trn,
	pdp_tst, feom_tst,corr_tst,r2_out_tst])
	trn_ratio.change(optimize, inputs=[N,n,m,func_code,trn_ratio,range_min, range_max],
	outputs=[out, pdp_x, pdp_trn, feom_trn,corr_trn,r2_out_trn,
	pdp_tst, feom_tst,corr_tst,r2_out_tst])
	range_min.change(optimize, inputs=[N,n,m,func_code,trn_ratio,range_min, range_max],
	outputs=[out, pdp_x, pdp_trn, feom_trn,corr_trn,r2_out_trn,
	pdp_tst, feom_tst,corr_tst,r2_out_tst])
	range_max.change(optimize, inputs=[N,n,m,func_code,trn_ratio,range_min, range_max],
	outputs=[out, pdp_x, pdp_trn, feom_trn,corr_trn,r2_out_trn,
	pdp_tst, feom_tst,corr_tst,r2_out_tst])
	pdp_x.change(change_pdp, inputs=pdp_x, outputs=[pdp_trn, feom_trn, pdp_tst, feom_tst])


	demo.launch()