Spaces:

mitbuechner
/

F-INR-Image

Sleeping

App Files Files Community

F-INR-Image / model.py

mitbuechner

Init

67556c9 10 days ago

raw

history blame contribute delete

10.7 kB

	# MIT License

	# Copyright (c) [2026] [Tim Büchner, Sai Karthikeya Vemuri, Joachim Denzler]

	# Permission is hereby granted, free of charge, to any person obtaining a copy
	# of this software and associated documentation files (the "Software"), to deal
	# in the Software without restriction, including without limitation the rights
	# to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
	# copies of the Software, and to permit persons to whom the Software is
	# furnished to do so, subject to the following conditions:

	# The above copyright notice and this permission notice shall be included in all
	# copies or substantial portions of the Software.

	# THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
	# IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
	# FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
	# AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
	# LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
	# OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
	# SOFTWARE.

	__all__ = ["get_model_2D", "MLPType", "EmbeddingType", "DecompositionType"]

	from abc import ABC
	from enum import Enum
	from typing import Optional

	import flax.linen as nn
	import jax
	import jax.numpy as jnp


	class MLPType(Enum):
	TANH = "TANH"
	RELU = "ReLU"
	WIRE = "WIRE"
	SIREN = "SIREN"
	SIREN2 = "SIREN2"
	FINER = "FINER"
	NEURBF = "NeuRBF"


	class EmbeddingType(Enum):
	PE000 = "PE000"
	PE010 = "PE010"
	PE020 = "PE020"
	PE100 = "PE100"
	HE = "HE"


	class DecompositionType(Enum):
	BASELINE = "Baseline"
	CP = "CP"
	TT = "TT"
	TU = "TU"
	TR = "TR"


	class NeuRBF1D(nn.Module):
	num_rbfs: int
	feature_dim: int

	@nn.compact
	def __call__(self, x):
	centers = self.param("centers", nn.initializers.uniform(), (self.num_rbfs, 1))
	log_sigma = self.param("log_sigma", nn.initializers.zeros, (self.num_rbfs, 1))
	sigma = jnp.exp(log_sigma) + 1e-6
	freq = self.param("freq", nn.initializers.normal(stddev=5.0), (1, self.feature_dim))
	bias = self.param("bias", nn.initializers.zeros, (1, self.feature_dim))
	features = self.param("features", nn.initializers.normal(stddev=0.1), (self.num_rbfs, self.feature_dim))
	x_exp = x[:, None, :]
	c = centers[None, :, :]
	s = sigma[None, :, :]
	sq_dist = ((x_exp - c) 2) / (s2)
	rbf_vals = 1.0 / (1.0 + sq_dist.sum(-1))
	composed = jnp.sin(rbf_vals[:, :, None] * freq + bias)
	modulated = composed * features[None, :, :]
	aggregated = jnp.sum(modulated, axis=1)
	h = nn.Dense(self.feature_dim)(aggregated)
	h = jnp.sin(h * freq[0]) + h
	return nn.Dense(self.feature_dim)(h)


	class RealGaborLayer(nn.Module):
	in_features: int
	out_features: int
	bias: bool = True
	is_first: bool = False
	omega0: float = 10.0
	sigma0: float = 10.0

	def setup(self):
	self.omega_0 = self.omega0
	self.scale_0 = self.sigma0
	self.freqs = nn.Dense(self.out_features, use_bias=self.bias)
	self.scale = nn.Dense(self.out_features, use_bias=self.bias)

	def __call__(self, input):
	omega = self.omega_0 * self.freqs(input)
	scale = self.scale(input) * self.scale_0
	return jnp.cos(omega) * jnp.exp(-(scale**2))


	class SineLayer(nn.Module):
	in_features: int
	out_features: int
	bias: bool = True
	is_first: bool = False
	omega_0: float = 30.0
	init_weights: bool = True

	def setup(self):
	self.linear = nn.Dense(self.out_features, use_bias=self.bias, kernel_init=self.init_weights_fn())

	def init_weights_fn(self):
	if self.is_first:

	def init(key, shape, dtype=jnp.float32):
	limit = 1.0 / shape[0]
	return jax.random.uniform(key, shape, dtype, minval=-limit, maxval=limit)
	else:

	def init(key, shape, dtype=jnp.float32):
	limit = jnp.sqrt(6.0 / shape[0]) / self.omega_0
	return jax.random.uniform(key, shape, dtype, minval=-limit, maxval=limit)

	return init

	def __call__(self, input):
	return jnp.sin(self.omega_0 * self.linear(input))


	class SimpleHashEncoder1D(nn.Module):
	L: int
	F: int
	N_min: int
	N_max: int
	T: int = 2**14

	@property
	def b(self) -> jax.Array:
	return jnp.exp((jnp.log(self.N_max) - jnp.log(self.N_min)) / (self.L - 1))

	@nn.compact
	def __call__(self, x: jax.Array, bound: float) -> jax.Array:
	x = (x + bound) / (2 * bound)
	scales = self.N_min * (self.b ** jnp.arange(self.L)) - 1
	x_scaled = x[:, None] * scales[None, :] + 0.5
	indices = jnp.floor(x_scaled).astype(jnp.int32) % self.T
	embeddings = self.param("hash_table", lambda key, shape: jax.random.uniform(key, shape, minval=-0.001, maxval=0.001), (self.T, self.F))
	return embeddings[indices].reshape(x.shape[0], -1)


	class BACKEND(ABC, nn.Module):
	features: list
	r: int
	in_dim: int
	out_dim: int
	embedding: EmbeddingType
	mlp: MLPType
	L: int = 16
	F: int = 2
	N_min: int = 16
	N_max: int = 524288
	T: int = 2**14

	def setup(self):
	if self.embedding == EmbeddingType.HE:
	self.hash_encoder = SimpleHashEncoder1D(L=self.L, F=self.F, N_min=self.N_min, N_max=self.N_max, T=self.T)

	def encode(self, input):
	if self.mlp == MLPType.NEURBF:
	return input
	if self.embedding == EmbeddingType.HE:
	return self.hash_encoder(input, 1.0)
	elif self.embedding == EmbeddingType.PE000:
	return input
	elif self.embedding == EmbeddingType.PE010:
	pos_enc = 10
	elif self.embedding == EmbeddingType.PE020:
	pos_enc = 20
	elif self.embedding == EmbeddingType.PE100:
	pos_enc = 100
	else:
	raise ValueError(f"Unsupported embedding type: {self.embedding}")
	freq = jnp.array([[2**k for k in range(-((pos_enc - 1) // 2), ((pos_enc + 1) // 2))]])
	return jnp.concatenate((jnp.sin(input @ freq), jnp.cos(input @ freq)), axis=1)

	def create_subnetwork(self, decomposition: Optional[DecompositionType] = None):
	layers = []
	if self.mlp == MLPType.RELU:
	init = nn.initializers.glorot_uniform()
	for fs in self.features[:-1]:
	layers.append(nn.Dense(fs, kernel_init=init))
	layers.append(nn.relu)
	layers.append(nn.Dense(self.r * self.out_dim, kernel_init=init))
	return nn.Sequential(layers)
	elif self.mlp == MLPType.TANH:
	init = nn.initializers.xavier_normal()
	for fs in self.features[:-1]:
	layers.append(nn.Dense(fs, kernel_init=init))
	layers.append(nn.tanh)
	layers.append(nn.Dense(self.r * self.out_dim, kernel_init=init))
	return nn.Sequential(layers)
	elif self.mlp == MLPType.WIRE:
	omega, sigma = 5, 5
	for idx, fs in enumerate(self.features[:-1]):
	layers.append(RealGaborLayer(fs, fs, is_first=(idx == 0), omega0=omega, sigma0=sigma))
	layers.append(nn.Dense(self.r * self.out_dim, kernel_init=self.custom_init(False)))
	return nn.Sequential(layers)
	elif self.mlp == MLPType.SIREN:
	for idx, fs in enumerate(self.features[:-1]):
	if idx == 0:
	layers.append(nn.Dense(fs, kernel_init=self.custom_init(True)))
	layers.append(self.scaled_sine_activation)
	else:
	layers.append(nn.Dense(fs, kernel_init=self.custom_init(False)))
	layers.append(self.sine_activation)
	layers.append(nn.Dense(self.r * self.out_dim, kernel_init=self.custom_init(False)))
	return nn.Sequential(layers)
	elif self.mlp == MLPType.FINER:
	for fs in self.features[:-1]:
	layers.append(nn.Dense(fs, kernel_init=self.finer_init(0.5)))
	layers.append(self.finer_activation)
	layers.append(nn.Dense(self.r * self.out_dim, kernel_init=self.finer_init(0.5)))
	return nn.Sequential(layers)
	elif self.mlp == MLPType.NEURBF:
	return NeuRBF1D(num_rbfs=self.r, feature_dim=self.r * self.out_dim)
	raise ValueError(f"Unsupported MLP type: {self.mlp}")

	def custom_init(self, is_first):
	def init(key, shape, dtype=jnp.float32):
	limit = 1.0 / shape[0] if is_first else jnp.sqrt(6.0 / shape[0]) / 100
	return jax.random.uniform(key, shape, dtype, minval=-limit, maxval=limit)

	return init

	def finer_init(self, scale=1.0):
	def init(key, shape, dtype=jnp.float32):
	limit = scale / jnp.sqrt(shape[0])
	return jax.random.uniform(key, shape, dtype, minval=-limit, maxval=limit)

	return init

	@staticmethod
	def sine_activation(x):
	return jnp.sin(30 * x)

	@staticmethod
	def scaled_sine_activation(x):
	return jnp.sin(100.0 * x)

	@staticmethod
	def finer_activation(x):
	return jnp.sin((jnp.abs(x) + 1.0) * x)


	class INR_Baseline2D(BACKEND):
	def setup(self):
	super().setup()
	self.network = self.create_subnetwork()

	def __call__(self, x, y):
	x, y = self.encode(x), self.encode(y)
	X = jnp.concatenate([x, y], axis=1)
	return self.network(X)


	class FINR_CP_2D(BACKEND):
	def setup(self):
	super().setup()
	self.network_x = self.create_subnetwork()
	self.network_y = self.create_subnetwork()

	def __call__(self, x, y):
	x, y = self.encode(x), self.encode(y)
	out_x, out_y = self.network_x(x), self.network_y(y)
	out_x, out_y = jnp.transpose(out_x, (1, 0)), jnp.transpose(out_y, (1, 0))
	pred = []
	for i in range(self.out_dim):
	pred.append(jnp.einsum("fx, fy->xy", out_x[self.r * i : self.r * (i + 1)], out_y[self.r * i : self.r * (i + 1)]))
	return pred


	def get_model_2D(backend=MLPType.RELU, embedding=EmbeddingType.PE100, decomp=DecompositionType.CP, rank=128, **kwargs):
	if decomp == DecompositionType.BASELINE:
	return INR_Baseline2D(r=rank, embedding=embedding, mlp=backend, in_dim=2, out_dim=3, **kwargs)
	elif decomp == DecompositionType.CP:
	return FINR_CP_2D(r=rank, embedding=embedding, mlp=backend, in_dim=2, out_dim=3, **kwargs)
	raise ValueError(f"Unsupported decomposition type: {decomp}")