instant-ngp / src /testbed_volume.cu

instant-ngp build

7873319 about 3 years ago

21.5 kB

	/*
	* Copyright (c) 2020-2022, NVIDIA CORPORATION. All rights reserved.
	*
	* NVIDIA CORPORATION and its licensors retain all intellectual property
	* and proprietary rights in and to this software, related documentation
	* and any modifications thereto. Any use, reproduction, disclosure or
	* distribution of this software and related documentation without an express
	* license agreement from NVIDIA CORPORATION is strictly prohibited.
	*/

	/** @file testbed_volume.cu
	* @author Thomas Müller & Alex Evans, NVIDIA
	*/

	#include <neural-graphics-primitives/common_device.cuh>
	#include <neural-graphics-primitives/common.h>
	#include <neural-graphics-primitives/random_val.cuh> // helpers to generate random values, directions
	#include <neural-graphics-primitives/render_buffer.h>
	#include <neural-graphics-primitives/testbed.h>
	#include <neural-graphics-primitives/trainable_buffer.cuh>

	#include <tiny-cuda-nn/common_device.h>
	#include <tiny-cuda-nn/gpu_matrix.h>
	#include <tiny-cuda-nn/network_with_input_encoding.h>
	#include <tiny-cuda-nn/network.h>
	#include <tiny-cuda-nn/trainer.h>

	#include <nanovdb/NanoVDB.h>

	#include <filesystem/path.h>

	#include <fstream>

	using namespace Eigen;
	using namespace tcnn;

	NGP_NAMESPACE_BEGIN

	Testbed::NetworkDims Testbed::network_dims_volume() const {
	NetworkDims dims;
	dims.n_input = 3;
	dims.n_output = 4;
	dims.n_pos = 3;
	return dims;
	}

	__device__ Array4f proc_envmap(const Vector3f& dir, const Vector3f& up_dir, const Vector3f& sun_dir, const Array3f& skycol) {
	float skyam = up_dir.dot(dir) * 0.5f + 0.5f;
	float sunam = std::max(0.f, sun_dir.dot(dir));
	sunam *= sunam;
	sunam *= sunam;
	sunam *= sunam;
	sunam *= sunam;
	sunam *= sunam;
	sunam *= sunam;

	Array4f result;
	result.head<3>() = skycol * skyam + Array3f{255.f/255.0f, 215.f/255.0f, 195.f/255.0f} * (20.f*sunam);
	result.w() = 1.0f;
	return result;
	}

	__device__ Array4f proc_envmap_render(const Vector3f& dir, const Vector3f& up_dir, const Vector3f& sun_dir, const Array3f& skycol) {
	// Constant background color. Uncomment the following two lines to instead render the
	// actual sunsky model that we trained from.
	Array4f result = Array4f::Zero();

	result = proc_envmap(dir, up_dir, sun_dir, skycol);

	return result;
	}

	__device__ inline bool walk_to_next_event(default_rng_t &rng, const BoundingBox &aabb, Vector3f &pos, const Vector3f &dir, const uint8_t *bitgrid, float scale) {
	while (1) {
	float zeta1 = random_val(rng); // sample a free flight distance and go there!
	float dt = -std::log(1.0f - zeta1) * scale; // todo - for spatially varying majorant, we must check dt against the range over which the majorant is defined. we can turn this into an optical thickness accumulating loop...
	pos += dir*dt;
	if (!aabb.contains(pos)) return false; // escape to the mooon!
	uint32_t bitidx = tcnn::morton3D(int(pos.x()128.f+0.5f),int(pos.y()128.f+0.5f),int(pos.z()*128.f+0.5f));
	if (bitidx<128128128 && bitgrid[bitidx>>3]&(1<<(bitidx&7))) break;
	// loop around and try again as we are in density=0 region!
	}
	return true;
	}

	static constexpr uint32_t MAX_TRAIN_VERTICES = 4; // record the first few real interactions and use as training data. uses a local array so cant be big.

	__global__ void volume_generate_training_data_kernel(uint32_t n_elements,
	Vector3f* pos_out,
	Array4f* target_out,
	const void* nanovdb,
	const uint8_t* bitgrid,
	Vector3f world2index_offset,
	float world2index_scale,
	BoundingBox aabb,
	default_rng_t rng,
	float albedo,
	float scattering,
	float distance_scale,
	float global_majorant,
	Vector3f up_dir,
	Vector3f sun_dir,
	Array3f sky_col
	) {
	uint32_t idx = blockIdx.x * blockDim.x + threadIdx.x;
	if (idx >= n_elements) return;
	rng.advance(idx*256);
	uint32_t numout = 0;
	Vector3f outpos[MAX_TRAIN_VERTICES];
	float outdensity[MAX_TRAIN_VERTICES];
	float scale = distance_scale / global_majorant;
	const nanovdb::FloatGrid* grid = reinterpret_cast<const nanovdb::FloatGrid*>(nanovdb);
	auto acc = grid->tree().getAccessor();
	while (numout < MAX_TRAIN_VERTICES) {
	uint32_t prev_numout = numout;
	Vector3f pos = random_dir(rng) * 2. + Vector3f::Constant(0.5f);
	Vector3f target = random_val_3d(rng).cwiseProduct(aabb.diag()) + aabb.min;
	Vector3f dir = (target-pos).normalized();
	auto box_intersection = aabb.ray_intersect(pos, dir);
	float t = max(box_intersection.x(), 0.0f);
	pos = pos + (t + 1e-6f) * dir;
	float throughput = 1.f;
	for (int iter=0; iter<128; ++iter) {
	if (!walk_to_next_event(rng, aabb, pos, dir, bitgrid, scale)) // escaped!
	break;
	Vector3f nanovdbpos = pos*world2index_scale + world2index_offset;
	float density = acc.getValue({int(nanovdbpos.x()+random_val(rng)), int(nanovdbpos.y()+random_val(rng)), int(nanovdbpos.z()+random_val(rng))});

	if (numout < MAX_TRAIN_VERTICES) {
	outdensity[numout]=density;
	outpos[numout]=pos;
	numout++;
	}

	float extinction_prob = density / global_majorant;
	float scatter_prob = extinction_prob * albedo;
	float zeta2=random_val(rng);
	if (zeta2 >= extinction_prob)
	continue; // null collision
	if (zeta2 < scatter_prob) // was it a scatter?
	dir = (dir*scattering + random_dir(rng)).normalized();
	else {
	throughput = 0.f; // absorb
	break;
	}
	}
	Array4f targetcol = proc_envmap(dir, up_dir, sun_dir, sky_col) * throughput;
	uint32_t oidx=idx * MAX_TRAIN_VERTICES;
	for (uint32_t i=prev_numout;i<numout;++i) {
	float density=outdensity[i];
	Vector3f pos=outpos[i];
	pos_out[oidx + i]=pos;
	target_out[oidx + i] = targetcol;
	target_out[oidx + i].w() = density;
	}
	}
	}

	void Testbed::train_volume(size_t target_batch_size, bool get_loss_scalar, cudaStream_t stream) {
	const uint32_t n_output_dims = 4;
	const uint32_t n_input_dims = 3;

	// Auxiliary matrices for training
	const uint32_t batch_size = (uint32_t)target_batch_size;

	// Permute all training records to de-correlate training data

	const uint32_t n_elements = batch_size;
	m_volume.training.positions.enlarge(n_elements);
	m_volume.training.targets.enlarge(n_elements);

	float distance_scale = 1.f/std::max(m_volume.inv_distance_scale,0.01f);
	auto sky_col = m_background_color.head<3>();

	linear_kernel(volume_generate_training_data_kernel, 0, stream, n_elements / MAX_TRAIN_VERTICES,
	m_volume.training.positions.data(),
	m_volume.training.targets.data(),
	m_volume.nanovdb_grid.data(),
	m_volume.bitgrid.data(),
	m_volume.world2index_offset,
	m_volume.world2index_scale,
	m_render_aabb,
	m_rng,
	m_volume.albedo,
	m_volume.scattering,
	distance_scale,
	m_volume.global_majorant,
	m_up_dir,
	m_sun_dir,
	sky_col
	);
	m_rng.advance(n_elements*256);

	GPUMatrix<float> training_batch_matrix((float*)(m_volume.training.positions.data()), n_input_dims, batch_size);
	GPUMatrix<float> training_target_matrix((float*)(m_volume.training.targets.data()), n_output_dims, batch_size);

	auto ctx = m_trainer->training_step(stream, training_batch_matrix, training_target_matrix);

	m_training_step++;

	if (get_loss_scalar) {
	m_loss_scalar.update(m_trainer->loss(stream, *ctx));
	}
	}

	__global__ void init_rays_volume(
	uint32_t sample_index,
	Vector3f* __restrict__ positions,
	Testbed::VolPayload* __restrict__ payloads,
	uint32_t *pixel_counter,
	Vector2i resolution,
	Vector2f focal_length,
	Matrix<float, 3, 4> camera_matrix,
	Vector2f screen_center,
	Vector3f parallax_shift,
	bool snap_to_pixel_centers,
	BoundingBox aabb,
	float near_distance,
	float plane_z,
	float aperture_size,
	const float* __restrict__ envmap_data,
	const Vector2i envmap_resolution,
	Array4f* __restrict__ framebuffer,
	float* __restrict__ depthbuffer,
	default_rng_t rng,
	const uint8_t *bitgrid,
	float distance_scale,
	float global_majorant,
	Vector3f up_dir,
	Vector3f sun_dir,
	Array3f sky_col
	) {
	uint32_t x = threadIdx.x + blockDim.x * blockIdx.x;
	uint32_t y = threadIdx.y + blockDim.y * blockIdx.y;
	if (x >= resolution.x() \|\| y >= resolution.y()) {
	return;
	}
	uint32_t idx = x + resolution.x() * y;
	rng.advance(idx<<8);
	if (plane_z < 0) {
	aperture_size = 0.0;
	}
	Ray ray = pixel_to_ray(sample_index, {x, y}, resolution, focal_length, camera_matrix, screen_center, parallax_shift, snap_to_pixel_centers, near_distance, plane_z, aperture_size);
	ray.d = ray.d.normalized();
	auto box_intersection = aabb.ray_intersect(ray.o, ray.d);
	float t = max(box_intersection.x(), 0.0f);
	ray.o = ray.o + (t + 1e-6f) * ray.d;
	float scale = distance_scale / global_majorant;
	if (t >= box_intersection.y() \|\| !walk_to_next_event(rng, aabb, ray.o, ray.d, bitgrid, scale)) {
	framebuffer[idx] = proc_envmap_render(ray.d, up_dir, sun_dir, sky_col);
	depthbuffer[idx] = 1e10f;
	} else {
	uint32_t dstidx = atomicAdd(pixel_counter, 1);
	positions[dstidx] = ray.o;
	payloads[dstidx] = {ray.d, Array4f::Constant(0.f), idx};
	depthbuffer[idx] = camera_matrix.col(2).dot(ray.o - camera_matrix.col(3));
	}
	}

	__global__ void volume_render_kernel_gt(
	uint32_t n_pixels,
	Vector2i resolution,
	default_rng_t rng,
	BoundingBox aabb,
	const Vector3f* __restrict__ positions_in,
	const Testbed::VolPayload* __restrict__ payloads_in,
	const uint32_t *pixel_counter_in,
	const Vector3f up_dir,
	const Vector3f sun_dir,
	const Array3f sky_col,
	const void *nanovdb,
	const uint8_t *bitgrid,
	float global_majorant,
	Vector3f world2index_offset,
	float world2index_scale,
	float distance_scale,
	float albedo,
	float scattering,
	Array4f* __restrict__ framebuffer,
	float* __restrict__ depthbuffer
	) {
	uint32_t idx = threadIdx.x + blockDim.x * blockIdx.x;
	if (idx>=n_pixels \|\| idx>=pixel_counter_in[0])
	return;
	uint32_t pixidx = payloads_in[idx].pixidx;
	uint32_t x = pixidx % resolution.x();
	uint32_t y = pixidx / resolution.x();
	if (y>=resolution.y())
	return;
	Vector3f pos = positions_in[idx];
	Vector3f dir = payloads_in[idx].dir;
	rng.advance(pixidx<<8);
	const nanovdb::FloatGrid* grid = reinterpret_cast<const nanovdb::FloatGrid*>(nanovdb);
	auto acc = grid->tree().getAccessor();

	// ye olde delta tracker
	float scale = distance_scale / global_majorant;

	bool absorbed = false;
	bool scattered = false;

	for (int iter=0;iter<128;++iter) {
	Vector3f nanovdbpos = pos*world2index_scale + world2index_offset;
	float density = acc.getValue({int(nanovdbpos.x()+random_val(rng)), int(nanovdbpos.y()+random_val(rng)), int(nanovdbpos.z()+random_val(rng))});
	float extinction_prob = density / global_majorant;
	float scatter_prob = extinction_prob * albedo;
	float zeta2=random_val(rng);
	if (zeta2<scatter_prob) {
	dir = (dir*scattering + random_dir(rng)).normalized();
	scattered = true;
	} else if (zeta2<extinction_prob) {
	absorbed = true;
	break;
	}
	if (!walk_to_next_event(rng, aabb, pos, dir, bitgrid, scale))
	break;
	}
	// the ray is done!

	Array4f col;
	if (absorbed) {
	col = {0.0f, 0.0f, 0.0f, 1.0f};
	} else if (scattered) {
	col = proc_envmap(dir, up_dir, sun_dir, sky_col);
	} else {
	col = proc_envmap_render(dir, up_dir, sun_dir, sky_col);
	}
	framebuffer[pixidx] = col;
	}

	__global__ void volume_render_kernel_step(
	uint32_t n_pixels,
	Vector2i resolution,
	default_rng_t rng,
	BoundingBox aabb,
	const Vector3f* __restrict__ positions_in,
	const Testbed::VolPayload* __restrict__ payloads_in,
	const uint32_t *pixel_counter_in,
	Vector3f* __restrict__ positions_out,
	Testbed::VolPayload* __restrict__ payloads_out,
	uint32_t *pixel_counter_out,
	const Array4f *network_outputs_in,
	const Vector3f up_dir,
	const Vector3f sun_dir,
	const Array3f sky_col,
	const void *nanovdb,
	const uint8_t *bitgrid,
	float global_majorant,
	Vector3f world2index_offset,
	float world2index_scale,
	float distance_scale,
	float albedo,
	float scattering,
	Array4f* __restrict__ framebuffer,
	float* __restrict__ depthbuffer,
	bool force_finish_ray
	) {
	uint32_t idx = threadIdx.x + blockDim.x * blockIdx.x;
	if (idx>=n_pixels \|\| idx>=pixel_counter_in[0])
	return;
	Testbed::VolPayload payload = payloads_in[idx];
	uint32_t pixidx = payload.pixidx;
	uint32_t x = pixidx % resolution.x();
	uint32_t y = pixidx / resolution.x();
	if (y>=resolution.y())
	return;
	Vector3f pos = positions_in[idx];
	Vector3f dir = payload.dir;
	rng.advance(pixidx<<8);
	const nanovdb::FloatGrid* grid = reinterpret_cast<const nanovdb::FloatGrid*>(nanovdb);
	auto acc = grid->tree().getAccessor();
	// ye olde delta tracker

	Array4f local_output = network_outputs_in[idx];
	float scale = distance_scale / global_majorant;
	float density = local_output.w();
	float extinction_prob = density / global_majorant;
	if (extinction_prob>1.f) extinction_prob=1.f;
	float T = 1.f-payload.col.w();
	float alpha = extinction_prob * T;
	payload.col.head<3>() += local_output.head<3>() * alpha;
	payload.col.w() += alpha;
	if (payload.col.w() > 0.99f \|\| !walk_to_next_event(rng, aabb, pos, dir, bitgrid, scale) \|\| force_finish_ray) {
	payload.col += (1.f-payload.col.w()) * proc_envmap_render(dir, up_dir, sun_dir, sky_col);
	framebuffer[pixidx] = payload.col;
	return;
	}
	uint32_t dstidx = atomicAdd(pixel_counter_out, 1);
	positions_out[dstidx]=pos;
	payloads_out[dstidx]=payload;
	}

	void Testbed::render_volume(CudaRenderBuffer& render_buffer,
	const Vector2f& focal_length,
	const Matrix<float, 3, 4>& camera_matrix,
	const Vector2f& screen_center,
	cudaStream_t stream
	) {
	float plane_z = m_slice_plane_z + m_scale;
	float distance_scale = 1.f/std::max(m_volume.inv_distance_scale,0.01f);
	auto res = render_buffer.in_resolution();

	size_t n_pixels = (size_t)res.x() * res.y();
	for (uint32_t i=0;i<2;++i) {
	m_volume.pos[i].enlarge(n_pixels);
	m_volume.payload[i].enlarge(n_pixels);
	}
	m_volume.hit_counter.enlarge(2);
	m_volume.hit_counter.memset(0);

	Array3f sky_col = m_background_color.head<3>();

	const dim3 threads = { 16, 8, 1 };
	const dim3 blocks = { div_round_up((uint32_t)res.x(), threads.x), div_round_up((uint32_t)res.y(), threads.y), 1 };
	init_rays_volume<<<blocks, threads, 0, stream>>>(
	render_buffer.spp(),
	m_volume.pos[0].data(),
	m_volume.payload[0].data(),
	m_volume.hit_counter.data(),
	res,
	focal_length,
	camera_matrix,
	screen_center,
	m_parallax_shift,
	m_snap_to_pixel_centers,
	m_render_aabb,
	m_render_near_distance,
	plane_z,
	m_aperture_size,
	m_envmap.envmap->inference_params(),
	m_envmap.resolution,
	render_buffer.frame_buffer(),
	render_buffer.depth_buffer(),
	m_rng,
	m_volume.bitgrid.data(),
	distance_scale,
	m_volume.global_majorant,
	m_up_dir,
	m_sun_dir,
	sky_col
	);
	m_rng.advance(n_pixels*256);

	uint32_t n=n_pixels;
	CUDA_CHECK_THROW(cudaDeviceSynchronize());
	cudaMemcpy(&n, m_volume.hit_counter.data(), sizeof(uint32_t), cudaMemcpyDeviceToHost);

	if (m_render_ground_truth) {
	linear_kernel(volume_render_kernel_gt, 0, stream,
	n,
	res,
	m_rng,
	m_render_aabb,
	m_volume.pos[0].data(),
	m_volume.payload[0].data(),
	m_volume.hit_counter.data(),

	m_up_dir,
	m_sun_dir,
	sky_col,
	m_volume.nanovdb_grid.data(),
	m_volume.bitgrid.data(),
	m_volume.global_majorant,
	m_volume.world2index_offset,
	m_volume.world2index_scale,
	distance_scale,
	std::min(m_volume.albedo,0.995f),
	m_volume.scattering,
	render_buffer.frame_buffer(),
	render_buffer.depth_buffer()
	);
	m_rng.advance(n_pixels*256);
	} else {
	m_volume.radiance_and_density.enlarge(n);

	int max_iter = 64;
	for (int iter=0;iter<max_iter && n>0;++iter) {
	uint32_t srcbuf=(iter&1);
	uint32_t dstbuf=1-srcbuf;

	uint32_t n_elements = next_multiple(n, tcnn::batch_size_granularity);
	GPUMatrix<float> positions_matrix((float*)m_volume.pos[srcbuf].data(), 3, n_elements);
	GPUMatrix<float> densities_matrix((float*)m_volume.radiance_and_density.data(), 4, n_elements);
	m_network->inference(stream, positions_matrix, densities_matrix);

	cudaMemsetAsync(m_volume.hit_counter.data()+dstbuf,0,sizeof(uint32_t));

	linear_kernel(volume_render_kernel_step, 0, stream,
	n,
	res,
	m_rng,
	m_render_aabb,
	m_volume.pos[srcbuf].data(),
	m_volume.payload[srcbuf].data(),
	m_volume.hit_counter.data()+srcbuf,
	m_volume.pos[dstbuf].data(),
	m_volume.payload[dstbuf].data(),
	m_volume.hit_counter.data()+dstbuf,
	m_volume.radiance_and_density.data(),
	m_up_dir,
	m_sun_dir,
	sky_col,
	m_volume.nanovdb_grid.data(),
	m_volume.bitgrid.data(),
	m_volume.global_majorant,
	m_volume.world2index_offset,
	m_volume.world2index_scale,
	distance_scale,
	std::min(m_volume.albedo,0.995f),
	m_volume.scattering,
	render_buffer.frame_buffer(),
	render_buffer.depth_buffer(),
	(iter>=max_iter-1)
	);
	m_rng.advance(n_pixels*256);
	if (((iter+1) % 4)==0) {
	// periodically tell the cpu how many pixels are left
	CUDA_CHECK_THROW(cudaMemcpyAsync(&n, m_volume.hit_counter.data()+dstbuf, sizeof(uint32_t), cudaMemcpyDeviceToHost, stream));
	CUDA_CHECK_THROW(cudaDeviceSynchronize());
	}
	}
	}
	}

	#define NANOVDB_MAGIC_NUMBER 0x304244566f6e614eUL // "NanoVDB0" in hex - little endian (uint64_t)
	struct NanoVDBFileHeader
	{
	uint64_t magic; // 8 bytes
	uint32_t version; // 4 bytes version numbers
	uint16_t gridCount; // 2 bytes
	uint16_t codec; // 2 bytes - must be 0
	};
	static_assert(sizeof(NanoVDBFileHeader) == 16, "nanovdb padding error");

	struct NanoVDBMetaData
	{
	uint64_t gridSize, fileSize, nameKey, voxelCount; // 4 * 8 = 32B.
	uint32_t gridType; // 4B.
	uint32_t gridClass; // 4B.
	double worldBBox[2][3]; // 2 * 3 * 8 = 48B.
	int indexBBox[2][3]; // 2 * 3 * 4 = 24B.
	double voxelSize[3]; // 24B.
	uint32_t nameSize; // 4B.
	uint32_t nodeCount[4]; // 4 x 4 = 16B
	uint32_t tileCount[3]; // 3 x 4 = 12B
	uint16_t codec; // 2B
	uint16_t padding; // 2B, due to 8B alignment from uint64_t
	uint32_t version; // 4B
	};
	static_assert(sizeof(NanoVDBMetaData) == 176, "nanovdb padding error");

	void Testbed::load_volume() {
	if (!m_data_path.exists()) {
	throw std::runtime_error{m_data_path.str() + " does not exist."};
	}
	tlog::info() << "Loading NanoVDB file from " << m_data_path;
	std::ifstream f(m_data_path.str(), std::ios::in \| std::ios::binary);
	NanoVDBFileHeader header;
	NanoVDBMetaData metadata;
	f.read(reinterpret_cast<char*>(&header), sizeof(header));
	f.read(reinterpret_cast<char*>(&metadata), sizeof(metadata));

	if (header.magic!=NANOVDB_MAGIC_NUMBER)
	throw std::runtime_error{"not a nanovdb file"};
	if (header.gridCount==0)
	throw std::runtime_error{"no grids in file"};
	if (header.gridCount>1)
	tlog::warning() << "Only loading first grid in file";
	if (metadata.codec!=0)
	throw std::runtime_error{"cannot use compressed nvdb files"};
	char name[256] = {};
	if (metadata.nameSize > 256)
	throw std::runtime_error{"nanovdb name too long"};
	f.read(name, metadata.nameSize);
	tlog::info()
	<< name << ": gridSize=" << metadata.gridSize << " filesize=" << metadata.fileSize
	<< " voxelCount=" << metadata.voxelCount << " gridType=" << metadata.gridType
	<< " gridClass=" << metadata.gridClass << " indexBBox=[min=["<<metadata.indexBBox[0][0]<<","<<metadata.indexBBox[0][1]<<","<<metadata.indexBBox[0][2]<<"],max]["<<metadata.indexBBox[1][0]<<","<<metadata.indexBBox[1][1]<<","<<metadata.indexBBox[1][2]<<"]]";

	std::vector<char> cpugrid;
	cpugrid.resize(metadata.gridSize);
	f.read(cpugrid.data(), metadata.gridSize);
	m_volume.nanovdb_grid.enlarge(metadata.gridSize);
	m_volume.nanovdb_grid.copy_from_host(cpugrid);
	const nanovdb::FloatGrid* grid = reinterpret_cast<const nanovdb::FloatGrid*>(cpugrid.data());

	float mn=1e10f,mx=-1e10f;
	bool hmm = grid->hasMinMax();
	//grid->tree().extrema(mn,mx);
	int xsize = std::max(1,metadata.indexBBox[1][0]-metadata.indexBBox[0][0]);
	int ysize = std::max(1,metadata.indexBBox[1][1]-metadata.indexBBox[0][1]);
	int zsize = std::max(1,metadata.indexBBox[1][2]-metadata.indexBBox[0][2]);
	float maxsize=std::max(std::max(xsize,ysize),zsize);
	float scale = 1.f/maxsize;
	m_aabb = m_render_aabb = BoundingBox{
	Vector3f{0.5f-xsizescale0.5f,0.5f-ysizescale0.5f,0.5f-zsizescale0.5f},
	Vector3f{0.5f+xsizescale0.5f,0.5f+ysizescale0.5f,0.5f+zsizescale0.5f}
	};
	m_volume.world2index_scale = maxsize;
	m_volume.world2index_offset= Vector3f{(metadata.indexBBox[0][0]+metadata.indexBBox[1][0])0.5f-0.5fmaxsize,(metadata.indexBBox[0][1]+metadata.indexBBox[1][1])0.5f-0.5fmaxsize,(metadata.indexBBox[0][2]+metadata.indexBBox[1][2])0.5f-0.5fmaxsize};

	auto acc = grid->tree().getAccessor();
	std::vector<uint8_t> bitgrid;
	bitgrid.resize(128128128/8);
	for (int i=metadata.indexBBox[0][0];i<metadata.indexBBox[1][0];++i)
	for (int j=metadata.indexBBox[0][1];j<metadata.indexBBox[1][1];++j)
	for (int k=metadata.indexBBox[0][2];k<metadata.indexBBox[1][2];++k) {
	float d = acc.getValue({i,j,k});
	if (d>mx) mx=d;
	if (d<mn) mn=d;
	if (d>0.001f) {
	float fx=((i+0.5f)-m_volume.world2index_offset.x())/m_volume.world2index_scale;
	float fy=((j+0.5f)-m_volume.world2index_offset.y())/m_volume.world2index_scale;
	float fz=((k+0.5f)-m_volume.world2index_offset.z())/m_volume.world2index_scale;
	uint32_t bitidx = tcnn::morton3D(int(fx128.f+0.5f),int(fy128.f+0.5f),int(fz*128.f+0.5f));
	if (bitidx<128128128)
	bitgrid[bitidx/8]\|=1<<(bitidx&7);
	}
	}
	m_volume.bitgrid.enlarge(bitgrid.size());
	m_volume.bitgrid.copy_from_host(bitgrid);
	tlog::info() << "nanovdb extrema: " << mn << " " << mx << " (" << hmm << ")";;
	m_volume.global_majorant = mx;
	}

	NGP_NAMESPACE_END