Spaces:

VAST-AI
/

AniGen

Running on Zero

File size: 8,056 Bytes

6b92ff7

import cv2
import numpy as np

import torch

from matplotlib import cm
import matplotlib.pyplot as plt

import logging
logger = logging.getLogger('root')

from utils.utils import compute_normal_error


def tensor_to_numpy(tensor_in):
    """ torch tensor to numpy array
    """
    if tensor_in is not None:
        if tensor_in.ndim == 3:
            # (C, H, W) -> (H, W, C)
            tensor_in = tensor_in.detach().cpu().permute(1, 2, 0).numpy()
        elif tensor_in.ndim == 4:
            # (B, C, H, W) -> (B, H, W, C)
            tensor_in = tensor_in.detach().cpu().permute(0, 2, 3, 1).numpy()
        else:
            raise Exception('invalid tensor size')
    return tensor_in


def unnormalize(img_in, img_stats={'mean': [0.485, 0.456, 0.406], 
                                    'std': [0.229, 0.224, 0.225]}):
    """ unnormalize input image
    """
    if torch.is_tensor(img_in):
        img_in = tensor_to_numpy(img_in)

    img_out = np.zeros_like(img_in)
    for ich in range(3):
        img_out[..., ich] = img_in[..., ich] * img_stats['std'][ich]
        img_out[..., ich] += img_stats['mean'][ich]
    img_out = (img_out * 255.0).astype(np.uint8)
    return img_out


def normal_to_rgb(normal, normal_mask=None):
    """ surface normal map to RGB
        (used for visualization)

        NOTE: x, y, z are mapped to R, G, B
        NOTE: [-1, 1] are mapped to [0, 255]
    """
    if torch.is_tensor(normal):
        normal = tensor_to_numpy(normal)
        normal_mask = tensor_to_numpy(normal_mask)

    normal_norm = np.linalg.norm(normal, axis=-1, keepdims=True)
    normal_norm[normal_norm < 1e-12] = 1e-12
    normal = normal / normal_norm

    normal_rgb = (((normal + 1) * 0.5) * 255).astype(np.uint8)
    if normal_mask is not None:
        normal_rgb = normal_rgb * normal_mask     # (B, H, W, 3)
    return normal_rgb


def normal_to_uint8(normal, valid_mask):
    """ surface normal map to uint8
        (used to generate ground truth)

        NOTE: normal should be pre-normalized
    """
    if torch.is_tensor(normal):
        normal = tensor_to_numpy(normal)
        valid_mask = tensor_to_numpy(valid_mask)

    norm_uint8 = ((normal + 1) * 0.5) * 255
    assert np.min(norm_uint8) >= 0 
    assert np.max(norm_uint8) <= 255
    norm_uint8 = np.rint(norm_uint8).astype(np.uint8)
    norm_uint8 = norm_uint8 * valid_mask
    return norm_uint8


def normal_to_uint16(normal, valid_mask):
    """ surface normal map to uint16
        (used to generate ground truth)

        NOTE: normal should be pre-normalized
    """
    if torch.is_tensor(normal):
        normal = tensor_to_numpy(normal)
        valid_mask = tensor_to_numpy(valid_mask)

    norm_uint16 = ((normal + 1) * 0.5) * 65535
    assert np.min(norm_uint16) >= 0 
    assert np.max(norm_uint16) <= 65535
    norm_uint16 = np.rint(norm_uint16).astype(np.uint16)
    norm_uint16 = norm_uint16 * valid_mask
    return norm_uint16


def kappa_to_alpha(pred_kappa, to_numpy=True):
    """ Confidence kappa to uncertainty alpha
        Assuming AngMF distribution (introduced in https://arxiv.org/abs/2109.09881)
    """
    if torch.is_tensor(pred_kappa) and to_numpy:
        pred_kappa = tensor_to_numpy(pred_kappa)

    if torch.is_tensor(pred_kappa):
        alpha = ((2 * pred_kappa) / ((pred_kappa ** 2.0) + 1)) \
            + ((torch.exp(- pred_kappa * np.pi) * np.pi) / (1 + torch.exp(- pred_kappa * np.pi)))
        alpha = torch.rad2deg(alpha)
    else:
        alpha = ((2 * pred_kappa) / ((pred_kappa ** 2.0) + 1)) \
                + ((np.exp(- pred_kappa * np.pi) * np.pi) / (1 + np.exp(- pred_kappa * np.pi)))
        alpha = np.degrees(alpha)

    return alpha


def alpha_to_jet(pred_alpha, a_max=60.0):
    """ Uncertainty alpha to JET
        (used for visualization)
    """
    pred_alpha = np.clip(pred_alpha, a_min=0.0, a_max=a_max)
    pred_alpha = ((pred_alpha[0,:,:,:] / 60.0) * 255.0).astype(np.uint8)
    pred_alpha = cv2.applyColorMap(pred_alpha, cv2.COLORMAP_JET)
    return pred_alpha


def depth_to_rgb(depth, depth_mask=None, d_min=None, d_max=None, colormap='jet'):
    """ Convert depth map, or any 1D map to RGB using colormap
    """
    assert depth.ndim == 3
    if torch.is_tensor(depth):
        depth = tensor_to_numpy(depth)
        depth_mask = tensor_to_numpy(depth_mask)

    if d_min is not None:
        depth[depth < d_min] = d_min
    else:
        d_min = np.min(depth)

    if d_max is not None:
        depth[depth > d_max] = d_max
    else:
        d_max = np.max(depth)
    
    depth = (depth - d_min) / abs(d_max - d_min)

    if colormap == 'jet':
        depth = (cm.jet(depth[:,:,0]) * 255).astype(np.uint8)
        depth = depth[:,:,:3]
    elif colormap == 'gray':
        depth = (cm.gray(depth[:,:,0]) * 255).astype(np.uint8)
        depth = depth[:,:,:3]
    if depth_mask is not None:
        depth = depth * depth_mask

    return depth


def visualize_normal(target_dir, prefixs, img, pred_norm, pred_kappa,
                        gt_norm, gt_norm_mask, pred_error, num_vis=-1):
    """ visualize normal
    """
    error_max = 60.0

    img = tensor_to_numpy(img)                      # (B, H, W, 3)
    pred_norm = tensor_to_numpy(pred_norm)          # (B, H, W, 3)
    pred_kappa = tensor_to_numpy(pred_kappa)        # (B, H, W, 1)
    gt_norm = tensor_to_numpy(gt_norm)              # (B, H, W, 3)
    gt_norm_mask = tensor_to_numpy(gt_norm_mask)    # (B, H, W, 1)
    pred_error = tensor_to_numpy(pred_error)        # (B, H, W, 1)

    num_vis = len(prefixs) if num_vis == -1 else num_vis
    for i in range(num_vis):
        # img
        img_ = unnormalize(img[i, ...])
        target_path = '%s/%s_img.png' % (target_dir, prefixs[i])
        plt.imsave(target_path, img_)

        # pred_norm 
        target_path = '%s/%s_norm.png' % (target_dir, prefixs[i])
        plt.imsave(target_path, normal_to_rgb(pred_norm[i, ...]))

        # pred_kappa
        if pred_kappa is not None:
            pred_alpha = kappa_to_alpha(pred_kappa[i, :, :, 0])
            target_path = '%s/%s_pred_alpha.png' % (target_dir, prefixs[i])
            plt.imsave(target_path, pred_alpha, vmin=0.0, vmax=error_max, cmap='jet')

        # gt_norm, pred_error
        if gt_norm is not None:
            target_path = '%s/%s_gt.png' % (target_dir, prefixs[i])
            plt.imsave(target_path, normal_to_rgb(gt_norm[i, ...], gt_norm_mask[i, ...]))

            E = pred_error[i, :, :, 0] * gt_norm_mask[i, :, :, 0]
            target_path = '%s/%s_pred_error.png' % (target_dir, prefixs[i])
            plt.imsave(target_path, E, vmin=0, vmax=error_max, cmap='jet')


def visualize_normal_tb(args, img, norm_out, gt_norm, gt_norm_mask):
    """ visualize normal (tensorboard logging)
    """
    pred_norm = norm_out[:, :3, :, :]
    pred_kappa = norm_out[:, 3:, :, :] if args.NNET_output_dim == 4 else None
    pred_error = compute_normal_error(pred_norm, gt_norm)
    error_max = 60.0

    img = tensor_to_numpy(img)                      # (B, H, W, 3)
    pred_norm = tensor_to_numpy(pred_norm)          # (B, H, W, 3)
    pred_kappa = tensor_to_numpy(pred_kappa)        # (B, H, W, 1)
    gt_norm = tensor_to_numpy(gt_norm)              # (B, H, W, 3)
    gt_norm_mask = tensor_to_numpy(gt_norm_mask)    # (B, H, W, 1)
    pred_error = tensor_to_numpy(pred_error)        # (B, H, W, 1)

    # visualize
    vis_list = []
    vis_list.append(unnormalize(img[0, ...]))
    vis_list.append(normal_to_rgb(pred_norm[0, ...]))
    if pred_kappa is not None:
        if 'NLL_angmf' in args.loss_fn:
            vis_list.append(depth_to_rgb(kappa_to_alpha(pred_kappa[0, ...]), None, d_min=0.0, d_max=error_max))
        else:
            vis_list.append(depth_to_rgb(pred_kappa[0, ...], None, d_min=0.0, d_max=None, colormap='gray'))
    if gt_norm is not None:
        vis_list.append(normal_to_rgb(gt_norm[0, ...], gt_norm_mask[0, ...]))
        vis_list.append(depth_to_rgb(pred_error[0, ...], gt_norm_mask[0, ...], d_min=0.0, d_max=error_max))

    return np.hstack(vis_list).astype(np.uint8)