Spaces:

huaweilin
/

VTBench

Running

App Files Files Community

VTBench / src /vqvaes /maskbit /modules /masking.py

huaweilin

update

14ce5a9 7 months ago

raw

history blame contribute delete

2.32 kB

	"""This file contains the definition of utility functions for masking."""

	import math
	from typing import Text, Tuple
	import torch


	def get_mask_tokens(
	tokens: torch.Tensor,
	mask_token: int,
	mode: Text = "arccos",
	min_masking_ratio: float = 0.0,
	) -> Tuple[torch.Tensor, torch.Tensor]:
	"""Get the masked tokens.
	Args:
	tokens -> torch.Tensor: The input tokens.
	mask_token -> int: The special `mask` token.
	mode -> Text: The masking function to use (default: "arccos").
	Returns:
	masked_tokens -> torch.Tensor: The masked input tokens. Each masked token is set to mask_token.
	mask -> torch.Tensor: A boolean tensor mask indicating which tokens are masked.
	"""
	r = torch.rand(tokens.size(0)) * (1 - min_masking_ratio)
	if mode == "linear":
	val_to_mask = 1 - r
	elif mode == "square":
	val_to_mask = 1 - (r**2)
	elif mode == "cosine":
	val_to_mask = torch.cos(r * math.pi * 0.5)
	elif mode == "arccos":
	val_to_mask = torch.acos(r) / (math.pi * 0.5)
	else:
	raise ValueError(
	"Invalid mode. Choose between 'linear','square', 'cosine', 'arccos'."
	)

	masked_tokens = tokens.detach().clone()
	mask = torch.rand(tokens.size()) < val_to_mask.view(-1, 1, 1)

	masked_tokens[mask] = torch.full_like(masked_tokens[mask], mask_token)
	return masked_tokens, mask


	def get_masking_ratio(progress: float, mode: Text = "arccos") -> torch.Tensor:
	"""Get masking ratio.
	Args:
	progress -> float: The percentage of iterations already done.
	mode -> Text: The masking function to use (default: "arccos").

	Returns:
	val_to_mask -> torch.Tensor: The masking ratio.
	"""
	r = torch.tensor(progress)
	if mode == "root":
	val_to_mask = 1 - (r**0.5)
	elif mode == "square":
	val_to_mask = 1 - (r**2)
	elif mode == "cosine":
	val_to_mask = torch.cos(r * math.pi * 0.5)
	elif mode == "arccos":
	val_to_mask = torch.acos(r) / (math.pi * 0.5)
	elif mode == "linear":
	val_to_mask = 1 - r
	else:
	raise ValueError(
	"Invalid mode. Choose between 'linear','square', 'cosine', 'arccos', 'root'."
	)

	val_to_mask = torch.clamp(val_to_mask, 1e-6, 1.0)
	return val_to_mask