Upload 331 files

8026e91 over 2 years ago

6 kB

	import torch as t
	import numpy as np
	from jukebox.data.artist_genre_processor import ArtistGenreProcessor
	from jukebox.data.text_processor import TextProcessor

	# Linear window heurisic to get a window of lyric_tokens
	def get_relevant_lyric_tokens(full_tokens, n_tokens, total_length, offset, duration):
	if len(full_tokens) < n_tokens:
	tokens = [0] * (n_tokens - len(full_tokens)) + full_tokens
	indices = [-1] * (n_tokens - len(full_tokens)) + list(range(0, len(full_tokens)))
	else:
	assert 0 <= offset < total_length
	midpoint = int(len(full_tokens) * (offset + duration / 2.0) / total_length)
	midpoint = min(max(midpoint, n_tokens // 2), len(full_tokens) - n_tokens // 2)
	tokens = full_tokens[midpoint - n_tokens // 2:midpoint + n_tokens // 2]
	indices = list(range(midpoint - n_tokens // 2, midpoint + n_tokens // 2))
	assert len(tokens) == n_tokens, f"Expected length {n_tokens}, got {len(tokens)}"
	assert len(indices) == n_tokens, f"Expected length {n_tokens}, got {len(indices)}"
	assert tokens == [full_tokens[index] if index != -1 else 0 for index in indices]
	return tokens, indices

	class EmptyLabeller():
	def get_label(self, artist=None, genre=None, lyrics=None, total_length=None, offset=None):
	y = np.array([], dtype=np.int64)
	info = dict(artist="n/a", genre="n/a", lyrics=[], full_tokens=[])
	return dict(y=y, info=info)

	def get_batch_labels(self, metas, device='cpu'):
	ys, infos = [], []
	for meta in metas:
	label = self.get_label()
	y, info = label['y'], label['info']
	ys.append(y)
	infos.append(info)

	ys = t.stack([t.from_numpy(y) for y in ys], dim=0).to(device).long()
	assert ys.shape[0] == len(metas)
	assert len(infos) == len(metas)
	return dict(y=ys, info=infos)

	class Labeller():
	def __init__(self, max_genre_words, n_tokens, sample_length, v3=False):
	self.ag_processor = ArtistGenreProcessor(v3)
	self.text_processor = TextProcessor(v3)
	self.n_tokens = n_tokens
	self.max_genre_words = max_genre_words
	self.sample_length = sample_length
	self.label_shape = (4 + self.max_genre_words + self.n_tokens, )

	def get_label(self, artist, genre, lyrics, total_length, offset):
	artist_id = self.ag_processor.get_artist_id(artist)
	genre_ids = self.ag_processor.get_genre_ids(genre)

	lyrics = self.text_processor.clean(lyrics)
	full_tokens = self.text_processor.tokenise(lyrics)
	tokens, _ = get_relevant_lyric_tokens(full_tokens, self.n_tokens, total_length, offset, self.sample_length)

	assert len(genre_ids) <= self.max_genre_words
	genre_ids = genre_ids + [-1] * (self.max_genre_words - len(genre_ids))
	y = np.array([total_length, offset, self.sample_length, artist_id, genre_ids, tokens], dtype=np.int64)
	assert y.shape == self.label_shape, f"Expected {self.label_shape}, got {y.shape}"
	info = dict(artist=artist, genre=genre, lyrics=lyrics, full_tokens=full_tokens)
	return dict(y=y, info=info)

	def get_y_from_ids(self, artist_id, genre_ids, lyric_tokens, total_length, offset):
	assert len(genre_ids) <= self.max_genre_words
	genre_ids = genre_ids + [-1] * (self.max_genre_words - len(genre_ids))
	if self.n_tokens > 0:
	assert len(lyric_tokens) == self.n_tokens
	else:
	lyric_tokens = []
	y = np.array([total_length, offset, self.sample_length, artist_id, genre_ids, lyric_tokens], dtype=np.int64)
	assert y.shape == self.label_shape, f"Expected {self.label_shape}, got {y.shape}"
	return y

	def get_batch_labels(self, metas, device='cpu'):
	ys, infos = [], []
	for meta in metas:
	label = self.get_label(**meta)
	y, info = label['y'], label['info']
	ys.append(y)
	infos.append(info)

	ys = t.stack([t.from_numpy(y) for y in ys], dim=0).to(device).long()
	assert ys.shape[0] == len(metas)
	assert len(infos) == len(metas)
	return dict(y=ys, info=infos)

	def set_y_lyric_tokens(self, ys, labels):
	info = labels['info']
	assert ys.shape[0] == len(info)
	if self.n_tokens > 0:
	# total_length, offset, duration):
	tokens_list = []
	indices_list = [] # whats the index of each current character in original array
	for i in range(ys.shape[0]):
	full_tokens = info[i]['full_tokens']
	total_length, offset, duration = ys[i, 0], ys[i, 1], ys[i, 2]
	tokens, indices = get_relevant_lyric_tokens(full_tokens, self.n_tokens, total_length, offset, duration)
	tokens_list.append(tokens)
	indices_list.append(indices)
	ys[:, -self.n_tokens:] = t.tensor(tokens_list, dtype=t.long, device='cuda')
	return indices_list
	else:
	return None

	def describe_label(self, y):
	assert y.shape == self.label_shape, f"Expected {self.label_shape}, got {y.shape}"
	y = np.array(y).tolist()
	total_length, offset, length, artist_id, *genre_ids = y[:4 + self.max_genre_words]
	tokens = y[4 + self.max_genre_words:]
	artist = self.ag_processor.get_artist(artist_id)
	genre = self.ag_processor.get_genre(genre_ids)
	lyrics = self.text_processor.textise(tokens)
	return dict(artist=artist, genre=genre, lyrics=lyrics)


	if __name__ == '__main__':
	labeller = Labeller(5, 512, 819284*4, v3=False)
	label = labeller.get_label("Alan Jackson", "Country Rock", "old town road", 46044100, 0)
	print(label, labeller.describe_label(label['y']))

	labeller = Labeller(1, 384, 614484*4, v3=True)
	label = labeller.get_label("Alan Jackson", "Country Rock", "old town road", 46044100, 0)
	print(label, labeller.describe_label(label['y']))