VieNeu-TTS-0.3B

Sleeping

VieNeu-TTS-0.3B / examples /encode_ref_audio.py

Upload 11 files

a738a55 verified 25 days ago

1.38 kB

	import torch
	from librosa import load
	from neucodec import NeuCodec

	def main(ref_audio_path, output_path="output.pt"):
	print("Encoding reference audio")

	# Make sure output path ends with .pt
	if not output_path.endswith(".pt"):
	print("Output path should end with .pt to save the codes.")
	return

	# Initialize codec
	codec = NeuCodec.from_pretrained("neuphonic/neucodec")
	codec.eval().to("cpu")

	# Load and encode reference audio
	wav, _ = load(ref_audio_path, sr=16000, mono=True) # load as 16kHz
	wav_tensor = torch.from_numpy(wav).float().unsqueeze(0).unsqueeze(0) # [1, 1, T]
	ref_codes = codec.encode_code(audio_or_path=wav_tensor).squeeze(0).squeeze(0)

	# Save the codes
	torch.save(ref_codes, output_path)


	if __name__ == "__main__":
	import argparse

	parser = argparse.ArgumentParser(description="NeuTTSAir Reference Encoding Example")
	parser.add_argument(
	"--ref_audio", type=str, default="./sample/Vĩnh (nam miền Nam).wav", help="Path to reference audio"
	)
	parser.add_argument(
	"--output_path",
	type=str,
	default="encoded_reference.pt",
	help="Path to save the output codes",
	)
	args = parser.parse_args()
	main(
	ref_audio_path=args.ref_audio,
	output_path=args.output_path,
	)