Duplicated from gab-gdp/StableBeaT

bharatverse11
/

BeatGeneration

music-generation

beat-generation

Model card Files Files and versions

BeatGeneration / handler.py

bharatverse11's picture

Create handler.py

5c04df5 verified 2 days ago

history blame contribute delete

1.15 kB

	from stable_audio_tools import get_pretrained_model
	from stable_audio_tools.inference.generation import generate_diffusion_cond
	import torch
	import base64
	import io
	import soundfile as sf

	# Load once (IMPORTANT)
	model, cfg = get_pretrained_model("bharatverse11/BeatGeneration")
	model.eval().to("cuda")

	SAMPLE_RATE = cfg.get("sample_rate", 44100)

	def handler(data):
	inputs = data["inputs"]

	prompt = inputs.get("prompt", "")
	duration = inputs.get("duration", 10)
	steps = inputs.get("steps", 50)
	cfg_scale = inputs.get("cfg_scale", 7)

	conditioning = [{
	"prompt": prompt,
	"seconds_start": 0,
	"seconds_total": duration,
	}]

	with torch.no_grad():
	output = generate_diffusion_cond(
	model,
	steps=steps,
	cfg_scale=cfg_scale,
	conditioning=conditioning,
	sample_size=int(duration * SAMPLE_RATE),
	device="cuda",
	)

	audio = output.cpu().numpy()[0].T

	buffer = io.BytesIO()
	sf.write(buffer, audio, SAMPLE_RATE, format="WAV")

	return {
	"audio": base64.b64encode(buffer.getvalue()).decode()
	}