KevinAHM
/

pocket-tts-onnx

pocket-tts-onnx

Model card Files Files and versions

pocket-tts-onnx / generate.py

Kevin Knoedler

Add v2 bundles

58a6d00 6 days ago

history blame contribute delete

2.09 kB

	#!/usr/bin/env python3
	"""
	Simple example script for Pocket TTS ONNX inference.

	Usage:
	python generate.py "Hello, this is a test." samples/reference.wav output.wav
	python generate.py "Hello world" samples/expresso_02_ex03-ex01_calm_005.wav output.wav
	"""

	import argparse
	import time
	from pocket_tts_onnx import PocketTTSOnnx


	def main():
	parser = argparse.ArgumentParser(description="Generate speech with Pocket TTS ONNX")
	parser.add_argument("text", help="Text to synthesize")
	parser.add_argument("voice", help="Voice name, .safetensors prompt state, or reference audio path")
	parser.add_argument("output", help="Output audio file path")
	parser.add_argument("--language", default="english_2026-04", help="Bundle/language to load")
	parser.add_argument("--models_dir", default="onnx", help="Directory containing ONNX bundles")
	parser.add_argument("--precision", choices=["int8", "fp32"], default="int8",
	help="Model precision (default: int8)")
	parser.add_argument("--temperature", type=float, default=0.7, help="Sampling temperature")
	parser.add_argument("--lsd_steps", type=int, default=1, help="Flow integration steps")
	args = parser.parse_args()

	print(f"Loading models (language={args.language}, precision={args.precision})...")
	t0 = time.time()
	tts = PocketTTSOnnx(
	models_dir=args.models_dir,
	language=args.language,
	precision=args.precision,
	temperature=args.temperature,
	lsd_steps=args.lsd_steps,
	)
	print(f" Loaded in {time.time() - t0:.2f}s")

	print(f"Generating speech...")
	print(f" Text: {args.text}")
	print(f" Voice: {args.voice}")

	t0 = time.time()
	audio = tts.generate(args.text, voice=args.voice)
	gen_time = time.time() - t0

	duration = len(audio) / tts.sample_rate
	rtfx = duration / gen_time

	print(f" Generated {duration:.2f}s audio in {gen_time:.2f}s (RTFx: {rtfx:.2f}x)")

	tts.save_audio(audio, args.output)
	print(f" Saved to: {args.output}")


	if __name__ == "__main__":
	main()