批量推理功能说明
本文档介绍了 ReSpark TTS 模型的批量推理功能,该功能可以显著提高多个文本的语音合成效率。
使用方法
基本批量推理
from utilities import generate_embeddings_batch
from tts_batch_infer import generate_speech_batch
# 准备文本列表
texts = [
"第一个要合成的文本。",
"第二个要合成的文本。",
"第三个要合成的文本。"
]
# 批量生成语音
wavs = generate_speech_batch(
model, tokenizer, texts, audio_tokenizer,
prompt_text="提示文本",
prompt_audio=prompt_audio,
device=device
)
# 保存音频文件
for i, wav in enumerate(wavs):
sf.write(f'output_{i}.wav', wav, sample_rate)