respark / trained_210k_steps /BATCH_INFERENCE_README.md
yueyulin's picture
Upload folder using huggingface_hub
a928261 verified

批量推理功能说明

本文档介绍了 ReSpark TTS 模型的批量推理功能,该功能可以显著提高多个文本的语音合成效率。

使用方法

基本批量推理

from utilities import generate_embeddings_batch
from tts_batch_infer import generate_speech_batch

# 准备文本列表
texts = [
    "第一个要合成的文本。",
    "第二个要合成的文本。",
    "第三个要合成的文本。"
]

# 批量生成语音
wavs = generate_speech_batch(
    model, tokenizer, texts, audio_tokenizer,
    prompt_text="提示文本",
    prompt_audio=prompt_audio,
    device=device
)

# 保存音频文件
for i, wav in enumerate(wavs):
    sf.write(f'output_{i}.wav', wav, sample_rate)