File size: 755 Bytes
c52df1b | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 | ## 代码
https://github.com/XiaoshanHsj/speechllm/tree/multispk_lingmeng
看代码的README_lingmeng.md
## 数据:
英文部分: `./data/Whisper-Sidecar-data-metadata/data_for_wavllm`
德文相关: `./data/de-en-mix`
targetASR (target-talker ASR)用到的reference audio: `./data/reference_enroll_audio/all`
英文部分只有metadata,可以从librispeech生成。德文部分还备份了测试集音频。
## 模型:
tokenizer: `./llama_model/llama/tokenizer.model`
llama-2-chat: `./llama_model/llama-2-7b-chat/consolidated.00.pth`
训练好的MT-LLM模型目录: `./lingmeng_multispk_multitask_retrain_speechllm_v0.1_llama2_chat_wavlm_weighted_update_lora_32_32_prompt_build_multispk_multitask_de.yaml_16gpu_1accum`
|