LingweiMeng
/

speechllm_multispk

Model card Files Files and versions

Metrics Training metrics Community

speechllm_multispk / README.md

Lingwei Meng

add data

c52df1b about 1 year ago

|

history blame contribute delete

755 Bytes

	## 代码
	https://github.com/XiaoshanHsj/speechllm/tree/multispk_lingmeng

	看代码的README_lingmeng.md

	## 数据：
	英文部分: `./data/Whisper-Sidecar-data-metadata/data_for_wavllm`

	德文相关: `./data/de-en-mix`

	targetASR (target-talker ASR)用到的reference audio: `./data/reference_enroll_audio/all`

	英文部分只有metadata，可以从librispeech生成。德文部分还备份了测试集音频。

	## 模型：
	tokenizer: `./llama_model/llama/tokenizer.model`

	llama-2-chat: `./llama_model/llama-2-7b-chat/consolidated.00.pth`

	训练好的MT-LLM模型目录: `./lingmeng_multispk_multitask_retrain_speechllm_v0.1_llama2_chat_wavlm_weighted_update_lora_32_32_prompt_build_multispk_multitask_de.yaml_16gpu_1accum`