AXERA-TECH
/

SileroVAD

Model card Files Files and versions

SileroVAD / README.md

inoryQwQ's picture

moved silero to pypi

872019a 28 days ago

|

history blame contribute delete

965 Bytes

	---
	license: mit
	---
	# SileroVAD

	流式语音端点识别


	## 安装依赖

	```
	sudo apt install libsndfile1

	pip install -r requirements.txt
	```

	## Demo

	### CLI

	```
	python main.py --input demo.wav --output_dir output --model silero_vad.onnx
	```
	被分段的语音后保存在output目录中


	### Gradio
	```
	pip install gradio

	python gradio_app.py
	```

	![gradio界面](/gradio.png)



	## 在项目中使用

	1. 复制StreamVAD.py 到项目中
	2. from StreamVAD import StreamVAD
	3.
	初始化
	```
	vad = StreamVAD(args.backend,
	sensitivity=0.5,
	silence_ms=200)
	```

	运行
	```
	for result in vad.run(audio, vad.model.sr):
	if result:
	print(result)
	```

	result的格式为:
	```
	{
	'start_ts': 语音开始的时间
	'end_ts': 语音结束的时间
	'audio': 语音数据
	}
	```

	时间戳的格式可通过StreamVAD.datetime_format设置