SileroVAD / README.md
inoryQwQ's picture
moved silero to pypi
872019a
---
license: mit
---
# SileroVAD
流式语音端点识别
## 安装依赖
```
sudo apt install libsndfile1
pip install -r requirements.txt
```
## Demo
### CLI
```
python main.py --input demo.wav --output_dir output --model silero_vad.onnx
```
被分段的语音后保存在output目录中
### Gradio
```
pip install gradio
python gradio_app.py
```
![gradio界面](/gradio.png)
## 在项目中使用
1. 复制StreamVAD.py 到项目中
2. from StreamVAD import StreamVAD
3.
初始化
```
vad = StreamVAD(args.backend,
sensitivity=0.5,
silence_ms=200)
```
运行
```
for result in vad.run(audio, vad.model.sr):
if result:
print(result)
```
result的格式为:
```
{
'start_ts': 语音开始的时间
'end_ts': 语音结束的时间
'audio': 语音数据
}
```
时间戳的格式可通过StreamVAD.datetime_format设置