--- license: mit --- # SileroVAD 流式语音端点识别 ## 安装依赖 ``` sudo apt install libsndfile1 pip install -r requirements.txt ``` ## Demo ### CLI ``` python main.py --input demo.wav --output_dir output --model silero_vad.onnx ``` 被分段的语音后保存在output目录中 ### Gradio ``` pip install gradio python gradio_app.py ``` ![gradio界面](/gradio.png) ## 在项目中使用 1. 复制StreamVAD.py 到项目中 2. from StreamVAD import StreamVAD 3. 初始化 ``` vad = StreamVAD(args.backend, sensitivity=0.5, silence_ms=200) ``` 运行 ``` for result in vad.run(audio, vad.model.sr): if result: print(result) ``` result的格式为: ``` { 'start_ts': 语音开始的时间 'end_ts': 语音结束的时间 'audio': 语音数据 } ``` 时间戳的格式可通过StreamVAD.datetime_format设置