openai/whisper-large-v3-turbo
Automatic Speech Recognition • 0.8B • Updated • 6.94M • • 3.12k
Transcribe audio files into text
Note Speech recognition serving sherpa onnx-zipformer-vi-int8 cpu
Transcribe speech from audio files, mic or URL to text
Note gipformer-65M-rnnt
Note Nemotron-3.5-ASR-Streaming-0.6B là 1 model Speech AI mới nhất từ NVIDIA, được thiết kế cho bài toán nhận dạng giọng nói thời gian thực với độ trễ thấp nhưng vẫn đạt chất lượng thuộc nhóm dẫn đầu hiện nay. Các điểm nổi bật: * Chỉ 600 triệu tham số WER 11-13% * Hỗ trợ nhận dạng tiếng Việt 🇻🇳 và nhiều ngôn ngữ khác. * Streaming ASR thời gian thực. * Độ trễ thấp phù hợp cho trợ lý ảo