parakeet-rnnt-0.6b — GGUF

GGUF conversions of nvidia/parakeet-rnnt-0.6b for use with CrispASR.

Files

File	Size	Quantization
`parakeet-rnnt-0.6b-q4_k.gguf`	~447 MB	Q4_K (recommended)
`parakeet-rnnt-0.6b-f16.gguf`	~1.2 GB	F16 (full precision)

crispasr --backend parakeet \
  -m parakeet-rnnt-0.6b-q4_k.gguf \
  -f audio.wav

Or let CrispASR auto-download:

crispasr --backend parakeet-rnnt-0.6b -f audio.wav

The RNNT decoder is auto-detected at runtime via n_tdt_durations==0.

nvidia/parakeet-rnnt-0.6b is released under the CC BY 4.0 license.

GGUF

Model size

0.6B params

Architecture

parakeet

Hardware compatibility

16-bit

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Base model

Quantized

(8)

this model