Parakeet TDT 0.6B v3 — CoreML

CoreML conversion of nvidia/parakeet-tdt-0.6b-v3 for Apple Silicon (ANE + GPU).

Architecture

Split architecture optimized for Apple Neural Engine:

Encoder (encoder.mlmodelc): Conformer encoder compiled for ANE/GPU (~1.18 GB)
Predictor + Joint (predictor_joint.safetensors): LSTM predictor + Joint network as float32 safetensors (~69 MB)

The encoder runs on ANE/GPU via CoreML, while the predictor and joint networks run on CPU via Accelerate for optimal performance.

The encoder supports 4 input duration buckets for optimized ANE scheduling:

~1.2 GB total (vs ~2.3 GB MLX float32)

This model is licensed under CC-BY-4.0. Original model by NVIDIA — attribution required.

See nvidia/parakeet-tdt-0.6b-v3 for the original model.

Converted from nvidia/parakeet-tdt-0.6b-v3 via MLX intermediate format using oriloq-mlx.

Conversion chain: NeMo (.nemo) → MLX (safetensors) → CoreML (.mlmodelc)

Base model

Finetuned

(58)

this model