Quantization Matrix (CoreML)

Fast preview: 10 steps
Balanced: 20 steps
Higher quality: 30 steps

This repository publishes only >=8-bit CoreML artifacts. 4-bit variants are excluded due to quality.

Naming rules

The folder name encodes the intended runtime and quantization approach:

Variant folder	Quantization (by name)	Expected tradeoff	When to use
`coreml`	full precision (mixed)	best quality, larger	baseline quality checks
`coreml_int8`	int8 (all stages)	faster, smaller	general fast inference
`coreml_compressed`	linear8	smallest memory	low-memory devices
`coreml_ios18`	full precision (mlprogram)	best quality on iOS 18	iOS 18+ devices
`coreml_ios18_int8_vocoder_only`	int8 (vocoder only)	balanced	iOS 18+ with minimal quality loss
`coreml_ios18_int8_both`	int8 (multiple stages)	faster, more loss	iOS 18+ when latency matters
`coreml_compressed_ios18`	linear8 (subset)	smallest memory	iOS 18+ with tight memory

The steps parameter controls the denoiser iterations:

Recommended starting points:

The following are intentionally not published: