Qwen3-TTS — CoreML

CoreML conversion of Qwen/Qwen3-TTS-0.6B for Apple Neural Engine acceleration. Includes the codec LM, Mimi decoder, and code embedder as separate CoreML models.

Models

Model	Description
`CodeDecoder.mlmodelc`	Mimi audio codec decoder
`CodeEmbedder.mlmodelc`	Token embedding layer
Additional `.mlmodelc`	Transformer layers for the codec LM

Usage

Used by speech-swift Qwen3TTSCoreML module:

let model = try await Qwen3TTSCoreMLModel.fromPretrained()
let audio = model.synthesize(text: "Hello world", language: "english")

Guide: soniqo.audio/guides/speak
Docs: soniqo.audio
GitHub: soniqo/speech-swift

Downloads last month: 378

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Collection including aufklarer/Qwen3-TTS-CoreML

CoreML Speech Models

Collection

Speech AI models for Apple Neural Engine via CoreML. iOS/macOS ready. ASR, TTS, VAD, diarization. • 35 items • Updated about 1 hour ago • 4