FluidInference
/

qwen3-asr-0.6b-coreml

Automatic Speech Recognition

speech-recognition

Model card Files Files and versions

alexwengg commited on Feb 8

Commit

ee0604f

·

verified ·

1 Parent(s): 529b2fa

Update README.md

Files changed (1) hide show

README.md +4 -15

README.md CHANGED Viewed

@@ -62,7 +62,7 @@ on-device speech recognition on Apple platforms (iOS/macOS).
 ## Usage with FluidAudio
-```swift
 import FluidAudio
 let manager = Qwen3AsrManager()
@@ -75,6 +75,8 @@ let transcript = try await manager.transcribe(
     maxNewTokens: 512
 )
 print(transcript)
 Model Architecture
@@ -82,19 +84,6 @@ Model Architecture
 - Decoder: 28-layer transformer decoder with 1024 hidden size
 - Tokenizer: Qwen tokenizer with special ASR tokens
-Files
-f32/
-├── AudioEncoder.mlpackage
-├── TextDecoder.mlpackage
-├── config.json
-└── tokenizer.json
-int8/
-├── AudioEncoder.mlpackage
-├── TextDecoder.mlpackage
-├── config.json
-└── tokenizer.json
 License
@@ -114,7 +103,7 @@ Citation
   journal={arXiv preprint arXiv:2601.21337},
   year={2025}
 }
 For the HuggingFace metadata UI, fill in:
 - **License**: Apache 2.0
 - **Base model**: Qwen/Qwen3-ASR-0.6B

 ## Usage with FluidAudio
+```
 import FluidAudio
 let manager = Qwen3AsrManager()
     maxNewTokens: 512
 )
 print(transcript)
+```
 Model Architecture
 - Decoder: 28-layer transformer decoder with 1024 hidden size
 - Tokenizer: Qwen tokenizer with special ASR tokens
 License
   journal={arXiv preprint arXiv:2601.21337},
   year={2025}
 }
 For the HuggingFace metadata UI, fill in:
 - **License**: Apache 2.0
 - **Base model**: Qwen/Qwen3-ASR-0.6B