Whisper Medium Korean (Zeroth fine-tune) โ MLX 4bit
ํ๊ตญ์ด ์์ฑ ์ธ์์ ์ํ Whisper Medium fine-tune ๋ชจ๋ธ์ Apple MLX ํ๋ ์์ํฌ์ฉ์ผ๋ก 4bit ์์ํํ ๋ฒ์ ์ ๋๋ค.
์๋ณธ: seastar105/whisper-medium-ko-zeroth (Whisper Medium์ Zeroth Korean ๋ฐ์ดํฐ์
์ผ๋ก fine-tune)
์์ฝ
- ๋ฒ ์ด์ค: Whisper Medium (769M ํ๋ผ๋ฏธํฐ)
- Fine-tune: Zeroth Korean ASR corpus
- ์์ํ: 4bit (group size 64),
mlx-examples/whisper/convert.py์ฌ์ฉ - ๋์คํฌ ํฌ๊ธฐ: 831 MB (์๋ณธ fp16 2.8GB ๋๋น ์ฝ 70% ๊ฐ์)
- ์ถ๋ก RAM: ~1.26 GB
- ํ๋ ์์ํฌ: Apple MLX (Apple Silicon ์ ์ฉ)
ํ๊ตญ์ด ์ฑ๋ฅ (Zeroth Korean test split)
| ์งํ | ๊ฐ |
|---|---|
| CER | 1.25% |
| WER | 3.21% |
| RTF | 0.055 (M3 16GB ๊ธฐ์ค) |
์๋ณธ fp16 ๋ชจ๋ธ๊ณผ ๊ฑฐ์ ๋์ผํ ์ ํ๋๋ฅผ ์ ์งํ๋ฉด์ ํฌ๊ธฐ์ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ํฌ๊ฒ ์ค์์ต๋๋ค.
์ฌ์ฉ๋ฒ
1) mlx-whisper ์ง์ ํธ์ถ
pip install mlx-whisper
import mlx_whisper
result = mlx_whisper.transcribe(
"audio.wav",
path_or_hf_repo="youngouk/seastar-medium-ko-4bit-mlx",
language="ko",
word_timestamps=True,
)
print(result["text"])
2) meeting-transcriber ์ฑ์์ ์ฌ์ฉ
meeting-transcriber๋ ์ด ๋ชจ๋ธ์ ๊ธฐ๋ณธ ์ ํ์ง๋ก ์ ๊ณตํ๋ macOS ๋ก์ปฌ ํ์ ์ ์ฌ ์ฑ์ ๋๋ค.
์น UI์์ ์ค์ โ ์์ฑ ์ธ์ ๋ชจ๋ธ (STT) โ seastar medium-ko-zeroth (4bit)๋ฅผ ์ ํํ๋ฉด ์๋ ๋ค์ด๋ก๋ ๋ฐ ํ์ฑํ๋ฉ๋๋ค.
ํ์ผ ๊ตฌ์ฑ
config.json # MLX Whisper ๋ชจ๋ธ ์ค์ (์์ํ ํ๋ผ๋ฏธํฐ ํฌํจ)
weights.safetensors # 4bit ์์ํ๋ ๊ฐ์ค์น (~415MB)
mlx-whisper ๋ฐํ์์ด ์ ๋ ํ์ผ์ path_or_hf_repo= ์ธ์๋ก ๋ฐ๋ก ๋ก๋ํฉ๋๋ค. ํ ํฌ๋์ด์ ๋ mlx-whisper๊ฐ ๋ด์ฅํ multilingual vocab์ ์ฌ์ฉํ๋ฏ๋ก ๋ณ๋ ํ์ผ ๋ถํ์.
์์ํ ํ๋ผ๋ฏธํฐ
{
"quantization": {
"bits": 4,
"group_size": 64
}
}
์ฌํ ์ปค๋งจ๋:
python mlx-examples/whisper/convert.py \
--torch-name-or-path seastar105/whisper-medium-ko-zeroth \
--mlx-path ./seastar-medium-ko-4bit \
-q --q-bits 4 --q-group-size 64
๋ผ์ด์ ์ค
Apache License 2.0 โ ์๋ณธ ๋ผ์ด์ ์ค๋ฅผ ๊ทธ๋๋ก ์น๊ณํฉ๋๋ค.
์ ํ ์ฌํญ
- Apple Silicon ์ ์ฉ: MLX ํ๋ ์์ํฌ๋ x86 CPU / CUDA์์ ๋์ํ์ง ์์ต๋๋ค. Intel Mac / Linux / Windows ์ฌ์ฉ์๋ ์๋ณธ seastar105/whisper-medium-ko-zeroth๋ฅผ ์ฌ์ฉํ์ธ์.
- ํ๊ตญ์ด ํนํ: Zeroth Korean ๋ฐ์ดํฐ์ ์ผ๋ก fine-tune๋์ด ํ๊ตญ์ด ์ธ ์ธ์ด ์ฑ๋ฅ์ ๋ฒ ์ด์ค Whisper Medium๋ณด๋ค ๋ฎ์ ์ ์์ต๋๋ค.
- 4bit ์์ํ ํน์ฑ: ๋งค์ฐ ๋๋ฌผ๊ฒ ํฌ๊ท ์ดํ์์ ์๋ณธ fp16๋ณด๋ค ์ฝ๊ฐ ๋ฎ์ ์ ํ๋๋ฅผ ๋ณด์ผ ์ ์์ต๋๋ค (์ธก์ ๋ CER/WER ์ฐจ์ด๋ ๋ฌด์ ๊ฐ๋ฅํ ์์ค).
์ถ์ฒ ยท ์ธ์ฉ
- ์๋ณธ Whisper: OpenAI
- ํ๊ตญ์ด fine-tune: seastar105/whisper-medium-ko-zeroth
- ์์ํ ๋๊ตฌ: mlx-examples/whisper
- ์ฌ๋ฐฐํฌ: youngouk for meeting-transcriber
- Downloads last month
- 62
Quantized
Model tree for youngouk/seastar-medium-ko-4bit-mlx
Base model
seastar105/whisper-medium-ko-zeroth