melo_mai_saya
ํ๊ตญ์ด TTS์ฉ์ผ๋ก ํ์ตํ MeloTTS ๊ธฐ๋ฐ ๋ชจ๋ธ์ ๋๋ค.
๊ธฐ์กด MeloTTS ํ์ดํ๋ผ์ธ์ ์ปค์คํฐ๋ง์ด์ฆํ๊ณ onnx ๋ณํ์ ์ถ๊ฐํ์ต๋๋ค.
ํ์ฌ ๋ฆฌํฌ์งํ ๋ฆฌ์๋ ์ธ ๊ฐ์ง ํ์ ๋ชจ๋ธ์ด ์์ผ๋ฉฐ,
๊ทธ์ค ํ๋๋ ๋ฐ์ดํฐ์
์ผ๋ก simon3000/genshin-voice๋ฅผ ์ฌ์ฉํ์ต๋๋ค.
๋๋จธ์ง ๋ ๊ฐ๋ voice conversion์ผ๋ก ๋ง๋ ๊ณ ์ ๋ฐ์ดํฐ์
์ผ๋ก ํ๋ จ๋์์ต๋๋ค.
์์ธํ ์ฌ์ฉ๋ฒ์ ๋ฆฌํฌ์งํ ๋ฆฌ๋ฅผ ์ฐธ๊ณ ํ์ธ์.
Sample
voice conversion์ผ๋ก ๋ง๋ ๋ชจ๋ธ์ ์ํ์ ๋๋ค.
Model Details
- Base repository:
myshell-ai/MeloTTS - Language: Korean (
ko) - BERT frontend:
{BERT_MODEL_ID}(์:kykim/bert-kor-base) - Author: ์ํธ์ฑ (GitHub:
hobi2k, Hugging Face:ahnhs2k) - Project repo: https://github.com/hobi2k/Kor_Voice_Lab
Training Data
๋ฐ์ดํฐ๋ ์๋ ํ์์ filelist/metadata๋ฅผ ์ฌ์ฉํ์ต๋๋ค.
wav_path|speaker_name|language_code|text
์ ์ฒ๋ฆฌ ์ ์ฑ ์์:
- ํ๊ตญ์ด ํ ์คํธ ํํฐ๋ง
- ํน์ ๊ธฐํธ/๋ฉํ ํ๊ทธ ์ ๊ฑฐ
- ์ค๋์ค ๋ฆฌ์ํ๋ง ๋ฐ ํฌ๋งท ์ ๊ทํ
Training Procedure
- Framework: PyTorch
- Training entry:
torchrun -m melo.train - ์ฃผ์ ์ค์ :
{CONFIG_PATH_OR_SUMMARY} - Checkpoints:
G_*.pth(generator)D_*.pth(discriminator)DUR_*.pth(duration discriminator)
ONNX Export (Optional)
Kor_Voice_Lab์์๋ ONNX ๋ชจ๋ธ์ ๋ณ๋๋ก ์ด์ํ ์ ์์ต๋๋ค.
- BERT ONNX
- TTS ONNX
๊ด๋ จ ์คํฌ๋ฆฝํธ:
scripts/bert_onnx_converter.pyscripts/onnx_converter.pyscripts/infer_onnx.pytts_runtime/infer_onnx.py
Inference
PyTorch ์ถ๋ก
uv run python -m melo.infer \
-t "์๋
ํ์ธ์. ํ
์คํธ ๋ฌธ์ฅ์
๋๋ค." \
-m {G_CHECKPOINT_PATH} \
-l KR \
-o {OUT_DIR}
ONNX ์ถ๋ก
uv run python scripts/infer_onnx.py \
--onnx {TTS_ONNX_PATH} \
--bert {BERT_ONNX_PATH} \
--config {CONFIG_PATH} \
--text "์๋
ํ์ธ์. ONNX ์ถ๋ก ํ
์คํธ์
๋๋ค." \
--speaker 0 \
--lang KR \
--device cpu \
--out out.wav
Limitations
- ๋ฐ์ดํฐ์ ๋๋ฉ์ธ/ํ์ ํธํฅ์ด ์์๊ณผ ๋ฐ์ ํ์ง์ ์ํฅ์ ์ค ์ ์์ต๋๋ค.
- ์ซ์/์ธ๋์ด/ํน์๊ธฐํธ๊ฐ ๋ง์ ๋ฌธ์ฅ์์ ๋ฐ์ ์ค๋ฅ๊ฐ ๋ฐ์ํ ์ ์์ต๋๋ค.
- ONNX ํ์ง์ ๋ณํ ์ต์ (opset, dynamic shape, ์ ๋ฐ๋)์ ๋ฏผ๊ฐํฉ๋๋ค.
Citation
@misc{kor_voice_lab,
title = {Kor Voice Lab: Korean ASR-TTS Training, ONNX Conversion, and Runtime Pipeline},
author = {์ํธ์ฑ (GitHub: hobi2k)},
year = {2026},
url = {https://github.com/hobi2k/Kor_Voice_Lab},
note = {MeloTTS ๊ธฐ๋ฐ ํ๊ตญ์ด ํ์ฅ ๋ฐ ONNX ๋ฐํ์ ๊ฐ์ }
}
Acknowledgements
- MeloTTS: https://github.com/myshell-ai/MeloTTS
- faster-whisper: https://github.com/SYSTRAN/faster-whisper
kykim/bert-kor-base: https://huggingface.co/kykim/bert-kor-base- ONNX Runtime: https://onnxruntime.ai/
Model tree for ahnhs2k/melo_mai_saya
Base model
myshell-ai/MeloTTS-KoreanDataset used to train ahnhs2k/melo_mai_saya
Collection including ahnhs2k/melo_mai_saya
Collection
2 items โข Updated
โข 1