File size: 1,737 Bytes
96b479b 32d1953 91e7ece 7bc69a9 91e7ece 7bc69a9 91e7ece 7bc69a9 91e7ece 7bc69a9 91e7ece 7bc69a9 91e7ece 7bc69a9 91e7ece |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 |
---
license: other
license_name: other
license_link: LICENSE
---
音声合成モデル Pheme (https://github.com/PolyAI-LDN/pheme) の日本語版です。
本モデルは、本リポジトリは、「ローカル LLM に向き合う会」と「メタデータラボ株式会社」の共催で開催された、[LOCAL AI HACKATHON#000](https://imminent-land-e64.notion.site/LOCAL-AI-HACKATHON-b8045ad0a99d40aaaa8591e41c5a6660) の成果物です。
Pheme (large) の公式チェックポイントをベースに、日本語で追加学習しています。
事前学習に、
・[ReazonSpeech コーパスv1](https://huggingface.co/datasets/reazon-research/reazonspeech)
・[青空文庫振り仮名注釈付き音声コーパス](https://github.com/ndl-lab/hurigana-speech-corpus-aozora)
を利用し、続いて、
・[みんなで作るJSUTコーパスbasic5000](https://tyc.rei-yumesaki.net/material/minnade-jsut/)
・[ルナイトネイルさんの ITA コーパス読み上げ音源](https://runaitoneiru.fanbox.cc/posts/3786422)
・[黄琴海月さんの ITA コーパスおよび MANA コーパス読み上げ音源 (ひそひそスタイル)](https://kikyohiroto1227.wixsite.com/kikoto-utau/kurage)
を用いた学習を行っています。
最終的な話者は、ルナイトネイルさんと黄琴海月さんの 2 名です。
本モデルは、以下の禁止事項に該当する行為を除き、自由にご利用いただけます。
禁止事項:
・犯罪目的、差別目的、誹謗中傷目的、その他社会通念上不適切な目的で利用する行為
モデルの使い方については、GitHub のリポジトリ (https://github.com/offtoung/pheme-ja) を参照してください。
|