File size: 1,737 Bytes
96b479b
 
 
 
 
32d1953
91e7ece
7bc69a9
 
91e7ece
 
 
7bc69a9
91e7ece
7bc69a9
91e7ece
 
 
7bc69a9
91e7ece
7bc69a9
91e7ece
7bc69a9
91e7ece
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
---
license: other
license_name: other
license_link: LICENSE
---
音声合成モデル Pheme (https://github.com/PolyAI-LDN/pheme) の日本語版です。

本モデルは、本リポジトリは、「ローカル LLM に向き合う会」と「メタデータラボ株式会社」の共催で開催された、[LOCAL AI HACKATHON#000](https://imminent-land-e64.notion.site/LOCAL-AI-HACKATHON-b8045ad0a99d40aaaa8591e41c5a6660) の成果物です。

Pheme (large) の公式チェックポイントをベースに、日本語で追加学習しています。
事前学習に、

・[ReazonSpeech コーパスv1](https://huggingface.co/datasets/reazon-research/reazonspeech) 

・[青空文庫振り仮名注釈付き音声コーパス](https://github.com/ndl-lab/hurigana-speech-corpus-aozora)

を利用し、続いて、

・[みんなで作るJSUTコーパスbasic5000](https://tyc.rei-yumesaki.net/material/minnade-jsut/)

・[ルナイトネイルさんの ITA コーパス読み上げ音源](https://runaitoneiru.fanbox.cc/posts/3786422)

・[黄琴海月さんの ITA コーパスおよび MANA コーパス読み上げ音源 (ひそひそスタイル)](https://kikyohiroto1227.wixsite.com/kikoto-utau/kurage)

を用いた学習を行っています。
最終的な話者は、ルナイトネイルさんと黄琴海月さんの 2 名です。

本モデルは、以下の禁止事項に該当する行為を除き、自由にご利用いただけます。

禁止事項:

・犯罪目的、差別目的、誹謗中傷目的、その他社会通念上不適切な目的で利用する行為


モデルの使い方については、GitHub のリポジトリ (https://github.com/offtoung/pheme-ja) を参照してください。