Text-to-Speech
ONNX
Japanese
akikukeo commited on
Commit
8be4197
·
1 Parent(s): 54abfbc

add README

Browse files
Files changed (1) hide show
  1. README.md +170 -0
README.md ADDED
@@ -0,0 +1,170 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - ja
4
+ pipeline_tag: text-to-speech
5
+ datasets:
6
+ - Yukiyoke-Lab/Tsukuyomi-chan_datasets
7
+ - Yukiyoke-Lab/Tsukuyomi-chan
8
+ license: other
9
+ ---
10
+
11
+ # モデルについて
12
+ 本モデルは、「つくよみちゃん」、その他の音源を学習・マージして作成されています。<br>
13
+ 「つくよみちゃん」公式が提供している合成音声モデルではありません。<br>
14
+ つくよみちゃん以外の合成音声モデルは公開しておりません。<br>
15
+ ハイパーパラメータ、マージ時のパラメータ等やエポック数等、一部情報を削除しています。<br>
16
+
17
+ つくよみちゃんモデルに関しては、[別リポジトリ](https://huggingface.co/Yukiyoke-Lab/Tsukuyomi-chan)を参照してください。<br>
18
+
19
+ ONNX形式ファイルは、Safetensors形式ファイルを変換して作成しています。<br>
20
+ 変換には、[litagin02/Style-Bert-VITS2/convert_bert_onnx.py](https://github.com/litagin02/Style-Bert-VITS2/blob/dev/convert_bert_onnx.py)を利用しています。<br>
21
+
22
+
23
+ ## Aivisspeech対応ファイル
24
+ Aivisspeech形式ファイルは、拡張子が```.aivm``` ```.aivmx```のものとします。<br>
25
+
26
+ Aivisspeech形式ファイルは、以下の通りにファイル名を命名する。<br>
27
+ ```TAR-v1.0.0.aivmx``` ```TAR-v1.0.0.aivm```<br>
28
+ ```モデル名```-v```バージョン``` ```拡張子```
29
+
30
+ ---
31
+
32
+ ## バージョニング
33
+ セマンティックバージョニングに基づいてバージョニングをし、音声モデルの形式にかかわらず、すべてでバージョンを統一します。
34
+ > Aivisspeech・Style-Birt-Vits2対応ファイルその他に関わらず、アップデートした場合に、共通して同一バージョンを割り振ります。
35
+
36
+ バージョンアップの基準は、マージ前モデルの追加学習等で音声の音質が変化した場合、マイナーバージョンをアップします。
37
+ メジャーバージョンは、メタデータ編集等により互換性が無くなった場合にアップします。
38
+ > Aivisspeechでは、ハイパーパラメータ・UUIDを変更すると同一モデル扱いではなくなるため。
39
+
40
+ ---
41
+
42
+ # ライセンス・クレジット表記
43
+ 本リポジトリ・モデルは```Aivis Common Model License (ACML) - Non Commercial 1.0```でライセンスされています。
44
+
45
+ ## 共通ライセンス
46
+ すべての他のライセンスよりも共通ライセンスが優先されます。<br>
47
+ ACMLライセンスよりも、共通ライセンスが優先されます。
48
+
49
+ 本モデルの音声合成には、フリー素材キャラクター「つくよみちゃん」(© Rei Yumesaki)が無料公開している音声データを一部使用しています。
50
+
51
+ ■つくよみちゃんコーパス(CV.夢前黎)<br>
52
+ https://tyc.rei-yumesaki.net/material/corpus/
53
+
54
+ ■つくよみちゃんキャラクターライセンス<br>
55
+ https://tyc.rei-yumesaki.net/about/terms/
56
+
57
+ - つくよみちゃんコーパスに由来する部分の取り扱いについては「つくよみちゃんコーパス」、「つくよみちゃんキャラクターライセンス」の利用規約に従うこととします。
58
+
59
+ ### 独自ライセンス
60
+ 独自ライセンスは、共通ライセンスと同一として解釈されます。<br>
61
+
62
+ - このライセンスの全ては修正・変更、それに限らずを告知せずとも行うことができます。<br>
63
+ - ライセンスの改変がされても改変以前に一般に公開されたコンテンツに関しては、以前のライセンスがそのまま適用されます。<br>
64
+ - このライセンスはすべて日本語で提供され、日本語のみにより解釈されるものとします。
65
+ - クレジット表記を行うかどうかは自由ですが、できる限り行う必要があります。
66
+ - クレジット表記の表記方法は自由ですが、できる限り作成者、モデルの配布先を目立つ箇所に記載してください。
67
+ - クレジットが困難な場合、行わないことも可能です。
68
+ > ◯◯の音声には、以下を使用しています。https://huggingface.co/Yukiyoke-Lab/TAR-model
69
+
70
+ ---
71
+
72
+ Aivis Common Model License (ACML) - Non Commercial 1.0
73
+ https://github.com/Aivis-Project/ACML/blob/master/ACML-NC-1.0.md
74
+ より引用
75
+ <details>
76
+ <summary>Aivis Common Model License (ACML) - Non Commercial 1.0</summary>
77
+
78
+ # Aivis Common Model License (ACML) - Non Commercial 1.0
79
+
80
+ このライセンスは、AI 音声合成モデルの利用条件と制限を定めるものです。
81
+
82
+ 音声合成技術の発展により、誰もが簡単に高品質な合成音声を作れるようになりました。
83
+ この技術は、創作活動はもちろん、AI との対話や新しいサービスの開発など、さまざまな可能性を広げる革新的な手段として注目されています。
84
+
85
+ 現在、音声合成モデルのライセンスは制作者ごとにまちまちで、利用条件も曖���なことが多く、使いづらい状況が続いています。
86
+ Aivis Project が策定する ACML は、音声合成モデルの自由な利用を促進しながら、制作者と利用者の双方にとって安心して活用できる環境を実現することを目指しています。
87
+
88
+ また、多くの制作者に共通のライセンスとして採用していただくことで、モデルごとの規約に気を遣うことなく、誰もが安心して音声合成モデルを利用できる環境づくりを目指しています。
89
+
90
+ このライセンスは、あなたに以下の権利を許諾します。
91
+
92
+ - ✅ **この音声合成モデルの利用・複製・改変・派生物の作成**
93
+ - 音声合成モデルを実行して音声を生成することはもちろん、モデルの複製や改変、派生モデルの作成も自由に行えます。
94
+ - ✅ **この音声合成モデルやその派生物の配布**
95
+ - このライセンスの条件に従う限り、改変の有無を問わず、自由に再配布することができます。
96
+
97
+ ただし、これらの権利は「できないこと(禁止事項)」に定める制限に従うものとします。
98
+
99
+ ## 用語の定義
100
+
101
+ - **話者:** 話し手 (Speaker) のことをいいます。話者には「実在人物」の声と「キャラクター」の声の両方を含みます。
102
+ - **音声合成モデル:** 話者の声を AI に学習させることで制作された、テキストからその話者に近い合成音声を生成できる、重み (Weight) やパラメータのことを指します。
103
+ - **あなた:** このライセンスによって許可された行為を行う個人・法人のことをいいます。
104
+ - **このライセンス:** このライセンス自身 (Aivis Common Model License: ACML) のことをいいます。
105
+ - **この音声合成モデル:** このライセンスにより利用が許諾される音声合成モデルのことをいいます。
106
+ - **利用:** この音声合成モデルの実行、複製、改変、配布、組み込み、その他あらゆる利用形態を含みます。
107
+ - **派生物:** この音声合成モデルを基に作成された二次的著作物、改変物、または派生物を指します。
108
+
109
+ ## できないこと(禁止事項)
110
+
111
+ - ❌ **音声合成モデルの元となった話者や無関係な他者の「本人」「原作者」「公式関係者」であるとの誤解を招く/騙すような利用**
112
+ - 生成した音声を、ディープフェイクや公式なコンテンツだと誤解されるような形で公開しないでください。
113
+ - 「※非公式です」「本人とは一切関係ありません」と明記するなど、なるべく公式なものだと誤解されないよう注意を払ってください。
114
+ - ❌ **話者のイメージ・尊厳・品位・社会的評価を「傷つける」「価値を下げる」「貶める」ような利用**
115
+ - 第三者が『この声がこんな用途に使われるのは嫌だ』と感じるような使い方をしないでください。
116
+ - 話者がキャラクターのときは、そのキャラクターが登場する作品に対しても同様に適用されます。
117
+ - 具体的には、下記の禁止事項が該当します。
118
+ - ❌ **実在する人物・団体・商品などを「批判」「攻撃」「嫌がらせ」「誹謗中傷」「差別」する活動への利用**
119
+ - 「攻撃」とは、自他を傷つけるあらゆる行為(犯罪、戦争、暴行、自傷・自殺、薬物乱用、ヘイトスピーチ、誹謗中傷、侮辱、揶揄、アンチ活動、詐欺、クラッキング、その他あらゆる身体的・精神的・社会的加害を含むがこれらに限定されない)を、実行または扇動することをいいます。
120
+ - あなたの主張が正当であるかどうかにかかわらず、批判や攻撃を目的とした活動にはお使いいただけません。
121
+ - ❌ **人々を騙す目的で虚偽の情報やコンテンツを公開・流布する活動への利用**
122
+ - フェイクニュースの作成や誤情報を広める目的ではお使いいただけません。
123
+ - ❌ **虚偽または誇大な表現によるマーケティングや倫理的に問題のあるビジネスへの利用**
124
+ - 消費者の誤解を狙った悪質なマーケティング活動・倫理的に問題のある事業活動(虚偽広告、誇大広告、高額情報商材、マルチ商法、ねずみ講を含むがこれらに限定されない)やその宣伝にはお使いいただけません。
125
+ - ❌ **特定の政治的立場・政治団体・政治家・宗教団体・宗教家・排他的思想・社会的勢力・陰謀論への賛同・支援または反対・批判・非難を呼びかける活動(権利運動・署名運動・デモ・プロパガンダを含むがこれらに限定されない)への利用**
126
+ - 「陰謀論」とは、科学的根拠や事実に基づかない主張(ワ���チン、通信技術、医療、健康、社会問題などに関する誤った情報を含むがこれらに限定されない)のことをいいます。
127
+ - あなたの主張が正当であるかどうかにかかわらず、特定の政治・宗教・排他的思想・社会的勢力・陰謀論に関する主張を広める活動にはお使いいただけません。
128
+ - ❌ **反社会的・犯罪目的での利用**
129
+ - 話者へのなりすましによるオレオレ詐欺や、反社会的勢力による利用などを含みます。
130
+ - ❌ **営利目的での利用**
131
+ - 以下のような、営利を目的としない使い方でのみお使いいただけます。
132
+ - 個人による私的な創作活動
133
+ - 学校や大学など教育機関における教育・研究目的での利用
134
+ - その他、営利を目的としない活動での利用
135
+
136
+ ## できること
137
+
138
+ - ✅ **上記「できないこと(禁止事項)」に該当しない、すべての非営利利用**
139
+ - 禁止事項に該当しない使い方であれば、どのような用途にも自由にお使いいただけます。
140
+ - その際、下記の「なるべく守ってほしいこと」を尊重した利用をお願いします。
141
+ - クレジット表記は任意です。音声合成モデルの制作者や話者のクレジット表記を行うかどうかは、あなたの判断にお任せします。
142
+ - この音声合成モデルを他の人に配布・共有する場合は、必ずこのライセンス文書も一緒に添付してください。
143
+ - ℹ️ **この音声合成モデルを組み込んだアプリ・Web サービスを不特定多数に公開する場合:**
144
+ - 不特定多数のユーザー or AI (LLM) が任意のテキストを入力して音声合成できる状況において、このライセンスをユーザーや LLM に完璧に遵守させることは、技術的・現実的に極めて困難であると考えられます。
145
+ - このため特例として、(技術的に禁止事項に該当する利用を防げる状態かに関わらず)**「アプリ・Web サービスの開発元自身がこのライセンスを遵守し、現実的な範囲でなるべく禁止事項に該当する利用が起きないよう努めていれば」お使いいただけます。**
146
+
147
+ ## なるべく守ってほしいこと
148
+
149
+ - ℹ️ **話者をリスペクト・尊重した利用をしてほしい**
150
+ - 具体的にどのような使い方が「リスペクト」となるかは、あなたの良識にお任せします。
151
+ - 話者がキャラクターのときは、そのキャラクターが登場する作品も十分にリスペクトしてください。
152
+ - キャラクター愛・作品愛のある使い方をお願いします。
153
+ - ℹ️ **刺激の強い/万人向けでない表現を公開するときは、「見たくない人・見るべきでない人の目に入らない」よう十分配慮してほしい**
154
+ - 表現に合わせた適切なゾーニングをお願いします。
155
+ - ゾーニングの例:「年齢制限を掛ける」「SNS のセンシティブ設定をオンにする」「コンテンツの前に注意書きを設置する」
156
+ - ℹ️ **常識の範囲内で、良識ある利用をしてほしい**
157
+ - 上記はあくまで任意であり、遵守されていなくてもライセンス違反にはなりません。
158
+
159
+ ## 免責事項
160
+
161
+ - この音声合成モデルは「現状のまま」提供されており、商品性や特定の目的への適合性、権利の非侵害などについて、明示的または黙示的を問わず、いかなる保証もありません。
162
+ - 音声合成モデルの制作者は、この音声合成モデルの利用や取り扱いまたはその結果に関連して、契約や不法行為など、いかなる形の請求や損害賠償、その他の責任についても、一切の責任を負いません。あなた自身の責任においてお使いください。
163
+ - このライセンスのいずれかの条項が無効または執行不能と判断された場合でも、残りの条項は完全に有効に存続するものとします。
164
+ - このライセンスのいずれかの条項の権利行使を行わなかったとしても、それは当該条項または他の条項の権利放棄とはみなされません。
165
+ - このライセンスはすべて日本語で提供され、日本語のみにより解釈されるものとします。
166
+
167
+ 上記の免責事項は、適用される法令の下で許容される最大限の範囲で適用されるものとします。
168
+ </details>
169
+
170
+ ---