Update README.md
Browse files
README.md
CHANGED
|
@@ -5,6 +5,78 @@ language:
|
|
| 5 |
datasets:
|
| 6 |
- Akjava/ja005_speech_common-voice_22khz
|
| 7 |
---
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 8 |
## Train
|
| 9 |
- Base model:Matcha_LJSpeech
|
| 10 |
- The train and valid split is based on mora balance-V1 and word length.
|
|
|
|
| 5 |
datasets:
|
| 6 |
- Akjava/ja005_speech_common-voice_22khz
|
| 7 |
---
|
| 8 |
+
|
| 9 |
+
**モデル名:** Matcha-TTS-Japanese Single Speaker Female Voice - ja005
|
| 10 |
+
|
| 11 |
+
**バージョン:** ver1.0
|
| 12 |
+
|
| 13 |
+
**作成者:** Akihito Miyazaki
|
| 14 |
+
|
| 15 |
+
**作成日:** 2024.Sep
|
| 16 |
+
|
| 17 |
+
**モデルの説明:**
|
| 18 |
+
|
| 19 |
+
このモデルは、Matcha-TTS-Japaneseを用いて、日本語の女性音声合成を行うための、話者1人のモデルです。コモンボイスから作られた ja005 の音声を再現することを目的としています。
|
| 20 |
+
|
| 21 |
+
**データセット:**
|
| 22 |
+
|
| 23 |
+
* ja005_speech_common-voice_22khz - Large
|
| 24 |
+
|
| 25 |
+
**トレーニング方法:**
|
| 26 |
+
|
| 27 |
+
* ベースモデル: Matcha_LJSpeech
|
| 28 |
+
* トレーニング/検証データ分割: モーラバランスV1と文字長さに基づく80:20分割
|
| 29 |
+
* バッチサイズ: 80
|
| 30 |
+
* エポック数: [エポック数] (例: 12099)
|
| 31 |
+
* その他トレーニング設定: デフォルト
|
| 32 |
+
* [トレーニング中に発生した問題点や対処法] (例: バッチサイズによるフリーズ, ロボット音声, 特定音素の学習不足)
|
| 33 |
+
|
| 34 |
+
**モデルの性能:**
|
| 35 |
+
|
| 36 |
+
* [モデルの強み] (例: 特定話者の音声を再現, 音素の正確な再現)
|
| 37 |
+
* [モデルの弱点] (例: イントネーションの不安定さ, ノイズ, 学習データにない音素の発音)
|
| 38 |
+
* [客観的な評価指標] (例: MOS値, MCD値)
|
| 39 |
+
* [主観的な評価結果] (例: 複数の話者の評価結果, 各話者の音声品質に関するコメント)
|
| 40 |
+
|
| 41 |
+
**使用例:**
|
| 42 |
+
|
| 43 |
+
* [モデルの用途] (例: 音声合成アプリケーション, 研究用途, ファインチューニング用ベースモデル)
|
| 44 |
+
* [モデルの使用上の注意点] (例: 特定の音素の発音に課題, イントネーションの調整が必要)
|
| 45 |
+
|
| 46 |
+
**重要なチェックポイント:**
|
| 47 |
+
|
| 48 |
+
* [チェックポイント番号]: [チェックポイントの説明] (例: 5709 - 最新, 5574 - group003f-CL-V1の最終)
|
| 49 |
+
|
| 50 |
+
**既知の問題点/警告:**
|
| 51 |
+
|
| 52 |
+
* [モデルの既知の問題点] (例: 特定音素の発音, イントネーション, ノイズ)
|
| 53 |
+
* [モデルの使用に関する警告] (例: 学習データ以外の音声合成は精度が低い可能性)
|
| 54 |
+
|
| 55 |
+
**今後の課題:**
|
| 56 |
+
|
| 57 |
+
* [モデルの改善点] (例: イントネーションの改善, ノイズ除去, 学習データの拡充)
|
| 58 |
+
|
| 59 |
+
**クレジット:**
|
| 60 |
+
|
| 61 |
+
* [使用したベースモデルの作成者] (例: Shivam Mehta (GitHub) - Matcha-TTS)
|
| 62 |
+
* [使用したデータセットの作成者] (例: Mozilla Common Voice)
|
| 63 |
+
|
| 64 |
+
**引用情報:**
|
| 65 |
+
|
| 66 |
+
* [モデルの引用方法] (例: モデル名, バージョン, 作成者, URL)
|
| 67 |
+
|
| 68 |
+
**その他:**
|
| 69 |
+
|
| 70 |
+
* [モデルに関する補足情報] (例: 内部コードネーム, TODOリスト)
|
| 71 |
+
|
| 72 |
+
|
| 73 |
+
**注記:**
|
| 74 |
+
|
| 75 |
+
* 上記はあくまで提案であり、必要に応じて項目の追加や削除、内容の変更を行ってください。
|
| 76 |
+
* モデルの特性に合わせて、具体的な内容を記述してください。
|
| 77 |
+
* 評価結果などを含めることで、より詳細なモデルカードを作成できます。
|
| 78 |
+
|
| 79 |
+
|
| 80 |
## Train
|
| 81 |
- Base model:Matcha_LJSpeech
|
| 82 |
- The train and valid split is based on mora balance-V1 and word length.
|