Update README.md
Browse files
README.md
CHANGED
|
@@ -36,8 +36,8 @@ GGUF(GPT-Generated Unified Format)は、大規模言語モデルを効率的
|
|
| 36 |
| VoiceCore-BF16.gguf | 6.61 GB | 最高品質、元モデルと同等の精度 | 高品質が必要な場合 |
|
| 37 |
| VoiceCore-Q4_K-f16.gguf | 2.66 GB | バランス型、実用的な精度 | 通常使用(要注意) |
|
| 38 |
|
| 39 |
-
⚠️ **重要な注意事項**: VoiceCore
|
| 40 |
-
自作gguf
|
| 41 |
|
| 42 |
量子化手順を更に改善した結果、現在のVoiceCore-Q4_K-f16.ggufはVoiceCore-BF16.ggufより音声品質や文字誤り率が改善しているという評価が内製ベンチマークで示されており、これについてはオペレーションミスの可能性も踏まえて、判断が保留されています。
|
| 43 |
|
|
@@ -59,6 +59,7 @@ GGUF(GPT-Generated Unified Format)は、大規模言語モデルを効率的
|
|
| 59 |
|
| 60 |
VoiceCoreは直接WAVファイルを生成するのではなく、SNAC用の音声トークンを出力します。
|
| 61 |
そのため、コマンドラインよりサーバー形式で動作させる方が柔軟性が高くなります
|
|
|
|
| 62 |
|
| 63 |
## セットアップガイド(Mac/初心者向け)
|
| 64 |
|
|
|
|
| 36 |
| VoiceCore-BF16.gguf | 6.61 GB | 最高品質、元モデルと同等の精度 | 高品質が必要な場合 |
|
| 37 |
| VoiceCore-Q4_K-f16.gguf | 2.66 GB | バランス型、実用的な精度 | 通常使用(要注意) |
|
| 38 |
|
| 39 |
+
⚠️ **重要な注意事項**: VoiceCoreは量子化に敏感なモデルです。ベースモデルであるorpheus-3bはQ4_K-f16以下の量子化レベルで[音声ファイルの作成に失敗するケース](https://huggingface.co/dahara1/orpheus-3b-0.1-ft_gguf)がある事がわかっています。
|
| 40 |
+
自作ggufに挑戦する場合は、音声品質や文字誤り率だけでなく発生失敗率にも注目する事を推奨します。
|
| 41 |
|
| 42 |
量子化手順を更に改善した結果、現在のVoiceCore-Q4_K-f16.ggufはVoiceCore-BF16.ggufより音声品質や文字誤り率が改善しているという評価が内製ベンチマークで示されており、これについてはオペレーションミスの可能性も踏まえて、判断が保留されています。
|
| 43 |
|
|
|
|
| 59 |
|
| 60 |
VoiceCoreは直接WAVファイルを生成するのではなく、SNAC用の音声トークンを出力します。
|
| 61 |
そのため、コマンドラインよりサーバー形式で動作させる方が柔軟性が高くなります
|
| 62 |
+
SNAC部分についてはC#実装[DillionLowry/NeuralCodecs](https://github.com/DillionLowry/NeuralCodecs))を公開してくれている方がいるので、参考にすればスマートフォン等で動作させる事も可能と思われます
|
| 63 |
|
| 64 |
## セットアップガイド(Mac/初心者向け)
|
| 65 |
|