dahara1 commited on
Commit
25b4c50
·
verified ·
1 Parent(s): 1343cb0

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +5 -5
README.md CHANGED
@@ -5,7 +5,7 @@ base_model:
5
  - webbigdata/VoiceCore
6
  ---
7
 
8
- # VoiceCore GGUF - 次世代 日本語Voice AI Agent用モデル(量子化版)
9
 
10
  [webbigdata/VoiceCore](https://huggingface.co/webbigdata/VoiceCore)はAIが自然な日本語を発声可能にする商用利用可能なVoice AI Agentモデルです。
11
  本リポジトリはVoiceCoreのGGUF(量子化)版です。Mac環境や低スペックPCでも手軽に動作させることができるように最適化されています。
@@ -13,7 +13,7 @@ base_model:
13
  ## GGUFとは?
14
 
15
  GGUF(GPT-Generated Unified Format)は、大規模言語モデルを効率的に配布・実行するためのファイルフォーマットです。
16
- 元々は「NvidiaのGPUがない環境でもCPUでLLMを動かすための純粋なC++ツール」として開発がスタートしたllama.cppというプロジェクト用のフォーマットでしたが、移植性が高いため、Macやスマートフォン、GPU環境にも移植されています。
17
 
18
  ### 主な特徴
19
  - **軽量化**: モデルサイズを大幅に削減(元の50%以下に)
@@ -57,9 +57,9 @@ GGUF(GPT-Generated Unified Format)は、大規模言語モデルを効率的
57
  [音声ファイル/リアルタイム再生]
58
  ```
59
 
60
- VoiceCoreは直接WAVファイルを生成するのではなく、SNAC用の音声トークンを出力します。そのため、コマンドラインよりサーバー形式で動作させる方が柔軟性が高くなります
61
- SNAC部分については[C#実装 DillionLowry/NeuralCodecs](https://github.com/DillionLowry/NeuralCodecs))を公開してくれている方がいるので、参考にすればスマートフォン等で動作させる事も可能と思われます
62
- また、オリジナルの[pytorchモデル hubertsiuzdak/snac_24khz](https://huggingface.co/hubertsiuzdak/snac_24khz))以外に[ONNXに移植したモデル onnx-community/snac_24khz-ONNX](https://huggingface.co/onnx-community/snac_24khz-ONNX))も存在しますが、自然さがやや落ちるという評価も目にしているので注意してください
63
 
64
  ## セットアップガイド(Mac/初心者向け)
65
 
 
5
  - webbigdata/VoiceCore
6
  ---
7
 
8
+ # VoiceCore GGUF - 次世代 日本語Voice AI Agent用モデル(gguf量子化版)
9
 
10
  [webbigdata/VoiceCore](https://huggingface.co/webbigdata/VoiceCore)はAIが自然な日本語を発声可能にする商用利用可能なVoice AI Agentモデルです。
11
  本リポジトリはVoiceCoreのGGUF(量子化)版です。Mac環境や低スペックPCでも手軽に動作させることができるように最適化されています。
 
13
  ## GGUFとは?
14
 
15
  GGUF(GPT-Generated Unified Format)は、大規模言語モデルを効率的に配布・実行するためのファイルフォーマットです。
16
+ 元々は「NvidiaのGPUがない環境でもCPUでLLMを動かすための純粋なC++ツール」として開発がスタートした[llama.cpp](https://github.com/ggml-org/llama.cpp)というプロジェクト用のフォーマットでしたが、移植性が高いため、Macやスマートフォン、GPU環境にも移植されています。
17
 
18
  ### 主な特徴
19
  - **軽量化**: モデルサイズを大幅に削減(元の50%以下に)
 
57
  [音声ファイル/リアルタイム再生]
58
  ```
59
 
60
+ VoiceCoreは直接WAVファイルを生成するのではなく、SNACというニューラルコーデック用の音声トークンを出力します。そのため、SNACも動かす必要があります。
61
+ SNAC[C#実装 DillionLowry/NeuralCodecs](https://github.com/DillionLowry/NeuralCodecs))を公開してくれている方がいるので、参考にすればスマートフォン等で動作させる事も可能と思われます
62
+ また、オリジナルの[pytorchモデル hubertsiuzdak/snac_24khz](https://huggingface.co/hubertsiuzdak/snac_24khz))以外に[ONNXに移植したモデル onnx-community/snac_24khz-ONNX](https://huggingface.co/onnx-community/snac_24khz-ONNX))も存在しますが、自然さがやや落ちるという評価も目にしているので留意してください
63
 
64
  ## セットアップガイド(Mac/初心者向け)
65