Update README.md
Browse files
README.md
CHANGED
|
@@ -15,6 +15,8 @@ license: gemma
|
|
| 15 |
|
| 16 |
このモデルは、Googleのマルチモーダルモデル [google/gemma-3n-e2b-it](https://huggingface.co/google/gemma-3n-e2b-it) から、音声エンコーダー部分 (`audio_tower`) のみを抽出したものです。
|
| 17 |
|
|
|
|
|
|
|
| 18 |
アーキテクチャは、論文 [Universal Speech Model](https://arxiv.org/abs/2303.01037) に基づくGemma3nAudioEncoderです。
|
| 19 |
|
| 20 |
このエンコーダーは、音声波形データを受け取り、その内容を表現する高次元の特徴量(エンコーディング)のシーケンスに変換する役割を果たします。
|
|
|
|
| 15 |
|
| 16 |
このモデルは、Googleのマルチモーダルモデル [google/gemma-3n-e2b-it](https://huggingface.co/google/gemma-3n-e2b-it) から、音声エンコーダー部分 (`audio_tower`) のみを抽出したものです。
|
| 17 |
|
| 18 |
+
bf16版:https://huggingface.co/Atotti/google-usm-bf16
|
| 19 |
+
|
| 20 |
アーキテクチャは、論文 [Universal Speech Model](https://arxiv.org/abs/2303.01037) に基づくGemma3nAudioEncoderです。
|
| 21 |
|
| 22 |
このエンコーダーは、音声波形データを受け取り、その内容を表現する高次元の特徴量(エンコーディング)のシーケンスに変換する役割を果たします。
|