Update README.md
Browse files
README.md
CHANGED
|
@@ -26,12 +26,15 @@ bf16版:https://huggingface.co/Atotti/google-usm-bf16
|
|
| 26 |
このモデルは単体で音声認識(文字起こし)などを行うものではなく、より大きなモデルのコンポーネントとして使用されることを想定しています。
|
| 27 |
|
| 28 |
* マルチモーダルモデルの音声入力部として: 生成AIに音声情報を与えるための特徴量を抽出します。
|
| 29 |
-
* 音声分類:
|
| 30 |
-
* 音声類似度検索: 音声のエンコーディングをベクトルとして扱い、意味的に似た音声を検索します。
|
| 31 |
-
* 話者認識: 音声から話者を識別するタスクのベースモデルとして利用します。
|
| 32 |
|
| 33 |
## How to Use
|
| 34 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 35 |
```python
|
| 36 |
import torch
|
| 37 |
import soundfile as sf
|
|
|
|
| 26 |
このモデルは単体で音声認識(文字起こし)などを行うものではなく、より大きなモデルのコンポーネントとして使用されることを想定しています。
|
| 27 |
|
| 28 |
* マルチモーダルモデルの音声入力部として: 生成AIに音声情報を与えるための特徴量を抽出します。
|
| 29 |
+
* 音声分類: このモデルの出力に分類ヘッドを追加して、特定の音声を分類するタスクでファインチューニングします。
|
|
|
|
|
|
|
| 30 |
|
| 31 |
## How to Use
|
| 32 |
|
| 33 |
+
### dependencies
|
| 34 |
+
```
|
| 35 |
+
pip install transformers==4.53.0
|
| 36 |
+
```
|
| 37 |
+
|
| 38 |
```python
|
| 39 |
import torch
|
| 40 |
import soundfile as sf
|