Atotti commited on
Commit
cb34c43
·
verified ·
1 Parent(s): ea831bc

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +6 -3
README.md CHANGED
@@ -26,12 +26,15 @@ bf16版:https://huggingface.co/Atotti/google-usm-bf16
26
  このモデルは単体で音声認識(文字起こし)などを行うものではなく、より大きなモデルのコンポーネントとして使用されることを想定しています。
27
 
28
  * マルチモーダルモデルの音声入力部として: 生成AIに音声情報を与えるための特徴量を抽出します。
29
- * 音声分類: このモデルの出力に分類ヘッドを追加して、特定の音声(例:笑い声、拍手、特定の単語)を分類するタスクでファインチューニングします。
30
- * 音声類似度検索: 音声のエンコーディングをベクトルとして扱い、意味的に似た音声を検索します。
31
- * 話者認識: 音声から話者を識別するタスクのベースモデルとして利用します。
32
 
33
  ## How to Use
34
 
 
 
 
 
 
35
  ```python
36
  import torch
37
  import soundfile as sf
 
26
  このモデルは単体で音声認識(文字起こし)などを行うものではなく、より大きなモデルのコンポーネントとして使用されることを想定しています。
27
 
28
  * マルチモーダルモデルの音声入力部として: 生成AIに音声情報を与えるための特徴量を抽出します。
29
+ * 音声分類: このモデルの出力に分類ヘッドを追加して、特定の音声を分類するタスクでファインチューニングします。
 
 
30
 
31
  ## How to Use
32
 
33
+ ### dependencies
34
+ ```
35
+ pip install transformers==4.53.0
36
+ ```
37
+
38
  ```python
39
  import torch
40
  import soundfile as sf