File size: 1,175 Bytes
4af265b
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
{
  "architectures": [
    "WhisperPhonemePredictionModel"
  ],
  "blank": 0,
  "decoder": "BLSTM",
  "dropout_rate": 0.1,
  "dtype": "float32",
  "freeze_encoder": true,
  "hidden_dim": 512,
  "id_2_phoneme": {
    "0": "\u2205",
    "1": "\u3131",
    "2": "\u3132",
    "3": "\u3134",
    "4": "\u3137",
    "5": "\u3138",
    "6": "\u3139",
    "7": "\u3141",
    "8": "\u3142",
    "9": "\u3143",
    "10": "\u3145",
    "11": "\u3146",
    "12": "\u3147",
    "13": "\u3148",
    "14": "\u3149",
    "15": "\u314a",
    "16": "\u314b",
    "17": "\u314c",
    "18": "\u314d",
    "19": "\u314e",
    "20": "\u314f",
    "21": "\u3150",
    "22": "\u3151",
    "23": "\u3152",
    "24": "\u3153",
    "25": "\u3154",
    "26": "\u3155",
    "27": "\u3156",
    "28": "\u3157",
    "29": "\u3158",
    "30": "\u3159",
    "31": "\u315a",
    "32": "\u315b",
    "33": "\u315c",
    "34": "\u315d",
    "35": "\u315e",
    "36": "\u315f",
    "37": "\u3160",
    "38": "\u3161",
    "39": "\u3162",
    "40": "\u3163"
  },
  "model_name": "openai/whisper-large-v3-turbo",
  "model_type": "whisper_phoneme",
  "phoneme_vocab_size": 41,
  "transformers_version": "4.57.0"
}