JLW commited on
Commit
f9ba71a
·
1 Parent(s): 5b59811

Enable Whisper

Browse files
Files changed (2) hide show
  1. app.py +5 -2
  2. polly_utils.py +103 -0
app.py CHANGED
@@ -69,8 +69,11 @@ def transcribe(aud_inp):
69
  aud = whisper.load_audio(aud_inp)
70
  aud = whisper.pad_or_trim(aud)
71
  mel = whisper.log_mel_spectrogram(aud).to(WHISPER_MODEL.device)
72
- # _, probs = WHISPER_MODEL.detect_language(mel)
73
- options = whisper.DecodingOptions(language="ja")
 
 
 
74
  result = whisper.decode(WHISPER_MODEL, mel, options)
75
  print("result.text", result.text)
76
  result_text = ""
 
69
  aud = whisper.load_audio(aud_inp)
70
  aud = whisper.pad_or_trim(aud)
71
  mel = whisper.log_mel_spectrogram(aud).to(WHISPER_MODEL.device)
72
+ _, probs = WHISPER_MODEL.detect_language(mel)
73
+
74
+ options = whisper.DecodingOptions()
75
+ # options = whisper.DecodingOptions(language="ja")
76
+
77
  result = whisper.decode(WHISPER_MODEL, mel, options)
78
  print("result.text", result.text)
79
  result_text = ""
polly_utils.py CHANGED
@@ -18,484 +18,570 @@ class PollyVoiceData:
18
  return voice['voice_id'], voice['lang_code'], STANDARD_ENGINE
19
  return None, None, None
20
 
 
 
 
 
 
 
21
  def __init__(self):
22
  self.voice_data = [
23
  {'language': 'Arabic',
24
  'lang_code': 'arb',
 
25
  'voice_id': 'Zeina',
26
  'gender': 'Female',
27
  'neural': 'No',
28
  'standard': 'Yes'},
29
  {'language': 'Arabic (Gulf)',
30
  'lang_code': 'ar-AE',
 
31
  'voice_id': 'Hala',
32
  'gender': 'Female',
33
  'neural': 'Yes',
34
  'standard': 'No'},
35
  {'language': 'Catalan',
36
  'lang_code': 'ca-ES',
 
37
  'voice_id': 'Arlet',
38
  'gender': 'Female',
39
  'neural': 'Yes',
40
  'standard': 'No'},
41
  {'language': 'Chinese (Cantonese)',
42
  'lang_code': 'yue-CN',
 
43
  'voice_id': 'Hiujin',
44
  'gender': 'Female',
45
  'neural': 'Yes',
46
  'standard': 'No'},
47
  {'language': 'Chinese (Mandarin)',
48
  'lang_code': 'cmn-CN',
 
49
  'voice_id': 'Zhiyu',
50
  'gender': 'Female',
51
  'neural': 'Yes',
52
  'standard': 'No'},
53
  {'language': 'Danish',
54
  'lang_code': 'da-DK',
 
55
  'voice_id': 'Naja',
56
  'gender': 'Female',
57
  'neural': 'No',
58
  'standard': 'Yes'},
59
  {'language': 'Danish',
60
  'lang_code': 'da-DK',
 
61
  'voice_id': 'Mads',
62
  'gender': 'Male',
63
  'neural': 'No',
64
  'standard': 'Yes'},
65
  {'language': 'Dutch',
66
  'lang_code': 'nl-NL',
 
67
  'voice_id': 'Laura',
68
  'gender': 'Female',
69
  'neural': 'Yes',
70
  'standard': 'No'},
71
  {'language': 'Dutch',
72
  'lang_code': 'nl-NL',
 
73
  'voice_id': 'Lotte',
74
  'gender': 'Female',
75
  'neural': 'No',
76
  'standard': 'Yes'},
77
  {'language': 'Dutch',
78
  'lang_code': 'nl-NL',
 
79
  'voice_id': 'Ruben',
80
  'gender': 'Male',
81
  'neural': 'No',
82
  'standard': 'Yes'},
83
  {'language': 'English (Australian)',
84
  'lang_code': 'en-AU',
 
85
  'voice_id': 'Nicole',
86
  'gender': 'Female',
87
  'neural': 'No',
88
  'standard': 'Yes'},
89
  {'language': 'English (Australian)',
90
  'lang_code': 'en-AU',
 
91
  'voice_id': 'Olivia',
92
  'gender': 'Female',
93
  'neural': 'Yes',
94
  'standard': 'No'},
95
  {'language': 'English (Australian)',
96
  'lang_code': 'en-AU',
 
97
  'voice_id': 'Russell',
98
  'gender': 'Male',
99
  'neural': 'No',
100
  'standard': 'Yes'},
101
  {'language': 'English (British)',
102
  'lang_code': 'en-GB',
 
103
  'voice_id': 'Amy',
104
  'gender': 'Female',
105
  'neural': 'Yes',
106
  'standard': 'Yes'},
107
  {'language': 'English (British)',
108
  'lang_code': 'en-GB',
 
109
  'voice_id': 'Emma',
110
  'gender': 'Female',
111
  'neural': 'Yes',
112
  'standard': 'Yes'},
113
  {'language': 'English (British)',
114
  'lang_code': 'en-GB',
 
115
  'voice_id': 'Brian',
116
  'gender': 'Male',
117
  'neural': 'Yes',
118
  'standard': 'Yes'},
119
  {'language': 'English (British)',
120
  'lang_code': 'en-GB',
 
121
  'voice_id': 'Arthur',
122
  'gender': 'Male',
123
  'neural': 'Yes',
124
  'standard': 'No'},
125
  {'language': 'English (Indian)',
126
  'lang_code': 'en-IN',
 
127
  'voice_id': 'Aditi',
128
  'gender': 'Female',
129
  'neural': 'No',
130
  'standard': 'Yes'},
131
  {'language': 'English (Indian)',
132
  'lang_code': 'en-IN',
 
133
  'voice_id': 'Raveena',
134
  'gender': 'Female',
135
  'neural': 'No',
136
  'standard': 'Yes'},
137
  {'language': 'English (Indian)',
138
  'lang_code': 'en-IN',
 
139
  'voice_id': 'Kajal',
140
  'gender': 'Female',
141
  'neural': 'Yes',
142
  'standard': 'No'},
143
  {'language': 'English (New Zealand)',
144
  'lang_code': 'en-NZ',
 
145
  'voice_id': 'Aria',
146
  'gender': 'Female',
147
  'neural': 'Yes',
148
  'standard': 'No'},
149
  {'language': 'English (South African)',
150
  'lang_code': 'en-ZA',
 
151
  'voice_id': 'Ayanda',
152
  'gender': 'Female',
153
  'neural': 'Yes',
154
  'standard': 'No'},
155
  {'language': 'English (US)',
156
  'lang_code': 'en-US',
 
157
  'voice_id': 'Ivy',
158
  'gender': 'Female (child)',
159
  'neural': 'Yes',
160
  'standard': 'Yes'},
161
  {'language': 'English (US)',
162
  'lang_code': 'en-US',
 
163
  'voice_id': 'Joanna',
164
  'gender': 'Female',
165
  'neural': 'Yes',
166
  'standard': 'Yes'},
167
  {'language': 'English (US)',
168
  'lang_code': 'en-US',
 
169
  'voice_id': 'Kendra',
170
  'gender': 'Female',
171
  'neural': 'Yes',
172
  'standard': 'Yes'},
173
  {'language': 'English (US)',
174
  'lang_code': 'en-US',
 
175
  'voice_id': 'Kimberly',
176
  'gender': 'Female',
177
  'neural': 'Yes',
178
  'standard': 'Yes'},
179
  {'language': 'English (US)',
180
  'lang_code': 'en-US',
 
181
  'voice_id': 'Salli',
182
  'gender': 'Female',
183
  'neural': 'Yes',
184
  'standard': 'Yes'},
185
  {'language': 'English (US)',
186
  'lang_code': 'en-US',
 
187
  'voice_id': 'Joey',
188
  'gender': 'Male',
189
  'neural': 'Yes',
190
  'standard': 'Yes'},
191
  {'language': 'English (US)',
192
  'lang_code': 'en-US',
 
193
  'voice_id': 'Justin',
194
  'gender': 'Male (child)',
195
  'neural': 'Yes',
196
  'standard': 'Yes'},
197
  {'language': 'English (US)',
198
  'lang_code': 'en-US',
 
199
  'voice_id': 'Kevin',
200
  'gender': 'Male (child)',
201
  'neural': 'Yes',
202
  'standard': 'No'},
203
  {'language': 'English (US)',
204
  'lang_code': 'en-US',
 
205
  'voice_id': 'Matthew',
206
  'gender': 'Male',
207
  'neural': 'Yes',
208
  'standard': 'Yes'},
209
  {'language': 'English (Welsh)',
210
  'lang_code': 'en-GB-WLS',
 
211
  'voice_id': 'Geraint',
212
  'gender': 'Male',
213
  'neural': 'No',
214
  'standard': 'Yes'},
215
  {'language': 'Finnish',
216
  'lang_code': 'fi-FI',
 
217
  'voice_id': 'Suvi',
218
  'gender': 'Female',
219
  'neural': 'Yes',
220
  'standard': 'No'},
221
  {'language': 'French',
222
  'lang_code': 'fr-FR',
 
223
  'voice_id': 'Celine',
224
  'gender': 'Female',
225
  'neural': 'No',
226
  'standard': 'Yes'},
227
  {'language': 'French',
228
  'lang_code': 'fr-FR',
 
229
  'voice_id': 'Lea',
230
  'gender': 'Female',
231
  'neural': 'Yes',
232
  'standard': 'Yes'},
233
  {'language': 'French',
234
  'lang_code': 'fr-FR',
 
235
  'voice_id': 'Mathieu',
236
  'gender': 'Male',
237
  'neural': 'No',
238
  'standard': 'Yes'},
239
  {'language': 'French (Canadian)',
240
  'lang_code': 'fr-CA',
 
241
  'voice_id': 'Chantal',
242
  'gender': 'Female',
243
  'neural': 'No',
244
  'standard': 'Yes'},
245
  {'language': 'French (Canadian)',
246
  'lang_code': 'fr-CA',
 
247
  'voice_id': 'Gabrielle',
248
  'gender': 'Female',
249
  'neural': 'Yes',
250
  'standard': 'No'},
251
  {'language': 'French (Canadian)',
252
  'lang_code': 'fr-CA',
 
253
  'voice_id': 'Liam',
254
  'gender': 'Male',
255
  'neural': 'Yes',
256
  'standard': 'No'},
257
  {'language': 'German',
258
  'lang_code': 'de-DE',
 
259
  'voice_id': 'Marlene',
260
  'gender': 'Female',
261
  'neural': 'No',
262
  'standard': 'Yes'},
263
  {'language': 'German',
264
  'lang_code': 'de-DE',
 
265
  'voice_id': 'Vicki',
266
  'gender': 'Female',
267
  'neural': 'Yes',
268
  'standard': 'Yes'},
269
  {'language': 'German',
270
  'lang_code': 'de-DE',
 
271
  'voice_id': 'Hans',
272
  'gender': 'Male',
273
  'neural': 'No',
274
  'standard': 'Yes'},
275
  {'language': 'German',
276
  'lang_code': 'de-DE',
 
277
  'voice_id': 'Daniel',
278
  'gender': 'Male',
279
  'neural': 'Yes',
280
  'standard': 'No'},
281
  {'language': 'German (Austrian)',
282
  'lang_code': 'de-AT',
 
283
  'voice_id': 'Hannah',
284
  'gender': 'Female',
285
  'neural': 'Yes',
286
  'standard': 'No'},
287
  {'language': 'Hindi',
288
  'lang_code': 'hi-IN',
 
289
  'voice_id': 'Aditi',
290
  'gender': 'Female',
291
  'neural': 'No',
292
  'standard': 'Yes'},
293
  {'language': 'Hindi',
294
  'lang_code': 'hi-IN',
 
295
  'voice_id': 'Kajal',
296
  'gender': 'Female',
297
  'neural': 'Yes',
298
  'standard': 'No'},
299
  {'language': 'Icelandic',
300
  'lang_code': 'is-IS',
 
301
  'voice_id': 'Dora',
302
  'gender': 'Female',
303
  'neural': 'No',
304
  'standard': 'Yes'},
305
  {'language': 'Icelandic',
306
  'lang_code': 'is-IS',
 
307
  'voice_id': 'Karl',
308
  'gender': 'Male',
309
  'neural': 'No',
310
  'standard': 'Yes'},
311
  {'language': 'Italian',
312
  'lang_code': 'it-IT',
 
313
  'voice_id': 'Carla',
314
  'gender': 'Female',
315
  'neural': 'No',
316
  'standard': 'Yes'},
317
  {'language': 'Italian',
318
  'lang_code': 'it-IT',
 
319
  'voice_id': 'Bianca',
320
  'gender': 'Female',
321
  'neural': 'Yes',
322
  'standard': 'Yes'},
323
  {'language': 'Japanese',
324
  'lang_code': 'ja-JP',
 
325
  'voice_id': 'Mizuki',
326
  'gender': 'Female',
327
  'neural': 'No',
328
  'standard': 'Yes'},
329
  {'language': 'Japanese',
330
  'lang_code': 'ja-JP',
 
331
  'voice_id': 'Takumi',
332
  'gender': 'Male',
333
  'neural': 'Yes',
334
  'standard': 'Yes'},
335
  {'language': 'Korean',
336
  'lang_code': 'ko-KR',
 
337
  'voice_id': 'Seoyeon',
338
  'gender': 'Female',
339
  'neural': 'Yes',
340
  'standard': 'Yes'},
341
  {'language': 'Norwegian',
342
  'lang_code': 'nb-NO',
 
343
  'voice_id': 'Liv',
344
  'gender': 'Female',
345
  'neural': 'No',
346
  'standard': 'Yes'},
347
  {'language': 'Norwegian',
348
  'lang_code': 'nb-NO',
 
349
  'voice_id': 'Ida',
350
  'gender': 'Female',
351
  'neural': 'Yes',
352
  'standard': 'No'},
353
  {'language': 'Polish',
354
  'lang_code': 'pl-PL',
 
355
  'voice_id': 'Ewa',
356
  'gender': 'Female',
357
  'neural': 'No',
358
  'standard': 'Yes'},
359
  {'language': 'Polish',
360
  'lang_code': 'pl-PL',
 
361
  'voice_id': 'Maja',
362
  'gender': 'Female',
363
  'neural': 'No',
364
  'standard': 'Yes'},
365
  {'language': 'Polish',
366
  'lang_code': 'pl-PL',
 
367
  'voice_id': 'Jacek',
368
  'gender': 'Male',
369
  'neural': 'No',
370
  'standard': 'Yes'},
371
  {'language': 'Polish',
372
  'lang_code': 'pl-PL',
 
373
  'voice_id': 'Jan',
374
  'gender': 'Male',
375
  'neural': 'No',
376
  'standard': 'Yes'},
377
  {'language': 'Polish',
378
  'lang_code': 'pl-PL',
 
379
  'voice_id': 'Ola',
380
  'gender': 'Female',
381
  'neural': 'Yes',
382
  'standard': 'No'},
383
  {'language': 'Portuguese (Brazilian)',
384
  'lang_code': 'pt-BR',
 
385
  'voice_id': 'Camila',
386
  'gender': 'Female',
387
  'neural': 'Yes',
388
  'standard': 'Yes'},
389
  {'language': 'Portuguese (Brazilian)',
390
  'lang_code': 'pt-BR',
 
391
  'voice_id': 'Vitoria',
392
  'gender': 'Female',
393
  'neural': 'Yes',
394
  'standard': 'Yes'},
395
  {'language': 'Portuguese (Brazilian)',
396
  'lang_code': 'pt-BR',
 
397
  'voice_id': 'Ricardo',
398
  'gender': 'Male',
399
  'neural': 'No',
400
  'standard': 'Yes'},
401
  {'language': 'Portuguese (European)',
402
  'lang_code': 'pt-PT',
 
403
  'voice_id': 'Ines',
404
  'gender': 'Female',
405
  'neural': 'Yes',
406
  'standard': 'Yes'},
407
  {'language': 'Portuguese (European)',
408
  'lang_code': 'pt-PT',
 
409
  'voice_id': 'Cristiano',
410
  'gender': 'Male',
411
  'neural': 'No',
412
  'standard': 'Yes'},
413
  {'language': 'Romanian',
414
  'lang_code': 'ro-RO',
 
415
  'voice_id': 'Carmen',
416
  'gender': 'Female',
417
  'neural': 'No',
418
  'standard': 'Yes'},
419
  {'language': 'Russian',
420
  'lang_code': 'ru-RU',
 
421
  'voice_id': 'Tatyana',
422
  'gender': 'Female',
423
  'neural': 'No',
424
  'standard': 'Yes'},
425
  {'language': 'Russian',
426
  'lang_code': 'ru-RU',
 
427
  'voice_id': 'Maxim',
428
  'gender': 'Male',
429
  'neural': 'No',
430
  'standard': 'Yes'},
431
  {'language': 'Spanish (European)',
432
  'lang_code': 'es-ES',
 
433
  'voice_id': 'Conchita',
434
  'gender': 'Female',
435
  'neural': 'No',
436
  'standard': 'Yes'},
437
  {'language': 'Spanish (European)',
438
  'lang_code': 'es-ES',
 
439
  'voice_id': 'Lucia',
440
  'gender': 'Female',
441
  'neural': 'Yes',
442
  'standard': 'Yes'},
443
  {'language': 'Spanish (European)',
444
  'lang_code': 'es-ES',
 
445
  'voice_id': 'Enrique',
446
  'gender': 'Male',
447
  'neural': 'No',
448
  'standard': 'Yes'},
449
  {'language': 'Spanish (Mexican)',
450
  'lang_code': 'es-MX',
 
451
  'voice_id': 'Mia',
452
  'gender': 'Female',
453
  'neural': 'Yes',
454
  'standard': 'Yes'},
455
  {'language': 'Spanish (US)',
456
  'lang_code': 'es-US',
 
457
  'voice_id': 'Lupe',
458
  'gender': 'Female',
459
  'neural': 'Yes',
460
  'standard': 'Yes'},
461
  {'language': 'Spanish (US)',
462
  'lang_code': 'es-US',
 
463
  'voice_id': 'Penelope',
464
  'gender': 'Female',
465
  'neural': 'No',
466
  'standard': 'Yes'},
467
  {'language': 'Spanish (US)',
468
  'lang_code': 'es-US',
 
469
  'voice_id': 'Miguel',
470
  'gender': 'Male',
471
  'neural': 'No',
472
  'standard': 'Yes'},
473
  {'language': 'Spanish (US)',
474
  'lang_code': 'es-US',
 
475
  'voice_id': 'Pedro',
476
  'gender': 'Male',
477
  'neural': 'Yes',
478
  'standard': 'No'},
479
  {'language': 'Swedish',
480
  'lang_code': 'sv-SE',
 
481
  'voice_id': 'Astrid',
482
  'gender': 'Female',
483
  'neural': 'No',
484
  'standard': 'Yes'},
485
  {'language': 'Swedish',
486
  'lang_code': 'sv-SE',
 
487
  'voice_id': 'Elin',
488
  'gender': 'Female',
489
  'neural': 'Yes',
490
  'standard': 'No'},
491
  {'language': 'Turkish',
492
  'lang_code': 'tr-TR',
 
493
  'voice_id': 'Filiz',
494
  'gender': 'Female',
495
  'neural': 'No',
496
  'standard': 'Yes'},
497
  {'language': 'Welsh',
498
  'lang_code': 'cy-GB',
 
499
  'voice_id': 'Gwyneth',
500
  'gender': 'Female',
501
  'neural': 'No',
@@ -530,3 +616,20 @@ if __name__ == '__main__':
530
 
531
  voice_id, language_code, engine = polly_voice_data.get_voice('Hindi', 'Male')
532
  print('Hindi', 'Male', voice_id, language_code, engine)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
18
  return voice['voice_id'], voice['lang_code'], STANDARD_ENGINE
19
  return None, None, None
20
 
21
+ def get_whisper_lang_code(self, language):
22
+ for voice in self.voice_data:
23
+ if voice['language'] == language:
24
+ return voice['whisper_lang_code']
25
+ return "en"
26
+
27
  def __init__(self):
28
  self.voice_data = [
29
  {'language': 'Arabic',
30
  'lang_code': 'arb',
31
+ 'whisper_lang_code': 'ar',
32
  'voice_id': 'Zeina',
33
  'gender': 'Female',
34
  'neural': 'No',
35
  'standard': 'Yes'},
36
  {'language': 'Arabic (Gulf)',
37
  'lang_code': 'ar-AE',
38
+ 'whisper_lang_code': 'ar',
39
  'voice_id': 'Hala',
40
  'gender': 'Female',
41
  'neural': 'Yes',
42
  'standard': 'No'},
43
  {'language': 'Catalan',
44
  'lang_code': 'ca-ES',
45
+ 'whisper_lang_code': 'ca',
46
  'voice_id': 'Arlet',
47
  'gender': 'Female',
48
  'neural': 'Yes',
49
  'standard': 'No'},
50
  {'language': 'Chinese (Cantonese)',
51
  'lang_code': 'yue-CN',
52
+ 'whisper_lang_code': 'zh',
53
  'voice_id': 'Hiujin',
54
  'gender': 'Female',
55
  'neural': 'Yes',
56
  'standard': 'No'},
57
  {'language': 'Chinese (Mandarin)',
58
  'lang_code': 'cmn-CN',
59
+ 'whisper_lang_code': 'zh',
60
  'voice_id': 'Zhiyu',
61
  'gender': 'Female',
62
  'neural': 'Yes',
63
  'standard': 'No'},
64
  {'language': 'Danish',
65
  'lang_code': 'da-DK',
66
+ 'whisper_lang_code': 'da',
67
  'voice_id': 'Naja',
68
  'gender': 'Female',
69
  'neural': 'No',
70
  'standard': 'Yes'},
71
  {'language': 'Danish',
72
  'lang_code': 'da-DK',
73
+ 'whisper_lang_code': 'da',
74
  'voice_id': 'Mads',
75
  'gender': 'Male',
76
  'neural': 'No',
77
  'standard': 'Yes'},
78
  {'language': 'Dutch',
79
  'lang_code': 'nl-NL',
80
+ 'whisper_lang_code': 'nl',
81
  'voice_id': 'Laura',
82
  'gender': 'Female',
83
  'neural': 'Yes',
84
  'standard': 'No'},
85
  {'language': 'Dutch',
86
  'lang_code': 'nl-NL',
87
+ 'whisper_lang_code': 'nl',
88
  'voice_id': 'Lotte',
89
  'gender': 'Female',
90
  'neural': 'No',
91
  'standard': 'Yes'},
92
  {'language': 'Dutch',
93
  'lang_code': 'nl-NL',
94
+ 'whisper_lang_code': 'nl',
95
  'voice_id': 'Ruben',
96
  'gender': 'Male',
97
  'neural': 'No',
98
  'standard': 'Yes'},
99
  {'language': 'English (Australian)',
100
  'lang_code': 'en-AU',
101
+ 'whisper_lang_code': 'en',
102
  'voice_id': 'Nicole',
103
  'gender': 'Female',
104
  'neural': 'No',
105
  'standard': 'Yes'},
106
  {'language': 'English (Australian)',
107
  'lang_code': 'en-AU',
108
+ 'whisper_lang_code': 'en',
109
  'voice_id': 'Olivia',
110
  'gender': 'Female',
111
  'neural': 'Yes',
112
  'standard': 'No'},
113
  {'language': 'English (Australian)',
114
  'lang_code': 'en-AU',
115
+ 'whisper_lang_code': 'en',
116
  'voice_id': 'Russell',
117
  'gender': 'Male',
118
  'neural': 'No',
119
  'standard': 'Yes'},
120
  {'language': 'English (British)',
121
  'lang_code': 'en-GB',
122
+ 'whisper_lang_code': 'en',
123
  'voice_id': 'Amy',
124
  'gender': 'Female',
125
  'neural': 'Yes',
126
  'standard': 'Yes'},
127
  {'language': 'English (British)',
128
  'lang_code': 'en-GB',
129
+ 'whisper_lang_code': 'en',
130
  'voice_id': 'Emma',
131
  'gender': 'Female',
132
  'neural': 'Yes',
133
  'standard': 'Yes'},
134
  {'language': 'English (British)',
135
  'lang_code': 'en-GB',
136
+ 'whisper_lang_code': 'en',
137
  'voice_id': 'Brian',
138
  'gender': 'Male',
139
  'neural': 'Yes',
140
  'standard': 'Yes'},
141
  {'language': 'English (British)',
142
  'lang_code': 'en-GB',
143
+ 'whisper_lang_code': 'en',
144
  'voice_id': 'Arthur',
145
  'gender': 'Male',
146
  'neural': 'Yes',
147
  'standard': 'No'},
148
  {'language': 'English (Indian)',
149
  'lang_code': 'en-IN',
150
+ 'whisper_lang_code': 'en',
151
  'voice_id': 'Aditi',
152
  'gender': 'Female',
153
  'neural': 'No',
154
  'standard': 'Yes'},
155
  {'language': 'English (Indian)',
156
  'lang_code': 'en-IN',
157
+ 'whisper_lang_code': 'en',
158
  'voice_id': 'Raveena',
159
  'gender': 'Female',
160
  'neural': 'No',
161
  'standard': 'Yes'},
162
  {'language': 'English (Indian)',
163
  'lang_code': 'en-IN',
164
+ 'whisper_lang_code': 'en',
165
  'voice_id': 'Kajal',
166
  'gender': 'Female',
167
  'neural': 'Yes',
168
  'standard': 'No'},
169
  {'language': 'English (New Zealand)',
170
  'lang_code': 'en-NZ',
171
+ 'whisper_lang_code': 'en',
172
  'voice_id': 'Aria',
173
  'gender': 'Female',
174
  'neural': 'Yes',
175
  'standard': 'No'},
176
  {'language': 'English (South African)',
177
  'lang_code': 'en-ZA',
178
+ 'whisper_lang_code': 'en',
179
  'voice_id': 'Ayanda',
180
  'gender': 'Female',
181
  'neural': 'Yes',
182
  'standard': 'No'},
183
  {'language': 'English (US)',
184
  'lang_code': 'en-US',
185
+ 'whisper_lang_code': 'en',
186
  'voice_id': 'Ivy',
187
  'gender': 'Female (child)',
188
  'neural': 'Yes',
189
  'standard': 'Yes'},
190
  {'language': 'English (US)',
191
  'lang_code': 'en-US',
192
+ 'whisper_lang_code': 'en',
193
  'voice_id': 'Joanna',
194
  'gender': 'Female',
195
  'neural': 'Yes',
196
  'standard': 'Yes'},
197
  {'language': 'English (US)',
198
  'lang_code': 'en-US',
199
+ 'whisper_lang_code': 'en',
200
  'voice_id': 'Kendra',
201
  'gender': 'Female',
202
  'neural': 'Yes',
203
  'standard': 'Yes'},
204
  {'language': 'English (US)',
205
  'lang_code': 'en-US',
206
+ 'whisper_lang_code': 'en',
207
  'voice_id': 'Kimberly',
208
  'gender': 'Female',
209
  'neural': 'Yes',
210
  'standard': 'Yes'},
211
  {'language': 'English (US)',
212
  'lang_code': 'en-US',
213
+ 'whisper_lang_code': 'en',
214
  'voice_id': 'Salli',
215
  'gender': 'Female',
216
  'neural': 'Yes',
217
  'standard': 'Yes'},
218
  {'language': 'English (US)',
219
  'lang_code': 'en-US',
220
+ 'whisper_lang_code': 'en',
221
  'voice_id': 'Joey',
222
  'gender': 'Male',
223
  'neural': 'Yes',
224
  'standard': 'Yes'},
225
  {'language': 'English (US)',
226
  'lang_code': 'en-US',
227
+ 'whisper_lang_code': 'en',
228
  'voice_id': 'Justin',
229
  'gender': 'Male (child)',
230
  'neural': 'Yes',
231
  'standard': 'Yes'},
232
  {'language': 'English (US)',
233
  'lang_code': 'en-US',
234
+ 'whisper_lang_code': 'en',
235
  'voice_id': 'Kevin',
236
  'gender': 'Male (child)',
237
  'neural': 'Yes',
238
  'standard': 'No'},
239
  {'language': 'English (US)',
240
  'lang_code': 'en-US',
241
+ 'whisper_lang_code': 'en',
242
  'voice_id': 'Matthew',
243
  'gender': 'Male',
244
  'neural': 'Yes',
245
  'standard': 'Yes'},
246
  {'language': 'English (Welsh)',
247
  'lang_code': 'en-GB-WLS',
248
+ 'whisper_lang_code': 'en',
249
  'voice_id': 'Geraint',
250
  'gender': 'Male',
251
  'neural': 'No',
252
  'standard': 'Yes'},
253
  {'language': 'Finnish',
254
  'lang_code': 'fi-FI',
255
+ 'whisper_lang_code': 'fi',
256
  'voice_id': 'Suvi',
257
  'gender': 'Female',
258
  'neural': 'Yes',
259
  'standard': 'No'},
260
  {'language': 'French',
261
  'lang_code': 'fr-FR',
262
+ 'whisper_lang_code': 'fr',
263
  'voice_id': 'Celine',
264
  'gender': 'Female',
265
  'neural': 'No',
266
  'standard': 'Yes'},
267
  {'language': 'French',
268
  'lang_code': 'fr-FR',
269
+ 'whisper_lang_code': 'fr',
270
  'voice_id': 'Lea',
271
  'gender': 'Female',
272
  'neural': 'Yes',
273
  'standard': 'Yes'},
274
  {'language': 'French',
275
  'lang_code': 'fr-FR',
276
+ 'whisper_lang_code': 'fr',
277
  'voice_id': 'Mathieu',
278
  'gender': 'Male',
279
  'neural': 'No',
280
  'standard': 'Yes'},
281
  {'language': 'French (Canadian)',
282
  'lang_code': 'fr-CA',
283
+ 'whisper_lang_code': 'fr',
284
  'voice_id': 'Chantal',
285
  'gender': 'Female',
286
  'neural': 'No',
287
  'standard': 'Yes'},
288
  {'language': 'French (Canadian)',
289
  'lang_code': 'fr-CA',
290
+ 'whisper_lang_code': 'fr',
291
  'voice_id': 'Gabrielle',
292
  'gender': 'Female',
293
  'neural': 'Yes',
294
  'standard': 'No'},
295
  {'language': 'French (Canadian)',
296
  'lang_code': 'fr-CA',
297
+ 'whisper_lang_code': 'fr',
298
  'voice_id': 'Liam',
299
  'gender': 'Male',
300
  'neural': 'Yes',
301
  'standard': 'No'},
302
  {'language': 'German',
303
  'lang_code': 'de-DE',
304
+ 'whisper_lang_code': 'de',
305
  'voice_id': 'Marlene',
306
  'gender': 'Female',
307
  'neural': 'No',
308
  'standard': 'Yes'},
309
  {'language': 'German',
310
  'lang_code': 'de-DE',
311
+ 'whisper_lang_code': 'de',
312
  'voice_id': 'Vicki',
313
  'gender': 'Female',
314
  'neural': 'Yes',
315
  'standard': 'Yes'},
316
  {'language': 'German',
317
  'lang_code': 'de-DE',
318
+ 'whisper_lang_code': 'de',
319
  'voice_id': 'Hans',
320
  'gender': 'Male',
321
  'neural': 'No',
322
  'standard': 'Yes'},
323
  {'language': 'German',
324
  'lang_code': 'de-DE',
325
+ 'whisper_lang_code': 'de',
326
  'voice_id': 'Daniel',
327
  'gender': 'Male',
328
  'neural': 'Yes',
329
  'standard': 'No'},
330
  {'language': 'German (Austrian)',
331
  'lang_code': 'de-AT',
332
+ 'whisper_lang_code': 'de',
333
  'voice_id': 'Hannah',
334
  'gender': 'Female',
335
  'neural': 'Yes',
336
  'standard': 'No'},
337
  {'language': 'Hindi',
338
  'lang_code': 'hi-IN',
339
+ 'whisper_lang_code': 'hi',
340
  'voice_id': 'Aditi',
341
  'gender': 'Female',
342
  'neural': 'No',
343
  'standard': 'Yes'},
344
  {'language': 'Hindi',
345
  'lang_code': 'hi-IN',
346
+ 'whisper_lang_code': 'hi',
347
  'voice_id': 'Kajal',
348
  'gender': 'Female',
349
  'neural': 'Yes',
350
  'standard': 'No'},
351
  {'language': 'Icelandic',
352
  'lang_code': 'is-IS',
353
+ 'whisper_lang_code': 'is',
354
  'voice_id': 'Dora',
355
  'gender': 'Female',
356
  'neural': 'No',
357
  'standard': 'Yes'},
358
  {'language': 'Icelandic',
359
  'lang_code': 'is-IS',
360
+ 'whisper_lang_code': 'is',
361
  'voice_id': 'Karl',
362
  'gender': 'Male',
363
  'neural': 'No',
364
  'standard': 'Yes'},
365
  {'language': 'Italian',
366
  'lang_code': 'it-IT',
367
+ 'whisper_lang_code': 'it',
368
  'voice_id': 'Carla',
369
  'gender': 'Female',
370
  'neural': 'No',
371
  'standard': 'Yes'},
372
  {'language': 'Italian',
373
  'lang_code': 'it-IT',
374
+ 'whisper_lang_code': 'it',
375
  'voice_id': 'Bianca',
376
  'gender': 'Female',
377
  'neural': 'Yes',
378
  'standard': 'Yes'},
379
  {'language': 'Japanese',
380
  'lang_code': 'ja-JP',
381
+ 'whisper_lang_code': 'ja',
382
  'voice_id': 'Mizuki',
383
  'gender': 'Female',
384
  'neural': 'No',
385
  'standard': 'Yes'},
386
  {'language': 'Japanese',
387
  'lang_code': 'ja-JP',
388
+ 'whisper_lang_code': 'ja',
389
  'voice_id': 'Takumi',
390
  'gender': 'Male',
391
  'neural': 'Yes',
392
  'standard': 'Yes'},
393
  {'language': 'Korean',
394
  'lang_code': 'ko-KR',
395
+ 'whisper_lang_code': 'ko',
396
  'voice_id': 'Seoyeon',
397
  'gender': 'Female',
398
  'neural': 'Yes',
399
  'standard': 'Yes'},
400
  {'language': 'Norwegian',
401
  'lang_code': 'nb-NO',
402
+ 'whisper_lang_code': 'no',
403
  'voice_id': 'Liv',
404
  'gender': 'Female',
405
  'neural': 'No',
406
  'standard': 'Yes'},
407
  {'language': 'Norwegian',
408
  'lang_code': 'nb-NO',
409
+ 'whisper_lang_code': 'no',
410
  'voice_id': 'Ida',
411
  'gender': 'Female',
412
  'neural': 'Yes',
413
  'standard': 'No'},
414
  {'language': 'Polish',
415
  'lang_code': 'pl-PL',
416
+ 'whisper_lang_code': 'pl',
417
  'voice_id': 'Ewa',
418
  'gender': 'Female',
419
  'neural': 'No',
420
  'standard': 'Yes'},
421
  {'language': 'Polish',
422
  'lang_code': 'pl-PL',
423
+ 'whisper_lang_code': 'pl',
424
  'voice_id': 'Maja',
425
  'gender': 'Female',
426
  'neural': 'No',
427
  'standard': 'Yes'},
428
  {'language': 'Polish',
429
  'lang_code': 'pl-PL',
430
+ 'whisper_lang_code': 'pl',
431
  'voice_id': 'Jacek',
432
  'gender': 'Male',
433
  'neural': 'No',
434
  'standard': 'Yes'},
435
  {'language': 'Polish',
436
  'lang_code': 'pl-PL',
437
+ 'whisper_lang_code': 'pl',
438
  'voice_id': 'Jan',
439
  'gender': 'Male',
440
  'neural': 'No',
441
  'standard': 'Yes'},
442
  {'language': 'Polish',
443
  'lang_code': 'pl-PL',
444
+ 'whisper_lang_code': 'pl',
445
  'voice_id': 'Ola',
446
  'gender': 'Female',
447
  'neural': 'Yes',
448
  'standard': 'No'},
449
  {'language': 'Portuguese (Brazilian)',
450
  'lang_code': 'pt-BR',
451
+ 'whisper_lang_code': 'pt',
452
  'voice_id': 'Camila',
453
  'gender': 'Female',
454
  'neural': 'Yes',
455
  'standard': 'Yes'},
456
  {'language': 'Portuguese (Brazilian)',
457
  'lang_code': 'pt-BR',
458
+ 'whisper_lang_code': 'pt',
459
  'voice_id': 'Vitoria',
460
  'gender': 'Female',
461
  'neural': 'Yes',
462
  'standard': 'Yes'},
463
  {'language': 'Portuguese (Brazilian)',
464
  'lang_code': 'pt-BR',
465
+ 'whisper_lang_code': 'pt',
466
  'voice_id': 'Ricardo',
467
  'gender': 'Male',
468
  'neural': 'No',
469
  'standard': 'Yes'},
470
  {'language': 'Portuguese (European)',
471
  'lang_code': 'pt-PT',
472
+ 'whisper_lang_code': 'pt',
473
  'voice_id': 'Ines',
474
  'gender': 'Female',
475
  'neural': 'Yes',
476
  'standard': 'Yes'},
477
  {'language': 'Portuguese (European)',
478
  'lang_code': 'pt-PT',
479
+ 'whisper_lang_code': 'pt',
480
  'voice_id': 'Cristiano',
481
  'gender': 'Male',
482
  'neural': 'No',
483
  'standard': 'Yes'},
484
  {'language': 'Romanian',
485
  'lang_code': 'ro-RO',
486
+ 'whisper_lang_code': 'ro',
487
  'voice_id': 'Carmen',
488
  'gender': 'Female',
489
  'neural': 'No',
490
  'standard': 'Yes'},
491
  {'language': 'Russian',
492
  'lang_code': 'ru-RU',
493
+ 'whisper_lang_code': 'ru',
494
  'voice_id': 'Tatyana',
495
  'gender': 'Female',
496
  'neural': 'No',
497
  'standard': 'Yes'},
498
  {'language': 'Russian',
499
  'lang_code': 'ru-RU',
500
+ 'whisper_lang_code': 'ru',
501
  'voice_id': 'Maxim',
502
  'gender': 'Male',
503
  'neural': 'No',
504
  'standard': 'Yes'},
505
  {'language': 'Spanish (European)',
506
  'lang_code': 'es-ES',
507
+ 'whisper_lang_code': 'es',
508
  'voice_id': 'Conchita',
509
  'gender': 'Female',
510
  'neural': 'No',
511
  'standard': 'Yes'},
512
  {'language': 'Spanish (European)',
513
  'lang_code': 'es-ES',
514
+ 'whisper_lang_code': 'es',
515
  'voice_id': 'Lucia',
516
  'gender': 'Female',
517
  'neural': 'Yes',
518
  'standard': 'Yes'},
519
  {'language': 'Spanish (European)',
520
  'lang_code': 'es-ES',
521
+ 'whisper_lang_code': 'es',
522
  'voice_id': 'Enrique',
523
  'gender': 'Male',
524
  'neural': 'No',
525
  'standard': 'Yes'},
526
  {'language': 'Spanish (Mexican)',
527
  'lang_code': 'es-MX',
528
+ 'whisper_lang_code': 'es',
529
  'voice_id': 'Mia',
530
  'gender': 'Female',
531
  'neural': 'Yes',
532
  'standard': 'Yes'},
533
  {'language': 'Spanish (US)',
534
  'lang_code': 'es-US',
535
+ 'whisper_lang_code': 'es',
536
  'voice_id': 'Lupe',
537
  'gender': 'Female',
538
  'neural': 'Yes',
539
  'standard': 'Yes'},
540
  {'language': 'Spanish (US)',
541
  'lang_code': 'es-US',
542
+ 'whisper_lang_code': 'es',
543
  'voice_id': 'Penelope',
544
  'gender': 'Female',
545
  'neural': 'No',
546
  'standard': 'Yes'},
547
  {'language': 'Spanish (US)',
548
  'lang_code': 'es-US',
549
+ 'whisper_lang_code': 'es',
550
  'voice_id': 'Miguel',
551
  'gender': 'Male',
552
  'neural': 'No',
553
  'standard': 'Yes'},
554
  {'language': 'Spanish (US)',
555
  'lang_code': 'es-US',
556
+ 'whisper_lang_code': 'es',
557
  'voice_id': 'Pedro',
558
  'gender': 'Male',
559
  'neural': 'Yes',
560
  'standard': 'No'},
561
  {'language': 'Swedish',
562
  'lang_code': 'sv-SE',
563
+ 'whisper_lang_code': 'sv',
564
  'voice_id': 'Astrid',
565
  'gender': 'Female',
566
  'neural': 'No',
567
  'standard': 'Yes'},
568
  {'language': 'Swedish',
569
  'lang_code': 'sv-SE',
570
+ 'whisper_lang_code': 'sv',
571
  'voice_id': 'Elin',
572
  'gender': 'Female',
573
  'neural': 'Yes',
574
  'standard': 'No'},
575
  {'language': 'Turkish',
576
  'lang_code': 'tr-TR',
577
+ 'whisper_lang_code': 'tr',
578
  'voice_id': 'Filiz',
579
  'gender': 'Female',
580
  'neural': 'No',
581
  'standard': 'Yes'},
582
  {'language': 'Welsh',
583
  'lang_code': 'cy-GB',
584
+ 'whisper_lang_code': 'cy',
585
  'voice_id': 'Gwyneth',
586
  'gender': 'Female',
587
  'neural': 'No',
 
616
 
617
  voice_id, language_code, engine = polly_voice_data.get_voice('Hindi', 'Male')
618
  print('Hindi', 'Male', voice_id, language_code, engine)
619
+
620
+ whisper_lang_code = polly_voice_data.get_whisper_lang_code('English (US)')
621
+ print('English (US) whisper_lang_code:', whisper_lang_code)
622
+
623
+ whisper_lang_code = polly_voice_data.get_whisper_lang_code('Chinese (Mandarin)')
624
+ print('Chinese (Mandarin) whisper_lang_code:', whisper_lang_code)
625
+
626
+ whisper_lang_code = polly_voice_data.get_whisper_lang_code('Norwegian')
627
+ print('Norwegian whisper_lang_code:', whisper_lang_code)
628
+
629
+ whisper_lang_code = polly_voice_data.get_whisper_lang_code('Dutch')
630
+ print('Dutch whisper_lang_code:', whisper_lang_code)
631
+
632
+ whisper_lang_code = polly_voice_data.get_whisper_lang_code('Foo')
633
+ print('Foo whisper_lang_code:', whisper_lang_code)
634
+
635
+