caoldr commited on Oct 9, 2023

Commit

9eb06e6

1 Parent(s): b2d1eb5

adding missing files

Browse files

Files changed (43) hide show

.gitattributes +2 -1
.gitignore +1 -0
README.md +88 -0
added_tokens.json +109 -0
all_results.json +12 -0
eval_results.json +8 -0
merges.txt +0 -0
normalizer.json +1742 -0
preprocessor_config.json +0 -0
pytorch_model.bin +3 -0
run.sh +48 -0
run_speech_recognition_seq2seq_streaming.py +769 -0
runs/Dec18_19-31-26_150-136-92-72/1671392859.803059/events.out.tfevents.1671392859.150-136-92-72.3522376.1 +3 -0
runs/Dec18_19-31-26_150-136-92-72/events.out.tfevents.1671392859.150-136-92-72.3522376.0 +3 -0
runs/Dec18_19-31-26_150-136-92-72/events.out.tfevents.1671450244.150-136-92-72.3522376.2 +3 -0
special_tokens_map.json +133 -0
tokenizer_config.json +36 -0
train_results.json +7 -0
trainer_state.json +2515 -0
training_args.bin +3 -0
vocab.json +0 -0
~/.cache/models--openai--whisper-medium/.no_exist/a0b3589e1034234495a1b696c28d4832cdaf8a32/generation_config.json +0 -0
~/.cache/models--openai--whisper-medium/.no_exist/a0b3589e1034234495a1b696c28d4832cdaf8a32/tokenizer.json +0 -0
~/.cache/models--openai--whisper-medium/blobs/0f3456460629e21d559c6daa23ab6ce3644e8271 +0 -0
~/.cache/models--openai--whisper-medium/blobs/3a00c89ee5e8ae0cb159a6ec838843fb2266fac6 +0 -0
~/.cache/models--openai--whisper-medium/blobs/47e9dd31523ecea227504afad3870da1cfe5ad81 +109 -0
~/.cache/models--openai--whisper-medium/blobs/5e6c8377adf6019428b34a1ad906fb43de71d387 +36 -0
~/.cache/models--openai--whisper-medium/blobs/9115b6806f75d5122486b0e1ae0279a0207199c2 +133 -0
~/.cache/models--openai--whisper-medium/blobs/96d734d68ad5d63c8f41d525f5769788432f6963f32dbe36feefaa33d736a962 +3 -0
~/.cache/models--openai--whisper-medium/blobs/c2048dfa9fd94a052e62e908d2c4dfb18534b4d2 +0 -0
~/.cache/models--openai--whisper-medium/blobs/dd6ae819ad738ac1a546e9f9282ef325c33b9ea0 +1742 -0
~/.cache/models--openai--whisper-medium/blobs/f84be5dbc1bfd09035c3fd3e01b777bc47f14a66 +142 -0
~/.cache/models--openai--whisper-medium/refs/main +1 -0
~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/added_tokens.json +1 -0
~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/config.json +1 -0
~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/merges.txt +1 -0
~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/normalizer.json +1 -0
~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/preprocessor_config.json +1 -0
~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/pytorch_model.bin +3 -0
~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/special_tokens_map.json +1 -0
~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/tokenizer_config.json +1 -0
~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/vocab.json +1 -0
~/.cache/tmp22vcmo7s +3 -0

.gitattributes CHANGED Viewed

@@ -25,7 +25,6 @@
 *.safetensors filter=lfs diff=lfs merge=lfs -text
 saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tar filter=lfs diff=lfs merge=lfs -text
 *.tflite filter=lfs diff=lfs merge=lfs -text
 *.tgz filter=lfs diff=lfs merge=lfs -text
 *.wasm filter=lfs diff=lfs merge=lfs -text
@@ -33,3 +32,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.safetensors filter=lfs diff=lfs merge=lfs -text
 saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.tar.* filter=lfs diff=lfs merge=lfs -text
 *.tflite filter=lfs diff=lfs merge=lfs -text
 *.tgz filter=lfs diff=lfs merge=lfs -text
 *.wasm filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+~/.cache/models--openai--whisper-medium/blobs/96d734d68ad5d63c8f41d525f5769788432f6963f32dbe36feefaa33d736a962 filter=lfs diff=lfs merge=lfs -text
+~/.cache/tmp22vcmo7s filter=lfs diff=lfs merge=lfs -text

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ checkpoint-*/

README.md ADDED Viewed

	@@ -0,0 +1,88 @@

+---
+language:
+- da
+license: apache-2.0
+tags:
+- generated_from_trainer
+- hf-asr-leaderboard
+- whisper-event
+datasets:
+- mozilla-foundation/common_voice_11_0
+metrics:
+- wer
+model-index:
+- name: Whisper Medium Danish (CV11 + FLEAURS)
+  results:
+  - task:
+      name: Automatic Speech Recognition
+      type: automatic-speech-recognition
+    dataset:
+      name: mozilla-foundation/common_voice_11_0
+      type: mozilla-foundation/common_voice_11_0
+      config: da
+      split: test
+    metrics:
+    - name: Wer
+      type: wer
+      value: 13.708574434508153
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# Whisper Medium Danish (CV11 + FLEAURS)
+This model is a fine-tuned version of [openai/whisper-medium](https://huggingface.co/openai/whisper-medium) on the mozilla-foundation/common_voice_11_0,google/fleurs da,da_dk dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.5814
+- Wer: 13.7086
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 8e-06
+- train_batch_size: 32
+- eval_batch_size: 8
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- lr_scheduler_warmup_steps: 500
+- training_steps: 10000
+- mixed_precision_training: Native AMP
+### Training results
+| Training Loss | Epoch | Step  | Validation Loss | Wer     |
+|:-------------:|:-----:|:-----:|:---------------:|:-------:|
+| 0.0265        | 3.14  | 1000  | 0.3690          | 14.7607 |
+| 0.0063        | 6.29  | 2000  | 0.4342          | 14.0926 |
+| 0.0016        | 9.43  | 3000  | 0.4847          | 14.3609 |
+| 0.002         | 12.58 | 4000  | 0.4919          | 14.1715 |
+| 0.0013        | 15.72 | 5000  | 0.5114          | 14.2294 |
+| 0.0014        | 18.87 | 6000  | 0.5197          | 13.9137 |
+| 0.0003        | 22.01 | 7000  | 0.5422          | 14.1978 |
+| 0.0001        | 25.16 | 8000  | 0.5659          | 13.8716 |
+| 0.0001        | 28.3  | 9000  | 0.5772          | 13.7296 |
+| 0.0001        | 31.45 | 10000 | 0.5814          | 13.7086 |
+### Framework versions
+- Transformers 4.26.0.dev0
+- Pytorch 1.13.1+cu117
+- Datasets 2.7.1.dev0
+- Tokenizers 0.13.2

added_tokens.json ADDED Viewed

	@@ -0,0 +1,109 @@

+{
+  "<|af|>": 50327,
+  "<|am|>": 50334,
+  "<|ar|>": 50272,
+  "<|as|>": 50350,
+  "<|az|>": 50304,
+  "<|ba|>": 50355,
+  "<|be|>": 50330,
+  "<|bg|>": 50292,
+  "<|bn|>": 50302,
+  "<|bo|>": 50347,
+  "<|br|>": 50309,
+  "<|bs|>": 50315,
+  "<|ca|>": 50270,
+  "<|cs|>": 50283,
+  "<|cy|>": 50297,
+  "<|da|>": 50285,
+  "<|de|>": 50261,
+  "<|el|>": 50281,
+  "<|endoftext|>": 50257,
+  "<|en|>": 50259,
+  "<|es|>": 50262,
+  "<|et|>": 50307,
+  "<|eu|>": 50310,
+  "<|fa|>": 50300,
+  "<|fi|>": 50277,
+  "<|fo|>": 50338,
+  "<|fr|>": 50265,
+  "<|gl|>": 50319,
+  "<|gu|>": 50333,
+  "<|haw|>": 50352,
+  "<|ha|>": 50354,
+  "<|hi|>": 50276,
+  "<|hr|>": 50291,
+  "<|ht|>": 50339,
+  "<|hu|>": 50286,
+  "<|hy|>": 50312,
+  "<|id|>": 50275,
+  "<|is|>": 50311,
+  "<|it|>": 50274,
+  "<|iw|>": 50279,
+  "<|ja|>": 50266,
+  "<|jw|>": 50356,
+  "<|ka|>": 50329,
+  "<|kk|>": 50316,
+  "<|km|>": 50323,
+  "<|kn|>": 50306,
+  "<|ko|>": 50264,
+  "<|la|>": 50294,
+  "<|lb|>": 50345,
+  "<|ln|>": 50353,
+  "<|lo|>": 50336,
+  "<|lt|>": 50293,
+  "<|lv|>": 50301,
+  "<|mg|>": 50349,
+  "<|mi|>": 50295,
+  "<|mk|>": 50308,
+  "<|ml|>": 50296,
+  "<|mn|>": 50314,
+  "<|mr|>": 50320,
+  "<|ms|>": 50282,
+  "<|mt|>": 50343,
+  "<|my|>": 50346,
+  "<|ne|>": 50313,
+  "<|nl|>": 50271,
+  "<|nn|>": 50342,
+  "<|nocaptions|>": 50362,
+  "<|notimestamps|>": 50363,
+  "<|no|>": 50288,
+  "<|oc|>": 50328,
+  "<|pa|>": 50321,
+  "<|pl|>": 50269,
+  "<|ps|>": 50340,
+  "<|pt|>": 50267,
+  "<|ro|>": 50284,
+  "<|ru|>": 50263,
+  "<|sa|>": 50344,
+  "<|sd|>": 50332,
+  "<|si|>": 50322,
+  "<|sk|>": 50298,
+  "<|sl|>": 50305,
+  "<|sn|>": 50324,
+  "<|so|>": 50326,
+  "<|sq|>": 50317,
+  "<|sr|>": 50303,
+  "<|startoflm|>": 50360,
+  "<|startofprev|>": 50361,
+  "<|startoftranscript|>": 50258,
+  "<|su|>": 50357,
+  "<|sv|>": 50273,
+  "<|sw|>": 50318,
+  "<|ta|>": 50287,
+  "<|te|>": 50299,
+  "<|tg|>": 50331,
+  "<|th|>": 50289,
+  "<|tk|>": 50341,
+  "<|tl|>": 50348,
+  "<|transcribe|>": 50359,
+  "<|translate|>": 50358,
+  "<|tr|>": 50268,
+  "<|tt|>": 50351,
+  "<|uk|>": 50280,
+  "<|ur|>": 50290,
+  "<|uz|>": 50337,
+  "<|vi|>": 50278,
+  "<|yi|>": 50335,
+  "<|yo|>": 50325,
+  "<|zh|>": 50260
+}

all_results.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+    "epoch": 31.45,
+    "eval_loss": 0.5813759565353394,
+    "eval_runtime": 1248.5474,
+    "eval_samples_per_second": 1.708,
+    "eval_steps_per_second": 0.214,
+    "eval_wer": 13.708574434508153,
+    "train_loss": 0.0230206538159051,
+    "train_runtime": 56008.0991,
+    "train_samples_per_second": 5.713,
+    "train_steps_per_second": 0.179
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 31.45,
+    "eval_loss": 0.5813759565353394,
+    "eval_runtime": 1248.5474,
+    "eval_samples_per_second": 1.708,
+    "eval_steps_per_second": 0.214,
+    "eval_wer": 13.708574434508153
+}

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

normalizer.json ADDED Viewed

	@@ -0,0 +1,1742 @@

+{
+  "accessorise": "accessorize",
+  "accessorised": "accessorized",
+  "accessorises": "accessorizes",
+  "accessorising": "accessorizing",
+  "acclimatisation": "acclimatization",
+  "acclimatise": "acclimatize",
+  "acclimatised": "acclimatized",
+  "acclimatises": "acclimatizes",
+  "acclimatising": "acclimatizing",
+  "accoutrements": "accouterments",
+  "aeon": "eon",
+  "aeons": "eons",
+  "aerogramme": "aerogram",
+  "aerogrammes": "aerograms",
+  "aeroplane": "airplane",
+  "aeroplanes": "airplanes",
+  "aesthete": "esthete",
+  "aesthetes": "esthetes",
+  "aesthetic": "esthetic",
+  "aesthetically": "esthetically",
+  "aesthetics": "esthetics",
+  "aetiology": "etiology",
+  "ageing": "aging",
+  "aggrandisement": "aggrandizement",
+  "agonise": "agonize",
+  "agonised": "agonized",
+  "agonises": "agonizes",
+  "agonising": "agonizing",
+  "agonisingly": "agonizingly",
+  "almanack": "almanac",
+  "almanacks": "almanacs",
+  "aluminium": "aluminum",
+  "amortisable": "amortizable",
+  "amortisation": "amortization",
+  "amortisations": "amortizations",
+  "amortise": "amortize",
+  "amortised": "amortized",
+  "amortises": "amortizes",
+  "amortising": "amortizing",
+  "amphitheatre": "amphitheater",
+  "amphitheatres": "amphitheaters",
+  "anaemia": "anemia",
+  "anaemic": "anemic",
+  "anaesthesia": "anesthesia",
+  "anaesthetic": "anesthetic",
+  "anaesthetics": "anesthetics",
+  "anaesthetise": "anesthetize",
+  "anaesthetised": "anesthetized",
+  "anaesthetises": "anesthetizes",
+  "anaesthetising": "anesthetizing",
+  "anaesthetist": "anesthetist",
+  "anaesthetists": "anesthetists",
+  "anaesthetize": "anesthetize",
+  "anaesthetized": "anesthetized",
+  "anaesthetizes": "anesthetizes",
+  "anaesthetizing": "anesthetizing",
+  "analogue": "analog",
+  "analogues": "analogs",
+  "analyse": "analyze",
+  "analysed": "analyzed",
+  "analyses": "analyzes",
+  "analysing": "analyzing",
+  "anglicise": "anglicize",
+  "anglicised": "anglicized",
+  "anglicises": "anglicizes",
+  "anglicising": "anglicizing",
+  "annualised": "annualized",
+  "antagonise": "antagonize",
+  "antagonised": "antagonized",
+  "antagonises": "antagonizes",
+  "antagonising": "antagonizing",
+  "apologise": "apologize",
+  "apologised": "apologized",
+  "apologises": "apologizes",
+  "apologising": "apologizing",
+  "appal": "appall",
+  "appals": "appalls",
+  "appetiser": "appetizer",
+  "appetisers": "appetizers",
+  "appetising": "appetizing",
+  "appetisingly": "appetizingly",
+  "arbour": "arbor",
+  "arbours": "arbors",
+  "archaeologically": "archeologically",
+  "archaeologist": "archeologist",
+  "archaeologists": "archeologists",
+  "archaeology": "archeology</span>",
+  "archeological": "archaeological",
+  "ardour": "ardor",
+  "armour": "armor",
+  "armoured": "armored",
+  "armourer": "armorer",
+  "armourers": "armorers",
+  "armouries": "armories",
+  "armoury": "armory",
+  "artefact": "artifact",
+  "artefacts": "artifacts",
+  "authorise": "authorize",
+  "authorised": "authorized",
+  "authorises": "authorizes",
+  "authorising": "authorizing",
+  "axe": "ax",
+  "backpedalled": "backpedaled",
+  "backpedalling": "backpedaling",
+  "bannister": "banister",
+  "bannisters": "banisters",
+  "baptise": "baptize",
+  "baptised": "baptized",
+  "baptises": "baptizes",
+  "baptising": "baptizing",
+  "bastardise": "bastardize",
+  "bastardised": "bastardized",
+  "bastardises": "bastardizes",
+  "bastardising": "bastardizing",
+  "battleax": "battleaxe",
+  "baulk": "balk",
+  "baulked": "balked",
+  "baulking": "balking",
+  "baulks": "balks",
+  "bedevilled": "bedeviled",
+  "bedevilling": "bedeviling",
+  "behaviour": "behavior",
+  "behavioural": "behavioral",
+  "behaviourism": "behaviorism",
+  "behaviourist": "behaviorist",
+  "behaviourists": "behaviorists",
+  "behaviours": "behaviors",
+  "behove": "behoove",
+  "behoved": "behooved",
+  "behoves": "behooves",
+  "bejewelled": "bejeweled",
+  "belabour": "belabor",
+  "belaboured": "belabored",
+  "belabouring": "belaboring",
+  "belabours": "belabors",
+  "bevelled": "beveled",
+  "bevvies": "bevies",
+  "bevvy": "bevy",
+  "biassed": "biased",
+  "biassing": "biasing",
+  "bingeing": "binging",
+  "bougainvillaea": "bougainvillea",
+  "bougainvillaeas": "bougainvilleas",
+  "bowdlerise": "bowdlerize",
+  "bowdlerised": "bowdlerized",
+  "bowdlerises": "bowdlerizes",
+  "bowdlerising": "bowdlerizing",
+  "breathalyse": "breathalyze",
+  "breathalysed": "breathalyzed",
+  "breathalyser": "breathalyzer",
+  "breathalysers": "breathalyzers",
+  "breathalyses": "breathalyzes",
+  "breathalysing": "breathalyzing",
+  "brutalise": "brutalize",
+  "brutalised": "brutalized",
+  "brutalises": "brutalizes",
+  "brutalising": "brutalizing",
+  "busses": "buses",
+  "bussing": "busing",
+  "caesarean": "cesarean",
+  "caesareans": "cesareans",
+  "calibre": "caliber",
+  "calibres": "calibers",
+  "calliper": "caliper",
+  "callipers": "calipers",
+  "callisthenics": "calisthenics",
+  "canalise": "canalize",
+  "canalised": "canalized",
+  "canalises": "canalizes",
+  "canalising": "canalizing",
+  "cancelation": "cancellation",
+  "cancelations": "cancellations",
+  "cancelled": "canceled",
+  "cancelling": "canceling",
+  "candour": "candor",
+  "cannibalise": "cannibalize",
+  "cannibalised": "cannibalized",
+  "cannibalises": "cannibalizes",
+  "cannibalising": "cannibalizing",
+  "canonise": "canonize",
+  "canonised": "canonized",
+  "canonises": "canonizes",
+  "canonising": "canonizing",
+  "capitalise": "capitalize",
+  "capitalised": "capitalized",
+  "capitalises": "capitalizes",
+  "capitalising": "capitalizing",
+  "caramelise": "caramelize",
+  "caramelised": "caramelized",
+  "caramelises": "caramelizes",
+  "caramelising": "caramelizing",
+  "carbonise": "carbonize",
+  "carbonised": "carbonized",
+  "carbonises": "carbonizes",
+  "carbonising": "carbonizing",
+  "carolled": "caroled",
+  "carolling": "caroling",
+  "catalogue": "catalog",
+  "catalogued": "cataloged",
+  "catalogues": "catalogs",
+  "cataloguing": "cataloging",
+  "catalyse": "catalyze",
+  "catalysed": "catalyzed",
+  "catalyses": "catalyzes",
+  "catalysing": "catalyzing",
+  "categorise": "categorize",
+  "categorised": "categorized",
+  "categorises": "categorizes",
+  "categorising": "categorizing",
+  "cauterise": "cauterize",
+  "cauterised": "cauterized",
+  "cauterises": "cauterizes",
+  "cauterising": "cauterizing",
+  "cavilled": "caviled",
+  "cavilling": "caviling",
+  "centigramme": "centigram",
+  "centigrammes": "centigrams",
+  "centilitre": "centiliter",
+  "centilitres": "centiliters",
+  "centimetre": "centimeter",
+  "centimetres": "centimeters",
+  "centralise": "centralize",
+  "centralised": "centralized",
+  "centralises": "centralizes",
+  "centralising": "centralizing",
+  "centre": "center",
+  "centred": "centered",
+  "centrefold": "centerfold",
+  "centrefolds": "centerfolds",
+  "centrepiece": "centerpiece",
+  "centrepieces": "centerpieces",
+  "centres": "centers",
+  "channelled": "channeled",
+  "channelling": "channeling",
+  "characterise": "characterize",
+  "characterised": "characterized",
+  "characterises": "characterizes",
+  "characterising": "characterizing",
+  "cheque": "check",
+  "chequebook": "checkbook",
+  "chequebooks": "checkbooks",
+  "chequered": "checkered",
+  "cheques": "checks",
+  "chilli": "chili",
+  "chimaera": "chimera",
+  "chimaeras": "chimeras",
+  "chiselled": "chiseled",
+  "chiselling": "chiseling",
+  "circularise": "circularize",
+  "circularised": "circularized",
+  "circularises": "circularizes",
+  "circularising": "circularizing",
+  "civilise": "civilize",
+  "civilised": "civilized",
+  "civilises": "civilizes",
+  "civilising": "civilizing",
+  "clamour": "clamor",
+  "clamoured": "clamored",
+  "clamouring": "clamoring",
+  "clamours": "clamors",
+  "clangour": "clangor",
+  "clarinettist": "clarinetist",
+  "clarinettists": "clarinetists",
+  "collectivise": "collectivize",
+  "collectivised": "collectivized",
+  "collectivises": "collectivizes",
+  "collectivising": "collectivizing",
+  "colonisation": "colonization",
+  "colonise": "colonize",
+  "colonised": "colonized",
+  "coloniser": "colonizer",
+  "colonisers": "colonizers",
+  "colonises": "colonizes",
+  "colonising": "colonizing",
+  "colour": "color",
+  "colourant": "colorant",
+  "colourants": "colorants",
+  "coloured": "colored",
+  "coloureds": "coloreds",
+  "colourful": "colorful",
+  "colourfully": "colorfully",
+  "colouring": "coloring",
+  "colourize": "colorize",
+  "colourized": "colorized",
+  "colourizes": "colorizes",
+  "colourizing": "colorizing",
+  "colourless": "colorless",
+  "colours": "colors",
+  "commercialise": "commercialize",
+  "commercialised": "commercialized",
+  "commercialises": "commercializes",
+  "commercialising": "commercializing",
+  "compartmentalise": "compartmentalize",
+  "compartmentalised": "compartmentalized",
+  "compartmentalises": "compartmentalizes",
+  "compartmentalising": "compartmentalizing",
+  "computerise": "computerize",
+  "computerised": "computerized",
+  "computerises": "computerizes",
+  "computerising": "computerizing",
+  "conceptualise": "conceptualize",
+  "conceptualised": "conceptualized",
+  "conceptualises": "conceptualizes",
+  "conceptualising": "conceptualizing",
+  "connexion": "connection",
+  "connexions": "connections",
+  "contextualise": "contextualize",
+  "contextualised": "contextualized",
+  "contextualises": "contextualizes",
+  "contextualising": "contextualizing",
+  "cosier": "cozier",
+  "cosies": "cozies",
+  "cosiest": "coziest",
+  "cosily": "cozily",
+  "cosiness": "coziness",
+  "cosy": "cozy",
+  "councillor": "councilor",
+  "councillors": "councilors",
+  "counselled": "counseled",
+  "counselling": "counseling",
+  "counsellor": "counselor",
+  "counsellors": "counselors",
+  "crenelated": "crenellated",
+  "criminalise": "criminalize",
+  "criminalised": "criminalized",
+  "criminalises": "criminalizes",
+  "criminalising": "criminalizing",
+  "criticise": "criticize",
+  "criticised": "criticized",
+  "criticises": "criticizes",
+  "criticising": "criticizing",
+  "crueller": "crueler",
+  "cruellest": "cruelest",
+  "crystallisation": "crystallization",
+  "crystallise": "crystallize",
+  "crystallised": "crystallized",
+  "crystallises": "crystallizes",
+  "crystallising": "crystallizing",
+  "cudgelled": "cudgeled",
+  "cudgelling": "cudgeling",
+  "customise": "customize",
+  "customised": "customized",
+  "customises": "customizes",
+  "customising": "customizing",
+  "cypher": "cipher",
+  "cyphers": "ciphers",
+  "decentralisation": "decentralization",
+  "decentralise": "decentralize",
+  "decentralised": "decentralized",
+  "decentralises": "decentralizes",
+  "decentralising": "decentralizing",
+  "decriminalisation": "decriminalization",
+  "decriminalise": "decriminalize",
+  "decriminalised": "decriminalized",
+  "decriminalises": "decriminalizes",
+  "decriminalising": "decriminalizing",
+  "defence": "defense",
+  "defenceless": "defenseless",
+  "defences": "defenses",
+  "dehumanisation": "dehumanization",
+  "dehumanise": "dehumanize",
+  "dehumanised": "dehumanized",
+  "dehumanises": "dehumanizes",
+  "dehumanising": "dehumanizing",
+  "demeanour": "demeanor",
+  "demilitarisation": "demilitarization",
+  "demilitarise": "demilitarize",
+  "demilitarised": "demilitarized",
+  "demilitarises": "demilitarizes",
+  "demilitarising": "demilitarizing",
+  "demobilisation": "demobilization",
+  "demobilise": "demobilize",
+  "demobilised": "demobilized",
+  "demobilises": "demobilizes",
+  "demobilising": "demobilizing",
+  "democratisation": "democratization",
+  "democratise": "democratize",
+  "democratised": "democratized",
+  "democratises": "democratizes",
+  "democratising": "democratizing",
+  "demonise": "demonize",
+  "demonised": "demonized",
+  "demonises": "demonizes",
+  "demonising": "demonizing",
+  "demoralisation": "demoralization",
+  "demoralise": "demoralize",
+  "demoralised": "demoralized",
+  "demoralises": "demoralizes",
+  "demoralising": "demoralizing",
+  "denationalisation": "denationalization",
+  "denationalise": "denationalize",
+  "denationalised": "denationalized",
+  "denationalises": "denationalizes",
+  "denationalising": "denationalizing",
+  "deodorise": "deodorize",
+  "deodorised": "deodorized",
+  "deodorises": "deodorizes",
+  "deodorising": "deodorizing",
+  "depersonalise": "depersonalize",
+  "depersonalised": "depersonalized",
+  "depersonalises": "depersonalizes",
+  "depersonalising": "depersonalizing",
+  "deputise": "deputize",
+  "deputised": "deputized",
+  "deputises": "deputizes",
+  "deputising": "deputizing",
+  "desensitisation": "desensitization",
+  "desensitise": "desensitize",
+  "desensitised": "desensitized",
+  "desensitises": "desensitizes",
+  "desensitising": "desensitizing",
+  "destabilisation": "destabilization",
+  "destabilise": "destabilize",
+  "destabilised": "destabilized",
+  "destabilises": "destabilizes",
+  "destabilising": "destabilizing",
+  "dialled": "dialed",
+  "dialling": "dialing",
+  "dialogue": "dialog",
+  "dialogues": "dialogs",
+  "diarrhoea": "diarrhea",
+  "digitise": "digitize",
+  "digitised": "digitized",
+  "digitises": "digitizes",
+  "digitising": "digitizing",
+  "disc": "disk",
+  "discolour": "discolor",
+  "discoloured": "discolored",
+  "discolouring": "discoloring",
+  "discolours": "discolors",
+  "discs": "disks",
+  "disembowelled": "disemboweled",
+  "disembowelling": "disemboweling",
+  "disfavour": "disfavor",
+  "dishevelled": "disheveled",
+  "dishonour": "dishonor",
+  "dishonourable": "dishonorable",
+  "dishonourably": "dishonorably",
+  "dishonoured": "dishonored",
+  "dishonouring": "dishonoring",
+  "dishonours": "dishonors",
+  "disorganisation": "disorganization",
+  "disorganised": "disorganized",
+  "distil": "distill",
+  "distils": "distills",
+  "dramatisation": "dramatization",
+  "dramatisations": "dramatizations",
+  "dramatise": "dramatize",
+  "dramatised": "dramatized",
+  "dramatises": "dramatizes",
+  "dramatising": "dramatizing",
+  "draught": "draft",
+  "draughtboard": "draftboard",
+  "draughtboards": "draftboards",
+  "draughtier": "draftier",
+  "draughtiest": "draftiest",
+  "draughts": "drafts",
+  "draughtsman": "draftsman",
+  "draughtsmanship": "draftsmanship",
+  "draughtsmen": "draftsmen",
+  "draughtswoman": "draftswoman",
+  "draughtswomen": "draftswomen",
+  "draughty": "drafty",
+  "drivelled": "driveled",
+  "drivelling": "driveling",
+  "duelled": "dueled",
+  "duelling": "dueling",
+  "economise": "economize",
+  "economised": "economized",
+  "economises": "economizes",
+  "economising": "economizing",
+  "editorialise": "editorialize",
+  "editorialised": "editorialized",
+  "editorialises": "editorializes",
+  "editorialising": "editorializing",
+  "edoema": "edema",
+  "empathise": "empathize",
+  "empathised": "empathized",
+  "empathises": "empathizes",
+  "empathising": "empathizing",
+  "emphasise": "emphasize",
+  "emphasised": "emphasized",
+  "emphasises": "emphasizes",
+  "emphasising": "emphasizing",
+  "enamelled": "enameled",
+  "enamelling": "enameling",
+  "enamoured": "enamored",
+  "encyclopaedia": "encyclopedia",
+  "encyclopaedias": "encyclopedias",
+  "encyclopaedic": "encyclopedic",
+  "endeavour": "endeavor",
+  "endeavoured": "endeavored",
+  "endeavouring": "endeavoring",
+  "endeavours": "endeavors",
+  "energise": "energize",
+  "energised": "energized",
+  "energises": "energizes",
+  "energising": "energizing",
+  "enrol": "enroll",
+  "enrols": "enrolls",
+  "enthral": "enthrall",
+  "enthrals": "enthralls",
+  "epaulette": "epaulet",
+  "epaulettes": "epaulets",
+  "epicentre": "epicenter",
+  "epicentres": "epicenters",
+  "epilogue": "epilog",
+  "epilogues": "epilogs",
+  "epitomise": "epitomize",
+  "epitomised": "epitomized",
+  "epitomises": "epitomizes",
+  "epitomising": "epitomizing",
+  "equalisation": "equalization",
+  "equalise": "equalize",
+  "equalised": "equalized",
+  "equaliser": "equalizer",
+  "equalisers": "equalizers",
+  "equalises": "equalizes",
+  "equalising": "equalizing",
+  "eulogise": "eulogize",
+  "eulogised": "eulogized",
+  "eulogises": "eulogizes",
+  "eulogising": "eulogizing",
+  "evangelise": "evangelize",
+  "evangelised": "evangelized",
+  "evangelises": "evangelizes",
+  "evangelising": "evangelizing",
+  "exorcise": "exorcize",
+  "exorcised": "exorcized",
+  "exorcises": "exorcizes",
+  "exorcising": "exorcizing",
+  "extemporisation": "extemporization",
+  "extemporise": "extemporize",
+  "extemporised": "extemporized",
+  "extemporises": "extemporizes",
+  "extemporising": "extemporizing",
+  "externalisation": "externalization",
+  "externalisations": "externalizations",
+  "externalise": "externalize",
+  "externalised": "externalized",
+  "externalises": "externalizes",
+  "externalising": "externalizing",
+  "factorise": "factorize",
+  "factorised": "factorized",
+  "factorises": "factorizes",
+  "factorising": "factorizing",
+  "faecal": "fecal",
+  "faeces": "feces",
+  "familiarisation": "familiarization",
+  "familiarise": "familiarize",
+  "familiarised": "familiarized",
+  "familiarises": "familiarizes",
+  "familiarising": "familiarizing",
+  "fantasise": "fantasize",
+  "fantasised": "fantasized",
+  "fantasises": "fantasizes",
+  "fantasising": "fantasizing",
+  "favour": "favor",
+  "favourable": "favorable",
+  "favourably": "favorably",
+  "favoured": "favored",
+  "favouring": "favoring",
+  "favourite": "favorite",
+  "favourites": "favorites",
+  "favouritism": "favoritism",
+  "favours": "favors",
+  "feminise": "feminize",
+  "feminised": "feminized",
+  "feminises": "feminizes",
+  "feminising": "feminizing",
+  "fertilisation": "fertilization",
+  "fertilise": "fertilize",
+  "fertilised": "fertilized",
+  "fertiliser": "fertilizer",
+  "fertilisers": "fertilizers",
+  "fertilises": "fertilizes",
+  "fertilising": "fertilizing",
+  "fervour": "fervor",
+  "fibre": "fiber",
+  "fibreglass": "fiberglass",
+  "fibres": "fibers",
+  "fictionalisation": "fictionalization",
+  "fictionalisations": "fictionalizations",
+  "fictionalise": "fictionalize",
+  "fictionalised": "fictionalized",
+  "fictionalises": "fictionalizes",
+  "fictionalising": "fictionalizing",
+  "fillet": "filet",
+  "filleted": "fileted",
+  "filleting": "fileting",
+  "fillets": "filets",
+  "finalisation": "finalization",
+  "finalise": "finalize",
+  "finalised": "finalized",
+  "finalises": "finalizes",
+  "finalising": "finalizing",
+  "flautist": "flutist",
+  "flautists": "flutists",
+  "flavour": "flavor",
+  "flavoured": "flavored",
+  "flavouring": "flavoring",
+  "flavourings": "flavorings",
+  "flavourless": "flavorless",
+  "flavours": "flavors",
+  "flavoursome": "flavorsome",
+  "flyer / flier": "flier / flyer",
+  "foetal": "fetal",
+  "foetid": "fetid",
+  "foetus": "fetus",
+  "foetuses": "fetuses",
+  "formalisation": "formalization",
+  "formalise": "formalize",
+  "formalised": "formalized",
+  "formalises": "formalizes",
+  "formalising": "formalizing",
+  "fossilisation": "fossilization",
+  "fossilise": "fossilize",
+  "fossilised": "fossilized",
+  "fossilises": "fossilizes",
+  "fossilising": "fossilizing",
+  "fraternisation": "fraternization",
+  "fraternise": "fraternize",
+  "fraternised": "fraternized",
+  "fraternises": "fraternizes",
+  "fraternising": "fraternizing",
+  "fulfil": "fulfill",
+  "fulfilment": "fulfillment",
+  "fulfils": "fulfills",
+  "funnelled": "funneled",
+  "funnelling": "funneling",
+  "gage": "gauge",
+  "gaged": "gauged",
+  "gages": "gauges",
+  "gaging": "gauging",
+  "galvanise": "galvanize",
+  "galvanised": "galvanized",
+  "galvanises": "galvanizes",
+  "galvanising": "galvanizing",
+  "gambolled": "gamboled",
+  "gambolling": "gamboling",
+  "gaol": "jail",
+  "gaolbird": "jailbird",
+  "gaolbirds": "jailbirds",
+  "gaolbreak": "jailbreak",
+  "gaolbreaks": "jailbreaks",
+  "gaoled": "jailed",
+  "gaoler": "jailer",
+  "gaolers": "jailers",
+  "gaoling": "jailing",
+  "gaols": "jails",
+  "gasses": "gases",
+  "generalisation": "generalization",
+  "generalisations": "generalizations",
+  "generalise": "generalize",
+  "generalised": "generalized",
+  "generalises": "generalizes",
+  "generalising": "generalizing",
+  "ghettoise": "ghettoize",
+  "ghettoised": "ghettoized",
+  "ghettoises": "ghettoizes",
+  "ghettoising": "ghettoizing",
+  "gipsies": "gypsies",
+  "glamor": "glamour",
+  "glamorise": "glamorize",
+  "glamorised": "glamorized",
+  "glamorises": "glamorizes",
+  "glamorising": "glamorizing",
+  "globalisation": "globalization",
+  "globalise": "globalize",
+  "globalised": "globalized",
+  "globalises": "globalizes",
+  "globalising": "globalizing",
+  "glueing": "gluing",
+  "goitre": "goiter",
+  "goitres": "goiters",
+  "gonorrhoea": "gonorrhea",
+  "gramme": "gram",
+  "grammes": "grams",
+  "gravelled": "graveled",
+  "grey": "gray",
+  "greyed": "grayed",
+  "greying": "graying",
+  "greyish": "grayish",
+  "greyness": "grayness",
+  "greys": "grays",
+  "grovelled": "groveled",
+  "grovelling": "groveling",
+  "groyne": "groin",
+  "groynes": "groins",
+  "gruelling": "grueling",
+  "gruellingly": "gruelingly",
+  "gryphon": "griffin",
+  "gryphons": "griffins",
+  "gynaecological": "gynecological",
+  "gynaecologist": "gynecologist",
+  "gynaecologists": "gynecologists",
+  "gynaecology": "gynecology",
+  "haematological": "hematological",
+  "haematologist": "hematologist",
+  "haematologists": "hematologists",
+  "haematology": "hematology",
+  "haemoglobin": "hemoglobin",
+  "haemophilia": "hemophilia",
+  "haemophiliac": "hemophiliac",
+  "haemophiliacs": "hemophiliacs",
+  "haemorrhage": "hemorrhage",
+  "haemorrhaged": "hemorrhaged",
+  "haemorrhages": "hemorrhages",
+  "haemorrhaging": "hemorrhaging",
+  "haemorrhoids": "hemorrhoids",
+  "harbour": "harbor",
+  "harboured": "harbored",
+  "harbouring": "harboring",
+  "harbours": "harbors",
+  "harmonisation": "harmonization",
+  "harmonise": "harmonize",
+  "harmonised": "harmonized",
+  "harmonises": "harmonizes",
+  "harmonising": "harmonizing",
+  "homoeopath": "homeopath",
+  "homoeopathic": "homeopathic",
+  "homoeopaths": "homeopaths",
+  "homoeopathy": "homeopathy",
+  "homogenise": "homogenize",
+  "homogenised": "homogenized",
+  "homogenises": "homogenizes",
+  "homogenising": "homogenizing",
+  "honour": "honor",
+  "honourable": "honorable",
+  "honourably": "honorably",
+  "honoured": "honored",
+  "honouring": "honoring",
+  "honours": "honors",
+  "hospitalisation": "hospitalization",
+  "hospitalise": "hospitalize",
+  "hospitalised": "hospitalized",
+  "hospitalises": "hospitalizes",
+  "hospitalising": "hospitalizing",
+  "humanise": "humanize",
+  "humanised": "humanized",
+  "humanises": "humanizes",
+  "humanising": "humanizing",
+  "humour": "humor",
+  "humoured": "humored",
+  "humouring": "humoring",
+  "humourless": "humorless",
+  "humours": "humors",
+  "hybridise": "hybridize",
+  "hybridised": "hybridized",
+  "hybridises": "hybridizes",
+  "hybridising": "hybridizing",
+  "hypnotise": "hypnotize",
+  "hypnotised": "hypnotized",
+  "hypnotises": "hypnotizes",
+  "hypnotising": "hypnotizing",
+  "hypothesise": "hypothesize",
+  "hypothesised": "hypothesized",
+  "hypothesises": "hypothesizes",
+  "hypothesising": "hypothesizing",
+  "idealisation": "idealization",
+  "idealise": "idealize",
+  "idealised": "idealized",
+  "idealises": "idealizes",
+  "idealising": "idealizing",
+  "idolise": "idolize",
+  "idolised": "idolized",
+  "idolises": "idolizes",
+  "idolising": "idolizing",
+  "immobilisation": "immobilization",
+  "immobilise": "immobilize",
+  "immobilised": "immobilized",
+  "immobiliser": "immobilizer",
+  "immobilisers": "immobilizers",
+  "immobilises": "immobilizes",
+  "immobilising": "immobilizing",
+  "immortalise": "immortalize",
+  "immortalised": "immortalized",
+  "immortalises": "immortalizes",
+  "immortalising": "immortalizing",
+  "immunisation": "immunization",
+  "immunise": "immunize",
+  "immunised": "immunized",
+  "immunises": "immunizes",
+  "immunising": "immunizing",
+  "impanelled": "impaneled",
+  "impanelling": "impaneling",
+  "imperilled": "imperiled",
+  "imperilling": "imperiling",
+  "individualise": "individualize",
+  "individualised": "individualized",
+  "individualises": "individualizes",
+  "individualising": "individualizing",
+  "industrialise": "industrialize",
+  "industrialised": "industrialized",
+  "industrialises": "industrializes",
+  "industrialising": "industrializing",
+  "inflexion": "inflection",
+  "inflexions": "inflections",
+  "initialise": "initialize",
+  "initialised": "initialized",
+  "initialises": "initializes",
+  "initialising": "initializing",
+  "initialled": "initialed",
+  "initialling": "initialing",
+  "instal": "install",
+  "instalment": "installment",
+  "instalments": "installments",
+  "instals": "installs",
+  "instil": "instill",
+  "instils": "instills",
+  "institutionalisation": "institutionalization",
+  "institutionalise": "institutionalize",
+  "institutionalised": "institutionalized",
+  "institutionalises": "institutionalizes",
+  "institutionalising": "institutionalizing",
+  "intellectualise": "intellectualize",
+  "intellectualised": "intellectualized",
+  "intellectualises": "intellectualizes",
+  "intellectualising": "intellectualizing",
+  "internalisation": "internalization",
+  "internalise": "internalize",
+  "internalised": "internalized",
+  "internalises": "internalizes",
+  "internalising": "internalizing",
+  "internationalisation": "internationalization",
+  "internationalise": "internationalize",
+  "internationalised": "internationalized",
+  "internationalises": "internationalizes",
+  "internationalising": "internationalizing",
+  "ionisation": "ionization",
+  "ionise": "ionize",
+  "ionised": "ionized",
+  "ioniser": "ionizer",
+  "ionisers": "ionizers",
+  "ionises": "ionizes",
+  "ionising": "ionizing",
+  "italicise": "italicize",
+  "italicised": "italicized",
+  "italicises": "italicizes",
+  "italicising": "italicizing",
+  "itemise": "itemize",
+  "itemised": "itemized",
+  "itemises": "itemizes",
+  "itemising": "itemizing",
+  "jeopardise": "jeopardize",
+  "jeopardised": "jeopardized",
+  "jeopardises": "jeopardizes",
+  "jeopardising": "jeopardizing",
+  "jewelled": "jeweled",
+  "jeweller": "jeweler",
+  "jewellers": "jewelers",
+  "jewellery": "jewelry",
+  "judgement": "judgment",
+  "kilogramme": "kilogram",
+  "kilogrammes": "kilograms",
+  "kilometre": "kilometer",
+  "kilometres": "kilometers",
+  "labelled": "labeled",
+  "labelling": "labeling",
+  "labour": "labor",
+  "laboured": "labored",
+  "labourer": "laborer",
+  "labourers": "laborers",
+  "labouring": "laboring",
+  "labours": "labors",
+  "lacklustre": "lackluster",
+  "legalisation": "legalization",
+  "legalise": "legalize",
+  "legalised": "legalized",
+  "legalises": "legalizes",
+  "legalising": "legalizing",
+  "legitimise": "legitimize",
+  "legitimised": "legitimized",
+  "legitimises": "legitimizes",
+  "legitimising": "legitimizing",
+  "leukaemia": "leukemia",
+  "levelled": "leveled",
+  "leveller": "leveler",
+  "levellers": "levelers",
+  "levelling": "leveling",
+  "libelled": "libeled",
+  "libelling": "libeling",
+  "libellous": "libelous",
+  "liberalisation": "liberalization",
+  "liberalise": "liberalize",
+  "liberalised": "liberalized",
+  "liberalises": "liberalizes",
+  "liberalising": "liberalizing",
+  "licence": "license",
+  "licenced": "licensed",
+  "licences": "licenses",
+  "licencing": "licensing",
+  "likeable": "likable",
+  "lionisation": "lionization",
+  "lionise": "lionize",
+  "lionised": "lionized",
+  "lionises": "lionizes",
+  "lionising": "lionizing",
+  "liquidise": "liquidize",
+  "liquidised": "liquidized",
+  "liquidiser": "liquidizer",
+  "liquidisers": "liquidizers",
+  "liquidises": "liquidizes",
+  "liquidising": "liquidizing",
+  "litre": "liter",
+  "litres": "liters",
+  "localise": "localize",
+  "localised": "localized",
+  "localises": "localizes",
+  "localising": "localizing",
+  "louvre": "louver",
+  "louvred": "louvered",
+  "louvres": "louvers",
+  "lustre": "luster",
+  "magnetise": "magnetize",
+  "magnetised": "magnetized",
+  "magnetises": "magnetizes",
+  "magnetising": "magnetizing",
+  "manoeuvrability": "maneuverability",
+  "manoeuvrable": "maneuverable",
+  "manoeuvre": "maneuver",
+  "manoeuvred": "maneuvered",
+  "manoeuvres": "maneuvers",
+  "manoeuvring": "maneuvering",
+  "manoeuvrings": "maneuverings",
+  "marginalisation": "marginalization",
+  "marginalise": "marginalize",
+  "marginalised": "marginalized",
+  "marginalises": "marginalizes",
+  "marginalising": "marginalizing",
+  "marshalled": "marshaled",
+  "marshalling": "marshaling",
+  "marvelled": "marveled",
+  "marvelling": "marveling",
+  "marvellous": "marvelous",
+  "marvellously": "marvelously",
+  "materialisation": "materialization",
+  "materialise": "materialize",
+  "materialised": "materialized",
+  "materialises": "materializes",
+  "materialising": "materializing",
+  "maximisation": "maximization",
+  "maximise": "maximize",
+  "maximised": "maximized",
+  "maximises": "maximizes",
+  "maximising": "maximizing",
+  "meagre": "meager",
+  "mechanisation": "mechanization",
+  "mechanise": "mechanize",
+  "mechanised": "mechanized",
+  "mechanises": "mechanizes",
+  "mechanising": "mechanizing",
+  "mediaeval": "medieval",
+  "memorialise": "memorialize",
+  "memorialised": "memorialized",
+  "memorialises": "memorializes",
+  "memorialising": "memorializing",
+  "memorise": "memorize",
+  "memorised": "memorized",
+  "memorises": "memorizes",
+  "memorising": "memorizing",
+  "mesmerise": "mesmerize",
+  "mesmerised": "mesmerized",
+  "mesmerises": "mesmerizes",
+  "mesmerising": "mesmerizing",
+  "metabolise": "metabolize",
+  "metabolised": "metabolized",
+  "metabolises": "metabolizes",
+  "metabolising": "metabolizing",
+  "metre": "meter",
+  "metres": "meters",
+  "mhm": "hmm",
+  "micrometre": "micrometer",
+  "micrometres": "micrometers",
+  "militarise": "militarize",
+  "militarised": "militarized",
+  "militarises": "militarizes",
+  "militarising": "militarizing",
+  "milligramme": "milligram",
+  "milligrammes": "milligrams",
+  "millilitre": "milliliter",
+  "millilitres": "milliliters",
+  "millimetre": "millimeter",
+  "millimetres": "millimeters",
+  "miniaturisation": "miniaturization",
+  "miniaturise": "miniaturize",
+  "miniaturised": "miniaturized",
+  "miniaturises": "miniaturizes",
+  "miniaturising": "miniaturizing",
+  "minibusses": "minibuses",
+  "minimise": "minimize",
+  "minimised": "minimized",
+  "minimises": "minimizes",
+  "minimising": "minimizing",
+  "misbehaviour": "misbehavior",
+  "misdemeanour": "misdemeanor",
+  "misdemeanours": "misdemeanors",
+  "misspelt": "misspelled",
+  "mitre": "miter",
+  "mitres": "miters",
+  "mm": "hmm",
+  "mmm": "hmm",
+  "mobilisation": "mobilization",
+  "mobilise": "mobilize",
+  "mobilised": "mobilized",
+  "mobilises": "mobilizes",
+  "mobilising": "mobilizing",
+  "modelled": "modeled",
+  "modeller": "modeler",
+  "modellers": "modelers",
+  "modelling": "modeling",
+  "modernise": "modernize",
+  "modernised": "modernized",
+  "modernises": "modernizes",
+  "modernising": "modernizing",
+  "moisturise": "moisturize",
+  "moisturised": "moisturized",
+  "moisturiser": "moisturizer",
+  "moisturisers": "moisturizers",
+  "moisturises": "moisturizes",
+  "moisturising": "moisturizing",
+  "monologue": "monolog",
+  "monologues": "monologs",
+  "monopolisation": "monopolization",
+  "monopolise": "monopolize",
+  "monopolised": "monopolized",
+  "monopolises": "monopolizes",
+  "monopolising": "monopolizing",
+  "moralise": "moralize",
+  "moralised": "moralized",
+  "moralises": "moralizes",
+  "moralising": "moralizing",
+  "motorised": "motorized",
+  "mould": "mold",
+  "moulded": "molded",
+  "moulder": "molder",
+  "mouldered": "moldered",
+  "mouldering": "moldering",
+  "moulders": "molders",
+  "mouldier": "moldier",
+  "mouldiest": "moldiest",
+  "moulding": "molding",
+  "mouldings": "moldings",
+  "moulds": "molds",
+  "mouldy": "moldy",
+  "moult": "molt",
+  "moulted": "molted",
+  "moulting": "molting",
+  "moults": "molts",
+  "moustache": "mustache",
+  "moustached": "mustached",
+  "moustaches": "mustaches",
+  "moustachioed": "mustachioed",
+  "multicoloured": "multicolored",
+  "nationalisation": "nationalization",
+  "nationalisations": "nationalizations",
+  "nationalise": "nationalize",
+  "nationalised": "nationalized",
+  "nationalises": "nationalizes",
+  "nationalising": "nationalizing",
+  "naturalisation": "naturalization",
+  "naturalise": "naturalize",
+  "naturalised": "naturalized",
+  "naturalises": "naturalizes",
+  "naturalising": "naturalizing",
+  "neighbour": "neighbor",
+  "neighbourhood": "neighborhood",
+  "neighbourhoods": "neighborhoods",
+  "neighbouring": "neighboring",
+  "neighbourliness": "neighborliness",
+  "neighbourly": "neighborly",
+  "neighbours": "neighbors",
+  "neutralisation": "neutralization",
+  "neutralise": "neutralize",
+  "neutralised": "neutralized",
+  "neutralises": "neutralizes",
+  "neutralising": "neutralizing",
+  "normalisation": "normalization",
+  "normalise": "normalize",
+  "normalised": "normalized",
+  "normalises": "normalizes",
+  "normalising": "normalizing",
+  "odour": "odor",
+  "odourless": "odorless",
+  "odours": "odors",
+  "oesophagus": "esophagus",
+  "oesophaguses": "esophaguses",
+  "oestrogen": "estrogen",
+  "offence": "offense",
+  "offences": "offenses",
+  "omelette": "omelet",
+  "omelettes": "omelets",
+  "optimise": "optimize",
+  "optimised": "optimized",
+  "optimises": "optimizes",
+  "optimising": "optimizing",
+  "organisation": "organization",
+  "organisational": "organizational",
+  "organisations": "organizations",
+  "organise": "organize",
+  "organised": "organized",
+  "organiser": "organizer",
+  "organisers": "organizers",
+  "organises": "organizes",
+  "organising": "organizing",
+  "orthopaedic": "orthopedic",
+  "orthopaedics": "orthopedics",
+  "ostracise": "ostracize",
+  "ostracised": "ostracized",
+  "ostracises": "ostracizes",
+  "ostracising": "ostracizing",
+  "outmanoeuvre": "outmaneuver",
+  "outmanoeuvred": "outmaneuvered",
+  "outmanoeuvres": "outmaneuvers",
+  "outmanoeuvring": "outmaneuvering",
+  "overemphasise": "overemphasize",
+  "overemphasised": "overemphasized",
+  "overemphasises": "overemphasizes",
+  "overemphasising": "overemphasizing",
+  "oxidisation": "oxidization",
+  "oxidise": "oxidize",
+  "oxidised": "oxidized",
+  "oxidises": "oxidizes",
+  "oxidising": "oxidizing",
+  "paederast": "pederast",
+  "paederasts": "pederasts",
+  "paediatric": "pediatric",
+  "paediatrician": "pediatrician",
+  "paediatricians": "pediatricians",
+  "paediatrics": "pediatrics",
+  "paedophile": "pedophile",
+  "paedophiles": "pedophiles",
+  "paedophilia": "pedophilia",
+  "palaeolithic": "paleolithic",
+  "palaeontologist": "paleontologist",
+  "palaeontologists": "paleontologists",
+  "palaeontology": "paleontology",
+  "panelled": "paneled",
+  "panelling": "paneling",
+  "panellist": "panelist",
+  "panellists": "panelists",
+  "paralyse": "paralyze",
+  "paralysed": "paralyzed",
+  "paralyses": "paralyzes",
+  "paralysing": "paralyzing",
+  "parcelled": "parceled",
+  "parcelling": "parceling",
+  "parlour": "parlor",
+  "parlours": "parlors",
+  "particularise": "particularize",
+  "particularised": "particularized",
+  "particularises": "particularizes",
+  "particularising": "particularizing",
+  "passivisation": "passivization",
+  "passivise": "passivize",
+  "passivised": "passivized",
+  "passivises": "passivizes",
+  "passivising": "passivizing",
+  "pasteurisation": "pasteurization",
+  "pasteurise": "pasteurize",
+  "pasteurised": "pasteurized",
+  "pasteurises": "pasteurizes",
+  "pasteurising": "pasteurizing",
+  "patronise": "patronize",
+  "patronised": "patronized",
+  "patronises": "patronizes",
+  "patronising": "patronizing",
+  "patronisingly": "patronizingly",
+  "pedalled": "pedaled",
+  "pedalling": "pedaling",
+  "pedestrianisation": "pedestrianization",
+  "pedestrianise": "pedestrianize",
+  "pedestrianised": "pedestrianized",
+  "pedestrianises": "pedestrianizes",
+  "pedestrianising": "pedestrianizing",
+  "penalise": "penalize",
+  "penalised": "penalized",
+  "penalises": "penalizes",
+  "penalising": "penalizing",
+  "pencilled": "penciled",
+  "pencilling": "penciling",
+  "personalise": "personalize",
+  "personalised": "personalized",
+  "personalises": "personalizes",
+  "personalising": "personalizing",
+  "pharmacopoeia": "pharmacopeia",
+  "pharmacopoeias": "pharmacopeias",
+  "philosophise": "philosophize",
+  "philosophised": "philosophized",
+  "philosophises": "philosophizes",
+  "philosophising": "philosophizing",
+  "philtre": "filter",
+  "philtres": "filters",
+  "phoney": "phony",
+  "plagiarise": "plagiarize",
+  "plagiarised": "plagiarized",
+  "plagiarises": "plagiarizes",
+  "plagiarising": "plagiarizing",
+  "plough": "plow",
+  "ploughed": "plowed",
+  "ploughing": "plowing",
+  "ploughman": "plowman",
+  "ploughmen": "plowmen",
+  "ploughs": "plows",
+  "ploughshare": "plowshare",
+  "ploughshares": "plowshares",
+  "polarisation": "polarization",
+  "polarise": "polarize",
+  "polarised": "polarized",
+  "polarises": "polarizes",
+  "polarising": "polarizing",
+  "politicisation": "politicization",
+  "politicise": "politicize",
+  "politicised": "politicized",
+  "politicises": "politicizes",
+  "politicising": "politicizing",
+  "popularisation": "popularization",
+  "popularise": "popularize",
+  "popularised": "popularized",
+  "popularises": "popularizes",
+  "popularising": "popularizing",
+  "pouffe": "pouf",
+  "pouffes": "poufs",
+  "practise": "practice",
+  "practised": "practiced",
+  "practises": "practices",
+  "practising": "practicing",
+  "praesidium": "presidium",
+  "praesidiums": "presidiums",
+  "pressurisation": "pressurization",
+  "pressurise": "pressurize",
+  "pressurised": "pressurized",
+  "pressurises": "pressurizes",
+  "pressurising": "pressurizing",
+  "pretence": "pretense",
+  "pretences": "pretenses",
+  "primaeval": "primeval",
+  "prioritisation": "prioritization",
+  "prioritise": "prioritize",
+  "prioritised": "prioritized",
+  "prioritises": "prioritizes",
+  "prioritising": "prioritizing",
+  "privatisation": "privatization",
+  "privatisations": "privatizations",
+  "privatise": "privatize",
+  "privatised": "privatized",
+  "privatises": "privatizes",
+  "privatising": "privatizing",
+  "professionalisation": "professionalization",
+  "professionalise": "professionalize",
+  "professionalised": "professionalized",
+  "professionalises": "professionalizes",
+  "professionalising": "professionalizing",
+  "programme": "program",
+  "programmes": "programs",
+  "prologue": "prolog",
+  "prologues": "prologs",
+  "propagandise": "propagandize",
+  "propagandised": "propagandized",
+  "propagandises": "propagandizes",
+  "propagandising": "propagandizing",
+  "proselytise": "proselytize",
+  "proselytised": "proselytized",
+  "proselytiser": "proselytizer",
+  "proselytisers": "proselytizers",
+  "proselytises": "proselytizes",
+  "proselytising": "proselytizing",
+  "psychoanalyse": "psychoanalyze",
+  "psychoanalysed": "psychoanalyzed",
+  "psychoanalyses": "psychoanalyzes",
+  "psychoanalysing": "psychoanalyzing",
+  "publicise": "publicize",
+  "publicised": "publicized",
+  "publicises": "publicizes",
+  "publicising": "publicizing",
+  "pulverisation": "pulverization",
+  "pulverise": "pulverize",
+  "pulverised": "pulverized",
+  "pulverises": "pulverizes",
+  "pulverising": "pulverizing",
+  "pummelled": "pummel",
+  "pummelling": "pummeled",
+  "pyjama": "pajama",
+  "pyjamas": "pajamas",
+  "pzazz": "pizzazz",
+  "quarrelled": "quarreled",
+  "quarrelling": "quarreling",
+  "radicalise": "radicalize",
+  "radicalised": "radicalized",
+  "radicalises": "radicalizes",
+  "radicalising": "radicalizing",
+  "rancour": "rancor",
+  "randomise": "randomize",
+  "randomised": "randomized",
+  "randomises": "randomizes",
+  "randomising": "randomizing",
+  "rationalisation": "rationalization",
+  "rationalisations": "rationalizations",
+  "rationalise": "rationalize",
+  "rationalised": "rationalized",
+  "rationalises": "rationalizes",
+  "rationalising": "rationalizing",
+  "ravelled": "raveled",
+  "ravelling": "raveling",
+  "realisable": "realizable",
+  "realisation": "realization",
+  "realisations": "realizations",
+  "realise": "realize",
+  "realised": "realized",
+  "realises": "realizes",
+  "realising": "realizing",
+  "recognisable": "recognizable",
+  "recognisably": "recognizably",
+  "recognisance": "recognizance",
+  "recognise": "recognize",
+  "recognised": "recognized",
+  "recognises": "recognizes",
+  "recognising": "recognizing",
+  "reconnoitre": "reconnoiter",
+  "reconnoitred": "reconnoitered",
+  "reconnoitres": "reconnoiters",
+  "reconnoitring": "reconnoitering",
+  "refuelled": "refueled",
+  "refuelling": "refueling",
+  "regularisation": "regularization",
+  "regularise": "regularize",
+  "regularised": "regularized",
+  "regularises": "regularizes",
+  "regularising": "regularizing",
+  "remodelled": "remodeled",
+  "remodelling": "remodeling",
+  "remould": "remold",
+  "remoulded": "remolded",
+  "remoulding": "remolding",
+  "remoulds": "remolds",
+  "reorganisation": "reorganization",
+  "reorganisations": "reorganizations",
+  "reorganise": "reorganize",
+  "reorganised": "reorganized",
+  "reorganises": "reorganizes",
+  "reorganising": "reorganizing",
+  "revelled": "reveled",
+  "reveller": "reveler",
+  "revellers": "revelers",
+  "revelling": "reveling",
+  "revitalise": "revitalize",
+  "revitalised": "revitalized",
+  "revitalises": "revitalizes",
+  "revitalising": "revitalizing",
+  "revolutionise": "revolutionize",
+  "revolutionised": "revolutionized",
+  "revolutionises": "revolutionizes",
+  "revolutionising": "revolutionizing",
+  "rhapsodise": "rhapsodize",
+  "rhapsodised": "rhapsodized",
+  "rhapsodises": "rhapsodizes",
+  "rhapsodising": "rhapsodizing",
+  "rigour": "rigor",
+  "rigours": "rigors",
+  "ritualised": "ritualized",
+  "rivalled": "rivaled",
+  "rivalling": "rivaling",
+  "romanticise": "romanticize",
+  "romanticised": "romanticized",
+  "romanticises": "romanticizes",
+  "romanticising": "romanticizing",
+  "rumour": "rumor",
+  "rumoured": "rumored",
+  "rumours": "rumors",
+  "sabre": "saber",
+  "sabres": "sabers",
+  "saltpetre": "saltpeter",
+  "sanitise": "sanitize",
+  "sanitised": "sanitized",
+  "sanitises": "sanitizes",
+  "sanitising": "sanitizing",
+  "satirise": "satirize",
+  "satirised": "satirized",
+  "satirises": "satirizes",
+  "satirising": "satirizing",
+  "saviour": "savior",
+  "saviours": "saviors",
+  "savour": "savor",
+  "savoured": "savored",
+  "savouries": "savories",
+  "savouring": "savoring",
+  "savours": "savors",
+  "savoury": "savory",
+  "scandalise": "scandalize",
+  "scandalised": "scandalized",
+  "scandalises": "scandalizes",
+  "scandalising": "scandalizing",
+  "sceptic": "skeptic",
+  "sceptical": "skeptical",
+  "sceptically": "skeptically",
+  "scepticism": "skepticism",
+  "sceptics": "skeptics",
+  "sceptre": "scepter",
+  "sceptres": "scepters",
+  "scrutinise": "scrutinize",
+  "scrutinised": "scrutinized",
+  "scrutinises": "scrutinizes",
+  "scrutinising": "scrutinizing",
+  "secularisation": "secularization",
+  "secularise": "secularize",
+  "secularised": "secularized",
+  "secularises": "secularizes",
+  "secularising": "secularizing",
+  "sensationalise": "sensationalize",
+  "sensationalised": "sensationalized",
+  "sensationalises": "sensationalizes",
+  "sensationalising": "sensationalizing",
+  "sensitise": "sensitize",
+  "sensitised": "sensitized",
+  "sensitises": "sensitizes",
+  "sensitising": "sensitizing",
+  "sentimentalise": "sentimentalize",
+  "sentimentalised": "sentimentalized",
+  "sentimentalises": "sentimentalizes",
+  "sentimentalising": "sentimentalizing",
+  "sepulchre": "sepulcher",
+  "sepulchres": "sepulchers",
+  "serialisation": "serialization",
+  "serialisations": "serializations",
+  "serialise": "serialize",
+  "serialised": "serialized",
+  "serialises": "serializes",
+  "serialising": "serializing",
+  "sermonise": "sermonize",
+  "sermonised": "sermonized",
+  "sermonises": "sermonizes",
+  "sermonising": "sermonizing",
+  "sheikh": "sheik",
+  "shovelled": "shoveled",
+  "shovelling": "shoveling",
+  "shrivelled": "shriveled",
+  "shrivelling": "shriveling",
+  "signalise": "signalize",
+  "signalised": "signalized",
+  "signalises": "signalizes",
+  "signalising": "signalizing",
+  "signalled": "signaled",
+  "signalling": "signaling",
+  "smoulder": "smolder",
+  "smouldered": "smoldered",
+  "smouldering": "smoldering",
+  "smoulders": "smolders",
+  "snivelled": "sniveled",
+  "snivelling": "sniveling",
+  "snorkelled": "snorkeled",
+  "snorkelling": "snorkeling",
+  "snowplough": "snowplow",
+  "snowploughs": "snowplow",
+  "socialisation": "socialization",
+  "socialise": "socialize",
+  "socialised": "socialized",
+  "socialises": "socializes",
+  "socialising": "socializing",
+  "sodomise": "sodomize",
+  "sodomised": "sodomized",
+  "sodomises": "sodomizes",
+  "sodomising": "sodomizing",
+  "solemnise": "solemnize",
+  "solemnised": "solemnized",
+  "solemnises": "solemnizes",
+  "solemnising": "solemnizing",
+  "sombre": "somber",
+  "specialisation": "specialization",
+  "specialisations": "specializations",
+  "specialise": "specialize",
+  "specialised": "specialized",
+  "specialises": "specializes",
+  "specialising": "specializing",
+  "spectre": "specter",
+  "spectres": "specters",
+  "spiralled": "spiraled",
+  "spiralling": "spiraling",
+  "splendour": "splendor",
+  "splendours": "splendors",
+  "squirrelled": "squirreled",
+  "squirrelling": "squirreling",
+  "stabilisation": "stabilization",
+  "stabilise": "stabilize",
+  "stabilised": "stabilized",
+  "stabiliser": "stabilizer",
+  "stabilisers": "stabilizers",
+  "stabilises": "stabilizes",
+  "stabilising": "stabilizing",
+  "standardisation": "standardization",
+  "standardise": "standardize",
+  "standardised": "standardized",
+  "standardises": "standardizes",
+  "standardising": "standardizing",
+  "stencilled": "stenciled",
+  "stencilling": "stenciling",
+  "sterilisation": "sterilization",
+  "sterilisations": "sterilizations",
+  "sterilise": "sterilize",
+  "sterilised": "sterilized",
+  "steriliser": "sterilizer",
+  "sterilisers": "sterilizers",
+  "sterilises": "sterilizes",
+  "sterilising": "sterilizing",
+  "stigmatisation": "stigmatization",
+  "stigmatise": "stigmatize",
+  "stigmatised": "stigmatized",
+  "stigmatises": "stigmatizes",
+  "stigmatising": "stigmatizing",
+  "storey": "story",
+  "storeys": "stories",
+  "subsidisation": "subsidization",
+  "subsidise": "subsidize",
+  "subsidised": "subsidized",
+  "subsidiser": "subsidizer",
+  "subsidisers": "subsidizers",
+  "subsidises": "subsidizes",
+  "subsidising": "subsidizing",
+  "succour": "succor",
+  "succoured": "succored",
+  "succouring": "succoring",
+  "succours": "succors",
+  "sulphate": "sulfate",
+  "sulphates": "sulfates",
+  "sulphide": "sulfide",
+  "sulphides": "sulfides",
+  "sulphur": "sulfur",
+  "sulphurous": "sulfurous",
+  "summarise": "summarize",
+  "summarised": "summarized",
+  "summarises": "summarizes",
+  "summarising": "summarizing",
+  "swivelled": "swiveled",
+  "swivelling": "swiveling",
+  "symbolise": "symbolize",
+  "symbolised": "symbolized",
+  "symbolises": "symbolizes",
+  "symbolising": "symbolizing",
+  "sympathise": "sympathize",
+  "sympathised": "sympathized",
+  "sympathiser": "sympathizer",
+  "sympathisers": "sympathizers",
+  "sympathises": "sympathizes",
+  "sympathising": "sympathizing",
+  "synchronisation": "synchronization",
+  "synchronise": "synchronize",
+  "synchronised": "synchronized",
+  "synchronises": "synchronizes",
+  "synchronising": "synchronizing",
+  "synthesise": "synthesize",
+  "synthesised": "synthesized",
+  "synthesiser": "synthesizer",
+  "synthesisers": "synthesizers",
+  "synthesises": "synthesizes",
+  "synthesising": "synthesizing",
+  "syphon": "siphon",
+  "syphoned": "siphoned",
+  "syphoning": "siphoning",
+  "syphons": "siphons",
+  "systematisation": "systematization",
+  "systematise": "systematize",
+  "systematised": "systematized",
+  "systematises": "systematizes",
+  "systematising": "systematizing",
+  "tantalise": "tantalize",
+  "tantalised": "tantalized",
+  "tantalises": "tantalizes",
+  "tantalising": "tantalizing",
+  "tantalisingly": "tantalizingly",
+  "tasselled": "tasseled",
+  "technicolour": "technicolor",
+  "temporise": "temporize",
+  "temporised": "temporized",
+  "temporises": "temporizes",
+  "temporising": "temporizing",
+  "tenderise": "tenderize",
+  "tenderised": "tenderized",
+  "tenderises": "tenderizes",
+  "tenderising": "tenderizing",
+  "terrorise": "terrorize",
+  "terrorised": "terrorized",
+  "terrorises": "terrorizes",
+  "terrorising": "terrorizing",
+  "theatre": "theater",
+  "theatregoer": "theatergoer",
+  "theatregoers": "theatergoers",
+  "theatres": "theaters",
+  "theorise": "theorize",
+  "theorised": "theorized",
+  "theorises": "theorizes",
+  "theorising": "theorizing",
+  "tonne": "ton",
+  "tonnes": "tons",
+  "towelled": "toweled",
+  "towelling": "toweling",
+  "toxaemia": "toxemia",
+  "tranquillise": "tranquilize",
+  "tranquillised": "tranquilized",
+  "tranquilliser": "tranquilizer",
+  "tranquillisers": "tranquilizers",
+  "tranquillises": "tranquilizes",
+  "tranquillising": "tranquilizing",
+  "tranquillity": "tranquility",
+  "tranquillize": "tranquilize",
+  "tranquillized": "tranquilized",
+  "tranquillizer": "tranquilizer",
+  "tranquillizers": "tranquilizers",
+  "tranquillizes": "tranquilizes",
+  "tranquillizing": "tranquilizing",
+  "tranquilly": "tranquility",
+  "transistorised": "transistorized",
+  "traumatise": "traumatize",
+  "traumatised": "traumatized",
+  "traumatises": "traumatizes",
+  "traumatising": "traumatizing",
+  "travelled": "traveled",
+  "traveller": "traveler",
+  "travellers": "travelers",
+  "travelling": "traveling",
+  "travelog": "travelogue",
+  "travelogs": "travelogues",
+  "trialled": "trialed",
+  "trialling": "trialing",
+  "tricolour": "tricolor",
+  "tricolours": "tricolors",
+  "trivialise": "trivialize",
+  "trivialised": "trivialized",
+  "trivialises": "trivializes",
+  "trivialising": "trivializing",
+  "tumour": "tumor",
+  "tumours": "tumors",
+  "tunnelled": "tunneled",
+  "tunnelling": "tunneling",
+  "tyrannise": "tyrannize",
+  "tyrannised": "tyrannized",
+  "tyrannises": "tyrannizes",
+  "tyrannising": "tyrannizing",
+  "tyre": "tire",
+  "tyres": "tires",
+  "unauthorised": "unauthorized",
+  "uncivilised": "uncivilized",
+  "underutilised": "underutilized",
+  "unequalled": "unequaled",
+  "unfavourable": "unfavorable",
+  "unfavourably": "unfavorably",
+  "unionisation": "unionization",
+  "unionise": "unionize",
+  "unionised": "unionized",
+  "unionises": "unionizes",
+  "unionising": "unionizing",
+  "unorganised": "unorganized",
+  "unravelled": "unraveled",
+  "unravelling": "unraveling",
+  "unrecognisable": "unrecognizable",
+  "unrecognised": "unrecognized",
+  "unrivalled": "unrivaled",
+  "unsavoury": "unsavory",
+  "untrammelled": "untrammeled",
+  "urbanisation": "urbanization",
+  "urbanise": "urbanize",
+  "urbanised": "urbanized",
+  "urbanises": "urbanizes",
+  "urbanising": "urbanizing",
+  "utilisable": "utilizable",
+  "utilisation": "utilization",
+  "utilise": "utilize",
+  "utilised": "utilized",
+  "utilises": "utilizes",
+  "utilising": "utilizing",
+  "valour": "valor",
+  "vandalise": "vandalize",
+  "vandalised": "vandalized",
+  "vandalises": "vandalizes",
+  "vandalising": "vandalizing",
+  "vaporisation": "vaporization",
+  "vaporise": "vaporize",
+  "vaporised": "vaporized",
+  "vaporises": "vaporizes",
+  "vaporising": "vaporizing",
+  "vapour": "vapor",
+  "vapours": "vapors",
+  "verbalise": "verbalize",
+  "verbalised": "verbalized",
+  "verbalises": "verbalizes",
+  "verbalising": "verbalizing",
+  "victimisation": "victimization",
+  "victimise": "victimize",
+  "victimised": "victimized",
+  "victimises": "victimizes",
+  "victimising": "victimizing",
+  "videodisc": "videodisk",
+  "videodiscs": "videodisks",
+  "vigour": "vigor",
+  "visualisation": "visualization",
+  "visualisations": "visualizations",
+  "visualise": "visualize",
+  "visualised": "visualized",
+  "visualises": "visualizes",
+  "visualising": "visualizing",
+  "vocalisation": "vocalization",
+  "vocalisations": "vocalizations",
+  "vocalise": "vocalize",
+  "vocalised": "vocalized",
+  "vocalises": "vocalizes",
+  "vocalising": "vocalizing",
+  "vulcanised": "vulcanized",
+  "vulgarisation": "vulgarization",
+  "vulgarise": "vulgarize",
+  "vulgarised": "vulgarized",
+  "vulgarises": "vulgarizes",
+  "vulgarising": "vulgarizing",
+  "waggon": "wagon",
+  "waggons": "wagons",
+  "watercolour": "watercolor",
+  "watercolours": "watercolors",
+  "weaselled": "weaseled",
+  "weaselling": "weaseling",
+  "westernisation": "westernization",
+  "westernise": "westernize",
+  "westernised": "westernized",
+  "westernises": "westernizes",
+  "westernising": "westernizing",
+  "womanise": "womanize",
+  "womanised": "womanized",
+  "womaniser": "womanizer",
+  "womanisers": "womanizers",
+  "womanises": "womanizes",
+  "womanising": "womanizing",
+  "woollen": "woolen",
+  "woollens": "woolens",
+  "woollies": "woolies",
+  "woolly": "wooly",
+  "worshipped": "worshiped",
+  "worshipper": "worshiper",
+  "worshipping": "worshiping",
+  "yodelled": "yodeled",
+  "yodelling": "yodeling",
+  "yoghourt": "yogurt",
+  "yoghourts": "yogurts",
+  "yoghurt": "yogurt",
+  "yoghurts": "yogurts"
+}

preprocessor_config.json ADDED Viewed

The diff for this file is too large to render. See raw diff

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:705c29d8f8f9970b7fd384c347f0309c5b784dd244a64eb1f721f226ae5fb4f8
+size 3055754841

run.sh ADDED Viewed

	@@ -0,0 +1,48 @@

+# source: https://github.com/kamfonas/whisper-fine-tuning-event/compare/master...minor-mods-by-farsipal
+python run_speech_recognition_seq2seq_streaming.py \
+                --model_name_or_path   'openai/whisper-medium' \
+                --model_revision   main \
+                --do_train   True \
+                --do_eval   True \
+                --use_auth_token   False \
+                --freeze_feature_encoder   False \
+                --freeze_encoder   False \
+		--model_index_name   'Whisper Medium Danish (CV11 + FLEAURS)' \
+                --dataset_name 'mozilla-foundation/common_voice_11_0,google/fleurs' \
+                --dataset_config_name 'da,da_dk' \
+                --train_split_name  'train+validation,train+validation' \
+                --eval_split_name   'test,-' \
+                --text_column_name  'sentence,raw_transcription' \
+                --audio_column_name 'audio,audio' \
+                --streaming   False \
+                --max_duration_in_seconds   30 \
+                --do_lower_case   False \
+                --do_remove_punctuation   False \
+                --do_normalize_eval   True \
+                --language   danish \
+                --task transcribe \
+                --shuffle_buffer_size   500 \
+                --output_dir   './' \
+                --overwrite_output_dir   True \
+                --per_device_train_batch_size   32 \
+                --gradient_accumulation_steps  1 \
+                --learning_rate   8e-6 \
+                --dropout         0.1 \
+                --warmup_steps   500 \
+                --max_steps   10000 \
+                --eval_steps   1000 \
+                --gradient_checkpointing   True \
+                --cache_dir   '~/.cache' \
+                --fp16   True \
+                --evaluation_strategy   steps \
+                --per_device_eval_batch_size   8 \
+                --predict_with_generate   True \
+                --generation_max_length   225 \
+                --save_steps   1000 \
+                --logging_steps   25 \
+                --report_to   tensorboard \
+                --load_best_model_at_end   True \
+                --metric_for_best_model   wer \
+                --greater_is_better   False \
+                --push_to_hub

run_speech_recognition_seq2seq_streaming.py ADDED Viewed

	@@ -0,0 +1,769 @@

+#!/usr/bin/env python
+# coding=utf-8
+# Copyright 2022 The HuggingFace Team. All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+"""
+Fine-tuning the library models for sequence to sequence speech recognition
+with 🤗 Datasets' streaming mode.
+"""
+# This progam was modified by Michael Kamfonas (mkamfonas@infokarta.com) on Dec 11 2022
+# - added options for drpout, gradient_checkpointing, use_cache, stopping_strategy and streaming
+# - restructured it to enable both streaming and non-streaming modes
+# - allows concatenation of mutiple datasets (single-string comma-separated) for interleaving
+#     The following params must have the same number of comma-separated (,) elements:
+#       dataset_name,
+#       dataset_config_name,
+#       train_split_name and eval_split_name (each element plus-separated (+) for multiple splits),
+#       text_column_name and audio_column_name
+import logging
+import os
+import sys
+from dataclasses import dataclass, field
+from typing import Any, Dict, List, Optional, Union
+import datasets
+import torch
+from datasets import Audio, DatasetDict, IterableDatasetDict, interleave_datasets, load_dataset
+from torch.utils.data import IterableDataset
+import evaluate
+import transformers
+from transformers import (
+    AutoConfig,
+    AutoFeatureExtractor,
+    AutoModelForSpeechSeq2Seq,
+    AutoProcessor,
+    AutoTokenizer,
+    HfArgumentParser,
+    Seq2SeqTrainer,
+    Seq2SeqTrainingArguments,
+    TrainerCallback,
+    set_seed,
+)
+from transformers.trainer_pt_utils import IterableDatasetShard
+from transformers.trainer_utils import get_last_checkpoint, is_main_process
+from transformers.utils import check_min_version, send_example_telemetry
+from transformers.utils.versions import require_version
+from transformers.models.whisper.english_normalizer import BasicTextNormalizer
+TEXT_COL_NAME="text"
+AUDIO_COL_NAME="audio"
+# Will error if the minimal version of Transformers is not installed. Remove at your own risks.
+check_min_version("4.25.0.dev0")
+require_version("datasets>=1.18.2", "To fix: pip install -r examples/pytorch/speech-recognition/requirements.txt")
+logger = logging.getLogger(__name__)
+@dataclass
+class ModelArguments:
+    """
+    Arguments pertaining to which model/config/tokenizer we are going to fine-tune from.
+    """
+    model_name_or_path: str = field(
+        metadata={"help": "Path to pretrained model or model identifier from huggingface.co/models"}
+    )
+    config_name: Optional[str] = field(
+        default=None, metadata={"help": "Pretrained config name or path if not the same as model_name"}
+    )
+    tokenizer_name: Optional[str] = field(
+        default=None, metadata={"help": "Pretrained tokenizer name or path if not the same as model_name"}
+    )
+    feature_extractor_name: Optional[str] = field(
+        default=None, metadata={"help": "feature extractor name or path if not the same as model_name"}
+    )
+    cache_dir: Optional[str] = field(
+        default=None,
+        metadata={"help": "Where to store the pretrained models downloaded from huggingface.co"},
+    )
+    use_fast_tokenizer: bool = field(
+        default=True,
+        metadata={"help": "Whether to use one of the fast tokenizer (backed by the tokenizers library) or not."},
+    )
+    model_revision: str = field(
+        default="main",
+        metadata={"help": "The specific model version to use (can be a branch name, tag name or commit id)."},
+    )
+    use_auth_token: bool = field(
+        default=False,
+        metadata={
+            "help": (
+                "Will use the token generated when running `huggingface-cli login` (necessary to use this script "
+                "with private models)."
+            )
+        },
+    )
+    freeze_feature_encoder: bool = field(
+        default=True, metadata={"help": "Deprecated - Whether to freeze the feature encoder layers of the model."}
+    )
+    freeze_encoder: bool = field(
+        default=False, metadata={"help": "Whether to freeze the entire encoder of the seq2seq model."}
+    )
+    forced_decoder_ids: List[List[int]] = field(
+        default=None,
+        metadata={
+            "help": (
+                "A list of pairs of integers which indicates a mapping from generation indices to token indices "
+                "that will be forced before sampling. For example, [[0, 123]] means the first generated token "
+                "will always be a token of index 123."
+            )
+        },
+    )
+    suppress_tokens: List[int] = field(
+        default=None, metadata={"help": "A list of tokens that will be suppressed at generation."}
+    )
+    model_index_name: str = field(default=None, metadata={"help": "Pretty name for the model card."})
+    ## added by Michael Kamfonas
+    use_cache: bool = field(
+        default=False, metadata={"help": "Whether to use cache."}
+    )
+    dropout: float = field(
+        default = 0.0, metadata = {"help": "dropout probability."}
+    )
+    attention_dropout: float = field(
+        default = 0.0, metadata = {"help": "attention_dropout probability."}
+    )
+@dataclass
+class DataTrainingArguments:
+    """
+    Arguments pertaining to what data we are going to input our model for training and eval.
+    """
+    dataset_name: str = field(
+        default=None,
+        metadata={"help": "The name of the dataset to use (via the datasets library)."}
+    )
+    dataset_config_name: Optional[str] = field(
+        default=None,
+        metadata={"help": "The configuration name of the dataset to use (via the datasets library)."}
+    )
+    text_column: Optional[str] = field(
+        default=None,
+        metadata={"help": "The name of the column in the datasets containing the full texts (for summarization)."},
+    )
+    max_train_samples: Optional[int] = field(
+        default=None,
+        metadata={
+            "help": (
+                "For debugging purposes or quicker training, truncate the number of training examples to this "
+                "value if set."
+            )
+        },
+    )
+    max_eval_samples: Optional[int] = field(
+        default=None,
+        metadata={
+            "help": (
+                "For debugging purposes or quicker training, truncate the number of evaluation examples to this "
+                "value if set."
+            )
+        },
+    )
+    audio_column_name: str = field(
+        default="audio",
+        metadata={"help": "The name of the dataset column containing the audio data. Defaults to 'audio'"},
+    )
+    text_column_name: str = field(
+        default="text",
+        metadata={"help": "The name of the dataset column containing the text data. Defaults to 'text'"},
+    )
+    max_duration_in_seconds: float = field(
+        default=20.0,
+        metadata={
+            "help": (
+                "Truncate audio files that are longer than `max_duration_in_seconds` seconds to"
+                " 'max_duration_in_seconds`"
+            )
+        },
+    )
+    min_duration_in_seconds: float = field(
+        default=0.0, metadata={"help": "Filter audio files that are shorter than `min_duration_in_seconds` seconds"}
+    )
+    train_split_name: str = field(
+        default="train",
+        metadata={
+            "help": "The name of the training data set split to use (via the datasets library). Defaults to 'train'"
+        },
+    )
+    eval_split_name: str = field(
+        default="test",
+        metadata={
+            "help": "The name of the training data set split to use (via the datasets library). Defaults to 'train'"
+        },
+    )
+    do_lower_case: bool = field(
+        default=False,
+        metadata={"help": "Whether the target text should be lower cased."},
+    )
+    do_remove_punctuation: bool = field(
+        default=False,
+        metadata={"help": "Whether the target text should be striped of punctuation."},
+    )
+    do_normalize_eval: bool = field(
+        default=True,
+        metadata={"help": "Whether to normalise the references and predictions in the eval WER calculation."},
+    )
+    language: str = field(
+        default=None,
+        metadata={
+            "help": (
+                "Language for multilingual fine-tuning. This argument should be set for multilingual fine-tuning "
+                "only. For English speech recognition, it should be set to `None`."
+            )
+        },
+    )
+    task: str = field(
+        default="transcribe",
+        metadata={"help": "Task, either `transcribe` for speech recognition or `translate` for speech translation."},
+    )
+    shuffle_buffer_size: Optional[int] = field(
+        default=500,
+        metadata={
+            "help": (
+                "The number of streamed examples to download before shuffling them. The large the buffer, "
+                "the closer it is to real offline shuffling."
+            )
+        },
+    )
+    stopping_strategy: Optional[str] = field(
+        default="all_exhausted",
+        metadata={
+             "help": "Strategy used to consume interleaved data. Default = 'all_exhausted'"
+        }
+    )
+    streaming: bool = field(
+        default=True,
+        metadata={"help": "Whether to use streaming mode to load and pre-process the data."},
+    )
+@dataclass
+class DataCollatorSpeechSeq2SeqWithPadding:
+    """
+    Data collator that will dynamically pad the inputs received.
+    Args:
+        processor ([`WhisperProcessor`])
+            The processor used for processing the data.
+        decoder_start_token_id (`int`)
+            The begin-of-sentence of the decoder.
+    """
+    processor: Any
+    decoder_start_token_id: int
+    def __call__(self, features: List[Dict[str, Union[List[int], torch.Tensor]]]) -> Dict[str, torch.Tensor]:
+        # split inputs and labels since they have to be of different lengths and need
+        # different padding methods
+        model_input_name = self.processor.model_input_names[0]
+        input_features = [{model_input_name: feature[model_input_name]} for feature in features]
+        label_features = [{"input_ids": feature["labels"]} for feature in features]
+        batch = self.processor.feature_extractor.pad(input_features, return_tensors="pt")
+        labels_batch = self.processor.tokenizer.pad(label_features, return_tensors="pt")
+        # replace padding with -100 to ignore loss correctly
+        labels = labels_batch["input_ids"].masked_fill(labels_batch.attention_mask.ne(1), -100)
+        # if bos token is appended in previous tokenization step,
+        # cut bos token here as it's append later anyways
+        if (labels[:, 0] == self.decoder_start_token_id).all().cpu().item():
+            labels = labels[:, 1:]
+        batch["labels"] = labels
+        return batch
+def load_streaming_dataset(dataset_name, dataset_config_name, split="train", **kwargs):
+    """
+    Utility function to load a dataset in streaming mode. For datasets with multiple splits,
+    each split is loaded individually and then splits combined by taking alternating examples from
+    each (interleaving).
+    """
+    if "+" in split:
+        # load multiple splits separated by the `+` symbol with streaming mode
+        dataset_splits = [
+            load_dataset(dataset_name, dataset_config_name, split=split_name, streaming=True, **kwargs)
+            for split_name in split.split("+")
+        ]
+        # interleave multiple splits to form one dataset
+        interleaved_dataset = interleave_datasets(dataset_splits)
+        return interleaved_dataset
+    else:
+        # load a single split *with* streaming mode
+        dataset = load_dataset(dataset_name, dataset_config_name, split=split, streaming=True, **kwargs)
+        return dataset
+def load_multiple_streaming_datasets(
+    dataset_names: List,
+    dataset_config_names: List,
+    splits: Optional[List] = None,
+    text_column_names: Optional[List] = None,
+    audio_column_names: Optional[List] = None,
+    sampling_rate: Optional[int] = 16000,
+    stopping_strategy: Optional[str] = "all_exhausted",
+    streaming = True,
+    **kwargs
+    ):
+    if len(dataset_names) != len(dataset_config_names):
+        raise ValueError(
+            f"Ensure one config is passed for each dataset, got {len(dataset_names)} datasets and"
+            f" {len(dataset_config_names)} configs."
+        )
+    if splits is not None and len(splits) != len(dataset_names):
+        raise ValueError(
+            f"Ensure one train_split is passed for each dataset, got {len(dataset_names)} datasets and {len(splits)} splits."
+        )
+    if text_column_names is not None and len(text_column_names) != len(dataset_names):
+        raise ValueError(
+            f"Ensure one text column name is passed for each dataset, got {len(dataset_names)} datasets and"
+            f" {len(text_column_names)} text column names."
+        )
+    if audio_column_names is not None and len(audio_column_names) != len(dataset_names):
+        raise ValueError(
+            f"Ensure one text column name is passed for each dataset, got {len(dataset_names)} datasets and"
+            f" {len(audio_column_names)} text column names."
+        )
+    splits = splits if splits is not None \
+        else ["train" for i in range(len(dataset_names))]
+    text_column_names = (
+        text_column_names if text_column_names is not None \
+            else [TEXT_COL_NAME for i in range(len(dataset_names))]
+    )
+    audio_column_names = (
+        audio_column_names if audio_column_names is not None \
+            else [AUDIO_COL_NAME for i in range(len(dataset_names))]
+    )
+    all_data_splits = []
+    # iterate over the datasets we want to interleave
+    for dset, cfgNm, splt,  txtColNm, audColNm in zip(dataset_names,dataset_config_names,\
+                                                splits,text_column_names, audio_column_names):
+        dset_splits = [load_dataset(dset, cfgNm, split=c, streaming=streaming, **kwargs) \
+            for c in splt.split('+') if c != '-']
+        if streaming:
+            dset_splits = [ds if TEXT_COL_NAME  in ds.features else ds.rename_column(txtColNm, TEXT_COL_NAME) \
+                for ds in dset_splits ]
+            dset_splits = [ds if AUDIO_COL_NAME in ds.features else ds.rename_column(audColNm, AUDIO_COL_NAME) \
+                for ds in dset_splits]
+            if len(dset_splits)>0 and sampling_rate != next(iter(dset_splits[0]))[AUDIO_COL_NAME]['sampling_rate']:
+                dset_splits = [ds.cast_column(AUDIO_COL_NAME, Audio(sampling_rate)) for ds in dset_splits]
+        else:
+            dset_splits = [ds if TEXT_COL_NAME  in ds.column_names else ds.rename_column(txtColNm, TEXT_COL_NAME) \
+                for ds in dset_splits ]
+            dset_splits = [ds if AUDIO_COL_NAME in ds.column_names else ds.rename_column(audColNm, AUDIO_COL_NAME) \
+                for ds in dset_splits]
+        if len(dset_splits)>0 and sampling_rate != next(iter(dset_splits[0]))[AUDIO_COL_NAME]['sampling_rate']:
+            dset_splits = [ds.cast_column(AUDIO_COL_NAME, Audio(sampling_rate)) for ds in dset_splits]
+        cols2keep = set([AUDIO_COL_NAME, TEXT_COL_NAME])
+        dset_splits = [ds.remove_columns(set(ds.features.keys()) - cols2keep) for ds in dset_splits]
+        all_data_splits +=   dset_splits
+    return interleave_datasets(all_data_splits, stopping_strategy=stopping_strategy)
+def main():
+    # 1. Parse input arguments
+    # See all possible arguments in src/transformers/training_args.py
+    # or by passing the --help flag to this script.
+    # We now keep distinct sets of args, for a cleaner separation of concerns.
+    parser = HfArgumentParser((ModelArguments, DataTrainingArguments, Seq2SeqTrainingArguments))
+    if len(sys.argv) == 2 and sys.argv[1].endswith(".json"):
+        # If we pass only one argument to the script and it's the path to a json file,
+        # let's parse it to get our arguments.
+        model_args, data_args, training_args = parser.parse_json_file(json_file=os.path.abspath(sys.argv[1]))
+    else:
+        model_args, data_args, training_args = parser.parse_args_into_dataclasses()
+    # Sending telemetry. Tracking the example usage helps us better allocate resources to maintain them. The
+    # information sent is the one passed as arguments along with your Python/PyTorch versions.
+    send_example_telemetry("run_speech_recognition_seq2seq_streaming", model_args, data_args)
+    # 2. Setup logging
+    logging.basicConfig(
+        format="%(asctime)s - %(levelname)s - %(name)s - %(message)s",
+        datefmt="%m/%d/%Y %H:%M:%S",
+        handlers=[logging.StreamHandler(sys.stdout)],
+    )
+    log_level = training_args.get_process_log_level()
+    logger.setLevel(log_level)
+    datasets.utils.logging.set_verbosity(log_level)
+    transformers.utils.logging.set_verbosity(log_level)
+    transformers.utils.logging.enable_default_handler()
+    transformers.utils.logging.enable_explicit_format()
+    logger.setLevel(logging.INFO if is_main_process(training_args.local_rank) else logging.WARN)
+    # Log on each process the small summary:
+    logger.warning(
+        f"Process rank: {training_args.local_rank}, device: {training_args.device}, n_gpu: {training_args.n_gpu}"
+        f"distributed training: {bool(training_args.local_rank != -1)}, 16-bits training: {training_args.fp16}"
+    )
+    logger.info(f"Training/evaluation parameters {training_args}")
+    # Set the verbosity to info of the Transformers logger (on main process only):
+    if is_main_process(training_args.local_rank):
+        transformers.utils.logging.set_verbosity_info()
+    logger.info("Training/evaluation parameters %s", training_args)
+    # 3. Detecting last checkpoint and eventually continue from last checkpoint
+    last_checkpoint = None
+    if os.path.isdir(training_args.output_dir) and training_args.do_train and not training_args.overwrite_output_dir:
+        last_checkpoint = get_last_checkpoint(training_args.output_dir)
+        if last_checkpoint is None and len(os.listdir(training_args.output_dir)) > 0:
+            raise ValueError(
+                f"Output directory ({training_args.output_dir}) already exists and is not empty. "
+                "Use --overwrite_output_dir to overcome."
+            )
+        elif last_checkpoint is not None and training_args.resume_from_checkpoint is None:
+            logger.info(
+                f"Checkpoint detected, resuming training at {last_checkpoint}. To avoid this behavior, change "
+                "the `--output_dir` or add `--overwrite_output_dir` to train from scratch."
+            )
+    # Set seed before initializing model.
+    set_seed(training_args.seed)
+    # 5. Load pretrained model, tokenizer, and feature extractor
+    #
+    # Distributed training:
+    # The .from_pretrained methods guarantee that only one local process can concurrently
+    config = AutoConfig.from_pretrained(
+        model_args.config_name if model_args.config_name else model_args.model_name_or_path,
+        cache_dir=model_args.cache_dir,
+        revision=model_args.model_revision,
+        use_auth_token=True if model_args.use_auth_token else None,
+    )
+    config.update({ "forced_decoder_ids": model_args.forced_decoder_ids,
+                    "suppress_tokens": model_args.suppress_tokens})
+    feature_extractor = AutoFeatureExtractor.from_pretrained(
+        model_args.feature_extractor_name if model_args.feature_extractor_name else model_args.model_name_or_path,
+        cache_dir=model_args.cache_dir,
+        revision=model_args.model_revision,
+        use_auth_token=True if model_args.use_auth_token else None,
+    )
+    tokenizer = AutoTokenizer.from_pretrained(
+        model_args.tokenizer_name if model_args.tokenizer_name else model_args.model_name_or_path,
+        cache_dir=model_args.cache_dir,
+        use_fast=model_args.use_fast_tokenizer,
+        revision=model_args.model_revision,
+        use_auth_token=True if model_args.use_auth_token else None,
+    )
+    model = AutoModelForSpeechSeq2Seq.from_pretrained(
+        model_args.model_name_or_path,
+        config=config,
+        cache_dir=model_args.cache_dir,
+        revision=model_args.model_revision,
+        use_auth_token=True if model_args.use_auth_token else None,
+    )
+    model.config.use_cache = model_args.use_cache
+    model.config.dropout = model_args.dropout
+    model.config.attention_dropout = model_args.attention_dropout
+    if training_args.gradient_checkpointing:
+        model.gradient_checkpointing_enable()
+    if model.config.decoder_start_token_id is None:
+        raise ValueError("Make sure that `config.decoder_start_token_id` is correctly defined")
+    # deprecated
+    #if model_args.freeze_feature_encoder:
+    #    model.freeze_feature_encoder()
+    if model_args.freeze_encoder:
+        model.freeze_encoder()
+        model.model.encoder.gradient_checkpointing = False
+    if data_args.language is not None:
+        # We only need to set the task id when the language is specified (i.e. in a multilingual setting)
+        tokenizer.set_prefix_tokens(language=data_args.language, task=data_args.task)
+    # 4. Load dataset
+    raw_datasets = IterableDatasetDict() if data_args.streaming else DatasetDict()
+    # if training_args.do_train:
+    #     raw_datasets["train"] = load_streaming_dataset(
+    #         data_args.dataset_name,
+    #         data_args.dataset_config_name,
+    #         split=data_args.train_split_name,
+    #         use_auth_token=True if model_args.use_auth_token else None,
+    #     )
+    # if training_args.do_eval:
+    #     raw_datasets["eval"] = load_streaming_dataset(
+    #         data_args.dataset_name,
+    #         data_args.dataset_config_name,
+    #         split=data_args.eval_split_name,
+    #         use_auth_token=True if model_args.use_auth_token else None,
+    #     )
+    if training_args.do_train:
+        raw_datasets["train"] = load_multiple_streaming_datasets(
+            dataset_names=data_args.dataset_name.split(","),
+            dataset_config_names=data_args.dataset_config_name.split(","),
+            splits = data_args.train_split_name.split(","),
+            text_column_names = data_args.text_column_name.split(","),
+            sampling_rate  = feature_extractor.sampling_rate,
+            streaming=data_args.streaming,
+            use_auth_token=True if model_args.use_auth_token else None,
+        )
+    if training_args.do_eval:
+        raw_datasets["eval"] = load_multiple_streaming_datasets(
+            dataset_names=data_args.dataset_name.split(","),
+            dataset_config_names=data_args.dataset_config_name.split(","),
+            splits  = data_args.eval_split_name.split(","),
+            text_column_names = data_args.text_column_name.split(","),
+            sampling_rate  = feature_extractor.sampling_rate,
+            streaming=False,
+            use_auth_token=True if model_args.use_auth_token else None,
+        )
+    raw_datasets_features = list(next(iter(raw_datasets.values())).features.keys())
+    if AUDIO_COL_NAME not in raw_datasets_features:
+        raise ValueError(
+            f"--audio_column_name '{data_args.audio_column_name}' not found in dataset '{data_args.dataset_name}'. "
+            "Make sure to set `--audio_column_name` to the correct audio column - one of "
+            f"{', '.join(raw_datasets_features)}."
+        )
+    if TEXT_COL_NAME not in raw_datasets_features:
+        raise ValueError(
+            f"--text_column_name {TEXT_COL_NAME} not found in dataset. "
+            "Make sure to set `--text_column_name` to the the respective correct text columns."
+        )
+    # 6. Resample speech dataset if necessary
+    #dataset_sampling_rate = next(iter(raw_datasets.values())).features[data_args.audio_column_name].sampling_rate
+    #if dataset_sampling_rate != feature_extractor.sampling_rate:
+    #    raw_datasets = raw_datasets.cast_column(
+    #        data_args.audio_column_name, datasets.features.Audio(sampling_rate=feature_extractor.sampling_rate)
+    #    )
+    # 7. Preprocessing the datasets.
+    # We need to read the audio files as arrays and tokenize the targets.
+    max_input_length = data_args.max_duration_in_seconds * feature_extractor.sampling_rate
+    min_input_length = data_args.min_duration_in_seconds * feature_extractor.sampling_rate
+    audio_column_name = AUDIO_COL_NAME
+    text_column_name = TEXT_COL_NAME
+    model_input_name = feature_extractor.model_input_names[0]
+    do_lower_case = data_args.do_lower_case
+    do_remove_punctuation = data_args.do_remove_punctuation
+    normalizer = BasicTextNormalizer()  # 'official' text normalizer from OpenAI
+    if data_args.max_train_samples is not None:
+        raw_datasets["train"] = (
+            raw_datasets["train"].take(data_args.max_train_samples)
+            if data_args.streaming
+            else raw_datasets["train"].select(range(data_args.max_train_samples))
+        )
+    if data_args.max_eval_samples is not None:
+        raw_datasets["eval"] = (
+            raw_datasets["eval"].take(data_args.max_eval_samples)
+            if data_args.streaming
+            else raw_datasets["eval"].select(range(data_args.max_eval_samples))
+        )
+    def prepare_dataset(batch):
+        # process audio
+        sample = batch[audio_column_name]
+        inputs = feature_extractor(sample["array"], sampling_rate=sample["sampling_rate"])
+        # process audio length
+        batch[model_input_name] = inputs.get(model_input_name)[0]
+        batch["input_length"] = len(sample["array"])
+        # process targets
+        input_str = batch[text_column_name].lower() if do_lower_case else batch[text_column_name]
+        if do_remove_punctuation:
+            input_str = normalizer(input_str).strip()
+        batch["labels"] = tokenizer(input_str).input_ids
+        return batch
+    with training_args.main_process_first(desc="dataset map pre-processing"):
+        vectorized_datasets = raw_datasets.map(
+            prepare_dataset,
+            remove_columns=raw_datasets_features,
+            num_proc=training_args.dataloader_num_workers if training_args.dataloader_num_workers else 1
+        ).with_format("torch")
+        if training_args.do_train and data_args.streaming:
+            # manually shuffle if streaming (done by the trainer for non-streaming)
+            vectorized_datasets["train"] = vectorized_datasets["train"].shuffle(
+                buffer_size=data_args.shuffle_buffer_size,
+                seed=training_args.seed,
+            )
+    # filter training data that is shorter than min_input_length or longer than
+    # max_input_length
+    def is_audio_in_length_range(length):
+        return min_input_length < length < max_input_length
+    if training_args.do_train:
+        vectorized_datasets["train"] = vectorized_datasets["train"].filter(
+            is_audio_in_length_range,
+            input_columns=["input_length"],
+        )
+    # 8. Load Metric
+    metric = evaluate.load("wer")
+    do_normalize_eval = data_args.do_normalize_eval
+    def compute_metrics(pred):
+        pred_ids = pred.predictions
+        pred.label_ids[pred.label_ids == -100] = tokenizer.pad_token_id
+        pred_str = tokenizer.batch_decode(pred_ids, skip_special_tokens=True)
+        # we do not want to group tokens when computing the metrics
+        label_str = tokenizer.batch_decode(pred.label_ids, skip_special_tokens=True)
+        if do_normalize_eval:
+            pred_str = [normalizer(pred) for pred in pred_str]
+            label_str = [normalizer(label) for label in label_str]
+            # filtering step to only evaluate the samples that correspond to non-zero references:
+            pred_str = [pred_str[i] for i in range(len(pred_str)) if len(label_str[i]) > 0]
+            label_str = [label_str[i] for i in range(len(label_str)) if len(label_str[i]) > 0]
+        wer = 100 * metric.compute(predictions=pred_str, references=label_str)
+        return {"wer": wer}
+    # 9. Create a single speech processor
+    if is_main_process(training_args.local_rank):
+        # save feature extractor, tokenizer and config
+        feature_extractor.save_pretrained(training_args.output_dir)
+        tokenizer.save_pretrained(training_args.output_dir)
+        config.save_pretrained(training_args.output_dir)
+    processor = AutoProcessor.from_pretrained(training_args.output_dir)
+    # 10. Define data collator
+    data_collator = DataCollatorSpeechSeq2SeqWithPadding(
+        processor=processor,
+        decoder_start_token_id=model.config.decoder_start_token_id,
+    )
+    # 11. Configure Trainer
+    # Trainer callback to reinitialise and reshuffle the streamable datasets at the beginning of each epoch
+    # Only required for streaming: Trainer automatically shuffles non-streaming datasets
+    class ShuffleCallback(TrainerCallback):
+        def on_epoch_begin(self, args, state, control, train_dataloader, **kwargs):
+            if isinstance(train_dataloader.dataset, IterableDatasetShard):
+                pass  # set_epoch() is handled by the Trainer
+            elif isinstance(train_dataloader.dataset, IterableDataset):
+                train_dataloader.dataset.set_epoch(train_dataloader.dataset._epoch + 1)
+    # Initialize Trainer
+    trainer = Seq2SeqTrainer(
+        model=model,
+        args=training_args,
+        train_dataset=vectorized_datasets["train"] if training_args.do_train else None,
+        eval_dataset=vectorized_datasets["eval"] if training_args.do_eval else None,
+        tokenizer=feature_extractor,
+        data_collator=data_collator,
+        compute_metrics=compute_metrics if training_args.predict_with_generate else None,
+        callbacks=[ShuffleCallback()] if data_args.streaming else None,
+    )
+    # 12. Training
+    if training_args.do_train:
+        checkpoint = None
+        if training_args.resume_from_checkpoint is not None:
+            checkpoint = training_args.resume_from_checkpoint
+        elif last_checkpoint is not None:
+            checkpoint = last_checkpoint
+        train_result = trainer.train(resume_from_checkpoint=checkpoint)
+        trainer.save_model()  # Saves the feature extractor too for easy upload
+        metrics = train_result.metrics
+        if data_args.max_train_samples:
+            metrics["train_samples"] = data_args.max_train_samples
+        trainer.log_metrics("train", metrics)
+        trainer.save_metrics("train", metrics)
+        trainer.save_state()
+    # 13. Evaluation
+    results = {}
+    if training_args.do_eval:
+        logger.info("*** Evaluate ***")
+        metrics = trainer.evaluate(
+            metric_key_prefix="eval",
+            max_length=training_args.generation_max_length,
+            num_beams=training_args.generation_num_beams,
+        )
+        if data_args.max_eval_samples:
+            metrics["eval_samples"] = data_args.max_eval_samples
+        trainer.log_metrics("eval", metrics)
+        trainer.save_metrics("eval", metrics)
+    # 14. Write Training Stats
+    kwargs = {
+        "finetuned_from": model_args.model_name_or_path,
+        "tasks": "automatic-speech-recognition",
+        "tags": "whisper-event",
+    }
+    if data_args.dataset_name is not None:
+        kwargs["dataset_tags"] = data_args.dataset_name
+        if data_args.dataset_config_name is not None:
+            kwargs["dataset"] = f"{data_args.dataset_name} {data_args.dataset_config_name}"
+        else:
+            kwargs["dataset"] = data_args.dataset_name
+        if "common_voice" in data_args.dataset_name:
+            kwargs["language"] = data_args.dataset_config_name[:2]
+        if model_args.model_index_name is not None:
+            kwargs["model_name"] = model_args.model_index_name
+    if training_args.push_to_hub:
+        trainer.push_to_hub(**kwargs)
+    else:
+        trainer.create_model_card(**kwargs)
+    return results
+if __name__ == "__main__":
+    main()

runs/Dec18_19-31-26_150-136-92-72/1671392859.803059/events.out.tfevents.1671392859.150-136-92-72.3522376.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f0ceb80046b312d6d4f6a912c505ee60a27e8c1423e7b51bdf1f3ed5bfaced17
+size 5863

runs/Dec18_19-31-26_150-136-92-72/events.out.tfevents.1671392859.150-136-92-72.3522376.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:67137c6c1fb87eb68b3419176c2ead80507b024b4ae641ccc4ee4dcede25638e
+size 70581

runs/Dec18_19-31-26_150-136-92-72/events.out.tfevents.1671450244.150-136-92-72.3522376.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1f8e1f98b6a01ff31c7996e218eaf4b7e895a3d912df49f0b37a427bc2e22d56
+size 358

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,133 @@

+{
+  "additional_special_tokens": [
+    "<|endoftext|>",
+    "<|startoftranscript|>",
+    "<|en|>",
+    "<|zh|>",
+    "<|de|>",
+    "<|es|>",
+    "<|ru|>",
+    "<|ko|>",
+    "<|fr|>",
+    "<|ja|>",
+    "<|pt|>",
+    "<|tr|>",
+    "<|pl|>",
+    "<|ca|>",
+    "<|nl|>",
+    "<|ar|>",
+    "<|sv|>",
+    "<|it|>",
+    "<|id|>",
+    "<|hi|>",
+    "<|fi|>",
+    "<|vi|>",
+    "<|iw|>",
+    "<|uk|>",
+    "<|el|>",
+    "<|ms|>",
+    "<|cs|>",
+    "<|ro|>",
+    "<|da|>",
+    "<|hu|>",
+    "<|ta|>",
+    "<|no|>",
+    "<|th|>",
+    "<|ur|>",
+    "<|hr|>",
+    "<|bg|>",
+    "<|lt|>",
+    "<|la|>",
+    "<|mi|>",
+    "<|ml|>",
+    "<|cy|>",
+    "<|sk|>",
+    "<|te|>",
+    "<|fa|>",
+    "<|lv|>",
+    "<|bn|>",
+    "<|sr|>",
+    "<|az|>",
+    "<|sl|>",
+    "<|kn|>",
+    "<|et|>",
+    "<|mk|>",
+    "<|br|>",
+    "<|eu|>",
+    "<|is|>",
+    "<|hy|>",
+    "<|ne|>",
+    "<|mn|>",
+    "<|bs|>",
+    "<|kk|>",
+    "<|sq|>",
+    "<|sw|>",
+    "<|gl|>",
+    "<|mr|>",
+    "<|pa|>",
+    "<|si|>",
+    "<|km|>",
+    "<|sn|>",
+    "<|yo|>",
+    "<|so|>",
+    "<|af|>",
+    "<|oc|>",
+    "<|ka|>",
+    "<|be|>",
+    "<|tg|>",
+    "<|sd|>",
+    "<|gu|>",
+    "<|am|>",
+    "<|yi|>",
+    "<|lo|>",
+    "<|uz|>",
+    "<|fo|>",
+    "<|ht|>",
+    "<|ps|>",
+    "<|tk|>",
+    "<|nn|>",
+    "<|mt|>",
+    "<|sa|>",
+    "<|lb|>",
+    "<|my|>",
+    "<|bo|>",
+    "<|tl|>",
+    "<|mg|>",
+    "<|as|>",
+    "<|tt|>",
+    "<|haw|>",
+    "<|ln|>",
+    "<|ha|>",
+    "<|ba|>",
+    "<|jw|>",
+    "<|su|>",
+    "<|translate|>",
+    "<|transcribe|>",
+    "<|startoflm|>",
+    "<|startofprev|>",
+    "<|nocaptions|>",
+    "<|notimestamps|>"
+  ],
+  "bos_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<|endoftext|>",
+  "unk_token": {
+    "content": "",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,36 @@

+{
+  "add_bos_token": false,
+  "add_prefix_space": false,
+  "bos_token": {
+    "__type": "AddedToken",
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "__type": "AddedToken",
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "errors": "replace",
+  "model_max_length": 1024,
+  "name_or_path": "openai/whisper-medium",
+  "pad_token": null,
+  "processor_class": "WhisperProcessor",
+  "return_attention_mask": false,
+  "special_tokens_map_file": null,
+  "tokenizer_class": "WhisperTokenizer",
+  "unk_token": {
+    "__type": "AddedToken",
+    "content": "",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 31.45,
+    "train_loss": 0.0230206538159051,
+    "train_runtime": 56008.0991,
+    "train_samples_per_second": 5.713,
+    "train_steps_per_second": 0.179
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,2515 @@

+{
+  "best_metric": 13.708574434508153,
+  "best_model_checkpoint": "./checkpoint-10000",
+  "epoch": 31.446540880503143,
+  "global_step": 10000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.08,
+      "learning_rate": 3.6799999999999996e-07,
+      "loss": 1.2045,
+      "step": 25
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 7.68e-07,
+      "loss": 0.997,
+      "step": 50
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 1.1679999999999999e-06,
+      "loss": 0.6901,
+      "step": 75
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 1.568e-06,
+      "loss": 0.4398,
+      "step": 100
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 1.968e-06,
+      "loss": 0.3942,
+      "step": 125
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 2.3679999999999996e-06,
+      "loss": 0.3263,
+      "step": 150
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 2.7679999999999996e-06,
+      "loss": 0.3056,
+      "step": 175
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 3.168e-06,
+      "loss": 0.2628,
+      "step": 200
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 3.568e-06,
+      "loss": 0.2526,
+      "step": 225
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 3.968e-06,
+      "loss": 0.257,
+      "step": 250
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 4.368e-06,
+      "loss": 0.2296,
+      "step": 275
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 4.768e-06,
+      "loss": 0.231,
+      "step": 300
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 5.168e-06,
+      "loss": 0.194,
+      "step": 325
+    },
+    {
+      "epoch": 1.1,
+      "learning_rate": 5.567999999999999e-06,
+      "loss": 0.1423,
+      "step": 350
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 5.9679999999999994e-06,
+      "loss": 0.1473,
+      "step": 375
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 6.368e-06,
+      "loss": 0.1454,
+      "step": 400
+    },
+    {
+      "epoch": 1.34,
+      "learning_rate": 6.767999999999999e-06,
+      "loss": 0.143,
+      "step": 425
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 7.168e-06,
+      "loss": 0.141,
+      "step": 450
+    },
+    {
+      "epoch": 1.49,
+      "learning_rate": 7.567999999999999e-06,
+      "loss": 0.1471,
+      "step": 475
+    },
+    {
+      "epoch": 1.57,
+      "learning_rate": 7.967999999999999e-06,
+      "loss": 0.1336,
+      "step": 500
+    },
+    {
+      "epoch": 1.65,
+      "learning_rate": 7.980631578947368e-06,
+      "loss": 0.1264,
+      "step": 525
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 7.95957894736842e-06,
+      "loss": 0.1324,
+      "step": 550
+    },
+    {
+      "epoch": 1.81,
+      "learning_rate": 7.938526315789473e-06,
+      "loss": 0.1179,
+      "step": 575
+    },
+    {
+      "epoch": 1.89,
+      "learning_rate": 7.917473684210526e-06,
+      "loss": 0.1243,
+      "step": 600
+    },
+    {
+      "epoch": 1.97,
+      "learning_rate": 7.896421052631578e-06,
+      "loss": 0.1209,
+      "step": 625
+    },
+    {
+      "epoch": 2.04,
+      "learning_rate": 7.875368421052631e-06,
+      "loss": 0.0874,
+      "step": 650
+    },
+    {
+      "epoch": 2.12,
+      "learning_rate": 7.854315789473684e-06,
+      "loss": 0.0612,
+      "step": 675
+    },
+    {
+      "epoch": 2.2,
+      "learning_rate": 7.833263157894736e-06,
+      "loss": 0.0569,
+      "step": 700
+    },
+    {
+      "epoch": 2.28,
+      "learning_rate": 7.812210526315789e-06,
+      "loss": 0.0566,
+      "step": 725
+    },
+    {
+      "epoch": 2.36,
+      "learning_rate": 7.791157894736842e-06,
+      "loss": 0.0522,
+      "step": 750
+    },
+    {
+      "epoch": 2.44,
+      "learning_rate": 7.770105263157894e-06,
+      "loss": 0.0558,
+      "step": 775
+    },
+    {
+      "epoch": 2.52,
+      "learning_rate": 7.749052631578947e-06,
+      "loss": 0.0547,
+      "step": 800
+    },
+    {
+      "epoch": 2.59,
+      "learning_rate": 7.728e-06,
+      "loss": 0.0568,
+      "step": 825
+    },
+    {
+      "epoch": 2.67,
+      "learning_rate": 7.706947368421052e-06,
+      "loss": 0.0569,
+      "step": 850
+    },
+    {
+      "epoch": 2.75,
+      "learning_rate": 7.685894736842105e-06,
+      "loss": 0.0573,
+      "step": 875
+    },
+    {
+      "epoch": 2.83,
+      "learning_rate": 7.664842105263157e-06,
+      "loss": 0.0538,
+      "step": 900
+    },
+    {
+      "epoch": 2.91,
+      "learning_rate": 7.64378947368421e-06,
+      "loss": 0.054,
+      "step": 925
+    },
+    {
+      "epoch": 2.99,
+      "learning_rate": 7.622736842105263e-06,
+      "loss": 0.0553,
+      "step": 950
+    },
+    {
+      "epoch": 3.07,
+      "learning_rate": 7.6016842105263155e-06,
+      "loss": 0.0316,
+      "step": 975
+    },
+    {
+      "epoch": 3.14,
+      "learning_rate": 7.580631578947368e-06,
+      "loss": 0.0265,
+      "step": 1000
+    },
+    {
+      "epoch": 3.14,
+      "eval_loss": 0.3689558207988739,
+      "eval_runtime": 1285.0181,
+      "eval_samples_per_second": 1.66,
+      "eval_steps_per_second": 0.208,
+      "eval_wer": 14.760652288269332,
+      "step": 1000
+    },
+    {
+      "epoch": 3.22,
+      "learning_rate": 7.559578947368421e-06,
+      "loss": 0.0247,
+      "step": 1025
+    },
+    {
+      "epoch": 3.3,
+      "learning_rate": 7.5385263157894734e-06,
+      "loss": 0.0285,
+      "step": 1050
+    },
+    {
+      "epoch": 3.38,
+      "learning_rate": 7.517473684210526e-06,
+      "loss": 0.0266,
+      "step": 1075
+    },
+    {
+      "epoch": 3.46,
+      "learning_rate": 7.496421052631579e-06,
+      "loss": 0.0242,
+      "step": 1100
+    },
+    {
+      "epoch": 3.54,
+      "learning_rate": 7.475368421052631e-06,
+      "loss": 0.0286,
+      "step": 1125
+    },
+    {
+      "epoch": 3.62,
+      "learning_rate": 7.454315789473684e-06,
+      "loss": 0.0254,
+      "step": 1150
+    },
+    {
+      "epoch": 3.69,
+      "learning_rate": 7.433263157894736e-06,
+      "loss": 0.0303,
+      "step": 1175
+    },
+    {
+      "epoch": 3.77,
+      "learning_rate": 7.4122105263157885e-06,
+      "loss": 0.0281,
+      "step": 1200
+    },
+    {
+      "epoch": 3.85,
+      "learning_rate": 7.391157894736841e-06,
+      "loss": 0.0267,
+      "step": 1225
+    },
+    {
+      "epoch": 3.93,
+      "learning_rate": 7.370105263157895e-06,
+      "loss": 0.0272,
+      "step": 1250
+    },
+    {
+      "epoch": 4.01,
+      "learning_rate": 7.349052631578947e-06,
+      "loss": 0.0233,
+      "step": 1275
+    },
+    {
+      "epoch": 4.09,
+      "learning_rate": 7.328e-06,
+      "loss": 0.0133,
+      "step": 1300
+    },
+    {
+      "epoch": 4.17,
+      "learning_rate": 7.306947368421053e-06,
+      "loss": 0.0148,
+      "step": 1325
+    },
+    {
+      "epoch": 4.25,
+      "learning_rate": 7.285894736842105e-06,
+      "loss": 0.0153,
+      "step": 1350
+    },
+    {
+      "epoch": 4.32,
+      "learning_rate": 7.264842105263158e-06,
+      "loss": 0.016,
+      "step": 1375
+    },
+    {
+      "epoch": 4.4,
+      "learning_rate": 7.243789473684211e-06,
+      "loss": 0.0146,
+      "step": 1400
+    },
+    {
+      "epoch": 4.48,
+      "learning_rate": 7.222736842105262e-06,
+      "loss": 0.0147,
+      "step": 1425
+    },
+    {
+      "epoch": 4.56,
+      "learning_rate": 7.201684210526315e-06,
+      "loss": 0.0151,
+      "step": 1450
+    },
+    {
+      "epoch": 4.64,
+      "learning_rate": 7.180631578947368e-06,
+      "loss": 0.0135,
+      "step": 1475
+    },
+    {
+      "epoch": 4.72,
+      "learning_rate": 7.15957894736842e-06,
+      "loss": 0.0159,
+      "step": 1500
+    },
+    {
+      "epoch": 4.8,
+      "learning_rate": 7.138526315789473e-06,
+      "loss": 0.0166,
+      "step": 1525
+    },
+    {
+      "epoch": 4.87,
+      "learning_rate": 7.117473684210526e-06,
+      "loss": 0.0118,
+      "step": 1550
+    },
+    {
+      "epoch": 4.95,
+      "learning_rate": 7.096421052631578e-06,
+      "loss": 0.015,
+      "step": 1575
+    },
+    {
+      "epoch": 5.03,
+      "learning_rate": 7.075368421052632e-06,
+      "loss": 0.0121,
+      "step": 1600
+    },
+    {
+      "epoch": 5.11,
+      "learning_rate": 7.0543157894736845e-06,
+      "loss": 0.0098,
+      "step": 1625
+    },
+    {
+      "epoch": 5.19,
+      "learning_rate": 7.033263157894737e-06,
+      "loss": 0.0083,
+      "step": 1650
+    },
+    {
+      "epoch": 5.27,
+      "learning_rate": 7.012210526315789e-06,
+      "loss": 0.0092,
+      "step": 1675
+    },
+    {
+      "epoch": 5.35,
+      "learning_rate": 6.991157894736842e-06,
+      "loss": 0.0076,
+      "step": 1700
+    },
+    {
+      "epoch": 5.42,
+      "learning_rate": 6.970105263157894e-06,
+      "loss": 0.009,
+      "step": 1725
+    },
+    {
+      "epoch": 5.5,
+      "learning_rate": 6.949052631578947e-06,
+      "loss": 0.0098,
+      "step": 1750
+    },
+    {
+      "epoch": 5.58,
+      "learning_rate": 6.9279999999999996e-06,
+      "loss": 0.0069,
+      "step": 1775
+    },
+    {
+      "epoch": 5.66,
+      "learning_rate": 6.906947368421052e-06,
+      "loss": 0.0095,
+      "step": 1800
+    },
+    {
+      "epoch": 5.74,
+      "learning_rate": 6.885894736842105e-06,
+      "loss": 0.009,
+      "step": 1825
+    },
+    {
+      "epoch": 5.82,
+      "learning_rate": 6.8648421052631575e-06,
+      "loss": 0.0103,
+      "step": 1850
+    },
+    {
+      "epoch": 5.9,
+      "learning_rate": 6.84378947368421e-06,
+      "loss": 0.0106,
+      "step": 1875
+    },
+    {
+      "epoch": 5.97,
+      "learning_rate": 6.822736842105263e-06,
+      "loss": 0.0114,
+      "step": 1900
+    },
+    {
+      "epoch": 6.05,
+      "learning_rate": 6.8016842105263155e-06,
+      "loss": 0.0089,
+      "step": 1925
+    },
+    {
+      "epoch": 6.13,
+      "learning_rate": 6.780631578947368e-06,
+      "loss": 0.0055,
+      "step": 1950
+    },
+    {
+      "epoch": 6.21,
+      "learning_rate": 6.759578947368421e-06,
+      "loss": 0.0051,
+      "step": 1975
+    },
+    {
+      "epoch": 6.29,
+      "learning_rate": 6.7385263157894735e-06,
+      "loss": 0.0063,
+      "step": 2000
+    },
+    {
+      "epoch": 6.29,
+      "eval_loss": 0.4341892600059509,
+      "eval_runtime": 1246.3959,
+      "eval_samples_per_second": 1.711,
+      "eval_steps_per_second": 0.214,
+      "eval_wer": 14.092582851130983,
+      "step": 2000
+    },
+    {
+      "epoch": 6.37,
+      "learning_rate": 6.717473684210526e-06,
+      "loss": 0.006,
+      "step": 2025
+    },
+    {
+      "epoch": 6.45,
+      "learning_rate": 6.696421052631579e-06,
+      "loss": 0.005,
+      "step": 2050
+    },
+    {
+      "epoch": 6.53,
+      "learning_rate": 6.6753684210526314e-06,
+      "loss": 0.0047,
+      "step": 2075
+    },
+    {
+      "epoch": 6.6,
+      "learning_rate": 6.654315789473684e-06,
+      "loss": 0.0066,
+      "step": 2100
+    },
+    {
+      "epoch": 6.68,
+      "learning_rate": 6.633263157894737e-06,
+      "loss": 0.0057,
+      "step": 2125
+    },
+    {
+      "epoch": 6.76,
+      "learning_rate": 6.612210526315789e-06,
+      "loss": 0.0063,
+      "step": 2150
+    },
+    {
+      "epoch": 6.84,
+      "learning_rate": 6.591157894736841e-06,
+      "loss": 0.0067,
+      "step": 2175
+    },
+    {
+      "epoch": 6.92,
+      "learning_rate": 6.570105263157894e-06,
+      "loss": 0.006,
+      "step": 2200
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 6.5490526315789465e-06,
+      "loss": 0.0066,
+      "step": 2225
+    },
+    {
+      "epoch": 7.08,
+      "learning_rate": 6.527999999999999e-06,
+      "loss": 0.0056,
+      "step": 2250
+    },
+    {
+      "epoch": 7.15,
+      "learning_rate": 6.506947368421053e-06,
+      "loss": 0.0036,
+      "step": 2275
+    },
+    {
+      "epoch": 7.23,
+      "learning_rate": 6.485894736842105e-06,
+      "loss": 0.0034,
+      "step": 2300
+    },
+    {
+      "epoch": 7.31,
+      "learning_rate": 6.464842105263158e-06,
+      "loss": 0.0027,
+      "step": 2325
+    },
+    {
+      "epoch": 7.39,
+      "learning_rate": 6.443789473684211e-06,
+      "loss": 0.0044,
+      "step": 2350
+    },
+    {
+      "epoch": 7.47,
+      "learning_rate": 6.422736842105263e-06,
+      "loss": 0.005,
+      "step": 2375
+    },
+    {
+      "epoch": 7.55,
+      "learning_rate": 6.401684210526316e-06,
+      "loss": 0.0034,
+      "step": 2400
+    },
+    {
+      "epoch": 7.63,
+      "learning_rate": 6.380631578947368e-06,
+      "loss": 0.0028,
+      "step": 2425
+    },
+    {
+      "epoch": 7.7,
+      "learning_rate": 6.35957894736842e-06,
+      "loss": 0.0037,
+      "step": 2450
+    },
+    {
+      "epoch": 7.78,
+      "learning_rate": 6.338526315789473e-06,
+      "loss": 0.0045,
+      "step": 2475
+    },
+    {
+      "epoch": 7.86,
+      "learning_rate": 6.317473684210526e-06,
+      "loss": 0.005,
+      "step": 2500
+    },
+    {
+      "epoch": 7.94,
+      "learning_rate": 6.296421052631578e-06,
+      "loss": 0.0063,
+      "step": 2525
+    },
+    {
+      "epoch": 8.02,
+      "learning_rate": 6.275368421052631e-06,
+      "loss": 0.0051,
+      "step": 2550
+    },
+    {
+      "epoch": 8.1,
+      "learning_rate": 6.254315789473684e-06,
+      "loss": 0.0038,
+      "step": 2575
+    },
+    {
+      "epoch": 8.18,
+      "learning_rate": 6.233263157894737e-06,
+      "loss": 0.0035,
+      "step": 2600
+    },
+    {
+      "epoch": 8.25,
+      "learning_rate": 6.21221052631579e-06,
+      "loss": 0.0036,
+      "step": 2625
+    },
+    {
+      "epoch": 8.33,
+      "learning_rate": 6.1911578947368425e-06,
+      "loss": 0.0034,
+      "step": 2650
+    },
+    {
+      "epoch": 8.41,
+      "learning_rate": 6.170105263157894e-06,
+      "loss": 0.0028,
+      "step": 2675
+    },
+    {
+      "epoch": 8.49,
+      "learning_rate": 6.149052631578947e-06,
+      "loss": 0.0028,
+      "step": 2700
+    },
+    {
+      "epoch": 8.57,
+      "learning_rate": 6.128e-06,
+      "loss": 0.0024,
+      "step": 2725
+    },
+    {
+      "epoch": 8.65,
+      "learning_rate": 6.106947368421052e-06,
+      "loss": 0.0029,
+      "step": 2750
+    },
+    {
+      "epoch": 8.73,
+      "learning_rate": 6.085894736842105e-06,
+      "loss": 0.0032,
+      "step": 2775
+    },
+    {
+      "epoch": 8.81,
+      "learning_rate": 6.0648421052631576e-06,
+      "loss": 0.0031,
+      "step": 2800
+    },
+    {
+      "epoch": 8.88,
+      "learning_rate": 6.04378947368421e-06,
+      "loss": 0.0023,
+      "step": 2825
+    },
+    {
+      "epoch": 8.96,
+      "learning_rate": 6.022736842105263e-06,
+      "loss": 0.0028,
+      "step": 2850
+    },
+    {
+      "epoch": 9.04,
+      "learning_rate": 6.0016842105263155e-06,
+      "loss": 0.0032,
+      "step": 2875
+    },
+    {
+      "epoch": 9.12,
+      "learning_rate": 5.980631578947368e-06,
+      "loss": 0.0037,
+      "step": 2900
+    },
+    {
+      "epoch": 9.2,
+      "learning_rate": 5.95957894736842e-06,
+      "loss": 0.0021,
+      "step": 2925
+    },
+    {
+      "epoch": 9.28,
+      "learning_rate": 5.9385263157894735e-06,
+      "loss": 0.0021,
+      "step": 2950
+    },
+    {
+      "epoch": 9.36,
+      "learning_rate": 5.917473684210526e-06,
+      "loss": 0.0022,
+      "step": 2975
+    },
+    {
+      "epoch": 9.43,
+      "learning_rate": 5.896421052631579e-06,
+      "loss": 0.0016,
+      "step": 3000
+    },
+    {
+      "epoch": 9.43,
+      "eval_loss": 0.48472946882247925,
+      "eval_runtime": 1245.478,
+      "eval_samples_per_second": 1.713,
+      "eval_steps_per_second": 0.214,
+      "eval_wer": 14.360862703840086,
+      "step": 3000
+    },
+    {
+      "epoch": 9.51,
+      "learning_rate": 5.8753684210526315e-06,
+      "loss": 0.002,
+      "step": 3025
+    },
+    {
+      "epoch": 9.59,
+      "learning_rate": 5.854315789473684e-06,
+      "loss": 0.0027,
+      "step": 3050
+    },
+    {
+      "epoch": 9.67,
+      "learning_rate": 5.833263157894737e-06,
+      "loss": 0.0027,
+      "step": 3075
+    },
+    {
+      "epoch": 9.75,
+      "learning_rate": 5.8122105263157894e-06,
+      "loss": 0.0038,
+      "step": 3100
+    },
+    {
+      "epoch": 9.83,
+      "learning_rate": 5.791157894736842e-06,
+      "loss": 0.0027,
+      "step": 3125
+    },
+    {
+      "epoch": 9.91,
+      "learning_rate": 5.770105263157895e-06,
+      "loss": 0.0021,
+      "step": 3150
+    },
+    {
+      "epoch": 9.98,
+      "learning_rate": 5.7490526315789465e-06,
+      "loss": 0.0024,
+      "step": 3175
+    },
+    {
+      "epoch": 10.06,
+      "learning_rate": 5.727999999999999e-06,
+      "loss": 0.0017,
+      "step": 3200
+    },
+    {
+      "epoch": 10.14,
+      "learning_rate": 5.706947368421052e-06,
+      "loss": 0.0024,
+      "step": 3225
+    },
+    {
+      "epoch": 10.22,
+      "learning_rate": 5.6858947368421045e-06,
+      "loss": 0.0023,
+      "step": 3250
+    },
+    {
+      "epoch": 10.3,
+      "learning_rate": 5.664842105263157e-06,
+      "loss": 0.0018,
+      "step": 3275
+    },
+    {
+      "epoch": 10.38,
+      "learning_rate": 5.643789473684211e-06,
+      "loss": 0.0019,
+      "step": 3300
+    },
+    {
+      "epoch": 10.46,
+      "learning_rate": 5.622736842105263e-06,
+      "loss": 0.0027,
+      "step": 3325
+    },
+    {
+      "epoch": 10.53,
+      "learning_rate": 5.601684210526316e-06,
+      "loss": 0.0027,
+      "step": 3350
+    },
+    {
+      "epoch": 10.61,
+      "learning_rate": 5.580631578947369e-06,
+      "loss": 0.0022,
+      "step": 3375
+    },
+    {
+      "epoch": 10.69,
+      "learning_rate": 5.559578947368421e-06,
+      "loss": 0.0019,
+      "step": 3400
+    },
+    {
+      "epoch": 10.77,
+      "learning_rate": 5.538526315789473e-06,
+      "loss": 0.0018,
+      "step": 3425
+    },
+    {
+      "epoch": 10.85,
+      "learning_rate": 5.517473684210526e-06,
+      "loss": 0.002,
+      "step": 3450
+    },
+    {
+      "epoch": 10.93,
+      "learning_rate": 5.496421052631578e-06,
+      "loss": 0.0034,
+      "step": 3475
+    },
+    {
+      "epoch": 11.01,
+      "learning_rate": 5.475368421052631e-06,
+      "loss": 0.0017,
+      "step": 3500
+    },
+    {
+      "epoch": 11.08,
+      "learning_rate": 5.454315789473684e-06,
+      "loss": 0.002,
+      "step": 3525
+    },
+    {
+      "epoch": 11.16,
+      "learning_rate": 5.433263157894736e-06,
+      "loss": 0.0019,
+      "step": 3550
+    },
+    {
+      "epoch": 11.24,
+      "learning_rate": 5.412210526315789e-06,
+      "loss": 0.0022,
+      "step": 3575
+    },
+    {
+      "epoch": 11.32,
+      "learning_rate": 5.391157894736842e-06,
+      "loss": 0.0015,
+      "step": 3600
+    },
+    {
+      "epoch": 11.4,
+      "learning_rate": 5.370105263157895e-06,
+      "loss": 0.0014,
+      "step": 3625
+    },
+    {
+      "epoch": 11.48,
+      "learning_rate": 5.349052631578948e-06,
+      "loss": 0.0017,
+      "step": 3650
+    },
+    {
+      "epoch": 11.56,
+      "learning_rate": 5.328e-06,
+      "loss": 0.0015,
+      "step": 3675
+    },
+    {
+      "epoch": 11.64,
+      "learning_rate": 5.306947368421052e-06,
+      "loss": 0.0016,
+      "step": 3700
+    },
+    {
+      "epoch": 11.71,
+      "learning_rate": 5.285894736842105e-06,
+      "loss": 0.0026,
+      "step": 3725
+    },
+    {
+      "epoch": 11.79,
+      "learning_rate": 5.264842105263158e-06,
+      "loss": 0.0026,
+      "step": 3750
+    },
+    {
+      "epoch": 11.87,
+      "learning_rate": 5.24378947368421e-06,
+      "loss": 0.0026,
+      "step": 3775
+    },
+    {
+      "epoch": 11.95,
+      "learning_rate": 5.222736842105263e-06,
+      "loss": 0.0019,
+      "step": 3800
+    },
+    {
+      "epoch": 12.03,
+      "learning_rate": 5.2016842105263156e-06,
+      "loss": 0.0019,
+      "step": 3825
+    },
+    {
+      "epoch": 12.11,
+      "learning_rate": 5.180631578947368e-06,
+      "loss": 0.0018,
+      "step": 3850
+    },
+    {
+      "epoch": 12.19,
+      "learning_rate": 5.159578947368421e-06,
+      "loss": 0.0021,
+      "step": 3875
+    },
+    {
+      "epoch": 12.26,
+      "learning_rate": 5.1385263157894735e-06,
+      "loss": 0.0015,
+      "step": 3900
+    },
+    {
+      "epoch": 12.34,
+      "learning_rate": 5.117473684210525e-06,
+      "loss": 0.0019,
+      "step": 3925
+    },
+    {
+      "epoch": 12.42,
+      "learning_rate": 5.096421052631578e-06,
+      "loss": 0.0026,
+      "step": 3950
+    },
+    {
+      "epoch": 12.5,
+      "learning_rate": 5.0753684210526315e-06,
+      "loss": 0.0015,
+      "step": 3975
+    },
+    {
+      "epoch": 12.58,
+      "learning_rate": 5.054315789473684e-06,
+      "loss": 0.002,
+      "step": 4000
+    },
+    {
+      "epoch": 12.58,
+      "eval_loss": 0.4919339120388031,
+      "eval_runtime": 1243.533,
+      "eval_samples_per_second": 1.715,
+      "eval_steps_per_second": 0.215,
+      "eval_wer": 14.171488690163073,
+      "step": 4000
+    },
+    {
+      "epoch": 12.66,
+      "learning_rate": 5.033263157894737e-06,
+      "loss": 0.0017,
+      "step": 4025
+    },
+    {
+      "epoch": 12.74,
+      "learning_rate": 5.0122105263157895e-06,
+      "loss": 0.0025,
+      "step": 4050
+    },
+    {
+      "epoch": 12.81,
+      "learning_rate": 4.991157894736842e-06,
+      "loss": 0.0025,
+      "step": 4075
+    },
+    {
+      "epoch": 12.89,
+      "learning_rate": 4.970105263157895e-06,
+      "loss": 0.0016,
+      "step": 4100
+    },
+    {
+      "epoch": 12.97,
+      "learning_rate": 4.9490526315789474e-06,
+      "loss": 0.0027,
+      "step": 4125
+    },
+    {
+      "epoch": 13.05,
+      "learning_rate": 4.928e-06,
+      "loss": 0.0021,
+      "step": 4150
+    },
+    {
+      "epoch": 13.13,
+      "learning_rate": 4.906947368421052e-06,
+      "loss": 0.0012,
+      "step": 4175
+    },
+    {
+      "epoch": 13.21,
+      "learning_rate": 4.8858947368421045e-06,
+      "loss": 0.0018,
+      "step": 4200
+    },
+    {
+      "epoch": 13.29,
+      "learning_rate": 4.864842105263157e-06,
+      "loss": 0.0012,
+      "step": 4225
+    },
+    {
+      "epoch": 13.36,
+      "learning_rate": 4.84378947368421e-06,
+      "loss": 0.0012,
+      "step": 4250
+    },
+    {
+      "epoch": 13.44,
+      "learning_rate": 4.8227368421052625e-06,
+      "loss": 0.0008,
+      "step": 4275
+    },
+    {
+      "epoch": 13.52,
+      "learning_rate": 4.801684210526316e-06,
+      "loss": 0.001,
+      "step": 4300
+    },
+    {
+      "epoch": 13.6,
+      "learning_rate": 4.780631578947369e-06,
+      "loss": 0.001,
+      "step": 4325
+    },
+    {
+      "epoch": 13.68,
+      "learning_rate": 4.759578947368421e-06,
+      "loss": 0.001,
+      "step": 4350
+    },
+    {
+      "epoch": 13.76,
+      "learning_rate": 4.738526315789474e-06,
+      "loss": 0.0011,
+      "step": 4375
+    },
+    {
+      "epoch": 13.84,
+      "learning_rate": 4.717473684210527e-06,
+      "loss": 0.0011,
+      "step": 4400
+    },
+    {
+      "epoch": 13.92,
+      "learning_rate": 4.6964210526315784e-06,
+      "loss": 0.0008,
+      "step": 4425
+    },
+    {
+      "epoch": 13.99,
+      "learning_rate": 4.675368421052631e-06,
+      "loss": 0.0021,
+      "step": 4450
+    },
+    {
+      "epoch": 14.07,
+      "learning_rate": 4.654315789473684e-06,
+      "loss": 0.0018,
+      "step": 4475
+    },
+    {
+      "epoch": 14.15,
+      "learning_rate": 4.633263157894736e-06,
+      "loss": 0.0013,
+      "step": 4500
+    },
+    {
+      "epoch": 14.23,
+      "learning_rate": 4.612210526315789e-06,
+      "loss": 0.0009,
+      "step": 4525
+    },
+    {
+      "epoch": 14.31,
+      "learning_rate": 4.591157894736842e-06,
+      "loss": 0.0012,
+      "step": 4550
+    },
+    {
+      "epoch": 14.39,
+      "learning_rate": 4.570105263157894e-06,
+      "loss": 0.0009,
+      "step": 4575
+    },
+    {
+      "epoch": 14.47,
+      "learning_rate": 4.549052631578947e-06,
+      "loss": 0.002,
+      "step": 4600
+    },
+    {
+      "epoch": 14.54,
+      "learning_rate": 4.528e-06,
+      "loss": 0.0011,
+      "step": 4625
+    },
+    {
+      "epoch": 14.62,
+      "learning_rate": 4.506947368421053e-06,
+      "loss": 0.0006,
+      "step": 4650
+    },
+    {
+      "epoch": 14.7,
+      "learning_rate": 4.485894736842105e-06,
+      "loss": 0.0013,
+      "step": 4675
+    },
+    {
+      "epoch": 14.78,
+      "learning_rate": 4.464842105263158e-06,
+      "loss": 0.0011,
+      "step": 4700
+    },
+    {
+      "epoch": 14.86,
+      "learning_rate": 4.44378947368421e-06,
+      "loss": 0.0013,
+      "step": 4725
+    },
+    {
+      "epoch": 14.94,
+      "learning_rate": 4.422736842105263e-06,
+      "loss": 0.0012,
+      "step": 4750
+    },
+    {
+      "epoch": 15.02,
+      "learning_rate": 4.401684210526316e-06,
+      "loss": 0.0024,
+      "step": 4775
+    },
+    {
+      "epoch": 15.09,
+      "learning_rate": 4.380631578947368e-06,
+      "loss": 0.0013,
+      "step": 4800
+    },
+    {
+      "epoch": 15.17,
+      "learning_rate": 4.359578947368421e-06,
+      "loss": 0.0013,
+      "step": 4825
+    },
+    {
+      "epoch": 15.25,
+      "learning_rate": 4.3385263157894736e-06,
+      "loss": 0.0014,
+      "step": 4850
+    },
+    {
+      "epoch": 15.33,
+      "learning_rate": 4.317473684210526e-06,
+      "loss": 0.0015,
+      "step": 4875
+    },
+    {
+      "epoch": 15.41,
+      "learning_rate": 4.296421052631579e-06,
+      "loss": 0.0006,
+      "step": 4900
+    },
+    {
+      "epoch": 15.49,
+      "learning_rate": 4.275368421052631e-06,
+      "loss": 0.0008,
+      "step": 4925
+    },
+    {
+      "epoch": 15.57,
+      "learning_rate": 4.254315789473683e-06,
+      "loss": 0.0008,
+      "step": 4950
+    },
+    {
+      "epoch": 15.64,
+      "learning_rate": 4.233263157894737e-06,
+      "loss": 0.0007,
+      "step": 4975
+    },
+    {
+      "epoch": 15.72,
+      "learning_rate": 4.2122105263157895e-06,
+      "loss": 0.0013,
+      "step": 5000
+    },
+    {
+      "epoch": 15.72,
+      "eval_loss": 0.5114014744758606,
+      "eval_runtime": 1251.3958,
+      "eval_samples_per_second": 1.704,
+      "eval_steps_per_second": 0.213,
+      "eval_wer": 14.229352972119939,
+      "step": 5000
+    },
+    {
+      "epoch": 15.8,
+      "learning_rate": 4.191157894736842e-06,
+      "loss": 0.0011,
+      "step": 5025
+    },
+    {
+      "epoch": 15.88,
+      "learning_rate": 4.170105263157895e-06,
+      "loss": 0.0011,
+      "step": 5050
+    },
+    {
+      "epoch": 15.96,
+      "learning_rate": 4.1490526315789475e-06,
+      "loss": 0.0007,
+      "step": 5075
+    },
+    {
+      "epoch": 16.04,
+      "learning_rate": 4.128e-06,
+      "loss": 0.0011,
+      "step": 5100
+    },
+    {
+      "epoch": 16.12,
+      "learning_rate": 4.106947368421053e-06,
+      "loss": 0.0012,
+      "step": 5125
+    },
+    {
+      "epoch": 16.19,
+      "learning_rate": 4.0858947368421054e-06,
+      "loss": 0.0005,
+      "step": 5150
+    },
+    {
+      "epoch": 16.27,
+      "learning_rate": 4.064842105263157e-06,
+      "loss": 0.0016,
+      "step": 5175
+    },
+    {
+      "epoch": 16.35,
+      "learning_rate": 4.04378947368421e-06,
+      "loss": 0.0009,
+      "step": 5200
+    },
+    {
+      "epoch": 16.43,
+      "learning_rate": 4.0227368421052625e-06,
+      "loss": 0.0005,
+      "step": 5225
+    },
+    {
+      "epoch": 16.51,
+      "learning_rate": 4.001684210526315e-06,
+      "loss": 0.0006,
+      "step": 5250
+    },
+    {
+      "epoch": 16.59,
+      "learning_rate": 3.980631578947369e-06,
+      "loss": 0.0005,
+      "step": 5275
+    },
+    {
+      "epoch": 16.67,
+      "learning_rate": 3.9595789473684205e-06,
+      "loss": 0.0005,
+      "step": 5300
+    },
+    {
+      "epoch": 16.75,
+      "learning_rate": 3.939368421052631e-06,
+      "loss": 0.0015,
+      "step": 5325
+    },
+    {
+      "epoch": 16.82,
+      "learning_rate": 3.918315789473684e-06,
+      "loss": 0.0006,
+      "step": 5350
+    },
+    {
+      "epoch": 16.9,
+      "learning_rate": 3.897263157894737e-06,
+      "loss": 0.0005,
+      "step": 5375
+    },
+    {
+      "epoch": 16.98,
+      "learning_rate": 3.87621052631579e-06,
+      "loss": 0.0014,
+      "step": 5400
+    },
+    {
+      "epoch": 17.06,
+      "learning_rate": 3.855157894736842e-06,
+      "loss": 0.0012,
+      "step": 5425
+    },
+    {
+      "epoch": 17.14,
+      "learning_rate": 3.834105263157894e-06,
+      "loss": 0.0024,
+      "step": 5450
+    },
+    {
+      "epoch": 17.22,
+      "learning_rate": 3.813052631578947e-06,
+      "loss": 0.0007,
+      "step": 5475
+    },
+    {
+      "epoch": 17.3,
+      "learning_rate": 3.7919999999999994e-06,
+      "loss": 0.001,
+      "step": 5500
+    },
+    {
+      "epoch": 17.37,
+      "learning_rate": 3.7709473684210525e-06,
+      "loss": 0.0012,
+      "step": 5525
+    },
+    {
+      "epoch": 17.45,
+      "learning_rate": 3.749894736842105e-06,
+      "loss": 0.0008,
+      "step": 5550
+    },
+    {
+      "epoch": 17.53,
+      "learning_rate": 3.728842105263158e-06,
+      "loss": 0.0004,
+      "step": 5575
+    },
+    {
+      "epoch": 17.61,
+      "learning_rate": 3.7077894736842105e-06,
+      "loss": 0.0005,
+      "step": 5600
+    },
+    {
+      "epoch": 17.69,
+      "learning_rate": 3.6867368421052627e-06,
+      "loss": 0.0005,
+      "step": 5625
+    },
+    {
+      "epoch": 17.77,
+      "learning_rate": 3.6656842105263154e-06,
+      "loss": 0.0007,
+      "step": 5650
+    },
+    {
+      "epoch": 17.85,
+      "learning_rate": 3.644631578947368e-06,
+      "loss": 0.0011,
+      "step": 5675
+    },
+    {
+      "epoch": 17.92,
+      "learning_rate": 3.623578947368421e-06,
+      "loss": 0.0005,
+      "step": 5700
+    },
+    {
+      "epoch": 18.0,
+      "learning_rate": 3.6025263157894738e-06,
+      "loss": 0.0004,
+      "step": 5725
+    },
+    {
+      "epoch": 18.08,
+      "learning_rate": 3.5814736842105264e-06,
+      "loss": 0.0007,
+      "step": 5750
+    },
+    {
+      "epoch": 18.16,
+      "learning_rate": 3.5604210526315786e-06,
+      "loss": 0.0003,
+      "step": 5775
+    },
+    {
+      "epoch": 18.24,
+      "learning_rate": 3.5393684210526313e-06,
+      "loss": 0.0003,
+      "step": 5800
+    },
+    {
+      "epoch": 18.32,
+      "learning_rate": 3.518315789473684e-06,
+      "loss": 0.0003,
+      "step": 5825
+    },
+    {
+      "epoch": 18.4,
+      "learning_rate": 3.4972631578947366e-06,
+      "loss": 0.001,
+      "step": 5850
+    },
+    {
+      "epoch": 18.47,
+      "learning_rate": 3.4762105263157897e-06,
+      "loss": 0.0003,
+      "step": 5875
+    },
+    {
+      "epoch": 18.55,
+      "learning_rate": 3.455157894736842e-06,
+      "loss": 0.0004,
+      "step": 5900
+    },
+    {
+      "epoch": 18.63,
+      "learning_rate": 3.4341052631578946e-06,
+      "loss": 0.0003,
+      "step": 5925
+    },
+    {
+      "epoch": 18.71,
+      "learning_rate": 3.4130526315789472e-06,
+      "loss": 0.0004,
+      "step": 5950
+    },
+    {
+      "epoch": 18.79,
+      "learning_rate": 3.392e-06,
+      "loss": 0.0004,
+      "step": 5975
+    },
+    {
+      "epoch": 18.87,
+      "learning_rate": 3.370947368421052e-06,
+      "loss": 0.0014,
+      "step": 6000
+    },
+    {
+      "epoch": 18.87,
+      "eval_loss": 0.5197107791900635,
+      "eval_runtime": 1246.3616,
+      "eval_samples_per_second": 1.711,
+      "eval_steps_per_second": 0.214,
+      "eval_wer": 13.913729615991583,
+      "step": 6000
+    },
+    {
+      "epoch": 18.95,
+      "learning_rate": 3.349894736842105e-06,
+      "loss": 0.0003,
+      "step": 6025
+    },
+    {
+      "epoch": 19.03,
+      "learning_rate": 3.328842105263158e-06,
+      "loss": 0.0003,
+      "step": 6050
+    },
+    {
+      "epoch": 19.1,
+      "learning_rate": 3.3077894736842105e-06,
+      "loss": 0.0004,
+      "step": 6075
+    },
+    {
+      "epoch": 19.18,
+      "learning_rate": 3.286736842105263e-06,
+      "loss": 0.0002,
+      "step": 6100
+    },
+    {
+      "epoch": 19.26,
+      "learning_rate": 3.2656842105263154e-06,
+      "loss": 0.0002,
+      "step": 6125
+    },
+    {
+      "epoch": 19.34,
+      "learning_rate": 3.244631578947368e-06,
+      "loss": 0.0004,
+      "step": 6150
+    },
+    {
+      "epoch": 19.42,
+      "learning_rate": 3.2235789473684207e-06,
+      "loss": 0.0005,
+      "step": 6175
+    },
+    {
+      "epoch": 19.5,
+      "learning_rate": 3.2025263157894738e-06,
+      "loss": 0.0003,
+      "step": 6200
+    },
+    {
+      "epoch": 19.58,
+      "learning_rate": 3.1814736842105264e-06,
+      "loss": 0.0007,
+      "step": 6225
+    },
+    {
+      "epoch": 19.65,
+      "learning_rate": 3.160421052631579e-06,
+      "loss": 0.0005,
+      "step": 6250
+    },
+    {
+      "epoch": 19.73,
+      "learning_rate": 3.1393684210526313e-06,
+      "loss": 0.0007,
+      "step": 6275
+    },
+    {
+      "epoch": 19.81,
+      "learning_rate": 3.118315789473684e-06,
+      "loss": 0.0002,
+      "step": 6300
+    },
+    {
+      "epoch": 19.89,
+      "learning_rate": 3.0972631578947366e-06,
+      "loss": 0.0008,
+      "step": 6325
+    },
+    {
+      "epoch": 19.97,
+      "learning_rate": 3.0762105263157893e-06,
+      "loss": 0.0013,
+      "step": 6350
+    },
+    {
+      "epoch": 20.05,
+      "learning_rate": 3.0551578947368424e-06,
+      "loss": 0.0004,
+      "step": 6375
+    },
+    {
+      "epoch": 20.13,
+      "learning_rate": 3.0341052631578946e-06,
+      "loss": 0.0002,
+      "step": 6400
+    },
+    {
+      "epoch": 20.2,
+      "learning_rate": 3.0130526315789472e-06,
+      "loss": 0.0004,
+      "step": 6425
+    },
+    {
+      "epoch": 20.28,
+      "learning_rate": 2.992e-06,
+      "loss": 0.0003,
+      "step": 6450
+    },
+    {
+      "epoch": 20.36,
+      "learning_rate": 2.9709473684210526e-06,
+      "loss": 0.0008,
+      "step": 6475
+    },
+    {
+      "epoch": 20.44,
+      "learning_rate": 2.9498947368421048e-06,
+      "loss": 0.0006,
+      "step": 6500
+    },
+    {
+      "epoch": 20.52,
+      "learning_rate": 2.9288421052631574e-06,
+      "loss": 0.0008,
+      "step": 6525
+    },
+    {
+      "epoch": 20.6,
+      "learning_rate": 2.9077894736842105e-06,
+      "loss": 0.0007,
+      "step": 6550
+    },
+    {
+      "epoch": 20.68,
+      "learning_rate": 2.886736842105263e-06,
+      "loss": 0.0007,
+      "step": 6575
+    },
+    {
+      "epoch": 20.75,
+      "learning_rate": 2.865684210526316e-06,
+      "loss": 0.0003,
+      "step": 6600
+    },
+    {
+      "epoch": 20.83,
+      "learning_rate": 2.8446315789473685e-06,
+      "loss": 0.0004,
+      "step": 6625
+    },
+    {
+      "epoch": 20.91,
+      "learning_rate": 2.8235789473684207e-06,
+      "loss": 0.0006,
+      "step": 6650
+    },
+    {
+      "epoch": 20.99,
+      "learning_rate": 2.8025263157894734e-06,
+      "loss": 0.0006,
+      "step": 6675
+    },
+    {
+      "epoch": 21.07,
+      "learning_rate": 2.781473684210526e-06,
+      "loss": 0.0008,
+      "step": 6700
+    },
+    {
+      "epoch": 21.15,
+      "learning_rate": 2.760421052631579e-06,
+      "loss": 0.0003,
+      "step": 6725
+    },
+    {
+      "epoch": 21.23,
+      "learning_rate": 2.7393684210526318e-06,
+      "loss": 0.0002,
+      "step": 6750
+    },
+    {
+      "epoch": 21.31,
+      "learning_rate": 2.718315789473684e-06,
+      "loss": 0.0002,
+      "step": 6775
+    },
+    {
+      "epoch": 21.38,
+      "learning_rate": 2.6972631578947366e-06,
+      "loss": 0.0003,
+      "step": 6800
+    },
+    {
+      "epoch": 21.46,
+      "learning_rate": 2.6762105263157893e-06,
+      "loss": 0.0005,
+      "step": 6825
+    },
+    {
+      "epoch": 21.54,
+      "learning_rate": 2.655157894736842e-06,
+      "loss": 0.0003,
+      "step": 6850
+    },
+    {
+      "epoch": 21.62,
+      "learning_rate": 2.634105263157895e-06,
+      "loss": 0.0004,
+      "step": 6875
+    },
+    {
+      "epoch": 21.7,
+      "learning_rate": 2.6130526315789473e-06,
+      "loss": 0.0003,
+      "step": 6900
+    },
+    {
+      "epoch": 21.78,
+      "learning_rate": 2.592e-06,
+      "loss": 0.0003,
+      "step": 6925
+    },
+    {
+      "epoch": 21.86,
+      "learning_rate": 2.5709473684210526e-06,
+      "loss": 0.0008,
+      "step": 6950
+    },
+    {
+      "epoch": 21.93,
+      "learning_rate": 2.5498947368421052e-06,
+      "loss": 0.0006,
+      "step": 6975
+    },
+    {
+      "epoch": 22.01,
+      "learning_rate": 2.5288421052631575e-06,
+      "loss": 0.0003,
+      "step": 7000
+    },
+    {
+      "epoch": 22.01,
+      "eval_loss": 0.5421546101570129,
+      "eval_runtime": 1231.4206,
+      "eval_samples_per_second": 1.732,
+      "eval_steps_per_second": 0.217,
+      "eval_wer": 14.1977906365071,
+      "step": 7000
+    },
+    {
+      "epoch": 22.09,
+      "learning_rate": 2.50778947368421e-06,
+      "loss": 0.0005,
+      "step": 7025
+    },
+    {
+      "epoch": 22.17,
+      "learning_rate": 2.486736842105263e-06,
+      "loss": 0.0002,
+      "step": 7050
+    },
+    {
+      "epoch": 22.25,
+      "learning_rate": 2.465684210526316e-06,
+      "loss": 0.0003,
+      "step": 7075
+    },
+    {
+      "epoch": 22.33,
+      "learning_rate": 2.4446315789473685e-06,
+      "loss": 0.0002,
+      "step": 7100
+    },
+    {
+      "epoch": 22.41,
+      "learning_rate": 2.423578947368421e-06,
+      "loss": 0.0003,
+      "step": 7125
+    },
+    {
+      "epoch": 22.48,
+      "learning_rate": 2.4025263157894734e-06,
+      "loss": 0.0002,
+      "step": 7150
+    },
+    {
+      "epoch": 22.56,
+      "learning_rate": 2.381473684210526e-06,
+      "loss": 0.0004,
+      "step": 7175
+    },
+    {
+      "epoch": 22.64,
+      "learning_rate": 2.3604210526315787e-06,
+      "loss": 0.0002,
+      "step": 7200
+    },
+    {
+      "epoch": 22.72,
+      "learning_rate": 2.3393684210526318e-06,
+      "loss": 0.0004,
+      "step": 7225
+    },
+    {
+      "epoch": 22.8,
+      "learning_rate": 2.3183157894736844e-06,
+      "loss": 0.0002,
+      "step": 7250
+    },
+    {
+      "epoch": 22.88,
+      "learning_rate": 2.2972631578947367e-06,
+      "loss": 0.0002,
+      "step": 7275
+    },
+    {
+      "epoch": 22.96,
+      "learning_rate": 2.2762105263157893e-06,
+      "loss": 0.0002,
+      "step": 7300
+    },
+    {
+      "epoch": 23.03,
+      "learning_rate": 2.255157894736842e-06,
+      "loss": 0.0003,
+      "step": 7325
+    },
+    {
+      "epoch": 23.11,
+      "learning_rate": 2.2341052631578946e-06,
+      "loss": 0.0002,
+      "step": 7350
+    },
+    {
+      "epoch": 23.19,
+      "learning_rate": 2.213052631578947e-06,
+      "loss": 0.0002,
+      "step": 7375
+    },
+    {
+      "epoch": 23.27,
+      "learning_rate": 2.192e-06,
+      "loss": 0.0001,
+      "step": 7400
+    },
+    {
+      "epoch": 23.35,
+      "learning_rate": 2.1709473684210526e-06,
+      "loss": 0.0001,
+      "step": 7425
+    },
+    {
+      "epoch": 23.43,
+      "learning_rate": 2.1498947368421052e-06,
+      "loss": 0.0001,
+      "step": 7450
+    },
+    {
+      "epoch": 23.51,
+      "learning_rate": 2.128842105263158e-06,
+      "loss": 0.0001,
+      "step": 7475
+    },
+    {
+      "epoch": 23.58,
+      "learning_rate": 2.10778947368421e-06,
+      "loss": 0.0001,
+      "step": 7500
+    },
+    {
+      "epoch": 23.66,
+      "learning_rate": 2.0867368421052628e-06,
+      "loss": 0.0001,
+      "step": 7525
+    },
+    {
+      "epoch": 23.74,
+      "learning_rate": 2.065684210526316e-06,
+      "loss": 0.0001,
+      "step": 7550
+    },
+    {
+      "epoch": 23.82,
+      "learning_rate": 2.0446315789473685e-06,
+      "loss": 0.0001,
+      "step": 7575
+    },
+    {
+      "epoch": 23.9,
+      "learning_rate": 2.023578947368421e-06,
+      "loss": 0.0001,
+      "step": 7600
+    },
+    {
+      "epoch": 23.98,
+      "learning_rate": 2.002526315789474e-06,
+      "loss": 0.0001,
+      "step": 7625
+    },
+    {
+      "epoch": 24.06,
+      "learning_rate": 1.981473684210526e-06,
+      "loss": 0.0001,
+      "step": 7650
+    },
+    {
+      "epoch": 24.14,
+      "learning_rate": 1.9604210526315787e-06,
+      "loss": 0.0001,
+      "step": 7675
+    },
+    {
+      "epoch": 24.21,
+      "learning_rate": 1.9393684210526314e-06,
+      "loss": 0.0001,
+      "step": 7700
+    },
+    {
+      "epoch": 24.29,
+      "learning_rate": 1.918315789473684e-06,
+      "loss": 0.0001,
+      "step": 7725
+    },
+    {
+      "epoch": 24.37,
+      "learning_rate": 1.8972631578947367e-06,
+      "loss": 0.0001,
+      "step": 7750
+    },
+    {
+      "epoch": 24.45,
+      "learning_rate": 1.8762105263157895e-06,
+      "loss": 0.0001,
+      "step": 7775
+    },
+    {
+      "epoch": 24.53,
+      "learning_rate": 1.855157894736842e-06,
+      "loss": 0.0001,
+      "step": 7800
+    },
+    {
+      "epoch": 24.61,
+      "learning_rate": 1.8341052631578946e-06,
+      "loss": 0.0001,
+      "step": 7825
+    },
+    {
+      "epoch": 24.69,
+      "learning_rate": 1.8130526315789473e-06,
+      "loss": 0.0001,
+      "step": 7850
+    },
+    {
+      "epoch": 24.76,
+      "learning_rate": 1.792e-06,
+      "loss": 0.0001,
+      "step": 7875
+    },
+    {
+      "epoch": 24.84,
+      "learning_rate": 1.7709473684210526e-06,
+      "loss": 0.0001,
+      "step": 7900
+    },
+    {
+      "epoch": 24.92,
+      "learning_rate": 1.749894736842105e-06,
+      "loss": 0.0001,
+      "step": 7925
+    },
+    {
+      "epoch": 25.0,
+      "learning_rate": 1.728842105263158e-06,
+      "loss": 0.0001,
+      "step": 7950
+    },
+    {
+      "epoch": 25.08,
+      "learning_rate": 1.7077894736842104e-06,
+      "loss": 0.0001,
+      "step": 7975
+    },
+    {
+      "epoch": 25.16,
+      "learning_rate": 1.686736842105263e-06,
+      "loss": 0.0001,
+      "step": 8000
+    },
+    {
+      "epoch": 25.16,
+      "eval_loss": 0.5658935904502869,
+      "eval_runtime": 1242.8998,
+      "eval_samples_per_second": 1.716,
+      "eval_steps_per_second": 0.215,
+      "eval_wer": 13.871646501841136,
+      "step": 8000
+    },
+    {
+      "epoch": 25.24,
+      "learning_rate": 1.6656842105263159e-06,
+      "loss": 0.0001,
+      "step": 8025
+    },
+    {
+      "epoch": 25.31,
+      "learning_rate": 1.6446315789473683e-06,
+      "loss": 0.0001,
+      "step": 8050
+    },
+    {
+      "epoch": 25.39,
+      "learning_rate": 1.623578947368421e-06,
+      "loss": 0.0001,
+      "step": 8075
+    },
+    {
+      "epoch": 25.47,
+      "learning_rate": 1.6025263157894734e-06,
+      "loss": 0.0001,
+      "step": 8100
+    },
+    {
+      "epoch": 25.55,
+      "learning_rate": 1.5814736842105263e-06,
+      "loss": 0.0001,
+      "step": 8125
+    },
+    {
+      "epoch": 25.63,
+      "learning_rate": 1.560421052631579e-06,
+      "loss": 0.0001,
+      "step": 8150
+    },
+    {
+      "epoch": 25.71,
+      "learning_rate": 1.5393684210526314e-06,
+      "loss": 0.0001,
+      "step": 8175
+    },
+    {
+      "epoch": 25.79,
+      "learning_rate": 1.5183157894736843e-06,
+      "loss": 0.0001,
+      "step": 8200
+    },
+    {
+      "epoch": 25.86,
+      "learning_rate": 1.4972631578947367e-06,
+      "loss": 0.0001,
+      "step": 8225
+    },
+    {
+      "epoch": 25.94,
+      "learning_rate": 1.4762105263157894e-06,
+      "loss": 0.0001,
+      "step": 8250
+    },
+    {
+      "epoch": 26.02,
+      "learning_rate": 1.4551578947368422e-06,
+      "loss": 0.0001,
+      "step": 8275
+    },
+    {
+      "epoch": 26.1,
+      "learning_rate": 1.4341052631578947e-06,
+      "loss": 0.0001,
+      "step": 8300
+    },
+    {
+      "epoch": 26.18,
+      "learning_rate": 1.4130526315789473e-06,
+      "loss": 0.0001,
+      "step": 8325
+    },
+    {
+      "epoch": 26.26,
+      "learning_rate": 1.3919999999999998e-06,
+      "loss": 0.0001,
+      "step": 8350
+    },
+    {
+      "epoch": 26.34,
+      "learning_rate": 1.3709473684210526e-06,
+      "loss": 0.0001,
+      "step": 8375
+    },
+    {
+      "epoch": 26.42,
+      "learning_rate": 1.3498947368421053e-06,
+      "loss": 0.0001,
+      "step": 8400
+    },
+    {
+      "epoch": 26.49,
+      "learning_rate": 1.3288421052631577e-06,
+      "loss": 0.0001,
+      "step": 8425
+    },
+    {
+      "epoch": 26.57,
+      "learning_rate": 1.3077894736842106e-06,
+      "loss": 0.0001,
+      "step": 8450
+    },
+    {
+      "epoch": 26.65,
+      "learning_rate": 1.286736842105263e-06,
+      "loss": 0.0001,
+      "step": 8475
+    },
+    {
+      "epoch": 26.73,
+      "learning_rate": 1.2656842105263157e-06,
+      "loss": 0.0001,
+      "step": 8500
+    },
+    {
+      "epoch": 26.81,
+      "learning_rate": 1.2446315789473683e-06,
+      "loss": 0.0001,
+      "step": 8525
+    },
+    {
+      "epoch": 26.89,
+      "learning_rate": 1.223578947368421e-06,
+      "loss": 0.0001,
+      "step": 8550
+    },
+    {
+      "epoch": 26.97,
+      "learning_rate": 1.2025263157894737e-06,
+      "loss": 0.0001,
+      "step": 8575
+    },
+    {
+      "epoch": 27.04,
+      "learning_rate": 1.181473684210526e-06,
+      "loss": 0.0001,
+      "step": 8600
+    },
+    {
+      "epoch": 27.12,
+      "learning_rate": 1.160421052631579e-06,
+      "loss": 0.0001,
+      "step": 8625
+    },
+    {
+      "epoch": 27.2,
+      "learning_rate": 1.1393684210526316e-06,
+      "loss": 0.0001,
+      "step": 8650
+    },
+    {
+      "epoch": 27.28,
+      "learning_rate": 1.118315789473684e-06,
+      "loss": 0.0001,
+      "step": 8675
+    },
+    {
+      "epoch": 27.36,
+      "learning_rate": 1.097263157894737e-06,
+      "loss": 0.0001,
+      "step": 8700
+    },
+    {
+      "epoch": 27.44,
+      "learning_rate": 1.0762105263157894e-06,
+      "loss": 0.0001,
+      "step": 8725
+    },
+    {
+      "epoch": 27.52,
+      "learning_rate": 1.055157894736842e-06,
+      "loss": 0.0001,
+      "step": 8750
+    },
+    {
+      "epoch": 27.59,
+      "learning_rate": 1.0341052631578947e-06,
+      "loss": 0.0001,
+      "step": 8775
+    },
+    {
+      "epoch": 27.67,
+      "learning_rate": 1.0130526315789473e-06,
+      "loss": 0.0001,
+      "step": 8800
+    },
+    {
+      "epoch": 27.75,
+      "learning_rate": 9.92e-07,
+      "loss": 0.0001,
+      "step": 8825
+    },
+    {
+      "epoch": 27.83,
+      "learning_rate": 9.709473684210526e-07,
+      "loss": 0.0001,
+      "step": 8850
+    },
+    {
+      "epoch": 27.91,
+      "learning_rate": 9.498947368421052e-07,
+      "loss": 0.0001,
+      "step": 8875
+    },
+    {
+      "epoch": 27.99,
+      "learning_rate": 9.288421052631578e-07,
+      "loss": 0.0001,
+      "step": 8900
+    },
+    {
+      "epoch": 28.07,
+      "learning_rate": 9.077894736842104e-07,
+      "loss": 0.0001,
+      "step": 8925
+    },
+    {
+      "epoch": 28.14,
+      "learning_rate": 8.867368421052632e-07,
+      "loss": 0.0001,
+      "step": 8950
+    },
+    {
+      "epoch": 28.22,
+      "learning_rate": 8.656842105263158e-07,
+      "loss": 0.0001,
+      "step": 8975
+    },
+    {
+      "epoch": 28.3,
+      "learning_rate": 8.446315789473684e-07,
+      "loss": 0.0001,
+      "step": 9000
+    },
+    {
+      "epoch": 28.3,
+      "eval_loss": 0.5772180557250977,
+      "eval_runtime": 1231.7677,
+      "eval_samples_per_second": 1.732,
+      "eval_steps_per_second": 0.217,
+      "eval_wer": 13.729615991583376,
+      "step": 9000
+    },
+    {
+      "epoch": 28.38,
+      "learning_rate": 8.23578947368421e-07,
+      "loss": 0.0001,
+      "step": 9025
+    },
+    {
+      "epoch": 28.46,
+      "learning_rate": 8.025263157894736e-07,
+      "loss": 0.0001,
+      "step": 9050
+    },
+    {
+      "epoch": 28.54,
+      "learning_rate": 7.814736842105263e-07,
+      "loss": 0.0001,
+      "step": 9075
+    },
+    {
+      "epoch": 28.62,
+      "learning_rate": 7.60421052631579e-07,
+      "loss": 0.0001,
+      "step": 9100
+    },
+    {
+      "epoch": 28.69,
+      "learning_rate": 7.393684210526315e-07,
+      "loss": 0.0001,
+      "step": 9125
+    },
+    {
+      "epoch": 28.77,
+      "learning_rate": 7.183157894736842e-07,
+      "loss": 0.0001,
+      "step": 9150
+    },
+    {
+      "epoch": 28.85,
+      "learning_rate": 6.972631578947367e-07,
+      "loss": 0.0001,
+      "step": 9175
+    },
+    {
+      "epoch": 28.93,
+      "learning_rate": 6.762105263157895e-07,
+      "loss": 0.0001,
+      "step": 9200
+    },
+    {
+      "epoch": 29.01,
+      "learning_rate": 6.55157894736842e-07,
+      "loss": 0.0001,
+      "step": 9225
+    },
+    {
+      "epoch": 29.09,
+      "learning_rate": 6.341052631578947e-07,
+      "loss": 0.0001,
+      "step": 9250
+    },
+    {
+      "epoch": 29.17,
+      "learning_rate": 6.130526315789474e-07,
+      "loss": 0.0001,
+      "step": 9275
+    },
+    {
+      "epoch": 29.25,
+      "learning_rate": 5.919999999999999e-07,
+      "loss": 0.0001,
+      "step": 9300
+    },
+    {
+      "epoch": 29.32,
+      "learning_rate": 5.709473684210527e-07,
+      "loss": 0.0001,
+      "step": 9325
+    },
+    {
+      "epoch": 29.4,
+      "learning_rate": 5.498947368421052e-07,
+      "loss": 0.0001,
+      "step": 9350
+    },
+    {
+      "epoch": 29.48,
+      "learning_rate": 5.288421052631579e-07,
+      "loss": 0.0001,
+      "step": 9375
+    },
+    {
+      "epoch": 29.56,
+      "learning_rate": 5.077894736842105e-07,
+      "loss": 0.0001,
+      "step": 9400
+    },
+    {
+      "epoch": 29.64,
+      "learning_rate": 4.867368421052631e-07,
+      "loss": 0.0001,
+      "step": 9425
+    },
+    {
+      "epoch": 29.72,
+      "learning_rate": 4.656842105263158e-07,
+      "loss": 0.0001,
+      "step": 9450
+    },
+    {
+      "epoch": 29.8,
+      "learning_rate": 4.4463157894736843e-07,
+      "loss": 0.0001,
+      "step": 9475
+    },
+    {
+      "epoch": 29.87,
+      "learning_rate": 4.2357894736842103e-07,
+      "loss": 0.0001,
+      "step": 9500
+    },
+    {
+      "epoch": 29.95,
+      "learning_rate": 4.0252631578947364e-07,
+      "loss": 0.0001,
+      "step": 9525
+    },
+    {
+      "epoch": 30.03,
+      "learning_rate": 3.814736842105263e-07,
+      "loss": 0.0001,
+      "step": 9550
+    },
+    {
+      "epoch": 30.11,
+      "learning_rate": 3.604210526315789e-07,
+      "loss": 0.0001,
+      "step": 9575
+    },
+    {
+      "epoch": 30.19,
+      "learning_rate": 3.393684210526316e-07,
+      "loss": 0.0001,
+      "step": 9600
+    },
+    {
+      "epoch": 30.27,
+      "learning_rate": 3.183157894736842e-07,
+      "loss": 0.0001,
+      "step": 9625
+    },
+    {
+      "epoch": 30.35,
+      "learning_rate": 2.972631578947368e-07,
+      "loss": 0.0001,
+      "step": 9650
+    },
+    {
+      "epoch": 30.42,
+      "learning_rate": 2.7621052631578946e-07,
+      "loss": 0.0001,
+      "step": 9675
+    },
+    {
+      "epoch": 30.5,
+      "learning_rate": 2.5515789473684206e-07,
+      "loss": 0.0001,
+      "step": 9700
+    },
+    {
+      "epoch": 30.58,
+      "learning_rate": 2.3410526315789472e-07,
+      "loss": 0.0001,
+      "step": 9725
+    },
+    {
+      "epoch": 30.66,
+      "learning_rate": 2.1305263157894734e-07,
+      "loss": 0.0001,
+      "step": 9750
+    },
+    {
+      "epoch": 30.74,
+      "learning_rate": 1.92e-07,
+      "loss": 0.0001,
+      "step": 9775
+    },
+    {
+      "epoch": 30.82,
+      "learning_rate": 1.7094736842105263e-07,
+      "loss": 0.0001,
+      "step": 9800
+    },
+    {
+      "epoch": 30.9,
+      "learning_rate": 1.4989473684210526e-07,
+      "loss": 0.0001,
+      "step": 9825
+    },
+    {
+      "epoch": 30.97,
+      "learning_rate": 1.2884210526315788e-07,
+      "loss": 0.0001,
+      "step": 9850
+    },
+    {
+      "epoch": 31.05,
+      "learning_rate": 1.0778947368421053e-07,
+      "loss": 0.0001,
+      "step": 9875
+    },
+    {
+      "epoch": 31.13,
+      "learning_rate": 8.673684210526315e-08,
+      "loss": 0.0001,
+      "step": 9900
+    },
+    {
+      "epoch": 31.21,
+      "learning_rate": 6.568421052631578e-08,
+      "loss": 0.0001,
+      "step": 9925
+    },
+    {
+      "epoch": 31.29,
+      "learning_rate": 4.463157894736842e-08,
+      "loss": 0.0001,
+      "step": 9950
+    },
+    {
+      "epoch": 31.37,
+      "learning_rate": 2.3578947368421052e-08,
+      "loss": 0.0001,
+      "step": 9975
+    },
+    {
+      "epoch": 31.45,
+      "learning_rate": 2.526315789473684e-09,
+      "loss": 0.0001,
+      "step": 10000
+    },
+    {
+      "epoch": 31.45,
+      "eval_loss": 0.5813759565353394,
+      "eval_runtime": 1234.2331,
+      "eval_samples_per_second": 1.728,
+      "eval_steps_per_second": 0.216,
+      "eval_wer": 13.708574434508153,
+      "step": 10000
+    },
+    {
+      "epoch": 31.45,
+      "step": 10000,
+      "total_flos": 3.263088216372019e+20,
+      "train_loss": 0.0230206538159051,
+      "train_runtime": 56008.0991,
+      "train_samples_per_second": 5.713,
+      "train_steps_per_second": 0.179
+    }
+  ],
+  "max_steps": 10000,
+  "num_train_epochs": 32,
+  "total_flos": 3.263088216372019e+20,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a31f574c900c75499bd9490b8ebb87b5d3e973f3c0daed72c40c0cadbb10d361
+size 3579

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

~/.cache/models--openai--whisper-medium/.no_exist/a0b3589e1034234495a1b696c28d4832cdaf8a32/generation_config.json ADDED Viewed

File without changes

~/.cache/models--openai--whisper-medium/.no_exist/a0b3589e1034234495a1b696c28d4832cdaf8a32/tokenizer.json ADDED Viewed

File without changes

~/.cache/models--openai--whisper-medium/blobs/0f3456460629e21d559c6daa23ab6ce3644e8271 ADDED Viewed

The diff for this file is too large to render. See raw diff

~/.cache/models--openai--whisper-medium/blobs/3a00c89ee5e8ae0cb159a6ec838843fb2266fac6 ADDED Viewed

The diff for this file is too large to render. See raw diff

~/.cache/models--openai--whisper-medium/blobs/47e9dd31523ecea227504afad3870da1cfe5ad81 ADDED Viewed

	@@ -0,0 +1,109 @@

+{
+  "<|af|>": 50327,
+  "<|am|>": 50334,
+  "<|ar|>": 50272,
+  "<|as|>": 50350,
+  "<|az|>": 50304,
+  "<|ba|>": 50355,
+  "<|be|>": 50330,
+  "<|bg|>": 50292,
+  "<|bn|>": 50302,
+  "<|bo|>": 50347,
+  "<|br|>": 50309,
+  "<|bs|>": 50315,
+  "<|ca|>": 50270,
+  "<|cs|>": 50283,
+  "<|cy|>": 50297,
+  "<|da|>": 50285,
+  "<|de|>": 50261,
+  "<|el|>": 50281,
+  "<|endoftext|>": 50257,
+  "<|en|>": 50259,
+  "<|es|>": 50262,
+  "<|et|>": 50307,
+  "<|eu|>": 50310,
+  "<|fa|>": 50300,
+  "<|fi|>": 50277,
+  "<|fo|>": 50338,
+  "<|fr|>": 50265,
+  "<|gl|>": 50319,
+  "<|gu|>": 50333,
+  "<|haw|>": 50352,
+  "<|ha|>": 50354,
+  "<|hi|>": 50276,
+  "<|hr|>": 50291,
+  "<|ht|>": 50339,
+  "<|hu|>": 50286,
+  "<|hy|>": 50312,
+  "<|id|>": 50275,
+  "<|is|>": 50311,
+  "<|it|>": 50274,
+  "<|iw|>": 50279,
+  "<|ja|>": 50266,
+  "<|jw|>": 50356,
+  "<|ka|>": 50329,
+  "<|kk|>": 50316,
+  "<|km|>": 50323,
+  "<|kn|>": 50306,
+  "<|ko|>": 50264,
+  "<|la|>": 50294,
+  "<|lb|>": 50345,
+  "<|ln|>": 50353,
+  "<|lo|>": 50336,
+  "<|lt|>": 50293,
+  "<|lv|>": 50301,
+  "<|mg|>": 50349,
+  "<|mi|>": 50295,
+  "<|mk|>": 50308,
+  "<|ml|>": 50296,
+  "<|mn|>": 50314,
+  "<|mr|>": 50320,
+  "<|ms|>": 50282,
+  "<|mt|>": 50343,
+  "<|my|>": 50346,
+  "<|ne|>": 50313,
+  "<|nl|>": 50271,
+  "<|nn|>": 50342,
+  "<|nocaptions|>": 50362,
+  "<|notimestamps|>": 50363,
+  "<|no|>": 50288,
+  "<|oc|>": 50328,
+  "<|pa|>": 50321,
+  "<|pl|>": 50269,
+  "<|ps|>": 50340,
+  "<|pt|>": 50267,
+  "<|ro|>": 50284,
+  "<|ru|>": 50263,
+  "<|sa|>": 50344,
+  "<|sd|>": 50332,
+  "<|si|>": 50322,
+  "<|sk|>": 50298,
+  "<|sl|>": 50305,
+  "<|sn|>": 50324,
+  "<|so|>": 50326,
+  "<|sq|>": 50317,
+  "<|sr|>": 50303,
+  "<|startoflm|>": 50360,
+  "<|startofprev|>": 50361,
+  "<|startoftranscript|>": 50258,
+  "<|su|>": 50357,
+  "<|sv|>": 50273,
+  "<|sw|>": 50318,
+  "<|ta|>": 50287,
+  "<|te|>": 50299,
+  "<|tg|>": 50331,
+  "<|th|>": 50289,
+  "<|tk|>": 50341,
+  "<|tl|>": 50348,
+  "<|transcribe|>": 50359,
+  "<|translate|>": 50358,
+  "<|tr|>": 50268,
+  "<|tt|>": 50351,
+  "<|uk|>": 50280,
+  "<|ur|>": 50290,
+  "<|uz|>": 50337,
+  "<|vi|>": 50278,
+  "<|yi|>": 50335,
+  "<|yo|>": 50325,
+  "<|zh|>": 50260
+}

~/.cache/models--openai--whisper-medium/blobs/5e6c8377adf6019428b34a1ad906fb43de71d387 ADDED Viewed

	@@ -0,0 +1,36 @@

+{
+  "add_bos_token": false,
+  "add_prefix_space": false,
+  "bos_token": {
+    "__type": "AddedToken",
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "__type": "AddedToken",
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "errors": "replace",
+  "model_max_length": 1024,
+  "name_or_path": "openai/whisper-medium",
+  "pad_token": null,
+  "processor_class": "WhisperProcessor",
+  "return_attention_mask": false,
+  "special_tokens_map_file": null,
+  "tokenizer_class": "WhisperTokenizer",
+  "unk_token": {
+    "__type": "AddedToken",
+    "content": "",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

~/.cache/models--openai--whisper-medium/blobs/9115b6806f75d5122486b0e1ae0279a0207199c2 ADDED Viewed

	@@ -0,0 +1,133 @@

+{
+  "additional_special_tokens": [
+    "<|endoftext|>",
+    "<|startoftranscript|>",
+    "<|en|>",
+    "<|zh|>",
+    "<|de|>",
+    "<|es|>",
+    "<|ru|>",
+    "<|ko|>",
+    "<|fr|>",
+    "<|ja|>",
+    "<|pt|>",
+    "<|tr|>",
+    "<|pl|>",
+    "<|ca|>",
+    "<|nl|>",
+    "<|ar|>",
+    "<|sv|>",
+    "<|it|>",
+    "<|id|>",
+    "<|hi|>",
+    "<|fi|>",
+    "<|vi|>",
+    "<|iw|>",
+    "<|uk|>",
+    "<|el|>",
+    "<|ms|>",
+    "<|cs|>",
+    "<|ro|>",
+    "<|da|>",
+    "<|hu|>",
+    "<|ta|>",
+    "<|no|>",
+    "<|th|>",
+    "<|ur|>",
+    "<|hr|>",
+    "<|bg|>",
+    "<|lt|>",
+    "<|la|>",
+    "<|mi|>",
+    "<|ml|>",
+    "<|cy|>",
+    "<|sk|>",
+    "<|te|>",
+    "<|fa|>",
+    "<|lv|>",
+    "<|bn|>",
+    "<|sr|>",
+    "<|az|>",
+    "<|sl|>",
+    "<|kn|>",
+    "<|et|>",
+    "<|mk|>",
+    "<|br|>",
+    "<|eu|>",
+    "<|is|>",
+    "<|hy|>",
+    "<|ne|>",
+    "<|mn|>",
+    "<|bs|>",
+    "<|kk|>",
+    "<|sq|>",
+    "<|sw|>",
+    "<|gl|>",
+    "<|mr|>",
+    "<|pa|>",
+    "<|si|>",
+    "<|km|>",
+    "<|sn|>",
+    "<|yo|>",
+    "<|so|>",
+    "<|af|>",
+    "<|oc|>",
+    "<|ka|>",
+    "<|be|>",
+    "<|tg|>",
+    "<|sd|>",
+    "<|gu|>",
+    "<|am|>",
+    "<|yi|>",
+    "<|lo|>",
+    "<|uz|>",
+    "<|fo|>",
+    "<|ht|>",
+    "<|ps|>",
+    "<|tk|>",
+    "<|nn|>",
+    "<|mt|>",
+    "<|sa|>",
+    "<|lb|>",
+    "<|my|>",
+    "<|bo|>",
+    "<|tl|>",
+    "<|mg|>",
+    "<|as|>",
+    "<|tt|>",
+    "<|haw|>",
+    "<|ln|>",
+    "<|ha|>",
+    "<|ba|>",
+    "<|jw|>",
+    "<|su|>",
+    "<|translate|>",
+    "<|transcribe|>",
+    "<|startoflm|>",
+    "<|startofprev|>",
+    "<|nocaptions|>",
+    "<|notimestamps|>"
+  ],
+  "bos_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<|endoftext|>",
+  "unk_token": {
+    "content": "",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

~/.cache/models--openai--whisper-medium/blobs/96d734d68ad5d63c8f41d525f5769788432f6963f32dbe36feefaa33d736a962 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:96d734d68ad5d63c8f41d525f5769788432f6963f32dbe36feefaa33d736a962
+size 3055735323

~/.cache/models--openai--whisper-medium/blobs/c2048dfa9fd94a052e62e908d2c4dfb18534b4d2 ADDED Viewed

The diff for this file is too large to render. See raw diff

~/.cache/models--openai--whisper-medium/blobs/dd6ae819ad738ac1a546e9f9282ef325c33b9ea0 ADDED Viewed

	@@ -0,0 +1,1742 @@

+{
+  "accessorise": "accessorize",
+  "accessorised": "accessorized",
+  "accessorises": "accessorizes",
+  "accessorising": "accessorizing",
+  "acclimatisation": "acclimatization",
+  "acclimatise": "acclimatize",
+  "acclimatised": "acclimatized",
+  "acclimatises": "acclimatizes",
+  "acclimatising": "acclimatizing",
+  "accoutrements": "accouterments",
+  "aeon": "eon",
+  "aeons": "eons",
+  "aerogramme": "aerogram",
+  "aerogrammes": "aerograms",
+  "aeroplane": "airplane",
+  "aeroplanes": "airplanes",
+  "aesthete": "esthete",
+  "aesthetes": "esthetes",
+  "aesthetic": "esthetic",
+  "aesthetically": "esthetically",
+  "aesthetics": "esthetics",
+  "aetiology": "etiology",
+  "ageing": "aging",
+  "aggrandisement": "aggrandizement",
+  "agonise": "agonize",
+  "agonised": "agonized",
+  "agonises": "agonizes",
+  "agonising": "agonizing",
+  "agonisingly": "agonizingly",
+  "almanack": "almanac",
+  "almanacks": "almanacs",
+  "aluminium": "aluminum",
+  "amortisable": "amortizable",
+  "amortisation": "amortization",
+  "amortisations": "amortizations",
+  "amortise": "amortize",
+  "amortised": "amortized",
+  "amortises": "amortizes",
+  "amortising": "amortizing",
+  "amphitheatre": "amphitheater",
+  "amphitheatres": "amphitheaters",
+  "anaemia": "anemia",
+  "anaemic": "anemic",
+  "anaesthesia": "anesthesia",
+  "anaesthetic": "anesthetic",
+  "anaesthetics": "anesthetics",
+  "anaesthetise": "anesthetize",
+  "anaesthetised": "anesthetized",
+  "anaesthetises": "anesthetizes",
+  "anaesthetising": "anesthetizing",
+  "anaesthetist": "anesthetist",
+  "anaesthetists": "anesthetists",
+  "anaesthetize": "anesthetize",
+  "anaesthetized": "anesthetized",
+  "anaesthetizes": "anesthetizes",
+  "anaesthetizing": "anesthetizing",
+  "analogue": "analog",
+  "analogues": "analogs",
+  "analyse": "analyze",
+  "analysed": "analyzed",
+  "analyses": "analyzes",
+  "analysing": "analyzing",
+  "anglicise": "anglicize",
+  "anglicised": "anglicized",
+  "anglicises": "anglicizes",
+  "anglicising": "anglicizing",
+  "annualised": "annualized",
+  "antagonise": "antagonize",
+  "antagonised": "antagonized",
+  "antagonises": "antagonizes",
+  "antagonising": "antagonizing",
+  "apologise": "apologize",
+  "apologised": "apologized",
+  "apologises": "apologizes",
+  "apologising": "apologizing",
+  "appal": "appall",
+  "appals": "appalls",
+  "appetiser": "appetizer",
+  "appetisers": "appetizers",
+  "appetising": "appetizing",
+  "appetisingly": "appetizingly",
+  "arbour": "arbor",
+  "arbours": "arbors",
+  "archaeologically": "archeologically",
+  "archaeologist": "archeologist",
+  "archaeologists": "archeologists",
+  "archaeology": "archeology</span>",
+  "archeological": "archaeological",
+  "ardour": "ardor",
+  "armour": "armor",
+  "armoured": "armored",
+  "armourer": "armorer",
+  "armourers": "armorers",
+  "armouries": "armories",
+  "armoury": "armory",
+  "artefact": "artifact",
+  "artefacts": "artifacts",
+  "authorise": "authorize",
+  "authorised": "authorized",
+  "authorises": "authorizes",
+  "authorising": "authorizing",
+  "axe": "ax",
+  "backpedalled": "backpedaled",
+  "backpedalling": "backpedaling",
+  "bannister": "banister",
+  "bannisters": "banisters",
+  "baptise": "baptize",
+  "baptised": "baptized",
+  "baptises": "baptizes",
+  "baptising": "baptizing",
+  "bastardise": "bastardize",
+  "bastardised": "bastardized",
+  "bastardises": "bastardizes",
+  "bastardising": "bastardizing",
+  "battleax": "battleaxe",
+  "baulk": "balk",
+  "baulked": "balked",
+  "baulking": "balking",
+  "baulks": "balks",
+  "bedevilled": "bedeviled",
+  "bedevilling": "bedeviling",
+  "behaviour": "behavior",
+  "behavioural": "behavioral",
+  "behaviourism": "behaviorism",
+  "behaviourist": "behaviorist",
+  "behaviourists": "behaviorists",
+  "behaviours": "behaviors",
+  "behove": "behoove",
+  "behoved": "behooved",
+  "behoves": "behooves",
+  "bejewelled": "bejeweled",
+  "belabour": "belabor",
+  "belaboured": "belabored",
+  "belabouring": "belaboring",
+  "belabours": "belabors",
+  "bevelled": "beveled",
+  "bevvies": "bevies",
+  "bevvy": "bevy",
+  "biassed": "biased",
+  "biassing": "biasing",
+  "bingeing": "binging",
+  "bougainvillaea": "bougainvillea",
+  "bougainvillaeas": "bougainvilleas",
+  "bowdlerise": "bowdlerize",
+  "bowdlerised": "bowdlerized",
+  "bowdlerises": "bowdlerizes",
+  "bowdlerising": "bowdlerizing",
+  "breathalyse": "breathalyze",
+  "breathalysed": "breathalyzed",
+  "breathalyser": "breathalyzer",
+  "breathalysers": "breathalyzers",
+  "breathalyses": "breathalyzes",
+  "breathalysing": "breathalyzing",
+  "brutalise": "brutalize",
+  "brutalised": "brutalized",
+  "brutalises": "brutalizes",
+  "brutalising": "brutalizing",
+  "busses": "buses",
+  "bussing": "busing",
+  "caesarean": "cesarean",
+  "caesareans": "cesareans",
+  "calibre": "caliber",
+  "calibres": "calibers",
+  "calliper": "caliper",
+  "callipers": "calipers",
+  "callisthenics": "calisthenics",
+  "canalise": "canalize",
+  "canalised": "canalized",
+  "canalises": "canalizes",
+  "canalising": "canalizing",
+  "cancelation": "cancellation",
+  "cancelations": "cancellations",
+  "cancelled": "canceled",
+  "cancelling": "canceling",
+  "candour": "candor",
+  "cannibalise": "cannibalize",
+  "cannibalised": "cannibalized",
+  "cannibalises": "cannibalizes",
+  "cannibalising": "cannibalizing",
+  "canonise": "canonize",
+  "canonised": "canonized",
+  "canonises": "canonizes",
+  "canonising": "canonizing",
+  "capitalise": "capitalize",
+  "capitalised": "capitalized",
+  "capitalises": "capitalizes",
+  "capitalising": "capitalizing",
+  "caramelise": "caramelize",
+  "caramelised": "caramelized",
+  "caramelises": "caramelizes",
+  "caramelising": "caramelizing",
+  "carbonise": "carbonize",
+  "carbonised": "carbonized",
+  "carbonises": "carbonizes",
+  "carbonising": "carbonizing",
+  "carolled": "caroled",
+  "carolling": "caroling",
+  "catalogue": "catalog",
+  "catalogued": "cataloged",
+  "catalogues": "catalogs",
+  "cataloguing": "cataloging",
+  "catalyse": "catalyze",
+  "catalysed": "catalyzed",
+  "catalyses": "catalyzes",
+  "catalysing": "catalyzing",
+  "categorise": "categorize",
+  "categorised": "categorized",
+  "categorises": "categorizes",
+  "categorising": "categorizing",
+  "cauterise": "cauterize",
+  "cauterised": "cauterized",
+  "cauterises": "cauterizes",
+  "cauterising": "cauterizing",
+  "cavilled": "caviled",
+  "cavilling": "caviling",
+  "centigramme": "centigram",
+  "centigrammes": "centigrams",
+  "centilitre": "centiliter",
+  "centilitres": "centiliters",
+  "centimetre": "centimeter",
+  "centimetres": "centimeters",
+  "centralise": "centralize",
+  "centralised": "centralized",
+  "centralises": "centralizes",
+  "centralising": "centralizing",
+  "centre": "center",
+  "centred": "centered",
+  "centrefold": "centerfold",
+  "centrefolds": "centerfolds",
+  "centrepiece": "centerpiece",
+  "centrepieces": "centerpieces",
+  "centres": "centers",
+  "channelled": "channeled",
+  "channelling": "channeling",
+  "characterise": "characterize",
+  "characterised": "characterized",
+  "characterises": "characterizes",
+  "characterising": "characterizing",
+  "cheque": "check",
+  "chequebook": "checkbook",
+  "chequebooks": "checkbooks",
+  "chequered": "checkered",
+  "cheques": "checks",
+  "chilli": "chili",
+  "chimaera": "chimera",
+  "chimaeras": "chimeras",
+  "chiselled": "chiseled",
+  "chiselling": "chiseling",
+  "circularise": "circularize",
+  "circularised": "circularized",
+  "circularises": "circularizes",
+  "circularising": "circularizing",
+  "civilise": "civilize",
+  "civilised": "civilized",
+  "civilises": "civilizes",
+  "civilising": "civilizing",
+  "clamour": "clamor",
+  "clamoured": "clamored",
+  "clamouring": "clamoring",
+  "clamours": "clamors",
+  "clangour": "clangor",
+  "clarinettist": "clarinetist",
+  "clarinettists": "clarinetists",
+  "collectivise": "collectivize",
+  "collectivised": "collectivized",
+  "collectivises": "collectivizes",
+  "collectivising": "collectivizing",
+  "colonisation": "colonization",
+  "colonise": "colonize",
+  "colonised": "colonized",
+  "coloniser": "colonizer",
+  "colonisers": "colonizers",
+  "colonises": "colonizes",
+  "colonising": "colonizing",
+  "colour": "color",
+  "colourant": "colorant",
+  "colourants": "colorants",
+  "coloured": "colored",
+  "coloureds": "coloreds",
+  "colourful": "colorful",
+  "colourfully": "colorfully",
+  "colouring": "coloring",
+  "colourize": "colorize",
+  "colourized": "colorized",
+  "colourizes": "colorizes",
+  "colourizing": "colorizing",
+  "colourless": "colorless",
+  "colours": "colors",
+  "commercialise": "commercialize",
+  "commercialised": "commercialized",
+  "commercialises": "commercializes",
+  "commercialising": "commercializing",
+  "compartmentalise": "compartmentalize",
+  "compartmentalised": "compartmentalized",
+  "compartmentalises": "compartmentalizes",
+  "compartmentalising": "compartmentalizing",
+  "computerise": "computerize",
+  "computerised": "computerized",
+  "computerises": "computerizes",
+  "computerising": "computerizing",
+  "conceptualise": "conceptualize",
+  "conceptualised": "conceptualized",
+  "conceptualises": "conceptualizes",
+  "conceptualising": "conceptualizing",
+  "connexion": "connection",
+  "connexions": "connections",
+  "contextualise": "contextualize",
+  "contextualised": "contextualized",
+  "contextualises": "contextualizes",
+  "contextualising": "contextualizing",
+  "cosier": "cozier",
+  "cosies": "cozies",
+  "cosiest": "coziest",
+  "cosily": "cozily",
+  "cosiness": "coziness",
+  "cosy": "cozy",
+  "councillor": "councilor",
+  "councillors": "councilors",
+  "counselled": "counseled",
+  "counselling": "counseling",
+  "counsellor": "counselor",
+  "counsellors": "counselors",
+  "crenelated": "crenellated",
+  "criminalise": "criminalize",
+  "criminalised": "criminalized",
+  "criminalises": "criminalizes",
+  "criminalising": "criminalizing",
+  "criticise": "criticize",
+  "criticised": "criticized",
+  "criticises": "criticizes",
+  "criticising": "criticizing",
+  "crueller": "crueler",
+  "cruellest": "cruelest",
+  "crystallisation": "crystallization",
+  "crystallise": "crystallize",
+  "crystallised": "crystallized",
+  "crystallises": "crystallizes",
+  "crystallising": "crystallizing",
+  "cudgelled": "cudgeled",
+  "cudgelling": "cudgeling",
+  "customise": "customize",
+  "customised": "customized",
+  "customises": "customizes",
+  "customising": "customizing",
+  "cypher": "cipher",
+  "cyphers": "ciphers",
+  "decentralisation": "decentralization",
+  "decentralise": "decentralize",
+  "decentralised": "decentralized",
+  "decentralises": "decentralizes",
+  "decentralising": "decentralizing",
+  "decriminalisation": "decriminalization",
+  "decriminalise": "decriminalize",
+  "decriminalised": "decriminalized",
+  "decriminalises": "decriminalizes",
+  "decriminalising": "decriminalizing",
+  "defence": "defense",
+  "defenceless": "defenseless",
+  "defences": "defenses",
+  "dehumanisation": "dehumanization",
+  "dehumanise": "dehumanize",
+  "dehumanised": "dehumanized",
+  "dehumanises": "dehumanizes",
+  "dehumanising": "dehumanizing",
+  "demeanour": "demeanor",
+  "demilitarisation": "demilitarization",
+  "demilitarise": "demilitarize",
+  "demilitarised": "demilitarized",
+  "demilitarises": "demilitarizes",
+  "demilitarising": "demilitarizing",
+  "demobilisation": "demobilization",
+  "demobilise": "demobilize",
+  "demobilised": "demobilized",
+  "demobilises": "demobilizes",
+  "demobilising": "demobilizing",
+  "democratisation": "democratization",
+  "democratise": "democratize",
+  "democratised": "democratized",
+  "democratises": "democratizes",
+  "democratising": "democratizing",
+  "demonise": "demonize",
+  "demonised": "demonized",
+  "demonises": "demonizes",
+  "demonising": "demonizing",
+  "demoralisation": "demoralization",
+  "demoralise": "demoralize",
+  "demoralised": "demoralized",
+  "demoralises": "demoralizes",
+  "demoralising": "demoralizing",
+  "denationalisation": "denationalization",
+  "denationalise": "denationalize",
+  "denationalised": "denationalized",
+  "denationalises": "denationalizes",
+  "denationalising": "denationalizing",
+  "deodorise": "deodorize",
+  "deodorised": "deodorized",
+  "deodorises": "deodorizes",
+  "deodorising": "deodorizing",
+  "depersonalise": "depersonalize",
+  "depersonalised": "depersonalized",
+  "depersonalises": "depersonalizes",
+  "depersonalising": "depersonalizing",
+  "deputise": "deputize",
+  "deputised": "deputized",
+  "deputises": "deputizes",
+  "deputising": "deputizing",
+  "desensitisation": "desensitization",
+  "desensitise": "desensitize",
+  "desensitised": "desensitized",
+  "desensitises": "desensitizes",
+  "desensitising": "desensitizing",
+  "destabilisation": "destabilization",
+  "destabilise": "destabilize",
+  "destabilised": "destabilized",
+  "destabilises": "destabilizes",
+  "destabilising": "destabilizing",
+  "dialled": "dialed",
+  "dialling": "dialing",
+  "dialogue": "dialog",
+  "dialogues": "dialogs",
+  "diarrhoea": "diarrhea",
+  "digitise": "digitize",
+  "digitised": "digitized",
+  "digitises": "digitizes",
+  "digitising": "digitizing",
+  "disc": "disk",
+  "discolour": "discolor",
+  "discoloured": "discolored",
+  "discolouring": "discoloring",
+  "discolours": "discolors",
+  "discs": "disks",
+  "disembowelled": "disemboweled",
+  "disembowelling": "disemboweling",
+  "disfavour": "disfavor",
+  "dishevelled": "disheveled",
+  "dishonour": "dishonor",
+  "dishonourable": "dishonorable",
+  "dishonourably": "dishonorably",
+  "dishonoured": "dishonored",
+  "dishonouring": "dishonoring",
+  "dishonours": "dishonors",
+  "disorganisation": "disorganization",
+  "disorganised": "disorganized",
+  "distil": "distill",
+  "distils": "distills",
+  "dramatisation": "dramatization",
+  "dramatisations": "dramatizations",
+  "dramatise": "dramatize",
+  "dramatised": "dramatized",
+  "dramatises": "dramatizes",
+  "dramatising": "dramatizing",
+  "draught": "draft",
+  "draughtboard": "draftboard",
+  "draughtboards": "draftboards",
+  "draughtier": "draftier",
+  "draughtiest": "draftiest",
+  "draughts": "drafts",
+  "draughtsman": "draftsman",
+  "draughtsmanship": "draftsmanship",
+  "draughtsmen": "draftsmen",
+  "draughtswoman": "draftswoman",
+  "draughtswomen": "draftswomen",
+  "draughty": "drafty",
+  "drivelled": "driveled",
+  "drivelling": "driveling",
+  "duelled": "dueled",
+  "duelling": "dueling",
+  "economise": "economize",
+  "economised": "economized",
+  "economises": "economizes",
+  "economising": "economizing",
+  "editorialise": "editorialize",
+  "editorialised": "editorialized",
+  "editorialises": "editorializes",
+  "editorialising": "editorializing",
+  "edoema": "edema",
+  "empathise": "empathize",
+  "empathised": "empathized",
+  "empathises": "empathizes",
+  "empathising": "empathizing",
+  "emphasise": "emphasize",
+  "emphasised": "emphasized",
+  "emphasises": "emphasizes",
+  "emphasising": "emphasizing",
+  "enamelled": "enameled",
+  "enamelling": "enameling",
+  "enamoured": "enamored",
+  "encyclopaedia": "encyclopedia",
+  "encyclopaedias": "encyclopedias",
+  "encyclopaedic": "encyclopedic",
+  "endeavour": "endeavor",
+  "endeavoured": "endeavored",
+  "endeavouring": "endeavoring",
+  "endeavours": "endeavors",
+  "energise": "energize",
+  "energised": "energized",
+  "energises": "energizes",
+  "energising": "energizing",
+  "enrol": "enroll",
+  "enrols": "enrolls",
+  "enthral": "enthrall",
+  "enthrals": "enthralls",
+  "epaulette": "epaulet",
+  "epaulettes": "epaulets",
+  "epicentre": "epicenter",
+  "epicentres": "epicenters",
+  "epilogue": "epilog",
+  "epilogues": "epilogs",
+  "epitomise": "epitomize",
+  "epitomised": "epitomized",
+  "epitomises": "epitomizes",
+  "epitomising": "epitomizing",
+  "equalisation": "equalization",
+  "equalise": "equalize",
+  "equalised": "equalized",
+  "equaliser": "equalizer",
+  "equalisers": "equalizers",
+  "equalises": "equalizes",
+  "equalising": "equalizing",
+  "eulogise": "eulogize",
+  "eulogised": "eulogized",
+  "eulogises": "eulogizes",
+  "eulogising": "eulogizing",
+  "evangelise": "evangelize",
+  "evangelised": "evangelized",
+  "evangelises": "evangelizes",
+  "evangelising": "evangelizing",
+  "exorcise": "exorcize",
+  "exorcised": "exorcized",
+  "exorcises": "exorcizes",
+  "exorcising": "exorcizing",
+  "extemporisation": "extemporization",
+  "extemporise": "extemporize",
+  "extemporised": "extemporized",
+  "extemporises": "extemporizes",
+  "extemporising": "extemporizing",
+  "externalisation": "externalization",
+  "externalisations": "externalizations",
+  "externalise": "externalize",
+  "externalised": "externalized",
+  "externalises": "externalizes",
+  "externalising": "externalizing",
+  "factorise": "factorize",
+  "factorised": "factorized",
+  "factorises": "factorizes",
+  "factorising": "factorizing",
+  "faecal": "fecal",
+  "faeces": "feces",
+  "familiarisation": "familiarization",
+  "familiarise": "familiarize",
+  "familiarised": "familiarized",
+  "familiarises": "familiarizes",
+  "familiarising": "familiarizing",
+  "fantasise": "fantasize",
+  "fantasised": "fantasized",
+  "fantasises": "fantasizes",
+  "fantasising": "fantasizing",
+  "favour": "favor",
+  "favourable": "favorable",
+  "favourably": "favorably",
+  "favoured": "favored",
+  "favouring": "favoring",
+  "favourite": "favorite",
+  "favourites": "favorites",
+  "favouritism": "favoritism",
+  "favours": "favors",
+  "feminise": "feminize",
+  "feminised": "feminized",
+  "feminises": "feminizes",
+  "feminising": "feminizing",
+  "fertilisation": "fertilization",
+  "fertilise": "fertilize",
+  "fertilised": "fertilized",
+  "fertiliser": "fertilizer",
+  "fertilisers": "fertilizers",
+  "fertilises": "fertilizes",
+  "fertilising": "fertilizing",
+  "fervour": "fervor",
+  "fibre": "fiber",
+  "fibreglass": "fiberglass",
+  "fibres": "fibers",
+  "fictionalisation": "fictionalization",
+  "fictionalisations": "fictionalizations",
+  "fictionalise": "fictionalize",
+  "fictionalised": "fictionalized",
+  "fictionalises": "fictionalizes",
+  "fictionalising": "fictionalizing",
+  "fillet": "filet",
+  "filleted": "fileted",
+  "filleting": "fileting",
+  "fillets": "filets",
+  "finalisation": "finalization",
+  "finalise": "finalize",
+  "finalised": "finalized",
+  "finalises": "finalizes",
+  "finalising": "finalizing",
+  "flautist": "flutist",
+  "flautists": "flutists",
+  "flavour": "flavor",
+  "flavoured": "flavored",
+  "flavouring": "flavoring",
+  "flavourings": "flavorings",
+  "flavourless": "flavorless",
+  "flavours": "flavors",
+  "flavoursome": "flavorsome",
+  "flyer / flier": "flier / flyer",
+  "foetal": "fetal",
+  "foetid": "fetid",
+  "foetus": "fetus",
+  "foetuses": "fetuses",
+  "formalisation": "formalization",
+  "formalise": "formalize",
+  "formalised": "formalized",
+  "formalises": "formalizes",
+  "formalising": "formalizing",
+  "fossilisation": "fossilization",
+  "fossilise": "fossilize",
+  "fossilised": "fossilized",
+  "fossilises": "fossilizes",
+  "fossilising": "fossilizing",
+  "fraternisation": "fraternization",
+  "fraternise": "fraternize",
+  "fraternised": "fraternized",
+  "fraternises": "fraternizes",
+  "fraternising": "fraternizing",
+  "fulfil": "fulfill",
+  "fulfilment": "fulfillment",
+  "fulfils": "fulfills",
+  "funnelled": "funneled",
+  "funnelling": "funneling",
+  "gage": "gauge",
+  "gaged": "gauged",
+  "gages": "gauges",
+  "gaging": "gauging",
+  "galvanise": "galvanize",
+  "galvanised": "galvanized",
+  "galvanises": "galvanizes",
+  "galvanising": "galvanizing",
+  "gambolled": "gamboled",
+  "gambolling": "gamboling",
+  "gaol": "jail",
+  "gaolbird": "jailbird",
+  "gaolbirds": "jailbirds",
+  "gaolbreak": "jailbreak",
+  "gaolbreaks": "jailbreaks",
+  "gaoled": "jailed",
+  "gaoler": "jailer",
+  "gaolers": "jailers",
+  "gaoling": "jailing",
+  "gaols": "jails",
+  "gasses": "gases",
+  "generalisation": "generalization",
+  "generalisations": "generalizations",
+  "generalise": "generalize",
+  "generalised": "generalized",
+  "generalises": "generalizes",
+  "generalising": "generalizing",
+  "ghettoise": "ghettoize",
+  "ghettoised": "ghettoized",
+  "ghettoises": "ghettoizes",
+  "ghettoising": "ghettoizing",
+  "gipsies": "gypsies",
+  "glamor": "glamour",
+  "glamorise": "glamorize",
+  "glamorised": "glamorized",
+  "glamorises": "glamorizes",
+  "glamorising": "glamorizing",
+  "globalisation": "globalization",
+  "globalise": "globalize",
+  "globalised": "globalized",
+  "globalises": "globalizes",
+  "globalising": "globalizing",
+  "glueing": "gluing",
+  "goitre": "goiter",
+  "goitres": "goiters",
+  "gonorrhoea": "gonorrhea",
+  "gramme": "gram",
+  "grammes": "grams",
+  "gravelled": "graveled",
+  "grey": "gray",
+  "greyed": "grayed",
+  "greying": "graying",
+  "greyish": "grayish",
+  "greyness": "grayness",
+  "greys": "grays",
+  "grovelled": "groveled",
+  "grovelling": "groveling",
+  "groyne": "groin",
+  "groynes": "groins",
+  "gruelling": "grueling",
+  "gruellingly": "gruelingly",
+  "gryphon": "griffin",
+  "gryphons": "griffins",
+  "gynaecological": "gynecological",
+  "gynaecologist": "gynecologist",
+  "gynaecologists": "gynecologists",
+  "gynaecology": "gynecology",
+  "haematological": "hematological",
+  "haematologist": "hematologist",
+  "haematologists": "hematologists",
+  "haematology": "hematology",
+  "haemoglobin": "hemoglobin",
+  "haemophilia": "hemophilia",
+  "haemophiliac": "hemophiliac",
+  "haemophiliacs": "hemophiliacs",
+  "haemorrhage": "hemorrhage",
+  "haemorrhaged": "hemorrhaged",
+  "haemorrhages": "hemorrhages",
+  "haemorrhaging": "hemorrhaging",
+  "haemorrhoids": "hemorrhoids",
+  "harbour": "harbor",
+  "harboured": "harbored",
+  "harbouring": "harboring",
+  "harbours": "harbors",
+  "harmonisation": "harmonization",
+  "harmonise": "harmonize",
+  "harmonised": "harmonized",
+  "harmonises": "harmonizes",
+  "harmonising": "harmonizing",
+  "homoeopath": "homeopath",
+  "homoeopathic": "homeopathic",
+  "homoeopaths": "homeopaths",
+  "homoeopathy": "homeopathy",
+  "homogenise": "homogenize",
+  "homogenised": "homogenized",
+  "homogenises": "homogenizes",
+  "homogenising": "homogenizing",
+  "honour": "honor",
+  "honourable": "honorable",
+  "honourably": "honorably",
+  "honoured": "honored",
+  "honouring": "honoring",
+  "honours": "honors",
+  "hospitalisation": "hospitalization",
+  "hospitalise": "hospitalize",
+  "hospitalised": "hospitalized",
+  "hospitalises": "hospitalizes",
+  "hospitalising": "hospitalizing",
+  "humanise": "humanize",
+  "humanised": "humanized",
+  "humanises": "humanizes",
+  "humanising": "humanizing",
+  "humour": "humor",
+  "humoured": "humored",
+  "humouring": "humoring",
+  "humourless": "humorless",
+  "humours": "humors",
+  "hybridise": "hybridize",
+  "hybridised": "hybridized",
+  "hybridises": "hybridizes",
+  "hybridising": "hybridizing",
+  "hypnotise": "hypnotize",
+  "hypnotised": "hypnotized",
+  "hypnotises": "hypnotizes",
+  "hypnotising": "hypnotizing",
+  "hypothesise": "hypothesize",
+  "hypothesised": "hypothesized",
+  "hypothesises": "hypothesizes",
+  "hypothesising": "hypothesizing",
+  "idealisation": "idealization",
+  "idealise": "idealize",
+  "idealised": "idealized",
+  "idealises": "idealizes",
+  "idealising": "idealizing",
+  "idolise": "idolize",
+  "idolised": "idolized",
+  "idolises": "idolizes",
+  "idolising": "idolizing",
+  "immobilisation": "immobilization",
+  "immobilise": "immobilize",
+  "immobilised": "immobilized",
+  "immobiliser": "immobilizer",
+  "immobilisers": "immobilizers",
+  "immobilises": "immobilizes",
+  "immobilising": "immobilizing",
+  "immortalise": "immortalize",
+  "immortalised": "immortalized",
+  "immortalises": "immortalizes",
+  "immortalising": "immortalizing",
+  "immunisation": "immunization",
+  "immunise": "immunize",
+  "immunised": "immunized",
+  "immunises": "immunizes",
+  "immunising": "immunizing",
+  "impanelled": "impaneled",
+  "impanelling": "impaneling",
+  "imperilled": "imperiled",
+  "imperilling": "imperiling",
+  "individualise": "individualize",
+  "individualised": "individualized",
+  "individualises": "individualizes",
+  "individualising": "individualizing",
+  "industrialise": "industrialize",
+  "industrialised": "industrialized",
+  "industrialises": "industrializes",
+  "industrialising": "industrializing",
+  "inflexion": "inflection",
+  "inflexions": "inflections",
+  "initialise": "initialize",
+  "initialised": "initialized",
+  "initialises": "initializes",
+  "initialising": "initializing",
+  "initialled": "initialed",
+  "initialling": "initialing",
+  "instal": "install",
+  "instalment": "installment",
+  "instalments": "installments",
+  "instals": "installs",
+  "instil": "instill",
+  "instils": "instills",
+  "institutionalisation": "institutionalization",
+  "institutionalise": "institutionalize",
+  "institutionalised": "institutionalized",
+  "institutionalises": "institutionalizes",
+  "institutionalising": "institutionalizing",
+  "intellectualise": "intellectualize",
+  "intellectualised": "intellectualized",
+  "intellectualises": "intellectualizes",
+  "intellectualising": "intellectualizing",
+  "internalisation": "internalization",
+  "internalise": "internalize",
+  "internalised": "internalized",
+  "internalises": "internalizes",
+  "internalising": "internalizing",
+  "internationalisation": "internationalization",
+  "internationalise": "internationalize",
+  "internationalised": "internationalized",
+  "internationalises": "internationalizes",
+  "internationalising": "internationalizing",
+  "ionisation": "ionization",
+  "ionise": "ionize",
+  "ionised": "ionized",
+  "ioniser": "ionizer",
+  "ionisers": "ionizers",
+  "ionises": "ionizes",
+  "ionising": "ionizing",
+  "italicise": "italicize",
+  "italicised": "italicized",
+  "italicises": "italicizes",
+  "italicising": "italicizing",
+  "itemise": "itemize",
+  "itemised": "itemized",
+  "itemises": "itemizes",
+  "itemising": "itemizing",
+  "jeopardise": "jeopardize",
+  "jeopardised": "jeopardized",
+  "jeopardises": "jeopardizes",
+  "jeopardising": "jeopardizing",
+  "jewelled": "jeweled",
+  "jeweller": "jeweler",
+  "jewellers": "jewelers",
+  "jewellery": "jewelry",
+  "judgement": "judgment",
+  "kilogramme": "kilogram",
+  "kilogrammes": "kilograms",
+  "kilometre": "kilometer",
+  "kilometres": "kilometers",
+  "labelled": "labeled",
+  "labelling": "labeling",
+  "labour": "labor",
+  "laboured": "labored",
+  "labourer": "laborer",
+  "labourers": "laborers",
+  "labouring": "laboring",
+  "labours": "labors",
+  "lacklustre": "lackluster",
+  "legalisation": "legalization",
+  "legalise": "legalize",
+  "legalised": "legalized",
+  "legalises": "legalizes",
+  "legalising": "legalizing",
+  "legitimise": "legitimize",
+  "legitimised": "legitimized",
+  "legitimises": "legitimizes",
+  "legitimising": "legitimizing",
+  "leukaemia": "leukemia",
+  "levelled": "leveled",
+  "leveller": "leveler",
+  "levellers": "levelers",
+  "levelling": "leveling",
+  "libelled": "libeled",
+  "libelling": "libeling",
+  "libellous": "libelous",
+  "liberalisation": "liberalization",
+  "liberalise": "liberalize",
+  "liberalised": "liberalized",
+  "liberalises": "liberalizes",
+  "liberalising": "liberalizing",
+  "licence": "license",
+  "licenced": "licensed",
+  "licences": "licenses",
+  "licencing": "licensing",
+  "likeable": "likable",
+  "lionisation": "lionization",
+  "lionise": "lionize",
+  "lionised": "lionized",
+  "lionises": "lionizes",
+  "lionising": "lionizing",
+  "liquidise": "liquidize",
+  "liquidised": "liquidized",
+  "liquidiser": "liquidizer",
+  "liquidisers": "liquidizers",
+  "liquidises": "liquidizes",
+  "liquidising": "liquidizing",
+  "litre": "liter",
+  "litres": "liters",
+  "localise": "localize",
+  "localised": "localized",
+  "localises": "localizes",
+  "localising": "localizing",
+  "louvre": "louver",
+  "louvred": "louvered",
+  "louvres": "louvers",
+  "lustre": "luster",
+  "magnetise": "magnetize",
+  "magnetised": "magnetized",
+  "magnetises": "magnetizes",
+  "magnetising": "magnetizing",
+  "manoeuvrability": "maneuverability",
+  "manoeuvrable": "maneuverable",
+  "manoeuvre": "maneuver",
+  "manoeuvred": "maneuvered",
+  "manoeuvres": "maneuvers",
+  "manoeuvring": "maneuvering",
+  "manoeuvrings": "maneuverings",
+  "marginalisation": "marginalization",
+  "marginalise": "marginalize",
+  "marginalised": "marginalized",
+  "marginalises": "marginalizes",
+  "marginalising": "marginalizing",
+  "marshalled": "marshaled",
+  "marshalling": "marshaling",
+  "marvelled": "marveled",
+  "marvelling": "marveling",
+  "marvellous": "marvelous",
+  "marvellously": "marvelously",
+  "materialisation": "materialization",
+  "materialise": "materialize",
+  "materialised": "materialized",
+  "materialises": "materializes",
+  "materialising": "materializing",
+  "maximisation": "maximization",
+  "maximise": "maximize",
+  "maximised": "maximized",
+  "maximises": "maximizes",
+  "maximising": "maximizing",
+  "meagre": "meager",
+  "mechanisation": "mechanization",
+  "mechanise": "mechanize",
+  "mechanised": "mechanized",
+  "mechanises": "mechanizes",
+  "mechanising": "mechanizing",
+  "mediaeval": "medieval",
+  "memorialise": "memorialize",
+  "memorialised": "memorialized",
+  "memorialises": "memorializes",
+  "memorialising": "memorializing",
+  "memorise": "memorize",
+  "memorised": "memorized",
+  "memorises": "memorizes",
+  "memorising": "memorizing",
+  "mesmerise": "mesmerize",
+  "mesmerised": "mesmerized",
+  "mesmerises": "mesmerizes",
+  "mesmerising": "mesmerizing",
+  "metabolise": "metabolize",
+  "metabolised": "metabolized",
+  "metabolises": "metabolizes",
+  "metabolising": "metabolizing",
+  "metre": "meter",
+  "metres": "meters",
+  "mhm": "hmm",
+  "micrometre": "micrometer",
+  "micrometres": "micrometers",
+  "militarise": "militarize",
+  "militarised": "militarized",
+  "militarises": "militarizes",
+  "militarising": "militarizing",
+  "milligramme": "milligram",
+  "milligrammes": "milligrams",
+  "millilitre": "milliliter",
+  "millilitres": "milliliters",
+  "millimetre": "millimeter",
+  "millimetres": "millimeters",
+  "miniaturisation": "miniaturization",
+  "miniaturise": "miniaturize",
+  "miniaturised": "miniaturized",
+  "miniaturises": "miniaturizes",
+  "miniaturising": "miniaturizing",
+  "minibusses": "minibuses",
+  "minimise": "minimize",
+  "minimised": "minimized",
+  "minimises": "minimizes",
+  "minimising": "minimizing",
+  "misbehaviour": "misbehavior",
+  "misdemeanour": "misdemeanor",
+  "misdemeanours": "misdemeanors",
+  "misspelt": "misspelled",
+  "mitre": "miter",
+  "mitres": "miters",
+  "mm": "hmm",
+  "mmm": "hmm",
+  "mobilisation": "mobilization",
+  "mobilise": "mobilize",
+  "mobilised": "mobilized",
+  "mobilises": "mobilizes",
+  "mobilising": "mobilizing",
+  "modelled": "modeled",
+  "modeller": "modeler",
+  "modellers": "modelers",
+  "modelling": "modeling",
+  "modernise": "modernize",
+  "modernised": "modernized",
+  "modernises": "modernizes",
+  "modernising": "modernizing",
+  "moisturise": "moisturize",
+  "moisturised": "moisturized",
+  "moisturiser": "moisturizer",
+  "moisturisers": "moisturizers",
+  "moisturises": "moisturizes",
+  "moisturising": "moisturizing",
+  "monologue": "monolog",
+  "monologues": "monologs",
+  "monopolisation": "monopolization",
+  "monopolise": "monopolize",
+  "monopolised": "monopolized",
+  "monopolises": "monopolizes",
+  "monopolising": "monopolizing",
+  "moralise": "moralize",
+  "moralised": "moralized",
+  "moralises": "moralizes",
+  "moralising": "moralizing",
+  "motorised": "motorized",
+  "mould": "mold",
+  "moulded": "molded",
+  "moulder": "molder",
+  "mouldered": "moldered",
+  "mouldering": "moldering",
+  "moulders": "molders",
+  "mouldier": "moldier",
+  "mouldiest": "moldiest",
+  "moulding": "molding",
+  "mouldings": "moldings",
+  "moulds": "molds",
+  "mouldy": "moldy",
+  "moult": "molt",
+  "moulted": "molted",
+  "moulting": "molting",
+  "moults": "molts",
+  "moustache": "mustache",
+  "moustached": "mustached",
+  "moustaches": "mustaches",
+  "moustachioed": "mustachioed",
+  "multicoloured": "multicolored",
+  "nationalisation": "nationalization",
+  "nationalisations": "nationalizations",
+  "nationalise": "nationalize",
+  "nationalised": "nationalized",
+  "nationalises": "nationalizes",
+  "nationalising": "nationalizing",
+  "naturalisation": "naturalization",
+  "naturalise": "naturalize",
+  "naturalised": "naturalized",
+  "naturalises": "naturalizes",
+  "naturalising": "naturalizing",
+  "neighbour": "neighbor",
+  "neighbourhood": "neighborhood",
+  "neighbourhoods": "neighborhoods",
+  "neighbouring": "neighboring",
+  "neighbourliness": "neighborliness",
+  "neighbourly": "neighborly",
+  "neighbours": "neighbors",
+  "neutralisation": "neutralization",
+  "neutralise": "neutralize",
+  "neutralised": "neutralized",
+  "neutralises": "neutralizes",
+  "neutralising": "neutralizing",
+  "normalisation": "normalization",
+  "normalise": "normalize",
+  "normalised": "normalized",
+  "normalises": "normalizes",
+  "normalising": "normalizing",
+  "odour": "odor",
+  "odourless": "odorless",
+  "odours": "odors",
+  "oesophagus": "esophagus",
+  "oesophaguses": "esophaguses",
+  "oestrogen": "estrogen",
+  "offence": "offense",
+  "offences": "offenses",
+  "omelette": "omelet",
+  "omelettes": "omelets",
+  "optimise": "optimize",
+  "optimised": "optimized",
+  "optimises": "optimizes",
+  "optimising": "optimizing",
+  "organisation": "organization",
+  "organisational": "organizational",
+  "organisations": "organizations",
+  "organise": "organize",
+  "organised": "organized",
+  "organiser": "organizer",
+  "organisers": "organizers",
+  "organises": "organizes",
+  "organising": "organizing",
+  "orthopaedic": "orthopedic",
+  "orthopaedics": "orthopedics",
+  "ostracise": "ostracize",
+  "ostracised": "ostracized",
+  "ostracises": "ostracizes",
+  "ostracising": "ostracizing",
+  "outmanoeuvre": "outmaneuver",
+  "outmanoeuvred": "outmaneuvered",
+  "outmanoeuvres": "outmaneuvers",
+  "outmanoeuvring": "outmaneuvering",
+  "overemphasise": "overemphasize",
+  "overemphasised": "overemphasized",
+  "overemphasises": "overemphasizes",
+  "overemphasising": "overemphasizing",
+  "oxidisation": "oxidization",
+  "oxidise": "oxidize",
+  "oxidised": "oxidized",
+  "oxidises": "oxidizes",
+  "oxidising": "oxidizing",
+  "paederast": "pederast",
+  "paederasts": "pederasts",
+  "paediatric": "pediatric",
+  "paediatrician": "pediatrician",
+  "paediatricians": "pediatricians",
+  "paediatrics": "pediatrics",
+  "paedophile": "pedophile",
+  "paedophiles": "pedophiles",
+  "paedophilia": "pedophilia",
+  "palaeolithic": "paleolithic",
+  "palaeontologist": "paleontologist",
+  "palaeontologists": "paleontologists",
+  "palaeontology": "paleontology",
+  "panelled": "paneled",
+  "panelling": "paneling",
+  "panellist": "panelist",
+  "panellists": "panelists",
+  "paralyse": "paralyze",
+  "paralysed": "paralyzed",
+  "paralyses": "paralyzes",
+  "paralysing": "paralyzing",
+  "parcelled": "parceled",
+  "parcelling": "parceling",
+  "parlour": "parlor",
+  "parlours": "parlors",
+  "particularise": "particularize",
+  "particularised": "particularized",
+  "particularises": "particularizes",
+  "particularising": "particularizing",
+  "passivisation": "passivization",
+  "passivise": "passivize",
+  "passivised": "passivized",
+  "passivises": "passivizes",
+  "passivising": "passivizing",
+  "pasteurisation": "pasteurization",
+  "pasteurise": "pasteurize",
+  "pasteurised": "pasteurized",
+  "pasteurises": "pasteurizes",
+  "pasteurising": "pasteurizing",
+  "patronise": "patronize",
+  "patronised": "patronized",
+  "patronises": "patronizes",
+  "patronising": "patronizing",
+  "patronisingly": "patronizingly",
+  "pedalled": "pedaled",
+  "pedalling": "pedaling",
+  "pedestrianisation": "pedestrianization",
+  "pedestrianise": "pedestrianize",
+  "pedestrianised": "pedestrianized",
+  "pedestrianises": "pedestrianizes",
+  "pedestrianising": "pedestrianizing",
+  "penalise": "penalize",
+  "penalised": "penalized",
+  "penalises": "penalizes",
+  "penalising": "penalizing",
+  "pencilled": "penciled",
+  "pencilling": "penciling",
+  "personalise": "personalize",
+  "personalised": "personalized",
+  "personalises": "personalizes",
+  "personalising": "personalizing",
+  "pharmacopoeia": "pharmacopeia",
+  "pharmacopoeias": "pharmacopeias",
+  "philosophise": "philosophize",
+  "philosophised": "philosophized",
+  "philosophises": "philosophizes",
+  "philosophising": "philosophizing",
+  "philtre": "filter",
+  "philtres": "filters",
+  "phoney": "phony",
+  "plagiarise": "plagiarize",
+  "plagiarised": "plagiarized",
+  "plagiarises": "plagiarizes",
+  "plagiarising": "plagiarizing",
+  "plough": "plow",
+  "ploughed": "plowed",
+  "ploughing": "plowing",
+  "ploughman": "plowman",
+  "ploughmen": "plowmen",
+  "ploughs": "plows",
+  "ploughshare": "plowshare",
+  "ploughshares": "plowshares",
+  "polarisation": "polarization",
+  "polarise": "polarize",
+  "polarised": "polarized",
+  "polarises": "polarizes",
+  "polarising": "polarizing",
+  "politicisation": "politicization",
+  "politicise": "politicize",
+  "politicised": "politicized",
+  "politicises": "politicizes",
+  "politicising": "politicizing",
+  "popularisation": "popularization",
+  "popularise": "popularize",
+  "popularised": "popularized",
+  "popularises": "popularizes",
+  "popularising": "popularizing",
+  "pouffe": "pouf",
+  "pouffes": "poufs",
+  "practise": "practice",
+  "practised": "practiced",
+  "practises": "practices",
+  "practising": "practicing",
+  "praesidium": "presidium",
+  "praesidiums": "presidiums",
+  "pressurisation": "pressurization",
+  "pressurise": "pressurize",
+  "pressurised": "pressurized",
+  "pressurises": "pressurizes",
+  "pressurising": "pressurizing",
+  "pretence": "pretense",
+  "pretences": "pretenses",
+  "primaeval": "primeval",
+  "prioritisation": "prioritization",
+  "prioritise": "prioritize",
+  "prioritised": "prioritized",
+  "prioritises": "prioritizes",
+  "prioritising": "prioritizing",
+  "privatisation": "privatization",
+  "privatisations": "privatizations",
+  "privatise": "privatize",
+  "privatised": "privatized",
+  "privatises": "privatizes",
+  "privatising": "privatizing",
+  "professionalisation": "professionalization",
+  "professionalise": "professionalize",
+  "professionalised": "professionalized",
+  "professionalises": "professionalizes",
+  "professionalising": "professionalizing",
+  "programme": "program",
+  "programmes": "programs",
+  "prologue": "prolog",
+  "prologues": "prologs",
+  "propagandise": "propagandize",
+  "propagandised": "propagandized",
+  "propagandises": "propagandizes",
+  "propagandising": "propagandizing",
+  "proselytise": "proselytize",
+  "proselytised": "proselytized",
+  "proselytiser": "proselytizer",
+  "proselytisers": "proselytizers",
+  "proselytises": "proselytizes",
+  "proselytising": "proselytizing",
+  "psychoanalyse": "psychoanalyze",
+  "psychoanalysed": "psychoanalyzed",
+  "psychoanalyses": "psychoanalyzes",
+  "psychoanalysing": "psychoanalyzing",
+  "publicise": "publicize",
+  "publicised": "publicized",
+  "publicises": "publicizes",
+  "publicising": "publicizing",
+  "pulverisation": "pulverization",
+  "pulverise": "pulverize",
+  "pulverised": "pulverized",
+  "pulverises": "pulverizes",
+  "pulverising": "pulverizing",
+  "pummelled": "pummel",
+  "pummelling": "pummeled",
+  "pyjama": "pajama",
+  "pyjamas": "pajamas",
+  "pzazz": "pizzazz",
+  "quarrelled": "quarreled",
+  "quarrelling": "quarreling",
+  "radicalise": "radicalize",
+  "radicalised": "radicalized",
+  "radicalises": "radicalizes",
+  "radicalising": "radicalizing",
+  "rancour": "rancor",
+  "randomise": "randomize",
+  "randomised": "randomized",
+  "randomises": "randomizes",
+  "randomising": "randomizing",
+  "rationalisation": "rationalization",
+  "rationalisations": "rationalizations",
+  "rationalise": "rationalize",
+  "rationalised": "rationalized",
+  "rationalises": "rationalizes",
+  "rationalising": "rationalizing",
+  "ravelled": "raveled",
+  "ravelling": "raveling",
+  "realisable": "realizable",
+  "realisation": "realization",
+  "realisations": "realizations",
+  "realise": "realize",
+  "realised": "realized",
+  "realises": "realizes",
+  "realising": "realizing",
+  "recognisable": "recognizable",
+  "recognisably": "recognizably",
+  "recognisance": "recognizance",
+  "recognise": "recognize",
+  "recognised": "recognized",
+  "recognises": "recognizes",
+  "recognising": "recognizing",
+  "reconnoitre": "reconnoiter",
+  "reconnoitred": "reconnoitered",
+  "reconnoitres": "reconnoiters",
+  "reconnoitring": "reconnoitering",
+  "refuelled": "refueled",
+  "refuelling": "refueling",
+  "regularisation": "regularization",
+  "regularise": "regularize",
+  "regularised": "regularized",
+  "regularises": "regularizes",
+  "regularising": "regularizing",
+  "remodelled": "remodeled",
+  "remodelling": "remodeling",
+  "remould": "remold",
+  "remoulded": "remolded",
+  "remoulding": "remolding",
+  "remoulds": "remolds",
+  "reorganisation": "reorganization",
+  "reorganisations": "reorganizations",
+  "reorganise": "reorganize",
+  "reorganised": "reorganized",
+  "reorganises": "reorganizes",
+  "reorganising": "reorganizing",
+  "revelled": "reveled",
+  "reveller": "reveler",
+  "revellers": "revelers",
+  "revelling": "reveling",
+  "revitalise": "revitalize",
+  "revitalised": "revitalized",
+  "revitalises": "revitalizes",
+  "revitalising": "revitalizing",
+  "revolutionise": "revolutionize",
+  "revolutionised": "revolutionized",
+  "revolutionises": "revolutionizes",
+  "revolutionising": "revolutionizing",
+  "rhapsodise": "rhapsodize",
+  "rhapsodised": "rhapsodized",
+  "rhapsodises": "rhapsodizes",
+  "rhapsodising": "rhapsodizing",
+  "rigour": "rigor",
+  "rigours": "rigors",
+  "ritualised": "ritualized",
+  "rivalled": "rivaled",
+  "rivalling": "rivaling",
+  "romanticise": "romanticize",
+  "romanticised": "romanticized",
+  "romanticises": "romanticizes",
+  "romanticising": "romanticizing",
+  "rumour": "rumor",
+  "rumoured": "rumored",
+  "rumours": "rumors",
+  "sabre": "saber",
+  "sabres": "sabers",
+  "saltpetre": "saltpeter",
+  "sanitise": "sanitize",
+  "sanitised": "sanitized",
+  "sanitises": "sanitizes",
+  "sanitising": "sanitizing",
+  "satirise": "satirize",
+  "satirised": "satirized",
+  "satirises": "satirizes",
+  "satirising": "satirizing",
+  "saviour": "savior",
+  "saviours": "saviors",
+  "savour": "savor",
+  "savoured": "savored",
+  "savouries": "savories",
+  "savouring": "savoring",
+  "savours": "savors",
+  "savoury": "savory",
+  "scandalise": "scandalize",
+  "scandalised": "scandalized",
+  "scandalises": "scandalizes",
+  "scandalising": "scandalizing",
+  "sceptic": "skeptic",
+  "sceptical": "skeptical",
+  "sceptically": "skeptically",
+  "scepticism": "skepticism",
+  "sceptics": "skeptics",
+  "sceptre": "scepter",
+  "sceptres": "scepters",
+  "scrutinise": "scrutinize",
+  "scrutinised": "scrutinized",
+  "scrutinises": "scrutinizes",
+  "scrutinising": "scrutinizing",
+  "secularisation": "secularization",
+  "secularise": "secularize",
+  "secularised": "secularized",
+  "secularises": "secularizes",
+  "secularising": "secularizing",
+  "sensationalise": "sensationalize",
+  "sensationalised": "sensationalized",
+  "sensationalises": "sensationalizes",
+  "sensationalising": "sensationalizing",
+  "sensitise": "sensitize",
+  "sensitised": "sensitized",
+  "sensitises": "sensitizes",
+  "sensitising": "sensitizing",
+  "sentimentalise": "sentimentalize",
+  "sentimentalised": "sentimentalized",
+  "sentimentalises": "sentimentalizes",
+  "sentimentalising": "sentimentalizing",
+  "sepulchre": "sepulcher",
+  "sepulchres": "sepulchers",
+  "serialisation": "serialization",
+  "serialisations": "serializations",
+  "serialise": "serialize",
+  "serialised": "serialized",
+  "serialises": "serializes",
+  "serialising": "serializing",
+  "sermonise": "sermonize",
+  "sermonised": "sermonized",
+  "sermonises": "sermonizes",
+  "sermonising": "sermonizing",
+  "sheikh": "sheik",
+  "shovelled": "shoveled",
+  "shovelling": "shoveling",
+  "shrivelled": "shriveled",
+  "shrivelling": "shriveling",
+  "signalise": "signalize",
+  "signalised": "signalized",
+  "signalises": "signalizes",
+  "signalising": "signalizing",
+  "signalled": "signaled",
+  "signalling": "signaling",
+  "smoulder": "smolder",
+  "smouldered": "smoldered",
+  "smouldering": "smoldering",
+  "smoulders": "smolders",
+  "snivelled": "sniveled",
+  "snivelling": "sniveling",
+  "snorkelled": "snorkeled",
+  "snorkelling": "snorkeling",
+  "snowplough": "snowplow",
+  "snowploughs": "snowplow",
+  "socialisation": "socialization",
+  "socialise": "socialize",
+  "socialised": "socialized",
+  "socialises": "socializes",
+  "socialising": "socializing",
+  "sodomise": "sodomize",
+  "sodomised": "sodomized",
+  "sodomises": "sodomizes",
+  "sodomising": "sodomizing",
+  "solemnise": "solemnize",
+  "solemnised": "solemnized",
+  "solemnises": "solemnizes",
+  "solemnising": "solemnizing",
+  "sombre": "somber",
+  "specialisation": "specialization",
+  "specialisations": "specializations",
+  "specialise": "specialize",
+  "specialised": "specialized",
+  "specialises": "specializes",
+  "specialising": "specializing",
+  "spectre": "specter",
+  "spectres": "specters",
+  "spiralled": "spiraled",
+  "spiralling": "spiraling",
+  "splendour": "splendor",
+  "splendours": "splendors",
+  "squirrelled": "squirreled",
+  "squirrelling": "squirreling",
+  "stabilisation": "stabilization",
+  "stabilise": "stabilize",
+  "stabilised": "stabilized",
+  "stabiliser": "stabilizer",
+  "stabilisers": "stabilizers",
+  "stabilises": "stabilizes",
+  "stabilising": "stabilizing",
+  "standardisation": "standardization",
+  "standardise": "standardize",
+  "standardised": "standardized",
+  "standardises": "standardizes",
+  "standardising": "standardizing",
+  "stencilled": "stenciled",
+  "stencilling": "stenciling",
+  "sterilisation": "sterilization",
+  "sterilisations": "sterilizations",
+  "sterilise": "sterilize",
+  "sterilised": "sterilized",
+  "steriliser": "sterilizer",
+  "sterilisers": "sterilizers",
+  "sterilises": "sterilizes",
+  "sterilising": "sterilizing",
+  "stigmatisation": "stigmatization",
+  "stigmatise": "stigmatize",
+  "stigmatised": "stigmatized",
+  "stigmatises": "stigmatizes",
+  "stigmatising": "stigmatizing",
+  "storey": "story",
+  "storeys": "stories",
+  "subsidisation": "subsidization",
+  "subsidise": "subsidize",
+  "subsidised": "subsidized",
+  "subsidiser": "subsidizer",
+  "subsidisers": "subsidizers",
+  "subsidises": "subsidizes",
+  "subsidising": "subsidizing",
+  "succour": "succor",
+  "succoured": "succored",
+  "succouring": "succoring",
+  "succours": "succors",
+  "sulphate": "sulfate",
+  "sulphates": "sulfates",
+  "sulphide": "sulfide",
+  "sulphides": "sulfides",
+  "sulphur": "sulfur",
+  "sulphurous": "sulfurous",
+  "summarise": "summarize",
+  "summarised": "summarized",
+  "summarises": "summarizes",
+  "summarising": "summarizing",
+  "swivelled": "swiveled",
+  "swivelling": "swiveling",
+  "symbolise": "symbolize",
+  "symbolised": "symbolized",
+  "symbolises": "symbolizes",
+  "symbolising": "symbolizing",
+  "sympathise": "sympathize",
+  "sympathised": "sympathized",
+  "sympathiser": "sympathizer",
+  "sympathisers": "sympathizers",
+  "sympathises": "sympathizes",
+  "sympathising": "sympathizing",
+  "synchronisation": "synchronization",
+  "synchronise": "synchronize",
+  "synchronised": "synchronized",
+  "synchronises": "synchronizes",
+  "synchronising": "synchronizing",
+  "synthesise": "synthesize",
+  "synthesised": "synthesized",
+  "synthesiser": "synthesizer",
+  "synthesisers": "synthesizers",
+  "synthesises": "synthesizes",
+  "synthesising": "synthesizing",
+  "syphon": "siphon",
+  "syphoned": "siphoned",
+  "syphoning": "siphoning",
+  "syphons": "siphons",
+  "systematisation": "systematization",
+  "systematise": "systematize",
+  "systematised": "systematized",
+  "systematises": "systematizes",
+  "systematising": "systematizing",
+  "tantalise": "tantalize",
+  "tantalised": "tantalized",
+  "tantalises": "tantalizes",
+  "tantalising": "tantalizing",
+  "tantalisingly": "tantalizingly",
+  "tasselled": "tasseled",
+  "technicolour": "technicolor",
+  "temporise": "temporize",
+  "temporised": "temporized",
+  "temporises": "temporizes",
+  "temporising": "temporizing",
+  "tenderise": "tenderize",
+  "tenderised": "tenderized",
+  "tenderises": "tenderizes",
+  "tenderising": "tenderizing",
+  "terrorise": "terrorize",
+  "terrorised": "terrorized",
+  "terrorises": "terrorizes",
+  "terrorising": "terrorizing",
+  "theatre": "theater",
+  "theatregoer": "theatergoer",
+  "theatregoers": "theatergoers",
+  "theatres": "theaters",
+  "theorise": "theorize",
+  "theorised": "theorized",
+  "theorises": "theorizes",
+  "theorising": "theorizing",
+  "tonne": "ton",
+  "tonnes": "tons",
+  "towelled": "toweled",
+  "towelling": "toweling",
+  "toxaemia": "toxemia",
+  "tranquillise": "tranquilize",
+  "tranquillised": "tranquilized",
+  "tranquilliser": "tranquilizer",
+  "tranquillisers": "tranquilizers",
+  "tranquillises": "tranquilizes",
+  "tranquillising": "tranquilizing",
+  "tranquillity": "tranquility",
+  "tranquillize": "tranquilize",
+  "tranquillized": "tranquilized",
+  "tranquillizer": "tranquilizer",
+  "tranquillizers": "tranquilizers",
+  "tranquillizes": "tranquilizes",
+  "tranquillizing": "tranquilizing",
+  "tranquilly": "tranquility",
+  "transistorised": "transistorized",
+  "traumatise": "traumatize",
+  "traumatised": "traumatized",
+  "traumatises": "traumatizes",
+  "traumatising": "traumatizing",
+  "travelled": "traveled",
+  "traveller": "traveler",
+  "travellers": "travelers",
+  "travelling": "traveling",
+  "travelog": "travelogue",
+  "travelogs": "travelogues",
+  "trialled": "trialed",
+  "trialling": "trialing",
+  "tricolour": "tricolor",
+  "tricolours": "tricolors",
+  "trivialise": "trivialize",
+  "trivialised": "trivialized",
+  "trivialises": "trivializes",
+  "trivialising": "trivializing",
+  "tumour": "tumor",
+  "tumours": "tumors",
+  "tunnelled": "tunneled",
+  "tunnelling": "tunneling",
+  "tyrannise": "tyrannize",
+  "tyrannised": "tyrannized",
+  "tyrannises": "tyrannizes",
+  "tyrannising": "tyrannizing",
+  "tyre": "tire",
+  "tyres": "tires",
+  "unauthorised": "unauthorized",
+  "uncivilised": "uncivilized",
+  "underutilised": "underutilized",
+  "unequalled": "unequaled",
+  "unfavourable": "unfavorable",
+  "unfavourably": "unfavorably",
+  "unionisation": "unionization",
+  "unionise": "unionize",
+  "unionised": "unionized",
+  "unionises": "unionizes",
+  "unionising": "unionizing",
+  "unorganised": "unorganized",
+  "unravelled": "unraveled",
+  "unravelling": "unraveling",
+  "unrecognisable": "unrecognizable",
+  "unrecognised": "unrecognized",
+  "unrivalled": "unrivaled",
+  "unsavoury": "unsavory",
+  "untrammelled": "untrammeled",
+  "urbanisation": "urbanization",
+  "urbanise": "urbanize",
+  "urbanised": "urbanized",
+  "urbanises": "urbanizes",
+  "urbanising": "urbanizing",
+  "utilisable": "utilizable",
+  "utilisation": "utilization",
+  "utilise": "utilize",
+  "utilised": "utilized",
+  "utilises": "utilizes",
+  "utilising": "utilizing",
+  "valour": "valor",
+  "vandalise": "vandalize",
+  "vandalised": "vandalized",
+  "vandalises": "vandalizes",
+  "vandalising": "vandalizing",
+  "vaporisation": "vaporization",
+  "vaporise": "vaporize",
+  "vaporised": "vaporized",
+  "vaporises": "vaporizes",
+  "vaporising": "vaporizing",
+  "vapour": "vapor",
+  "vapours": "vapors",
+  "verbalise": "verbalize",
+  "verbalised": "verbalized",
+  "verbalises": "verbalizes",
+  "verbalising": "verbalizing",
+  "victimisation": "victimization",
+  "victimise": "victimize",
+  "victimised": "victimized",
+  "victimises": "victimizes",
+  "victimising": "victimizing",
+  "videodisc": "videodisk",
+  "videodiscs": "videodisks",
+  "vigour": "vigor",
+  "visualisation": "visualization",
+  "visualisations": "visualizations",
+  "visualise": "visualize",
+  "visualised": "visualized",
+  "visualises": "visualizes",
+  "visualising": "visualizing",
+  "vocalisation": "vocalization",
+  "vocalisations": "vocalizations",
+  "vocalise": "vocalize",
+  "vocalised": "vocalized",
+  "vocalises": "vocalizes",
+  "vocalising": "vocalizing",
+  "vulcanised": "vulcanized",
+  "vulgarisation": "vulgarization",
+  "vulgarise": "vulgarize",
+  "vulgarised": "vulgarized",
+  "vulgarises": "vulgarizes",
+  "vulgarising": "vulgarizing",
+  "waggon": "wagon",
+  "waggons": "wagons",
+  "watercolour": "watercolor",
+  "watercolours": "watercolors",
+  "weaselled": "weaseled",
+  "weaselling": "weaseling",
+  "westernisation": "westernization",
+  "westernise": "westernize",
+  "westernised": "westernized",
+  "westernises": "westernizes",
+  "westernising": "westernizing",
+  "womanise": "womanize",
+  "womanised": "womanized",
+  "womaniser": "womanizer",
+  "womanisers": "womanizers",
+  "womanises": "womanizes",
+  "womanising": "womanizing",
+  "woollen": "woolen",
+  "woollens": "woolens",
+  "woollies": "woolies",
+  "woolly": "wooly",
+  "worshipped": "worshiped",
+  "worshipper": "worshiper",
+  "worshipping": "worshiping",
+  "yodelled": "yodeled",
+  "yodelling": "yodeling",
+  "yoghourt": "yogurt",
+  "yoghourts": "yogurts",
+  "yoghurt": "yogurt",
+  "yoghurts": "yogurts"
+}

~/.cache/models--openai--whisper-medium/blobs/f84be5dbc1bfd09035c3fd3e01b777bc47f14a66 ADDED Viewed

	@@ -0,0 +1,142 @@

+{
+  "_name_or_path": "openai/whisper-medium",
+  "activation_dropout": 0.0,
+  "activation_function": "gelu",
+  "architectures": [
+    "WhisperForConditionalGeneration"
+  ],
+  "attention_dropout": 0.0,
+  "begin_suppress_tokens": [
+    220,
+    50257
+  ],
+  "bos_token_id": 50257,
+  "d_model": 1024,
+  "decoder_attention_heads": 16,
+  "decoder_ffn_dim": 4096,
+  "decoder_layerdrop": 0.0,
+  "decoder_layers": 24,
+  "decoder_start_token_id": 50258,
+  "dropout": 0.0,
+  "encoder_attention_heads": 16,
+  "encoder_ffn_dim": 4096,
+  "encoder_layerdrop": 0.0,
+  "encoder_layers": 24,
+  "eos_token_id": 50257,
+  "forced_decoder_ids": [
+    [
+      1,
+      50259
+    ],
+    [
+      2,
+      50359
+    ],
+    [
+      3,
+      50363
+    ]
+  ],
+  "init_std": 0.02,
+  "is_encoder_decoder": true,
+  "max_length": 448,
+  "max_source_positions": 1500,
+  "max_target_positions": 448,
+  "model_type": "whisper",
+  "num_hidden_layers": 24,
+  "num_mel_bins": 80,
+  "pad_token_id": 50257,
+  "scale_embedding": false,
+  "suppress_tokens": [
+    1,
+    2,
+    7,
+    8,
+    9,
+    10,
+    14,
+    25,
+    26,
+    27,
+    28,
+    29,
+    31,
+    58,
+    59,
+    60,
+    61,
+    62,
+    63,
+    90,
+    91,
+    92,
+    93,
+    359,
+    503,
+    522,
+    542,
+    873,
+    893,
+    902,
+    918,
+    922,
+    931,
+    1350,
+    1853,
+    1982,
+    2460,
+    2627,
+    3246,
+    3253,
+    3268,
+    3536,
+    3846,
+    3961,
+    4183,
+    4667,
+    6585,
+    6647,
+    7273,
+    9061,
+    9383,
+    10428,
+    10929,
+    11938,
+    12033,
+    12331,
+    12562,
+    13793,
+    14157,
+    14635,
+    15265,
+    15618,
+    16553,
+    16604,
+    18362,
+    18956,
+    20075,
+    21675,
+    22520,
+    26130,
+    26161,
+    26435,
+    28279,
+    29464,
+    31650,
+    32302,
+    32470,
+    36865,
+    42863,
+    47425,
+    49870,
+    50254,
+    50258,
+    50360,
+    50361,
+    50362
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.24.0.dev0",
+  "use_cache": true,
+  "vocab_size": 51865
+}

~/.cache/models--openai--whisper-medium/refs/main ADDED Viewed

	@@ -0,0 +1 @@


1	+ a0b3589e1034234495a1b696c28d4832cdaf8a32

~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/added_tokens.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ../../blobs/47e9dd31523ecea227504afad3870da1cfe5ad81

~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/config.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ../../blobs/f84be5dbc1bfd09035c3fd3e01b777bc47f14a66

~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/merges.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ ../../blobs/3a00c89ee5e8ae0cb159a6ec838843fb2266fac6

~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/normalizer.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ../../blobs/dd6ae819ad738ac1a546e9f9282ef325c33b9ea0

~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ../../blobs/c2048dfa9fd94a052e62e908d2c4dfb18534b4d2

~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:30a744be592bdbc567915370b1a83438bb77847eaf0443926d1966d4b857a237
+size 76

~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ../../blobs/9115b6806f75d5122486b0e1ae0279a0207199c2

~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ../../blobs/5e6c8377adf6019428b34a1ad906fb43de71d387

~/.cache/models--openai--whisper-medium/snapshots/a0b3589e1034234495a1b696c28d4832cdaf8a32/vocab.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ../../blobs/0f3456460629e21d559c6daa23ab6ce3644e8271

~/.cache/tmp22vcmo7s ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:acdef7fc4af7d3cc2cc34ae300364b3d385544f77a90f165b420c38c846e1c41
+size 1246900224