Add CoreML export: stt-eu-conformer-ctc-large-coreml-4bit

Browse files

Files changed (10) hide show

README.md +22 -0
metadata.json +59 -0
parakeet_ctc_decoder.mlpackage/Data/com.apple.CoreML/model.mlmodel +3 -0
parakeet_ctc_decoder.mlpackage/Data/com.apple.CoreML/weights/weight.bin +3 -0
parakeet_ctc_decoder.mlpackage/Manifest.json +18 -0
parakeet_mel_encoder.mlpackage/Data/com.apple.CoreML/model.mlmodel +3 -0
parakeet_mel_encoder.mlpackage/Data/com.apple.CoreML/weights/weight.bin +3 -0
parakeet_mel_encoder.mlpackage/Manifest.json +18 -0
quantization_summary.json +12 -0
vocab.json +258 -0

README.md ADDED Viewed

	@@ -0,0 +1,22 @@

+---
+license: apache-2.0
+tags:
+- automatic-speech-recognition
+- nemo
+- coreml
+- apple-silicon
+- ovos
+---
+# stt-eu-conformer-ctc-large-coreml
+CoreML export of [HiTZ/stt_eu_conformer_ctc_large](https://huggingface.co/HiTZ/stt_eu_conformer_ctc_large) for Apple Silicon.
+Exported with [ovos-stt-plugin-coreml](https://github.com/TigreGotico/ovos-stt-plugin-coreml).
+## Usage
+```python
+from ovos_stt_plugin_coreml import CoremlSTT
+stt = CoremlSTT(config={"repo_id": "OpenVoiceOS/stt-eu-conformer-ctc-large-coreml"})
+```

metadata.json ADDED Viewed

	@@ -0,0 +1,59 @@

+{
+  "model_id": "HiTZ/stt_eu_conformer_ctc_large",
+  "model_type": "ctc",
+  "language": "",
+  "sample_rate": 16000,
+  "max_audio_seconds": 15.0,
+  "max_audio_samples": 240000,
+  "vocab_size": 256,
+  "blank_id": 256,
+  "checkpoint": {
+    "type": "pretrained",
+    "model_id": "HiTZ/stt_eu_conformer_ctc_large"
+  },
+  "coreml": {
+    "compute_precision": "FLOAT32",
+    "quantization": "4bit_palettize_kmeans"
+  },
+  "components": {
+    "mel_encoder": {
+      "path": "parakeet_mel_encoder.mlpackage",
+      "inputs": {
+        "audio_signal": [
+          1,
+          240000
+        ],
+        "audio_length": [
+          1
+        ]
+      },
+      "outputs": {
+        "encoder": [
+          1,
+          512,
+          376
+        ],
+        "encoder_length": [
+          1
+        ]
+      }
+    },
+    "ctc_decoder": {
+      "path": "parakeet_ctc_decoder.mlpackage",
+      "inputs": {
+        "encoder": [
+          1,
+          512,
+          376
+        ]
+      },
+      "outputs": {
+        "log_probs": [
+          1,
+          376,
+          257
+        ]
+      }
+    }
+  }
+}

parakeet_ctc_decoder.mlpackage/Data/com.apple.CoreML/model.mlmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1c56389a10848483a7aa6a4398d95e29ba0c00792e41a6de1ba6136a43cc6cf4
+size 2545

parakeet_ctc_decoder.mlpackage/Data/com.apple.CoreML/weights/weight.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fba4385df7d1613f0c9fcecb76d8049f99fc3c0809d0650bb75c3a88f0b5c6d6
+size 67200

parakeet_ctc_decoder.mlpackage/Manifest.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+    "fileFormatVersion": "1.0.0",
+    "itemInfoEntries": {
+        "AF61B19F-CD39-4DFC-B508-8CECA0183E24": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Specification",
+            "name": "model.mlmodel",
+            "path": "com.apple.CoreML/model.mlmodel"
+        },
+        "FB429D97-5D3C-46A0-9AC2-1598F7CE31F4": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Weights",
+            "name": "weights",
+            "path": "com.apple.CoreML/weights"
+        }
+    },
+    "rootModelIdentifier": "AF61B19F-CD39-4DFC-B508-8CECA0183E24"
+}

parakeet_mel_encoder.mlpackage/Data/com.apple.CoreML/model.mlmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:66ef9c76cb1aed10e8506cfd131880d7d7ee6ee4bfce7e17d64c3f7bc7b86f67
+size 1347209

parakeet_mel_encoder.mlpackage/Data/com.apple.CoreML/weights/weight.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:83ea10030071ff896cd4fec712c69a8a0731dc2a48a4ab76599eda41513c2cd9
+size 63054272

parakeet_mel_encoder.mlpackage/Manifest.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+    "fileFormatVersion": "1.0.0",
+    "itemInfoEntries": {
+        "9F69AE1C-6350-404A-A8DE-A43884AB903C": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Specification",
+            "name": "model.mlmodel",
+            "path": "com.apple.CoreML/model.mlmodel"
+        },
+        "D6F710BF-375C-4563-98B3-CDFB161A7D24": {
+            "author": "com.apple.CoreML",
+            "description": "CoreML Model Weights",
+            "name": "weights",
+            "path": "com.apple.CoreML/weights"
+        }
+    },
+    "rootModelIdentifier": "9F69AE1C-6350-404A-A8DE-A43884AB903C"
+}

quantization_summary.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+  "parakeet_ctc_decoder": {
+    "original_mb": 0.5,
+    "4bit_mb": 0.1,
+    "compression": 7.54
+  },
+  "parakeet_mel_encoder": {
+    "original_mb": 474.4,
+    "4bit_mb": 61.4,
+    "compression": 7.72
+  }
+}

vocab.json ADDED Viewed

	@@ -0,0 +1,258 @@

+[
+  "<unk>",
+  "a",
+  "▁",
+  "i",
+  "n",
+  "r",
+  "ko",
+  "z",
+  "o",
+  "u",
+  "e",
+  "tu",
+  "s",
+  "l",
+  "k",
+  "ra",
+  "ak",
+  "te",
+  "▁a",
+  "la",
+  "ta",
+  "t",
+  "en",
+  "an",
+  "ri",
+  "▁da",
+  "▁eta",
+  "▁e",
+  "go",
+  "ka",
+  "re",
+  "da",
+  "▁ez",
+  "in",
+  "▁ba",
+  "▁i",
+  "tzen",
+  "gi",
+  "le",
+  "p",
+  "▁du",
+  "ki",
+  "di",
+  "du",
+  "▁ga",
+  "▁bat",
+  "ma",
+  "h",
+  "de",
+  "ek",
+  "gu",
+  "ro",
+  "tza",
+  "ur",
+  "▁o",
+  "to",
+  "▁ar",
+  "▁bi",
+  "▁es",
+  "aren",
+  "ba",
+  "ts",
+  "▁zen",
+  "▁izan",
+  "st",
+  "g",
+  "tik",
+  "ga",
+  "ren",
+  "era",
+  "▁di",
+  "ke",
+  "ti",
+  "▁ere",
+  "b",
+  "be",
+  "ten",
+  "▁f",
+  "▁er",
+  "▁ha",
+  "rra",
+  "iz",
+  "x",
+  "m",
+  "▁p",
+  "▁ho",
+  "f",
+  "ean",
+  "men",
+  "zu",
+  "etan",
+  "▁dira",
+  "▁u",
+  "▁be",
+  "▁z",
+  "lde",
+  "rri",
+  "▁ma",
+  "lo",
+  "zio",
+  "me",
+  "rik",
+  "▁egin",
+  "▁hori",
+  "▁sa",
+  "tzeko",
+  "▁zuen",
+  "▁de",
+  "lu",
+  "ru",
+  "tzi",
+  "▁har",
+  "▁ka",
+  "▁ber",
+  "pe",
+  "▁ditu",
+  "▁ze",
+  "▁al",
+  "si",
+  "pa",
+  "▁hau",
+  "▁jo",
+  "▁kon",
+  "do",
+  "▁bere",
+  "tan",
+  "▁zi",
+  "▁behar",
+  "ez",
+  "▁horre",
+  "▁dago",
+  "▁so",
+  "▁mi",
+  "bo",
+  "▁he",
+  "bide",
+  "▁dute",
+  "bi",
+  "▁ger",
+  "▁lan",
+  "▁se",
+  "tze",
+  "tzea",
+  "mo",
+  "▁na",
+  "ntz",
+  "▁pa",
+  "▁or",
+  "▁in",
+  "▁herri",
+  "▁oso",
+  "▁ni",
+  "▁mu",
+  "▁no",
+  "▁beste",
+  "▁den",
+  "▁po",
+  "▁urte",
+  "hi",
+  "bil",
+  "▁zu",
+  "keta",
+  "d",
+  "▁mo",
+  "▁zer",
+  "▁erre",
+  "▁baina",
+  "▁bo",
+  "▁nahi",
+  "▁ikas",
+  "aldi",
+  "etako",
+  "▁handi",
+  "▁ge",
+  "▁pro",
+  "tasun",
+  "ber",
+  "c",
+  "▁lo",
+  "▁ondo",
+  "▁dugu",
+  "garri",
+  "▁jar",
+  "itz",
+  "▁egun",
+  "▁ne",
+  "▁guzti",
+  "▁lehen",
+  "pen",
+  "▁ikus",
+  "▁egiten",
+  "▁esku",
+  "txe",
+  "▁gai",
+  "ekin",
+  "▁edo",
+  "▁tx",
+  "▁bizi",
+  "▁berri",
+  "▁ziren",
+  "▁zuten",
+  "▁zituen",
+  "▁li",
+  "▁aurre",
+  "tzaile",
+  "▁euskal",
+  "▁buru",
+  "arekin",
+  "▁hiru",
+  "▁erabil",
+  "▁lau",
+  "▁eman",
+  "▁gor",
+  "▁baino",
+  "▁su",
+  "▁hasi",
+  "txa",
+  "▁izen",
+  "▁euskara",
+  "▁hil",
+  "▁bu",
+  "▁dituzte",
+  "▁nagusi",
+  "ehun",
+  "▁mundu",
+  "▁talde",
+  "▁azken",
+  "▁hainbat",
+  "▁gutxi",
+  "▁orain",
+  "▁daude",
+  "garren",
+  "▁hitz",
+  "▁elkar",
+  "txo",
+  "▁batzuk",
+  "▁uste",
+  "▁hiri",
+  "entzia",
+  "▁gehien",
+  "v",
+  "▁gehiago",
+  "▁lagun",
+  "▁txiki",
+  "y",
+  "w",
+  "▁inguru",
+  "▁emakume",
+  "▁nuen",
+  "▁liburu",
+  "▁jende",
+  "▁hizkuntza",
+  "▁ahal",
+  "q",
+  "ñ",
+  "j"
+]