alpaycli commited on
Commit
ca2d842
·
verified ·
1 Parent(s): 6197c36

Upload 18 files

Browse files
.gitattributes CHANGED
@@ -35,3 +35,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
  az-speechto-text-HF/WhisperDecoder.mlmodelc/model.espresso.weights filter=lfs diff=lfs merge=lfs -text
37
  az-speechto-text-HF/WhisperEncoder.mlmodelc/model.espresso.weights filter=lfs diff=lfs merge=lfs -text
 
 
 
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
  az-speechto-text-HF/WhisperDecoder.mlmodelc/model.espresso.weights filter=lfs diff=lfs merge=lfs -text
37
  az-speechto-text-HF/WhisperEncoder.mlmodelc/model.espresso.weights filter=lfs diff=lfs merge=lfs -text
38
+ WhisperDecoder.mlmodelc/model.espresso.weights filter=lfs diff=lfs merge=lfs -text
39
+ WhisperEncoder.mlmodelc/model.espresso.weights filter=lfs diff=lfs merge=lfs -text
WhisperDecoder.mlmodelc/analytics/coremldata.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:8862dad097476bb776346165cbd092589fab34861e48f8112b129361be44507d
3
+ size 482
WhisperDecoder.mlmodelc/coremldata.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:db1e1510350e3532f9c8033cd379e2e04a41fa0f634c922625faf1060ce79b71
3
+ size 310
WhisperDecoder.mlmodelc/metadata.json ADDED
@@ -0,0 +1,93 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "metadataOutputVersion" : "3.0",
4
+ "storagePrecision" : "Float32",
5
+ "outputSchema" : [
6
+ {
7
+ "hasShapeFlexibility" : "0",
8
+ "isOptional" : "0",
9
+ "dataType" : "Float32",
10
+ "formattedType" : "MultiArray (Float32)",
11
+ "shortDescription" : "",
12
+ "shape" : "[]",
13
+ "name" : "logits",
14
+ "type" : "MultiArray"
15
+ }
16
+ ],
17
+ "modelParameters" : [
18
+
19
+ ],
20
+ "specificationVersion" : 5,
21
+ "computePrecision" : "Float16",
22
+ "isUpdatable" : "0",
23
+ "stateSchema" : [
24
+
25
+ ],
26
+ "availability" : {
27
+ "macOS" : "11.0",
28
+ "tvOS" : "14.0",
29
+ "visionOS" : "1.0",
30
+ "watchOS" : "7.0",
31
+ "iOS" : "14.0",
32
+ "macCatalyst" : "14.0"
33
+ },
34
+ "modelType" : {
35
+ "name" : "MLModelType_neuralNetwork"
36
+ },
37
+ "userDefinedMetadata" : {
38
+ "com.github.apple.coremltools.version" : "6.3.0",
39
+ "com.github.apple.coremltools.source" : "torch==2.6.0"
40
+ },
41
+ "inputSchema" : [
42
+ {
43
+ "hasShapeFlexibility" : "0",
44
+ "isOptional" : "0",
45
+ "dataType" : "Float32",
46
+ "formattedType" : "MultiArray (Float32 1 × 128)",
47
+ "shortDescription" : "",
48
+ "shape" : "[1, 128]",
49
+ "name" : "decoder_input_ids",
50
+ "type" : "MultiArray"
51
+ },
52
+ {
53
+ "hasShapeFlexibility" : "0",
54
+ "isOptional" : "0",
55
+ "dataType" : "Float32",
56
+ "formattedType" : "MultiArray (Float32 1 × 1500 × 768)",
57
+ "shortDescription" : "",
58
+ "shape" : "[1, 1500, 768]",
59
+ "name" : "encoder_hidden_states",
60
+ "type" : "MultiArray"
61
+ }
62
+ ],
63
+ "generatedClassName" : "WhisperDecoder",
64
+ "neuralNetworkLayerTypeHistogram" : {
65
+ "Multiply" : 24,
66
+ "RankPreservingReshape" : 1,
67
+ "Transpose" : 108,
68
+ "InnerProduct" : 121,
69
+ "ConcatND" : 37,
70
+ "Gather" : 38,
71
+ "AddBroadcastable" : 36,
72
+ "SliceDynamic" : 12,
73
+ "GreaterThan" : 1,
74
+ "Tile" : 1,
75
+ "GetShape" : 37,
76
+ "Add" : 14,
77
+ "ReshapeDynamic" : 48,
78
+ "BatchedMatmul" : 48,
79
+ "LoadConstantND" : 95,
80
+ "ExpandDims" : 2,
81
+ "Scale" : 37,
82
+ "MatrixBandPart" : 1,
83
+ "ReshapeStatic" : 123,
84
+ "Mvn" : 37,
85
+ "SoftmaxND" : 24,
86
+ "DivideBroadcastable" : 1,
87
+ "MultiplyBroadcastable" : 1,
88
+ "ActivationLinear" : 2,
89
+ "Gelu" : 12
90
+ },
91
+ "method" : "predict"
92
+ }
93
+ ]
WhisperDecoder.mlmodelc/model.espresso.net ADDED
The diff for this file is too large to render. See raw diff
 
WhisperDecoder.mlmodelc/model.espresso.shape ADDED
The diff for this file is too large to render. See raw diff
 
WhisperDecoder.mlmodelc/model.espresso.weights ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:8ea75bbea4da5c00af24411311d61e4842ded014e3cd469313e61b5ae06c08e2
3
+ size 775096832
WhisperDecoder.mlmodelc/model/coremldata.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:f5a5fd42d16a20302798ef6ed309979b43003d2320d9f0e8ea9831a92759fb4b
3
+ size 64
WhisperDecoder.mlmodelc/neural_network_optionals/coremldata.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:7ea4be15c238ac4c2e874f33bd81c341776c1f1cc472ac9171e1074b39b46ab1
3
+ size 40
WhisperEncoder.mlmodelc/analytics/coremldata.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:244350c083b017874b49581b27fa55c8c7f0e4c358e7f180f9102cf8db016422
3
+ size 482
WhisperEncoder.mlmodelc/coremldata.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:fa71a7dacc43df25cefec94e78cfb13fdd28ca823b58963ee3485d346119f0c8
3
+ size 290
WhisperEncoder.mlmodelc/metadata.json ADDED
@@ -0,0 +1,72 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "metadataOutputVersion" : "3.0",
4
+ "storagePrecision" : "Float32",
5
+ "outputSchema" : [
6
+ {
7
+ "hasShapeFlexibility" : "0",
8
+ "isOptional" : "0",
9
+ "dataType" : "Float32",
10
+ "formattedType" : "MultiArray (Float32)",
11
+ "shortDescription" : "",
12
+ "shape" : "[]",
13
+ "name" : "last_hidden_state",
14
+ "type" : "MultiArray"
15
+ }
16
+ ],
17
+ "modelParameters" : [
18
+
19
+ ],
20
+ "specificationVersion" : 4,
21
+ "computePrecision" : "Float16",
22
+ "isUpdatable" : "0",
23
+ "stateSchema" : [
24
+
25
+ ],
26
+ "availability" : {
27
+ "macOS" : "10.15",
28
+ "tvOS" : "13.0",
29
+ "visionOS" : "1.0",
30
+ "watchOS" : "6.0",
31
+ "iOS" : "13.0",
32
+ "macCatalyst" : "13.0"
33
+ },
34
+ "modelType" : {
35
+ "name" : "MLModelType_neuralNetwork"
36
+ },
37
+ "userDefinedMetadata" : {
38
+ "com.github.apple.coremltools.version" : "6.3.0",
39
+ "com.github.apple.coremltools.source" : "torch==2.6.0"
40
+ },
41
+ "inputSchema" : [
42
+ {
43
+ "hasShapeFlexibility" : "0",
44
+ "isOptional" : "0",
45
+ "dataType" : "Float32",
46
+ "formattedType" : "MultiArray (Float32 1 × 80 × 3000)",
47
+ "shortDescription" : "",
48
+ "shape" : "[1, 80, 3000]",
49
+ "name" : "input_features",
50
+ "type" : "MultiArray"
51
+ }
52
+ ],
53
+ "generatedClassName" : "WhisperEncoder",
54
+ "neuralNetworkLayerTypeHistogram" : {
55
+ "BatchedMatmul" : 24,
56
+ "InnerProduct" : 72,
57
+ "Convolution" : 2,
58
+ "Gelu" : 14,
59
+ "Scale" : 25,
60
+ "ReshapeStatic" : 98,
61
+ "Transpose" : 49,
62
+ "LoadConstantND" : 1,
63
+ "Squeeze" : 2,
64
+ "Multiply" : 12,
65
+ "Add" : 25,
66
+ "ExpandDims" : 2,
67
+ "SoftmaxND" : 12,
68
+ "Mvn" : 25
69
+ },
70
+ "method" : "predict"
71
+ }
72
+ ]
WhisperEncoder.mlmodelc/model.espresso.net ADDED
The diff for this file is too large to render. See raw diff
 
WhisperEncoder.mlmodelc/model.espresso.shape ADDED
@@ -0,0 +1,3027 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "layer_shapes" : {
3
+ "663" : {
4
+ "k" : 1500,
5
+ "w" : 64,
6
+ "n" : 1,
7
+ "_rank" : 4,
8
+ "h" : 12
9
+ },
10
+ "input.83_scale_constant_in_scale" : {
11
+ "k" : 1,
12
+ "w" : 768,
13
+ "n" : 1,
14
+ "h" : 1
15
+ },
16
+ "hidden_states.49_mvn" : {
17
+ "k" : 1500,
18
+ "w" : 768,
19
+ "n" : 1,
20
+ "_rank" : 4,
21
+ "h" : 1
22
+ },
23
+ "hidden_states.49_scale_mul_out" : {
24
+ "k" : 1500,
25
+ "w" : 768,
26
+ "n" : 1,
27
+ "_rank" : 4,
28
+ "h" : 1
29
+ },
30
+ "221" : {
31
+ "k" : 1500,
32
+ "w" : 64,
33
+ "n" : 1,
34
+ "_rank" : 4,
35
+ "h" : 12
36
+ },
37
+ "hidden_states.49_reshape" : {
38
+ "k" : 1500,
39
+ "w" : 768,
40
+ "n" : 1,
41
+ "_rank" : 4,
42
+ "h" : 1
43
+ },
44
+ "input.131" : {
45
+ "k" : 1,
46
+ "w" : 3072,
47
+ "n" : 1,
48
+ "_rank" : 3,
49
+ "h" : 1500
50
+ },
51
+ "input.83_scale_mul_out" : {
52
+ "k" : 1500,
53
+ "w" : 768,
54
+ "n" : 1,
55
+ "_rank" : 4,
56
+ "h" : 1
57
+ },
58
+ "tensor.67" : {
59
+ "k" : 1,
60
+ "w" : 768,
61
+ "n" : 1,
62
+ "_rank" : 3,
63
+ "h" : 1500
64
+ },
65
+ "hidden_states.25" : {
66
+ "k" : 1,
67
+ "w" : 768,
68
+ "n" : 1,
69
+ "_rank" : 3,
70
+ "h" : 1500
71
+ },
72
+ "transpose_61" : {
73
+ "k" : 12,
74
+ "w" : 1500,
75
+ "n" : 1,
76
+ "_rank" : 4,
77
+ "h" : 64
78
+ },
79
+ "hidden_states.43_mvn" : {
80
+ "k" : 1500,
81
+ "w" : 768,
82
+ "n" : 1,
83
+ "_rank" : 4,
84
+ "h" : 1
85
+ },
86
+ "input.97" : {
87
+ "k" : 12,
88
+ "w" : 1500,
89
+ "n" : 1,
90
+ "_rank" : 4,
91
+ "h" : 1500
92
+ },
93
+ "input.75" : {
94
+ "k" : 12,
95
+ "w" : 1500,
96
+ "n" : 1,
97
+ "_rank" : 4,
98
+ "h" : 1500
99
+ },
100
+ "input.239" : {
101
+ "k" : 1,
102
+ "w" : 3072,
103
+ "n" : 1,
104
+ "_rank" : 3,
105
+ "h" : 1500
106
+ },
107
+ "input.53" : {
108
+ "k" : 12,
109
+ "w" : 1500,
110
+ "n" : 1,
111
+ "_rank" : 4,
112
+ "h" : 1500
113
+ },
114
+ "input.31" : {
115
+ "k" : 12,
116
+ "w" : 1500,
117
+ "n" : 1,
118
+ "_rank" : 4,
119
+ "h" : 1500
120
+ },
121
+ "tensor.21" : {
122
+ "k" : 1,
123
+ "w" : 768,
124
+ "n" : 1,
125
+ "_rank" : 3,
126
+ "h" : 1500
127
+ },
128
+ "input.17_scale_constant_in_scale" : {
129
+ "k" : 1,
130
+ "w" : 768,
131
+ "n" : 1,
132
+ "h" : 1
133
+ },
134
+ "hidden_states.7_reshape" : {
135
+ "k" : 1500,
136
+ "w" : 768,
137
+ "n" : 1,
138
+ "_rank" : 4,
139
+ "h" : 1
140
+ },
141
+ "input.105" : {
142
+ "k" : 1,
143
+ "w" : 768,
144
+ "n" : 1,
145
+ "_rank" : 3,
146
+ "h" : 1500
147
+ },
148
+ "837_scale_mul_out" : {
149
+ "k" : 1500,
150
+ "w" : 768,
151
+ "n" : 1,
152
+ "_rank" : 4,
153
+ "h" : 1
154
+ },
155
+ "669" : {
156
+ "k" : 1500,
157
+ "w" : 64,
158
+ "n" : 1,
159
+ "_rank" : 4,
160
+ "h" : 12
161
+ },
162
+ "input.3" : {
163
+ "k" : 1,
164
+ "w" : 768,
165
+ "n" : 1,
166
+ "_rank" : 3,
167
+ "h" : 1500
168
+ },
169
+ "83" : {
170
+ "k" : 1,
171
+ "w" : 768,
172
+ "n" : 1,
173
+ "_rank" : 3,
174
+ "h" : 1500
175
+ },
176
+ "input.175" : {
177
+ "k" : 1,
178
+ "w" : 3072,
179
+ "n" : 1,
180
+ "_rank" : 3,
181
+ "h" : 1500
182
+ },
183
+ "transpose_78" : {
184
+ "k" : 12,
185
+ "w" : 64,
186
+ "n" : 1,
187
+ "_rank" : 4,
188
+ "h" : 1500
189
+ },
190
+ "input.263" : {
191
+ "k" : 1,
192
+ "w" : 3072,
193
+ "n" : 1,
194
+ "_rank" : 3,
195
+ "h" : 1500
196
+ },
197
+ "transpose_95" : {
198
+ "k" : 12,
199
+ "w" : 64,
200
+ "n" : 1,
201
+ "_rank" : 4,
202
+ "h" : 1500
203
+ },
204
+ "339" : {
205
+ "k" : 1,
206
+ "w" : 768,
207
+ "n" : 1,
208
+ "_rank" : 3,
209
+ "h" : 1500
210
+ },
211
+ "228" : {
212
+ "k" : 1500,
213
+ "w" : 64,
214
+ "n" : 1,
215
+ "_rank" : 4,
216
+ "h" : 12
217
+ },
218
+ "tensor" : {
219
+ "k" : 1,
220
+ "w" : 768,
221
+ "n" : 1,
222
+ "_rank" : 3,
223
+ "h" : 1500
224
+ },
225
+ "hidden_states.61_scale" : {
226
+ "k" : 1500,
227
+ "w" : 768,
228
+ "n" : 1,
229
+ "_rank" : 4,
230
+ "h" : 1
231
+ },
232
+ "transpose_101" : {
233
+ "k" : 12,
234
+ "w" : 1500,
235
+ "n" : 1,
236
+ "_rank" : 4,
237
+ "h" : 64
238
+ },
239
+ "87" : {
240
+ "k" : 1500,
241
+ "w" : 64,
242
+ "n" : 1,
243
+ "_rank" : 4,
244
+ "h" : 12
245
+ },
246
+ "attn_output.17" : {
247
+ "k" : 12,
248
+ "w" : 64,
249
+ "n" : 1,
250
+ "_rank" : 4,
251
+ "h" : 1500
252
+ },
253
+ "tensor.65" : {
254
+ "k" : 1,
255
+ "w" : 768,
256
+ "n" : 1,
257
+ "_rank" : 3,
258
+ "h" : 1500
259
+ },
260
+ "input_features" : {
261
+ "k" : 1,
262
+ "w" : 3000,
263
+ "n" : 1,
264
+ "_rank" : 3,
265
+ "h" : 80
266
+ },
267
+ "input.149" : {
268
+ "k" : 1,
269
+ "w" : 768,
270
+ "n" : 1,
271
+ "_rank" : 3,
272
+ "h" : 1500
273
+ },
274
+ "input.93" : {
275
+ "k" : 1,
276
+ "w" : 768,
277
+ "n" : 1,
278
+ "_rank" : 3,
279
+ "h" : 1500
280
+ },
281
+ "input.71" : {
282
+ "k" : 1,
283
+ "w" : 768,
284
+ "n" : 1,
285
+ "_rank" : 3,
286
+ "h" : 1500
287
+ },
288
+ "hidden_states.49" : {
289
+ "k" : 1,
290
+ "w" : 768,
291
+ "n" : 1,
292
+ "_rank" : 3,
293
+ "h" : 1500
294
+ },
295
+ "input.237" : {
296
+ "k" : 1,
297
+ "w" : 768,
298
+ "n" : 1,
299
+ "_rank" : 3,
300
+ "h" : 1500
301
+ },
302
+ "input.103" : {
303
+ "k" : 1,
304
+ "w" : 768,
305
+ "n" : 1,
306
+ "_rank" : 3,
307
+ "h" : 1500
308
+ },
309
+ "hidden_states.49_scale" : {
310
+ "k" : 1500,
311
+ "w" : 768,
312
+ "n" : 1,
313
+ "_rank" : 4,
314
+ "h" : 1
315
+ },
316
+ "hidden_states.31_reshape" : {
317
+ "k" : 1500,
318
+ "w" : 768,
319
+ "n" : 1,
320
+ "_rank" : 4,
321
+ "h" : 1
322
+ },
323
+ "transpose_65" : {
324
+ "k" : 12,
325
+ "w" : 1500,
326
+ "n" : 1,
327
+ "_rank" : 4,
328
+ "h" : 64
329
+ },
330
+ "tensor.39" : {
331
+ "k" : 1,
332
+ "w" : 768,
333
+ "n" : 1,
334
+ "_rank" : 3,
335
+ "h" : 1500
336
+ },
337
+ "transpose_82" : {
338
+ "k" : 12,
339
+ "w" : 64,
340
+ "n" : 1,
341
+ "_rank" : 4,
342
+ "h" : 1500
343
+ },
344
+ "attn_output.5" : {
345
+ "k" : 12,
346
+ "w" : 64,
347
+ "n" : 1,
348
+ "_rank" : 4,
349
+ "h" : 1500
350
+ },
351
+ "hidden_states.13_scale_constant_in_bias" : {
352
+ "k" : 1,
353
+ "w" : 768,
354
+ "n" : 1,
355
+ "h" : 1
356
+ },
357
+ "input.173" : {
358
+ "k" : 1,
359
+ "w" : 3072,
360
+ "n" : 1,
361
+ "_rank" : 3,
362
+ "h" : 1500
363
+ },
364
+ "hidden_states.67_scale_mul_out" : {
365
+ "k" : 1500,
366
+ "w" : 768,
367
+ "n" : 1,
368
+ "_rank" : 4,
369
+ "h" : 1
370
+ },
371
+ "input.261" : {
372
+ "k" : 1,
373
+ "w" : 3072,
374
+ "n" : 1,
375
+ "_rank" : 3,
376
+ "h" : 1500
377
+ },
378
+ "837_scale_constant_in_bias" : {
379
+ "k" : 1,
380
+ "w" : 768,
381
+ "n" : 1,
382
+ "h" : 1
383
+ },
384
+ "tensor.63" : {
385
+ "k" : 1,
386
+ "w" : 768,
387
+ "n" : 1,
388
+ "_rank" : 3,
389
+ "h" : 1500
390
+ },
391
+ "input.147" : {
392
+ "k" : 1,
393
+ "w" : 768,
394
+ "n" : 1,
395
+ "_rank" : 3,
396
+ "h" : 1500
397
+ },
398
+ "attn_output.29" : {
399
+ "k" : 12,
400
+ "w" : 64,
401
+ "n" : 1,
402
+ "_rank" : 4,
403
+ "h" : 1500
404
+ },
405
+ "transpose_99" : {
406
+ "k" : 12,
407
+ "w" : 64,
408
+ "n" : 1,
409
+ "_rank" : 4,
410
+ "h" : 1500
411
+ },
412
+ "encoder.embed_positions.weight" : {
413
+ "k" : 1,
414
+ "w" : 768,
415
+ "n" : 1,
416
+ "_rank" : 2,
417
+ "h" : 1500
418
+ },
419
+ "input.235" : {
420
+ "k" : 1,
421
+ "w" : 768,
422
+ "n" : 1,
423
+ "_rank" : 3,
424
+ "h" : 1500
425
+ },
426
+ "343" : {
427
+ "k" : 1500,
428
+ "w" : 64,
429
+ "n" : 1,
430
+ "_rank" : 4,
431
+ "h" : 12
432
+ },
433
+ "676" : {
434
+ "k" : 1500,
435
+ "w" : 64,
436
+ "n" : 1,
437
+ "_rank" : 4,
438
+ "h" : 12
439
+ },
440
+ "transpose_103" : {
441
+ "k" : 12,
442
+ "w" : 64,
443
+ "n" : 1,
444
+ "_rank" : 4,
445
+ "h" : 1500
446
+ },
447
+ "input.193_scale_constant_in_scale" : {
448
+ "k" : 1,
449
+ "w" : 768,
450
+ "n" : 1,
451
+ "h" : 1
452
+ },
453
+ "input.101" : {
454
+ "k" : 1,
455
+ "w" : 768,
456
+ "n" : 1,
457
+ "_rank" : 3,
458
+ "h" : 1500
459
+ },
460
+ "hidden_states.19_reshape" : {
461
+ "k" : 1500,
462
+ "w" : 768,
463
+ "n" : 1,
464
+ "_rank" : 4,
465
+ "h" : 1
466
+ },
467
+ "hidden_states.1_scale_mul_out" : {
468
+ "k" : 1500,
469
+ "w" : 768,
470
+ "n" : 1,
471
+ "_rank" : 4,
472
+ "h" : 1
473
+ },
474
+ "787" : {
475
+ "k" : 1,
476
+ "w" : 768,
477
+ "n" : 1,
478
+ "_rank" : 3,
479
+ "h" : 1500
480
+ },
481
+ "tensor.37" : {
482
+ "k" : 1,
483
+ "w" : 768,
484
+ "n" : 1,
485
+ "_rank" : 3,
486
+ "h" : 1500
487
+ },
488
+ "input.29" : {
489
+ "k" : 12,
490
+ "w" : 1500,
491
+ "n" : 1,
492
+ "_rank" : 4,
493
+ "h" : 1500
494
+ },
495
+ "input.209" : {
496
+ "k" : 1,
497
+ "w" : 768,
498
+ "n" : 1,
499
+ "_rank" : 3,
500
+ "h" : 1500
501
+ },
502
+ "input" : {
503
+ "k" : 1,
504
+ "w" : 768,
505
+ "n" : 1,
506
+ "_rank" : 3,
507
+ "h" : 1500
508
+ },
509
+ "input.149_scale_constant_in_scale" : {
510
+ "k" : 1,
511
+ "w" : 768,
512
+ "n" : 1,
513
+ "h" : 1
514
+ },
515
+ "input.39_mvn" : {
516
+ "k" : 1500,
517
+ "w" : 768,
518
+ "n" : 1,
519
+ "_rank" : 4,
520
+ "h" : 1
521
+ },
522
+ "input.171" : {
523
+ "k" : 1,
524
+ "w" : 768,
525
+ "n" : 1,
526
+ "_rank" : 3,
527
+ "h" : 1500
528
+ },
529
+ "input.215_scale_constant_in_bias" : {
530
+ "k" : 1,
531
+ "w" : 768,
532
+ "n" : 1,
533
+ "h" : 1
534
+ },
535
+ "transpose_69" : {
536
+ "k" : 12,
537
+ "w" : 1500,
538
+ "n" : 1,
539
+ "_rank" : 4,
540
+ "h" : 64
541
+ },
542
+ "input.237_scale_constant_in_scale" : {
543
+ "k" : 1,
544
+ "w" : 768,
545
+ "n" : 1,
546
+ "h" : 1
547
+ },
548
+ "transpose_86" : {
549
+ "k" : 12,
550
+ "w" : 64,
551
+ "n" : 1,
552
+ "_rank" : 4,
553
+ "h" : 1500
554
+ },
555
+ "input.39_scale" : {
556
+ "k" : 1500,
557
+ "w" : 768,
558
+ "n" : 1,
559
+ "_rank" : 4,
560
+ "h" : 1
561
+ },
562
+ "input.17_scale" : {
563
+ "k" : 1500,
564
+ "w" : 768,
565
+ "n" : 1,
566
+ "_rank" : 4,
567
+ "h" : 1
568
+ },
569
+ "hidden_states.67_scale" : {
570
+ "k" : 1500,
571
+ "w" : 768,
572
+ "n" : 1,
573
+ "_rank" : 4,
574
+ "h" : 1
575
+ },
576
+ "hidden_states.37_scale_constant_in_scale" : {
577
+ "k" : 1,
578
+ "w" : 768,
579
+ "n" : 1,
580
+ "h" : 1
581
+ },
582
+ "tensor.61" : {
583
+ "k" : 1,
584
+ "w" : 768,
585
+ "n" : 1,
586
+ "_rank" : 3,
587
+ "h" : 1500
588
+ },
589
+ "input.145" : {
590
+ "k" : 1,
591
+ "w" : 768,
592
+ "n" : 1,
593
+ "_rank" : 3,
594
+ "h" : 1500
595
+ },
596
+ "input.149_reshape" : {
597
+ "k" : 1500,
598
+ "w" : 768,
599
+ "n" : 1,
600
+ "_rank" : 4,
601
+ "h" : 1
602
+ },
603
+ "349" : {
604
+ "k" : 1500,
605
+ "w" : 64,
606
+ "n" : 1,
607
+ "_rank" : 4,
608
+ "h" : 12
609
+ },
610
+ "input.233" : {
611
+ "k" : 1,
612
+ "w" : 768,
613
+ "n" : 1,
614
+ "_rank" : 3,
615
+ "h" : 1500
616
+ },
617
+ "hidden_states.55_mvn" : {
618
+ "k" : 1500,
619
+ "w" : 768,
620
+ "n" : 1,
621
+ "_rank" : 4,
622
+ "h" : 1
623
+ },
624
+ "hidden_states.25_scale_mul_out" : {
625
+ "k" : 1500,
626
+ "w" : 768,
627
+ "n" : 1,
628
+ "_rank" : 4,
629
+ "h" : 1
630
+ },
631
+ "tensor.7" : {
632
+ "k" : 1,
633
+ "w" : 768,
634
+ "n" : 1,
635
+ "_rank" : 3,
636
+ "h" : 1500
637
+ },
638
+ "tensor.35" : {
639
+ "k" : 1,
640
+ "w" : 768,
641
+ "n" : 1,
642
+ "_rank" : 3,
643
+ "h" : 1500
644
+ },
645
+ "input.69" : {
646
+ "k" : 1,
647
+ "w" : 768,
648
+ "n" : 1,
649
+ "_rank" : 3,
650
+ "h" : 1500
651
+ },
652
+ "input.119" : {
653
+ "k" : 12,
654
+ "w" : 1500,
655
+ "n" : 1,
656
+ "_rank" : 4,
657
+ "h" : 1500
658
+ },
659
+ "input.47" : {
660
+ "k" : 1,
661
+ "w" : 768,
662
+ "n" : 1,
663
+ "_rank" : 3,
664
+ "h" : 1500
665
+ },
666
+ "transpose_73" : {
667
+ "k" : 12,
668
+ "w" : 1500,
669
+ "n" : 1,
670
+ "_rank" : 4,
671
+ "h" : 64
672
+ },
673
+ "input.25" : {
674
+ "k" : 1,
675
+ "w" : 768,
676
+ "n" : 1,
677
+ "_rank" : 3,
678
+ "h" : 1500
679
+ },
680
+ "input.207" : {
681
+ "k" : 12,
682
+ "w" : 1500,
683
+ "n" : 1,
684
+ "_rank" : 4,
685
+ "h" : 1500
686
+ },
687
+ "transpose_105" : {
688
+ "k" : 12,
689
+ "w" : 1500,
690
+ "n" : 1,
691
+ "_rank" : 4,
692
+ "h" : 64
693
+ },
694
+ "transpose_90" : {
695
+ "k" : 12,
696
+ "w" : 64,
697
+ "n" : 1,
698
+ "_rank" : 4,
699
+ "h" : 1500
700
+ },
701
+ "791" : {
702
+ "k" : 1500,
703
+ "w" : 64,
704
+ "n" : 1,
705
+ "_rank" : 4,
706
+ "h" : 12
707
+ },
708
+ "input.127_mvn" : {
709
+ "k" : 1500,
710
+ "w" : 768,
711
+ "n" : 1,
712
+ "_rank" : 4,
713
+ "h" : 1
714
+ },
715
+ "hidden_states.49_scale_constant_in_scale" : {
716
+ "k" : 1,
717
+ "w" : 768,
718
+ "n" : 1,
719
+ "h" : 1
720
+ },
721
+ "input.189" : {
722
+ "k" : 1,
723
+ "w" : 768,
724
+ "n" : 1,
725
+ "_rank" : 3,
726
+ "h" : 1500
727
+ },
728
+ "93" : {
729
+ "k" : 1500,
730
+ "w" : 64,
731
+ "n" : 1,
732
+ "_rank" : 4,
733
+ "h" : 12
734
+ },
735
+ "hidden_states.19" : {
736
+ "k" : 1,
737
+ "w" : 768,
738
+ "n" : 1,
739
+ "_rank" : 3,
740
+ "h" : 1500
741
+ },
742
+ "605" : {
743
+ "k" : 1500,
744
+ "w" : 64,
745
+ "n" : 1,
746
+ "_rank" : 4,
747
+ "h" : 12
748
+ },
749
+ "hidden_states.13_scale_constant_in_scale" : {
750
+ "k" : 1,
751
+ "w" : 768,
752
+ "n" : 1,
753
+ "h" : 1
754
+ },
755
+ "input.143" : {
756
+ "k" : 1,
757
+ "w" : 768,
758
+ "n" : 1,
759
+ "_rank" : 3,
760
+ "h" : 1500
761
+ },
762
+ "hidden_states.31_scale_constant_in_bias" : {
763
+ "k" : 1,
764
+ "w" : 768,
765
+ "n" : 1,
766
+ "h" : 1
767
+ },
768
+ "transpose_60" : {
769
+ "k" : 1500,
770
+ "w" : 64,
771
+ "n" : 1,
772
+ "_rank" : 4,
773
+ "h" : 12
774
+ },
775
+ "input.231" : {
776
+ "k" : 1,
777
+ "w" : 768,
778
+ "n" : 1,
779
+ "_rank" : 3,
780
+ "h" : 1500
781
+ },
782
+ "hidden_states.43_reshape" : {
783
+ "k" : 1500,
784
+ "w" : 768,
785
+ "n" : 1,
786
+ "_rank" : 4,
787
+ "h" : 1
788
+ },
789
+ "attn_output.9" : {
790
+ "k" : 12,
791
+ "w" : 64,
792
+ "n" : 1,
793
+ "_rank" : 4,
794
+ "h" : 1500
795
+ },
796
+ "tensor.3" : {
797
+ "k" : 1,
798
+ "w" : 768,
799
+ "n" : 1,
800
+ "_rank" : 3,
801
+ "h" : 1500
802
+ },
803
+ "input.87" : {
804
+ "k" : 1,
805
+ "w" : 3072,
806
+ "n" : 1,
807
+ "_rank" : 3,
808
+ "h" : 1500
809
+ },
810
+ "tensor.33" : {
811
+ "k" : 1,
812
+ "w" : 768,
813
+ "n" : 1,
814
+ "_rank" : 3,
815
+ "h" : 1500
816
+ },
817
+ "input.65" : {
818
+ "k" : 1,
819
+ "w" : 3072,
820
+ "n" : 1,
821
+ "_rank" : 3,
822
+ "h" : 1500
823
+ },
824
+ "input.43" : {
825
+ "k" : 1,
826
+ "w" : 3072,
827
+ "n" : 1,
828
+ "_rank" : 3,
829
+ "h" : 1500
830
+ },
831
+ "input.117" : {
832
+ "k" : 12,
833
+ "w" : 1500,
834
+ "n" : 1,
835
+ "_rank" : 4,
836
+ "h" : 1500
837
+ },
838
+ "input.21" : {
839
+ "k" : 1,
840
+ "w" : 3072,
841
+ "n" : 1,
842
+ "_rank" : 3,
843
+ "h" : 1500
844
+ },
845
+ "797" : {
846
+ "k" : 1500,
847
+ "w" : 64,
848
+ "n" : 1,
849
+ "_rank" : 4,
850
+ "h" : 12
851
+ },
852
+ "input.205" : {
853
+ "k" : 12,
854
+ "w" : 1500,
855
+ "n" : 1,
856
+ "_rank" : 4,
857
+ "h" : 1500
858
+ },
859
+ "input.61_mvn" : {
860
+ "k" : 1500,
861
+ "w" : 768,
862
+ "n" : 1,
863
+ "_rank" : 4,
864
+ "h" : 1
865
+ },
866
+ "hidden_states.67_scale_constant_in_bias" : {
867
+ "k" : 1,
868
+ "w" : 768,
869
+ "n" : 1,
870
+ "h" : 1
871
+ },
872
+ "input.187" : {
873
+ "k" : 1,
874
+ "w" : 768,
875
+ "n" : 1,
876
+ "_rank" : 3,
877
+ "h" : 1500
878
+ },
879
+ "transpose_77" : {
880
+ "k" : 12,
881
+ "w" : 1500,
882
+ "n" : 1,
883
+ "_rank" : 4,
884
+ "h" : 64
885
+ },
886
+ "hidden_states.25_scale_constant_in_scale" : {
887
+ "k" : 1,
888
+ "w" : 768,
889
+ "n" : 1,
890
+ "h" : 1
891
+ },
892
+ "transpose_107" : {
893
+ "k" : 12,
894
+ "w" : 64,
895
+ "n" : 1,
896
+ "_rank" : 4,
897
+ "h" : 1500
898
+ },
899
+ "hidden_states.49_scale_constant_in_bias" : {
900
+ "k" : 1,
901
+ "w" : 768,
902
+ "n" : 1,
903
+ "h" : 1
904
+ },
905
+ "transpose_94" : {
906
+ "k" : 12,
907
+ "w" : 64,
908
+ "n" : 1,
909
+ "_rank" : 4,
910
+ "h" : 1500
911
+ },
912
+ "467" : {
913
+ "k" : 1,
914
+ "w" : 768,
915
+ "n" : 1,
916
+ "_rank" : 3,
917
+ "h" : 1500
918
+ },
919
+ "356" : {
920
+ "k" : 1500,
921
+ "w" : 64,
922
+ "n" : 1,
923
+ "_rank" : 4,
924
+ "h" : 12
925
+ },
926
+ "input.141" : {
927
+ "k" : 12,
928
+ "w" : 1500,
929
+ "n" : 1,
930
+ "_rank" : 4,
931
+ "h" : 1500
932
+ },
933
+ "input.193_reshape" : {
934
+ "k" : 1500,
935
+ "w" : 768,
936
+ "n" : 1,
937
+ "_rank" : 4,
938
+ "h" : 1
939
+ },
940
+ "hidden_states.43_scale_mul_out" : {
941
+ "k" : 1500,
942
+ "w" : 768,
943
+ "n" : 1,
944
+ "_rank" : 4,
945
+ "h" : 1
946
+ },
947
+ "input.83" : {
948
+ "k" : 1,
949
+ "w" : 768,
950
+ "n" : 1,
951
+ "_rank" : 3,
952
+ "h" : 1500
953
+ },
954
+ "input.249" : {
955
+ "k" : 12,
956
+ "w" : 1500,
957
+ "n" : 1,
958
+ "_rank" : 4,
959
+ "h" : 1500
960
+ },
961
+ "input.61" : {
962
+ "k" : 1,
963
+ "w" : 768,
964
+ "n" : 1,
965
+ "_rank" : 3,
966
+ "h" : 1500
967
+ },
968
+ "tensor.31" : {
969
+ "k" : 1,
970
+ "w" : 768,
971
+ "n" : 1,
972
+ "_rank" : 3,
973
+ "h" : 1500
974
+ },
975
+ "input.115" : {
976
+ "k" : 1,
977
+ "w" : 768,
978
+ "n" : 1,
979
+ "_rank" : 3,
980
+ "h" : 1500
981
+ },
982
+ "transpose_64" : {
983
+ "k" : 1500,
984
+ "w" : 64,
985
+ "n" : 1,
986
+ "_rank" : 4,
987
+ "h" : 12
988
+ },
989
+ "hidden_states.1_mvn" : {
990
+ "k" : 1500,
991
+ "w" : 768,
992
+ "n" : 1,
993
+ "_rank" : 4,
994
+ "h" : 1
995
+ },
996
+ "input.203" : {
997
+ "k" : 1,
998
+ "w" : 768,
999
+ "n" : 1,
1000
+ "_rank" : 3,
1001
+ "h" : 1500
1002
+ },
1003
+ "transpose_81" : {
1004
+ "k" : 12,
1005
+ "w" : 1500,
1006
+ "n" : 1,
1007
+ "_rank" : 4,
1008
+ "h" : 64
1009
+ },
1010
+ "hidden_states.43" : {
1011
+ "k" : 1,
1012
+ "w" : 768,
1013
+ "n" : 1,
1014
+ "_rank" : 3,
1015
+ "h" : 1500
1016
+ },
1017
+ "723" : {
1018
+ "k" : 1,
1019
+ "w" : 768,
1020
+ "n" : 1,
1021
+ "_rank" : 3,
1022
+ "h" : 1500
1023
+ },
1024
+ "612" : {
1025
+ "k" : 1500,
1026
+ "w" : 64,
1027
+ "n" : 1,
1028
+ "_rank" : 4,
1029
+ "h" : 12
1030
+ },
1031
+ "input.185" : {
1032
+ "k" : 12,
1033
+ "w" : 1500,
1034
+ "n" : 1,
1035
+ "_rank" : 4,
1036
+ "h" : 1500
1037
+ },
1038
+ "input.193_scale_mul_out" : {
1039
+ "k" : 1500,
1040
+ "w" : 768,
1041
+ "n" : 1,
1042
+ "_rank" : 4,
1043
+ "h" : 1
1044
+ },
1045
+ "hidden_states.13_scale" : {
1046
+ "k" : 1500,
1047
+ "w" : 768,
1048
+ "n" : 1,
1049
+ "_rank" : 4,
1050
+ "h" : 1
1051
+ },
1052
+ "input.159" : {
1053
+ "k" : 1,
1054
+ "w" : 768,
1055
+ "n" : 1,
1056
+ "_rank" : 3,
1057
+ "h" : 1500
1058
+ },
1059
+ "input.127_reshape" : {
1060
+ "k" : 1500,
1061
+ "w" : 768,
1062
+ "n" : 1,
1063
+ "_rank" : 4,
1064
+ "h" : 1
1065
+ },
1066
+ "transpose_98" : {
1067
+ "k" : 12,
1068
+ "w" : 64,
1069
+ "n" : 1,
1070
+ "_rank" : 4,
1071
+ "h" : 1500
1072
+ },
1073
+ "hidden_states.67_mvn" : {
1074
+ "k" : 1500,
1075
+ "w" : 768,
1076
+ "n" : 1,
1077
+ "_rank" : 4,
1078
+ "h" : 1
1079
+ },
1080
+ "input.247" : {
1081
+ "k" : 1,
1082
+ "w" : 768,
1083
+ "n" : 1,
1084
+ "_rank" : 3,
1085
+ "h" : 1500
1086
+ },
1087
+ "471" : {
1088
+ "k" : 1500,
1089
+ "w" : 64,
1090
+ "n" : 1,
1091
+ "_rank" : 4,
1092
+ "h" : 12
1093
+ },
1094
+ "attn_output.41" : {
1095
+ "k" : 12,
1096
+ "w" : 64,
1097
+ "n" : 1,
1098
+ "_rank" : 4,
1099
+ "h" : 1500
1100
+ },
1101
+ "727" : {
1102
+ "k" : 1500,
1103
+ "w" : 64,
1104
+ "n" : 1,
1105
+ "_rank" : 4,
1106
+ "h" : 12
1107
+ },
1108
+ "input.113" : {
1109
+ "k" : 1,
1110
+ "w" : 768,
1111
+ "n" : 1,
1112
+ "_rank" : 3,
1113
+ "h" : 1500
1114
+ },
1115
+ "input.215_mvn" : {
1116
+ "k" : 1500,
1117
+ "w" : 768,
1118
+ "n" : 1,
1119
+ "_rank" : 4,
1120
+ "h" : 1
1121
+ },
1122
+ "tensor.49" : {
1123
+ "k" : 1,
1124
+ "w" : 768,
1125
+ "n" : 1,
1126
+ "_rank" : 3,
1127
+ "h" : 1500
1128
+ },
1129
+ "input.201" : {
1130
+ "k" : 1,
1131
+ "w" : 768,
1132
+ "n" : 1,
1133
+ "_rank" : 3,
1134
+ "h" : 1500
1135
+ },
1136
+ "hidden_states.61_mvn" : {
1137
+ "k" : 1500,
1138
+ "w" : 768,
1139
+ "n" : 1,
1140
+ "_rank" : 4,
1141
+ "h" : 1
1142
+ },
1143
+ "input.19" : {
1144
+ "k" : 1,
1145
+ "w" : 3072,
1146
+ "n" : 1,
1147
+ "_rank" : 3,
1148
+ "h" : 1500
1149
+ },
1150
+ "hidden_states.67" : {
1151
+ "k" : 1,
1152
+ "w" : 768,
1153
+ "n" : 1,
1154
+ "_rank" : 3,
1155
+ "h" : 1500
1156
+ },
1157
+ "input.83_scale" : {
1158
+ "k" : 1500,
1159
+ "w" : 768,
1160
+ "n" : 1,
1161
+ "_rank" : 4,
1162
+ "h" : 1
1163
+ },
1164
+ "input.61_scale" : {
1165
+ "k" : 1500,
1166
+ "w" : 768,
1167
+ "n" : 1,
1168
+ "_rank" : 4,
1169
+ "h" : 1
1170
+ },
1171
+ "input.183" : {
1172
+ "k" : 12,
1173
+ "w" : 1500,
1174
+ "n" : 1,
1175
+ "_rank" : 4,
1176
+ "h" : 1500
1177
+ },
1178
+ "hidden_states.61_scale_constant_in_scale" : {
1179
+ "k" : 1,
1180
+ "w" : 768,
1181
+ "n" : 1,
1182
+ "h" : 1
1183
+ },
1184
+ "transpose_68" : {
1185
+ "k" : 1500,
1186
+ "w" : 64,
1187
+ "n" : 1,
1188
+ "_rank" : 4,
1189
+ "h" : 12
1190
+ },
1191
+ "transpose_85" : {
1192
+ "k" : 12,
1193
+ "w" : 1500,
1194
+ "n" : 1,
1195
+ "_rank" : 4,
1196
+ "h" : 64
1197
+ },
1198
+ "hidden_states.55_reshape" : {
1199
+ "k" : 1500,
1200
+ "w" : 768,
1201
+ "n" : 1,
1202
+ "_rank" : 4,
1203
+ "h" : 1
1204
+ },
1205
+ "input.157" : {
1206
+ "k" : 1,
1207
+ "w" : 768,
1208
+ "n" : 1,
1209
+ "_rank" : 3,
1210
+ "h" : 1500
1211
+ },
1212
+ "477" : {
1213
+ "k" : 1500,
1214
+ "w" : 64,
1215
+ "n" : 1,
1216
+ "_rank" : 4,
1217
+ "h" : 12
1218
+ },
1219
+ "input.245" : {
1220
+ "k" : 1,
1221
+ "w" : 768,
1222
+ "n" : 1,
1223
+ "_rank" : 3,
1224
+ "h" : 1500
1225
+ },
1226
+ "tensor.47" : {
1227
+ "k" : 1,
1228
+ "w" : 768,
1229
+ "n" : 1,
1230
+ "_rank" : 3,
1231
+ "h" : 1500
1232
+ },
1233
+ "transpose_72" : {
1234
+ "k" : 1500,
1235
+ "w" : 64,
1236
+ "n" : 1,
1237
+ "_rank" : 4,
1238
+ "h" : 12
1239
+ },
1240
+ "input.59" : {
1241
+ "k" : 1,
1242
+ "w" : 768,
1243
+ "n" : 1,
1244
+ "_rank" : 3,
1245
+ "h" : 1500
1246
+ },
1247
+ "147" : {
1248
+ "k" : 1,
1249
+ "w" : 768,
1250
+ "n" : 1,
1251
+ "_rank" : 3,
1252
+ "h" : 1500
1253
+ },
1254
+ "input.37" : {
1255
+ "k" : 1,
1256
+ "w" : 768,
1257
+ "n" : 1,
1258
+ "_rank" : 3,
1259
+ "h" : 1500
1260
+ },
1261
+ "input.219" : {
1262
+ "k" : 1,
1263
+ "w" : 3072,
1264
+ "n" : 1,
1265
+ "_rank" : 3,
1266
+ "h" : 1500
1267
+ },
1268
+ "input.15" : {
1269
+ "k" : 1,
1270
+ "w" : 768,
1271
+ "n" : 1,
1272
+ "_rank" : 3,
1273
+ "h" : 1500
1274
+ },
1275
+ "hidden_states.31_scale" : {
1276
+ "k" : 1500,
1277
+ "w" : 768,
1278
+ "n" : 1,
1279
+ "_rank" : 4,
1280
+ "h" : 1
1281
+ },
1282
+ "hidden_states.19_mvn" : {
1283
+ "k" : 1500,
1284
+ "w" : 768,
1285
+ "n" : 1,
1286
+ "_rank" : 4,
1287
+ "h" : 1
1288
+ },
1289
+ "input.181" : {
1290
+ "k" : 1,
1291
+ "w" : 768,
1292
+ "n" : 1,
1293
+ "_rank" : 3,
1294
+ "h" : 1500
1295
+ },
1296
+ "input.39_scale_constant_in_scale" : {
1297
+ "k" : 1,
1298
+ "w" : 768,
1299
+ "n" : 1,
1300
+ "h" : 1
1301
+ },
1302
+ "input.215_scale" : {
1303
+ "k" : 1500,
1304
+ "w" : 768,
1305
+ "n" : 1,
1306
+ "_rank" : 4,
1307
+ "h" : 1
1308
+ },
1309
+ "733" : {
1310
+ "k" : 1500,
1311
+ "w" : 64,
1312
+ "n" : 1,
1313
+ "_rank" : 4,
1314
+ "h" : 12
1315
+ },
1316
+ "input.171_scale_constant_in_scale" : {
1317
+ "k" : 1,
1318
+ "w" : 768,
1319
+ "n" : 1,
1320
+ "h" : 1
1321
+ },
1322
+ "hidden_states.19_scale" : {
1323
+ "k" : 1500,
1324
+ "w" : 768,
1325
+ "n" : 1,
1326
+ "_rank" : 4,
1327
+ "h" : 1
1328
+ },
1329
+ "hidden_states.13_mvn" : {
1330
+ "k" : 1500,
1331
+ "w" : 768,
1332
+ "n" : 1,
1333
+ "_rank" : 4,
1334
+ "h" : 1
1335
+ },
1336
+ "input.149_mvn" : {
1337
+ "k" : 1500,
1338
+ "w" : 768,
1339
+ "n" : 1,
1340
+ "_rank" : 4,
1341
+ "h" : 1
1342
+ },
1343
+ "transpose_89" : {
1344
+ "k" : 12,
1345
+ "w" : 1500,
1346
+ "n" : 1,
1347
+ "_rank" : 4,
1348
+ "h" : 64
1349
+ },
1350
+ "input.237_scale" : {
1351
+ "k" : 1500,
1352
+ "w" : 768,
1353
+ "n" : 1,
1354
+ "_rank" : 4,
1355
+ "h" : 1
1356
+ },
1357
+ "input.171_reshape" : {
1358
+ "k" : 1500,
1359
+ "w" : 768,
1360
+ "n" : 1,
1361
+ "_rank" : 4,
1362
+ "h" : 1
1363
+ },
1364
+ "hidden_states.13" : {
1365
+ "k" : 1,
1366
+ "w" : 768,
1367
+ "n" : 1,
1368
+ "_rank" : 3,
1369
+ "h" : 1500
1370
+ },
1371
+ "input.105_scale" : {
1372
+ "k" : 1500,
1373
+ "w" : 768,
1374
+ "n" : 1,
1375
+ "_rank" : 4,
1376
+ "h" : 1
1377
+ },
1378
+ "input.171_scale_mul_out" : {
1379
+ "k" : 1500,
1380
+ "w" : 768,
1381
+ "n" : 1,
1382
+ "_rank" : 4,
1383
+ "h" : 1
1384
+ },
1385
+ "input.127_scale_constant_in_scale" : {
1386
+ "k" : 1,
1387
+ "w" : 768,
1388
+ "n" : 1,
1389
+ "h" : 1
1390
+ },
1391
+ "hidden_states.19_scale_mul_out" : {
1392
+ "k" : 1500,
1393
+ "w" : 768,
1394
+ "n" : 1,
1395
+ "_rank" : 4,
1396
+ "h" : 1
1397
+ },
1398
+ "403" : {
1399
+ "k" : 1,
1400
+ "w" : 768,
1401
+ "n" : 1,
1402
+ "_rank" : 3,
1403
+ "h" : 1500
1404
+ },
1405
+ "tensor.45" : {
1406
+ "k" : 1,
1407
+ "w" : 768,
1408
+ "n" : 1,
1409
+ "_rank" : 3,
1410
+ "h" : 1500
1411
+ },
1412
+ "input.99" : {
1413
+ "k" : 1,
1414
+ "w" : 768,
1415
+ "n" : 1,
1416
+ "_rank" : 3,
1417
+ "h" : 1500
1418
+ },
1419
+ "input.149_scale_constant_in_bias" : {
1420
+ "k" : 1,
1421
+ "w" : 768,
1422
+ "n" : 1,
1423
+ "h" : 1
1424
+ },
1425
+ "input.193_scale_constant_in_bias" : {
1426
+ "k" : 1,
1427
+ "w" : 768,
1428
+ "n" : 1,
1429
+ "h" : 1
1430
+ },
1431
+ "52" : {
1432
+ "k" : 1,
1433
+ "w" : 3000,
1434
+ "n" : 1,
1435
+ "_rank" : 3,
1436
+ "h" : 768
1437
+ },
1438
+ "input.129" : {
1439
+ "k" : 1,
1440
+ "w" : 3072,
1441
+ "n" : 1,
1442
+ "_rank" : 3,
1443
+ "h" : 1500
1444
+ },
1445
+ "input.55" : {
1446
+ "k" : 1,
1447
+ "w" : 768,
1448
+ "n" : 1,
1449
+ "_rank" : 3,
1450
+ "h" : 1500
1451
+ },
1452
+ "input.33" : {
1453
+ "k" : 1,
1454
+ "w" : 768,
1455
+ "n" : 1,
1456
+ "_rank" : 3,
1457
+ "h" : 1500
1458
+ },
1459
+ "input.39_scale_constant_in_bias" : {
1460
+ "k" : 1,
1461
+ "w" : 768,
1462
+ "n" : 1,
1463
+ "h" : 1
1464
+ },
1465
+ "input.77" : {
1466
+ "k" : 1,
1467
+ "w" : 768,
1468
+ "n" : 1,
1469
+ "_rank" : 3,
1470
+ "h" : 1500
1471
+ },
1472
+ "input.217" : {
1473
+ "k" : 1,
1474
+ "w" : 3072,
1475
+ "n" : 1,
1476
+ "_rank" : 3,
1477
+ "h" : 1500
1478
+ },
1479
+ "hidden_states.25_scale_constant_in_bias" : {
1480
+ "k" : 1,
1481
+ "w" : 768,
1482
+ "n" : 1,
1483
+ "h" : 1
1484
+ },
1485
+ "input.127_scale" : {
1486
+ "k" : 1500,
1487
+ "w" : 768,
1488
+ "n" : 1,
1489
+ "_rank" : 4,
1490
+ "h" : 1
1491
+ },
1492
+ "input.215_scale_constant_in_scale" : {
1493
+ "k" : 1,
1494
+ "w" : 768,
1495
+ "n" : 1,
1496
+ "h" : 1
1497
+ },
1498
+ "input.11" : {
1499
+ "k" : 1,
1500
+ "w" : 768,
1501
+ "n" : 1,
1502
+ "_rank" : 3,
1503
+ "h" : 1500
1504
+ },
1505
+ "input.259_scale" : {
1506
+ "k" : 1500,
1507
+ "w" : 768,
1508
+ "n" : 1,
1509
+ "_rank" : 4,
1510
+ "h" : 1
1511
+ },
1512
+ "837_reshape" : {
1513
+ "k" : 1500,
1514
+ "w" : 768,
1515
+ "n" : 1,
1516
+ "_rank" : 4,
1517
+ "h" : 1
1518
+ },
1519
+ "tensor.19" : {
1520
+ "k" : 1,
1521
+ "w" : 768,
1522
+ "n" : 1,
1523
+ "_rank" : 3,
1524
+ "h" : 1500
1525
+ },
1526
+ "input.7" : {
1527
+ "k" : 12,
1528
+ "w" : 1500,
1529
+ "n" : 1,
1530
+ "_rank" : 4,
1531
+ "h" : 1500
1532
+ },
1533
+ "transpose_76" : {
1534
+ "k" : 1500,
1535
+ "w" : 64,
1536
+ "n" : 1,
1537
+ "_rank" : 4,
1538
+ "h" : 12
1539
+ },
1540
+ "input.259_reshape" : {
1541
+ "k" : 1500,
1542
+ "w" : 768,
1543
+ "n" : 1,
1544
+ "_rank" : 4,
1545
+ "h" : 1
1546
+ },
1547
+ "transpose_93" : {
1548
+ "k" : 12,
1549
+ "w" : 1500,
1550
+ "n" : 1,
1551
+ "_rank" : 4,
1552
+ "h" : 64
1553
+ },
1554
+ "595" : {
1555
+ "k" : 1,
1556
+ "w" : 768,
1557
+ "n" : 1,
1558
+ "_rank" : 3,
1559
+ "h" : 1500
1560
+ },
1561
+ "151" : {
1562
+ "k" : 1500,
1563
+ "w" : 64,
1564
+ "n" : 1,
1565
+ "_rank" : 4,
1566
+ "h" : 12
1567
+ },
1568
+ "407" : {
1569
+ "k" : 1500,
1570
+ "w" : 64,
1571
+ "n" : 1,
1572
+ "_rank" : 4,
1573
+ "h" : 12
1574
+ },
1575
+ "484" : {
1576
+ "k" : 1500,
1577
+ "w" : 64,
1578
+ "n" : 1,
1579
+ "_rank" : 4,
1580
+ "h" : 12
1581
+ },
1582
+ "input.149_scale" : {
1583
+ "k" : 1500,
1584
+ "w" : 768,
1585
+ "n" : 1,
1586
+ "_rank" : 4,
1587
+ "h" : 1
1588
+ },
1589
+ "transpose_100" : {
1590
+ "k" : 1500,
1591
+ "w" : 64,
1592
+ "n" : 1,
1593
+ "_rank" : 4,
1594
+ "h" : 12
1595
+ },
1596
+ "hidden_states.7_scale_constant_in_bias" : {
1597
+ "k" : 1,
1598
+ "w" : 768,
1599
+ "n" : 1,
1600
+ "h" : 1
1601
+ },
1602
+ "input.171_mvn" : {
1603
+ "k" : 1500,
1604
+ "w" : 768,
1605
+ "n" : 1,
1606
+ "_rank" : 4,
1607
+ "h" : 1
1608
+ },
1609
+ "input.153" : {
1610
+ "k" : 1,
1611
+ "w" : 3072,
1612
+ "n" : 1,
1613
+ "_rank" : 3,
1614
+ "h" : 1500
1615
+ },
1616
+ "hidden_states.13_reshape" : {
1617
+ "k" : 1500,
1618
+ "w" : 768,
1619
+ "n" : 1,
1620
+ "_rank" : 4,
1621
+ "h" : 1
1622
+ },
1623
+ "input.241" : {
1624
+ "k" : 1,
1625
+ "w" : 3072,
1626
+ "n" : 1,
1627
+ "_rank" : 3,
1628
+ "h" : 1500
1629
+ },
1630
+ "hidden_states.7_scale_mul_out" : {
1631
+ "k" : 1500,
1632
+ "w" : 768,
1633
+ "n" : 1,
1634
+ "_rank" : 4,
1635
+ "h" : 1
1636
+ },
1637
+ "attn_output.21" : {
1638
+ "k" : 12,
1639
+ "w" : 64,
1640
+ "n" : 1,
1641
+ "_rank" : 4,
1642
+ "h" : 1500
1643
+ },
1644
+ "input.83_mvn" : {
1645
+ "k" : 1500,
1646
+ "w" : 768,
1647
+ "n" : 1,
1648
+ "_rank" : 4,
1649
+ "h" : 1
1650
+ },
1651
+ "input.105_reshape" : {
1652
+ "k" : 1500,
1653
+ "w" : 768,
1654
+ "n" : 1,
1655
+ "_rank" : 4,
1656
+ "h" : 1
1657
+ },
1658
+ "hidden_states.37" : {
1659
+ "k" : 1,
1660
+ "w" : 768,
1661
+ "n" : 1,
1662
+ "_rank" : 3,
1663
+ "h" : 1500
1664
+ },
1665
+ "input.95" : {
1666
+ "k" : 12,
1667
+ "w" : 1500,
1668
+ "n" : 1,
1669
+ "_rank" : 4,
1670
+ "h" : 1500
1671
+ },
1672
+ "tensor.43" : {
1673
+ "k" : 1,
1674
+ "w" : 768,
1675
+ "n" : 1,
1676
+ "_rank" : 3,
1677
+ "h" : 1500
1678
+ },
1679
+ "input.73" : {
1680
+ "k" : 12,
1681
+ "w" : 1500,
1682
+ "n" : 1,
1683
+ "_rank" : 4,
1684
+ "h" : 1500
1685
+ },
1686
+ "input.259_scale_mul_out" : {
1687
+ "k" : 1500,
1688
+ "w" : 768,
1689
+ "n" : 1,
1690
+ "_rank" : 4,
1691
+ "h" : 1
1692
+ },
1693
+ "input.127" : {
1694
+ "k" : 1,
1695
+ "w" : 768,
1696
+ "n" : 1,
1697
+ "_rank" : 3,
1698
+ "h" : 1500
1699
+ },
1700
+ "input.51" : {
1701
+ "k" : 12,
1702
+ "w" : 1500,
1703
+ "n" : 1,
1704
+ "_rank" : 4,
1705
+ "h" : 1500
1706
+ },
1707
+ "transpose_63" : {
1708
+ "k" : 12,
1709
+ "w" : 64,
1710
+ "n" : 1,
1711
+ "_rank" : 4,
1712
+ "h" : 1500
1713
+ },
1714
+ "599" : {
1715
+ "k" : 1500,
1716
+ "w" : 64,
1717
+ "n" : 1,
1718
+ "_rank" : 4,
1719
+ "h" : 12
1720
+ },
1721
+ "transpose_80" : {
1722
+ "k" : 1500,
1723
+ "w" : 64,
1724
+ "n" : 1,
1725
+ "_rank" : 4,
1726
+ "h" : 12
1727
+ },
1728
+ "input.215" : {
1729
+ "k" : 1,
1730
+ "w" : 768,
1731
+ "n" : 1,
1732
+ "_rank" : 3,
1733
+ "h" : 1500
1734
+ },
1735
+ "input.61_scale_constant_in_scale" : {
1736
+ "k" : 1,
1737
+ "w" : 768,
1738
+ "n" : 1,
1739
+ "h" : 1
1740
+ },
1741
+ "hidden_states.37_scale" : {
1742
+ "k" : 1500,
1743
+ "w" : 768,
1744
+ "n" : 1,
1745
+ "_rank" : 4,
1746
+ "h" : 1
1747
+ },
1748
+ "hidden_states.67_reshape" : {
1749
+ "k" : 1500,
1750
+ "w" : 768,
1751
+ "n" : 1,
1752
+ "_rank" : 4,
1753
+ "h" : 1
1754
+ },
1755
+ "hidden_states.61_scale_mul_out" : {
1756
+ "k" : 1500,
1757
+ "w" : 768,
1758
+ "n" : 1,
1759
+ "_rank" : 4,
1760
+ "h" : 1
1761
+ },
1762
+ "740" : {
1763
+ "k" : 1500,
1764
+ "w" : 64,
1765
+ "n" : 1,
1766
+ "_rank" : 4,
1767
+ "h" : 12
1768
+ },
1769
+ "tensor.17" : {
1770
+ "k" : 1,
1771
+ "w" : 768,
1772
+ "n" : 1,
1773
+ "_rank" : 3,
1774
+ "h" : 1500
1775
+ },
1776
+ "157" : {
1777
+ "k" : 1500,
1778
+ "w" : 64,
1779
+ "n" : 1,
1780
+ "_rank" : 4,
1781
+ "h" : 12
1782
+ },
1783
+ "input.197" : {
1784
+ "k" : 1,
1785
+ "w" : 3072,
1786
+ "n" : 1,
1787
+ "_rank" : 3,
1788
+ "h" : 1500
1789
+ },
1790
+ "input.151" : {
1791
+ "k" : 1,
1792
+ "w" : 3072,
1793
+ "n" : 1,
1794
+ "_rank" : 3,
1795
+ "h" : 1500
1796
+ },
1797
+ "transpose_97" : {
1798
+ "k" : 12,
1799
+ "w" : 1500,
1800
+ "n" : 1,
1801
+ "_rank" : 4,
1802
+ "h" : 64
1803
+ },
1804
+ "input.83_scale_constant_in_bias" : {
1805
+ "k" : 1,
1806
+ "w" : 768,
1807
+ "n" : 1,
1808
+ "h" : 1
1809
+ },
1810
+ "hidden_states.37_scale_mul_out" : {
1811
+ "k" : 1500,
1812
+ "w" : 768,
1813
+ "n" : 1,
1814
+ "_rank" : 4,
1815
+ "h" : 1
1816
+ },
1817
+ "input.259" : {
1818
+ "k" : 1,
1819
+ "w" : 768,
1820
+ "n" : 1,
1821
+ "_rank" : 3,
1822
+ "h" : 1500
1823
+ },
1824
+ "attn_output.33" : {
1825
+ "k" : 12,
1826
+ "w" : 64,
1827
+ "n" : 1,
1828
+ "_rank" : 4,
1829
+ "h" : 1500
1830
+ },
1831
+ "input.91" : {
1832
+ "k" : 1,
1833
+ "w" : 768,
1834
+ "n" : 1,
1835
+ "_rank" : 3,
1836
+ "h" : 1500
1837
+ },
1838
+ "transpose_102" : {
1839
+ "k" : 12,
1840
+ "w" : 64,
1841
+ "n" : 1,
1842
+ "_rank" : 4,
1843
+ "h" : 1500
1844
+ },
1845
+ "tensor.41" : {
1846
+ "k" : 1,
1847
+ "w" : 768,
1848
+ "n" : 1,
1849
+ "_rank" : 3,
1850
+ "h" : 1500
1851
+ },
1852
+ "input.125" : {
1853
+ "k" : 1,
1854
+ "w" : 768,
1855
+ "n" : 1,
1856
+ "_rank" : 3,
1857
+ "h" : 1500
1858
+ },
1859
+ "input.213" : {
1860
+ "k" : 1,
1861
+ "w" : 768,
1862
+ "n" : 1,
1863
+ "_rank" : 3,
1864
+ "h" : 1500
1865
+ },
1866
+ "413" : {
1867
+ "k" : 1500,
1868
+ "w" : 64,
1869
+ "n" : 1,
1870
+ "_rank" : 4,
1871
+ "h" : 12
1872
+ },
1873
+ "hidden_states.61_scale_constant_in_bias" : {
1874
+ "k" : 1,
1875
+ "w" : 768,
1876
+ "n" : 1,
1877
+ "h" : 1
1878
+ },
1879
+ "tensor.15" : {
1880
+ "k" : 1,
1881
+ "w" : 768,
1882
+ "n" : 1,
1883
+ "_rank" : 3,
1884
+ "h" : 1500
1885
+ },
1886
+ "hidden_states.1_scale" : {
1887
+ "k" : 1500,
1888
+ "w" : 768,
1889
+ "n" : 1,
1890
+ "_rank" : 4,
1891
+ "h" : 1
1892
+ },
1893
+ "transpose_67" : {
1894
+ "k" : 12,
1895
+ "w" : 64,
1896
+ "n" : 1,
1897
+ "_rank" : 4,
1898
+ "h" : 1500
1899
+ },
1900
+ "input.195" : {
1901
+ "k" : 1,
1902
+ "w" : 3072,
1903
+ "n" : 1,
1904
+ "_rank" : 3,
1905
+ "h" : 1500
1906
+ },
1907
+ "input.237_mvn" : {
1908
+ "k" : 1500,
1909
+ "w" : 768,
1910
+ "n" : 1,
1911
+ "_rank" : 4,
1912
+ "h" : 1
1913
+ },
1914
+ "input.83_reshape" : {
1915
+ "k" : 1500,
1916
+ "w" : 768,
1917
+ "n" : 1,
1918
+ "_rank" : 4,
1919
+ "h" : 1
1920
+ },
1921
+ "transpose_84" : {
1922
+ "k" : 1500,
1923
+ "w" : 64,
1924
+ "n" : 1,
1925
+ "_rank" : 4,
1926
+ "h" : 12
1927
+ },
1928
+ "hidden_states.43_scale_constant_in_bias" : {
1929
+ "k" : 1,
1930
+ "w" : 768,
1931
+ "n" : 1,
1932
+ "h" : 1
1933
+ },
1934
+ "input.127_scale_mul_out" : {
1935
+ "k" : 1500,
1936
+ "w" : 768,
1937
+ "n" : 1,
1938
+ "_rank" : 4,
1939
+ "h" : 1
1940
+ },
1941
+ "hidden_states.61" : {
1942
+ "k" : 1,
1943
+ "w" : 768,
1944
+ "n" : 1,
1945
+ "_rank" : 3,
1946
+ "h" : 1500
1947
+ },
1948
+ "hidden_states.25_mvn" : {
1949
+ "k" : 1500,
1950
+ "w" : 768,
1951
+ "n" : 1,
1952
+ "_rank" : 4,
1953
+ "h" : 1
1954
+ },
1955
+ "input.169" : {
1956
+ "k" : 1,
1957
+ "w" : 768,
1958
+ "n" : 1,
1959
+ "_rank" : 3,
1960
+ "h" : 1500
1961
+ },
1962
+ "hidden_states.55_scale" : {
1963
+ "k" : 1500,
1964
+ "w" : 768,
1965
+ "n" : 1,
1966
+ "_rank" : 4,
1967
+ "h" : 1
1968
+ },
1969
+ "input.17_scale_mul_out" : {
1970
+ "k" : 1500,
1971
+ "w" : 768,
1972
+ "n" : 1,
1973
+ "_rank" : 4,
1974
+ "h" : 1
1975
+ },
1976
+ "input.257" : {
1977
+ "k" : 1,
1978
+ "w" : 768,
1979
+ "n" : 1,
1980
+ "_rank" : 3,
1981
+ "h" : 1500
1982
+ },
1983
+ "input.149_scale_mul_out" : {
1984
+ "k" : 1500,
1985
+ "w" : 768,
1986
+ "n" : 1,
1987
+ "_rank" : 4,
1988
+ "h" : 1
1989
+ },
1990
+ "input.123" : {
1991
+ "k" : 1,
1992
+ "w" : 768,
1993
+ "n" : 1,
1994
+ "_rank" : 3,
1995
+ "h" : 1500
1996
+ },
1997
+ "attn_output.45" : {
1998
+ "k" : 12,
1999
+ "w" : 64,
2000
+ "n" : 1,
2001
+ "_rank" : 4,
2002
+ "h" : 1500
2003
+ },
2004
+ "60" : {
2005
+ "k" : 1,
2006
+ "w" : 1500,
2007
+ "n" : 1,
2008
+ "_rank" : 3,
2009
+ "h" : 768
2010
+ },
2011
+ "input.211" : {
2012
+ "k" : 1,
2013
+ "w" : 768,
2014
+ "n" : 1,
2015
+ "_rank" : 3,
2016
+ "h" : 1500
2017
+ },
2018
+ "transpose_71" : {
2019
+ "k" : 12,
2020
+ "w" : 64,
2021
+ "n" : 1,
2022
+ "_rank" : 4,
2023
+ "h" : 1500
2024
+ },
2025
+ "tensor.59" : {
2026
+ "k" : 1,
2027
+ "w" : 768,
2028
+ "n" : 1,
2029
+ "_rank" : 3,
2030
+ "h" : 1500
2031
+ },
2032
+ "275" : {
2033
+ "k" : 1,
2034
+ "w" : 768,
2035
+ "n" : 1,
2036
+ "_rank" : 3,
2037
+ "h" : 1500
2038
+ },
2039
+ "tensor.9" : {
2040
+ "k" : 1,
2041
+ "w" : 768,
2042
+ "n" : 1,
2043
+ "_rank" : 3,
2044
+ "h" : 1500
2045
+ },
2046
+ "164" : {
2047
+ "k" : 1500,
2048
+ "w" : 64,
2049
+ "n" : 1,
2050
+ "_rank" : 4,
2051
+ "h" : 12
2052
+ },
2053
+ "transpose_104" : {
2054
+ "k" : 1500,
2055
+ "w" : 64,
2056
+ "n" : 1,
2057
+ "_rank" : 4,
2058
+ "h" : 12
2059
+ },
2060
+ "input.49" : {
2061
+ "k" : 1,
2062
+ "w" : 768,
2063
+ "n" : 1,
2064
+ "_rank" : 3,
2065
+ "h" : 1500
2066
+ },
2067
+ "input.27" : {
2068
+ "k" : 1,
2069
+ "w" : 768,
2070
+ "n" : 1,
2071
+ "_rank" : 3,
2072
+ "h" : 1500
2073
+ },
2074
+ "input.237_scale_mul_out" : {
2075
+ "k" : 1500,
2076
+ "w" : 768,
2077
+ "n" : 1,
2078
+ "_rank" : 4,
2079
+ "h" : 1
2080
+ },
2081
+ "tensor.13" : {
2082
+ "k" : 1,
2083
+ "w" : 768,
2084
+ "n" : 1,
2085
+ "_rank" : 3,
2086
+ "h" : 1500
2087
+ },
2088
+ "837_scale_constant_in_scale" : {
2089
+ "k" : 1,
2090
+ "w" : 768,
2091
+ "n" : 1,
2092
+ "h" : 1
2093
+ },
2094
+ "input.193" : {
2095
+ "k" : 1,
2096
+ "w" : 768,
2097
+ "n" : 1,
2098
+ "_rank" : 3,
2099
+ "h" : 1500
2100
+ },
2101
+ "hidden_states.25_reshape" : {
2102
+ "k" : 1500,
2103
+ "w" : 768,
2104
+ "n" : 1,
2105
+ "_rank" : 4,
2106
+ "h" : 1
2107
+ },
2108
+ "inputs_embeds.1" : {
2109
+ "k" : 1,
2110
+ "w" : 1500,
2111
+ "n" : 1,
2112
+ "_rank" : 3,
2113
+ "h" : 768
2114
+ },
2115
+ "hidden_states.19_scale_constant_in_scale" : {
2116
+ "k" : 1,
2117
+ "w" : 768,
2118
+ "n" : 1,
2119
+ "h" : 1
2120
+ },
2121
+ "input.237_reshape" : {
2122
+ "k" : 1500,
2123
+ "w" : 768,
2124
+ "n" : 1,
2125
+ "_rank" : 4,
2126
+ "h" : 1
2127
+ },
2128
+ "hidden_states.55_scale_mul_out" : {
2129
+ "k" : 1500,
2130
+ "w" : 768,
2131
+ "n" : 1,
2132
+ "_rank" : 4,
2133
+ "h" : 1
2134
+ },
2135
+ "279" : {
2136
+ "k" : 1500,
2137
+ "w" : 64,
2138
+ "n" : 1,
2139
+ "_rank" : 4,
2140
+ "h" : 12
2141
+ },
2142
+ "input.167" : {
2143
+ "k" : 1,
2144
+ "w" : 768,
2145
+ "n" : 1,
2146
+ "_rank" : 3,
2147
+ "h" : 1500
2148
+ },
2149
+ "hidden_states.67_scale_constant_in_scale" : {
2150
+ "k" : 1,
2151
+ "w" : 768,
2152
+ "n" : 1,
2153
+ "h" : 1
2154
+ },
2155
+ "transpose_88" : {
2156
+ "k" : 1500,
2157
+ "w" : 64,
2158
+ "n" : 1,
2159
+ "_rank" : 4,
2160
+ "h" : 12
2161
+ },
2162
+ "input.259_scale_constant_in_bias" : {
2163
+ "k" : 1,
2164
+ "w" : 768,
2165
+ "n" : 1,
2166
+ "h" : 1
2167
+ },
2168
+ "input.255" : {
2169
+ "k" : 1,
2170
+ "w" : 768,
2171
+ "n" : 1,
2172
+ "_rank" : 3,
2173
+ "h" : 1500
2174
+ },
2175
+ "input.61_scale_mul_out" : {
2176
+ "k" : 1500,
2177
+ "w" : 768,
2178
+ "n" : 1,
2179
+ "_rank" : 4,
2180
+ "h" : 1
2181
+ },
2182
+ "input.121" : {
2183
+ "k" : 1,
2184
+ "w" : 768,
2185
+ "n" : 1,
2186
+ "_rank" : 3,
2187
+ "h" : 1500
2188
+ },
2189
+ "531" : {
2190
+ "k" : 1,
2191
+ "w" : 768,
2192
+ "n" : 1,
2193
+ "_rank" : 3,
2194
+ "h" : 1500
2195
+ },
2196
+ "420" : {
2197
+ "k" : 1500,
2198
+ "w" : 64,
2199
+ "n" : 1,
2200
+ "_rank" : 4,
2201
+ "h" : 12
2202
+ },
2203
+ "tensor.57" : {
2204
+ "k" : 1,
2205
+ "w" : 768,
2206
+ "n" : 1,
2207
+ "_rank" : 3,
2208
+ "h" : 1500
2209
+ },
2210
+ "tensor.5" : {
2211
+ "k" : 1,
2212
+ "w" : 768,
2213
+ "n" : 1,
2214
+ "_rank" : 3,
2215
+ "h" : 1500
2216
+ },
2217
+ "input.229" : {
2218
+ "k" : 12,
2219
+ "w" : 1500,
2220
+ "n" : 1,
2221
+ "_rank" : 4,
2222
+ "h" : 1500
2223
+ },
2224
+ "hidden_states.1_scale_constant_in_bias" : {
2225
+ "k" : 1,
2226
+ "w" : 768,
2227
+ "n" : 1,
2228
+ "h" : 1
2229
+ },
2230
+ "hidden_states.7_scale_constant_in_scale" : {
2231
+ "k" : 1,
2232
+ "w" : 768,
2233
+ "n" : 1,
2234
+ "h" : 1
2235
+ },
2236
+ "tensor.11" : {
2237
+ "k" : 1,
2238
+ "w" : 768,
2239
+ "n" : 1,
2240
+ "_rank" : 3,
2241
+ "h" : 1500
2242
+ },
2243
+ "input.191" : {
2244
+ "k" : 1,
2245
+ "w" : 768,
2246
+ "n" : 1,
2247
+ "_rank" : 3,
2248
+ "h" : 1500
2249
+ },
2250
+ "transpose_75" : {
2251
+ "k" : 12,
2252
+ "w" : 64,
2253
+ "n" : 1,
2254
+ "_rank" : 4,
2255
+ "h" : 1500
2256
+ },
2257
+ "input.9" : {
2258
+ "k" : 12,
2259
+ "w" : 1500,
2260
+ "n" : 1,
2261
+ "_rank" : 4,
2262
+ "h" : 1500
2263
+ },
2264
+ "transpose_106" : {
2265
+ "k" : 12,
2266
+ "w" : 64,
2267
+ "n" : 1,
2268
+ "_rank" : 4,
2269
+ "h" : 1500
2270
+ },
2271
+ "transpose_92" : {
2272
+ "k" : 1500,
2273
+ "w" : 64,
2274
+ "n" : 1,
2275
+ "_rank" : 4,
2276
+ "h" : 12
2277
+ },
2278
+ "535" : {
2279
+ "k" : 1500,
2280
+ "w" : 64,
2281
+ "n" : 1,
2282
+ "_rank" : 4,
2283
+ "h" : 12
2284
+ },
2285
+ "hidden_states.19_scale_constant_in_bias" : {
2286
+ "k" : 1,
2287
+ "w" : 768,
2288
+ "n" : 1,
2289
+ "h" : 1
2290
+ },
2291
+ "input.165" : {
2292
+ "k" : 1,
2293
+ "w" : 768,
2294
+ "n" : 1,
2295
+ "_rank" : 3,
2296
+ "h" : 1500
2297
+ },
2298
+ "hidden_states.43_scale_constant_in_scale" : {
2299
+ "k" : 1,
2300
+ "w" : 768,
2301
+ "n" : 1,
2302
+ "h" : 1
2303
+ },
2304
+ "input.253" : {
2305
+ "k" : 1,
2306
+ "w" : 768,
2307
+ "n" : 1,
2308
+ "_rank" : 3,
2309
+ "h" : 1500
2310
+ },
2311
+ "input.105_scale_mul_out" : {
2312
+ "k" : 1500,
2313
+ "w" : 768,
2314
+ "n" : 1,
2315
+ "_rank" : 4,
2316
+ "h" : 1
2317
+ },
2318
+ "attn_output.13" : {
2319
+ "k" : 12,
2320
+ "w" : 64,
2321
+ "n" : 1,
2322
+ "_rank" : 4,
2323
+ "h" : 1500
2324
+ },
2325
+ "input.171_scale" : {
2326
+ "k" : 1500,
2327
+ "w" : 768,
2328
+ "n" : 1,
2329
+ "_rank" : 4,
2330
+ "h" : 1
2331
+ },
2332
+ "tensor.55" : {
2333
+ "k" : 1,
2334
+ "w" : 768,
2335
+ "n" : 1,
2336
+ "_rank" : 3,
2337
+ "h" : 1500
2338
+ },
2339
+ "tensor.1" : {
2340
+ "k" : 1,
2341
+ "w" : 768,
2342
+ "n" : 1,
2343
+ "_rank" : 3,
2344
+ "h" : 1500
2345
+ },
2346
+ "input.139" : {
2347
+ "k" : 12,
2348
+ "w" : 1500,
2349
+ "n" : 1,
2350
+ "_rank" : 4,
2351
+ "h" : 1500
2352
+ },
2353
+ "input.85" : {
2354
+ "k" : 1,
2355
+ "w" : 3072,
2356
+ "n" : 1,
2357
+ "_rank" : 3,
2358
+ "h" : 1500
2359
+ },
2360
+ "input.193_mvn" : {
2361
+ "k" : 1500,
2362
+ "w" : 768,
2363
+ "n" : 1,
2364
+ "_rank" : 4,
2365
+ "h" : 1
2366
+ },
2367
+ "input.63" : {
2368
+ "k" : 1,
2369
+ "w" : 3072,
2370
+ "n" : 1,
2371
+ "_rank" : 3,
2372
+ "h" : 1500
2373
+ },
2374
+ "transpose_62" : {
2375
+ "k" : 12,
2376
+ "w" : 64,
2377
+ "n" : 1,
2378
+ "_rank" : 4,
2379
+ "h" : 1500
2380
+ },
2381
+ "input.41" : {
2382
+ "k" : 1,
2383
+ "w" : 3072,
2384
+ "n" : 1,
2385
+ "_rank" : 3,
2386
+ "h" : 1500
2387
+ },
2388
+ "input.227" : {
2389
+ "k" : 12,
2390
+ "w" : 1500,
2391
+ "n" : 1,
2392
+ "_rank" : 4,
2393
+ "h" : 1500
2394
+ },
2395
+ "expand_dims_0" : {
2396
+ "k" : 80,
2397
+ "w" : 3000,
2398
+ "n" : 1,
2399
+ "_rank" : 4,
2400
+ "h" : 1
2401
+ },
2402
+ "input.193_scale" : {
2403
+ "k" : 1500,
2404
+ "w" : 768,
2405
+ "n" : 1,
2406
+ "_rank" : 4,
2407
+ "h" : 1
2408
+ },
2409
+ "hidden_states.31" : {
2410
+ "k" : 1,
2411
+ "w" : 768,
2412
+ "n" : 1,
2413
+ "_rank" : 3,
2414
+ "h" : 1500
2415
+ },
2416
+ "hidden_states.13_scale_mul_out" : {
2417
+ "k" : 1500,
2418
+ "w" : 768,
2419
+ "n" : 1,
2420
+ "_rank" : 4,
2421
+ "h" : 1
2422
+ },
2423
+ "input.127_scale_constant_in_bias" : {
2424
+ "k" : 1,
2425
+ "w" : 768,
2426
+ "n" : 1,
2427
+ "h" : 1
2428
+ },
2429
+ "input.171_scale_constant_in_bias" : {
2430
+ "k" : 1,
2431
+ "w" : 768,
2432
+ "n" : 1,
2433
+ "h" : 1
2434
+ },
2435
+ "input.1" : {
2436
+ "k" : 1,
2437
+ "w" : 3000,
2438
+ "n" : 1,
2439
+ "_rank" : 3,
2440
+ "h" : 768
2441
+ },
2442
+ "input.39_reshape" : {
2443
+ "k" : 1500,
2444
+ "w" : 768,
2445
+ "n" : 1,
2446
+ "_rank" : 4,
2447
+ "h" : 1
2448
+ },
2449
+ "tensor.29" : {
2450
+ "k" : 1,
2451
+ "w" : 768,
2452
+ "n" : 1,
2453
+ "_rank" : 3,
2454
+ "h" : 1500
2455
+ },
2456
+ "285" : {
2457
+ "k" : 1500,
2458
+ "w" : 64,
2459
+ "n" : 1,
2460
+ "_rank" : 4,
2461
+ "h" : 12
2462
+ },
2463
+ "hidden_states.7_scale" : {
2464
+ "k" : 1500,
2465
+ "w" : 768,
2466
+ "n" : 1,
2467
+ "_rank" : 4,
2468
+ "h" : 1
2469
+ },
2470
+ "hidden_states.55_scale_constant_in_scale" : {
2471
+ "k" : 1,
2472
+ "w" : 768,
2473
+ "n" : 1,
2474
+ "h" : 1
2475
+ },
2476
+ "input.105_scale_constant_in_scale" : {
2477
+ "k" : 1,
2478
+ "w" : 768,
2479
+ "n" : 1,
2480
+ "h" : 1
2481
+ },
2482
+ "input.215_scale_mul_out" : {
2483
+ "k" : 1500,
2484
+ "w" : 768,
2485
+ "n" : 1,
2486
+ "_rank" : 4,
2487
+ "h" : 1
2488
+ },
2489
+ "input.61_reshape" : {
2490
+ "k" : 1500,
2491
+ "w" : 768,
2492
+ "n" : 1,
2493
+ "_rank" : 4,
2494
+ "h" : 1
2495
+ },
2496
+ "hidden_states.7" : {
2497
+ "k" : 1,
2498
+ "w" : 768,
2499
+ "n" : 1,
2500
+ "_rank" : 3,
2501
+ "h" : 1500
2502
+ },
2503
+ "input.163" : {
2504
+ "k" : 12,
2505
+ "w" : 1500,
2506
+ "n" : 1,
2507
+ "_rank" : 4,
2508
+ "h" : 1500
2509
+ },
2510
+ "hidden_states.37_mvn" : {
2511
+ "k" : 1500,
2512
+ "w" : 768,
2513
+ "n" : 1,
2514
+ "_rank" : 4,
2515
+ "h" : 1
2516
+ },
2517
+ "transpose_79" : {
2518
+ "k" : 12,
2519
+ "w" : 64,
2520
+ "n" : 1,
2521
+ "_rank" : 4,
2522
+ "h" : 1500
2523
+ },
2524
+ "transpose_108" : {
2525
+ "k" : 1,
2526
+ "w" : 768,
2527
+ "n" : 1,
2528
+ "_rank" : 3,
2529
+ "h" : 1500
2530
+ },
2531
+ "hidden_states.1_scale_constant_in_scale" : {
2532
+ "k" : 1,
2533
+ "w" : 768,
2534
+ "n" : 1,
2535
+ "h" : 1
2536
+ },
2537
+ "input.251" : {
2538
+ "k" : 12,
2539
+ "w" : 1500,
2540
+ "n" : 1,
2541
+ "_rank" : 4,
2542
+ "h" : 1500
2543
+ },
2544
+ "transpose_96" : {
2545
+ "k" : 1500,
2546
+ "w" : 64,
2547
+ "n" : 1,
2548
+ "_rank" : 4,
2549
+ "h" : 12
2550
+ },
2551
+ "attn_output.25" : {
2552
+ "k" : 12,
2553
+ "w" : 64,
2554
+ "n" : 1,
2555
+ "_rank" : 4,
2556
+ "h" : 1500
2557
+ },
2558
+ "input.17_reshape" : {
2559
+ "k" : 1500,
2560
+ "w" : 768,
2561
+ "n" : 1,
2562
+ "_rank" : 4,
2563
+ "h" : 1
2564
+ },
2565
+ "tensor.53" : {
2566
+ "k" : 1,
2567
+ "w" : 768,
2568
+ "n" : 1,
2569
+ "_rank" : 3,
2570
+ "h" : 1500
2571
+ },
2572
+ "input.81" : {
2573
+ "k" : 1,
2574
+ "w" : 768,
2575
+ "n" : 1,
2576
+ "_rank" : 3,
2577
+ "h" : 1500
2578
+ },
2579
+ "input.137" : {
2580
+ "k" : 1,
2581
+ "w" : 768,
2582
+ "n" : 1,
2583
+ "_rank" : 3,
2584
+ "h" : 1500
2585
+ },
2586
+ "input.259_scale_constant_in_scale" : {
2587
+ "k" : 1,
2588
+ "w" : 768,
2589
+ "n" : 1,
2590
+ "h" : 1
2591
+ },
2592
+ "hidden_states.31_mvn" : {
2593
+ "k" : 1500,
2594
+ "w" : 768,
2595
+ "n" : 1,
2596
+ "_rank" : 4,
2597
+ "h" : 1
2598
+ },
2599
+ "input.225" : {
2600
+ "k" : 1,
2601
+ "w" : 768,
2602
+ "n" : 1,
2603
+ "_rank" : 3,
2604
+ "h" : 1500
2605
+ },
2606
+ "hidden_states.37_reshape" : {
2607
+ "k" : 1500,
2608
+ "w" : 768,
2609
+ "n" : 1,
2610
+ "_rank" : 4,
2611
+ "h" : 1
2612
+ },
2613
+ "541" : {
2614
+ "k" : 1500,
2615
+ "w" : 64,
2616
+ "n" : 1,
2617
+ "_rank" : 4,
2618
+ "h" : 12
2619
+ },
2620
+ "tensor.27" : {
2621
+ "k" : 1,
2622
+ "w" : 768,
2623
+ "n" : 1,
2624
+ "_rank" : 3,
2625
+ "h" : 1500
2626
+ },
2627
+ "hidden_states.55" : {
2628
+ "k" : 1,
2629
+ "w" : 768,
2630
+ "n" : 1,
2631
+ "_rank" : 3,
2632
+ "h" : 1500
2633
+ },
2634
+ "transpose_66" : {
2635
+ "k" : 12,
2636
+ "w" : 64,
2637
+ "n" : 1,
2638
+ "_rank" : 4,
2639
+ "h" : 1500
2640
+ },
2641
+ "input.237_scale_constant_in_bias" : {
2642
+ "k" : 1,
2643
+ "w" : 768,
2644
+ "n" : 1,
2645
+ "h" : 1
2646
+ },
2647
+ "transpose_83" : {
2648
+ "k" : 12,
2649
+ "w" : 64,
2650
+ "n" : 1,
2651
+ "_rank" : 4,
2652
+ "h" : 1500
2653
+ },
2654
+ "expand_dims_2" : {
2655
+ "k" : 768,
2656
+ "w" : 3000,
2657
+ "n" : 1,
2658
+ "_rank" : 4,
2659
+ "h" : 1
2660
+ },
2661
+ "837_scale" : {
2662
+ "k" : 1500,
2663
+ "w" : 768,
2664
+ "n" : 1,
2665
+ "_rank" : 4,
2666
+ "h" : 1
2667
+ },
2668
+ "hidden_states.31_scale_constant_in_scale" : {
2669
+ "k" : 1,
2670
+ "w" : 768,
2671
+ "n" : 1,
2672
+ "h" : 1
2673
+ },
2674
+ "211" : {
2675
+ "k" : 1,
2676
+ "w" : 768,
2677
+ "n" : 1,
2678
+ "_rank" : 3,
2679
+ "h" : 1500
2680
+ },
2681
+ "100" : {
2682
+ "k" : 1500,
2683
+ "w" : 64,
2684
+ "n" : 1,
2685
+ "_rank" : 4,
2686
+ "h" : 12
2687
+ },
2688
+ "input.161" : {
2689
+ "k" : 12,
2690
+ "w" : 1500,
2691
+ "n" : 1,
2692
+ "_rank" : 4,
2693
+ "h" : 1500
2694
+ },
2695
+ "input.17_scale_constant_in_bias" : {
2696
+ "k" : 1,
2697
+ "w" : 768,
2698
+ "n" : 1,
2699
+ "h" : 1
2700
+ },
2701
+ "input.215_reshape" : {
2702
+ "k" : 1500,
2703
+ "w" : 768,
2704
+ "n" : 1,
2705
+ "_rank" : 4,
2706
+ "h" : 1
2707
+ },
2708
+ "hidden_states.55_scale_constant_in_bias" : {
2709
+ "k" : 1,
2710
+ "w" : 768,
2711
+ "n" : 1,
2712
+ "h" : 1
2713
+ },
2714
+ "hidden_states.25_scale" : {
2715
+ "k" : 1500,
2716
+ "w" : 768,
2717
+ "n" : 1,
2718
+ "_rank" : 4,
2719
+ "h" : 1
2720
+ },
2721
+ "input.259_mvn" : {
2722
+ "k" : 1500,
2723
+ "w" : 768,
2724
+ "n" : 1,
2725
+ "_rank" : 4,
2726
+ "h" : 1
2727
+ },
2728
+ "tensor.51" : {
2729
+ "k" : 1,
2730
+ "w" : 768,
2731
+ "n" : 1,
2732
+ "_rank" : 3,
2733
+ "h" : 1500
2734
+ },
2735
+ "input.17_mvn" : {
2736
+ "k" : 1500,
2737
+ "w" : 768,
2738
+ "n" : 1,
2739
+ "_rank" : 4,
2740
+ "h" : 1
2741
+ },
2742
+ "hidden_states.37_scale_constant_in_bias" : {
2743
+ "k" : 1,
2744
+ "w" : 768,
2745
+ "n" : 1,
2746
+ "h" : 1
2747
+ },
2748
+ "attn_output.37" : {
2749
+ "k" : 12,
2750
+ "w" : 64,
2751
+ "n" : 1,
2752
+ "_rank" : 4,
2753
+ "h" : 1500
2754
+ },
2755
+ "conv_0" : {
2756
+ "k" : 768,
2757
+ "w" : 3000,
2758
+ "n" : 1,
2759
+ "_rank" : 4,
2760
+ "h" : 1
2761
+ },
2762
+ "input.135" : {
2763
+ "k" : 1,
2764
+ "w" : 768,
2765
+ "n" : 1,
2766
+ "_rank" : 3,
2767
+ "h" : 1500
2768
+ },
2769
+ "transpose_70" : {
2770
+ "k" : 12,
2771
+ "w" : 64,
2772
+ "n" : 1,
2773
+ "_rank" : 4,
2774
+ "h" : 1500
2775
+ },
2776
+ "input.223" : {
2777
+ "k" : 1,
2778
+ "w" : 768,
2779
+ "n" : 1,
2780
+ "_rank" : 3,
2781
+ "h" : 1500
2782
+ },
2783
+ "292" : {
2784
+ "k" : 1500,
2785
+ "w" : 64,
2786
+ "n" : 1,
2787
+ "_rank" : 4,
2788
+ "h" : 12
2789
+ },
2790
+ "hidden_states.31_scale_mul_out" : {
2791
+ "k" : 1500,
2792
+ "w" : 768,
2793
+ "n" : 1,
2794
+ "_rank" : 4,
2795
+ "h" : 1
2796
+ },
2797
+ "659" : {
2798
+ "k" : 1,
2799
+ "w" : 768,
2800
+ "n" : 1,
2801
+ "_rank" : 3,
2802
+ "h" : 1500
2803
+ },
2804
+ "215" : {
2805
+ "k" : 1500,
2806
+ "w" : 64,
2807
+ "n" : 1,
2808
+ "_rank" : 4,
2809
+ "h" : 12
2810
+ },
2811
+ "548" : {
2812
+ "k" : 1500,
2813
+ "w" : 64,
2814
+ "n" : 1,
2815
+ "_rank" : 4,
2816
+ "h" : 12
2817
+ },
2818
+ "837_mvn" : {
2819
+ "k" : 1500,
2820
+ "w" : 768,
2821
+ "n" : 1,
2822
+ "_rank" : 4,
2823
+ "h" : 1
2824
+ },
2825
+ "tensor.25" : {
2826
+ "k" : 1,
2827
+ "w" : 768,
2828
+ "n" : 1,
2829
+ "_rank" : 3,
2830
+ "h" : 1500
2831
+ },
2832
+ "input.109" : {
2833
+ "k" : 1,
2834
+ "w" : 3072,
2835
+ "n" : 1,
2836
+ "_rank" : 3,
2837
+ "h" : 1500
2838
+ },
2839
+ "input.39" : {
2840
+ "k" : 1,
2841
+ "w" : 768,
2842
+ "n" : 1,
2843
+ "_rank" : 3,
2844
+ "h" : 1500
2845
+ },
2846
+ "input.17" : {
2847
+ "k" : 1,
2848
+ "w" : 768,
2849
+ "n" : 1,
2850
+ "_rank" : 3,
2851
+ "h" : 1500
2852
+ },
2853
+ "hidden_states.7_mvn" : {
2854
+ "k" : 1500,
2855
+ "w" : 768,
2856
+ "n" : 1,
2857
+ "_rank" : 4,
2858
+ "h" : 1
2859
+ },
2860
+ "last_hidden_state" : {
2861
+ "k" : 1,
2862
+ "w" : 768,
2863
+ "n" : 1,
2864
+ "_rank" : 3,
2865
+ "h" : 1500
2866
+ },
2867
+ "input.179" : {
2868
+ "k" : 1,
2869
+ "w" : 768,
2870
+ "n" : 1,
2871
+ "_rank" : 3,
2872
+ "h" : 1500
2873
+ },
2874
+ "hidden_states.1" : {
2875
+ "k" : 1,
2876
+ "w" : 768,
2877
+ "n" : 1,
2878
+ "_rank" : 3,
2879
+ "h" : 1500
2880
+ },
2881
+ "transpose_87" : {
2882
+ "k" : 12,
2883
+ "w" : 64,
2884
+ "n" : 1,
2885
+ "_rank" : 4,
2886
+ "h" : 1500
2887
+ },
2888
+ "input.267" : {
2889
+ "k" : 1,
2890
+ "w" : 768,
2891
+ "n" : 1,
2892
+ "_rank" : 3,
2893
+ "h" : 1500
2894
+ },
2895
+ "input.39_scale_mul_out" : {
2896
+ "k" : 1500,
2897
+ "w" : 768,
2898
+ "n" : 1,
2899
+ "_rank" : 4,
2900
+ "h" : 1
2901
+ },
2902
+ "attn_output.1" : {
2903
+ "k" : 12,
2904
+ "w" : 64,
2905
+ "n" : 1,
2906
+ "_rank" : 4,
2907
+ "h" : 1500
2908
+ },
2909
+ "input.105_scale_constant_in_bias" : {
2910
+ "k" : 1,
2911
+ "w" : 768,
2912
+ "n" : 1,
2913
+ "h" : 1
2914
+ },
2915
+ "804" : {
2916
+ "k" : 1500,
2917
+ "w" : 64,
2918
+ "n" : 1,
2919
+ "_rank" : 4,
2920
+ "h" : 12
2921
+ },
2922
+ "conv_1" : {
2923
+ "k" : 768,
2924
+ "w" : 1500,
2925
+ "n" : 1,
2926
+ "_rank" : 4,
2927
+ "h" : 1
2928
+ },
2929
+ "hidden_states.61_reshape" : {
2930
+ "k" : 1500,
2931
+ "w" : 768,
2932
+ "n" : 1,
2933
+ "_rank" : 4,
2934
+ "h" : 1
2935
+ },
2936
+ "tensor.69" : {
2937
+ "k" : 1,
2938
+ "w" : 768,
2939
+ "n" : 1,
2940
+ "_rank" : 3,
2941
+ "h" : 1500
2942
+ },
2943
+ "hidden_states.1_reshape" : {
2944
+ "k" : 1500,
2945
+ "w" : 768,
2946
+ "n" : 1,
2947
+ "_rank" : 4,
2948
+ "h" : 1
2949
+ },
2950
+ "input.105_mvn" : {
2951
+ "k" : 1500,
2952
+ "w" : 768,
2953
+ "n" : 1,
2954
+ "_rank" : 4,
2955
+ "h" : 1
2956
+ },
2957
+ "input.79" : {
2958
+ "k" : 1,
2959
+ "w" : 768,
2960
+ "n" : 1,
2961
+ "_rank" : 3,
2962
+ "h" : 1500
2963
+ },
2964
+ "input.57" : {
2965
+ "k" : 1,
2966
+ "w" : 768,
2967
+ "n" : 1,
2968
+ "_rank" : 3,
2969
+ "h" : 1500
2970
+ },
2971
+ "tensor.23" : {
2972
+ "k" : 1,
2973
+ "w" : 768,
2974
+ "n" : 1,
2975
+ "_rank" : 3,
2976
+ "h" : 1500
2977
+ },
2978
+ "input.35" : {
2979
+ "k" : 1,
2980
+ "w" : 768,
2981
+ "n" : 1,
2982
+ "_rank" : 3,
2983
+ "h" : 1500
2984
+ },
2985
+ "hidden_states.43_scale" : {
2986
+ "k" : 1500,
2987
+ "w" : 768,
2988
+ "n" : 1,
2989
+ "_rank" : 4,
2990
+ "h" : 1
2991
+ },
2992
+ "input.107" : {
2993
+ "k" : 1,
2994
+ "w" : 3072,
2995
+ "n" : 1,
2996
+ "_rank" : 3,
2997
+ "h" : 1500
2998
+ },
2999
+ "input.61_scale_constant_in_bias" : {
3000
+ "k" : 1,
3001
+ "w" : 768,
3002
+ "n" : 1,
3003
+ "h" : 1
3004
+ },
3005
+ "input.13" : {
3006
+ "k" : 1,
3007
+ "w" : 768,
3008
+ "n" : 1,
3009
+ "_rank" : 3,
3010
+ "h" : 1500
3011
+ },
3012
+ "transpose_74" : {
3013
+ "k" : 12,
3014
+ "w" : 64,
3015
+ "n" : 1,
3016
+ "_rank" : 4,
3017
+ "h" : 1500
3018
+ },
3019
+ "transpose_91" : {
3020
+ "k" : 12,
3021
+ "w" : 64,
3022
+ "n" : 1,
3023
+ "_rank" : 4,
3024
+ "h" : 1500
3025
+ }
3026
+ }
3027
+ }
WhisperEncoder.mlmodelc/model.espresso.weights ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:9587e0a2943e66021b9e0baa5e437d5e4f80039b2ee9cd4c9b839b1f40b7ddd3
3
+ size 353655040
WhisperEncoder.mlmodelc/model/coremldata.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:f5a5fd42d16a20302798ef6ed309979b43003d2320d9f0e8ea9831a92759fb4b
3
+ size 64
WhisperEncoder.mlmodelc/neural_network_optionals/coremldata.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:5931bd536c4550294a212c6fc8d3c1bee75da817980ba0b671c8603dafb36238
3
+ size 40
config.json ADDED
@@ -0,0 +1,59 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "activation_dropout": 0.0,
3
+ "activation_function": "gelu",
4
+ "apply_spec_augment": false,
5
+ "architectures": [
6
+ "WhisperForConditionalGeneration"
7
+ ],
8
+ "attention_dropout": 0.0,
9
+ "bos_token_id": 50257,
10
+ "classifier_proj_size": 256,
11
+ "d_model": 768,
12
+ "decoder_attention_heads": 12,
13
+ "decoder_ffn_dim": 3072,
14
+ "decoder_layerdrop": 0.0,
15
+ "decoder_layers": 12,
16
+ "decoder_start_token_id": 50258,
17
+ "dropout": 0.0,
18
+ "dtype": "float32",
19
+ "encoder_attention_heads": 12,
20
+ "encoder_ffn_dim": 3072,
21
+ "encoder_layerdrop": 0.0,
22
+ "encoder_layers": 12,
23
+ "eos_token_id": 50257,
24
+ "forced_decoder_ids": [
25
+ [
26
+ 1,
27
+ 50259
28
+ ],
29
+ [
30
+ 2,
31
+ 50359
32
+ ],
33
+ [
34
+ 3,
35
+ 50363
36
+ ]
37
+ ],
38
+ "init_std": 0.02,
39
+ "is_encoder_decoder": true,
40
+ "mask_feature_length": 10,
41
+ "mask_feature_min_masks": 0,
42
+ "mask_feature_prob": 0.0,
43
+ "mask_time_length": 10,
44
+ "mask_time_min_masks": 2,
45
+ "mask_time_prob": 0.05,
46
+ "max_source_positions": 1500,
47
+ "max_target_positions": 448,
48
+ "median_filter_width": 7,
49
+ "model_type": "whisper",
50
+ "num_hidden_layers": 12,
51
+ "num_mel_bins": 80,
52
+ "pad_token_id": 50257,
53
+ "scale_embedding": false,
54
+ "tie_word_embeddings": true,
55
+ "transformers_version": "5.3.0",
56
+ "use_cache": true,
57
+ "use_weighted_layer_sum": false,
58
+ "vocab_size": 51865
59
+ }
generation_config.json ADDED
@@ -0,0 +1,264 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "alignment_heads": [
3
+ [
4
+ 5,
5
+ 3
6
+ ],
7
+ [
8
+ 5,
9
+ 9
10
+ ],
11
+ [
12
+ 8,
13
+ 0
14
+ ],
15
+ [
16
+ 8,
17
+ 4
18
+ ],
19
+ [
20
+ 8,
21
+ 7
22
+ ],
23
+ [
24
+ 8,
25
+ 8
26
+ ],
27
+ [
28
+ 9,
29
+ 0
30
+ ],
31
+ [
32
+ 9,
33
+ 7
34
+ ],
35
+ [
36
+ 9,
37
+ 9
38
+ ],
39
+ [
40
+ 10,
41
+ 5
42
+ ]
43
+ ],
44
+ "begin_suppress_tokens": [
45
+ 220,
46
+ 50257
47
+ ],
48
+ "bos_token_id": 50257,
49
+ "decoder_start_token_id": 50258,
50
+ "eos_token_id": 50257,
51
+ "forced_decoder_ids": [
52
+ [
53
+ 1,
54
+ null
55
+ ],
56
+ [
57
+ 2,
58
+ 50359
59
+ ]
60
+ ],
61
+ "is_multilingual": true,
62
+ "lang_to_id": {
63
+ "<|af|>": 50327,
64
+ "<|am|>": 50334,
65
+ "<|ar|>": 50272,
66
+ "<|as|>": 50350,
67
+ "<|az|>": 50304,
68
+ "<|ba|>": 50355,
69
+ "<|be|>": 50330,
70
+ "<|bg|>": 50292,
71
+ "<|bn|>": 50302,
72
+ "<|bo|>": 50347,
73
+ "<|br|>": 50309,
74
+ "<|bs|>": 50315,
75
+ "<|ca|>": 50270,
76
+ "<|cs|>": 50283,
77
+ "<|cy|>": 50297,
78
+ "<|da|>": 50285,
79
+ "<|de|>": 50261,
80
+ "<|el|>": 50281,
81
+ "<|en|>": 50259,
82
+ "<|es|>": 50262,
83
+ "<|et|>": 50307,
84
+ "<|eu|>": 50310,
85
+ "<|fa|>": 50300,
86
+ "<|fi|>": 50277,
87
+ "<|fo|>": 50338,
88
+ "<|fr|>": 50265,
89
+ "<|gl|>": 50319,
90
+ "<|gu|>": 50333,
91
+ "<|haw|>": 50352,
92
+ "<|ha|>": 50354,
93
+ "<|he|>": 50279,
94
+ "<|hi|>": 50276,
95
+ "<|hr|>": 50291,
96
+ "<|ht|>": 50339,
97
+ "<|hu|>": 50286,
98
+ "<|hy|>": 50312,
99
+ "<|id|>": 50275,
100
+ "<|is|>": 50311,
101
+ "<|it|>": 50274,
102
+ "<|ja|>": 50266,
103
+ "<|jw|>": 50356,
104
+ "<|ka|>": 50329,
105
+ "<|kk|>": 50316,
106
+ "<|km|>": 50323,
107
+ "<|kn|>": 50306,
108
+ "<|ko|>": 50264,
109
+ "<|la|>": 50294,
110
+ "<|lb|>": 50345,
111
+ "<|ln|>": 50353,
112
+ "<|lo|>": 50336,
113
+ "<|lt|>": 50293,
114
+ "<|lv|>": 50301,
115
+ "<|mg|>": 50349,
116
+ "<|mi|>": 50295,
117
+ "<|mk|>": 50308,
118
+ "<|ml|>": 50296,
119
+ "<|mn|>": 50314,
120
+ "<|mr|>": 50320,
121
+ "<|ms|>": 50282,
122
+ "<|mt|>": 50343,
123
+ "<|my|>": 50346,
124
+ "<|ne|>": 50313,
125
+ "<|nl|>": 50271,
126
+ "<|nn|>": 50342,
127
+ "<|no|>": 50288,
128
+ "<|oc|>": 50328,
129
+ "<|pa|>": 50321,
130
+ "<|pl|>": 50269,
131
+ "<|ps|>": 50340,
132
+ "<|pt|>": 50267,
133
+ "<|ro|>": 50284,
134
+ "<|ru|>": 50263,
135
+ "<|sa|>": 50344,
136
+ "<|sd|>": 50332,
137
+ "<|si|>": 50322,
138
+ "<|sk|>": 50298,
139
+ "<|sl|>": 50305,
140
+ "<|sn|>": 50324,
141
+ "<|so|>": 50326,
142
+ "<|sq|>": 50317,
143
+ "<|sr|>": 50303,
144
+ "<|su|>": 50357,
145
+ "<|sv|>": 50273,
146
+ "<|sw|>": 50318,
147
+ "<|ta|>": 50287,
148
+ "<|te|>": 50299,
149
+ "<|tg|>": 50331,
150
+ "<|th|>": 50289,
151
+ "<|tk|>": 50341,
152
+ "<|tl|>": 50348,
153
+ "<|tr|>": 50268,
154
+ "<|tt|>": 50351,
155
+ "<|uk|>": 50280,
156
+ "<|ur|>": 50290,
157
+ "<|uz|>": 50337,
158
+ "<|vi|>": 50278,
159
+ "<|yi|>": 50335,
160
+ "<|yo|>": 50325,
161
+ "<|zh|>": 50260
162
+ },
163
+ "max_initial_timestamp_index": 50,
164
+ "max_length": 448,
165
+ "no_timestamps_token_id": 50363,
166
+ "pad_token_id": 50257,
167
+ "prev_sot_token_id": 50361,
168
+ "return_timestamps": false,
169
+ "suppress_tokens": [
170
+ 1,
171
+ 2,
172
+ 7,
173
+ 8,
174
+ 9,
175
+ 10,
176
+ 14,
177
+ 25,
178
+ 26,
179
+ 27,
180
+ 28,
181
+ 29,
182
+ 31,
183
+ 58,
184
+ 59,
185
+ 60,
186
+ 61,
187
+ 62,
188
+ 63,
189
+ 90,
190
+ 91,
191
+ 92,
192
+ 93,
193
+ 359,
194
+ 503,
195
+ 522,
196
+ 542,
197
+ 873,
198
+ 893,
199
+ 902,
200
+ 918,
201
+ 922,
202
+ 931,
203
+ 1350,
204
+ 1853,
205
+ 1982,
206
+ 2460,
207
+ 2627,
208
+ 3246,
209
+ 3253,
210
+ 3268,
211
+ 3536,
212
+ 3846,
213
+ 3961,
214
+ 4183,
215
+ 4667,
216
+ 6585,
217
+ 6647,
218
+ 7273,
219
+ 9061,
220
+ 9383,
221
+ 10428,
222
+ 10929,
223
+ 11938,
224
+ 12033,
225
+ 12331,
226
+ 12562,
227
+ 13793,
228
+ 14157,
229
+ 14635,
230
+ 15265,
231
+ 15618,
232
+ 16553,
233
+ 16604,
234
+ 18362,
235
+ 18956,
236
+ 20075,
237
+ 21675,
238
+ 22520,
239
+ 26130,
240
+ 26161,
241
+ 26435,
242
+ 28279,
243
+ 29464,
244
+ 31650,
245
+ 32302,
246
+ 32470,
247
+ 36865,
248
+ 42863,
249
+ 47425,
250
+ 49870,
251
+ 50254,
252
+ 50258,
253
+ 50358,
254
+ 50359,
255
+ 50360,
256
+ 50361,
257
+ 50362
258
+ ],
259
+ "task_to_id": {
260
+ "transcribe": 50359,
261
+ "translate": 50358
262
+ },
263
+ "transformers_version": "5.3.0"
264
+ }