alpaycli commited on
Commit
6197c36
·
verified ·
1 Parent(s): f8aa558

Delete az-speechto-text-HF

Browse files
az-speechto-text-HF/.DS_Store DELETED
Binary file (6.15 kB)
 
az-speechto-text-HF/WhisperDecoder.mlmodelc/analytics/coremldata.bin DELETED
@@ -1,3 +0,0 @@
1
- version https://git-lfs.github.com/spec/v1
2
- oid sha256:8862dad097476bb776346165cbd092589fab34861e48f8112b129361be44507d
3
- size 482
 
 
 
 
az-speechto-text-HF/WhisperDecoder.mlmodelc/coremldata.bin DELETED
@@ -1,3 +0,0 @@
1
- version https://git-lfs.github.com/spec/v1
2
- oid sha256:db1e1510350e3532f9c8033cd379e2e04a41fa0f634c922625faf1060ce79b71
3
- size 310
 
 
 
 
az-speechto-text-HF/WhisperDecoder.mlmodelc/metadata.json DELETED
@@ -1,93 +0,0 @@
1
- [
2
- {
3
- "metadataOutputVersion" : "3.0",
4
- "storagePrecision" : "Float32",
5
- "outputSchema" : [
6
- {
7
- "hasShapeFlexibility" : "0",
8
- "isOptional" : "0",
9
- "dataType" : "Float32",
10
- "formattedType" : "MultiArray (Float32)",
11
- "shortDescription" : "",
12
- "shape" : "[]",
13
- "name" : "logits",
14
- "type" : "MultiArray"
15
- }
16
- ],
17
- "modelParameters" : [
18
-
19
- ],
20
- "specificationVersion" : 5,
21
- "computePrecision" : "Float16",
22
- "isUpdatable" : "0",
23
- "stateSchema" : [
24
-
25
- ],
26
- "availability" : {
27
- "macOS" : "11.0",
28
- "tvOS" : "14.0",
29
- "visionOS" : "1.0",
30
- "watchOS" : "7.0",
31
- "iOS" : "14.0",
32
- "macCatalyst" : "14.0"
33
- },
34
- "modelType" : {
35
- "name" : "MLModelType_neuralNetwork"
36
- },
37
- "userDefinedMetadata" : {
38
- "com.github.apple.coremltools.version" : "6.3.0",
39
- "com.github.apple.coremltools.source" : "torch==2.6.0"
40
- },
41
- "inputSchema" : [
42
- {
43
- "hasShapeFlexibility" : "0",
44
- "isOptional" : "0",
45
- "dataType" : "Float32",
46
- "formattedType" : "MultiArray (Float32 1 × 128)",
47
- "shortDescription" : "",
48
- "shape" : "[1, 128]",
49
- "name" : "decoder_input_ids",
50
- "type" : "MultiArray"
51
- },
52
- {
53
- "hasShapeFlexibility" : "0",
54
- "isOptional" : "0",
55
- "dataType" : "Float32",
56
- "formattedType" : "MultiArray (Float32 1 × 1500 × 768)",
57
- "shortDescription" : "",
58
- "shape" : "[1, 1500, 768]",
59
- "name" : "encoder_hidden_states",
60
- "type" : "MultiArray"
61
- }
62
- ],
63
- "generatedClassName" : "WhisperDecoder",
64
- "neuralNetworkLayerTypeHistogram" : {
65
- "Multiply" : 24,
66
- "RankPreservingReshape" : 1,
67
- "Transpose" : 108,
68
- "InnerProduct" : 121,
69
- "ConcatND" : 37,
70
- "Gather" : 38,
71
- "AddBroadcastable" : 36,
72
- "SliceDynamic" : 12,
73
- "GreaterThan" : 1,
74
- "Tile" : 1,
75
- "GetShape" : 37,
76
- "Add" : 14,
77
- "ReshapeDynamic" : 48,
78
- "BatchedMatmul" : 48,
79
- "LoadConstantND" : 95,
80
- "ExpandDims" : 2,
81
- "Scale" : 37,
82
- "MatrixBandPart" : 1,
83
- "ReshapeStatic" : 123,
84
- "Mvn" : 37,
85
- "SoftmaxND" : 24,
86
- "DivideBroadcastable" : 1,
87
- "MultiplyBroadcastable" : 1,
88
- "ActivationLinear" : 2,
89
- "Gelu" : 12
90
- },
91
- "method" : "predict"
92
- }
93
- ]
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
az-speechto-text-HF/WhisperDecoder.mlmodelc/model.espresso.net DELETED
The diff for this file is too large to render. See raw diff
 
az-speechto-text-HF/WhisperDecoder.mlmodelc/model.espresso.shape DELETED
The diff for this file is too large to render. See raw diff
 
az-speechto-text-HF/WhisperDecoder.mlmodelc/model.espresso.weights DELETED
@@ -1,3 +0,0 @@
1
- version https://git-lfs.github.com/spec/v1
2
- oid sha256:8ea75bbea4da5c00af24411311d61e4842ded014e3cd469313e61b5ae06c08e2
3
- size 775096832
 
 
 
 
az-speechto-text-HF/WhisperDecoder.mlmodelc/model/coremldata.bin DELETED
@@ -1,3 +0,0 @@
1
- version https://git-lfs.github.com/spec/v1
2
- oid sha256:f5a5fd42d16a20302798ef6ed309979b43003d2320d9f0e8ea9831a92759fb4b
3
- size 64
 
 
 
 
az-speechto-text-HF/WhisperDecoder.mlmodelc/neural_network_optionals/coremldata.bin DELETED
@@ -1,3 +0,0 @@
1
- version https://git-lfs.github.com/spec/v1
2
- oid sha256:7ea4be15c238ac4c2e874f33bd81c341776c1f1cc472ac9171e1074b39b46ab1
3
- size 40
 
 
 
 
az-speechto-text-HF/WhisperEncoder.mlmodelc/analytics/coremldata.bin DELETED
@@ -1,3 +0,0 @@
1
- version https://git-lfs.github.com/spec/v1
2
- oid sha256:244350c083b017874b49581b27fa55c8c7f0e4c358e7f180f9102cf8db016422
3
- size 482
 
 
 
 
az-speechto-text-HF/WhisperEncoder.mlmodelc/coremldata.bin DELETED
@@ -1,3 +0,0 @@
1
- version https://git-lfs.github.com/spec/v1
2
- oid sha256:fa71a7dacc43df25cefec94e78cfb13fdd28ca823b58963ee3485d346119f0c8
3
- size 290
 
 
 
 
az-speechto-text-HF/WhisperEncoder.mlmodelc/metadata.json DELETED
@@ -1,72 +0,0 @@
1
- [
2
- {
3
- "metadataOutputVersion" : "3.0",
4
- "storagePrecision" : "Float32",
5
- "outputSchema" : [
6
- {
7
- "hasShapeFlexibility" : "0",
8
- "isOptional" : "0",
9
- "dataType" : "Float32",
10
- "formattedType" : "MultiArray (Float32)",
11
- "shortDescription" : "",
12
- "shape" : "[]",
13
- "name" : "last_hidden_state",
14
- "type" : "MultiArray"
15
- }
16
- ],
17
- "modelParameters" : [
18
-
19
- ],
20
- "specificationVersion" : 4,
21
- "computePrecision" : "Float16",
22
- "isUpdatable" : "0",
23
- "stateSchema" : [
24
-
25
- ],
26
- "availability" : {
27
- "macOS" : "10.15",
28
- "tvOS" : "13.0",
29
- "visionOS" : "1.0",
30
- "watchOS" : "6.0",
31
- "iOS" : "13.0",
32
- "macCatalyst" : "13.0"
33
- },
34
- "modelType" : {
35
- "name" : "MLModelType_neuralNetwork"
36
- },
37
- "userDefinedMetadata" : {
38
- "com.github.apple.coremltools.version" : "6.3.0",
39
- "com.github.apple.coremltools.source" : "torch==2.6.0"
40
- },
41
- "inputSchema" : [
42
- {
43
- "hasShapeFlexibility" : "0",
44
- "isOptional" : "0",
45
- "dataType" : "Float32",
46
- "formattedType" : "MultiArray (Float32 1 × 80 × 3000)",
47
- "shortDescription" : "",
48
- "shape" : "[1, 80, 3000]",
49
- "name" : "input_features",
50
- "type" : "MultiArray"
51
- }
52
- ],
53
- "generatedClassName" : "WhisperEncoder",
54
- "neuralNetworkLayerTypeHistogram" : {
55
- "BatchedMatmul" : 24,
56
- "InnerProduct" : 72,
57
- "Convolution" : 2,
58
- "Gelu" : 14,
59
- "Scale" : 25,
60
- "ReshapeStatic" : 98,
61
- "Transpose" : 49,
62
- "LoadConstantND" : 1,
63
- "Squeeze" : 2,
64
- "Multiply" : 12,
65
- "Add" : 25,
66
- "ExpandDims" : 2,
67
- "SoftmaxND" : 12,
68
- "Mvn" : 25
69
- },
70
- "method" : "predict"
71
- }
72
- ]
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
az-speechto-text-HF/WhisperEncoder.mlmodelc/model.espresso.net DELETED
The diff for this file is too large to render. See raw diff
 
az-speechto-text-HF/WhisperEncoder.mlmodelc/model.espresso.shape DELETED
@@ -1,3027 +0,0 @@
1
- {
2
- "layer_shapes" : {
3
- "663" : {
4
- "k" : 1500,
5
- "w" : 64,
6
- "n" : 1,
7
- "_rank" : 4,
8
- "h" : 12
9
- },
10
- "input.83_scale_constant_in_scale" : {
11
- "k" : 1,
12
- "w" : 768,
13
- "n" : 1,
14
- "h" : 1
15
- },
16
- "hidden_states.49_mvn" : {
17
- "k" : 1500,
18
- "w" : 768,
19
- "n" : 1,
20
- "_rank" : 4,
21
- "h" : 1
22
- },
23
- "hidden_states.49_scale_mul_out" : {
24
- "k" : 1500,
25
- "w" : 768,
26
- "n" : 1,
27
- "_rank" : 4,
28
- "h" : 1
29
- },
30
- "221" : {
31
- "k" : 1500,
32
- "w" : 64,
33
- "n" : 1,
34
- "_rank" : 4,
35
- "h" : 12
36
- },
37
- "hidden_states.49_reshape" : {
38
- "k" : 1500,
39
- "w" : 768,
40
- "n" : 1,
41
- "_rank" : 4,
42
- "h" : 1
43
- },
44
- "input.131" : {
45
- "k" : 1,
46
- "w" : 3072,
47
- "n" : 1,
48
- "_rank" : 3,
49
- "h" : 1500
50
- },
51
- "input.83_scale_mul_out" : {
52
- "k" : 1500,
53
- "w" : 768,
54
- "n" : 1,
55
- "_rank" : 4,
56
- "h" : 1
57
- },
58
- "tensor.67" : {
59
- "k" : 1,
60
- "w" : 768,
61
- "n" : 1,
62
- "_rank" : 3,
63
- "h" : 1500
64
- },
65
- "hidden_states.25" : {
66
- "k" : 1,
67
- "w" : 768,
68
- "n" : 1,
69
- "_rank" : 3,
70
- "h" : 1500
71
- },
72
- "transpose_61" : {
73
- "k" : 12,
74
- "w" : 1500,
75
- "n" : 1,
76
- "_rank" : 4,
77
- "h" : 64
78
- },
79
- "hidden_states.43_mvn" : {
80
- "k" : 1500,
81
- "w" : 768,
82
- "n" : 1,
83
- "_rank" : 4,
84
- "h" : 1
85
- },
86
- "input.97" : {
87
- "k" : 12,
88
- "w" : 1500,
89
- "n" : 1,
90
- "_rank" : 4,
91
- "h" : 1500
92
- },
93
- "input.75" : {
94
- "k" : 12,
95
- "w" : 1500,
96
- "n" : 1,
97
- "_rank" : 4,
98
- "h" : 1500
99
- },
100
- "input.239" : {
101
- "k" : 1,
102
- "w" : 3072,
103
- "n" : 1,
104
- "_rank" : 3,
105
- "h" : 1500
106
- },
107
- "input.53" : {
108
- "k" : 12,
109
- "w" : 1500,
110
- "n" : 1,
111
- "_rank" : 4,
112
- "h" : 1500
113
- },
114
- "input.31" : {
115
- "k" : 12,
116
- "w" : 1500,
117
- "n" : 1,
118
- "_rank" : 4,
119
- "h" : 1500
120
- },
121
- "tensor.21" : {
122
- "k" : 1,
123
- "w" : 768,
124
- "n" : 1,
125
- "_rank" : 3,
126
- "h" : 1500
127
- },
128
- "input.17_scale_constant_in_scale" : {
129
- "k" : 1,
130
- "w" : 768,
131
- "n" : 1,
132
- "h" : 1
133
- },
134
- "hidden_states.7_reshape" : {
135
- "k" : 1500,
136
- "w" : 768,
137
- "n" : 1,
138
- "_rank" : 4,
139
- "h" : 1
140
- },
141
- "input.105" : {
142
- "k" : 1,
143
- "w" : 768,
144
- "n" : 1,
145
- "_rank" : 3,
146
- "h" : 1500
147
- },
148
- "837_scale_mul_out" : {
149
- "k" : 1500,
150
- "w" : 768,
151
- "n" : 1,
152
- "_rank" : 4,
153
- "h" : 1
154
- },
155
- "669" : {
156
- "k" : 1500,
157
- "w" : 64,
158
- "n" : 1,
159
- "_rank" : 4,
160
- "h" : 12
161
- },
162
- "input.3" : {
163
- "k" : 1,
164
- "w" : 768,
165
- "n" : 1,
166
- "_rank" : 3,
167
- "h" : 1500
168
- },
169
- "83" : {
170
- "k" : 1,
171
- "w" : 768,
172
- "n" : 1,
173
- "_rank" : 3,
174
- "h" : 1500
175
- },
176
- "input.175" : {
177
- "k" : 1,
178
- "w" : 3072,
179
- "n" : 1,
180
- "_rank" : 3,
181
- "h" : 1500
182
- },
183
- "transpose_78" : {
184
- "k" : 12,
185
- "w" : 64,
186
- "n" : 1,
187
- "_rank" : 4,
188
- "h" : 1500
189
- },
190
- "input.263" : {
191
- "k" : 1,
192
- "w" : 3072,
193
- "n" : 1,
194
- "_rank" : 3,
195
- "h" : 1500
196
- },
197
- "transpose_95" : {
198
- "k" : 12,
199
- "w" : 64,
200
- "n" : 1,
201
- "_rank" : 4,
202
- "h" : 1500
203
- },
204
- "339" : {
205
- "k" : 1,
206
- "w" : 768,
207
- "n" : 1,
208
- "_rank" : 3,
209
- "h" : 1500
210
- },
211
- "228" : {
212
- "k" : 1500,
213
- "w" : 64,
214
- "n" : 1,
215
- "_rank" : 4,
216
- "h" : 12
217
- },
218
- "tensor" : {
219
- "k" : 1,
220
- "w" : 768,
221
- "n" : 1,
222
- "_rank" : 3,
223
- "h" : 1500
224
- },
225
- "hidden_states.61_scale" : {
226
- "k" : 1500,
227
- "w" : 768,
228
- "n" : 1,
229
- "_rank" : 4,
230
- "h" : 1
231
- },
232
- "transpose_101" : {
233
- "k" : 12,
234
- "w" : 1500,
235
- "n" : 1,
236
- "_rank" : 4,
237
- "h" : 64
238
- },
239
- "87" : {
240
- "k" : 1500,
241
- "w" : 64,
242
- "n" : 1,
243
- "_rank" : 4,
244
- "h" : 12
245
- },
246
- "attn_output.17" : {
247
- "k" : 12,
248
- "w" : 64,
249
- "n" : 1,
250
- "_rank" : 4,
251
- "h" : 1500
252
- },
253
- "tensor.65" : {
254
- "k" : 1,
255
- "w" : 768,
256
- "n" : 1,
257
- "_rank" : 3,
258
- "h" : 1500
259
- },
260
- "input_features" : {
261
- "k" : 1,
262
- "w" : 3000,
263
- "n" : 1,
264
- "_rank" : 3,
265
- "h" : 80
266
- },
267
- "input.149" : {
268
- "k" : 1,
269
- "w" : 768,
270
- "n" : 1,
271
- "_rank" : 3,
272
- "h" : 1500
273
- },
274
- "input.93" : {
275
- "k" : 1,
276
- "w" : 768,
277
- "n" : 1,
278
- "_rank" : 3,
279
- "h" : 1500
280
- },
281
- "input.71" : {
282
- "k" : 1,
283
- "w" : 768,
284
- "n" : 1,
285
- "_rank" : 3,
286
- "h" : 1500
287
- },
288
- "hidden_states.49" : {
289
- "k" : 1,
290
- "w" : 768,
291
- "n" : 1,
292
- "_rank" : 3,
293
- "h" : 1500
294
- },
295
- "input.237" : {
296
- "k" : 1,
297
- "w" : 768,
298
- "n" : 1,
299
- "_rank" : 3,
300
- "h" : 1500
301
- },
302
- "input.103" : {
303
- "k" : 1,
304
- "w" : 768,
305
- "n" : 1,
306
- "_rank" : 3,
307
- "h" : 1500
308
- },
309
- "hidden_states.49_scale" : {
310
- "k" : 1500,
311
- "w" : 768,
312
- "n" : 1,
313
- "_rank" : 4,
314
- "h" : 1
315
- },
316
- "hidden_states.31_reshape" : {
317
- "k" : 1500,
318
- "w" : 768,
319
- "n" : 1,
320
- "_rank" : 4,
321
- "h" : 1
322
- },
323
- "transpose_65" : {
324
- "k" : 12,
325
- "w" : 1500,
326
- "n" : 1,
327
- "_rank" : 4,
328
- "h" : 64
329
- },
330
- "tensor.39" : {
331
- "k" : 1,
332
- "w" : 768,
333
- "n" : 1,
334
- "_rank" : 3,
335
- "h" : 1500
336
- },
337
- "transpose_82" : {
338
- "k" : 12,
339
- "w" : 64,
340
- "n" : 1,
341
- "_rank" : 4,
342
- "h" : 1500
343
- },
344
- "attn_output.5" : {
345
- "k" : 12,
346
- "w" : 64,
347
- "n" : 1,
348
- "_rank" : 4,
349
- "h" : 1500
350
- },
351
- "hidden_states.13_scale_constant_in_bias" : {
352
- "k" : 1,
353
- "w" : 768,
354
- "n" : 1,
355
- "h" : 1
356
- },
357
- "input.173" : {
358
- "k" : 1,
359
- "w" : 3072,
360
- "n" : 1,
361
- "_rank" : 3,
362
- "h" : 1500
363
- },
364
- "hidden_states.67_scale_mul_out" : {
365
- "k" : 1500,
366
- "w" : 768,
367
- "n" : 1,
368
- "_rank" : 4,
369
- "h" : 1
370
- },
371
- "input.261" : {
372
- "k" : 1,
373
- "w" : 3072,
374
- "n" : 1,
375
- "_rank" : 3,
376
- "h" : 1500
377
- },
378
- "837_scale_constant_in_bias" : {
379
- "k" : 1,
380
- "w" : 768,
381
- "n" : 1,
382
- "h" : 1
383
- },
384
- "tensor.63" : {
385
- "k" : 1,
386
- "w" : 768,
387
- "n" : 1,
388
- "_rank" : 3,
389
- "h" : 1500
390
- },
391
- "input.147" : {
392
- "k" : 1,
393
- "w" : 768,
394
- "n" : 1,
395
- "_rank" : 3,
396
- "h" : 1500
397
- },
398
- "attn_output.29" : {
399
- "k" : 12,
400
- "w" : 64,
401
- "n" : 1,
402
- "_rank" : 4,
403
- "h" : 1500
404
- },
405
- "transpose_99" : {
406
- "k" : 12,
407
- "w" : 64,
408
- "n" : 1,
409
- "_rank" : 4,
410
- "h" : 1500
411
- },
412
- "encoder.embed_positions.weight" : {
413
- "k" : 1,
414
- "w" : 768,
415
- "n" : 1,
416
- "_rank" : 2,
417
- "h" : 1500
418
- },
419
- "input.235" : {
420
- "k" : 1,
421
- "w" : 768,
422
- "n" : 1,
423
- "_rank" : 3,
424
- "h" : 1500
425
- },
426
- "343" : {
427
- "k" : 1500,
428
- "w" : 64,
429
- "n" : 1,
430
- "_rank" : 4,
431
- "h" : 12
432
- },
433
- "676" : {
434
- "k" : 1500,
435
- "w" : 64,
436
- "n" : 1,
437
- "_rank" : 4,
438
- "h" : 12
439
- },
440
- "transpose_103" : {
441
- "k" : 12,
442
- "w" : 64,
443
- "n" : 1,
444
- "_rank" : 4,
445
- "h" : 1500
446
- },
447
- "input.193_scale_constant_in_scale" : {
448
- "k" : 1,
449
- "w" : 768,
450
- "n" : 1,
451
- "h" : 1
452
- },
453
- "input.101" : {
454
- "k" : 1,
455
- "w" : 768,
456
- "n" : 1,
457
- "_rank" : 3,
458
- "h" : 1500
459
- },
460
- "hidden_states.19_reshape" : {
461
- "k" : 1500,
462
- "w" : 768,
463
- "n" : 1,
464
- "_rank" : 4,
465
- "h" : 1
466
- },
467
- "hidden_states.1_scale_mul_out" : {
468
- "k" : 1500,
469
- "w" : 768,
470
- "n" : 1,
471
- "_rank" : 4,
472
- "h" : 1
473
- },
474
- "787" : {
475
- "k" : 1,
476
- "w" : 768,
477
- "n" : 1,
478
- "_rank" : 3,
479
- "h" : 1500
480
- },
481
- "tensor.37" : {
482
- "k" : 1,
483
- "w" : 768,
484
- "n" : 1,
485
- "_rank" : 3,
486
- "h" : 1500
487
- },
488
- "input.29" : {
489
- "k" : 12,
490
- "w" : 1500,
491
- "n" : 1,
492
- "_rank" : 4,
493
- "h" : 1500
494
- },
495
- "input.209" : {
496
- "k" : 1,
497
- "w" : 768,
498
- "n" : 1,
499
- "_rank" : 3,
500
- "h" : 1500
501
- },
502
- "input" : {
503
- "k" : 1,
504
- "w" : 768,
505
- "n" : 1,
506
- "_rank" : 3,
507
- "h" : 1500
508
- },
509
- "input.149_scale_constant_in_scale" : {
510
- "k" : 1,
511
- "w" : 768,
512
- "n" : 1,
513
- "h" : 1
514
- },
515
- "input.39_mvn" : {
516
- "k" : 1500,
517
- "w" : 768,
518
- "n" : 1,
519
- "_rank" : 4,
520
- "h" : 1
521
- },
522
- "input.171" : {
523
- "k" : 1,
524
- "w" : 768,
525
- "n" : 1,
526
- "_rank" : 3,
527
- "h" : 1500
528
- },
529
- "input.215_scale_constant_in_bias" : {
530
- "k" : 1,
531
- "w" : 768,
532
- "n" : 1,
533
- "h" : 1
534
- },
535
- "transpose_69" : {
536
- "k" : 12,
537
- "w" : 1500,
538
- "n" : 1,
539
- "_rank" : 4,
540
- "h" : 64
541
- },
542
- "input.237_scale_constant_in_scale" : {
543
- "k" : 1,
544
- "w" : 768,
545
- "n" : 1,
546
- "h" : 1
547
- },
548
- "transpose_86" : {
549
- "k" : 12,
550
- "w" : 64,
551
- "n" : 1,
552
- "_rank" : 4,
553
- "h" : 1500
554
- },
555
- "input.39_scale" : {
556
- "k" : 1500,
557
- "w" : 768,
558
- "n" : 1,
559
- "_rank" : 4,
560
- "h" : 1
561
- },
562
- "input.17_scale" : {
563
- "k" : 1500,
564
- "w" : 768,
565
- "n" : 1,
566
- "_rank" : 4,
567
- "h" : 1
568
- },
569
- "hidden_states.67_scale" : {
570
- "k" : 1500,
571
- "w" : 768,
572
- "n" : 1,
573
- "_rank" : 4,
574
- "h" : 1
575
- },
576
- "hidden_states.37_scale_constant_in_scale" : {
577
- "k" : 1,
578
- "w" : 768,
579
- "n" : 1,
580
- "h" : 1
581
- },
582
- "tensor.61" : {
583
- "k" : 1,
584
- "w" : 768,
585
- "n" : 1,
586
- "_rank" : 3,
587
- "h" : 1500
588
- },
589
- "input.145" : {
590
- "k" : 1,
591
- "w" : 768,
592
- "n" : 1,
593
- "_rank" : 3,
594
- "h" : 1500
595
- },
596
- "input.149_reshape" : {
597
- "k" : 1500,
598
- "w" : 768,
599
- "n" : 1,
600
- "_rank" : 4,
601
- "h" : 1
602
- },
603
- "349" : {
604
- "k" : 1500,
605
- "w" : 64,
606
- "n" : 1,
607
- "_rank" : 4,
608
- "h" : 12
609
- },
610
- "input.233" : {
611
- "k" : 1,
612
- "w" : 768,
613
- "n" : 1,
614
- "_rank" : 3,
615
- "h" : 1500
616
- },
617
- "hidden_states.55_mvn" : {
618
- "k" : 1500,
619
- "w" : 768,
620
- "n" : 1,
621
- "_rank" : 4,
622
- "h" : 1
623
- },
624
- "hidden_states.25_scale_mul_out" : {
625
- "k" : 1500,
626
- "w" : 768,
627
- "n" : 1,
628
- "_rank" : 4,
629
- "h" : 1
630
- },
631
- "tensor.7" : {
632
- "k" : 1,
633
- "w" : 768,
634
- "n" : 1,
635
- "_rank" : 3,
636
- "h" : 1500
637
- },
638
- "tensor.35" : {
639
- "k" : 1,
640
- "w" : 768,
641
- "n" : 1,
642
- "_rank" : 3,
643
- "h" : 1500
644
- },
645
- "input.69" : {
646
- "k" : 1,
647
- "w" : 768,
648
- "n" : 1,
649
- "_rank" : 3,
650
- "h" : 1500
651
- },
652
- "input.119" : {
653
- "k" : 12,
654
- "w" : 1500,
655
- "n" : 1,
656
- "_rank" : 4,
657
- "h" : 1500
658
- },
659
- "input.47" : {
660
- "k" : 1,
661
- "w" : 768,
662
- "n" : 1,
663
- "_rank" : 3,
664
- "h" : 1500
665
- },
666
- "transpose_73" : {
667
- "k" : 12,
668
- "w" : 1500,
669
- "n" : 1,
670
- "_rank" : 4,
671
- "h" : 64
672
- },
673
- "input.25" : {
674
- "k" : 1,
675
- "w" : 768,
676
- "n" : 1,
677
- "_rank" : 3,
678
- "h" : 1500
679
- },
680
- "input.207" : {
681
- "k" : 12,
682
- "w" : 1500,
683
- "n" : 1,
684
- "_rank" : 4,
685
- "h" : 1500
686
- },
687
- "transpose_105" : {
688
- "k" : 12,
689
- "w" : 1500,
690
- "n" : 1,
691
- "_rank" : 4,
692
- "h" : 64
693
- },
694
- "transpose_90" : {
695
- "k" : 12,
696
- "w" : 64,
697
- "n" : 1,
698
- "_rank" : 4,
699
- "h" : 1500
700
- },
701
- "791" : {
702
- "k" : 1500,
703
- "w" : 64,
704
- "n" : 1,
705
- "_rank" : 4,
706
- "h" : 12
707
- },
708
- "input.127_mvn" : {
709
- "k" : 1500,
710
- "w" : 768,
711
- "n" : 1,
712
- "_rank" : 4,
713
- "h" : 1
714
- },
715
- "hidden_states.49_scale_constant_in_scale" : {
716
- "k" : 1,
717
- "w" : 768,
718
- "n" : 1,
719
- "h" : 1
720
- },
721
- "input.189" : {
722
- "k" : 1,
723
- "w" : 768,
724
- "n" : 1,
725
- "_rank" : 3,
726
- "h" : 1500
727
- },
728
- "93" : {
729
- "k" : 1500,
730
- "w" : 64,
731
- "n" : 1,
732
- "_rank" : 4,
733
- "h" : 12
734
- },
735
- "hidden_states.19" : {
736
- "k" : 1,
737
- "w" : 768,
738
- "n" : 1,
739
- "_rank" : 3,
740
- "h" : 1500
741
- },
742
- "605" : {
743
- "k" : 1500,
744
- "w" : 64,
745
- "n" : 1,
746
- "_rank" : 4,
747
- "h" : 12
748
- },
749
- "hidden_states.13_scale_constant_in_scale" : {
750
- "k" : 1,
751
- "w" : 768,
752
- "n" : 1,
753
- "h" : 1
754
- },
755
- "input.143" : {
756
- "k" : 1,
757
- "w" : 768,
758
- "n" : 1,
759
- "_rank" : 3,
760
- "h" : 1500
761
- },
762
- "hidden_states.31_scale_constant_in_bias" : {
763
- "k" : 1,
764
- "w" : 768,
765
- "n" : 1,
766
- "h" : 1
767
- },
768
- "transpose_60" : {
769
- "k" : 1500,
770
- "w" : 64,
771
- "n" : 1,
772
- "_rank" : 4,
773
- "h" : 12
774
- },
775
- "input.231" : {
776
- "k" : 1,
777
- "w" : 768,
778
- "n" : 1,
779
- "_rank" : 3,
780
- "h" : 1500
781
- },
782
- "hidden_states.43_reshape" : {
783
- "k" : 1500,
784
- "w" : 768,
785
- "n" : 1,
786
- "_rank" : 4,
787
- "h" : 1
788
- },
789
- "attn_output.9" : {
790
- "k" : 12,
791
- "w" : 64,
792
- "n" : 1,
793
- "_rank" : 4,
794
- "h" : 1500
795
- },
796
- "tensor.3" : {
797
- "k" : 1,
798
- "w" : 768,
799
- "n" : 1,
800
- "_rank" : 3,
801
- "h" : 1500
802
- },
803
- "input.87" : {
804
- "k" : 1,
805
- "w" : 3072,
806
- "n" : 1,
807
- "_rank" : 3,
808
- "h" : 1500
809
- },
810
- "tensor.33" : {
811
- "k" : 1,
812
- "w" : 768,
813
- "n" : 1,
814
- "_rank" : 3,
815
- "h" : 1500
816
- },
817
- "input.65" : {
818
- "k" : 1,
819
- "w" : 3072,
820
- "n" : 1,
821
- "_rank" : 3,
822
- "h" : 1500
823
- },
824
- "input.43" : {
825
- "k" : 1,
826
- "w" : 3072,
827
- "n" : 1,
828
- "_rank" : 3,
829
- "h" : 1500
830
- },
831
- "input.117" : {
832
- "k" : 12,
833
- "w" : 1500,
834
- "n" : 1,
835
- "_rank" : 4,
836
- "h" : 1500
837
- },
838
- "input.21" : {
839
- "k" : 1,
840
- "w" : 3072,
841
- "n" : 1,
842
- "_rank" : 3,
843
- "h" : 1500
844
- },
845
- "797" : {
846
- "k" : 1500,
847
- "w" : 64,
848
- "n" : 1,
849
- "_rank" : 4,
850
- "h" : 12
851
- },
852
- "input.205" : {
853
- "k" : 12,
854
- "w" : 1500,
855
- "n" : 1,
856
- "_rank" : 4,
857
- "h" : 1500
858
- },
859
- "input.61_mvn" : {
860
- "k" : 1500,
861
- "w" : 768,
862
- "n" : 1,
863
- "_rank" : 4,
864
- "h" : 1
865
- },
866
- "hidden_states.67_scale_constant_in_bias" : {
867
- "k" : 1,
868
- "w" : 768,
869
- "n" : 1,
870
- "h" : 1
871
- },
872
- "input.187" : {
873
- "k" : 1,
874
- "w" : 768,
875
- "n" : 1,
876
- "_rank" : 3,
877
- "h" : 1500
878
- },
879
- "transpose_77" : {
880
- "k" : 12,
881
- "w" : 1500,
882
- "n" : 1,
883
- "_rank" : 4,
884
- "h" : 64
885
- },
886
- "hidden_states.25_scale_constant_in_scale" : {
887
- "k" : 1,
888
- "w" : 768,
889
- "n" : 1,
890
- "h" : 1
891
- },
892
- "transpose_107" : {
893
- "k" : 12,
894
- "w" : 64,
895
- "n" : 1,
896
- "_rank" : 4,
897
- "h" : 1500
898
- },
899
- "hidden_states.49_scale_constant_in_bias" : {
900
- "k" : 1,
901
- "w" : 768,
902
- "n" : 1,
903
- "h" : 1
904
- },
905
- "transpose_94" : {
906
- "k" : 12,
907
- "w" : 64,
908
- "n" : 1,
909
- "_rank" : 4,
910
- "h" : 1500
911
- },
912
- "467" : {
913
- "k" : 1,
914
- "w" : 768,
915
- "n" : 1,
916
- "_rank" : 3,
917
- "h" : 1500
918
- },
919
- "356" : {
920
- "k" : 1500,
921
- "w" : 64,
922
- "n" : 1,
923
- "_rank" : 4,
924
- "h" : 12
925
- },
926
- "input.141" : {
927
- "k" : 12,
928
- "w" : 1500,
929
- "n" : 1,
930
- "_rank" : 4,
931
- "h" : 1500
932
- },
933
- "input.193_reshape" : {
934
- "k" : 1500,
935
- "w" : 768,
936
- "n" : 1,
937
- "_rank" : 4,
938
- "h" : 1
939
- },
940
- "hidden_states.43_scale_mul_out" : {
941
- "k" : 1500,
942
- "w" : 768,
943
- "n" : 1,
944
- "_rank" : 4,
945
- "h" : 1
946
- },
947
- "input.83" : {
948
- "k" : 1,
949
- "w" : 768,
950
- "n" : 1,
951
- "_rank" : 3,
952
- "h" : 1500
953
- },
954
- "input.249" : {
955
- "k" : 12,
956
- "w" : 1500,
957
- "n" : 1,
958
- "_rank" : 4,
959
- "h" : 1500
960
- },
961
- "input.61" : {
962
- "k" : 1,
963
- "w" : 768,
964
- "n" : 1,
965
- "_rank" : 3,
966
- "h" : 1500
967
- },
968
- "tensor.31" : {
969
- "k" : 1,
970
- "w" : 768,
971
- "n" : 1,
972
- "_rank" : 3,
973
- "h" : 1500
974
- },
975
- "input.115" : {
976
- "k" : 1,
977
- "w" : 768,
978
- "n" : 1,
979
- "_rank" : 3,
980
- "h" : 1500
981
- },
982
- "transpose_64" : {
983
- "k" : 1500,
984
- "w" : 64,
985
- "n" : 1,
986
- "_rank" : 4,
987
- "h" : 12
988
- },
989
- "hidden_states.1_mvn" : {
990
- "k" : 1500,
991
- "w" : 768,
992
- "n" : 1,
993
- "_rank" : 4,
994
- "h" : 1
995
- },
996
- "input.203" : {
997
- "k" : 1,
998
- "w" : 768,
999
- "n" : 1,
1000
- "_rank" : 3,
1001
- "h" : 1500
1002
- },
1003
- "transpose_81" : {
1004
- "k" : 12,
1005
- "w" : 1500,
1006
- "n" : 1,
1007
- "_rank" : 4,
1008
- "h" : 64
1009
- },
1010
- "hidden_states.43" : {
1011
- "k" : 1,
1012
- "w" : 768,
1013
- "n" : 1,
1014
- "_rank" : 3,
1015
- "h" : 1500
1016
- },
1017
- "723" : {
1018
- "k" : 1,
1019
- "w" : 768,
1020
- "n" : 1,
1021
- "_rank" : 3,
1022
- "h" : 1500
1023
- },
1024
- "612" : {
1025
- "k" : 1500,
1026
- "w" : 64,
1027
- "n" : 1,
1028
- "_rank" : 4,
1029
- "h" : 12
1030
- },
1031
- "input.185" : {
1032
- "k" : 12,
1033
- "w" : 1500,
1034
- "n" : 1,
1035
- "_rank" : 4,
1036
- "h" : 1500
1037
- },
1038
- "input.193_scale_mul_out" : {
1039
- "k" : 1500,
1040
- "w" : 768,
1041
- "n" : 1,
1042
- "_rank" : 4,
1043
- "h" : 1
1044
- },
1045
- "hidden_states.13_scale" : {
1046
- "k" : 1500,
1047
- "w" : 768,
1048
- "n" : 1,
1049
- "_rank" : 4,
1050
- "h" : 1
1051
- },
1052
- "input.159" : {
1053
- "k" : 1,
1054
- "w" : 768,
1055
- "n" : 1,
1056
- "_rank" : 3,
1057
- "h" : 1500
1058
- },
1059
- "input.127_reshape" : {
1060
- "k" : 1500,
1061
- "w" : 768,
1062
- "n" : 1,
1063
- "_rank" : 4,
1064
- "h" : 1
1065
- },
1066
- "transpose_98" : {
1067
- "k" : 12,
1068
- "w" : 64,
1069
- "n" : 1,
1070
- "_rank" : 4,
1071
- "h" : 1500
1072
- },
1073
- "hidden_states.67_mvn" : {
1074
- "k" : 1500,
1075
- "w" : 768,
1076
- "n" : 1,
1077
- "_rank" : 4,
1078
- "h" : 1
1079
- },
1080
- "input.247" : {
1081
- "k" : 1,
1082
- "w" : 768,
1083
- "n" : 1,
1084
- "_rank" : 3,
1085
- "h" : 1500
1086
- },
1087
- "471" : {
1088
- "k" : 1500,
1089
- "w" : 64,
1090
- "n" : 1,
1091
- "_rank" : 4,
1092
- "h" : 12
1093
- },
1094
- "attn_output.41" : {
1095
- "k" : 12,
1096
- "w" : 64,
1097
- "n" : 1,
1098
- "_rank" : 4,
1099
- "h" : 1500
1100
- },
1101
- "727" : {
1102
- "k" : 1500,
1103
- "w" : 64,
1104
- "n" : 1,
1105
- "_rank" : 4,
1106
- "h" : 12
1107
- },
1108
- "input.113" : {
1109
- "k" : 1,
1110
- "w" : 768,
1111
- "n" : 1,
1112
- "_rank" : 3,
1113
- "h" : 1500
1114
- },
1115
- "input.215_mvn" : {
1116
- "k" : 1500,
1117
- "w" : 768,
1118
- "n" : 1,
1119
- "_rank" : 4,
1120
- "h" : 1
1121
- },
1122
- "tensor.49" : {
1123
- "k" : 1,
1124
- "w" : 768,
1125
- "n" : 1,
1126
- "_rank" : 3,
1127
- "h" : 1500
1128
- },
1129
- "input.201" : {
1130
- "k" : 1,
1131
- "w" : 768,
1132
- "n" : 1,
1133
- "_rank" : 3,
1134
- "h" : 1500
1135
- },
1136
- "hidden_states.61_mvn" : {
1137
- "k" : 1500,
1138
- "w" : 768,
1139
- "n" : 1,
1140
- "_rank" : 4,
1141
- "h" : 1
1142
- },
1143
- "input.19" : {
1144
- "k" : 1,
1145
- "w" : 3072,
1146
- "n" : 1,
1147
- "_rank" : 3,
1148
- "h" : 1500
1149
- },
1150
- "hidden_states.67" : {
1151
- "k" : 1,
1152
- "w" : 768,
1153
- "n" : 1,
1154
- "_rank" : 3,
1155
- "h" : 1500
1156
- },
1157
- "input.83_scale" : {
1158
- "k" : 1500,
1159
- "w" : 768,
1160
- "n" : 1,
1161
- "_rank" : 4,
1162
- "h" : 1
1163
- },
1164
- "input.61_scale" : {
1165
- "k" : 1500,
1166
- "w" : 768,
1167
- "n" : 1,
1168
- "_rank" : 4,
1169
- "h" : 1
1170
- },
1171
- "input.183" : {
1172
- "k" : 12,
1173
- "w" : 1500,
1174
- "n" : 1,
1175
- "_rank" : 4,
1176
- "h" : 1500
1177
- },
1178
- "hidden_states.61_scale_constant_in_scale" : {
1179
- "k" : 1,
1180
- "w" : 768,
1181
- "n" : 1,
1182
- "h" : 1
1183
- },
1184
- "transpose_68" : {
1185
- "k" : 1500,
1186
- "w" : 64,
1187
- "n" : 1,
1188
- "_rank" : 4,
1189
- "h" : 12
1190
- },
1191
- "transpose_85" : {
1192
- "k" : 12,
1193
- "w" : 1500,
1194
- "n" : 1,
1195
- "_rank" : 4,
1196
- "h" : 64
1197
- },
1198
- "hidden_states.55_reshape" : {
1199
- "k" : 1500,
1200
- "w" : 768,
1201
- "n" : 1,
1202
- "_rank" : 4,
1203
- "h" : 1
1204
- },
1205
- "input.157" : {
1206
- "k" : 1,
1207
- "w" : 768,
1208
- "n" : 1,
1209
- "_rank" : 3,
1210
- "h" : 1500
1211
- },
1212
- "477" : {
1213
- "k" : 1500,
1214
- "w" : 64,
1215
- "n" : 1,
1216
- "_rank" : 4,
1217
- "h" : 12
1218
- },
1219
- "input.245" : {
1220
- "k" : 1,
1221
- "w" : 768,
1222
- "n" : 1,
1223
- "_rank" : 3,
1224
- "h" : 1500
1225
- },
1226
- "tensor.47" : {
1227
- "k" : 1,
1228
- "w" : 768,
1229
- "n" : 1,
1230
- "_rank" : 3,
1231
- "h" : 1500
1232
- },
1233
- "transpose_72" : {
1234
- "k" : 1500,
1235
- "w" : 64,
1236
- "n" : 1,
1237
- "_rank" : 4,
1238
- "h" : 12
1239
- },
1240
- "input.59" : {
1241
- "k" : 1,
1242
- "w" : 768,
1243
- "n" : 1,
1244
- "_rank" : 3,
1245
- "h" : 1500
1246
- },
1247
- "147" : {
1248
- "k" : 1,
1249
- "w" : 768,
1250
- "n" : 1,
1251
- "_rank" : 3,
1252
- "h" : 1500
1253
- },
1254
- "input.37" : {
1255
- "k" : 1,
1256
- "w" : 768,
1257
- "n" : 1,
1258
- "_rank" : 3,
1259
- "h" : 1500
1260
- },
1261
- "input.219" : {
1262
- "k" : 1,
1263
- "w" : 3072,
1264
- "n" : 1,
1265
- "_rank" : 3,
1266
- "h" : 1500
1267
- },
1268
- "input.15" : {
1269
- "k" : 1,
1270
- "w" : 768,
1271
- "n" : 1,
1272
- "_rank" : 3,
1273
- "h" : 1500
1274
- },
1275
- "hidden_states.31_scale" : {
1276
- "k" : 1500,
1277
- "w" : 768,
1278
- "n" : 1,
1279
- "_rank" : 4,
1280
- "h" : 1
1281
- },
1282
- "hidden_states.19_mvn" : {
1283
- "k" : 1500,
1284
- "w" : 768,
1285
- "n" : 1,
1286
- "_rank" : 4,
1287
- "h" : 1
1288
- },
1289
- "input.181" : {
1290
- "k" : 1,
1291
- "w" : 768,
1292
- "n" : 1,
1293
- "_rank" : 3,
1294
- "h" : 1500
1295
- },
1296
- "input.39_scale_constant_in_scale" : {
1297
- "k" : 1,
1298
- "w" : 768,
1299
- "n" : 1,
1300
- "h" : 1
1301
- },
1302
- "input.215_scale" : {
1303
- "k" : 1500,
1304
- "w" : 768,
1305
- "n" : 1,
1306
- "_rank" : 4,
1307
- "h" : 1
1308
- },
1309
- "733" : {
1310
- "k" : 1500,
1311
- "w" : 64,
1312
- "n" : 1,
1313
- "_rank" : 4,
1314
- "h" : 12
1315
- },
1316
- "input.171_scale_constant_in_scale" : {
1317
- "k" : 1,
1318
- "w" : 768,
1319
- "n" : 1,
1320
- "h" : 1
1321
- },
1322
- "hidden_states.19_scale" : {
1323
- "k" : 1500,
1324
- "w" : 768,
1325
- "n" : 1,
1326
- "_rank" : 4,
1327
- "h" : 1
1328
- },
1329
- "hidden_states.13_mvn" : {
1330
- "k" : 1500,
1331
- "w" : 768,
1332
- "n" : 1,
1333
- "_rank" : 4,
1334
- "h" : 1
1335
- },
1336
- "input.149_mvn" : {
1337
- "k" : 1500,
1338
- "w" : 768,
1339
- "n" : 1,
1340
- "_rank" : 4,
1341
- "h" : 1
1342
- },
1343
- "transpose_89" : {
1344
- "k" : 12,
1345
- "w" : 1500,
1346
- "n" : 1,
1347
- "_rank" : 4,
1348
- "h" : 64
1349
- },
1350
- "input.237_scale" : {
1351
- "k" : 1500,
1352
- "w" : 768,
1353
- "n" : 1,
1354
- "_rank" : 4,
1355
- "h" : 1
1356
- },
1357
- "input.171_reshape" : {
1358
- "k" : 1500,
1359
- "w" : 768,
1360
- "n" : 1,
1361
- "_rank" : 4,
1362
- "h" : 1
1363
- },
1364
- "hidden_states.13" : {
1365
- "k" : 1,
1366
- "w" : 768,
1367
- "n" : 1,
1368
- "_rank" : 3,
1369
- "h" : 1500
1370
- },
1371
- "input.105_scale" : {
1372
- "k" : 1500,
1373
- "w" : 768,
1374
- "n" : 1,
1375
- "_rank" : 4,
1376
- "h" : 1
1377
- },
1378
- "input.171_scale_mul_out" : {
1379
- "k" : 1500,
1380
- "w" : 768,
1381
- "n" : 1,
1382
- "_rank" : 4,
1383
- "h" : 1
1384
- },
1385
- "input.127_scale_constant_in_scale" : {
1386
- "k" : 1,
1387
- "w" : 768,
1388
- "n" : 1,
1389
- "h" : 1
1390
- },
1391
- "hidden_states.19_scale_mul_out" : {
1392
- "k" : 1500,
1393
- "w" : 768,
1394
- "n" : 1,
1395
- "_rank" : 4,
1396
- "h" : 1
1397
- },
1398
- "403" : {
1399
- "k" : 1,
1400
- "w" : 768,
1401
- "n" : 1,
1402
- "_rank" : 3,
1403
- "h" : 1500
1404
- },
1405
- "tensor.45" : {
1406
- "k" : 1,
1407
- "w" : 768,
1408
- "n" : 1,
1409
- "_rank" : 3,
1410
- "h" : 1500
1411
- },
1412
- "input.99" : {
1413
- "k" : 1,
1414
- "w" : 768,
1415
- "n" : 1,
1416
- "_rank" : 3,
1417
- "h" : 1500
1418
- },
1419
- "input.149_scale_constant_in_bias" : {
1420
- "k" : 1,
1421
- "w" : 768,
1422
- "n" : 1,
1423
- "h" : 1
1424
- },
1425
- "input.193_scale_constant_in_bias" : {
1426
- "k" : 1,
1427
- "w" : 768,
1428
- "n" : 1,
1429
- "h" : 1
1430
- },
1431
- "52" : {
1432
- "k" : 1,
1433
- "w" : 3000,
1434
- "n" : 1,
1435
- "_rank" : 3,
1436
- "h" : 768
1437
- },
1438
- "input.129" : {
1439
- "k" : 1,
1440
- "w" : 3072,
1441
- "n" : 1,
1442
- "_rank" : 3,
1443
- "h" : 1500
1444
- },
1445
- "input.55" : {
1446
- "k" : 1,
1447
- "w" : 768,
1448
- "n" : 1,
1449
- "_rank" : 3,
1450
- "h" : 1500
1451
- },
1452
- "input.33" : {
1453
- "k" : 1,
1454
- "w" : 768,
1455
- "n" : 1,
1456
- "_rank" : 3,
1457
- "h" : 1500
1458
- },
1459
- "input.39_scale_constant_in_bias" : {
1460
- "k" : 1,
1461
- "w" : 768,
1462
- "n" : 1,
1463
- "h" : 1
1464
- },
1465
- "input.77" : {
1466
- "k" : 1,
1467
- "w" : 768,
1468
- "n" : 1,
1469
- "_rank" : 3,
1470
- "h" : 1500
1471
- },
1472
- "input.217" : {
1473
- "k" : 1,
1474
- "w" : 3072,
1475
- "n" : 1,
1476
- "_rank" : 3,
1477
- "h" : 1500
1478
- },
1479
- "hidden_states.25_scale_constant_in_bias" : {
1480
- "k" : 1,
1481
- "w" : 768,
1482
- "n" : 1,
1483
- "h" : 1
1484
- },
1485
- "input.127_scale" : {
1486
- "k" : 1500,
1487
- "w" : 768,
1488
- "n" : 1,
1489
- "_rank" : 4,
1490
- "h" : 1
1491
- },
1492
- "input.215_scale_constant_in_scale" : {
1493
- "k" : 1,
1494
- "w" : 768,
1495
- "n" : 1,
1496
- "h" : 1
1497
- },
1498
- "input.11" : {
1499
- "k" : 1,
1500
- "w" : 768,
1501
- "n" : 1,
1502
- "_rank" : 3,
1503
- "h" : 1500
1504
- },
1505
- "input.259_scale" : {
1506
- "k" : 1500,
1507
- "w" : 768,
1508
- "n" : 1,
1509
- "_rank" : 4,
1510
- "h" : 1
1511
- },
1512
- "837_reshape" : {
1513
- "k" : 1500,
1514
- "w" : 768,
1515
- "n" : 1,
1516
- "_rank" : 4,
1517
- "h" : 1
1518
- },
1519
- "tensor.19" : {
1520
- "k" : 1,
1521
- "w" : 768,
1522
- "n" : 1,
1523
- "_rank" : 3,
1524
- "h" : 1500
1525
- },
1526
- "input.7" : {
1527
- "k" : 12,
1528
- "w" : 1500,
1529
- "n" : 1,
1530
- "_rank" : 4,
1531
- "h" : 1500
1532
- },
1533
- "transpose_76" : {
1534
- "k" : 1500,
1535
- "w" : 64,
1536
- "n" : 1,
1537
- "_rank" : 4,
1538
- "h" : 12
1539
- },
1540
- "input.259_reshape" : {
1541
- "k" : 1500,
1542
- "w" : 768,
1543
- "n" : 1,
1544
- "_rank" : 4,
1545
- "h" : 1
1546
- },
1547
- "transpose_93" : {
1548
- "k" : 12,
1549
- "w" : 1500,
1550
- "n" : 1,
1551
- "_rank" : 4,
1552
- "h" : 64
1553
- },
1554
- "595" : {
1555
- "k" : 1,
1556
- "w" : 768,
1557
- "n" : 1,
1558
- "_rank" : 3,
1559
- "h" : 1500
1560
- },
1561
- "151" : {
1562
- "k" : 1500,
1563
- "w" : 64,
1564
- "n" : 1,
1565
- "_rank" : 4,
1566
- "h" : 12
1567
- },
1568
- "407" : {
1569
- "k" : 1500,
1570
- "w" : 64,
1571
- "n" : 1,
1572
- "_rank" : 4,
1573
- "h" : 12
1574
- },
1575
- "484" : {
1576
- "k" : 1500,
1577
- "w" : 64,
1578
- "n" : 1,
1579
- "_rank" : 4,
1580
- "h" : 12
1581
- },
1582
- "input.149_scale" : {
1583
- "k" : 1500,
1584
- "w" : 768,
1585
- "n" : 1,
1586
- "_rank" : 4,
1587
- "h" : 1
1588
- },
1589
- "transpose_100" : {
1590
- "k" : 1500,
1591
- "w" : 64,
1592
- "n" : 1,
1593
- "_rank" : 4,
1594
- "h" : 12
1595
- },
1596
- "hidden_states.7_scale_constant_in_bias" : {
1597
- "k" : 1,
1598
- "w" : 768,
1599
- "n" : 1,
1600
- "h" : 1
1601
- },
1602
- "input.171_mvn" : {
1603
- "k" : 1500,
1604
- "w" : 768,
1605
- "n" : 1,
1606
- "_rank" : 4,
1607
- "h" : 1
1608
- },
1609
- "input.153" : {
1610
- "k" : 1,
1611
- "w" : 3072,
1612
- "n" : 1,
1613
- "_rank" : 3,
1614
- "h" : 1500
1615
- },
1616
- "hidden_states.13_reshape" : {
1617
- "k" : 1500,
1618
- "w" : 768,
1619
- "n" : 1,
1620
- "_rank" : 4,
1621
- "h" : 1
1622
- },
1623
- "input.241" : {
1624
- "k" : 1,
1625
- "w" : 3072,
1626
- "n" : 1,
1627
- "_rank" : 3,
1628
- "h" : 1500
1629
- },
1630
- "hidden_states.7_scale_mul_out" : {
1631
- "k" : 1500,
1632
- "w" : 768,
1633
- "n" : 1,
1634
- "_rank" : 4,
1635
- "h" : 1
1636
- },
1637
- "attn_output.21" : {
1638
- "k" : 12,
1639
- "w" : 64,
1640
- "n" : 1,
1641
- "_rank" : 4,
1642
- "h" : 1500
1643
- },
1644
- "input.83_mvn" : {
1645
- "k" : 1500,
1646
- "w" : 768,
1647
- "n" : 1,
1648
- "_rank" : 4,
1649
- "h" : 1
1650
- },
1651
- "input.105_reshape" : {
1652
- "k" : 1500,
1653
- "w" : 768,
1654
- "n" : 1,
1655
- "_rank" : 4,
1656
- "h" : 1
1657
- },
1658
- "hidden_states.37" : {
1659
- "k" : 1,
1660
- "w" : 768,
1661
- "n" : 1,
1662
- "_rank" : 3,
1663
- "h" : 1500
1664
- },
1665
- "input.95" : {
1666
- "k" : 12,
1667
- "w" : 1500,
1668
- "n" : 1,
1669
- "_rank" : 4,
1670
- "h" : 1500
1671
- },
1672
- "tensor.43" : {
1673
- "k" : 1,
1674
- "w" : 768,
1675
- "n" : 1,
1676
- "_rank" : 3,
1677
- "h" : 1500
1678
- },
1679
- "input.73" : {
1680
- "k" : 12,
1681
- "w" : 1500,
1682
- "n" : 1,
1683
- "_rank" : 4,
1684
- "h" : 1500
1685
- },
1686
- "input.259_scale_mul_out" : {
1687
- "k" : 1500,
1688
- "w" : 768,
1689
- "n" : 1,
1690
- "_rank" : 4,
1691
- "h" : 1
1692
- },
1693
- "input.127" : {
1694
- "k" : 1,
1695
- "w" : 768,
1696
- "n" : 1,
1697
- "_rank" : 3,
1698
- "h" : 1500
1699
- },
1700
- "input.51" : {
1701
- "k" : 12,
1702
- "w" : 1500,
1703
- "n" : 1,
1704
- "_rank" : 4,
1705
- "h" : 1500
1706
- },
1707
- "transpose_63" : {
1708
- "k" : 12,
1709
- "w" : 64,
1710
- "n" : 1,
1711
- "_rank" : 4,
1712
- "h" : 1500
1713
- },
1714
- "599" : {
1715
- "k" : 1500,
1716
- "w" : 64,
1717
- "n" : 1,
1718
- "_rank" : 4,
1719
- "h" : 12
1720
- },
1721
- "transpose_80" : {
1722
- "k" : 1500,
1723
- "w" : 64,
1724
- "n" : 1,
1725
- "_rank" : 4,
1726
- "h" : 12
1727
- },
1728
- "input.215" : {
1729
- "k" : 1,
1730
- "w" : 768,
1731
- "n" : 1,
1732
- "_rank" : 3,
1733
- "h" : 1500
1734
- },
1735
- "input.61_scale_constant_in_scale" : {
1736
- "k" : 1,
1737
- "w" : 768,
1738
- "n" : 1,
1739
- "h" : 1
1740
- },
1741
- "hidden_states.37_scale" : {
1742
- "k" : 1500,
1743
- "w" : 768,
1744
- "n" : 1,
1745
- "_rank" : 4,
1746
- "h" : 1
1747
- },
1748
- "hidden_states.67_reshape" : {
1749
- "k" : 1500,
1750
- "w" : 768,
1751
- "n" : 1,
1752
- "_rank" : 4,
1753
- "h" : 1
1754
- },
1755
- "hidden_states.61_scale_mul_out" : {
1756
- "k" : 1500,
1757
- "w" : 768,
1758
- "n" : 1,
1759
- "_rank" : 4,
1760
- "h" : 1
1761
- },
1762
- "740" : {
1763
- "k" : 1500,
1764
- "w" : 64,
1765
- "n" : 1,
1766
- "_rank" : 4,
1767
- "h" : 12
1768
- },
1769
- "tensor.17" : {
1770
- "k" : 1,
1771
- "w" : 768,
1772
- "n" : 1,
1773
- "_rank" : 3,
1774
- "h" : 1500
1775
- },
1776
- "157" : {
1777
- "k" : 1500,
1778
- "w" : 64,
1779
- "n" : 1,
1780
- "_rank" : 4,
1781
- "h" : 12
1782
- },
1783
- "input.197" : {
1784
- "k" : 1,
1785
- "w" : 3072,
1786
- "n" : 1,
1787
- "_rank" : 3,
1788
- "h" : 1500
1789
- },
1790
- "input.151" : {
1791
- "k" : 1,
1792
- "w" : 3072,
1793
- "n" : 1,
1794
- "_rank" : 3,
1795
- "h" : 1500
1796
- },
1797
- "transpose_97" : {
1798
- "k" : 12,
1799
- "w" : 1500,
1800
- "n" : 1,
1801
- "_rank" : 4,
1802
- "h" : 64
1803
- },
1804
- "input.83_scale_constant_in_bias" : {
1805
- "k" : 1,
1806
- "w" : 768,
1807
- "n" : 1,
1808
- "h" : 1
1809
- },
1810
- "hidden_states.37_scale_mul_out" : {
1811
- "k" : 1500,
1812
- "w" : 768,
1813
- "n" : 1,
1814
- "_rank" : 4,
1815
- "h" : 1
1816
- },
1817
- "input.259" : {
1818
- "k" : 1,
1819
- "w" : 768,
1820
- "n" : 1,
1821
- "_rank" : 3,
1822
- "h" : 1500
1823
- },
1824
- "attn_output.33" : {
1825
- "k" : 12,
1826
- "w" : 64,
1827
- "n" : 1,
1828
- "_rank" : 4,
1829
- "h" : 1500
1830
- },
1831
- "input.91" : {
1832
- "k" : 1,
1833
- "w" : 768,
1834
- "n" : 1,
1835
- "_rank" : 3,
1836
- "h" : 1500
1837
- },
1838
- "transpose_102" : {
1839
- "k" : 12,
1840
- "w" : 64,
1841
- "n" : 1,
1842
- "_rank" : 4,
1843
- "h" : 1500
1844
- },
1845
- "tensor.41" : {
1846
- "k" : 1,
1847
- "w" : 768,
1848
- "n" : 1,
1849
- "_rank" : 3,
1850
- "h" : 1500
1851
- },
1852
- "input.125" : {
1853
- "k" : 1,
1854
- "w" : 768,
1855
- "n" : 1,
1856
- "_rank" : 3,
1857
- "h" : 1500
1858
- },
1859
- "input.213" : {
1860
- "k" : 1,
1861
- "w" : 768,
1862
- "n" : 1,
1863
- "_rank" : 3,
1864
- "h" : 1500
1865
- },
1866
- "413" : {
1867
- "k" : 1500,
1868
- "w" : 64,
1869
- "n" : 1,
1870
- "_rank" : 4,
1871
- "h" : 12
1872
- },
1873
- "hidden_states.61_scale_constant_in_bias" : {
1874
- "k" : 1,
1875
- "w" : 768,
1876
- "n" : 1,
1877
- "h" : 1
1878
- },
1879
- "tensor.15" : {
1880
- "k" : 1,
1881
- "w" : 768,
1882
- "n" : 1,
1883
- "_rank" : 3,
1884
- "h" : 1500
1885
- },
1886
- "hidden_states.1_scale" : {
1887
- "k" : 1500,
1888
- "w" : 768,
1889
- "n" : 1,
1890
- "_rank" : 4,
1891
- "h" : 1
1892
- },
1893
- "transpose_67" : {
1894
- "k" : 12,
1895
- "w" : 64,
1896
- "n" : 1,
1897
- "_rank" : 4,
1898
- "h" : 1500
1899
- },
1900
- "input.195" : {
1901
- "k" : 1,
1902
- "w" : 3072,
1903
- "n" : 1,
1904
- "_rank" : 3,
1905
- "h" : 1500
1906
- },
1907
- "input.237_mvn" : {
1908
- "k" : 1500,
1909
- "w" : 768,
1910
- "n" : 1,
1911
- "_rank" : 4,
1912
- "h" : 1
1913
- },
1914
- "input.83_reshape" : {
1915
- "k" : 1500,
1916
- "w" : 768,
1917
- "n" : 1,
1918
- "_rank" : 4,
1919
- "h" : 1
1920
- },
1921
- "transpose_84" : {
1922
- "k" : 1500,
1923
- "w" : 64,
1924
- "n" : 1,
1925
- "_rank" : 4,
1926
- "h" : 12
1927
- },
1928
- "hidden_states.43_scale_constant_in_bias" : {
1929
- "k" : 1,
1930
- "w" : 768,
1931
- "n" : 1,
1932
- "h" : 1
1933
- },
1934
- "input.127_scale_mul_out" : {
1935
- "k" : 1500,
1936
- "w" : 768,
1937
- "n" : 1,
1938
- "_rank" : 4,
1939
- "h" : 1
1940
- },
1941
- "hidden_states.61" : {
1942
- "k" : 1,
1943
- "w" : 768,
1944
- "n" : 1,
1945
- "_rank" : 3,
1946
- "h" : 1500
1947
- },
1948
- "hidden_states.25_mvn" : {
1949
- "k" : 1500,
1950
- "w" : 768,
1951
- "n" : 1,
1952
- "_rank" : 4,
1953
- "h" : 1
1954
- },
1955
- "input.169" : {
1956
- "k" : 1,
1957
- "w" : 768,
1958
- "n" : 1,
1959
- "_rank" : 3,
1960
- "h" : 1500
1961
- },
1962
- "hidden_states.55_scale" : {
1963
- "k" : 1500,
1964
- "w" : 768,
1965
- "n" : 1,
1966
- "_rank" : 4,
1967
- "h" : 1
1968
- },
1969
- "input.17_scale_mul_out" : {
1970
- "k" : 1500,
1971
- "w" : 768,
1972
- "n" : 1,
1973
- "_rank" : 4,
1974
- "h" : 1
1975
- },
1976
- "input.257" : {
1977
- "k" : 1,
1978
- "w" : 768,
1979
- "n" : 1,
1980
- "_rank" : 3,
1981
- "h" : 1500
1982
- },
1983
- "input.149_scale_mul_out" : {
1984
- "k" : 1500,
1985
- "w" : 768,
1986
- "n" : 1,
1987
- "_rank" : 4,
1988
- "h" : 1
1989
- },
1990
- "input.123" : {
1991
- "k" : 1,
1992
- "w" : 768,
1993
- "n" : 1,
1994
- "_rank" : 3,
1995
- "h" : 1500
1996
- },
1997
- "attn_output.45" : {
1998
- "k" : 12,
1999
- "w" : 64,
2000
- "n" : 1,
2001
- "_rank" : 4,
2002
- "h" : 1500
2003
- },
2004
- "60" : {
2005
- "k" : 1,
2006
- "w" : 1500,
2007
- "n" : 1,
2008
- "_rank" : 3,
2009
- "h" : 768
2010
- },
2011
- "input.211" : {
2012
- "k" : 1,
2013
- "w" : 768,
2014
- "n" : 1,
2015
- "_rank" : 3,
2016
- "h" : 1500
2017
- },
2018
- "transpose_71" : {
2019
- "k" : 12,
2020
- "w" : 64,
2021
- "n" : 1,
2022
- "_rank" : 4,
2023
- "h" : 1500
2024
- },
2025
- "tensor.59" : {
2026
- "k" : 1,
2027
- "w" : 768,
2028
- "n" : 1,
2029
- "_rank" : 3,
2030
- "h" : 1500
2031
- },
2032
- "275" : {
2033
- "k" : 1,
2034
- "w" : 768,
2035
- "n" : 1,
2036
- "_rank" : 3,
2037
- "h" : 1500
2038
- },
2039
- "tensor.9" : {
2040
- "k" : 1,
2041
- "w" : 768,
2042
- "n" : 1,
2043
- "_rank" : 3,
2044
- "h" : 1500
2045
- },
2046
- "164" : {
2047
- "k" : 1500,
2048
- "w" : 64,
2049
- "n" : 1,
2050
- "_rank" : 4,
2051
- "h" : 12
2052
- },
2053
- "transpose_104" : {
2054
- "k" : 1500,
2055
- "w" : 64,
2056
- "n" : 1,
2057
- "_rank" : 4,
2058
- "h" : 12
2059
- },
2060
- "input.49" : {
2061
- "k" : 1,
2062
- "w" : 768,
2063
- "n" : 1,
2064
- "_rank" : 3,
2065
- "h" : 1500
2066
- },
2067
- "input.27" : {
2068
- "k" : 1,
2069
- "w" : 768,
2070
- "n" : 1,
2071
- "_rank" : 3,
2072
- "h" : 1500
2073
- },
2074
- "input.237_scale_mul_out" : {
2075
- "k" : 1500,
2076
- "w" : 768,
2077
- "n" : 1,
2078
- "_rank" : 4,
2079
- "h" : 1
2080
- },
2081
- "tensor.13" : {
2082
- "k" : 1,
2083
- "w" : 768,
2084
- "n" : 1,
2085
- "_rank" : 3,
2086
- "h" : 1500
2087
- },
2088
- "837_scale_constant_in_scale" : {
2089
- "k" : 1,
2090
- "w" : 768,
2091
- "n" : 1,
2092
- "h" : 1
2093
- },
2094
- "input.193" : {
2095
- "k" : 1,
2096
- "w" : 768,
2097
- "n" : 1,
2098
- "_rank" : 3,
2099
- "h" : 1500
2100
- },
2101
- "hidden_states.25_reshape" : {
2102
- "k" : 1500,
2103
- "w" : 768,
2104
- "n" : 1,
2105
- "_rank" : 4,
2106
- "h" : 1
2107
- },
2108
- "inputs_embeds.1" : {
2109
- "k" : 1,
2110
- "w" : 1500,
2111
- "n" : 1,
2112
- "_rank" : 3,
2113
- "h" : 768
2114
- },
2115
- "hidden_states.19_scale_constant_in_scale" : {
2116
- "k" : 1,
2117
- "w" : 768,
2118
- "n" : 1,
2119
- "h" : 1
2120
- },
2121
- "input.237_reshape" : {
2122
- "k" : 1500,
2123
- "w" : 768,
2124
- "n" : 1,
2125
- "_rank" : 4,
2126
- "h" : 1
2127
- },
2128
- "hidden_states.55_scale_mul_out" : {
2129
- "k" : 1500,
2130
- "w" : 768,
2131
- "n" : 1,
2132
- "_rank" : 4,
2133
- "h" : 1
2134
- },
2135
- "279" : {
2136
- "k" : 1500,
2137
- "w" : 64,
2138
- "n" : 1,
2139
- "_rank" : 4,
2140
- "h" : 12
2141
- },
2142
- "input.167" : {
2143
- "k" : 1,
2144
- "w" : 768,
2145
- "n" : 1,
2146
- "_rank" : 3,
2147
- "h" : 1500
2148
- },
2149
- "hidden_states.67_scale_constant_in_scale" : {
2150
- "k" : 1,
2151
- "w" : 768,
2152
- "n" : 1,
2153
- "h" : 1
2154
- },
2155
- "transpose_88" : {
2156
- "k" : 1500,
2157
- "w" : 64,
2158
- "n" : 1,
2159
- "_rank" : 4,
2160
- "h" : 12
2161
- },
2162
- "input.259_scale_constant_in_bias" : {
2163
- "k" : 1,
2164
- "w" : 768,
2165
- "n" : 1,
2166
- "h" : 1
2167
- },
2168
- "input.255" : {
2169
- "k" : 1,
2170
- "w" : 768,
2171
- "n" : 1,
2172
- "_rank" : 3,
2173
- "h" : 1500
2174
- },
2175
- "input.61_scale_mul_out" : {
2176
- "k" : 1500,
2177
- "w" : 768,
2178
- "n" : 1,
2179
- "_rank" : 4,
2180
- "h" : 1
2181
- },
2182
- "input.121" : {
2183
- "k" : 1,
2184
- "w" : 768,
2185
- "n" : 1,
2186
- "_rank" : 3,
2187
- "h" : 1500
2188
- },
2189
- "531" : {
2190
- "k" : 1,
2191
- "w" : 768,
2192
- "n" : 1,
2193
- "_rank" : 3,
2194
- "h" : 1500
2195
- },
2196
- "420" : {
2197
- "k" : 1500,
2198
- "w" : 64,
2199
- "n" : 1,
2200
- "_rank" : 4,
2201
- "h" : 12
2202
- },
2203
- "tensor.57" : {
2204
- "k" : 1,
2205
- "w" : 768,
2206
- "n" : 1,
2207
- "_rank" : 3,
2208
- "h" : 1500
2209
- },
2210
- "tensor.5" : {
2211
- "k" : 1,
2212
- "w" : 768,
2213
- "n" : 1,
2214
- "_rank" : 3,
2215
- "h" : 1500
2216
- },
2217
- "input.229" : {
2218
- "k" : 12,
2219
- "w" : 1500,
2220
- "n" : 1,
2221
- "_rank" : 4,
2222
- "h" : 1500
2223
- },
2224
- "hidden_states.1_scale_constant_in_bias" : {
2225
- "k" : 1,
2226
- "w" : 768,
2227
- "n" : 1,
2228
- "h" : 1
2229
- },
2230
- "hidden_states.7_scale_constant_in_scale" : {
2231
- "k" : 1,
2232
- "w" : 768,
2233
- "n" : 1,
2234
- "h" : 1
2235
- },
2236
- "tensor.11" : {
2237
- "k" : 1,
2238
- "w" : 768,
2239
- "n" : 1,
2240
- "_rank" : 3,
2241
- "h" : 1500
2242
- },
2243
- "input.191" : {
2244
- "k" : 1,
2245
- "w" : 768,
2246
- "n" : 1,
2247
- "_rank" : 3,
2248
- "h" : 1500
2249
- },
2250
- "transpose_75" : {
2251
- "k" : 12,
2252
- "w" : 64,
2253
- "n" : 1,
2254
- "_rank" : 4,
2255
- "h" : 1500
2256
- },
2257
- "input.9" : {
2258
- "k" : 12,
2259
- "w" : 1500,
2260
- "n" : 1,
2261
- "_rank" : 4,
2262
- "h" : 1500
2263
- },
2264
- "transpose_106" : {
2265
- "k" : 12,
2266
- "w" : 64,
2267
- "n" : 1,
2268
- "_rank" : 4,
2269
- "h" : 1500
2270
- },
2271
- "transpose_92" : {
2272
- "k" : 1500,
2273
- "w" : 64,
2274
- "n" : 1,
2275
- "_rank" : 4,
2276
- "h" : 12
2277
- },
2278
- "535" : {
2279
- "k" : 1500,
2280
- "w" : 64,
2281
- "n" : 1,
2282
- "_rank" : 4,
2283
- "h" : 12
2284
- },
2285
- "hidden_states.19_scale_constant_in_bias" : {
2286
- "k" : 1,
2287
- "w" : 768,
2288
- "n" : 1,
2289
- "h" : 1
2290
- },
2291
- "input.165" : {
2292
- "k" : 1,
2293
- "w" : 768,
2294
- "n" : 1,
2295
- "_rank" : 3,
2296
- "h" : 1500
2297
- },
2298
- "hidden_states.43_scale_constant_in_scale" : {
2299
- "k" : 1,
2300
- "w" : 768,
2301
- "n" : 1,
2302
- "h" : 1
2303
- },
2304
- "input.253" : {
2305
- "k" : 1,
2306
- "w" : 768,
2307
- "n" : 1,
2308
- "_rank" : 3,
2309
- "h" : 1500
2310
- },
2311
- "input.105_scale_mul_out" : {
2312
- "k" : 1500,
2313
- "w" : 768,
2314
- "n" : 1,
2315
- "_rank" : 4,
2316
- "h" : 1
2317
- },
2318
- "attn_output.13" : {
2319
- "k" : 12,
2320
- "w" : 64,
2321
- "n" : 1,
2322
- "_rank" : 4,
2323
- "h" : 1500
2324
- },
2325
- "input.171_scale" : {
2326
- "k" : 1500,
2327
- "w" : 768,
2328
- "n" : 1,
2329
- "_rank" : 4,
2330
- "h" : 1
2331
- },
2332
- "tensor.55" : {
2333
- "k" : 1,
2334
- "w" : 768,
2335
- "n" : 1,
2336
- "_rank" : 3,
2337
- "h" : 1500
2338
- },
2339
- "tensor.1" : {
2340
- "k" : 1,
2341
- "w" : 768,
2342
- "n" : 1,
2343
- "_rank" : 3,
2344
- "h" : 1500
2345
- },
2346
- "input.139" : {
2347
- "k" : 12,
2348
- "w" : 1500,
2349
- "n" : 1,
2350
- "_rank" : 4,
2351
- "h" : 1500
2352
- },
2353
- "input.85" : {
2354
- "k" : 1,
2355
- "w" : 3072,
2356
- "n" : 1,
2357
- "_rank" : 3,
2358
- "h" : 1500
2359
- },
2360
- "input.193_mvn" : {
2361
- "k" : 1500,
2362
- "w" : 768,
2363
- "n" : 1,
2364
- "_rank" : 4,
2365
- "h" : 1
2366
- },
2367
- "input.63" : {
2368
- "k" : 1,
2369
- "w" : 3072,
2370
- "n" : 1,
2371
- "_rank" : 3,
2372
- "h" : 1500
2373
- },
2374
- "transpose_62" : {
2375
- "k" : 12,
2376
- "w" : 64,
2377
- "n" : 1,
2378
- "_rank" : 4,
2379
- "h" : 1500
2380
- },
2381
- "input.41" : {
2382
- "k" : 1,
2383
- "w" : 3072,
2384
- "n" : 1,
2385
- "_rank" : 3,
2386
- "h" : 1500
2387
- },
2388
- "input.227" : {
2389
- "k" : 12,
2390
- "w" : 1500,
2391
- "n" : 1,
2392
- "_rank" : 4,
2393
- "h" : 1500
2394
- },
2395
- "expand_dims_0" : {
2396
- "k" : 80,
2397
- "w" : 3000,
2398
- "n" : 1,
2399
- "_rank" : 4,
2400
- "h" : 1
2401
- },
2402
- "input.193_scale" : {
2403
- "k" : 1500,
2404
- "w" : 768,
2405
- "n" : 1,
2406
- "_rank" : 4,
2407
- "h" : 1
2408
- },
2409
- "hidden_states.31" : {
2410
- "k" : 1,
2411
- "w" : 768,
2412
- "n" : 1,
2413
- "_rank" : 3,
2414
- "h" : 1500
2415
- },
2416
- "hidden_states.13_scale_mul_out" : {
2417
- "k" : 1500,
2418
- "w" : 768,
2419
- "n" : 1,
2420
- "_rank" : 4,
2421
- "h" : 1
2422
- },
2423
- "input.127_scale_constant_in_bias" : {
2424
- "k" : 1,
2425
- "w" : 768,
2426
- "n" : 1,
2427
- "h" : 1
2428
- },
2429
- "input.171_scale_constant_in_bias" : {
2430
- "k" : 1,
2431
- "w" : 768,
2432
- "n" : 1,
2433
- "h" : 1
2434
- },
2435
- "input.1" : {
2436
- "k" : 1,
2437
- "w" : 3000,
2438
- "n" : 1,
2439
- "_rank" : 3,
2440
- "h" : 768
2441
- },
2442
- "input.39_reshape" : {
2443
- "k" : 1500,
2444
- "w" : 768,
2445
- "n" : 1,
2446
- "_rank" : 4,
2447
- "h" : 1
2448
- },
2449
- "tensor.29" : {
2450
- "k" : 1,
2451
- "w" : 768,
2452
- "n" : 1,
2453
- "_rank" : 3,
2454
- "h" : 1500
2455
- },
2456
- "285" : {
2457
- "k" : 1500,
2458
- "w" : 64,
2459
- "n" : 1,
2460
- "_rank" : 4,
2461
- "h" : 12
2462
- },
2463
- "hidden_states.7_scale" : {
2464
- "k" : 1500,
2465
- "w" : 768,
2466
- "n" : 1,
2467
- "_rank" : 4,
2468
- "h" : 1
2469
- },
2470
- "hidden_states.55_scale_constant_in_scale" : {
2471
- "k" : 1,
2472
- "w" : 768,
2473
- "n" : 1,
2474
- "h" : 1
2475
- },
2476
- "input.105_scale_constant_in_scale" : {
2477
- "k" : 1,
2478
- "w" : 768,
2479
- "n" : 1,
2480
- "h" : 1
2481
- },
2482
- "input.215_scale_mul_out" : {
2483
- "k" : 1500,
2484
- "w" : 768,
2485
- "n" : 1,
2486
- "_rank" : 4,
2487
- "h" : 1
2488
- },
2489
- "input.61_reshape" : {
2490
- "k" : 1500,
2491
- "w" : 768,
2492
- "n" : 1,
2493
- "_rank" : 4,
2494
- "h" : 1
2495
- },
2496
- "hidden_states.7" : {
2497
- "k" : 1,
2498
- "w" : 768,
2499
- "n" : 1,
2500
- "_rank" : 3,
2501
- "h" : 1500
2502
- },
2503
- "input.163" : {
2504
- "k" : 12,
2505
- "w" : 1500,
2506
- "n" : 1,
2507
- "_rank" : 4,
2508
- "h" : 1500
2509
- },
2510
- "hidden_states.37_mvn" : {
2511
- "k" : 1500,
2512
- "w" : 768,
2513
- "n" : 1,
2514
- "_rank" : 4,
2515
- "h" : 1
2516
- },
2517
- "transpose_79" : {
2518
- "k" : 12,
2519
- "w" : 64,
2520
- "n" : 1,
2521
- "_rank" : 4,
2522
- "h" : 1500
2523
- },
2524
- "transpose_108" : {
2525
- "k" : 1,
2526
- "w" : 768,
2527
- "n" : 1,
2528
- "_rank" : 3,
2529
- "h" : 1500
2530
- },
2531
- "hidden_states.1_scale_constant_in_scale" : {
2532
- "k" : 1,
2533
- "w" : 768,
2534
- "n" : 1,
2535
- "h" : 1
2536
- },
2537
- "input.251" : {
2538
- "k" : 12,
2539
- "w" : 1500,
2540
- "n" : 1,
2541
- "_rank" : 4,
2542
- "h" : 1500
2543
- },
2544
- "transpose_96" : {
2545
- "k" : 1500,
2546
- "w" : 64,
2547
- "n" : 1,
2548
- "_rank" : 4,
2549
- "h" : 12
2550
- },
2551
- "attn_output.25" : {
2552
- "k" : 12,
2553
- "w" : 64,
2554
- "n" : 1,
2555
- "_rank" : 4,
2556
- "h" : 1500
2557
- },
2558
- "input.17_reshape" : {
2559
- "k" : 1500,
2560
- "w" : 768,
2561
- "n" : 1,
2562
- "_rank" : 4,
2563
- "h" : 1
2564
- },
2565
- "tensor.53" : {
2566
- "k" : 1,
2567
- "w" : 768,
2568
- "n" : 1,
2569
- "_rank" : 3,
2570
- "h" : 1500
2571
- },
2572
- "input.81" : {
2573
- "k" : 1,
2574
- "w" : 768,
2575
- "n" : 1,
2576
- "_rank" : 3,
2577
- "h" : 1500
2578
- },
2579
- "input.137" : {
2580
- "k" : 1,
2581
- "w" : 768,
2582
- "n" : 1,
2583
- "_rank" : 3,
2584
- "h" : 1500
2585
- },
2586
- "input.259_scale_constant_in_scale" : {
2587
- "k" : 1,
2588
- "w" : 768,
2589
- "n" : 1,
2590
- "h" : 1
2591
- },
2592
- "hidden_states.31_mvn" : {
2593
- "k" : 1500,
2594
- "w" : 768,
2595
- "n" : 1,
2596
- "_rank" : 4,
2597
- "h" : 1
2598
- },
2599
- "input.225" : {
2600
- "k" : 1,
2601
- "w" : 768,
2602
- "n" : 1,
2603
- "_rank" : 3,
2604
- "h" : 1500
2605
- },
2606
- "hidden_states.37_reshape" : {
2607
- "k" : 1500,
2608
- "w" : 768,
2609
- "n" : 1,
2610
- "_rank" : 4,
2611
- "h" : 1
2612
- },
2613
- "541" : {
2614
- "k" : 1500,
2615
- "w" : 64,
2616
- "n" : 1,
2617
- "_rank" : 4,
2618
- "h" : 12
2619
- },
2620
- "tensor.27" : {
2621
- "k" : 1,
2622
- "w" : 768,
2623
- "n" : 1,
2624
- "_rank" : 3,
2625
- "h" : 1500
2626
- },
2627
- "hidden_states.55" : {
2628
- "k" : 1,
2629
- "w" : 768,
2630
- "n" : 1,
2631
- "_rank" : 3,
2632
- "h" : 1500
2633
- },
2634
- "transpose_66" : {
2635
- "k" : 12,
2636
- "w" : 64,
2637
- "n" : 1,
2638
- "_rank" : 4,
2639
- "h" : 1500
2640
- },
2641
- "input.237_scale_constant_in_bias" : {
2642
- "k" : 1,
2643
- "w" : 768,
2644
- "n" : 1,
2645
- "h" : 1
2646
- },
2647
- "transpose_83" : {
2648
- "k" : 12,
2649
- "w" : 64,
2650
- "n" : 1,
2651
- "_rank" : 4,
2652
- "h" : 1500
2653
- },
2654
- "expand_dims_2" : {
2655
- "k" : 768,
2656
- "w" : 3000,
2657
- "n" : 1,
2658
- "_rank" : 4,
2659
- "h" : 1
2660
- },
2661
- "837_scale" : {
2662
- "k" : 1500,
2663
- "w" : 768,
2664
- "n" : 1,
2665
- "_rank" : 4,
2666
- "h" : 1
2667
- },
2668
- "hidden_states.31_scale_constant_in_scale" : {
2669
- "k" : 1,
2670
- "w" : 768,
2671
- "n" : 1,
2672
- "h" : 1
2673
- },
2674
- "211" : {
2675
- "k" : 1,
2676
- "w" : 768,
2677
- "n" : 1,
2678
- "_rank" : 3,
2679
- "h" : 1500
2680
- },
2681
- "100" : {
2682
- "k" : 1500,
2683
- "w" : 64,
2684
- "n" : 1,
2685
- "_rank" : 4,
2686
- "h" : 12
2687
- },
2688
- "input.161" : {
2689
- "k" : 12,
2690
- "w" : 1500,
2691
- "n" : 1,
2692
- "_rank" : 4,
2693
- "h" : 1500
2694
- },
2695
- "input.17_scale_constant_in_bias" : {
2696
- "k" : 1,
2697
- "w" : 768,
2698
- "n" : 1,
2699
- "h" : 1
2700
- },
2701
- "input.215_reshape" : {
2702
- "k" : 1500,
2703
- "w" : 768,
2704
- "n" : 1,
2705
- "_rank" : 4,
2706
- "h" : 1
2707
- },
2708
- "hidden_states.55_scale_constant_in_bias" : {
2709
- "k" : 1,
2710
- "w" : 768,
2711
- "n" : 1,
2712
- "h" : 1
2713
- },
2714
- "hidden_states.25_scale" : {
2715
- "k" : 1500,
2716
- "w" : 768,
2717
- "n" : 1,
2718
- "_rank" : 4,
2719
- "h" : 1
2720
- },
2721
- "input.259_mvn" : {
2722
- "k" : 1500,
2723
- "w" : 768,
2724
- "n" : 1,
2725
- "_rank" : 4,
2726
- "h" : 1
2727
- },
2728
- "tensor.51" : {
2729
- "k" : 1,
2730
- "w" : 768,
2731
- "n" : 1,
2732
- "_rank" : 3,
2733
- "h" : 1500
2734
- },
2735
- "input.17_mvn" : {
2736
- "k" : 1500,
2737
- "w" : 768,
2738
- "n" : 1,
2739
- "_rank" : 4,
2740
- "h" : 1
2741
- },
2742
- "hidden_states.37_scale_constant_in_bias" : {
2743
- "k" : 1,
2744
- "w" : 768,
2745
- "n" : 1,
2746
- "h" : 1
2747
- },
2748
- "attn_output.37" : {
2749
- "k" : 12,
2750
- "w" : 64,
2751
- "n" : 1,
2752
- "_rank" : 4,
2753
- "h" : 1500
2754
- },
2755
- "conv_0" : {
2756
- "k" : 768,
2757
- "w" : 3000,
2758
- "n" : 1,
2759
- "_rank" : 4,
2760
- "h" : 1
2761
- },
2762
- "input.135" : {
2763
- "k" : 1,
2764
- "w" : 768,
2765
- "n" : 1,
2766
- "_rank" : 3,
2767
- "h" : 1500
2768
- },
2769
- "transpose_70" : {
2770
- "k" : 12,
2771
- "w" : 64,
2772
- "n" : 1,
2773
- "_rank" : 4,
2774
- "h" : 1500
2775
- },
2776
- "input.223" : {
2777
- "k" : 1,
2778
- "w" : 768,
2779
- "n" : 1,
2780
- "_rank" : 3,
2781
- "h" : 1500
2782
- },
2783
- "292" : {
2784
- "k" : 1500,
2785
- "w" : 64,
2786
- "n" : 1,
2787
- "_rank" : 4,
2788
- "h" : 12
2789
- },
2790
- "hidden_states.31_scale_mul_out" : {
2791
- "k" : 1500,
2792
- "w" : 768,
2793
- "n" : 1,
2794
- "_rank" : 4,
2795
- "h" : 1
2796
- },
2797
- "659" : {
2798
- "k" : 1,
2799
- "w" : 768,
2800
- "n" : 1,
2801
- "_rank" : 3,
2802
- "h" : 1500
2803
- },
2804
- "215" : {
2805
- "k" : 1500,
2806
- "w" : 64,
2807
- "n" : 1,
2808
- "_rank" : 4,
2809
- "h" : 12
2810
- },
2811
- "548" : {
2812
- "k" : 1500,
2813
- "w" : 64,
2814
- "n" : 1,
2815
- "_rank" : 4,
2816
- "h" : 12
2817
- },
2818
- "837_mvn" : {
2819
- "k" : 1500,
2820
- "w" : 768,
2821
- "n" : 1,
2822
- "_rank" : 4,
2823
- "h" : 1
2824
- },
2825
- "tensor.25" : {
2826
- "k" : 1,
2827
- "w" : 768,
2828
- "n" : 1,
2829
- "_rank" : 3,
2830
- "h" : 1500
2831
- },
2832
- "input.109" : {
2833
- "k" : 1,
2834
- "w" : 3072,
2835
- "n" : 1,
2836
- "_rank" : 3,
2837
- "h" : 1500
2838
- },
2839
- "input.39" : {
2840
- "k" : 1,
2841
- "w" : 768,
2842
- "n" : 1,
2843
- "_rank" : 3,
2844
- "h" : 1500
2845
- },
2846
- "input.17" : {
2847
- "k" : 1,
2848
- "w" : 768,
2849
- "n" : 1,
2850
- "_rank" : 3,
2851
- "h" : 1500
2852
- },
2853
- "hidden_states.7_mvn" : {
2854
- "k" : 1500,
2855
- "w" : 768,
2856
- "n" : 1,
2857
- "_rank" : 4,
2858
- "h" : 1
2859
- },
2860
- "last_hidden_state" : {
2861
- "k" : 1,
2862
- "w" : 768,
2863
- "n" : 1,
2864
- "_rank" : 3,
2865
- "h" : 1500
2866
- },
2867
- "input.179" : {
2868
- "k" : 1,
2869
- "w" : 768,
2870
- "n" : 1,
2871
- "_rank" : 3,
2872
- "h" : 1500
2873
- },
2874
- "hidden_states.1" : {
2875
- "k" : 1,
2876
- "w" : 768,
2877
- "n" : 1,
2878
- "_rank" : 3,
2879
- "h" : 1500
2880
- },
2881
- "transpose_87" : {
2882
- "k" : 12,
2883
- "w" : 64,
2884
- "n" : 1,
2885
- "_rank" : 4,
2886
- "h" : 1500
2887
- },
2888
- "input.267" : {
2889
- "k" : 1,
2890
- "w" : 768,
2891
- "n" : 1,
2892
- "_rank" : 3,
2893
- "h" : 1500
2894
- },
2895
- "input.39_scale_mul_out" : {
2896
- "k" : 1500,
2897
- "w" : 768,
2898
- "n" : 1,
2899
- "_rank" : 4,
2900
- "h" : 1
2901
- },
2902
- "attn_output.1" : {
2903
- "k" : 12,
2904
- "w" : 64,
2905
- "n" : 1,
2906
- "_rank" : 4,
2907
- "h" : 1500
2908
- },
2909
- "input.105_scale_constant_in_bias" : {
2910
- "k" : 1,
2911
- "w" : 768,
2912
- "n" : 1,
2913
- "h" : 1
2914
- },
2915
- "804" : {
2916
- "k" : 1500,
2917
- "w" : 64,
2918
- "n" : 1,
2919
- "_rank" : 4,
2920
- "h" : 12
2921
- },
2922
- "conv_1" : {
2923
- "k" : 768,
2924
- "w" : 1500,
2925
- "n" : 1,
2926
- "_rank" : 4,
2927
- "h" : 1
2928
- },
2929
- "hidden_states.61_reshape" : {
2930
- "k" : 1500,
2931
- "w" : 768,
2932
- "n" : 1,
2933
- "_rank" : 4,
2934
- "h" : 1
2935
- },
2936
- "tensor.69" : {
2937
- "k" : 1,
2938
- "w" : 768,
2939
- "n" : 1,
2940
- "_rank" : 3,
2941
- "h" : 1500
2942
- },
2943
- "hidden_states.1_reshape" : {
2944
- "k" : 1500,
2945
- "w" : 768,
2946
- "n" : 1,
2947
- "_rank" : 4,
2948
- "h" : 1
2949
- },
2950
- "input.105_mvn" : {
2951
- "k" : 1500,
2952
- "w" : 768,
2953
- "n" : 1,
2954
- "_rank" : 4,
2955
- "h" : 1
2956
- },
2957
- "input.79" : {
2958
- "k" : 1,
2959
- "w" : 768,
2960
- "n" : 1,
2961
- "_rank" : 3,
2962
- "h" : 1500
2963
- },
2964
- "input.57" : {
2965
- "k" : 1,
2966
- "w" : 768,
2967
- "n" : 1,
2968
- "_rank" : 3,
2969
- "h" : 1500
2970
- },
2971
- "tensor.23" : {
2972
- "k" : 1,
2973
- "w" : 768,
2974
- "n" : 1,
2975
- "_rank" : 3,
2976
- "h" : 1500
2977
- },
2978
- "input.35" : {
2979
- "k" : 1,
2980
- "w" : 768,
2981
- "n" : 1,
2982
- "_rank" : 3,
2983
- "h" : 1500
2984
- },
2985
- "hidden_states.43_scale" : {
2986
- "k" : 1500,
2987
- "w" : 768,
2988
- "n" : 1,
2989
- "_rank" : 4,
2990
- "h" : 1
2991
- },
2992
- "input.107" : {
2993
- "k" : 1,
2994
- "w" : 3072,
2995
- "n" : 1,
2996
- "_rank" : 3,
2997
- "h" : 1500
2998
- },
2999
- "input.61_scale_constant_in_bias" : {
3000
- "k" : 1,
3001
- "w" : 768,
3002
- "n" : 1,
3003
- "h" : 1
3004
- },
3005
- "input.13" : {
3006
- "k" : 1,
3007
- "w" : 768,
3008
- "n" : 1,
3009
- "_rank" : 3,
3010
- "h" : 1500
3011
- },
3012
- "transpose_74" : {
3013
- "k" : 12,
3014
- "w" : 64,
3015
- "n" : 1,
3016
- "_rank" : 4,
3017
- "h" : 1500
3018
- },
3019
- "transpose_91" : {
3020
- "k" : 12,
3021
- "w" : 64,
3022
- "n" : 1,
3023
- "_rank" : 4,
3024
- "h" : 1500
3025
- }
3026
- }
3027
- }
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
az-speechto-text-HF/WhisperEncoder.mlmodelc/model.espresso.weights DELETED
@@ -1,3 +0,0 @@
1
- version https://git-lfs.github.com/spec/v1
2
- oid sha256:9587e0a2943e66021b9e0baa5e437d5e4f80039b2ee9cd4c9b839b1f40b7ddd3
3
- size 353655040
 
 
 
 
az-speechto-text-HF/WhisperEncoder.mlmodelc/model/coremldata.bin DELETED
@@ -1,3 +0,0 @@
1
- version https://git-lfs.github.com/spec/v1
2
- oid sha256:f5a5fd42d16a20302798ef6ed309979b43003d2320d9f0e8ea9831a92759fb4b
3
- size 64
 
 
 
 
az-speechto-text-HF/WhisperEncoder.mlmodelc/neural_network_optionals/coremldata.bin DELETED
@@ -1,3 +0,0 @@
1
- version https://git-lfs.github.com/spec/v1
2
- oid sha256:5931bd536c4550294a212c6fc8d3c1bee75da817980ba0b671c8603dafb36238
3
- size 40
 
 
 
 
az-speechto-text-HF/config.json DELETED
@@ -1,59 +0,0 @@
1
- {
2
- "activation_dropout": 0.0,
3
- "activation_function": "gelu",
4
- "apply_spec_augment": false,
5
- "architectures": [
6
- "WhisperForConditionalGeneration"
7
- ],
8
- "attention_dropout": 0.0,
9
- "bos_token_id": 50257,
10
- "classifier_proj_size": 256,
11
- "d_model": 768,
12
- "decoder_attention_heads": 12,
13
- "decoder_ffn_dim": 3072,
14
- "decoder_layerdrop": 0.0,
15
- "decoder_layers": 12,
16
- "decoder_start_token_id": 50258,
17
- "dropout": 0.0,
18
- "dtype": "float32",
19
- "encoder_attention_heads": 12,
20
- "encoder_ffn_dim": 3072,
21
- "encoder_layerdrop": 0.0,
22
- "encoder_layers": 12,
23
- "eos_token_id": 50257,
24
- "forced_decoder_ids": [
25
- [
26
- 1,
27
- 50259
28
- ],
29
- [
30
- 2,
31
- 50359
32
- ],
33
- [
34
- 3,
35
- 50363
36
- ]
37
- ],
38
- "init_std": 0.02,
39
- "is_encoder_decoder": true,
40
- "mask_feature_length": 10,
41
- "mask_feature_min_masks": 0,
42
- "mask_feature_prob": 0.0,
43
- "mask_time_length": 10,
44
- "mask_time_min_masks": 2,
45
- "mask_time_prob": 0.05,
46
- "max_source_positions": 1500,
47
- "max_target_positions": 448,
48
- "median_filter_width": 7,
49
- "model_type": "whisper",
50
- "num_hidden_layers": 12,
51
- "num_mel_bins": 80,
52
- "pad_token_id": 50257,
53
- "scale_embedding": false,
54
- "tie_word_embeddings": true,
55
- "transformers_version": "5.3.0",
56
- "use_cache": true,
57
- "use_weighted_layer_sum": false,
58
- "vocab_size": 51865
59
- }
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
az-speechto-text-HF/generation_config.json DELETED
@@ -1,264 +0,0 @@
1
- {
2
- "alignment_heads": [
3
- [
4
- 5,
5
- 3
6
- ],
7
- [
8
- 5,
9
- 9
10
- ],
11
- [
12
- 8,
13
- 0
14
- ],
15
- [
16
- 8,
17
- 4
18
- ],
19
- [
20
- 8,
21
- 7
22
- ],
23
- [
24
- 8,
25
- 8
26
- ],
27
- [
28
- 9,
29
- 0
30
- ],
31
- [
32
- 9,
33
- 7
34
- ],
35
- [
36
- 9,
37
- 9
38
- ],
39
- [
40
- 10,
41
- 5
42
- ]
43
- ],
44
- "begin_suppress_tokens": [
45
- 220,
46
- 50257
47
- ],
48
- "bos_token_id": 50257,
49
- "decoder_start_token_id": 50258,
50
- "eos_token_id": 50257,
51
- "forced_decoder_ids": [
52
- [
53
- 1,
54
- null
55
- ],
56
- [
57
- 2,
58
- 50359
59
- ]
60
- ],
61
- "is_multilingual": true,
62
- "lang_to_id": {
63
- "<|af|>": 50327,
64
- "<|am|>": 50334,
65
- "<|ar|>": 50272,
66
- "<|as|>": 50350,
67
- "<|az|>": 50304,
68
- "<|ba|>": 50355,
69
- "<|be|>": 50330,
70
- "<|bg|>": 50292,
71
- "<|bn|>": 50302,
72
- "<|bo|>": 50347,
73
- "<|br|>": 50309,
74
- "<|bs|>": 50315,
75
- "<|ca|>": 50270,
76
- "<|cs|>": 50283,
77
- "<|cy|>": 50297,
78
- "<|da|>": 50285,
79
- "<|de|>": 50261,
80
- "<|el|>": 50281,
81
- "<|en|>": 50259,
82
- "<|es|>": 50262,
83
- "<|et|>": 50307,
84
- "<|eu|>": 50310,
85
- "<|fa|>": 50300,
86
- "<|fi|>": 50277,
87
- "<|fo|>": 50338,
88
- "<|fr|>": 50265,
89
- "<|gl|>": 50319,
90
- "<|gu|>": 50333,
91
- "<|haw|>": 50352,
92
- "<|ha|>": 50354,
93
- "<|he|>": 50279,
94
- "<|hi|>": 50276,
95
- "<|hr|>": 50291,
96
- "<|ht|>": 50339,
97
- "<|hu|>": 50286,
98
- "<|hy|>": 50312,
99
- "<|id|>": 50275,
100
- "<|is|>": 50311,
101
- "<|it|>": 50274,
102
- "<|ja|>": 50266,
103
- "<|jw|>": 50356,
104
- "<|ka|>": 50329,
105
- "<|kk|>": 50316,
106
- "<|km|>": 50323,
107
- "<|kn|>": 50306,
108
- "<|ko|>": 50264,
109
- "<|la|>": 50294,
110
- "<|lb|>": 50345,
111
- "<|ln|>": 50353,
112
- "<|lo|>": 50336,
113
- "<|lt|>": 50293,
114
- "<|lv|>": 50301,
115
- "<|mg|>": 50349,
116
- "<|mi|>": 50295,
117
- "<|mk|>": 50308,
118
- "<|ml|>": 50296,
119
- "<|mn|>": 50314,
120
- "<|mr|>": 50320,
121
- "<|ms|>": 50282,
122
- "<|mt|>": 50343,
123
- "<|my|>": 50346,
124
- "<|ne|>": 50313,
125
- "<|nl|>": 50271,
126
- "<|nn|>": 50342,
127
- "<|no|>": 50288,
128
- "<|oc|>": 50328,
129
- "<|pa|>": 50321,
130
- "<|pl|>": 50269,
131
- "<|ps|>": 50340,
132
- "<|pt|>": 50267,
133
- "<|ro|>": 50284,
134
- "<|ru|>": 50263,
135
- "<|sa|>": 50344,
136
- "<|sd|>": 50332,
137
- "<|si|>": 50322,
138
- "<|sk|>": 50298,
139
- "<|sl|>": 50305,
140
- "<|sn|>": 50324,
141
- "<|so|>": 50326,
142
- "<|sq|>": 50317,
143
- "<|sr|>": 50303,
144
- "<|su|>": 50357,
145
- "<|sv|>": 50273,
146
- "<|sw|>": 50318,
147
- "<|ta|>": 50287,
148
- "<|te|>": 50299,
149
- "<|tg|>": 50331,
150
- "<|th|>": 50289,
151
- "<|tk|>": 50341,
152
- "<|tl|>": 50348,
153
- "<|tr|>": 50268,
154
- "<|tt|>": 50351,
155
- "<|uk|>": 50280,
156
- "<|ur|>": 50290,
157
- "<|uz|>": 50337,
158
- "<|vi|>": 50278,
159
- "<|yi|>": 50335,
160
- "<|yo|>": 50325,
161
- "<|zh|>": 50260
162
- },
163
- "max_initial_timestamp_index": 50,
164
- "max_length": 448,
165
- "no_timestamps_token_id": 50363,
166
- "pad_token_id": 50257,
167
- "prev_sot_token_id": 50361,
168
- "return_timestamps": false,
169
- "suppress_tokens": [
170
- 1,
171
- 2,
172
- 7,
173
- 8,
174
- 9,
175
- 10,
176
- 14,
177
- 25,
178
- 26,
179
- 27,
180
- 28,
181
- 29,
182
- 31,
183
- 58,
184
- 59,
185
- 60,
186
- 61,
187
- 62,
188
- 63,
189
- 90,
190
- 91,
191
- 92,
192
- 93,
193
- 359,
194
- 503,
195
- 522,
196
- 542,
197
- 873,
198
- 893,
199
- 902,
200
- 918,
201
- 922,
202
- 931,
203
- 1350,
204
- 1853,
205
- 1982,
206
- 2460,
207
- 2627,
208
- 3246,
209
- 3253,
210
- 3268,
211
- 3536,
212
- 3846,
213
- 3961,
214
- 4183,
215
- 4667,
216
- 6585,
217
- 6647,
218
- 7273,
219
- 9061,
220
- 9383,
221
- 10428,
222
- 10929,
223
- 11938,
224
- 12033,
225
- 12331,
226
- 12562,
227
- 13793,
228
- 14157,
229
- 14635,
230
- 15265,
231
- 15618,
232
- 16553,
233
- 16604,
234
- 18362,
235
- 18956,
236
- 20075,
237
- 21675,
238
- 22520,
239
- 26130,
240
- 26161,
241
- 26435,
242
- 28279,
243
- 29464,
244
- 31650,
245
- 32302,
246
- 32470,
247
- 36865,
248
- 42863,
249
- 47425,
250
- 49870,
251
- 50254,
252
- 50258,
253
- 50358,
254
- 50359,
255
- 50360,
256
- 50361,
257
- 50362
258
- ],
259
- "task_to_id": {
260
- "transcribe": 50359,
261
- "translate": 50358
262
- },
263
- "transformers_version": "5.3.0"
264
- }