AmberLJC commited on
Commit
5e4b6d0
·
verified ·
1 Parent(s): 61dd467

Upload results_fair.json with huggingface_hub

Browse files
Files changed (1) hide show
  1. results_fair.json +1174 -0
results_fair.json ADDED
@@ -0,0 +1,1174 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "config": {
3
+ "num_layers": 20,
4
+ "hidden_dim": 64,
5
+ "num_samples": 1024,
6
+ "training_steps": 500,
7
+ "learning_rate": 0.001,
8
+ "batch_size": 64,
9
+ "initialization": "Kaiming He + 1/sqrt(num_layers) scaling (IDENTICAL for both)"
10
+ },
11
+ "plain_mlp": {
12
+ "final_loss": 0.3332558274269104,
13
+ "initial_loss": 0.332968533039093,
14
+ "loss_history": [
15
+ 0.332968533039093,
16
+ 0.3402037024497986,
17
+ 0.3364717364311218,
18
+ 0.3382267951965332,
19
+ 0.3330632448196411,
20
+ 0.3238801956176758,
21
+ 0.33725303411483765,
22
+ 0.33949077129364014,
23
+ 0.3349677622318268,
24
+ 0.3314793109893799,
25
+ 0.3350830376148224,
26
+ 0.3396027088165283,
27
+ 0.3461214303970337,
28
+ 0.33500319719314575,
29
+ 0.33258378505706787,
30
+ 0.3271251916885376,
31
+ 0.33106938004493713,
32
+ 0.330522745847702,
33
+ 0.3350549042224884,
34
+ 0.34020766615867615,
35
+ 0.3346160352230072,
36
+ 0.33573126792907715,
37
+ 0.331778347492218,
38
+ 0.3422446846961975,
39
+ 0.32669609785079956,
40
+ 0.32841432094573975,
41
+ 0.33652669191360474,
42
+ 0.3339478373527527,
43
+ 0.33742019534111023,
44
+ 0.3364412188529968,
45
+ 0.3310929536819458,
46
+ 0.329889178276062,
47
+ 0.32710886001586914,
48
+ 0.3314291536808014,
49
+ 0.32728779315948486,
50
+ 0.33449968695640564,
51
+ 0.3348814845085144,
52
+ 0.33067554235458374,
53
+ 0.33825111389160156,
54
+ 0.32776153087615967,
55
+ 0.3310733437538147,
56
+ 0.33599284291267395,
57
+ 0.3276815712451935,
58
+ 0.33107852935791016,
59
+ 0.3359324038028717,
60
+ 0.3308407664299011,
61
+ 0.3272636830806732,
62
+ 0.3326541483402252,
63
+ 0.33763229846954346,
64
+ 0.3272179663181305,
65
+ 0.3317231833934784,
66
+ 0.33339571952819824,
67
+ 0.33039557933807373,
68
+ 0.33708441257476807,
69
+ 0.3325483500957489,
70
+ 0.32474005222320557,
71
+ 0.3338140845298767,
72
+ 0.3298497796058655,
73
+ 0.3405594825744629,
74
+ 0.3340454399585724,
75
+ 0.3293362855911255,
76
+ 0.33182770013809204,
77
+ 0.32914435863494873,
78
+ 0.33043327927589417,
79
+ 0.342511922121048,
80
+ 0.33861756324768066,
81
+ 0.3329136371612549,
82
+ 0.3396056294441223,
83
+ 0.33696088194847107,
84
+ 0.3394179344177246,
85
+ 0.3365488648414612,
86
+ 0.333668977022171,
87
+ 0.3302392065525055,
88
+ 0.3311960697174072,
89
+ 0.331310898065567,
90
+ 0.33419355750083923,
91
+ 0.33611857891082764,
92
+ 0.3307862877845764,
93
+ 0.33424338698387146,
94
+ 0.3314332962036133,
95
+ 0.33120185136795044,
96
+ 0.3432038128376007,
97
+ 0.3276495635509491,
98
+ 0.3253132998943329,
99
+ 0.33370089530944824,
100
+ 0.3334325850009918,
101
+ 0.33796757459640503,
102
+ 0.3381417691707611,
103
+ 0.336396187543869,
104
+ 0.3448200821876526,
105
+ 0.3283367156982422,
106
+ 0.33384162187576294,
107
+ 0.33309417963027954,
108
+ 0.3408854305744171,
109
+ 0.33603304624557495,
110
+ 0.3335626721382141,
111
+ 0.33273571729660034,
112
+ 0.332747220993042,
113
+ 0.33269503712654114,
114
+ 0.337196946144104,
115
+ 0.33257246017456055,
116
+ 0.3369458317756653,
117
+ 0.3334164321422577,
118
+ 0.3322732746601105,
119
+ 0.33338549733161926,
120
+ 0.34215712547302246,
121
+ 0.3291473388671875,
122
+ 0.3304932713508606,
123
+ 0.3349063992500305,
124
+ 0.3322477340698242,
125
+ 0.33423349261283875,
126
+ 0.33466511964797974,
127
+ 0.3396754562854767,
128
+ 0.3337388038635254,
129
+ 0.3390074074268341,
130
+ 0.33351635932922363,
131
+ 0.33572056889533997,
132
+ 0.33725765347480774,
133
+ 0.33980029821395874,
134
+ 0.3307250738143921,
135
+ 0.3347432315349579,
136
+ 0.3250923156738281,
137
+ 0.33779600262641907,
138
+ 0.3293820023536682,
139
+ 0.3356536626815796,
140
+ 0.33151179552078247,
141
+ 0.3418586850166321,
142
+ 0.3444397449493408,
143
+ 0.3353630006313324,
144
+ 0.3337811827659607,
145
+ 0.3424583971500397,
146
+ 0.3381706774234772,
147
+ 0.32626256346702576,
148
+ 0.3191347122192383,
149
+ 0.33715391159057617,
150
+ 0.33729690313339233,
151
+ 0.33802124857902527,
152
+ 0.3238735795021057,
153
+ 0.3331955671310425,
154
+ 0.33632975816726685,
155
+ 0.3381429612636566,
156
+ 0.3314988613128662,
157
+ 0.3366459608078003,
158
+ 0.33990392088890076,
159
+ 0.3366839587688446,
160
+ 0.3358498811721802,
161
+ 0.33553940057754517,
162
+ 0.3383553624153137,
163
+ 0.3372274935245514,
164
+ 0.3360890746116638,
165
+ 0.3336467444896698,
166
+ 0.33137425780296326,
167
+ 0.3313506543636322,
168
+ 0.33801984786987305,
169
+ 0.3348143696784973,
170
+ 0.3381652235984802,
171
+ 0.33109965920448303,
172
+ 0.33065634965896606,
173
+ 0.33452922105789185,
174
+ 0.3361864984035492,
175
+ 0.3278672397136688,
176
+ 0.3391719460487366,
177
+ 0.3253280222415924,
178
+ 0.33980295062065125,
179
+ 0.3361275792121887,
180
+ 0.33439165353775024,
181
+ 0.3297124207019806,
182
+ 0.3297994136810303,
183
+ 0.3315487504005432,
184
+ 0.34181031584739685,
185
+ 0.34069621562957764,
186
+ 0.3201693892478943,
187
+ 0.33051198720932007,
188
+ 0.32677409052848816,
189
+ 0.33463847637176514,
190
+ 0.334945946931839,
191
+ 0.33414000272750854,
192
+ 0.3312710225582123,
193
+ 0.3372732102870941,
194
+ 0.3287302255630493,
195
+ 0.32816988229751587,
196
+ 0.34039369225502014,
197
+ 0.3414865732192993,
198
+ 0.3287455439567566,
199
+ 0.3278599977493286,
200
+ 0.3294675946235657,
201
+ 0.3318881392478943,
202
+ 0.33630383014678955,
203
+ 0.33583498001098633,
204
+ 0.3277794122695923,
205
+ 0.3441321849822998,
206
+ 0.33931320905685425,
207
+ 0.3246610164642334,
208
+ 0.3394920825958252,
209
+ 0.3324398994445801,
210
+ 0.32542577385902405,
211
+ 0.33746016025543213,
212
+ 0.33016330003738403,
213
+ 0.33138081431388855,
214
+ 0.3333736062049866,
215
+ 0.33004230260849,
216
+ 0.335909366607666,
217
+ 0.33485135436058044,
218
+ 0.3469405174255371,
219
+ 0.3376665711402893,
220
+ 0.32913172245025635,
221
+ 0.3373066782951355,
222
+ 0.34056517481803894,
223
+ 0.33372431993484497,
224
+ 0.3341078758239746,
225
+ 0.33511120080947876,
226
+ 0.3352786600589752,
227
+ 0.3287707567214966,
228
+ 0.32857248187065125,
229
+ 0.33455517888069153,
230
+ 0.3378414511680603,
231
+ 0.32852864265441895,
232
+ 0.3366684913635254,
233
+ 0.3318488597869873,
234
+ 0.33084720373153687,
235
+ 0.3281920850276947,
236
+ 0.32972854375839233,
237
+ 0.33841508626937866,
238
+ 0.3286718726158142,
239
+ 0.3372878432273865,
240
+ 0.3256922662258148,
241
+ 0.32902824878692627,
242
+ 0.3393133878707886,
243
+ 0.32971060276031494,
244
+ 0.3320726156234741,
245
+ 0.33548030257225037,
246
+ 0.33959805965423584,
247
+ 0.3317180573940277,
248
+ 0.3321043848991394,
249
+ 0.33242157101631165,
250
+ 0.3237553834915161,
251
+ 0.3358321487903595,
252
+ 0.3395066559314728,
253
+ 0.33536916971206665,
254
+ 0.3325914144515991,
255
+ 0.3364296555519104,
256
+ 0.3329724967479706,
257
+ 0.3324553668498993,
258
+ 0.3354540765285492,
259
+ 0.3420693874359131,
260
+ 0.3459964692592621,
261
+ 0.33733582496643066,
262
+ 0.33702749013900757,
263
+ 0.33047980070114136,
264
+ 0.33542799949645996,
265
+ 0.34718090295791626,
266
+ 0.3310956060886383,
267
+ 0.328813374042511,
268
+ 0.3344953656196594,
269
+ 0.3336995840072632,
270
+ 0.3262229263782501,
271
+ 0.3373294174671173,
272
+ 0.3287215232849121,
273
+ 0.3260827660560608,
274
+ 0.3272097110748291,
275
+ 0.3332976698875427,
276
+ 0.34142327308654785,
277
+ 0.3398308753967285,
278
+ 0.33534085750579834,
279
+ 0.33829042315483093,
280
+ 0.3399216830730438,
281
+ 0.3382388949394226,
282
+ 0.3297419548034668,
283
+ 0.33515945076942444,
284
+ 0.3321044147014618,
285
+ 0.33267727494239807,
286
+ 0.32454240322113037,
287
+ 0.3303866684436798,
288
+ 0.3406679034233093,
289
+ 0.3363434076309204,
290
+ 0.33855724334716797,
291
+ 0.3321431875228882,
292
+ 0.34290140867233276,
293
+ 0.3352099359035492,
294
+ 0.3338983356952667,
295
+ 0.3258536756038666,
296
+ 0.33761051297187805,
297
+ 0.33715319633483887,
298
+ 0.3330615758895874,
299
+ 0.32767096161842346,
300
+ 0.33492639660835266,
301
+ 0.3231773376464844,
302
+ 0.33072930574417114,
303
+ 0.3423689007759094,
304
+ 0.33502012491226196,
305
+ 0.33624961972236633,
306
+ 0.3346553146839142,
307
+ 0.3279629945755005,
308
+ 0.3266867995262146,
309
+ 0.3321791887283325,
310
+ 0.33108729124069214,
311
+ 0.33155086636543274,
312
+ 0.3317343592643738,
313
+ 0.3374349772930145,
314
+ 0.3357178270816803,
315
+ 0.32846030592918396,
316
+ 0.328380286693573,
317
+ 0.3357793390750885,
318
+ 0.3296501636505127,
319
+ 0.33293581008911133,
320
+ 0.3345809578895569,
321
+ 0.34283316135406494,
322
+ 0.3336940407752991,
323
+ 0.3340163826942444,
324
+ 0.33170098066329956,
325
+ 0.3387867212295532,
326
+ 0.3395037055015564,
327
+ 0.33608272671699524,
328
+ 0.3381228744983673,
329
+ 0.3256526589393616,
330
+ 0.32226407527923584,
331
+ 0.3270655870437622,
332
+ 0.32900455594062805,
333
+ 0.32871338725090027,
334
+ 0.3325023949146271,
335
+ 0.34181392192840576,
336
+ 0.33826935291290283,
337
+ 0.3314586281776428,
338
+ 0.33122166991233826,
339
+ 0.3373032808303833,
340
+ 0.3400927484035492,
341
+ 0.33277270197868347,
342
+ 0.33700406551361084,
343
+ 0.3378522992134094,
344
+ 0.3333711326122284,
345
+ 0.33014780282974243,
346
+ 0.33368366956710815,
347
+ 0.32724565267562866,
348
+ 0.3266543745994568,
349
+ 0.33365482091903687,
350
+ 0.3297240734100342,
351
+ 0.32680970430374146,
352
+ 0.33299076557159424,
353
+ 0.33300912380218506,
354
+ 0.33403903245925903,
355
+ 0.3431350588798523,
356
+ 0.33904892206192017,
357
+ 0.3324755132198334,
358
+ 0.32933175563812256,
359
+ 0.33719339966773987,
360
+ 0.32767781615257263,
361
+ 0.33541908860206604,
362
+ 0.3346007466316223,
363
+ 0.33879315853118896,
364
+ 0.3345041275024414,
365
+ 0.33489879965782166,
366
+ 0.3363777995109558,
367
+ 0.33767563104629517,
368
+ 0.3328354060649872,
369
+ 0.3331868052482605,
370
+ 0.3402370810508728,
371
+ 0.33388105034828186,
372
+ 0.33734720945358276,
373
+ 0.332383394241333,
374
+ 0.33302611112594604,
375
+ 0.33460700511932373,
376
+ 0.3303910791873932,
377
+ 0.3368116021156311,
378
+ 0.3294057250022888,
379
+ 0.3381325602531433,
380
+ 0.33359014987945557,
381
+ 0.33498138189315796,
382
+ 0.33019959926605225,
383
+ 0.33259788155555725,
384
+ 0.3409283459186554,
385
+ 0.3365859091281891,
386
+ 0.33277761936187744,
387
+ 0.3394026756286621,
388
+ 0.3290417790412903,
389
+ 0.3401448130607605,
390
+ 0.3251156806945801,
391
+ 0.33011412620544434,
392
+ 0.3365683853626251,
393
+ 0.33974623680114746,
394
+ 0.33201247453689575,
395
+ 0.3294023275375366,
396
+ 0.3409932851791382,
397
+ 0.34747999906539917,
398
+ 0.34078940749168396,
399
+ 0.33660799264907837,
400
+ 0.3298097848892212,
401
+ 0.3322901725769043,
402
+ 0.3355182111263275,
403
+ 0.341055691242218,
404
+ 0.33802860975265503,
405
+ 0.33179306983947754,
406
+ 0.3440161943435669,
407
+ 0.33081281185150146,
408
+ 0.3272419273853302,
409
+ 0.3260897696018219,
410
+ 0.33437293767929077,
411
+ 0.3293749690055847,
412
+ 0.3273012936115265,
413
+ 0.332683801651001,
414
+ 0.3310787081718445,
415
+ 0.3282574415206909,
416
+ 0.3340969979763031,
417
+ 0.339628666639328,
418
+ 0.3317316770553589,
419
+ 0.32998812198638916,
420
+ 0.33901870250701904,
421
+ 0.33634477853775024,
422
+ 0.32989999651908875,
423
+ 0.3339465856552124,
424
+ 0.3389207720756531,
425
+ 0.34303727746009827,
426
+ 0.33803778886795044,
427
+ 0.33491209149360657,
428
+ 0.33020907640457153,
429
+ 0.3321894407272339,
430
+ 0.3333378732204437,
431
+ 0.3393198847770691,
432
+ 0.34461069107055664,
433
+ 0.3298798203468323,
434
+ 0.33570319414138794,
435
+ 0.3291119933128357,
436
+ 0.3379652202129364,
437
+ 0.3366316556930542,
438
+ 0.3392751216888428,
439
+ 0.330910325050354,
440
+ 0.3388398289680481,
441
+ 0.32620128989219666,
442
+ 0.34021633863449097,
443
+ 0.3330092430114746,
444
+ 0.33735135197639465,
445
+ 0.33621883392333984,
446
+ 0.33607298135757446,
447
+ 0.33188751339912415,
448
+ 0.33755841851234436,
449
+ 0.3280537724494934,
450
+ 0.3305507302284241,
451
+ 0.32686758041381836,
452
+ 0.32987216114997864,
453
+ 0.3396640717983246,
454
+ 0.33654022216796875,
455
+ 0.3425779342651367,
456
+ 0.32754188776016235,
457
+ 0.3275264501571655,
458
+ 0.33224233984947205,
459
+ 0.33522123098373413,
460
+ 0.3300197422504425,
461
+ 0.3299338221549988,
462
+ 0.33014100790023804,
463
+ 0.33165717124938965,
464
+ 0.33280014991760254,
465
+ 0.3325314521789551,
466
+ 0.33692190051078796,
467
+ 0.3337472677230835,
468
+ 0.3372674286365509,
469
+ 0.33729901909828186,
470
+ 0.3348565995693207,
471
+ 0.3356059491634369,
472
+ 0.32656145095825195,
473
+ 0.33172452449798584,
474
+ 0.3321564793586731,
475
+ 0.32580462098121643,
476
+ 0.33925479650497437,
477
+ 0.3400028944015503,
478
+ 0.3347415030002594,
479
+ 0.333713561296463,
480
+ 0.33577901124954224,
481
+ 0.3256620466709137,
482
+ 0.32763227820396423,
483
+ 0.33191540837287903,
484
+ 0.3397204875946045,
485
+ 0.3354407250881195,
486
+ 0.337093323469162,
487
+ 0.3282209038734436,
488
+ 0.32860079407691956,
489
+ 0.3297363817691803,
490
+ 0.33467888832092285,
491
+ 0.34158656001091003,
492
+ 0.3324458599090576,
493
+ 0.3320366442203522,
494
+ 0.3411107659339905,
495
+ 0.33266565203666687,
496
+ 0.3380263149738312,
497
+ 0.32896336913108826,
498
+ 0.32966428995132446,
499
+ 0.3425551652908325,
500
+ 0.3358476161956787,
501
+ 0.33467555046081543,
502
+ 0.3310127854347229,
503
+ 0.33904367685317993,
504
+ 0.33704298734664917,
505
+ 0.32885774970054626,
506
+ 0.3259532153606415,
507
+ 0.336847722530365,
508
+ 0.33440321683883667,
509
+ 0.3305370807647705,
510
+ 0.33669552206993103,
511
+ 0.33197110891342163,
512
+ 0.33256542682647705,
513
+ 0.33659619092941284,
514
+ 0.3332558274269104
515
+ ],
516
+ "gradient_norms": [
517
+ 8.64771111707464e-19,
518
+ 3.8712929478931e-18,
519
+ 1.745819773021961e-17,
520
+ 7.49907583485141e-17,
521
+ 2.979541624107448e-16,
522
+ 1.3384685459987998e-15,
523
+ 5.608540992334309e-15,
524
+ 2.6169963819686753e-14,
525
+ 2.812787708913328e-13,
526
+ 2.449897706577331e-12,
527
+ 2.7808975608389908e-11,
528
+ 2.4811785959144572e-09,
529
+ 1.491367562778123e-08,
530
+ 1.0903946190410352e-07,
531
+ 7.237420049932553e-07,
532
+ 4.253757651895285e-06,
533
+ 2.5013401682372205e-05,
534
+ 0.00014615175314247608,
535
+ 0.0007018009782768786,
536
+ 0.006607615854591131
537
+ ],
538
+ "activation_means": [
539
+ 0.004745648708194494,
540
+ -8.492707274854183e-05,
541
+ 0.0009839760605245829,
542
+ 0.00041824899381026626,
543
+ -3.091913094976917e-05,
544
+ -3.619983544922434e-06,
545
+ -4.25032339990139e-06,
546
+ -1.3652680536324624e-05,
547
+ -4.909698327537626e-05,
548
+ -0.0001918129128171131,
549
+ -0.0005527863977476954,
550
+ -0.0006557117449119687,
551
+ -0.0008800626383163035,
552
+ -0.0013834433630108833,
553
+ -0.0029748189263045788,
554
+ -0.0030720613431185484,
555
+ -0.0037732573691755533,
556
+ -0.0025511696003377438,
557
+ -0.003509903559461236,
558
+ -0.001648824429139495
559
+ ],
560
+ "activation_stds": [
561
+ 0.17953188717365265,
562
+ 0.04192492738366127,
563
+ 0.00943511351943016,
564
+ 0.0022596188355237246,
565
+ 0.0005189738003537059,
566
+ 0.00011896424257429317,
567
+ 2.454679270158522e-05,
568
+ 1.9420922399149276e-05,
569
+ 8.438384247710928e-05,
570
+ 0.0003417829575482756,
571
+ 0.0005783369415439665,
572
+ 0.00275764730758965,
573
+ 0.004125435370951891,
574
+ 0.005355025641620159,
575
+ 0.004256225656718016,
576
+ 0.004457178059965372,
577
+ 0.003838905831798911,
578
+ 0.007069852203130722,
579
+ 0.007913228124380112,
580
+ 0.010841521434485912
581
+ ]
582
+ },
583
+ "res_mlp": {
584
+ "final_loss": 0.0629926323890686,
585
+ "initial_loss": 13.825733184814453,
586
+ "loss_history": [
587
+ 13.825733184814453,
588
+ 6.929441928863525,
589
+ 4.056141376495361,
590
+ 2.5541770458221436,
591
+ 1.7824699878692627,
592
+ 1.416144847869873,
593
+ 1.1620547771453857,
594
+ 0.9483454823493958,
595
+ 0.7843164801597595,
596
+ 0.697279155254364,
597
+ 0.6453202366828918,
598
+ 0.5573611855506897,
599
+ 0.5255516171455383,
600
+ 0.5015190839767456,
601
+ 0.45454704761505127,
602
+ 0.41940945386886597,
603
+ 0.3973648250102997,
604
+ 0.3921322822570801,
605
+ 0.3478171229362488,
606
+ 0.3742031157016754,
607
+ 0.33467820286750793,
608
+ 0.33183223009109497,
609
+ 0.3318370580673218,
610
+ 0.3350353240966797,
611
+ 0.3137206435203552,
612
+ 0.30033594369888306,
613
+ 0.3070758879184723,
614
+ 0.28984498977661133,
615
+ 0.2851133346557617,
616
+ 0.26924896240234375,
617
+ 0.2905859053134918,
618
+ 0.279144287109375,
619
+ 0.2638997435569763,
620
+ 0.2549370229244232,
621
+ 0.24959874153137207,
622
+ 0.2570638060569763,
623
+ 0.2534509301185608,
624
+ 0.25506916642189026,
625
+ 0.24851691722869873,
626
+ 0.23037107288837433,
627
+ 0.24302563071250916,
628
+ 0.22616733610630035,
629
+ 0.24495507776737213,
630
+ 0.23248232901096344,
631
+ 0.24176537990570068,
632
+ 0.2333303689956665,
633
+ 0.22003066539764404,
634
+ 0.245095893740654,
635
+ 0.23193161189556122,
636
+ 0.2175668478012085,
637
+ 0.22363689541816711,
638
+ 0.2120945304632187,
639
+ 0.23737770318984985,
640
+ 0.23073768615722656,
641
+ 0.21438273787498474,
642
+ 0.21955570578575134,
643
+ 0.21080368757247925,
644
+ 0.21987861394882202,
645
+ 0.21614855527877808,
646
+ 0.21649761497974396,
647
+ 0.19733500480651855,
648
+ 0.2083965241909027,
649
+ 0.20562587678432465,
650
+ 0.22173789143562317,
651
+ 0.2059110701084137,
652
+ 0.1945328712463379,
653
+ 0.21662525832653046,
654
+ 0.19985336065292358,
655
+ 0.19271507859230042,
656
+ 0.21030962467193604,
657
+ 0.2069288194179535,
658
+ 0.1867353767156601,
659
+ 0.20643624663352966,
660
+ 0.1913994699716568,
661
+ 0.18623554706573486,
662
+ 0.20420098304748535,
663
+ 0.20161986351013184,
664
+ 0.1983901560306549,
665
+ 0.19239430129528046,
666
+ 0.1878090798854828,
667
+ 0.19025678932666779,
668
+ 0.1812693476676941,
669
+ 0.19511495530605316,
670
+ 0.19247011840343475,
671
+ 0.19345001876354218,
672
+ 0.18723750114440918,
673
+ 0.17752212285995483,
674
+ 0.18105608224868774,
675
+ 0.17320361733436584,
676
+ 0.17695054411888123,
677
+ 0.18027013540267944,
678
+ 0.18198877573013306,
679
+ 0.1806012988090515,
680
+ 0.17939069867134094,
681
+ 0.19096586108207703,
682
+ 0.17916780710220337,
683
+ 0.1848122477531433,
684
+ 0.16437095403671265,
685
+ 0.1749158799648285,
686
+ 0.1854352056980133,
687
+ 0.17872394621372223,
688
+ 0.1727355718612671,
689
+ 0.17188334465026855,
690
+ 0.17672254145145416,
691
+ 0.17822399735450745,
692
+ 0.17592446506023407,
693
+ 0.1675281673669815,
694
+ 0.16010603308677673,
695
+ 0.17089994251728058,
696
+ 0.1601085066795349,
697
+ 0.1725354939699173,
698
+ 0.1574731022119522,
699
+ 0.1598099172115326,
700
+ 0.16953468322753906,
701
+ 0.16409367322921753,
702
+ 0.1595795452594757,
703
+ 0.15564961731433868,
704
+ 0.1542244702577591,
705
+ 0.14573857188224792,
706
+ 0.1609399914741516,
707
+ 0.15494975447654724,
708
+ 0.15977708995342255,
709
+ 0.1628899723291397,
710
+ 0.15699170529842377,
711
+ 0.15361425280570984,
712
+ 0.16150403022766113,
713
+ 0.15789395570755005,
714
+ 0.13668665289878845,
715
+ 0.16025841236114502,
716
+ 0.14876320958137512,
717
+ 0.15640254318714142,
718
+ 0.13928887248039246,
719
+ 0.15516719222068787,
720
+ 0.14445939660072327,
721
+ 0.1433185338973999,
722
+ 0.14129473268985748,
723
+ 0.14215922355651855,
724
+ 0.15496797859668732,
725
+ 0.1444668471813202,
726
+ 0.14378705620765686,
727
+ 0.14088605344295502,
728
+ 0.12942053377628326,
729
+ 0.1482706069946289,
730
+ 0.13720951974391937,
731
+ 0.1429380476474762,
732
+ 0.14560531079769135,
733
+ 0.13521014153957367,
734
+ 0.1422801911830902,
735
+ 0.1372361034154892,
736
+ 0.13660244643688202,
737
+ 0.13699297606945038,
738
+ 0.14125284552574158,
739
+ 0.1396929919719696,
740
+ 0.13849902153015137,
741
+ 0.14266842603683472,
742
+ 0.14512087404727936,
743
+ 0.14272311329841614,
744
+ 0.13200822472572327,
745
+ 0.12528839707374573,
746
+ 0.1362495869398117,
747
+ 0.13740304112434387,
748
+ 0.14004293084144592,
749
+ 0.13355493545532227,
750
+ 0.13202989101409912,
751
+ 0.12513452768325806,
752
+ 0.12320512533187866,
753
+ 0.13207478821277618,
754
+ 0.12799137830734253,
755
+ 0.12362419813871384,
756
+ 0.13280878961086273,
757
+ 0.1266961544752121,
758
+ 0.13285361230373383,
759
+ 0.13146376609802246,
760
+ 0.1272575557231903,
761
+ 0.13236036896705627,
762
+ 0.13058793544769287,
763
+ 0.12451867759227753,
764
+ 0.13076333701610565,
765
+ 0.12537893652915955,
766
+ 0.1286524534225464,
767
+ 0.1255934089422226,
768
+ 0.12199349701404572,
769
+ 0.12703447043895721,
770
+ 0.1205616444349289,
771
+ 0.11638176441192627,
772
+ 0.12982048094272614,
773
+ 0.11749467253684998,
774
+ 0.11279859393835068,
775
+ 0.11866491287946701,
776
+ 0.12125350534915924,
777
+ 0.12608124315738678,
778
+ 0.1334507018327713,
779
+ 0.12499742209911346,
780
+ 0.12244322896003723,
781
+ 0.12269967049360275,
782
+ 0.11862020939588547,
783
+ 0.11574031412601471,
784
+ 0.12193585187196732,
785
+ 0.11600715667009354,
786
+ 0.11964584141969681,
787
+ 0.1162799671292305,
788
+ 0.12539267539978027,
789
+ 0.12248687446117401,
790
+ 0.12070564925670624,
791
+ 0.13140465319156647,
792
+ 0.11640572547912598,
793
+ 0.10755001753568649,
794
+ 0.11134535819292068,
795
+ 0.11165831983089447,
796
+ 0.1097593680024147,
797
+ 0.11635623127222061,
798
+ 0.11294370889663696,
799
+ 0.10825790464878082,
800
+ 0.10611490160226822,
801
+ 0.11304027587175369,
802
+ 0.11056037247180939,
803
+ 0.11218193918466568,
804
+ 0.11071833968162537,
805
+ 0.11433180421590805,
806
+ 0.1080167144536972,
807
+ 0.11098785698413849,
808
+ 0.10625725984573364,
809
+ 0.10640506446361542,
810
+ 0.11352894455194473,
811
+ 0.11021991074085236,
812
+ 0.10663466155529022,
813
+ 0.10082174837589264,
814
+ 0.10823401808738708,
815
+ 0.10888013243675232,
816
+ 0.10405822843313217,
817
+ 0.10449113696813583,
818
+ 0.10663808882236481,
819
+ 0.1043190062046051,
820
+ 0.10356761515140533,
821
+ 0.10988475382328033,
822
+ 0.11231439560651779,
823
+ 0.10832472890615463,
824
+ 0.10288867354393005,
825
+ 0.11017926037311554,
826
+ 0.10268239676952362,
827
+ 0.10657632350921631,
828
+ 0.10329350084066391,
829
+ 0.11197119206190109,
830
+ 0.10926295816898346,
831
+ 0.1126130148768425,
832
+ 0.0998806282877922,
833
+ 0.10103444755077362,
834
+ 0.09290547668933868,
835
+ 0.09799303859472275,
836
+ 0.10779248923063278,
837
+ 0.10077505558729172,
838
+ 0.10144646465778351,
839
+ 0.10275106132030487,
840
+ 0.09488312900066376,
841
+ 0.0980915054678917,
842
+ 0.09439370036125183,
843
+ 0.10310178995132446,
844
+ 0.09724435210227966,
845
+ 0.10685458779335022,
846
+ 0.09623485803604126,
847
+ 0.09753909707069397,
848
+ 0.08963052928447723,
849
+ 0.09267763793468475,
850
+ 0.09678862243890762,
851
+ 0.09540798515081406,
852
+ 0.08834634721279144,
853
+ 0.09270018339157104,
854
+ 0.08261752128601074,
855
+ 0.1081431582570076,
856
+ 0.10075649619102478,
857
+ 0.09674010425806046,
858
+ 0.09663750231266022,
859
+ 0.09644731134176254,
860
+ 0.09872166812419891,
861
+ 0.09951721131801605,
862
+ 0.088838130235672,
863
+ 0.09299120306968689,
864
+ 0.09496532380580902,
865
+ 0.09245827049016953,
866
+ 0.09697187691926956,
867
+ 0.0878148078918457,
868
+ 0.09270801395177841,
869
+ 0.09216231107711792,
870
+ 0.09456576406955719,
871
+ 0.08298899233341217,
872
+ 0.09676386415958405,
873
+ 0.09488122165203094,
874
+ 0.09232550114393234,
875
+ 0.09934262931346893,
876
+ 0.08506445586681366,
877
+ 0.09329526126384735,
878
+ 0.09657076001167297,
879
+ 0.09500131011009216,
880
+ 0.09519918262958527,
881
+ 0.09765627980232239,
882
+ 0.08732327073812485,
883
+ 0.09301722794771194,
884
+ 0.09543395042419434,
885
+ 0.0873609408736229,
886
+ 0.08974739909172058,
887
+ 0.08848126232624054,
888
+ 0.08153203874826431,
889
+ 0.0837751030921936,
890
+ 0.09327980130910873,
891
+ 0.0937112420797348,
892
+ 0.0836104080080986,
893
+ 0.08840271085500717,
894
+ 0.08613412827253342,
895
+ 0.08702630549669266,
896
+ 0.0854334831237793,
897
+ 0.07984519749879837,
898
+ 0.0783020630478859,
899
+ 0.0839296504855156,
900
+ 0.0771411657333374,
901
+ 0.07718954980373383,
902
+ 0.08612189441919327,
903
+ 0.08547349274158478,
904
+ 0.08440866321325302,
905
+ 0.0895165503025055,
906
+ 0.08419612795114517,
907
+ 0.08556754887104034,
908
+ 0.08557409048080444,
909
+ 0.08724275976419449,
910
+ 0.08401279896497726,
911
+ 0.08161499351263046,
912
+ 0.08135215193033218,
913
+ 0.07858897000551224,
914
+ 0.07412116229534149,
915
+ 0.09073606133460999,
916
+ 0.0884423777461052,
917
+ 0.07584438472986221,
918
+ 0.08999098837375641,
919
+ 0.07833802700042725,
920
+ 0.08642788231372833,
921
+ 0.08511155843734741,
922
+ 0.07571419328451157,
923
+ 0.07647889107465744,
924
+ 0.0770968496799469,
925
+ 0.07909407466650009,
926
+ 0.07677635550498962,
927
+ 0.07856360077857971,
928
+ 0.07897358387708664,
929
+ 0.08044072985649109,
930
+ 0.0849953144788742,
931
+ 0.07985112816095352,
932
+ 0.07496027648448944,
933
+ 0.0693586990237236,
934
+ 0.077299565076828,
935
+ 0.07525025308132172,
936
+ 0.07886706292629242,
937
+ 0.07089076936244965,
938
+ 0.0745236724615097,
939
+ 0.08298902958631516,
940
+ 0.07434681057929993,
941
+ 0.07863019406795502,
942
+ 0.07296870648860931,
943
+ 0.07038713246583939,
944
+ 0.07498430460691452,
945
+ 0.0731402337551117,
946
+ 0.0791475921869278,
947
+ 0.07742582261562347,
948
+ 0.07537870854139328,
949
+ 0.0774664357304573,
950
+ 0.08444315940141678,
951
+ 0.06756129115819931,
952
+ 0.07491543889045715,
953
+ 0.07476594299077988,
954
+ 0.07262799143791199,
955
+ 0.0735686719417572,
956
+ 0.07892186939716339,
957
+ 0.07961255311965942,
958
+ 0.07117517292499542,
959
+ 0.06840993463993073,
960
+ 0.06531023234128952,
961
+ 0.07480637729167938,
962
+ 0.07482421398162842,
963
+ 0.07697328180074692,
964
+ 0.08092670142650604,
965
+ 0.07015441358089447,
966
+ 0.07309134304523468,
967
+ 0.07465572655200958,
968
+ 0.07515942305326462,
969
+ 0.07721630483865738,
970
+ 0.07378698885440826,
971
+ 0.0710270032286644,
972
+ 0.07413457334041595,
973
+ 0.07682187855243683,
974
+ 0.08446906507015228,
975
+ 0.07762646675109863,
976
+ 0.07136626541614532,
977
+ 0.07230590283870697,
978
+ 0.07373417913913727,
979
+ 0.07236794382333755,
980
+ 0.07123907655477524,
981
+ 0.08195364475250244,
982
+ 0.06900320947170258,
983
+ 0.060011740773916245,
984
+ 0.07414371520280838,
985
+ 0.07555309683084488,
986
+ 0.0644296333193779,
987
+ 0.07632855325937271,
988
+ 0.07520553469657898,
989
+ 0.07276205718517303,
990
+ 0.07271023094654083,
991
+ 0.06531301140785217,
992
+ 0.07297447323799133,
993
+ 0.07270961999893188,
994
+ 0.07454632222652435,
995
+ 0.07276542484760284,
996
+ 0.06848332285881042,
997
+ 0.06939152628183365,
998
+ 0.07199845463037491,
999
+ 0.07199475914239883,
1000
+ 0.06776336580514908,
1001
+ 0.06876210123300552,
1002
+ 0.07206545770168304,
1003
+ 0.06846804171800613,
1004
+ 0.07429170608520508,
1005
+ 0.0714627206325531,
1006
+ 0.07270139455795288,
1007
+ 0.07588784396648407,
1008
+ 0.07119745016098022,
1009
+ 0.06948363780975342,
1010
+ 0.06362828612327576,
1011
+ 0.07597526907920837,
1012
+ 0.07059313356876373,
1013
+ 0.0640760287642479,
1014
+ 0.06041271239519119,
1015
+ 0.062441278249025345,
1016
+ 0.06848485767841339,
1017
+ 0.06524111330509186,
1018
+ 0.06564353406429291,
1019
+ 0.07082067430019379,
1020
+ 0.0676988959312439,
1021
+ 0.07045383006334305,
1022
+ 0.06132864952087402,
1023
+ 0.0676838830113411,
1024
+ 0.064274862408638,
1025
+ 0.06932217627763748,
1026
+ 0.06570309400558472,
1027
+ 0.06711895018815994,
1028
+ 0.06243062764406204,
1029
+ 0.0685991570353508,
1030
+ 0.0648145079612732,
1031
+ 0.0689878761768341,
1032
+ 0.06215982884168625,
1033
+ 0.06463310867547989,
1034
+ 0.055849675089120865,
1035
+ 0.06691331416368484,
1036
+ 0.06402920186519623,
1037
+ 0.05663374066352844,
1038
+ 0.056076034903526306,
1039
+ 0.06126324087381363,
1040
+ 0.06105763465166092,
1041
+ 0.06767643988132477,
1042
+ 0.06495392322540283,
1043
+ 0.06322813034057617,
1044
+ 0.0626610741019249,
1045
+ 0.05588827282190323,
1046
+ 0.06816142797470093,
1047
+ 0.06441586464643478,
1048
+ 0.06622708588838577,
1049
+ 0.053589969873428345,
1050
+ 0.06528521329164505,
1051
+ 0.06313464045524597,
1052
+ 0.06422115117311478,
1053
+ 0.06403939425945282,
1054
+ 0.05603744089603424,
1055
+ 0.06019753962755203,
1056
+ 0.05978955700993538,
1057
+ 0.058692023158073425,
1058
+ 0.05943136289715767,
1059
+ 0.06272856146097183,
1060
+ 0.06204809248447418,
1061
+ 0.05660928413271904,
1062
+ 0.06422382593154907,
1063
+ 0.06855501979589462,
1064
+ 0.05489934980869293,
1065
+ 0.05919265374541283,
1066
+ 0.06072087585926056,
1067
+ 0.06199055165052414,
1068
+ 0.06212494522333145,
1069
+ 0.0532408244907856,
1070
+ 0.05850880220532417,
1071
+ 0.06332679837942123,
1072
+ 0.06473984569311142,
1073
+ 0.05620533972978592,
1074
+ 0.056782789528369904,
1075
+ 0.05984317883849144,
1076
+ 0.06279785186052322,
1077
+ 0.0680396780371666,
1078
+ 0.06252189725637436,
1079
+ 0.057086262851953506,
1080
+ 0.057004414498806,
1081
+ 0.05471985042095184,
1082
+ 0.05932869017124176,
1083
+ 0.06498537957668304,
1084
+ 0.06377285718917847,
1085
+ 0.06319063156843185,
1086
+ 0.0629926323890686
1087
+ ],
1088
+ "gradient_norms": [
1089
+ 0.0037803652230650187,
1090
+ 0.003631350351497531,
1091
+ 0.003396314335986972,
1092
+ 0.00274146581068635,
1093
+ 0.002563745016232133,
1094
+ 0.0024723419919610023,
1095
+ 0.002229638397693634,
1096
+ 0.002245080890133977,
1097
+ 0.002163525903597474,
1098
+ 0.0021340805105865,
1099
+ 0.0021220329217612743,
1100
+ 0.0020243690814822912,
1101
+ 0.0020883611869066954,
1102
+ 0.001933824154548347,
1103
+ 0.0018491963855922222,
1104
+ 0.0018003054428845644,
1105
+ 0.0017963032005354762,
1106
+ 0.0018056104891002178,
1107
+ 0.0018354005878791213,
1108
+ 0.0019063110230490565
1109
+ ],
1110
+ "activation_means": [
1111
+ -0.02131376974284649,
1112
+ -0.03601019084453583,
1113
+ -0.06662210822105408,
1114
+ -0.12518449127674103,
1115
+ -0.1524452120065689,
1116
+ -0.1727040708065033,
1117
+ -0.1917235553264618,
1118
+ -0.20844022929668427,
1119
+ -0.21533320844173431,
1120
+ -0.2277694195508957,
1121
+ -0.2347966730594635,
1122
+ -0.2530445158481598,
1123
+ -0.2579406797885895,
1124
+ -0.2545703649520874,
1125
+ -0.2688005566596985,
1126
+ -0.2855533957481384,
1127
+ -0.28739380836486816,
1128
+ -0.3037635087966919,
1129
+ -0.29087066650390625,
1130
+ -0.3035217523574829
1131
+ ],
1132
+ "activation_stds": [
1133
+ 0.13483233749866486,
1134
+ 0.1384648084640503,
1135
+ 0.14461848139762878,
1136
+ 0.14690853655338287,
1137
+ 0.155510812997818,
1138
+ 0.15813173353672028,
1139
+ 0.1588330715894699,
1140
+ 0.16174864768981934,
1141
+ 0.1593213975429535,
1142
+ 0.16204914450645447,
1143
+ 0.16705702245235443,
1144
+ 0.16576600074768066,
1145
+ 0.16414247453212738,
1146
+ 0.16486325860023499,
1147
+ 0.16198192536830902,
1148
+ 0.16898144781589508,
1149
+ 0.16573883593082428,
1150
+ 0.17666961252689362,
1151
+ 0.16819415986537933,
1152
+ 0.17242176830768585
1153
+ ]
1154
+ },
1155
+ "summary": {
1156
+ "loss_improvement": 5.2903937299934425,
1157
+ "plain_grad_range": [
1158
+ 8.64771111707464e-19,
1159
+ 0.006607615854591131
1160
+ ],
1161
+ "res_grad_range": [
1162
+ 0.0017963032005354762,
1163
+ 0.0037803652230650187
1164
+ ],
1165
+ "plain_std_range": [
1166
+ 1.9420922399149276e-05,
1167
+ 0.17953188717365265
1168
+ ],
1169
+ "res_std_range": [
1170
+ 0.13483233749866486,
1171
+ 0.17666961252689362
1172
+ ]
1173
+ }
1174
+ }