AmberLJC commited on
Commit
9ec0e35
·
verified ·
1 Parent(s): 7dbd1cf

Upload results.json with huggingface_hub

Browse files
Files changed (1) hide show
  1. results.json +1173 -0
results.json ADDED
@@ -0,0 +1,1173 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "config": {
3
+ "num_layers": 20,
4
+ "hidden_dim": 64,
5
+ "num_samples": 1024,
6
+ "training_steps": 500,
7
+ "learning_rate": 0.001,
8
+ "batch_size": 64
9
+ },
10
+ "plain_mlp": {
11
+ "final_loss": 0.3122814893722534,
12
+ "initial_loss": 0.42214322090148926,
13
+ "loss_history": [
14
+ 0.42214322090148926,
15
+ 0.36282670497894287,
16
+ 0.3482760190963745,
17
+ 0.3494352102279663,
18
+ 0.33545294404029846,
19
+ 0.3272090554237366,
20
+ 0.33767467737197876,
21
+ 0.3396916091442108,
22
+ 0.3351821303367615,
23
+ 0.3310932219028473,
24
+ 0.3351791501045227,
25
+ 0.34008604288101196,
26
+ 0.34631210565567017,
27
+ 0.33455097675323486,
28
+ 0.33241066336631775,
29
+ 0.327256441116333,
30
+ 0.3311437964439392,
31
+ 0.3305869996547699,
32
+ 0.3346586227416992,
33
+ 0.340005487203598,
34
+ 0.33456265926361084,
35
+ 0.33543068170547485,
36
+ 0.3316764235496521,
37
+ 0.342144250869751,
38
+ 0.3264315724372864,
39
+ 0.32780060172080994,
40
+ 0.3364536166191101,
41
+ 0.3336724638938904,
42
+ 0.33728402853012085,
43
+ 0.33577609062194824,
44
+ 0.33049479126930237,
45
+ 0.329383909702301,
46
+ 0.3264477550983429,
47
+ 0.3307558298110962,
48
+ 0.32680246233940125,
49
+ 0.333177387714386,
50
+ 0.33437252044677734,
51
+ 0.32979515194892883,
52
+ 0.33821630477905273,
53
+ 0.3267170190811157,
54
+ 0.3301219344139099,
55
+ 0.3348636031150818,
56
+ 0.3265611529350281,
57
+ 0.32980096340179443,
58
+ 0.33458641171455383,
59
+ 0.3295944631099701,
60
+ 0.32541388273239136,
61
+ 0.33195948600769043,
62
+ 0.33705854415893555,
63
+ 0.32626599073410034,
64
+ 0.32933109998703003,
65
+ 0.3315778374671936,
66
+ 0.3286918103694916,
67
+ 0.335918128490448,
68
+ 0.3317474126815796,
69
+ 0.3240748643875122,
70
+ 0.3326587975025177,
71
+ 0.32749223709106445,
72
+ 0.33983999490737915,
73
+ 0.3330131769180298,
74
+ 0.3279249370098114,
75
+ 0.328784316778183,
76
+ 0.3272261619567871,
77
+ 0.32868239283561707,
78
+ 0.34050124883651733,
79
+ 0.3372110426425934,
80
+ 0.33211958408355713,
81
+ 0.3379274010658264,
82
+ 0.3354094922542572,
83
+ 0.337791383266449,
84
+ 0.3335695266723633,
85
+ 0.33175790309906006,
86
+ 0.3285711705684662,
87
+ 0.3294464349746704,
88
+ 0.3280278742313385,
89
+ 0.33241695165634155,
90
+ 0.33453792333602905,
91
+ 0.32833805680274963,
92
+ 0.3319797217845917,
93
+ 0.3291819393634796,
94
+ 0.3294021785259247,
95
+ 0.3406433165073395,
96
+ 0.32606297731399536,
97
+ 0.3226204812526703,
98
+ 0.3310944437980652,
99
+ 0.3309115469455719,
100
+ 0.3352738618850708,
101
+ 0.33406805992126465,
102
+ 0.33366382122039795,
103
+ 0.34170109033584595,
104
+ 0.32491233944892883,
105
+ 0.3298508822917938,
106
+ 0.3299129009246826,
107
+ 0.33908554911613464,
108
+ 0.33246976137161255,
109
+ 0.33066731691360474,
110
+ 0.3304769694805145,
111
+ 0.32929137349128723,
112
+ 0.32822930812835693,
113
+ 0.3333491086959839,
114
+ 0.32887813448905945,
115
+ 0.3329111337661743,
116
+ 0.33009040355682373,
117
+ 0.3283909261226654,
118
+ 0.32943427562713623,
119
+ 0.33743613958358765,
120
+ 0.32562410831451416,
121
+ 0.3262087106704712,
122
+ 0.3281552195549011,
123
+ 0.32880309224128723,
124
+ 0.33024877309799194,
125
+ 0.33133694529533386,
126
+ 0.3343980014324188,
127
+ 0.3297366499900818,
128
+ 0.33445966243743896,
129
+ 0.3308635652065277,
130
+ 0.33346372842788696,
131
+ 0.3338125944137573,
132
+ 0.33411431312561035,
133
+ 0.32354146242141724,
134
+ 0.3296177089214325,
135
+ 0.3204713761806488,
136
+ 0.3324952721595764,
137
+ 0.32344335317611694,
138
+ 0.330871045589447,
139
+ 0.32716238498687744,
140
+ 0.337432861328125,
141
+ 0.3403051495552063,
142
+ 0.3313557505607605,
143
+ 0.32797929644584656,
144
+ 0.3364092707633972,
145
+ 0.3307040333747864,
146
+ 0.32038557529449463,
147
+ 0.31208786368370056,
148
+ 0.3315786123275757,
149
+ 0.33295413851737976,
150
+ 0.33243390917778015,
151
+ 0.3210064172744751,
152
+ 0.32867860794067383,
153
+ 0.3323233425617218,
154
+ 0.333433598279953,
155
+ 0.326099157333374,
156
+ 0.33212804794311523,
157
+ 0.3348027765750885,
158
+ 0.32956549525260925,
159
+ 0.3299698233604431,
160
+ 0.3317911624908447,
161
+ 0.33178210258483887,
162
+ 0.3308490216732025,
163
+ 0.3286418914794922,
164
+ 0.32811760902404785,
165
+ 0.326610267162323,
166
+ 0.3255402743816376,
167
+ 0.33278921246528625,
168
+ 0.3288092315196991,
169
+ 0.333260178565979,
170
+ 0.32541632652282715,
171
+ 0.325713574886322,
172
+ 0.3272123336791992,
173
+ 0.3295033872127533,
174
+ 0.3211234211921692,
175
+ 0.33132150769233704,
176
+ 0.32147130370140076,
177
+ 0.33328524231910706,
178
+ 0.3304368853569031,
179
+ 0.32660651206970215,
180
+ 0.32244348526000977,
181
+ 0.3221438229084015,
182
+ 0.32539036870002747,
183
+ 0.3355017304420471,
184
+ 0.33238741755485535,
185
+ 0.31443461775779724,
186
+ 0.32446616888046265,
187
+ 0.3186056911945343,
188
+ 0.3275202512741089,
189
+ 0.32419508695602417,
190
+ 0.3279516100883484,
191
+ 0.3259829878807068,
192
+ 0.32992708683013916,
193
+ 0.32248663902282715,
194
+ 0.3220922350883484,
195
+ 0.3303144872188568,
196
+ 0.332166850566864,
197
+ 0.32141345739364624,
198
+ 0.31897056102752686,
199
+ 0.32363876700401306,
200
+ 0.3221549689769745,
201
+ 0.33142802119255066,
202
+ 0.3282598853111267,
203
+ 0.31797027587890625,
204
+ 0.33446645736694336,
205
+ 0.33268487453460693,
206
+ 0.3175439238548279,
207
+ 0.33158648014068604,
208
+ 0.324335515499115,
209
+ 0.3174867630004883,
210
+ 0.32891330122947693,
211
+ 0.3220325708389282,
212
+ 0.3250204026699066,
213
+ 0.32564860582351685,
214
+ 0.32088494300842285,
215
+ 0.32883039116859436,
216
+ 0.32697242498397827,
217
+ 0.33850207924842834,
218
+ 0.3279131054878235,
219
+ 0.3202984929084778,
220
+ 0.3261798620223999,
221
+ 0.3341549038887024,
222
+ 0.3264288604259491,
223
+ 0.32558804750442505,
224
+ 0.3242926001548767,
225
+ 0.3234439492225647,
226
+ 0.31936201453208923,
227
+ 0.32065972685813904,
228
+ 0.3229916989803314,
229
+ 0.3290161192417145,
230
+ 0.31866925954818726,
231
+ 0.3291019797325134,
232
+ 0.3215341567993164,
233
+ 0.3218863010406494,
234
+ 0.3229762017726898,
235
+ 0.3182288408279419,
236
+ 0.3278171420097351,
237
+ 0.31954365968704224,
238
+ 0.32973426580429077,
239
+ 0.3156335949897766,
240
+ 0.3162286579608917,
241
+ 0.32882851362228394,
242
+ 0.3199450373649597,
243
+ 0.32140082120895386,
244
+ 0.3241465985774994,
245
+ 0.3269677758216858,
246
+ 0.3188479244709015,
247
+ 0.31919217109680176,
248
+ 0.3209821581840515,
249
+ 0.3129628300666809,
250
+ 0.3245271146297455,
251
+ 0.3315494656562805,
252
+ 0.32561102509498596,
253
+ 0.32373708486557007,
254
+ 0.3241332769393921,
255
+ 0.3227849304676056,
256
+ 0.3221299648284912,
257
+ 0.3213585615158081,
258
+ 0.3290410339832306,
259
+ 0.3342036008834839,
260
+ 0.3285410404205322,
261
+ 0.3231137990951538,
262
+ 0.31683844327926636,
263
+ 0.3211103677749634,
264
+ 0.33177798986434937,
265
+ 0.32102054357528687,
266
+ 0.3156767189502716,
267
+ 0.32156461477279663,
268
+ 0.3223722577095032,
269
+ 0.3139723539352417,
270
+ 0.32709231972694397,
271
+ 0.3173341751098633,
272
+ 0.31532400846481323,
273
+ 0.3170064687728882,
274
+ 0.31997907161712646,
275
+ 0.32745033502578735,
276
+ 0.32697030901908875,
277
+ 0.3204156756401062,
278
+ 0.3271084129810333,
279
+ 0.32671791315078735,
280
+ 0.3246278762817383,
281
+ 0.3164779245853424,
282
+ 0.3271852433681488,
283
+ 0.3196042776107788,
284
+ 0.32026350498199463,
285
+ 0.3120955228805542,
286
+ 0.318584680557251,
287
+ 0.32811853289604187,
288
+ 0.32301777601242065,
289
+ 0.32394924759864807,
290
+ 0.3186284899711609,
291
+ 0.33235689997673035,
292
+ 0.3238418698310852,
293
+ 0.32303276658058167,
294
+ 0.3165513277053833,
295
+ 0.3227938115596771,
296
+ 0.3216084837913513,
297
+ 0.32230186462402344,
298
+ 0.31495195627212524,
299
+ 0.322005957365036,
300
+ 0.3129628300666809,
301
+ 0.316558837890625,
302
+ 0.3285377323627472,
303
+ 0.32414621114730835,
304
+ 0.31914806365966797,
305
+ 0.3209497332572937,
306
+ 0.31563228368759155,
307
+ 0.315194308757782,
308
+ 0.32207655906677246,
309
+ 0.3177405595779419,
310
+ 0.31551986932754517,
311
+ 0.31802260875701904,
312
+ 0.32021886110305786,
313
+ 0.3208439350128174,
314
+ 0.31313204765319824,
315
+ 0.3136066198348999,
316
+ 0.31712469458580017,
317
+ 0.31795984506607056,
318
+ 0.3181302547454834,
319
+ 0.322174072265625,
320
+ 0.32505011558532715,
321
+ 0.31750059127807617,
322
+ 0.3222911059856415,
323
+ 0.3154448866844177,
324
+ 0.3248714208602905,
325
+ 0.3258054554462433,
326
+ 0.3222883343696594,
327
+ 0.3219612240791321,
328
+ 0.30858346819877625,
329
+ 0.30579590797424316,
330
+ 0.31194090843200684,
331
+ 0.30980226397514343,
332
+ 0.3115063011646271,
333
+ 0.3166201710700989,
334
+ 0.32646316289901733,
335
+ 0.32494890689849854,
336
+ 0.3148566484451294,
337
+ 0.31464236974716187,
338
+ 0.32489898800849915,
339
+ 0.3286982774734497,
340
+ 0.31258541345596313,
341
+ 0.32561126351356506,
342
+ 0.32239222526550293,
343
+ 0.31925585865974426,
344
+ 0.31524786353111267,
345
+ 0.3155617117881775,
346
+ 0.30894869565963745,
347
+ 0.31647616624832153,
348
+ 0.3181927800178528,
349
+ 0.3155575394630432,
350
+ 0.31147250533103943,
351
+ 0.3121526539325714,
352
+ 0.3178417980670929,
353
+ 0.31777507066726685,
354
+ 0.3277454078197479,
355
+ 0.3230074644088745,
356
+ 0.3155066967010498,
357
+ 0.3123127222061157,
358
+ 0.321414977312088,
359
+ 0.31344032287597656,
360
+ 0.31667494773864746,
361
+ 0.32026779651641846,
362
+ 0.32438141107559204,
363
+ 0.3171403110027313,
364
+ 0.3197984993457794,
365
+ 0.32138901948928833,
366
+ 0.3184692859649658,
367
+ 0.31916412711143494,
368
+ 0.3180121183395386,
369
+ 0.32657110691070557,
370
+ 0.31782758235931396,
371
+ 0.3241843581199646,
372
+ 0.31732508540153503,
373
+ 0.317064106464386,
374
+ 0.3212159276008606,
375
+ 0.31150341033935547,
376
+ 0.3197249472141266,
377
+ 0.31177613139152527,
378
+ 0.3193328082561493,
379
+ 0.3192586302757263,
380
+ 0.3233141303062439,
381
+ 0.3107929229736328,
382
+ 0.3158963918685913,
383
+ 0.32218313217163086,
384
+ 0.3179759979248047,
385
+ 0.3117298483848572,
386
+ 0.3206039369106293,
387
+ 0.31486546993255615,
388
+ 0.3219609260559082,
389
+ 0.30939263105392456,
390
+ 0.3182328939437866,
391
+ 0.3162742853164673,
392
+ 0.32427945733070374,
393
+ 0.3155043125152588,
394
+ 0.31323426961898804,
395
+ 0.3223169147968292,
396
+ 0.33166787028312683,
397
+ 0.3266363739967346,
398
+ 0.318408727645874,
399
+ 0.3162022829055786,
400
+ 0.316178560256958,
401
+ 0.3218512237071991,
402
+ 0.32263171672821045,
403
+ 0.3201322853565216,
404
+ 0.3166625499725342,
405
+ 0.3264351487159729,
406
+ 0.3150608539581299,
407
+ 0.3099004626274109,
408
+ 0.311903178691864,
409
+ 0.315491259098053,
410
+ 0.3139011859893799,
411
+ 0.3073548674583435,
412
+ 0.3136225640773773,
413
+ 0.3125903010368347,
414
+ 0.3150739371776581,
415
+ 0.31659185886383057,
416
+ 0.32262271642684937,
417
+ 0.3133242130279541,
418
+ 0.31148239970207214,
419
+ 0.32298412919044495,
420
+ 0.31778499484062195,
421
+ 0.30843785405158997,
422
+ 0.3154827952384949,
423
+ 0.31984445452690125,
424
+ 0.3228866457939148,
425
+ 0.31940460205078125,
426
+ 0.315796822309494,
427
+ 0.31098097562789917,
428
+ 0.31478509306907654,
429
+ 0.3137901723384857,
430
+ 0.3185809850692749,
431
+ 0.3246801793575287,
432
+ 0.30861347913742065,
433
+ 0.3175472021102905,
434
+ 0.3125755190849304,
435
+ 0.317693829536438,
436
+ 0.31665486097335815,
437
+ 0.31839433312416077,
438
+ 0.31122976541519165,
439
+ 0.3198891580104828,
440
+ 0.3025595247745514,
441
+ 0.31865018606185913,
442
+ 0.31307554244995117,
443
+ 0.310791939496994,
444
+ 0.3189123570919037,
445
+ 0.31337010860443115,
446
+ 0.3129110038280487,
447
+ 0.3109862804412842,
448
+ 0.3105536699295044,
449
+ 0.3100142478942871,
450
+ 0.30681681632995605,
451
+ 0.30979853868484497,
452
+ 0.32108548283576965,
453
+ 0.31359052658081055,
454
+ 0.32146626710891724,
455
+ 0.3074720501899719,
456
+ 0.30723342299461365,
457
+ 0.3087216317653656,
458
+ 0.31279802322387695,
459
+ 0.30798858404159546,
460
+ 0.3053668141365051,
461
+ 0.3111911118030548,
462
+ 0.3119443953037262,
463
+ 0.31192684173583984,
464
+ 0.3080732822418213,
465
+ 0.31404170393943787,
466
+ 0.3138525187969208,
467
+ 0.31473881006240845,
468
+ 0.31580841541290283,
469
+ 0.3151828646659851,
470
+ 0.31342148780822754,
471
+ 0.3052767515182495,
472
+ 0.3119245171546936,
473
+ 0.3106262683868408,
474
+ 0.3038669228553772,
475
+ 0.3183707296848297,
476
+ 0.3203107714653015,
477
+ 0.309036523103714,
478
+ 0.31399810314178467,
479
+ 0.31323930621147156,
480
+ 0.306890606880188,
481
+ 0.30548590421676636,
482
+ 0.3077350854873657,
483
+ 0.3146387040615082,
484
+ 0.3109719455242157,
485
+ 0.31250497698783875,
486
+ 0.3004187345504761,
487
+ 0.30847451090812683,
488
+ 0.31020867824554443,
489
+ 0.31392747163772583,
490
+ 0.31991061568260193,
491
+ 0.3089701533317566,
492
+ 0.3094186782836914,
493
+ 0.316642165184021,
494
+ 0.3136940002441406,
495
+ 0.31746378540992737,
496
+ 0.3059760332107544,
497
+ 0.30767661333084106,
498
+ 0.31823939085006714,
499
+ 0.3136705756187439,
500
+ 0.31073373556137085,
501
+ 0.31243982911109924,
502
+ 0.31552764773368835,
503
+ 0.3138889670372009,
504
+ 0.30521848797798157,
505
+ 0.2989374101161957,
506
+ 0.3153800964355469,
507
+ 0.31432241201400757,
508
+ 0.31000563502311707,
509
+ 0.3153458833694458,
510
+ 0.31128472089767456,
511
+ 0.310610294342041,
512
+ 0.3141220808029175,
513
+ 0.3122814893722534
514
+ ],
515
+ "gradient_norms": [
516
+ 0.010068393312394619,
517
+ 0.009067831560969353,
518
+ 0.008841422386467457,
519
+ 0.008336398750543594,
520
+ 0.007635441143065691,
521
+ 0.007993700914084911,
522
+ 0.008473974652588367,
523
+ 0.008481012657284737,
524
+ 0.00877982284873724,
525
+ 0.009291221387684345,
526
+ 0.009246684610843658,
527
+ 0.010227610357105732,
528
+ 0.009622696787118912,
529
+ 0.008872134611010551,
530
+ 0.009406423196196556,
531
+ 0.009590999223291874,
532
+ 0.010016469284892082,
533
+ 0.010378911159932613,
534
+ 0.010058541782200336,
535
+ 0.009685155935585499
536
+ ],
537
+ "activation_means": [
538
+ 0.02235810086131096,
539
+ -0.0006043091416358948,
540
+ 0.027520379051566124,
541
+ 0.09677311778068542,
542
+ -0.09256714582443237,
543
+ -0.0832536593079567,
544
+ -0.03931272402405739,
545
+ -0.10891453176736832,
546
+ -0.1333763301372528,
547
+ -0.01697702705860138,
548
+ -0.24202276766300201,
549
+ -0.022496212273836136,
550
+ 0.0013794712722301483,
551
+ -0.07350999861955643,
552
+ -0.09732113778591156,
553
+ -0.0586143396794796,
554
+ -0.09032783657312393,
555
+ -0.010199513286352158,
556
+ 0.010252870619297028,
557
+ -0.1822284758090973
558
+ ],
559
+ "activation_stds": [
560
+ 0.8081836700439453,
561
+ 0.8764128684997559,
562
+ 0.9008104205131531,
563
+ 0.9063840508460999,
564
+ 0.9467869400978088,
565
+ 0.9418801069259644,
566
+ 0.8313923478126526,
567
+ 0.7985774874687195,
568
+ 0.843100905418396,
569
+ 0.7745543718338013,
570
+ 0.7544355392456055,
571
+ 0.5160097479820251,
572
+ 0.5802003741264343,
573
+ 0.5734189748764038,
574
+ 0.48425760865211487,
575
+ 0.44677266478538513,
576
+ 0.44068723917007446,
577
+ 0.4156236946582794,
578
+ 0.424014687538147,
579
+ 0.35631605982780457
580
+ ]
581
+ },
582
+ "res_mlp": {
583
+ "final_loss": 0.0629926323890686,
584
+ "initial_loss": 13.825733184814453,
585
+ "loss_history": [
586
+ 13.825733184814453,
587
+ 6.929441928863525,
588
+ 4.056141376495361,
589
+ 2.5541770458221436,
590
+ 1.7824699878692627,
591
+ 1.416144847869873,
592
+ 1.1620547771453857,
593
+ 0.9483454823493958,
594
+ 0.7843164801597595,
595
+ 0.697279155254364,
596
+ 0.6453202366828918,
597
+ 0.5573611855506897,
598
+ 0.5255516171455383,
599
+ 0.5015190839767456,
600
+ 0.45454704761505127,
601
+ 0.41940945386886597,
602
+ 0.3973648250102997,
603
+ 0.3921322822570801,
604
+ 0.3478171229362488,
605
+ 0.3742031157016754,
606
+ 0.33467820286750793,
607
+ 0.33183223009109497,
608
+ 0.3318370580673218,
609
+ 0.3350353240966797,
610
+ 0.3137206435203552,
611
+ 0.30033594369888306,
612
+ 0.3070758879184723,
613
+ 0.28984498977661133,
614
+ 0.2851133346557617,
615
+ 0.26924896240234375,
616
+ 0.2905859053134918,
617
+ 0.279144287109375,
618
+ 0.2638997435569763,
619
+ 0.2549370229244232,
620
+ 0.24959874153137207,
621
+ 0.2570638060569763,
622
+ 0.2534509301185608,
623
+ 0.25506916642189026,
624
+ 0.24851691722869873,
625
+ 0.23037107288837433,
626
+ 0.24302563071250916,
627
+ 0.22616733610630035,
628
+ 0.24495507776737213,
629
+ 0.23248232901096344,
630
+ 0.24176537990570068,
631
+ 0.2333303689956665,
632
+ 0.22003066539764404,
633
+ 0.245095893740654,
634
+ 0.23193161189556122,
635
+ 0.2175668478012085,
636
+ 0.22363689541816711,
637
+ 0.2120945304632187,
638
+ 0.23737770318984985,
639
+ 0.23073768615722656,
640
+ 0.21438273787498474,
641
+ 0.21955570578575134,
642
+ 0.21080368757247925,
643
+ 0.21987861394882202,
644
+ 0.21614855527877808,
645
+ 0.21649761497974396,
646
+ 0.19733500480651855,
647
+ 0.2083965241909027,
648
+ 0.20562587678432465,
649
+ 0.22173789143562317,
650
+ 0.2059110701084137,
651
+ 0.1945328712463379,
652
+ 0.21662525832653046,
653
+ 0.19985336065292358,
654
+ 0.19271507859230042,
655
+ 0.21030962467193604,
656
+ 0.2069288194179535,
657
+ 0.1867353767156601,
658
+ 0.20643624663352966,
659
+ 0.1913994699716568,
660
+ 0.18623554706573486,
661
+ 0.20420098304748535,
662
+ 0.20161986351013184,
663
+ 0.1983901560306549,
664
+ 0.19239430129528046,
665
+ 0.1878090798854828,
666
+ 0.19025678932666779,
667
+ 0.1812693476676941,
668
+ 0.19511495530605316,
669
+ 0.19247011840343475,
670
+ 0.19345001876354218,
671
+ 0.18723750114440918,
672
+ 0.17752212285995483,
673
+ 0.18105608224868774,
674
+ 0.17320361733436584,
675
+ 0.17695054411888123,
676
+ 0.18027013540267944,
677
+ 0.18198877573013306,
678
+ 0.1806012988090515,
679
+ 0.17939069867134094,
680
+ 0.19096586108207703,
681
+ 0.17916780710220337,
682
+ 0.1848122477531433,
683
+ 0.16437095403671265,
684
+ 0.1749158799648285,
685
+ 0.1854352056980133,
686
+ 0.17872394621372223,
687
+ 0.1727355718612671,
688
+ 0.17188334465026855,
689
+ 0.17672254145145416,
690
+ 0.17822399735450745,
691
+ 0.17592446506023407,
692
+ 0.1675281673669815,
693
+ 0.16010603308677673,
694
+ 0.17089994251728058,
695
+ 0.1601085066795349,
696
+ 0.1725354939699173,
697
+ 0.1574731022119522,
698
+ 0.1598099172115326,
699
+ 0.16953468322753906,
700
+ 0.16409367322921753,
701
+ 0.1595795452594757,
702
+ 0.15564961731433868,
703
+ 0.1542244702577591,
704
+ 0.14573857188224792,
705
+ 0.1609399914741516,
706
+ 0.15494975447654724,
707
+ 0.15977708995342255,
708
+ 0.1628899723291397,
709
+ 0.15699170529842377,
710
+ 0.15361425280570984,
711
+ 0.16150403022766113,
712
+ 0.15789395570755005,
713
+ 0.13668665289878845,
714
+ 0.16025841236114502,
715
+ 0.14876320958137512,
716
+ 0.15640254318714142,
717
+ 0.13928887248039246,
718
+ 0.15516719222068787,
719
+ 0.14445939660072327,
720
+ 0.1433185338973999,
721
+ 0.14129473268985748,
722
+ 0.14215922355651855,
723
+ 0.15496797859668732,
724
+ 0.1444668471813202,
725
+ 0.14378705620765686,
726
+ 0.14088605344295502,
727
+ 0.12942053377628326,
728
+ 0.1482706069946289,
729
+ 0.13720951974391937,
730
+ 0.1429380476474762,
731
+ 0.14560531079769135,
732
+ 0.13521014153957367,
733
+ 0.1422801911830902,
734
+ 0.1372361034154892,
735
+ 0.13660244643688202,
736
+ 0.13699297606945038,
737
+ 0.14125284552574158,
738
+ 0.1396929919719696,
739
+ 0.13849902153015137,
740
+ 0.14266842603683472,
741
+ 0.14512087404727936,
742
+ 0.14272311329841614,
743
+ 0.13200822472572327,
744
+ 0.12528839707374573,
745
+ 0.1362495869398117,
746
+ 0.13740304112434387,
747
+ 0.14004293084144592,
748
+ 0.13355493545532227,
749
+ 0.13202989101409912,
750
+ 0.12513452768325806,
751
+ 0.12320512533187866,
752
+ 0.13207478821277618,
753
+ 0.12799137830734253,
754
+ 0.12362419813871384,
755
+ 0.13280878961086273,
756
+ 0.1266961544752121,
757
+ 0.13285361230373383,
758
+ 0.13146376609802246,
759
+ 0.1272575557231903,
760
+ 0.13236036896705627,
761
+ 0.13058793544769287,
762
+ 0.12451867759227753,
763
+ 0.13076333701610565,
764
+ 0.12537893652915955,
765
+ 0.1286524534225464,
766
+ 0.1255934089422226,
767
+ 0.12199349701404572,
768
+ 0.12703447043895721,
769
+ 0.1205616444349289,
770
+ 0.11638176441192627,
771
+ 0.12982048094272614,
772
+ 0.11749467253684998,
773
+ 0.11279859393835068,
774
+ 0.11866491287946701,
775
+ 0.12125350534915924,
776
+ 0.12608124315738678,
777
+ 0.1334507018327713,
778
+ 0.12499742209911346,
779
+ 0.12244322896003723,
780
+ 0.12269967049360275,
781
+ 0.11862020939588547,
782
+ 0.11574031412601471,
783
+ 0.12193585187196732,
784
+ 0.11600715667009354,
785
+ 0.11964584141969681,
786
+ 0.1162799671292305,
787
+ 0.12539267539978027,
788
+ 0.12248687446117401,
789
+ 0.12070564925670624,
790
+ 0.13140465319156647,
791
+ 0.11640572547912598,
792
+ 0.10755001753568649,
793
+ 0.11134535819292068,
794
+ 0.11165831983089447,
795
+ 0.1097593680024147,
796
+ 0.11635623127222061,
797
+ 0.11294370889663696,
798
+ 0.10825790464878082,
799
+ 0.10611490160226822,
800
+ 0.11304027587175369,
801
+ 0.11056037247180939,
802
+ 0.11218193918466568,
803
+ 0.11071833968162537,
804
+ 0.11433180421590805,
805
+ 0.1080167144536972,
806
+ 0.11098785698413849,
807
+ 0.10625725984573364,
808
+ 0.10640506446361542,
809
+ 0.11352894455194473,
810
+ 0.11021991074085236,
811
+ 0.10663466155529022,
812
+ 0.10082174837589264,
813
+ 0.10823401808738708,
814
+ 0.10888013243675232,
815
+ 0.10405822843313217,
816
+ 0.10449113696813583,
817
+ 0.10663808882236481,
818
+ 0.1043190062046051,
819
+ 0.10356761515140533,
820
+ 0.10988475382328033,
821
+ 0.11231439560651779,
822
+ 0.10832472890615463,
823
+ 0.10288867354393005,
824
+ 0.11017926037311554,
825
+ 0.10268239676952362,
826
+ 0.10657632350921631,
827
+ 0.10329350084066391,
828
+ 0.11197119206190109,
829
+ 0.10926295816898346,
830
+ 0.1126130148768425,
831
+ 0.0998806282877922,
832
+ 0.10103444755077362,
833
+ 0.09290547668933868,
834
+ 0.09799303859472275,
835
+ 0.10779248923063278,
836
+ 0.10077505558729172,
837
+ 0.10144646465778351,
838
+ 0.10275106132030487,
839
+ 0.09488312900066376,
840
+ 0.0980915054678917,
841
+ 0.09439370036125183,
842
+ 0.10310178995132446,
843
+ 0.09724435210227966,
844
+ 0.10685458779335022,
845
+ 0.09623485803604126,
846
+ 0.09753909707069397,
847
+ 0.08963052928447723,
848
+ 0.09267763793468475,
849
+ 0.09678862243890762,
850
+ 0.09540798515081406,
851
+ 0.08834634721279144,
852
+ 0.09270018339157104,
853
+ 0.08261752128601074,
854
+ 0.1081431582570076,
855
+ 0.10075649619102478,
856
+ 0.09674010425806046,
857
+ 0.09663750231266022,
858
+ 0.09644731134176254,
859
+ 0.09872166812419891,
860
+ 0.09951721131801605,
861
+ 0.088838130235672,
862
+ 0.09299120306968689,
863
+ 0.09496532380580902,
864
+ 0.09245827049016953,
865
+ 0.09697187691926956,
866
+ 0.0878148078918457,
867
+ 0.09270801395177841,
868
+ 0.09216231107711792,
869
+ 0.09456576406955719,
870
+ 0.08298899233341217,
871
+ 0.09676386415958405,
872
+ 0.09488122165203094,
873
+ 0.09232550114393234,
874
+ 0.09934262931346893,
875
+ 0.08506445586681366,
876
+ 0.09329526126384735,
877
+ 0.09657076001167297,
878
+ 0.09500131011009216,
879
+ 0.09519918262958527,
880
+ 0.09765627980232239,
881
+ 0.08732327073812485,
882
+ 0.09301722794771194,
883
+ 0.09543395042419434,
884
+ 0.0873609408736229,
885
+ 0.08974739909172058,
886
+ 0.08848126232624054,
887
+ 0.08153203874826431,
888
+ 0.0837751030921936,
889
+ 0.09327980130910873,
890
+ 0.0937112420797348,
891
+ 0.0836104080080986,
892
+ 0.08840271085500717,
893
+ 0.08613412827253342,
894
+ 0.08702630549669266,
895
+ 0.0854334831237793,
896
+ 0.07984519749879837,
897
+ 0.0783020630478859,
898
+ 0.0839296504855156,
899
+ 0.0771411657333374,
900
+ 0.07718954980373383,
901
+ 0.08612189441919327,
902
+ 0.08547349274158478,
903
+ 0.08440866321325302,
904
+ 0.0895165503025055,
905
+ 0.08419612795114517,
906
+ 0.08556754887104034,
907
+ 0.08557409048080444,
908
+ 0.08724275976419449,
909
+ 0.08401279896497726,
910
+ 0.08161499351263046,
911
+ 0.08135215193033218,
912
+ 0.07858897000551224,
913
+ 0.07412116229534149,
914
+ 0.09073606133460999,
915
+ 0.0884423777461052,
916
+ 0.07584438472986221,
917
+ 0.08999098837375641,
918
+ 0.07833802700042725,
919
+ 0.08642788231372833,
920
+ 0.08511155843734741,
921
+ 0.07571419328451157,
922
+ 0.07647889107465744,
923
+ 0.0770968496799469,
924
+ 0.07909407466650009,
925
+ 0.07677635550498962,
926
+ 0.07856360077857971,
927
+ 0.07897358387708664,
928
+ 0.08044072985649109,
929
+ 0.0849953144788742,
930
+ 0.07985112816095352,
931
+ 0.07496027648448944,
932
+ 0.0693586990237236,
933
+ 0.077299565076828,
934
+ 0.07525025308132172,
935
+ 0.07886706292629242,
936
+ 0.07089076936244965,
937
+ 0.0745236724615097,
938
+ 0.08298902958631516,
939
+ 0.07434681057929993,
940
+ 0.07863019406795502,
941
+ 0.07296870648860931,
942
+ 0.07038713246583939,
943
+ 0.07498430460691452,
944
+ 0.0731402337551117,
945
+ 0.0791475921869278,
946
+ 0.07742582261562347,
947
+ 0.07537870854139328,
948
+ 0.0774664357304573,
949
+ 0.08444315940141678,
950
+ 0.06756129115819931,
951
+ 0.07491543889045715,
952
+ 0.07476594299077988,
953
+ 0.07262799143791199,
954
+ 0.0735686719417572,
955
+ 0.07892186939716339,
956
+ 0.07961255311965942,
957
+ 0.07117517292499542,
958
+ 0.06840993463993073,
959
+ 0.06531023234128952,
960
+ 0.07480637729167938,
961
+ 0.07482421398162842,
962
+ 0.07697328180074692,
963
+ 0.08092670142650604,
964
+ 0.07015441358089447,
965
+ 0.07309134304523468,
966
+ 0.07465572655200958,
967
+ 0.07515942305326462,
968
+ 0.07721630483865738,
969
+ 0.07378698885440826,
970
+ 0.0710270032286644,
971
+ 0.07413457334041595,
972
+ 0.07682187855243683,
973
+ 0.08446906507015228,
974
+ 0.07762646675109863,
975
+ 0.07136626541614532,
976
+ 0.07230590283870697,
977
+ 0.07373417913913727,
978
+ 0.07236794382333755,
979
+ 0.07123907655477524,
980
+ 0.08195364475250244,
981
+ 0.06900320947170258,
982
+ 0.060011740773916245,
983
+ 0.07414371520280838,
984
+ 0.07555309683084488,
985
+ 0.0644296333193779,
986
+ 0.07632855325937271,
987
+ 0.07520553469657898,
988
+ 0.07276205718517303,
989
+ 0.07271023094654083,
990
+ 0.06531301140785217,
991
+ 0.07297447323799133,
992
+ 0.07270961999893188,
993
+ 0.07454632222652435,
994
+ 0.07276542484760284,
995
+ 0.06848332285881042,
996
+ 0.06939152628183365,
997
+ 0.07199845463037491,
998
+ 0.07199475914239883,
999
+ 0.06776336580514908,
1000
+ 0.06876210123300552,
1001
+ 0.07206545770168304,
1002
+ 0.06846804171800613,
1003
+ 0.07429170608520508,
1004
+ 0.0714627206325531,
1005
+ 0.07270139455795288,
1006
+ 0.07588784396648407,
1007
+ 0.07119745016098022,
1008
+ 0.06948363780975342,
1009
+ 0.06362828612327576,
1010
+ 0.07597526907920837,
1011
+ 0.07059313356876373,
1012
+ 0.0640760287642479,
1013
+ 0.06041271239519119,
1014
+ 0.062441278249025345,
1015
+ 0.06848485767841339,
1016
+ 0.06524111330509186,
1017
+ 0.06564353406429291,
1018
+ 0.07082067430019379,
1019
+ 0.0676988959312439,
1020
+ 0.07045383006334305,
1021
+ 0.06132864952087402,
1022
+ 0.0676838830113411,
1023
+ 0.064274862408638,
1024
+ 0.06932217627763748,
1025
+ 0.06570309400558472,
1026
+ 0.06711895018815994,
1027
+ 0.06243062764406204,
1028
+ 0.0685991570353508,
1029
+ 0.0648145079612732,
1030
+ 0.0689878761768341,
1031
+ 0.06215982884168625,
1032
+ 0.06463310867547989,
1033
+ 0.055849675089120865,
1034
+ 0.06691331416368484,
1035
+ 0.06402920186519623,
1036
+ 0.05663374066352844,
1037
+ 0.056076034903526306,
1038
+ 0.06126324087381363,
1039
+ 0.06105763465166092,
1040
+ 0.06767643988132477,
1041
+ 0.06495392322540283,
1042
+ 0.06322813034057617,
1043
+ 0.0626610741019249,
1044
+ 0.05588827282190323,
1045
+ 0.06816142797470093,
1046
+ 0.06441586464643478,
1047
+ 0.06622708588838577,
1048
+ 0.053589969873428345,
1049
+ 0.06528521329164505,
1050
+ 0.06313464045524597,
1051
+ 0.06422115117311478,
1052
+ 0.06403939425945282,
1053
+ 0.05603744089603424,
1054
+ 0.06019753962755203,
1055
+ 0.05978955700993538,
1056
+ 0.058692023158073425,
1057
+ 0.05943136289715767,
1058
+ 0.06272856146097183,
1059
+ 0.06204809248447418,
1060
+ 0.05660928413271904,
1061
+ 0.06422382593154907,
1062
+ 0.06855501979589462,
1063
+ 0.05489934980869293,
1064
+ 0.05919265374541283,
1065
+ 0.06072087585926056,
1066
+ 0.06199055165052414,
1067
+ 0.06212494522333145,
1068
+ 0.0532408244907856,
1069
+ 0.05850880220532417,
1070
+ 0.06332679837942123,
1071
+ 0.06473984569311142,
1072
+ 0.05620533972978592,
1073
+ 0.056782789528369904,
1074
+ 0.05984317883849144,
1075
+ 0.06279785186052322,
1076
+ 0.0680396780371666,
1077
+ 0.06252189725637436,
1078
+ 0.057086262851953506,
1079
+ 0.057004414498806,
1080
+ 0.05471985042095184,
1081
+ 0.05932869017124176,
1082
+ 0.06498537957668304,
1083
+ 0.06377285718917847,
1084
+ 0.06319063156843185,
1085
+ 0.0629926323890686
1086
+ ],
1087
+ "gradient_norms": [
1088
+ 0.0037803652230650187,
1089
+ 0.003631350351497531,
1090
+ 0.003396314335986972,
1091
+ 0.00274146581068635,
1092
+ 0.002563745016232133,
1093
+ 0.0024723419919610023,
1094
+ 0.002229638397693634,
1095
+ 0.002245080890133977,
1096
+ 0.002163525903597474,
1097
+ 0.0021340805105865,
1098
+ 0.0021220329217612743,
1099
+ 0.0020243690814822912,
1100
+ 0.0020883611869066954,
1101
+ 0.001933824154548347,
1102
+ 0.0018491963855922222,
1103
+ 0.0018003054428845644,
1104
+ 0.0017963032005354762,
1105
+ 0.0018056104891002178,
1106
+ 0.0018354005878791213,
1107
+ 0.0019063110230490565
1108
+ ],
1109
+ "activation_means": [
1110
+ -0.02131376974284649,
1111
+ -0.03601019084453583,
1112
+ -0.06662210822105408,
1113
+ -0.12518449127674103,
1114
+ -0.1524452120065689,
1115
+ -0.1727040708065033,
1116
+ -0.1917235553264618,
1117
+ -0.20844022929668427,
1118
+ -0.21533320844173431,
1119
+ -0.2277694195508957,
1120
+ -0.2347966730594635,
1121
+ -0.2530445158481598,
1122
+ -0.2579406797885895,
1123
+ -0.2545703649520874,
1124
+ -0.2688005566596985,
1125
+ -0.2855533957481384,
1126
+ -0.28739380836486816,
1127
+ -0.3037635087966919,
1128
+ -0.29087066650390625,
1129
+ -0.3035217523574829
1130
+ ],
1131
+ "activation_stds": [
1132
+ 0.13483233749866486,
1133
+ 0.1384648084640503,
1134
+ 0.14461848139762878,
1135
+ 0.14690853655338287,
1136
+ 0.155510812997818,
1137
+ 0.15813173353672028,
1138
+ 0.1588330715894699,
1139
+ 0.16174864768981934,
1140
+ 0.1593213975429535,
1141
+ 0.16204914450645447,
1142
+ 0.16705702245235443,
1143
+ 0.16576600074768066,
1144
+ 0.16414247453212738,
1145
+ 0.16486325860023499,
1146
+ 0.16198192536830902,
1147
+ 0.16898144781589508,
1148
+ 0.16573883593082428,
1149
+ 0.17666961252689362,
1150
+ 0.16819415986537933,
1151
+ 0.17242176830768585
1152
+ ]
1153
+ },
1154
+ "summary": {
1155
+ "loss_improvement": 4.957428790139671,
1156
+ "plain_grad_range": [
1157
+ 0.007635441143065691,
1158
+ 0.010378911159932613
1159
+ ],
1160
+ "res_grad_range": [
1161
+ 0.0017963032005354762,
1162
+ 0.0037803652230650187
1163
+ ],
1164
+ "plain_std_range": [
1165
+ 0.35631605982780457,
1166
+ 0.9467869400978088
1167
+ ],
1168
+ "res_std_range": [
1169
+ 0.13483233749866486,
1170
+ 0.17666961252689362
1171
+ ]
1172
+ }
1173
+ }