smithblack-0 commited on
Commit
7d9008d
·
verified ·
1 Parent(s): 9768aa5

Upload folder using huggingface_hub

Browse files
control_123/epoch1/metadata.json ADDED
@@ -0,0 +1,6 @@
 
 
 
 
 
 
 
1
+ {
2
+ "epoch_num": 1,
3
+ "global_batch_num": 268,
4
+ "device": "cuda",
5
+ "dtype": "bfloat16"
6
+ }
control_123/epoch1/metrics.json ADDED
@@ -0,0 +1,1102 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "training": {
3
+ "effective_batch_nums": [
4
+ 1,
5
+ 2,
6
+ 3,
7
+ 4,
8
+ 5,
9
+ 6,
10
+ 7,
11
+ 8,
12
+ 9,
13
+ 10,
14
+ 11,
15
+ 12,
16
+ 13,
17
+ 14,
18
+ 15,
19
+ 16,
20
+ 17,
21
+ 18,
22
+ 19,
23
+ 20,
24
+ 21,
25
+ 22,
26
+ 23,
27
+ 24,
28
+ 25,
29
+ 26,
30
+ 27,
31
+ 28,
32
+ 29,
33
+ 30,
34
+ 31,
35
+ 32,
36
+ 33,
37
+ 34,
38
+ 35,
39
+ 36,
40
+ 37,
41
+ 38,
42
+ 39,
43
+ 40,
44
+ 41,
45
+ 42,
46
+ 43,
47
+ 44,
48
+ 45,
49
+ 46,
50
+ 47,
51
+ 48,
52
+ 49,
53
+ 50,
54
+ 51,
55
+ 52,
56
+ 53,
57
+ 54,
58
+ 55,
59
+ 56,
60
+ 57,
61
+ 58,
62
+ 59,
63
+ 60,
64
+ 61,
65
+ 62,
66
+ 63,
67
+ 64,
68
+ 65,
69
+ 66,
70
+ 67,
71
+ 68,
72
+ 69,
73
+ 70,
74
+ 71,
75
+ 72,
76
+ 73,
77
+ 74,
78
+ 75,
79
+ 76,
80
+ 77,
81
+ 78,
82
+ 79,
83
+ 80,
84
+ 81,
85
+ 82,
86
+ 83,
87
+ 84,
88
+ 85,
89
+ 86,
90
+ 87,
91
+ 88,
92
+ 89,
93
+ 90,
94
+ 91,
95
+ 92,
96
+ 93,
97
+ 94,
98
+ 95,
99
+ 96,
100
+ 97,
101
+ 98,
102
+ 99,
103
+ 100,
104
+ 101,
105
+ 102,
106
+ 103,
107
+ 104,
108
+ 105,
109
+ 106,
110
+ 107,
111
+ 108,
112
+ 109,
113
+ 110,
114
+ 111,
115
+ 112,
116
+ 113,
117
+ 114,
118
+ 115,
119
+ 116,
120
+ 117,
121
+ 118,
122
+ 119,
123
+ 120,
124
+ 121,
125
+ 122,
126
+ 123,
127
+ 124,
128
+ 125,
129
+ 126,
130
+ 127,
131
+ 128,
132
+ 129,
133
+ 130,
134
+ 131,
135
+ 132,
136
+ 133,
137
+ 134,
138
+ 135,
139
+ 136,
140
+ 137,
141
+ 138,
142
+ 139,
143
+ 140,
144
+ 141,
145
+ 142,
146
+ 143,
147
+ 144,
148
+ 145,
149
+ 146,
150
+ 147,
151
+ 148,
152
+ 149,
153
+ 150,
154
+ 151,
155
+ 152,
156
+ 153,
157
+ 154,
158
+ 155,
159
+ 156,
160
+ 157,
161
+ 158,
162
+ 159,
163
+ 160,
164
+ 161,
165
+ 162,
166
+ 163,
167
+ 164,
168
+ 165,
169
+ 166,
170
+ 167,
171
+ 168,
172
+ 169,
173
+ 170,
174
+ 171,
175
+ 172,
176
+ 173,
177
+ 174,
178
+ 175,
179
+ 176,
180
+ 177,
181
+ 178,
182
+ 179,
183
+ 180,
184
+ 181,
185
+ 182,
186
+ 183,
187
+ 184,
188
+ 185,
189
+ 186,
190
+ 187,
191
+ 188,
192
+ 189,
193
+ 190,
194
+ 191,
195
+ 192,
196
+ 193,
197
+ 194,
198
+ 195,
199
+ 196,
200
+ 197,
201
+ 198,
202
+ 199,
203
+ 200,
204
+ 201,
205
+ 202,
206
+ 203,
207
+ 204,
208
+ 205,
209
+ 206,
210
+ 207,
211
+ 208,
212
+ 209,
213
+ 210,
214
+ 211,
215
+ 212,
216
+ 213,
217
+ 214,
218
+ 215,
219
+ 216,
220
+ 217,
221
+ 218,
222
+ 219,
223
+ 220,
224
+ 221,
225
+ 222,
226
+ 223,
227
+ 224,
228
+ 225,
229
+ 226,
230
+ 227,
231
+ 228,
232
+ 229,
233
+ 230,
234
+ 231,
235
+ 232,
236
+ 233,
237
+ 234,
238
+ 235,
239
+ 236,
240
+ 237,
241
+ 238,
242
+ 239,
243
+ 240,
244
+ 241,
245
+ 242,
246
+ 243,
247
+ 244,
248
+ 245,
249
+ 246,
250
+ 247,
251
+ 248,
252
+ 249,
253
+ 250,
254
+ 251,
255
+ 252,
256
+ 253,
257
+ 254,
258
+ 255,
259
+ 256,
260
+ 257,
261
+ 258,
262
+ 259,
263
+ 260,
264
+ 261,
265
+ 262,
266
+ 263,
267
+ 264,
268
+ 265,
269
+ 266,
270
+ 267,
271
+ 268
272
+ ],
273
+ "losses": [
274
+ 11.0,
275
+ 10.625,
276
+ 10.0625,
277
+ 9.625,
278
+ 9.3125,
279
+ 9.0625,
280
+ 8.8125,
281
+ 8.625,
282
+ 8.5625,
283
+ 8.5,
284
+ 8.4375,
285
+ 8.3125,
286
+ 8.375,
287
+ 8.375,
288
+ 8.3125,
289
+ 8.375,
290
+ 8.3125,
291
+ 8.1875,
292
+ 8.25,
293
+ 8.25,
294
+ 8.125,
295
+ 8.25,
296
+ 8.125,
297
+ 8.25,
298
+ 8.125,
299
+ 8.125,
300
+ 8.0625,
301
+ 8.1875,
302
+ 8.0625,
303
+ 8.0,
304
+ 8.0,
305
+ 8.0625,
306
+ 8.0,
307
+ 8.0625,
308
+ 8.0625,
309
+ 8.0,
310
+ 8.0625,
311
+ 7.96875,
312
+ 8.0,
313
+ 8.0,
314
+ 8.0,
315
+ 8.0,
316
+ 7.875,
317
+ 7.96875,
318
+ 7.90625,
319
+ 7.90625,
320
+ 7.9375,
321
+ 7.9375,
322
+ 7.90625,
323
+ 7.90625,
324
+ 7.96875,
325
+ 7.875,
326
+ 7.875,
327
+ 7.84375,
328
+ 7.90625,
329
+ 7.84375,
330
+ 7.84375,
331
+ 7.84375,
332
+ 7.875,
333
+ 7.84375,
334
+ 7.875,
335
+ 7.8125,
336
+ 7.75,
337
+ 7.84375,
338
+ 7.8125,
339
+ 7.8125,
340
+ 7.8125,
341
+ 7.78125,
342
+ 7.75,
343
+ 7.75,
344
+ 7.75,
345
+ 7.71875,
346
+ 7.75,
347
+ 7.71875,
348
+ 7.65625,
349
+ 7.75,
350
+ 7.71875,
351
+ 7.65625,
352
+ 7.65625,
353
+ 7.78125,
354
+ 7.71875,
355
+ 7.65625,
356
+ 7.6875,
357
+ 7.6875,
358
+ 7.625,
359
+ 7.71875,
360
+ 7.59375,
361
+ 7.6875,
362
+ 7.65625,
363
+ 7.625,
364
+ 7.59375,
365
+ 7.59375,
366
+ 7.5625,
367
+ 7.59375,
368
+ 7.625,
369
+ 7.5625,
370
+ 7.59375,
371
+ 7.5,
372
+ 7.59375,
373
+ 7.5625,
374
+ 7.53125,
375
+ 7.53125,
376
+ 7.5625,
377
+ 7.5625,
378
+ 7.5,
379
+ 7.625,
380
+ 7.53125,
381
+ 7.46875,
382
+ 7.5,
383
+ 7.46875,
384
+ 7.5625,
385
+ 7.4375,
386
+ 7.5,
387
+ 7.5,
388
+ 7.46875,
389
+ 7.53125,
390
+ 7.46875,
391
+ 7.53125,
392
+ 7.46875,
393
+ 7.4375,
394
+ 7.5,
395
+ 7.46875,
396
+ 7.4375,
397
+ 7.4375,
398
+ 7.4375,
399
+ 7.40625,
400
+ 7.40625,
401
+ 7.40625,
402
+ 7.46875,
403
+ 7.40625,
404
+ 7.4375,
405
+ 7.375,
406
+ 7.4375,
407
+ 7.375,
408
+ 7.3125,
409
+ 7.25,
410
+ 7.34375,
411
+ 7.28125,
412
+ 7.28125,
413
+ 7.25,
414
+ 7.25,
415
+ 7.21875,
416
+ 7.28125,
417
+ 7.25,
418
+ 7.3125,
419
+ 7.25,
420
+ 7.21875,
421
+ 7.21875,
422
+ 7.15625,
423
+ 7.25,
424
+ 7.28125,
425
+ 7.25,
426
+ 7.21875,
427
+ 7.21875,
428
+ 7.21875,
429
+ 7.1875,
430
+ 7.25,
431
+ 7.28125,
432
+ 7.3125,
433
+ 7.25,
434
+ 7.25,
435
+ 7.25,
436
+ 7.15625,
437
+ 7.15625,
438
+ 7.1875,
439
+ 7.15625,
440
+ 7.15625,
441
+ 7.1875,
442
+ 7.21875,
443
+ 7.1875,
444
+ 7.1875,
445
+ 7.1875,
446
+ 7.15625,
447
+ 7.15625,
448
+ 7.1875,
449
+ 7.21875,
450
+ 7.125,
451
+ 7.1875,
452
+ 7.125,
453
+ 7.15625,
454
+ 7.1875,
455
+ 7.15625,
456
+ 7.15625,
457
+ 7.15625,
458
+ 7.15625,
459
+ 7.1875,
460
+ 7.125,
461
+ 7.09375,
462
+ 7.125,
463
+ 7.09375,
464
+ 7.15625,
465
+ 7.125,
466
+ 7.15625,
467
+ 7.0625,
468
+ 7.09375,
469
+ 7.09375,
470
+ 7.09375,
471
+ 7.15625,
472
+ 7.15625,
473
+ 7.125,
474
+ 7.125,
475
+ 7.09375,
476
+ 7.125,
477
+ 7.15625,
478
+ 7.15625,
479
+ 7.03125,
480
+ 7.0625,
481
+ 7.0625,
482
+ 7.0625,
483
+ 7.15625,
484
+ 7.0625,
485
+ 7.09375,
486
+ 7.0625,
487
+ 7.03125,
488
+ 7.09375,
489
+ 7.03125,
490
+ 7.0625,
491
+ 7.0,
492
+ 7.0,
493
+ 7.0625,
494
+ 7.0625,
495
+ 7.0625,
496
+ 7.09375,
497
+ 7.03125,
498
+ 7.09375,
499
+ 7.0625,
500
+ 7.0625,
501
+ 7.03125,
502
+ 7.0625,
503
+ 6.9375,
504
+ 7.0,
505
+ 7.0625,
506
+ 7.03125,
507
+ 7.0625,
508
+ 6.9375,
509
+ 6.9375,
510
+ 6.9375,
511
+ 7.03125,
512
+ 6.96875,
513
+ 7.0625,
514
+ 6.96875,
515
+ 7.0,
516
+ 7.0,
517
+ 6.90625,
518
+ 7.0625,
519
+ 7.03125,
520
+ 6.96875,
521
+ 6.96875,
522
+ 6.9375,
523
+ 6.96875,
524
+ 6.96875,
525
+ 7.0,
526
+ 7.0,
527
+ 6.9375,
528
+ 6.90625,
529
+ 7.0625,
530
+ 6.90625,
531
+ 7.03125,
532
+ 7.0,
533
+ 6.90625,
534
+ 7.0,
535
+ 6.9375,
536
+ 6.875,
537
+ 7.03125,
538
+ 6.84375,
539
+ 6.96875,
540
+ 6.96875,
541
+ 6.96875
542
+ ],
543
+ "accuracies": [
544
+ 6.324310650139134e-05,
545
+ 0.038764945149759644,
546
+ 0.052486878280429895,
547
+ 0.04908647990255786,
548
+ 0.0503037205770691,
549
+ 0.05076499208628876,
550
+ 0.048659556068031136,
551
+ 0.050592094290320785,
552
+ 0.06654567453115548,
553
+ 0.09441481209000062,
554
+ 0.10186898003444536,
555
+ 0.10660169548094253,
556
+ 0.10997624703087885,
557
+ 0.10079990377097492,
558
+ 0.10412937867553056,
559
+ 0.10075116251341362,
560
+ 0.11032388663967611,
561
+ 0.1145608500747136,
562
+ 0.11100705156456589,
563
+ 0.11410872459908528,
564
+ 0.1185922893627421,
565
+ 0.11541055988225915,
566
+ 0.11899897854954035,
567
+ 0.1100331573130296,
568
+ 0.1200594161715319,
569
+ 0.12133838383838384,
570
+ 0.11935819707269275,
571
+ 0.11066705847781369,
572
+ 0.1198848704792892,
573
+ 0.11711109761282877,
574
+ 0.12153883851997059,
575
+ 0.11506930109112357,
576
+ 0.1227846487313528,
577
+ 0.12027955599929524,
578
+ 0.11891060338442254,
579
+ 0.11972796891073266,
580
+ 0.11658014885233597,
581
+ 0.12334060454970396,
582
+ 0.1211556383970177,
583
+ 0.11820386913565639,
584
+ 0.12710209737355924,
585
+ 0.12634892086330934,
586
+ 0.12856000492095712,
587
+ 0.12711045420953898,
588
+ 0.12670829406220546,
589
+ 0.12903430346839134,
590
+ 0.12716516223469138,
591
+ 0.13136645962732918,
592
+ 0.12688978649740335,
593
+ 0.12631578947368421,
594
+ 0.12279997706816488,
595
+ 0.130340882558954,
596
+ 0.1363857177556473,
597
+ 0.1348738505069559,
598
+ 0.13268984765670427,
599
+ 0.13376947040498444,
600
+ 0.13119533527696792,
601
+ 0.13716866753833354,
602
+ 0.13,
603
+ 0.1365387837158653,
604
+ 0.12980420594633793,
605
+ 0.1360337775432115,
606
+ 0.14029741589468553,
607
+ 0.1364586964098989,
608
+ 0.13929240862230552,
609
+ 0.13862089375554898,
610
+ 0.14103549916698704,
611
+ 0.13962515921635227,
612
+ 0.14413484692122464,
613
+ 0.14635021223172118,
614
+ 0.14873269185637175,
615
+ 0.14737252861602498,
616
+ 0.1478513731825525,
617
+ 0.1468228021161505,
618
+ 0.1520194351655026,
619
+ 0.14839417392894144,
620
+ 0.14768919516975407,
621
+ 0.1529133571818347,
622
+ 0.15290778428649074,
623
+ 0.14818009315163017,
624
+ 0.15045987947986045,
625
+ 0.15479751495628163,
626
+ 0.15290646208321038,
627
+ 0.15635324015247776,
628
+ 0.158407030424384,
629
+ 0.15062280421590546,
630
+ 0.15759060360530117,
631
+ 0.15545615197702672,
632
+ 0.16099673612854631,
633
+ 0.15965248787092406,
634
+ 0.16358638437244122,
635
+ 0.16348982233203907,
636
+ 0.16076243024641043,
637
+ 0.16447368421052633,
638
+ 0.1572537757923846,
639
+ 0.16234564288640488,
640
+ 0.1637586226885398,
641
+ 0.16611925214754927,
642
+ 0.16175567833026397,
643
+ 0.16503720100842403,
644
+ 0.165823089901181,
645
+ 0.16753735876564207,
646
+ 0.1632179910740161,
647
+ 0.1608744066107953,
648
+ 0.16475204731574158,
649
+ 0.16584815503052827,
650
+ 0.1722479298587433,
651
+ 0.17150969612759018,
652
+ 0.17206504494976202,
653
+ 0.173767697954903,
654
+ 0.17260753987433541,
655
+ 0.17217119405901896,
656
+ 0.1731940818102698,
657
+ 0.1674297341981432,
658
+ 0.17060936338865496,
659
+ 0.16779089376053963,
660
+ 0.17310558294164852,
661
+ 0.1691967487449199,
662
+ 0.1755561172901921,
663
+ 0.1738278781751548,
664
+ 0.1736499967818755,
665
+ 0.171884264200166,
666
+ 0.17854012039039213,
667
+ 0.17619443784169242,
668
+ 0.17811032863849766,
669
+ 0.18120584852965335,
670
+ 0.1778608464970457,
671
+ 0.1843941248470012,
672
+ 0.17403777193401865,
673
+ 0.17751989389920425,
674
+ 0.17969303423848879,
675
+ 0.19001370434368112,
676
+ 0.1759136527172884,
677
+ 0.18311817279046674,
678
+ 0.17789165446559296,
679
+ 0.1871589085072231,
680
+ 0.1765788989136439,
681
+ 0.189447701326751,
682
+ 0.18931845356715823,
683
+ 0.1868917809825302,
684
+ 0.18790670889720704,
685
+ 0.18926386421945923,
686
+ 0.18291187291946504,
687
+ 0.18864071474154434,
688
+ 0.17798098467873796,
689
+ 0.18834106728538283,
690
+ 0.18340585675643892,
691
+ 0.19335458558116725,
692
+ 0.19225535073611283,
693
+ 0.18715177178515713,
694
+ 0.18541968162083936,
695
+ 0.1823062558356676,
696
+ 0.19053089853670335,
697
+ 0.1946129263679645,
698
+ 0.18928960348472232,
699
+ 0.19444912635541323,
700
+ 0.19299015612264092,
701
+ 0.1882717890592376,
702
+ 0.1872116018457482,
703
+ 0.19448292477263146,
704
+ 0.19547121485534663,
705
+ 0.19044665012406947,
706
+ 0.20087137469111718,
707
+ 0.19615048118985126,
708
+ 0.1951075395887497,
709
+ 0.19535367996355826,
710
+ 0.18784427802191,
711
+ 0.194937707875303,
712
+ 0.1908488142882743,
713
+ 0.20153135776491904,
714
+ 0.1926605504587156,
715
+ 0.19699082142442198,
716
+ 0.19692150403271613,
717
+ 0.19562313124244546,
718
+ 0.19745339344462046,
719
+ 0.19032374969799468,
720
+ 0.19800012819691046,
721
+ 0.1961576758624729,
722
+ 0.19922871182434534,
723
+ 0.20145054395398274,
724
+ 0.20119195756107144,
725
+ 0.19755801168913836,
726
+ 0.19876126126126126,
727
+ 0.20227815542899136,
728
+ 0.19643169494490118,
729
+ 0.19284243048403707,
730
+ 0.20234442125935928,
731
+ 0.2057829515583928,
732
+ 0.20347636530518587,
733
+ 0.2079017377030622,
734
+ 0.1998993900521914,
735
+ 0.20626995645863572,
736
+ 0.20260936300844207,
737
+ 0.20567375886524822,
738
+ 0.2074946605397709,
739
+ 0.2041157482130505,
740
+ 0.20585323598564534,
741
+ 0.20127094814981442,
742
+ 0.20116457247931352,
743
+ 0.20800576519916142,
744
+ 0.2008390451429922,
745
+ 0.2006463154250101,
746
+ 0.20092420332473143,
747
+ 0.20137350465219317,
748
+ 0.19311934740202163,
749
+ 0.20634446502180537,
750
+ 0.20786765170171118,
751
+ 0.20203627107858735,
752
+ 0.20465060385747763,
753
+ 0.2006873695838959,
754
+ 0.20694931463181385,
755
+ 0.20679870280287235,
756
+ 0.20877061469265368,
757
+ 0.20853848550950452,
758
+ 0.2100193845408287,
759
+ 0.2063750581665891,
760
+ 0.2060075248257571,
761
+ 0.21961594555177444,
762
+ 0.2156645081714462,
763
+ 0.21021579674710322,
764
+ 0.2080113741732089,
765
+ 0.2078752237279468,
766
+ 0.1999341057602548,
767
+ 0.20673269594091717,
768
+ 0.20649497571038797,
769
+ 0.21180840024031897,
770
+ 0.203,
771
+ 0.22024159320927195,
772
+ 0.21177188167124122,
773
+ 0.21415486077186127,
774
+ 0.20953263450512538,
775
+ 0.20348160223567768,
776
+ 0.21502870459841983,
777
+ 0.2132319041032734,
778
+ 0.21496590641899835,
779
+ 0.21915171086133017,
780
+ 0.22162760656947778,
781
+ 0.2104796786389414,
782
+ 0.2144240702479339,
783
+ 0.2079324794900549,
784
+ 0.22114063899671543,
785
+ 0.21620850918216036,
786
+ 0.21643656272316114,
787
+ 0.21707317073170732,
788
+ 0.21037152631894845,
789
+ 0.21644640234948606,
790
+ 0.20962600934976625,
791
+ 0.21583823786492629,
792
+ 0.21772867758269218,
793
+ 0.2169487442028549,
794
+ 0.21434133679428943,
795
+ 0.21078556806550666,
796
+ 0.21164510166358594,
797
+ 0.21986809081888753,
798
+ 0.21673074538013146,
799
+ 0.2107152179587575,
800
+ 0.2176851431167651,
801
+ 0.2146035228865728,
802
+ 0.2119031648271236,
803
+ 0.2239442299936625,
804
+ 0.21033210332103322,
805
+ 0.22376716955640621,
806
+ 0.2159126560833281,
807
+ 0.21613905982363762,
808
+ 0.21870372479781297,
809
+ 0.22078409304070531,
810
+ 0.2218245784301832,
811
+ 0.22308698495748855
812
+ ],
813
+ "grad_norms": [
814
+ 0.4921875,
815
+ 0.91015625,
816
+ 0.8359375,
817
+ 0.84375,
818
+ 0.83203125,
819
+ 0.78515625,
820
+ 0.6640625,
821
+ 0.54296875,
822
+ 0.384765625,
823
+ 0.265625,
824
+ 0.236328125,
825
+ 0.265625,
826
+ 0.400390625,
827
+ 0.27734375,
828
+ 0.25390625,
829
+ 0.25,
830
+ 0.1787109375,
831
+ 0.244140625,
832
+ 0.1904296875,
833
+ 0.1396484375,
834
+ 0.1728515625,
835
+ 0.150390625,
836
+ 0.1767578125,
837
+ 0.1513671875,
838
+ 0.1953125,
839
+ 0.15234375,
840
+ 0.1474609375,
841
+ 0.158203125,
842
+ 0.1484375,
843
+ 0.1552734375,
844
+ 0.140625,
845
+ 0.154296875,
846
+ 0.173828125,
847
+ 0.12158203125,
848
+ 0.11181640625,
849
+ 0.11572265625,
850
+ 0.1259765625,
851
+ 0.1806640625,
852
+ 0.3203125,
853
+ 0.232421875,
854
+ 0.140625,
855
+ 0.171875,
856
+ 0.1259765625,
857
+ 0.1357421875,
858
+ 0.1494140625,
859
+ 0.1396484375,
860
+ 0.12890625,
861
+ 0.125,
862
+ 0.1328125,
863
+ 0.185546875,
864
+ 0.12890625,
865
+ 0.134765625,
866
+ 0.17578125,
867
+ 0.1962890625,
868
+ 0.1875,
869
+ 0.125,
870
+ 0.18359375,
871
+ 0.349609375,
872
+ 0.439453125,
873
+ 0.1396484375,
874
+ 0.26953125,
875
+ 0.1953125,
876
+ 0.2236328125,
877
+ 0.1826171875,
878
+ 0.2158203125,
879
+ 0.1787109375,
880
+ 0.201171875,
881
+ 0.1806640625,
882
+ 0.1416015625,
883
+ 0.1416015625,
884
+ 0.16015625,
885
+ 0.16796875,
886
+ 0.1396484375,
887
+ 0.1796875,
888
+ 0.1953125,
889
+ 0.1328125,
890
+ 0.181640625,
891
+ 0.1826171875,
892
+ 0.14453125,
893
+ 0.1572265625,
894
+ 0.220703125,
895
+ 0.1767578125,
896
+ 0.1796875,
897
+ 0.1357421875,
898
+ 0.16796875,
899
+ 0.1474609375,
900
+ 0.1650390625,
901
+ 0.15234375,
902
+ 0.1611328125,
903
+ 0.15234375,
904
+ 0.1376953125,
905
+ 0.1533203125,
906
+ 0.16796875,
907
+ 0.125,
908
+ 0.146484375,
909
+ 0.1591796875,
910
+ 0.13671875,
911
+ 0.1826171875,
912
+ 0.150390625,
913
+ 0.2578125,
914
+ 0.216796875,
915
+ 0.1640625,
916
+ 0.193359375,
917
+ 0.20703125,
918
+ 0.2177734375,
919
+ 0.232421875,
920
+ 0.189453125,
921
+ 0.1865234375,
922
+ 0.2021484375,
923
+ 0.18359375,
924
+ 0.154296875,
925
+ 0.1669921875,
926
+ 0.1396484375,
927
+ 0.16015625,
928
+ 0.1396484375,
929
+ 0.14453125,
930
+ 0.12255859375,
931
+ 0.1689453125,
932
+ 0.205078125,
933
+ 0.1708984375,
934
+ 0.1630859375,
935
+ 0.201171875,
936
+ 0.2080078125,
937
+ 0.2734375,
938
+ 0.1943359375,
939
+ 0.228515625,
940
+ 0.21484375,
941
+ 0.1943359375,
942
+ 0.1806640625,
943
+ 0.27734375,
944
+ 0.1640625,
945
+ 0.1943359375,
946
+ 0.185546875,
947
+ 0.18359375,
948
+ 0.1865234375,
949
+ 0.2177734375,
950
+ 0.197265625,
951
+ 0.18359375,
952
+ 0.162109375,
953
+ 0.19140625,
954
+ 0.166015625,
955
+ 0.1748046875,
956
+ 0.1552734375,
957
+ 0.166015625,
958
+ 0.1630859375,
959
+ 0.15234375,
960
+ 0.1591796875,
961
+ 0.1357421875,
962
+ 0.166015625,
963
+ 0.1650390625,
964
+ 0.154296875,
965
+ 0.1572265625,
966
+ 0.1806640625,
967
+ 0.169921875,
968
+ 0.1708984375,
969
+ 0.17578125,
970
+ 0.166015625,
971
+ 0.2138671875,
972
+ 0.2197265625,
973
+ 0.1806640625,
974
+ 0.2314453125,
975
+ 0.2236328125,
976
+ 0.16796875,
977
+ 0.1533203125,
978
+ 0.1650390625,
979
+ 0.15625,
980
+ 0.1767578125,
981
+ 0.15234375,
982
+ 0.17578125,
983
+ 0.1435546875,
984
+ 0.166015625,
985
+ 0.1708984375,
986
+ 0.138671875,
987
+ 0.1513671875,
988
+ 0.1845703125,
989
+ 0.212890625,
990
+ 0.2001953125,
991
+ 0.2021484375,
992
+ 0.1923828125,
993
+ 0.21484375,
994
+ 0.1962890625,
995
+ 0.1982421875,
996
+ 0.171875,
997
+ 0.197265625,
998
+ 0.166015625,
999
+ 0.169921875,
1000
+ 0.1748046875,
1001
+ 0.1494140625,
1002
+ 0.2119140625,
1003
+ 0.150390625,
1004
+ 0.16796875,
1005
+ 0.1748046875,
1006
+ 0.16015625,
1007
+ 0.1806640625,
1008
+ 0.1533203125,
1009
+ 0.169921875,
1010
+ 0.1826171875,
1011
+ 0.177734375,
1012
+ 0.162109375,
1013
+ 0.166015625,
1014
+ 0.171875,
1015
+ 0.16796875,
1016
+ 0.1875,
1017
+ 0.20703125,
1018
+ 0.1708984375,
1019
+ 0.181640625,
1020
+ 0.173828125,
1021
+ 0.2041015625,
1022
+ 0.193359375,
1023
+ 0.224609375,
1024
+ 0.216796875,
1025
+ 0.193359375,
1026
+ 0.18359375,
1027
+ 0.1748046875,
1028
+ 0.1943359375,
1029
+ 0.16796875,
1030
+ 0.1904296875,
1031
+ 0.1923828125,
1032
+ 0.201171875,
1033
+ 0.1982421875,
1034
+ 0.216796875,
1035
+ 0.2109375,
1036
+ 0.1982421875,
1037
+ 0.1982421875,
1038
+ 0.1904296875,
1039
+ 0.20703125,
1040
+ 0.1533203125,
1041
+ 0.1943359375,
1042
+ 0.2080078125,
1043
+ 0.1865234375,
1044
+ 0.1630859375,
1045
+ 0.203125,
1046
+ 0.1708984375,
1047
+ 0.2099609375,
1048
+ 0.2021484375,
1049
+ 0.1611328125,
1050
+ 0.2216796875,
1051
+ 0.19140625,
1052
+ 0.1806640625,
1053
+ 0.1640625,
1054
+ 0.201171875,
1055
+ 0.1962890625,
1056
+ 0.1826171875,
1057
+ 0.2275390625,
1058
+ 0.1728515625,
1059
+ 0.2119140625,
1060
+ 0.1748046875,
1061
+ 0.2080078125,
1062
+ 0.203125,
1063
+ 0.16015625,
1064
+ 0.1865234375,
1065
+ 0.16015625,
1066
+ 0.1904296875,
1067
+ 0.1455078125,
1068
+ 0.1884765625,
1069
+ 0.1611328125,
1070
+ 0.185546875,
1071
+ 0.18359375,
1072
+ 0.1640625,
1073
+ 0.1689453125,
1074
+ 0.15234375,
1075
+ 0.1962890625,
1076
+ 0.177734375,
1077
+ 0.1767578125,
1078
+ 0.1748046875,
1079
+ 0.1611328125,
1080
+ 0.169921875,
1081
+ 0.2236328125
1082
+ ]
1083
+ },
1084
+ "eval": {
1085
+ "effective_batch_nums": [
1086
+ 134,
1087
+ 268
1088
+ ],
1089
+ "losses": [
1090
+ 7.4724264705882355,
1091
+ 7.1911764705882355
1092
+ ],
1093
+ "perplexities": [
1094
+ 1758.8693566231143,
1095
+ 1327.664245104053
1096
+ ],
1097
+ "accuracies": [
1098
+ 0.17904697093256416,
1099
+ 0.20669379675777594
1100
+ ]
1101
+ }
1102
+ }
control_123/epoch1/model.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:f55be0e2a9a470ae480b22c91a1219807d54c0c3e4287ca896148b26cf8b811d
3
+ size 29774371
control_123/epoch1/optimizer.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:ce5ea32d4d01d31ba5a4de107bdaf3a09df11f5651a1ada7342d0e16af699476
3
+ size 59595275
control_123/epoch1/scheduler.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:40efd449b2f99a257c8cda271acef1f5b04a347ecd71583a423c9906bb69a318
3
+ size 1465
control_123/epoch1/tokenizer/merges.txt ADDED
The diff for this file is too large to render. See raw diff
 
control_123/epoch1/tokenizer/special_tokens_map.json ADDED
@@ -0,0 +1,6 @@
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": "<|endoftext|>",
3
+ "eos_token": "<|endoftext|>",
4
+ "pad_token": "<|endoftext|>",
5
+ "unk_token": "<|endoftext|>"
6
+ }
control_123/epoch1/tokenizer/tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
control_123/epoch1/tokenizer/tokenizer_config.json ADDED
@@ -0,0 +1,21 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "add_prefix_space": false,
3
+ "added_tokens_decoder": {
4
+ "50256": {
5
+ "content": "<|endoftext|>",
6
+ "lstrip": false,
7
+ "normalized": true,
8
+ "rstrip": false,
9
+ "single_word": false,
10
+ "special": true
11
+ }
12
+ },
13
+ "bos_token": "<|endoftext|>",
14
+ "clean_up_tokenization_spaces": false,
15
+ "eos_token": "<|endoftext|>",
16
+ "extra_special_tokens": {},
17
+ "model_max_length": 1024,
18
+ "pad_token": "<|endoftext|>",
19
+ "tokenizer_class": "GPT2Tokenizer",
20
+ "unk_token": "<|endoftext|>"
21
+ }
control_123/epoch1/tokenizer/vocab.json ADDED
The diff for this file is too large to render. See raw diff