wuff-mann commited on
Commit
2a46537
·
verified ·
1 Parent(s): 366b6b2

Upload sigma_lambda_proto_v4/history.json with huggingface_hub

Browse files
Files changed (1) hide show
  1. sigma_lambda_proto_v4/history.json +277 -0
sigma_lambda_proto_v4/history.json ADDED
@@ -0,0 +1,277 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "epoch": [
3
+ 1,
4
+ 2,
5
+ 3,
6
+ 4,
7
+ 5,
8
+ 6,
9
+ 7,
10
+ 8,
11
+ 9,
12
+ 10,
13
+ 11,
14
+ 12,
15
+ 13,
16
+ 14,
17
+ 15
18
+ ],
19
+ "gen_loss": [
20
+ 18.370433433850607,
21
+ 12.677154767152034,
22
+ 12.081629503279022,
23
+ 11.843723264174027,
24
+ 11.67701819376512,
25
+ 11.95506536512664,
26
+ 11.651441534504746,
27
+ 11.484277419465961,
28
+ 11.311316739862615,
29
+ 11.168713086735119,
30
+ 11.069438566150087,
31
+ 11.003662894566855,
32
+ 10.940823611346158,
33
+ 10.90196396784349,
34
+ 11.473219166524483
35
+ ],
36
+ "ret_loss": [
37
+ 0.0,
38
+ 0.0,
39
+ 0.0,
40
+ 0.0,
41
+ 0.0,
42
+ 0.0,
43
+ 0.0,
44
+ 0.0,
45
+ 0.0,
46
+ 0.0,
47
+ 0.0,
48
+ 0.0,
49
+ 0.0,
50
+ 0.0,
51
+ 297885048197.7794
52
+ ],
53
+ "ent_loss": [
54
+ 0.6078802872065342,
55
+ 0.6268522234035261,
56
+ 0.6330166747714534,
57
+ 0.6162352153026697,
58
+ 0.6095350569667238,
59
+ 0.6105213370467677,
60
+ 0.6074923021143133,
61
+ 0.606140976638505,
62
+ 0.6052777969114708,
63
+ 0.6063350294575547,
64
+ 0.601400239648241,
65
+ 0.5932163899956328,
66
+ 0.5945930913000396,
67
+ 0.5991491057656028,
68
+ 0.6038948570959496
69
+ ],
70
+ "ppl": [
71
+ 40729.60576844635,
72
+ 2535.223731428122,
73
+ 337.67548432577263,
74
+ 123.54939191255174,
75
+ 81.4022446898097,
76
+ 73.53574793147658,
77
+ 66.62547611610893,
78
+ 61.79489383359564,
79
+ 57.91288486607438,
80
+ 54.61457791073815,
81
+ 51.96517694532289,
82
+ 49.970068452218335,
83
+ 48.41525029954994,
84
+ 47.256544770774525,
85
+ 57.93225257466221
86
+ ],
87
+ "tf_acc": [
88
+ 9.249682110189831e-06,
89
+ 0.21421828488041522,
90
+ 0.39405658955515016,
91
+ 0.4409562865464462,
92
+ 0.4514476024551921,
93
+ 0.4529803291907453,
94
+ 0.4559930050639289,
95
+ 0.45953291281739334,
96
+ 0.46299827901502855,
97
+ 0.4662247857746418,
98
+ 0.4692156976899191,
99
+ 0.47160701256487697,
100
+ 0.4732986161931464,
101
+ 0.47500545459195026,
102
+ 0.46299773491608087
103
+ ],
104
+ "fr_acc": [
105
+ 0.0,
106
+ 0.0,
107
+ 0.11453107816089203,
108
+ 0.09257571660973458,
109
+ 0.1671656922337565,
110
+ 0.16827387097913035,
111
+ 0.1727579081837558,
112
+ 0.18450658056400712,
113
+ 0.19845598231894296,
114
+ 0.19307914900769146,
115
+ 0.16651888731103695,
116
+ 0.17273634607377905,
117
+ 0.17980458818168835,
118
+ 0.14786793252599717,
119
+ 0.18805116826841511
120
+ ],
121
+ "def_rate": [
122
+ 0.0,
123
+ 0.0,
124
+ 0.0,
125
+ 0.45,
126
+ 1.0,
127
+ 1.0,
128
+ 1.0,
129
+ 1.0,
130
+ 1.0,
131
+ 1.0,
132
+ 1.0,
133
+ 1.0,
134
+ 1.0,
135
+ 0.95,
136
+ 1.0
137
+ ],
138
+ "mrr": [
139
+ 0.004940100014209747,
140
+ 0.005048312712460756,
141
+ 0.004967095330357552,
142
+ 0.004980043042451143,
143
+ 0.004973841365426779,
144
+ 0.004973897710442543,
145
+ 0.004973262082785368,
146
+ 0.004975350573658943,
147
+ 0.004973086062818766,
148
+ 0.0049743144772946835,
149
+ 0.004973770119249821,
150
+ 0.004974262323230505,
151
+ 0.004978574346750975,
152
+ 0.004983400925993919,
153
+ 0.00775557104498148
154
+ ],
155
+ "r1": [
156
+ 0.0006249999860301614,
157
+ 0.0006249999860301614,
158
+ 0.0006249999860301614,
159
+ 0.0006249999860301614,
160
+ 0.0006249999860301614,
161
+ 0.0006249999860301614,
162
+ 0.0006249999860301614,
163
+ 0.0006249999860301614,
164
+ 0.0006249999860301614,
165
+ 0.0006249999860301614,
166
+ 0.0006249999860301614,
167
+ 0.0006249999860301614,
168
+ 0.0006249999860301614,
169
+ 0.0006249999860301614,
170
+ 0.0010416667209938169
171
+ ],
172
+ "ret_ok_pct": [
173
+ 0.0,
174
+ 0.0,
175
+ 0.0,
176
+ 0.0,
177
+ 0.0,
178
+ 0.0,
179
+ 0.0,
180
+ 0.0,
181
+ 0.0,
182
+ 0.0,
183
+ 0.0,
184
+ 0.0,
185
+ 0.0,
186
+ 0.0,
187
+ 100.0
188
+ ],
189
+ "grad_norm": [
190
+ 2201.0254727094825,
191
+ 1418.5299411384265,
192
+ 1329.5837538555174,
193
+ 1217.5837738567411,
194
+ 1152.3023670419057,
195
+ 2138.4472111783607,
196
+ 1115.3582513533938,
197
+ 1271.3913563283284,
198
+ 954.6965318550485,
199
+ 886.9761017929424,
200
+ 1321.5633731934518,
201
+ 995.1202453779451,
202
+ 1172.9177006188306,
203
+ 1544.1169985122392,
204
+ Infinity
205
+ ],
206
+ "step_var": [
207
+ 0.22542811930179596,
208
+ 0.22660225629806519,
209
+ 0.2280091941356659,
210
+ 0.22952058911323547,
211
+ 0.23098886013031006,
212
+ 0.23129060864448547,
213
+ 0.23215171694755554,
214
+ 0.23333927989006042,
215
+ 0.23468747735023499,
216
+ 0.23607377707958221,
217
+ 0.23739510774612427,
218
+ 0.23860350251197815,
219
+ 0.2396431863307953,
220
+ 0.24049368500709534,
221
+ 0.2347075343132019
222
+ ],
223
+ "pos_slope": [
224
+ 0.49990350008010864,
225
+ 0.4996356666088104,
226
+ 0.49926072359085083,
227
+ 0.4988322854042053,
228
+ 0.4983888268470764,
229
+ 0.4982922673225403,
230
+ 0.49802443385124207,
231
+ 0.49764952063560486,
232
+ 0.49722111225128174,
233
+ 0.49677765369415283,
234
+ 0.4963497519493103,
235
+ 0.49595996737480164,
236
+ 0.49562159180641174,
237
+ 0.49534475803375244,
238
+ 0.4971509277820587
239
+ ],
240
+ "beta_mean": [
241
+ 0.09998118132352829,
242
+ 0.09992741793394089,
243
+ 0.09985271841287613,
244
+ 0.09976637363433838,
245
+ 0.09967698156833649,
246
+ 0.0996585488319397,
247
+ 0.09960417449474335,
248
+ 0.09952875226736069,
249
+ 0.0994425043463707,
250
+ 0.09935332834720612,
251
+ 0.09926743805408478,
252
+ 0.09918887913227081,
253
+ 0.09912104904651642,
254
+ 0.09906545281410217,
255
+ 0.09942715615034103
256
+ ],
257
+ "w_ret": [
258
+ 0.0,
259
+ 0.0,
260
+ 0.0,
261
+ 0.0,
262
+ 0.03,
263
+ 0.06,
264
+ 0.09,
265
+ 0.12,
266
+ 0.15,
267
+ 0.15,
268
+ 0.2,
269
+ 0.2,
270
+ 0.2,
271
+ 0.2,
272
+ 0.2
273
+ ],
274
+ "ret_raw": [
275
+ 297885048197.7794
276
+ ]
277
+ }