wuff-mann commited on
Commit
379df18
·
verified ·
1 Parent(s): 40e9907

Upload sigma_lambda_proto_v4/history.json with huggingface_hub

Browse files
Files changed (1) hide show
  1. sigma_lambda_proto_v4/history.json +29 -12
sigma_lambda_proto_v4/history.json CHANGED
@@ -17,7 +17,8 @@
17
  15,
18
  16,
19
  17,
20
- 18
 
21
  ],
22
  "gen_loss": [
23
  18.370433433850607,
@@ -37,7 +38,8 @@
37
  11.473219166524483,
38
  11.477066975073381,
39
  11.481685707063386,
40
- 11.48563595049309
 
41
  ],
42
  "ret_loss": [
43
  0.0,
@@ -57,7 +59,8 @@
57
  297885048197.7794,
58
  185471042979.8594,
59
  220422110895.04968,
60
- 190796641934.95273
 
61
  ],
62
  "ent_loss": [
63
  0.6078802872065342,
@@ -77,7 +80,8 @@
77
  0.6038948570959496,
78
  0.6058890042521737,
79
  0.6026860457478147,
80
- 0.604040896025571
 
81
  ],
82
  "ppl": [
83
  40729.60576844635,
@@ -97,7 +101,8 @@
97
  57.93225257466221,
98
  58.00014256149768,
99
  58.12945668251974,
100
- 58.12488720995803
 
101
  ],
102
  "tf_acc": [
103
  9.249682110189831e-06,
@@ -117,7 +122,8 @@
117
  0.46299773491608087,
118
  0.4629857647392324,
119
  0.4629770591560699,
120
- 0.46299773491608087
 
121
  ],
122
  "fr_acc": [
123
  0.0,
@@ -137,7 +143,8 @@
137
  0.18805116826841511,
138
  0.18621015772268792,
139
  0.18743173221865267,
140
- 0.18079325223458445
 
141
  ],
142
  "def_rate": [
143
  0.0,
@@ -157,6 +164,7 @@
157
  1.0,
158
  1.0,
159
  1.0,
 
160
  1.0
161
  ],
162
  "mrr": [
@@ -177,7 +185,8 @@
177
  0.00775557104498148,
178
  0.007759490050375462,
179
  0.007763712666928768,
180
- 0.007745448965579271
 
181
  ],
182
  "r1": [
183
  0.0006249999860301614,
@@ -197,6 +206,7 @@
197
  0.0010416667209938169,
198
  0.0010416667209938169,
199
  0.0010416667209938169,
 
200
  0.0010416667209938169
201
  ],
202
  "ret_ok_pct": [
@@ -217,6 +227,7 @@
217
  100.0,
218
  100.0,
219
  100.0,
 
220
  100.0
221
  ],
222
  "grad_norm": [
@@ -237,6 +248,7 @@
237
  Infinity,
238
  Infinity,
239
  Infinity,
 
240
  Infinity
241
  ],
242
  "step_var": [
@@ -257,7 +269,8 @@
257
  0.2347075343132019,
258
  0.23476119339466095,
259
  0.2348354160785675,
260
- 0.2349209189414978
 
261
  ],
262
  "pos_slope": [
263
  0.49990350008010864,
@@ -277,7 +290,8 @@
277
  0.4971509277820587,
278
  0.4969623386859894,
279
  0.4967041313648224,
280
- 0.49640679359436035
 
281
  ],
282
  "beta_mean": [
283
  0.09998118132352829,
@@ -297,7 +311,8 @@
297
  0.09942715615034103,
298
  0.0993889719247818,
299
  0.09933643043041229,
300
- 0.09927636384963989
 
301
  ],
302
  "w_ret": [
303
  0.0,
@@ -317,12 +332,14 @@
317
  0.2,
318
  0.2,
319
  0.2,
 
320
  0.2
321
  ],
322
  "ret_raw": [
323
  297885048197.7794,
324
  185471042979.8594,
325
  220422110895.04968,
326
- 190796641934.95273
 
327
  ]
328
  }
 
17
  15,
18
  16,
19
  17,
20
+ 18,
21
+ 19
22
  ],
23
  "gen_loss": [
24
  18.370433433850607,
 
38
  11.473219166524483,
39
  11.477066975073381,
40
  11.481685707063386,
41
+ 11.48563595049309,
42
+ 11.48989599907037
43
  ],
44
  "ret_loss": [
45
  0.0,
 
59
  297885048197.7794,
60
  185471042979.8594,
61
  220422110895.04968,
62
+ 190796641934.95273,
63
+ 175445324657.84244
64
  ],
65
  "ent_loss": [
66
  0.6078802872065342,
 
80
  0.6038948570959496,
81
  0.6058890042521737,
82
  0.6026860457478147,
83
+ 0.604040896025571,
84
+ 0.6060827209010269
85
  ],
86
  "ppl": [
87
  40729.60576844635,
 
101
  57.93225257466221,
102
  58.00014256149768,
103
  58.12945668251974,
104
+ 58.12488720995803,
105
+ 58.21156245196392
106
  ],
107
  "tf_acc": [
108
  9.249682110189831e-06,
 
122
  0.46299773491608087,
123
  0.4629857647392324,
124
  0.4629770591560699,
125
+ 0.46299773491608087,
126
+ 0.4629678094739597
127
  ],
128
  "fr_acc": [
129
  0.0,
 
143
  0.18805116826841511,
144
  0.18621015772268792,
145
  0.18743173221865267,
146
+ 0.18079325223458445,
147
+ 0.18188252448194492
148
  ],
149
  "def_rate": [
150
  0.0,
 
164
  1.0,
165
  1.0,
166
  1.0,
167
+ 1.0,
168
  1.0
169
  ],
170
  "mrr": [
 
185
  0.00775557104498148,
186
  0.007759490050375462,
187
  0.007763712666928768,
188
+ 0.007745448965579271,
189
+ 0.007738207932561636
190
  ],
191
  "r1": [
192
  0.0006249999860301614,
 
206
  0.0010416667209938169,
207
  0.0010416667209938169,
208
  0.0010416667209938169,
209
+ 0.0010416667209938169,
210
  0.0010416667209938169
211
  ],
212
  "ret_ok_pct": [
 
227
  100.0,
228
  100.0,
229
  100.0,
230
+ 100.0,
231
  100.0
232
  ],
233
  "grad_norm": [
 
248
  Infinity,
249
  Infinity,
250
  Infinity,
251
+ Infinity,
252
  Infinity
253
  ],
254
  "step_var": [
 
269
  0.2347075343132019,
270
  0.23476119339466095,
271
  0.2348354160785675,
272
+ 0.2349209189414978,
273
+ 0.23501138389110565
274
  ],
275
  "pos_slope": [
276
  0.49990350008010864,
 
290
  0.4971509277820587,
291
  0.4969623386859894,
292
  0.4967041313648224,
293
+ 0.49640679359436035,
294
+ 0.4960930347442627
295
  ],
296
  "beta_mean": [
297
  0.09998118132352829,
 
311
  0.09942715615034103,
312
  0.0993889719247818,
313
  0.09933643043041229,
314
+ 0.09927636384963989,
315
+ 0.09921339154243469
316
  ],
317
  "w_ret": [
318
  0.0,
 
332
  0.2,
333
  0.2,
334
  0.2,
335
+ 0.2,
336
  0.2
337
  ],
338
  "ret_raw": [
339
  297885048197.7794,
340
  185471042979.8594,
341
  220422110895.04968,
342
+ 190796641934.95273,
343
+ 175445324657.84244
344
  ]
345
  }