wuff-mann commited on
Commit
1e627df
·
verified ·
1 Parent(s): 5fbd48f

Upload sigma_lambda_proto_v3/history.json with huggingface_hub

Browse files
Files changed (1) hide show
  1. sigma_lambda_proto_v3/history.json +28 -12
sigma_lambda_proto_v3/history.json CHANGED
@@ -12,7 +12,8 @@
12
  10,
13
  11,
14
  12,
15
- 13
 
16
  ],
17
  "gen_loss": [
18
  18.370433433850607,
@@ -27,7 +28,8 @@
27
  11.168713086735119,
28
  11.069438566150087,
29
  11.003662894566855,
30
- 10.940823611346158
 
31
  ],
32
  "ret_loss": [
33
  0.0,
@@ -42,6 +44,7 @@
42
  0.0,
43
  0.0,
44
  0.0,
 
45
  0.0
46
  ],
47
  "ent_loss": [
@@ -57,7 +60,8 @@
57
  0.6063350294575547,
58
  0.601400239648241,
59
  0.5932163899956328,
60
- 0.5945930913000396
 
61
  ],
62
  "ppl": [
63
  40729.60576844635,
@@ -72,7 +76,8 @@
72
  54.61457791073815,
73
  51.96517694532289,
74
  49.970068452218335,
75
- 48.41525029954994
 
76
  ],
77
  "tf_acc": [
78
  9.249682110189831e-06,
@@ -87,7 +92,8 @@
87
  0.4662247857746418,
88
  0.4692156976899191,
89
  0.47160701256487697,
90
- 0.4732986161931464
 
91
  ],
92
  "fr_acc": [
93
  0.0,
@@ -102,7 +108,8 @@
102
  0.19307914900769146,
103
  0.16651888731103695,
104
  0.17273634607377905,
105
- 0.17980458818168835
 
106
  ],
107
  "def_rate": [
108
  0.0,
@@ -117,7 +124,8 @@
117
  1.0,
118
  1.0,
119
  1.0,
120
- 1.0
 
121
  ],
122
  "mrr": [
123
  0.004940100014209747,
@@ -132,7 +140,8 @@
132
  0.0049743144772946835,
133
  0.004973770119249821,
134
  0.004974262323230505,
135
- 0.004978574346750975
 
136
  ],
137
  "r1": [
138
  0.0006249999860301614,
@@ -147,6 +156,7 @@
147
  0.0006249999860301614,
148
  0.0006249999860301614,
149
  0.0006249999860301614,
 
150
  0.0006249999860301614
151
  ],
152
  "ret_ok_pct": [
@@ -162,6 +172,7 @@
162
  0.0,
163
  0.0,
164
  0.0,
 
165
  0.0
166
  ],
167
  "grad_norm": [
@@ -177,7 +188,8 @@
177
  886.9761017929424,
178
  1321.5633731934518,
179
  995.1202453779451,
180
- 1172.9177006188306
 
181
  ],
182
  "step_var": [
183
  0.22542811930179596,
@@ -192,7 +204,8 @@
192
  0.23607377707958221,
193
  0.23739510774612427,
194
  0.23860350251197815,
195
- 0.2396431863307953
 
196
  ],
197
  "pos_slope": [
198
  0.49990350008010864,
@@ -207,7 +220,8 @@
207
  0.49677765369415283,
208
  0.4963497519493103,
209
  0.49595996737480164,
210
- 0.49562159180641174
 
211
  ],
212
  "beta_mean": [
213
  0.09998118132352829,
@@ -222,7 +236,8 @@
222
  0.09935332834720612,
223
  0.09926743805408478,
224
  0.09918887913227081,
225
- 0.09912104904651642
 
226
  ],
227
  "w_ret": [
228
  0.0,
@@ -237,6 +252,7 @@
237
  0.15,
238
  0.2,
239
  0.2,
 
240
  0.2
241
  ]
242
  }
 
12
  10,
13
  11,
14
  12,
15
+ 13,
16
+ 14
17
  ],
18
  "gen_loss": [
19
  18.370433433850607,
 
28
  11.168713086735119,
29
  11.069438566150087,
30
  11.003662894566855,
31
+ 10.940823611346158,
32
+ 10.90196396784349
33
  ],
34
  "ret_loss": [
35
  0.0,
 
44
  0.0,
45
  0.0,
46
  0.0,
47
+ 0.0,
48
  0.0
49
  ],
50
  "ent_loss": [
 
60
  0.6063350294575547,
61
  0.601400239648241,
62
  0.5932163899956328,
63
+ 0.5945930913000396,
64
+ 0.5991491057656028
65
  ],
66
  "ppl": [
67
  40729.60576844635,
 
76
  54.61457791073815,
77
  51.96517694532289,
78
  49.970068452218335,
79
+ 48.41525029954994,
80
+ 47.256544770774525
81
  ],
82
  "tf_acc": [
83
  9.249682110189831e-06,
 
92
  0.4662247857746418,
93
  0.4692156976899191,
94
  0.47160701256487697,
95
+ 0.4732986161931464,
96
+ 0.47500545459195026
97
  ],
98
  "fr_acc": [
99
  0.0,
 
108
  0.19307914900769146,
109
  0.16651888731103695,
110
  0.17273634607377905,
111
+ 0.17980458818168835,
112
+ 0.14786793252599717
113
  ],
114
  "def_rate": [
115
  0.0,
 
124
  1.0,
125
  1.0,
126
  1.0,
127
+ 1.0,
128
+ 0.95
129
  ],
130
  "mrr": [
131
  0.004940100014209747,
 
140
  0.0049743144772946835,
141
  0.004973770119249821,
142
  0.004974262323230505,
143
+ 0.004978574346750975,
144
+ 0.004983400925993919
145
  ],
146
  "r1": [
147
  0.0006249999860301614,
 
156
  0.0006249999860301614,
157
  0.0006249999860301614,
158
  0.0006249999860301614,
159
+ 0.0006249999860301614,
160
  0.0006249999860301614
161
  ],
162
  "ret_ok_pct": [
 
172
  0.0,
173
  0.0,
174
  0.0,
175
+ 0.0,
176
  0.0
177
  ],
178
  "grad_norm": [
 
188
  886.9761017929424,
189
  1321.5633731934518,
190
  995.1202453779451,
191
+ 1172.9177006188306,
192
+ 1544.1169985122392
193
  ],
194
  "step_var": [
195
  0.22542811930179596,
 
204
  0.23607377707958221,
205
  0.23739510774612427,
206
  0.23860350251197815,
207
+ 0.2396431863307953,
208
+ 0.24049368500709534
209
  ],
210
  "pos_slope": [
211
  0.49990350008010864,
 
220
  0.49677765369415283,
221
  0.4963497519493103,
222
  0.49595996737480164,
223
+ 0.49562159180641174,
224
+ 0.49534475803375244
225
  ],
226
  "beta_mean": [
227
  0.09998118132352829,
 
236
  0.09935332834720612,
237
  0.09926743805408478,
238
  0.09918887913227081,
239
+ 0.09912104904651642,
240
+ 0.09906545281410217
241
  ],
242
  "w_ret": [
243
  0.0,
 
252
  0.15,
253
  0.2,
254
  0.2,
255
+ 0.2,
256
  0.2
257
  ]
258
  }