wuff-mann commited on
Commit
9d7c68c
·
verified ·
1 Parent(s): 892870f

Upload sigma_lambda_proto_v3/history.json with huggingface_hub

Browse files
Files changed (1) hide show
  1. sigma_lambda_proto_v3/history.json +27 -11
sigma_lambda_proto_v3/history.json CHANGED
@@ -10,7 +10,8 @@
10
  8,
11
  9,
12
  10,
13
- 11
 
14
  ],
15
  "gen_loss": [
16
  18.370433433850607,
@@ -23,7 +24,8 @@
23
  11.484277419465961,
24
  11.311316739862615,
25
  11.168713086735119,
26
- 11.069438566150087
 
27
  ],
28
  "ret_loss": [
29
  0.0,
@@ -36,6 +38,7 @@
36
  0.0,
37
  0.0,
38
  0.0,
 
39
  0.0
40
  ],
41
  "ent_loss": [
@@ -49,7 +52,8 @@
49
  0.606140976638505,
50
  0.6052777969114708,
51
  0.6063350294575547,
52
- 0.601400239648241
 
53
  ],
54
  "ppl": [
55
  40729.60576844635,
@@ -62,7 +66,8 @@
62
  61.79489383359564,
63
  57.91288486607438,
64
  54.61457791073815,
65
- 51.96517694532289
 
66
  ],
67
  "tf_acc": [
68
  9.249682110189831e-06,
@@ -75,7 +80,8 @@
75
  0.45953291281739334,
76
  0.46299827901502855,
77
  0.4662247857746418,
78
- 0.4692156976899191
 
79
  ],
80
  "fr_acc": [
81
  0.0,
@@ -88,7 +94,8 @@
88
  0.18450658056400712,
89
  0.19845598231894296,
90
  0.19307914900769146,
91
- 0.16651888731103695
 
92
  ],
93
  "def_rate": [
94
  0.0,
@@ -101,6 +108,7 @@
101
  1.0,
102
  1.0,
103
  1.0,
 
104
  1.0
105
  ],
106
  "mrr": [
@@ -114,7 +122,8 @@
114
  0.004975350573658943,
115
  0.004973086062818766,
116
  0.0049743144772946835,
117
- 0.004973770119249821
 
118
  ],
119
  "r1": [
120
  0.0006249999860301614,
@@ -127,6 +136,7 @@
127
  0.0006249999860301614,
128
  0.0006249999860301614,
129
  0.0006249999860301614,
 
130
  0.0006249999860301614
131
  ],
132
  "ret_ok_pct": [
@@ -140,6 +150,7 @@
140
  0.0,
141
  0.0,
142
  0.0,
 
143
  0.0
144
  ],
145
  "grad_norm": [
@@ -153,7 +164,8 @@
153
  1271.3913563283284,
154
  954.6965318550485,
155
  886.9761017929424,
156
- 1321.5633731934518
 
157
  ],
158
  "step_var": [
159
  0.22542811930179596,
@@ -166,7 +178,8 @@
166
  0.23333927989006042,
167
  0.23468747735023499,
168
  0.23607377707958221,
169
- 0.23739510774612427
 
170
  ],
171
  "pos_slope": [
172
  0.49990350008010864,
@@ -179,7 +192,8 @@
179
  0.49764952063560486,
180
  0.49722111225128174,
181
  0.49677765369415283,
182
- 0.4963497519493103
 
183
  ],
184
  "beta_mean": [
185
  0.09998118132352829,
@@ -192,7 +206,8 @@
192
  0.09952875226736069,
193
  0.0994425043463707,
194
  0.09935332834720612,
195
- 0.09926743805408478
 
196
  ],
197
  "w_ret": [
198
  0.0,
@@ -205,6 +220,7 @@
205
  0.12,
206
  0.15,
207
  0.15,
 
208
  0.2
209
  ]
210
  }
 
10
  8,
11
  9,
12
  10,
13
+ 11,
14
+ 12
15
  ],
16
  "gen_loss": [
17
  18.370433433850607,
 
24
  11.484277419465961,
25
  11.311316739862615,
26
  11.168713086735119,
27
+ 11.069438566150087,
28
+ 11.003662894566855
29
  ],
30
  "ret_loss": [
31
  0.0,
 
38
  0.0,
39
  0.0,
40
  0.0,
41
+ 0.0,
42
  0.0
43
  ],
44
  "ent_loss": [
 
52
  0.606140976638505,
53
  0.6052777969114708,
54
  0.6063350294575547,
55
+ 0.601400239648241,
56
+ 0.5932163899956328
57
  ],
58
  "ppl": [
59
  40729.60576844635,
 
66
  61.79489383359564,
67
  57.91288486607438,
68
  54.61457791073815,
69
+ 51.96517694532289,
70
+ 49.970068452218335
71
  ],
72
  "tf_acc": [
73
  9.249682110189831e-06,
 
80
  0.45953291281739334,
81
  0.46299827901502855,
82
  0.4662247857746418,
83
+ 0.4692156976899191,
84
+ 0.47160701256487697
85
  ],
86
  "fr_acc": [
87
  0.0,
 
94
  0.18450658056400712,
95
  0.19845598231894296,
96
  0.19307914900769146,
97
+ 0.16651888731103695,
98
+ 0.17273634607377905
99
  ],
100
  "def_rate": [
101
  0.0,
 
108
  1.0,
109
  1.0,
110
  1.0,
111
+ 1.0,
112
  1.0
113
  ],
114
  "mrr": [
 
122
  0.004975350573658943,
123
  0.004973086062818766,
124
  0.0049743144772946835,
125
+ 0.004973770119249821,
126
+ 0.004974262323230505
127
  ],
128
  "r1": [
129
  0.0006249999860301614,
 
136
  0.0006249999860301614,
137
  0.0006249999860301614,
138
  0.0006249999860301614,
139
+ 0.0006249999860301614,
140
  0.0006249999860301614
141
  ],
142
  "ret_ok_pct": [
 
150
  0.0,
151
  0.0,
152
  0.0,
153
+ 0.0,
154
  0.0
155
  ],
156
  "grad_norm": [
 
164
  1271.3913563283284,
165
  954.6965318550485,
166
  886.9761017929424,
167
+ 1321.5633731934518,
168
+ 995.1202453779451
169
  ],
170
  "step_var": [
171
  0.22542811930179596,
 
178
  0.23333927989006042,
179
  0.23468747735023499,
180
  0.23607377707958221,
181
+ 0.23739510774612427,
182
+ 0.23860350251197815
183
  ],
184
  "pos_slope": [
185
  0.49990350008010864,
 
192
  0.49764952063560486,
193
  0.49722111225128174,
194
  0.49677765369415283,
195
+ 0.4963497519493103,
196
+ 0.49595996737480164
197
  ],
198
  "beta_mean": [
199
  0.09998118132352829,
 
206
  0.09952875226736069,
207
  0.0994425043463707,
208
  0.09935332834720612,
209
+ 0.09926743805408478,
210
+ 0.09918887913227081
211
  ],
212
  "w_ret": [
213
  0.0,
 
220
  0.12,
221
  0.15,
222
  0.15,
223
+ 0.2,
224
  0.2
225
  ]
226
  }