wuff-mann commited on
Commit
44141f0
·
verified ·
1 Parent(s): fb56db3

Upload sigma_lambda_proto_v3/history.json with huggingface_hub

Browse files
Files changed (1) hide show
  1. sigma_lambda_proto_v3/history.json +27 -11
sigma_lambda_proto_v3/history.json CHANGED
@@ -11,7 +11,8 @@
11
  9,
12
  10,
13
  11,
14
- 12
 
15
  ],
16
  "gen_loss": [
17
  18.370433433850607,
@@ -25,7 +26,8 @@
25
  11.311316739862615,
26
  11.168713086735119,
27
  11.069438566150087,
28
- 11.003662894566855
 
29
  ],
30
  "ret_loss": [
31
  0.0,
@@ -39,6 +41,7 @@
39
  0.0,
40
  0.0,
41
  0.0,
 
42
  0.0
43
  ],
44
  "ent_loss": [
@@ -53,7 +56,8 @@
53
  0.6052777969114708,
54
  0.6063350294575547,
55
  0.601400239648241,
56
- 0.5932163899956328
 
57
  ],
58
  "ppl": [
59
  40729.60576844635,
@@ -67,7 +71,8 @@
67
  57.91288486607438,
68
  54.61457791073815,
69
  51.96517694532289,
70
- 49.970068452218335
 
71
  ],
72
  "tf_acc": [
73
  9.249682110189831e-06,
@@ -81,7 +86,8 @@
81
  0.46299827901502855,
82
  0.4662247857746418,
83
  0.4692156976899191,
84
- 0.47160701256487697
 
85
  ],
86
  "fr_acc": [
87
  0.0,
@@ -95,7 +101,8 @@
95
  0.19845598231894296,
96
  0.19307914900769146,
97
  0.16651888731103695,
98
- 0.17273634607377905
 
99
  ],
100
  "def_rate": [
101
  0.0,
@@ -109,6 +116,7 @@
109
  1.0,
110
  1.0,
111
  1.0,
 
112
  1.0
113
  ],
114
  "mrr": [
@@ -123,7 +131,8 @@
123
  0.004973086062818766,
124
  0.0049743144772946835,
125
  0.004973770119249821,
126
- 0.004974262323230505
 
127
  ],
128
  "r1": [
129
  0.0006249999860301614,
@@ -137,6 +146,7 @@
137
  0.0006249999860301614,
138
  0.0006249999860301614,
139
  0.0006249999860301614,
 
140
  0.0006249999860301614
141
  ],
142
  "ret_ok_pct": [
@@ -151,6 +161,7 @@
151
  0.0,
152
  0.0,
153
  0.0,
 
154
  0.0
155
  ],
156
  "grad_norm": [
@@ -165,7 +176,8 @@
165
  954.6965318550485,
166
  886.9761017929424,
167
  1321.5633731934518,
168
- 995.1202453779451
 
169
  ],
170
  "step_var": [
171
  0.22542811930179596,
@@ -179,7 +191,8 @@
179
  0.23468747735023499,
180
  0.23607377707958221,
181
  0.23739510774612427,
182
- 0.23860350251197815
 
183
  ],
184
  "pos_slope": [
185
  0.49990350008010864,
@@ -193,7 +206,8 @@
193
  0.49722111225128174,
194
  0.49677765369415283,
195
  0.4963497519493103,
196
- 0.49595996737480164
 
197
  ],
198
  "beta_mean": [
199
  0.09998118132352829,
@@ -207,7 +221,8 @@
207
  0.0994425043463707,
208
  0.09935332834720612,
209
  0.09926743805408478,
210
- 0.09918887913227081
 
211
  ],
212
  "w_ret": [
213
  0.0,
@@ -221,6 +236,7 @@
221
  0.15,
222
  0.15,
223
  0.2,
 
224
  0.2
225
  ]
226
  }
 
11
  9,
12
  10,
13
  11,
14
+ 12,
15
+ 13
16
  ],
17
  "gen_loss": [
18
  18.370433433850607,
 
26
  11.311316739862615,
27
  11.168713086735119,
28
  11.069438566150087,
29
+ 11.003662894566855,
30
+ 10.940823611346158
31
  ],
32
  "ret_loss": [
33
  0.0,
 
41
  0.0,
42
  0.0,
43
  0.0,
44
+ 0.0,
45
  0.0
46
  ],
47
  "ent_loss": [
 
56
  0.6052777969114708,
57
  0.6063350294575547,
58
  0.601400239648241,
59
+ 0.5932163899956328,
60
+ 0.5945930913000396
61
  ],
62
  "ppl": [
63
  40729.60576844635,
 
71
  57.91288486607438,
72
  54.61457791073815,
73
  51.96517694532289,
74
+ 49.970068452218335,
75
+ 48.41525029954994
76
  ],
77
  "tf_acc": [
78
  9.249682110189831e-06,
 
86
  0.46299827901502855,
87
  0.4662247857746418,
88
  0.4692156976899191,
89
+ 0.47160701256487697,
90
+ 0.4732986161931464
91
  ],
92
  "fr_acc": [
93
  0.0,
 
101
  0.19845598231894296,
102
  0.19307914900769146,
103
  0.16651888731103695,
104
+ 0.17273634607377905,
105
+ 0.17980458818168835
106
  ],
107
  "def_rate": [
108
  0.0,
 
116
  1.0,
117
  1.0,
118
  1.0,
119
+ 1.0,
120
  1.0
121
  ],
122
  "mrr": [
 
131
  0.004973086062818766,
132
  0.0049743144772946835,
133
  0.004973770119249821,
134
+ 0.004974262323230505,
135
+ 0.004978574346750975
136
  ],
137
  "r1": [
138
  0.0006249999860301614,
 
146
  0.0006249999860301614,
147
  0.0006249999860301614,
148
  0.0006249999860301614,
149
+ 0.0006249999860301614,
150
  0.0006249999860301614
151
  ],
152
  "ret_ok_pct": [
 
161
  0.0,
162
  0.0,
163
  0.0,
164
+ 0.0,
165
  0.0
166
  ],
167
  "grad_norm": [
 
176
  954.6965318550485,
177
  886.9761017929424,
178
  1321.5633731934518,
179
+ 995.1202453779451,
180
+ 1172.9177006188306
181
  ],
182
  "step_var": [
183
  0.22542811930179596,
 
191
  0.23468747735023499,
192
  0.23607377707958221,
193
  0.23739510774612427,
194
+ 0.23860350251197815,
195
+ 0.2396431863307953
196
  ],
197
  "pos_slope": [
198
  0.49990350008010864,
 
206
  0.49722111225128174,
207
  0.49677765369415283,
208
  0.4963497519493103,
209
+ 0.49595996737480164,
210
+ 0.49562159180641174
211
  ],
212
  "beta_mean": [
213
  0.09998118132352829,
 
221
  0.0994425043463707,
222
  0.09935332834720612,
223
  0.09926743805408478,
224
+ 0.09918887913227081,
225
+ 0.09912104904651642
226
  ],
227
  "w_ret": [
228
  0.0,
 
236
  0.15,
237
  0.15,
238
  0.2,
239
+ 0.2,
240
  0.2
241
  ]
242
  }