wuff-mann commited on
Commit
8710251
·
verified ·
1 Parent(s): 001069c

Upload sigma_lambda_proto_v3/history.json with huggingface_hub

Browse files
Files changed (1) hide show
  1. sigma_lambda_proto_v3/history.json +27 -11
sigma_lambda_proto_v3/history.json CHANGED
@@ -8,7 +8,8 @@
8
  6,
9
  7,
10
  8,
11
- 9
 
12
  ],
13
  "gen_loss": [
14
  18.370433433850607,
@@ -19,7 +20,8 @@
19
  11.95506536512664,
20
  11.651441534504746,
21
  11.484277419465961,
22
- 11.311316739862615
 
23
  ],
24
  "ret_loss": [
25
  0.0,
@@ -30,6 +32,7 @@
30
  0.0,
31
  0.0,
32
  0.0,
 
33
  0.0
34
  ],
35
  "ent_loss": [
@@ -41,7 +44,8 @@
41
  0.6105213370467677,
42
  0.6074923021143133,
43
  0.606140976638505,
44
- 0.6052777969114708
 
45
  ],
46
  "ppl": [
47
  40729.60576844635,
@@ -52,7 +56,8 @@
52
  73.53574793147658,
53
  66.62547611610893,
54
  61.79489383359564,
55
- 57.91288486607438
 
56
  ],
57
  "tf_acc": [
58
  9.249682110189831e-06,
@@ -63,7 +68,8 @@
63
  0.4529803291907453,
64
  0.4559930050639289,
65
  0.45953291281739334,
66
- 0.46299827901502855
 
67
  ],
68
  "fr_acc": [
69
  0.0,
@@ -74,7 +80,8 @@
74
  0.16827387097913035,
75
  0.1727579081837558,
76
  0.18450658056400712,
77
- 0.19845598231894296
 
78
  ],
79
  "def_rate": [
80
  0.0,
@@ -85,6 +92,7 @@
85
  1.0,
86
  1.0,
87
  1.0,
 
88
  1.0
89
  ],
90
  "mrr": [
@@ -96,7 +104,8 @@
96
  0.004973897710442543,
97
  0.004973262082785368,
98
  0.004975350573658943,
99
- 0.004973086062818766
 
100
  ],
101
  "r1": [
102
  0.0006249999860301614,
@@ -107,6 +116,7 @@
107
  0.0006249999860301614,
108
  0.0006249999860301614,
109
  0.0006249999860301614,
 
110
  0.0006249999860301614
111
  ],
112
  "ret_ok_pct": [
@@ -118,6 +128,7 @@
118
  0.0,
119
  0.0,
120
  0.0,
 
121
  0.0
122
  ],
123
  "grad_norm": [
@@ -129,7 +140,8 @@
129
  2138.4472111783607,
130
  1115.3582513533938,
131
  1271.3913563283284,
132
- 954.6965318550485
 
133
  ],
134
  "step_var": [
135
  0.22542811930179596,
@@ -140,7 +152,8 @@
140
  0.23129060864448547,
141
  0.23215171694755554,
142
  0.23333927989006042,
143
- 0.23468747735023499
 
144
  ],
145
  "pos_slope": [
146
  0.49990350008010864,
@@ -151,7 +164,8 @@
151
  0.4982922673225403,
152
  0.49802443385124207,
153
  0.49764952063560486,
154
- 0.49722111225128174
 
155
  ],
156
  "beta_mean": [
157
  0.09998118132352829,
@@ -162,7 +176,8 @@
162
  0.0996585488319397,
163
  0.09960417449474335,
164
  0.09952875226736069,
165
- 0.0994425043463707
 
166
  ],
167
  "w_ret": [
168
  0.0,
@@ -173,6 +188,7 @@
173
  0.06,
174
  0.09,
175
  0.12,
 
176
  0.15
177
  ]
178
  }
 
8
  6,
9
  7,
10
  8,
11
+ 9,
12
+ 10
13
  ],
14
  "gen_loss": [
15
  18.370433433850607,
 
20
  11.95506536512664,
21
  11.651441534504746,
22
  11.484277419465961,
23
+ 11.311316739862615,
24
+ 11.168713086735119
25
  ],
26
  "ret_loss": [
27
  0.0,
 
32
  0.0,
33
  0.0,
34
  0.0,
35
+ 0.0,
36
  0.0
37
  ],
38
  "ent_loss": [
 
44
  0.6105213370467677,
45
  0.6074923021143133,
46
  0.606140976638505,
47
+ 0.6052777969114708,
48
+ 0.6063350294575547
49
  ],
50
  "ppl": [
51
  40729.60576844635,
 
56
  73.53574793147658,
57
  66.62547611610893,
58
  61.79489383359564,
59
+ 57.91288486607438,
60
+ 54.61457791073815
61
  ],
62
  "tf_acc": [
63
  9.249682110189831e-06,
 
68
  0.4529803291907453,
69
  0.4559930050639289,
70
  0.45953291281739334,
71
+ 0.46299827901502855,
72
+ 0.4662247857746418
73
  ],
74
  "fr_acc": [
75
  0.0,
 
80
  0.16827387097913035,
81
  0.1727579081837558,
82
  0.18450658056400712,
83
+ 0.19845598231894296,
84
+ 0.19307914900769146
85
  ],
86
  "def_rate": [
87
  0.0,
 
92
  1.0,
93
  1.0,
94
  1.0,
95
+ 1.0,
96
  1.0
97
  ],
98
  "mrr": [
 
104
  0.004973897710442543,
105
  0.004973262082785368,
106
  0.004975350573658943,
107
+ 0.004973086062818766,
108
+ 0.0049743144772946835
109
  ],
110
  "r1": [
111
  0.0006249999860301614,
 
116
  0.0006249999860301614,
117
  0.0006249999860301614,
118
  0.0006249999860301614,
119
+ 0.0006249999860301614,
120
  0.0006249999860301614
121
  ],
122
  "ret_ok_pct": [
 
128
  0.0,
129
  0.0,
130
  0.0,
131
+ 0.0,
132
  0.0
133
  ],
134
  "grad_norm": [
 
140
  2138.4472111783607,
141
  1115.3582513533938,
142
  1271.3913563283284,
143
+ 954.6965318550485,
144
+ 886.9761017929424
145
  ],
146
  "step_var": [
147
  0.22542811930179596,
 
152
  0.23129060864448547,
153
  0.23215171694755554,
154
  0.23333927989006042,
155
+ 0.23468747735023499,
156
+ 0.23607377707958221
157
  ],
158
  "pos_slope": [
159
  0.49990350008010864,
 
164
  0.4982922673225403,
165
  0.49802443385124207,
166
  0.49764952063560486,
167
+ 0.49722111225128174,
168
+ 0.49677765369415283
169
  ],
170
  "beta_mean": [
171
  0.09998118132352829,
 
176
  0.0996585488319397,
177
  0.09960417449474335,
178
  0.09952875226736069,
179
+ 0.0994425043463707,
180
+ 0.09935332834720612
181
  ],
182
  "w_ret": [
183
  0.0,
 
188
  0.06,
189
  0.09,
190
  0.12,
191
+ 0.15,
192
  0.15
193
  ]
194
  }