amirali1985 commited on
Commit
0cb851b
·
verified ·
1 Parent(s): 4d3539f

Upload add_sub_sorl_v1_abs16_100K

Browse files
add_sub_sorl_v1_abs16_100K/config.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 510,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 2040,
15
+ "layer_types": [
16
+ "full_attention",
17
+ "full_attention"
18
+ ],
19
+ "max_position_embeddings": 128,
20
+ "max_window_layers": 28,
21
+ "model_type": "qwen3",
22
+ "num_attention_heads": 3,
23
+ "num_hidden_layers": 2,
24
+ "num_key_value_heads": 3,
25
+ "pad_token_id": null,
26
+ "rms_norm_eps": 1e-06,
27
+ "rope_parameters": {
28
+ "rope_theta": 10000.0,
29
+ "rope_type": "default"
30
+ },
31
+ "sliding_window": null,
32
+ "tie_word_embeddings": false,
33
+ "transformers_version": "5.5.0",
34
+ "use_cache": true,
35
+ "use_sliding_window": false,
36
+ "vocab_size": 151660
37
+ }
add_sub_sorl_v1_abs16_100K/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs16_100K/metrics.json ADDED
@@ -0,0 +1,3537 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 800,
20
+ 850,
21
+ 900,
22
+ 950,
23
+ 1000,
24
+ 1050,
25
+ 1100,
26
+ 1150,
27
+ 1200,
28
+ 1250,
29
+ 1300,
30
+ 1350,
31
+ 1400,
32
+ 1450,
33
+ 1500,
34
+ 1550,
35
+ 1613,
36
+ 1663,
37
+ 1713,
38
+ 1763,
39
+ 1813,
40
+ 1863,
41
+ 1913,
42
+ 1963,
43
+ 2013,
44
+ 2063,
45
+ 2113,
46
+ 2163,
47
+ 2213,
48
+ 2263,
49
+ 2313,
50
+ 2363,
51
+ 2413,
52
+ 2463,
53
+ 2513,
54
+ 2563,
55
+ 2613,
56
+ 2663,
57
+ 2713,
58
+ 2763,
59
+ 2813,
60
+ 2863,
61
+ 2913,
62
+ 2963,
63
+ 3013,
64
+ 3063,
65
+ 3113,
66
+ 3176,
67
+ 3226,
68
+ 3276,
69
+ 3326,
70
+ 3376,
71
+ 3426,
72
+ 3476,
73
+ 3526,
74
+ 3576,
75
+ 3626,
76
+ 3676,
77
+ 3726,
78
+ 3776,
79
+ 3826,
80
+ 3876,
81
+ 3926,
82
+ 3976,
83
+ 4026,
84
+ 4076,
85
+ 4126,
86
+ 4176,
87
+ 4226,
88
+ 4276,
89
+ 4326,
90
+ 4376,
91
+ 4426,
92
+ 4476,
93
+ 4526,
94
+ 4576,
95
+ 4626,
96
+ 4676,
97
+ 4739,
98
+ 4789,
99
+ 4839,
100
+ 4889,
101
+ 4939,
102
+ 4989,
103
+ 5039,
104
+ 5089,
105
+ 5139,
106
+ 5189,
107
+ 5239,
108
+ 5289,
109
+ 5339,
110
+ 5389,
111
+ 5439,
112
+ 5489,
113
+ 5539,
114
+ 5589,
115
+ 5639,
116
+ 5689,
117
+ 5739,
118
+ 5789,
119
+ 5839,
120
+ 5889,
121
+ 5939,
122
+ 5989,
123
+ 6039,
124
+ 6089,
125
+ 6139,
126
+ 6189,
127
+ 6239,
128
+ 6302,
129
+ 6352,
130
+ 6402,
131
+ 6452,
132
+ 6502,
133
+ 6552,
134
+ 6602,
135
+ 6652,
136
+ 6702,
137
+ 6752,
138
+ 6802,
139
+ 6852,
140
+ 6902,
141
+ 6952,
142
+ 7002,
143
+ 7052,
144
+ 7102,
145
+ 7152,
146
+ 7202,
147
+ 7252,
148
+ 7302,
149
+ 7352,
150
+ 7402,
151
+ 7452,
152
+ 7502,
153
+ 7552,
154
+ 7602,
155
+ 7652,
156
+ 7702,
157
+ 7752,
158
+ 7802,
159
+ 7865,
160
+ 7915,
161
+ 7965,
162
+ 8015,
163
+ 8065,
164
+ 8115,
165
+ 8165,
166
+ 8215,
167
+ 8265,
168
+ 8315,
169
+ 8365,
170
+ 8415,
171
+ 8465,
172
+ 8515,
173
+ 8565,
174
+ 8615,
175
+ 8665,
176
+ 8715,
177
+ 8765,
178
+ 8815,
179
+ 8865,
180
+ 8915,
181
+ 8965,
182
+ 9015,
183
+ 9065,
184
+ 9115,
185
+ 9165,
186
+ 9215,
187
+ 9265,
188
+ 9315,
189
+ 9365,
190
+ 9428,
191
+ 9478,
192
+ 9528,
193
+ 9578,
194
+ 9628,
195
+ 9678,
196
+ 9728,
197
+ 9778,
198
+ 9828,
199
+ 9878,
200
+ 9928,
201
+ 9978,
202
+ 10028,
203
+ 10078,
204
+ 10128,
205
+ 10178,
206
+ 10228,
207
+ 10278,
208
+ 10328,
209
+ 10378,
210
+ 10428,
211
+ 10478,
212
+ 10528,
213
+ 10578,
214
+ 10628,
215
+ 10678,
216
+ 10728,
217
+ 10778,
218
+ 10828,
219
+ 10878,
220
+ 10928,
221
+ 10991,
222
+ 11041,
223
+ 11091,
224
+ 11141,
225
+ 11191,
226
+ 11241,
227
+ 11291,
228
+ 11341,
229
+ 11391,
230
+ 11441,
231
+ 11491,
232
+ 11541,
233
+ 11591,
234
+ 11641,
235
+ 11691,
236
+ 11741,
237
+ 11791,
238
+ 11841,
239
+ 11891,
240
+ 11941,
241
+ 11991,
242
+ 12041,
243
+ 12091,
244
+ 12141,
245
+ 12191,
246
+ 12241,
247
+ 12291,
248
+ 12341,
249
+ 12391,
250
+ 12441,
251
+ 12491,
252
+ 12554,
253
+ 12604,
254
+ 12654,
255
+ 12704,
256
+ 12754,
257
+ 12804,
258
+ 12854,
259
+ 12904,
260
+ 12954,
261
+ 13004,
262
+ 13054,
263
+ 13104,
264
+ 13154,
265
+ 13204,
266
+ 13254,
267
+ 13304,
268
+ 13354,
269
+ 13404,
270
+ 13454,
271
+ 13504,
272
+ 13554,
273
+ 13604,
274
+ 13654,
275
+ 13704,
276
+ 13754,
277
+ 13804,
278
+ 13854,
279
+ 13904,
280
+ 13954,
281
+ 14004,
282
+ 14054,
283
+ 14117,
284
+ 14167,
285
+ 14217,
286
+ 14267,
287
+ 14317,
288
+ 14367,
289
+ 14417,
290
+ 14467,
291
+ 14517,
292
+ 14567,
293
+ 14617,
294
+ 14667,
295
+ 14717,
296
+ 14767,
297
+ 14817,
298
+ 14867,
299
+ 14917,
300
+ 14967,
301
+ 15017,
302
+ 15067,
303
+ 15117,
304
+ 15167,
305
+ 15217,
306
+ 15267,
307
+ 15317,
308
+ 15367,
309
+ 15417,
310
+ 15467,
311
+ 15517,
312
+ 15567,
313
+ 15617
314
+ ],
315
+ "loss": [
316
+ 16.671669006347656,
317
+ 11.76451301574707,
318
+ 8.801431655883789,
319
+ 7.921006202697754,
320
+ 5.511175155639648,
321
+ 4.23372745513916,
322
+ 3.3669848442077637,
323
+ 2.7362313270568848,
324
+ 2.7798409461975098,
325
+ 2.0342774391174316,
326
+ 2.6778364181518555,
327
+ 2.3960514068603516,
328
+ 2.3930070400238037,
329
+ 1.4117414951324463,
330
+ 1.4301897287368774,
331
+ 1.7312417030334473,
332
+ 1.1918331384658813,
333
+ 1.3515545129776,
334
+ 1.8523873090744019,
335
+ 1.2459018230438232,
336
+ 0.9775326251983643,
337
+ -0.6364008784294128,
338
+ -3.243363618850708,
339
+ -4.095810890197754,
340
+ -6.960159778594971,
341
+ -9.253399848937988,
342
+ -9.103655815124512,
343
+ -9.563366889953613,
344
+ -11.231627464294434,
345
+ -11.219977378845215,
346
+ -11.866069793701172,
347
+ -13.595829963684082,
348
+ -13.131518363952637,
349
+ -13.202994346618652,
350
+ -13.279316902160645,
351
+ -13.075213432312012,
352
+ -13.784010887145996,
353
+ -13.952326774597168,
354
+ -13.966639518737793,
355
+ -13.274131774902344,
356
+ -13.492032051086426,
357
+ -14.071678161621094,
358
+ -13.921222686767578,
359
+ -13.53633975982666,
360
+ -13.5321626663208,
361
+ -14.607442855834961,
362
+ -14.159483909606934,
363
+ -14.47022533416748,
364
+ -13.999115943908691,
365
+ -13.745505332946777,
366
+ -14.885555267333984,
367
+ -14.397637367248535,
368
+ -14.321432113647461,
369
+ -14.085877418518066,
370
+ -14.414926528930664,
371
+ -13.892180442810059,
372
+ -13.484789848327637,
373
+ -13.856369972229004,
374
+ -14.260724067687988,
375
+ -14.607751846313477,
376
+ -14.285247802734375,
377
+ -14.1376953125,
378
+ -13.70485782623291,
379
+ -14.543573379516602,
380
+ -14.476613998413086,
381
+ -14.107405662536621,
382
+ -14.12656307220459,
383
+ -13.730513572692871,
384
+ -14.510255813598633,
385
+ -13.808155059814453,
386
+ -14.117059707641602,
387
+ -14.026846885681152,
388
+ -14.534915924072266,
389
+ -14.46925163269043,
390
+ -14.468484878540039,
391
+ -14.118741035461426,
392
+ -14.42296028137207,
393
+ -14.069829940795898,
394
+ -14.312148094177246,
395
+ -14.25886058807373,
396
+ -15.426573753356934,
397
+ -13.97634506225586,
398
+ -14.062787055969238,
399
+ -13.932819366455078,
400
+ -14.374216079711914,
401
+ -14.277177810668945,
402
+ -14.284172058105469,
403
+ -14.175317764282227,
404
+ -13.622069358825684,
405
+ -12.66834545135498,
406
+ -13.368535041809082,
407
+ -11.731734275817871,
408
+ -9.118104934692383,
409
+ -7.7215046882629395,
410
+ -6.636661052703857,
411
+ -6.065880298614502,
412
+ -5.550992488861084,
413
+ -5.093198776245117,
414
+ -4.752264499664307,
415
+ -5.129302501678467,
416
+ -4.841475009918213,
417
+ -4.835540771484375,
418
+ -4.206387996673584,
419
+ -5.119156837463379,
420
+ -3.9197139739990234,
421
+ -4.387465476989746,
422
+ -4.074684143066406,
423
+ -3.418381690979004,
424
+ -4.059027194976807,
425
+ -3.477524757385254,
426
+ -3.8114800453186035,
427
+ -3.1857621669769287,
428
+ -3.7550437450408936,
429
+ -3.1774818897247314,
430
+ -3.237245798110962,
431
+ -2.9989490509033203,
432
+ -3.0659162998199463,
433
+ -2.8278210163116455,
434
+ -3.4058122634887695,
435
+ -2.9876441955566406,
436
+ -2.8914389610290527,
437
+ -2.676650285720825,
438
+ -2.672682523727417,
439
+ -2.7980239391326904,
440
+ -3.3208882808685303,
441
+ -2.9594175815582275,
442
+ -2.949089765548706,
443
+ -2.682825803756714,
444
+ -2.5156426429748535,
445
+ -2.4986965656280518,
446
+ -2.7391247749328613,
447
+ -2.567275047302246,
448
+ -2.553879737854004,
449
+ -2.890953779220581,
450
+ -2.345930576324463,
451
+ -1.8966050148010254,
452
+ -2.860386371612549,
453
+ -2.4158926010131836,
454
+ -2.1681196689605713,
455
+ -1.8340377807617188,
456
+ -2.2587294578552246,
457
+ -1.906646490097046,
458
+ -2.0606415271759033,
459
+ -1.9160561561584473,
460
+ -2.48103928565979,
461
+ -1.9408878087997437,
462
+ -1.853256106376648,
463
+ -2.2146284580230713,
464
+ -2.201028347015381,
465
+ -1.828320026397705,
466
+ -2.034412384033203,
467
+ -1.7938942909240723,
468
+ -2.244307041168213,
469
+ -1.9889719486236572,
470
+ -1.6898540258407593,
471
+ -1.7858039140701294,
472
+ -2.191715955734253,
473
+ -1.9715027809143066,
474
+ -1.919372797012329,
475
+ -1.8914986848831177,
476
+ -1.8873316049575806,
477
+ -1.4288508892059326,
478
+ -2.1516754627227783,
479
+ -1.8888063430786133,
480
+ -1.8703267574310303,
481
+ -2.0618436336517334,
482
+ -1.4358248710632324,
483
+ -1.3266373872756958,
484
+ -1.5694628953933716,
485
+ -1.402905821800232,
486
+ -1.6993207931518555,
487
+ -1.5431238412857056,
488
+ -1.7176926136016846,
489
+ -1.5956352949142456,
490
+ -1.402787208557129,
491
+ -1.6125233173370361,
492
+ -1.6770639419555664,
493
+ -1.930527925491333,
494
+ -1.4489266872406006,
495
+ -1.4066162109375,
496
+ -1.8514528274536133,
497
+ -1.1257268190383911,
498
+ -1.7762130498886108,
499
+ -1.7130666971206665,
500
+ -1.2325992584228516,
501
+ -1.542702317237854,
502
+ -1.270906686782837,
503
+ -1.1530277729034424,
504
+ -1.4442468881607056,
505
+ -1.7895030975341797,
506
+ -1.8281203508377075,
507
+ -1.118044137954712,
508
+ -1.084818959236145,
509
+ -1.2554227113723755,
510
+ -1.0617523193359375,
511
+ -1.375596523284912,
512
+ -1.3179610967636108,
513
+ -1.1270630359649658,
514
+ -1.0592299699783325,
515
+ -1.3966926336288452,
516
+ -0.9684830904006958,
517
+ -1.1333949565887451,
518
+ -1.1397461891174316,
519
+ -1.2867859601974487,
520
+ -1.0852409601211548,
521
+ -1.3851423263549805,
522
+ -0.8853378295898438,
523
+ -0.94475919008255,
524
+ -0.9066417217254639,
525
+ -1.519598126411438,
526
+ -1.102278709411621,
527
+ -0.8912283182144165,
528
+ -0.7503770589828491,
529
+ -0.9335433840751648,
530
+ -0.9593464136123657,
531
+ -1.116734266281128,
532
+ -0.8759087324142456,
533
+ -1.2935878038406372,
534
+ -0.6411604881286621,
535
+ -0.9160860776901245,
536
+ -0.93536376953125,
537
+ -0.8380880355834961,
538
+ -0.7900724411010742,
539
+ -0.9567074179649353,
540
+ -0.7380226254463196,
541
+ -0.9075157046318054,
542
+ -0.8449690937995911,
543
+ -0.9333892464637756,
544
+ -0.7380180954933167,
545
+ -1.0785728693008423,
546
+ -0.8032457828521729,
547
+ -0.6366966962814331,
548
+ -0.6988163590431213,
549
+ -0.9169015288352966,
550
+ -1.214188814163208,
551
+ -0.6135467886924744,
552
+ -0.6465123891830444,
553
+ -0.7552400827407837,
554
+ -0.7670201659202576,
555
+ -0.8525322675704956,
556
+ -0.7103525400161743,
557
+ -0.5674810409545898,
558
+ -1.270815372467041,
559
+ -0.7840167284011841,
560
+ -0.5641080141067505,
561
+ -0.8306724429130554,
562
+ -0.788975179195404,
563
+ -0.65106600522995,
564
+ -0.5759876370429993,
565
+ -0.555364191532135,
566
+ -0.7142438888549805,
567
+ -0.602454662322998,
568
+ -0.7172399163246155,
569
+ -0.4023277461528778,
570
+ -0.6256492733955383,
571
+ -0.7062656283378601,
572
+ -0.6178817749023438,
573
+ -0.4715927243232727,
574
+ -0.37143242359161377,
575
+ -0.5795446634292603,
576
+ -0.7000231146812439,
577
+ -0.6491426229476929,
578
+ -0.5702045559883118,
579
+ -0.6726967692375183,
580
+ -0.46789199113845825,
581
+ -0.649307131767273,
582
+ -0.612271249294281,
583
+ -0.45937222242355347,
584
+ -0.35666269063949585,
585
+ -0.5950183272361755,
586
+ -0.5590232610702515,
587
+ -0.5428248047828674,
588
+ -0.5403609275817871,
589
+ -0.3566666543483734,
590
+ -0.6202500462532043,
591
+ -0.4409750699996948,
592
+ -0.5675917863845825,
593
+ -0.4542946517467499,
594
+ -0.39824873208999634,
595
+ -0.3195297420024872,
596
+ -0.4000018239021301,
597
+ -0.45862290263175964,
598
+ -0.5217932462692261,
599
+ -0.39715659618377686,
600
+ -0.33934420347213745,
601
+ -0.43397337198257446,
602
+ -0.4806961417198181,
603
+ -0.3589365780353546,
604
+ -0.4422625005245209,
605
+ -0.6090811491012573,
606
+ -0.4298260509967804,
607
+ -0.3886895775794983,
608
+ -0.29521632194519043,
609
+ -0.335098534822464,
610
+ -0.2614021599292755,
611
+ -0.7061392664909363,
612
+ -0.39528343081474304,
613
+ -0.25662821531295776,
614
+ -0.2705487608909607,
615
+ -0.34987732768058777,
616
+ -0.26364603638648987,
617
+ -0.28086966276168823,
618
+ -0.3212970197200775,
619
+ -0.19448548555374146,
620
+ -0.28908517956733704,
621
+ -0.3309410810470581,
622
+ -0.311942994594574,
623
+ -0.3063529431819916,
624
+ -0.34509095549583435,
625
+ -0.39035525918006897
626
+ ],
627
+ "base_loss": [
628
+ 10.580854415893555,
629
+ 8.119989395141602,
630
+ 7.3575310707092285,
631
+ 6.388346195220947,
632
+ 5.366873264312744,
633
+ 3.7506906986236572,
634
+ 2.317335367202759,
635
+ 2.0707907676696777,
636
+ 1.9128801822662354,
637
+ 1.8451582193374634,
638
+ 1.8457585573196411,
639
+ 1.790676474571228,
640
+ 1.8424475193023682,
641
+ 1.8503745794296265,
642
+ 1.8616712093353271,
643
+ 1.8210214376449585,
644
+ 1.791472315788269,
645
+ 1.8120089769363403,
646
+ 1.7665530443191528,
647
+ 1.808519959449768,
648
+ 1.7760982513427734,
649
+ 1.8747520446777344,
650
+ 1.9280900955200195,
651
+ 1.828168511390686,
652
+ 1.8661088943481445,
653
+ 1.8001527786254883,
654
+ 1.774647831916809,
655
+ 1.6722437143325806,
656
+ 1.6824556589126587,
657
+ 1.7306270599365234,
658
+ 1.6374658346176147,
659
+ 1.7564665079116821,
660
+ 1.6978530883789062,
661
+ 1.6683281660079956,
662
+ 1.670649766921997,
663
+ 1.6164610385894775,
664
+ 1.6997318267822266,
665
+ 1.690144658088684,
666
+ 1.6809651851654053,
667
+ 1.6078029870986938,
668
+ 1.590226173400879,
669
+ 1.6705245971679688,
670
+ 1.6055727005004883,
671
+ 1.5866053104400635,
672
+ 1.5808082818984985,
673
+ 1.6946316957473755,
674
+ 1.6277645826339722,
675
+ 1.663727045059204,
676
+ 1.633544683456421,
677
+ 1.5950450897216797,
678
+ 1.7065118551254272,
679
+ 1.6284934282302856,
680
+ 1.6226651668548584,
681
+ 1.6058158874511719,
682
+ 1.6366831064224243,
683
+ 1.5840657949447632,
684
+ 1.5265496969223022,
685
+ 1.5768431425094604,
686
+ 1.6252962350845337,
687
+ 1.6619303226470947,
688
+ 1.6097668409347534,
689
+ 1.596845030784607,
690
+ 1.5575586557388306,
691
+ 1.6523736715316772,
692
+ 1.651186227798462,
693
+ 1.5962696075439453,
694
+ 1.5841522216796875,
695
+ 1.5555152893066406,
696
+ 1.634290099143982,
697
+ 1.561633825302124,
698
+ 1.5917693376541138,
699
+ 1.5894688367843628,
700
+ 1.6380078792572021,
701
+ 1.6202070713043213,
702
+ 1.6248090267181396,
703
+ 1.579480767250061,
704
+ 1.6126420497894287,
705
+ 1.5998783111572266,
706
+ 1.6076043844223022,
707
+ 1.5964406728744507,
708
+ 1.7230976819992065,
709
+ 1.5618696212768555,
710
+ 1.5692088603973389,
711
+ 1.5604798793792725,
712
+ 1.6072237491607666,
713
+ 1.5947141647338867,
714
+ 1.5954008102416992,
715
+ 1.5883949995040894,
716
+ 1.5214720964431763,
717
+ 1.4194573163986206,
718
+ 1.4938545227050781,
719
+ 1.3120161294937134,
720
+ 1.0255168676376343,
721
+ 0.8711405396461487,
722
+ 0.74779212474823,
723
+ 0.682752788066864,
724
+ 0.6244893670082092,
725
+ 0.5808435082435608,
726
+ 0.5371533632278442,
727
+ 0.5762635469436646,
728
+ 0.5437158346176147,
729
+ 0.5455597043037415,
730
+ 0.47316813468933105,
731
+ 0.5756062269210815,
732
+ 0.44454050064086914,
733
+ 0.49653053283691406,
734
+ 0.45801523327827454,
735
+ 0.38474538922309875,
736
+ 0.4559524953365326,
737
+ 0.39584872126579285,
738
+ 0.42833438515663147,
739
+ 0.3595929741859436,
740
+ 0.4211898446083069,
741
+ 0.3573281466960907,
742
+ 0.3656110167503357,
743
+ 0.3394474685192108,
744
+ 0.34687915444374084,
745
+ 0.31798049807548523,
746
+ 0.38100773096084595,
747
+ 0.33725786209106445,
748
+ 0.32460835576057434,
749
+ 0.30156829953193665,
750
+ 0.3008739650249481,
751
+ 0.31441500782966614,
752
+ 0.3745601773262024,
753
+ 0.33160558342933655,
754
+ 0.33050528168678284,
755
+ 0.3007682263851166,
756
+ 0.283095121383667,
757
+ 0.28178638219833374,
758
+ 0.3084280788898468,
759
+ 0.28848329186439514,
760
+ 0.2892639935016632,
761
+ 0.32449260354042053,
762
+ 0.26323333382606506,
763
+ 0.22359739243984222,
764
+ 0.3220460116863251,
765
+ 0.2926539480686188,
766
+ 0.24356520175933838,
767
+ 0.20664116740226746,
768
+ 0.2545173466205597,
769
+ 0.2144070863723755,
770
+ 0.2385072410106659,
771
+ 0.21697112917900085,
772
+ 0.27931639552116394,
773
+ 0.2182837575674057,
774
+ 0.21005725860595703,
775
+ 0.24993708729743958,
776
+ 0.24655453860759735,
777
+ 0.20667508244514465,
778
+ 0.23139040172100067,
779
+ 0.20187489688396454,
780
+ 0.25210073590278625,
781
+ 0.2255709171295166,
782
+ 0.18960872292518616,
783
+ 0.2023891657590866,
784
+ 0.24529790878295898,
785
+ 0.22237446904182434,
786
+ 0.2161502093076706,
787
+ 0.21211178600788116,
788
+ 0.21355855464935303,
789
+ 0.16337816417217255,
790
+ 0.24225734174251556,
791
+ 0.211660698056221,
792
+ 0.20943006873130798,
793
+ 0.233957439661026,
794
+ 0.16396750509738922,
795
+ 0.14962902665138245,
796
+ 0.1758873611688614,
797
+ 0.1604095846414566,
798
+ 0.19222556054592133,
799
+ 0.17423351109027863,
800
+ 0.1934070587158203,
801
+ 0.18693335354328156,
802
+ 0.15890741348266602,
803
+ 0.1813715547323227,
804
+ 0.18883773684501648,
805
+ 0.21779997646808624,
806
+ 0.16362996399402618,
807
+ 0.15952694416046143,
808
+ 0.21145786345005035,
809
+ 0.1282462626695633,
810
+ 0.19901803135871887,
811
+ 0.19262051582336426,
812
+ 0.13982339203357697,
813
+ 0.17418090999126434,
814
+ 0.14544856548309326,
815
+ 0.1315660923719406,
816
+ 0.16684947907924652,
817
+ 0.2021123468875885,
818
+ 0.20483198761940002,
819
+ 0.13199248909950256,
820
+ 0.12378420680761337,
821
+ 0.14227592945098877,
822
+ 0.12235838919878006,
823
+ 0.15495094656944275,
824
+ 0.14758138358592987,
825
+ 0.13045068085193634,
826
+ 0.12066575139760971,
827
+ 0.1572522073984146,
828
+ 0.10982964187860489,
829
+ 0.1298765391111374,
830
+ 0.1281500905752182,
831
+ 0.14656832814216614,
832
+ 0.12244265526533127,
833
+ 0.15763868391513824,
834
+ 0.10095322877168655,
835
+ 0.10781024396419525,
836
+ 0.10424082726240158,
837
+ 0.17119719088077545,
838
+ 0.12505456805229187,
839
+ 0.10057372599840164,
840
+ 0.08568765968084335,
841
+ 0.1093149334192276,
842
+ 0.10943430662155151,
843
+ 0.12677355110645294,
844
+ 0.10003077983856201,
845
+ 0.14645418524742126,
846
+ 0.07274025678634644,
847
+ 0.10459715873003006,
848
+ 0.10570158064365387,
849
+ 0.0950184240937233,
850
+ 0.08981633931398392,
851
+ 0.10920991003513336,
852
+ 0.0831788033246994,
853
+ 0.1030617505311966,
854
+ 0.09639338403940201,
855
+ 0.10584582388401031,
856
+ 0.0847930759191513,
857
+ 0.12341125309467316,
858
+ 0.09179931879043579,
859
+ 0.0737370103597641,
860
+ 0.07879512757062912,
861
+ 0.10479319095611572,
862
+ 0.13663651049137115,
863
+ 0.07123450189828873,
864
+ 0.07449010759592056,
865
+ 0.08675049990415573,
866
+ 0.08661101013422012,
867
+ 0.0966150164604187,
868
+ 0.08276067674160004,
869
+ 0.06827885657548904,
870
+ 0.1431131213903427,
871
+ 0.08881387859582901,
872
+ 0.06503797322511673,
873
+ 0.09457540512084961,
874
+ 0.08973288536071777,
875
+ 0.07396655529737473,
876
+ 0.06614848226308823,
877
+ 0.06386690586805344,
878
+ 0.08118759840726852,
879
+ 0.0680375024676323,
880
+ 0.08105553686618805,
881
+ 0.045911479741334915,
882
+ 0.0726836770772934,
883
+ 0.08092149347066879,
884
+ 0.0712655708193779,
885
+ 0.054410941898822784,
886
+ 0.043259959667921066,
887
+ 0.06585840880870819,
888
+ 0.07975509017705917,
889
+ 0.07529892027378082,
890
+ 0.06518300622701645,
891
+ 0.07613348215818405,
892
+ 0.05287592485547066,
893
+ 0.0744367465376854,
894
+ 0.07044298201799393,
895
+ 0.0531424805521965,
896
+ 0.04141668602824211,
897
+ 0.06721319258213043,
898
+ 0.06409581750631332,
899
+ 0.06317402422428131,
900
+ 0.06276766210794449,
901
+ 0.041923750191926956,
902
+ 0.07003537565469742,
903
+ 0.05061003938317299,
904
+ 0.06434254348278046,
905
+ 0.05242345854640007,
906
+ 0.045546114444732666,
907
+ 0.03749945014715195,
908
+ 0.04622683301568031,
909
+ 0.05430757999420166,
910
+ 0.06010174751281738,
911
+ 0.0459761805832386,
912
+ 0.03930548578500748,
913
+ 0.0503813736140728,
914
+ 0.05708807706832886,
915
+ 0.041468601673841476,
916
+ 0.05045849829912186,
917
+ 0.07037588953971863,
918
+ 0.04919378086924553,
919
+ 0.0451410673558712,
920
+ 0.03385286405682564,
921
+ 0.03891809657216072,
922
+ 0.032340068370103836,
923
+ 0.079730324447155,
924
+ 0.045579779893159866,
925
+ 0.031919825822114944,
926
+ 0.03207848593592644,
927
+ 0.04037968069314957,
928
+ 0.03096827305853367,
929
+ 0.032661374658346176,
930
+ 0.037077147513628006,
931
+ 0.023557504639029503,
932
+ 0.035045452415943146,
933
+ 0.038039352744817734,
934
+ 0.03735768795013428,
935
+ 0.03715559467673302,
936
+ 0.04278060048818588,
937
+ 0.04488012567162514
938
+ ],
939
+ "info_loss": [
940
+ -0.17996692657470703,
941
+ -0.3190937042236328,
942
+ -0.3570389747619629,
943
+ -0.19894742965698242,
944
+ -0.23011016845703125,
945
+ -0.1346883773803711,
946
+ -0.0539860725402832,
947
+ -0.0833503007888794,
948
+ -0.058913588523864746,
949
+ -0.12580227851867676,
950
+ -0.060360074043273926,
951
+ -0.08251023292541504,
952
+ -0.08766293525695801,
953
+ -0.18720686435699463,
954
+ -0.18549346923828125,
955
+ -0.151009202003479,
956
+ -0.20220160484313965,
957
+ -0.18667054176330566,
958
+ -0.12886452674865723,
959
+ -0.18700921535491943,
960
+ -0.18197119235992432,
961
+ -0.30183613300323486,
962
+ -0.5505107641220093,
963
+ -0.6193157434463501,
964
+ -0.9058982133865356,
965
+ -1.1273815631866455,
966
+ -1.1080050468444824,
967
+ -1.1432299613952637,
968
+ -1.3089624643325806,
969
+ -1.310119390487671,
970
+ -1.3641177415847778,
971
+ -1.548097848892212,
972
+ -1.4956003427505493,
973
+ -1.4994077682495117,
974
+ -1.505875587463379,
975
+ -1.4798970222473145,
976
+ -1.558509349822998,
977
+ -1.5736181735992432,
978
+ -1.5748445987701416,
979
+ -1.4975718259811401,
980
+ -1.517536997795105,
981
+ -1.5836838483810425,
982
+ -1.5615086555480957,
983
+ -1.5210106372833252,
984
+ -1.5199164152145386,
985
+ -1.6390318870544434,
986
+ -1.5876792669296265,
987
+ -1.6216202974319458,
988
+ -1.5719168186187744,
989
+ -1.542820930480957,
990
+ -1.66734778881073,
991
+ -1.6107299327850342,
992
+ -1.6022093296051025,
993
+ -1.5772621631622314,
994
+ -1.6136329174041748,
995
+ -1.5553803443908691,
996
+ -1.5086798667907715,
997
+ -1.551520824432373,
998
+ -1.5959516763687134,
999
+ -1.6351819038391113,
1000
+ -1.5981864929199219,
1001
+ -1.5813840627670288,
1002
+ -1.5355732440948486,
1003
+ -1.627362847328186,
1004
+ -1.6219881772994995,
1005
+ -1.5776844024658203,
1006
+ -1.577966332435608,
1007
+ -1.5382840633392334,
1008
+ -1.6226786375045776,
1009
+ -1.544333577156067,
1010
+ -1.579701542854309,
1011
+ -1.57033371925354,
1012
+ -1.624372124671936,
1013
+ -1.6153326034545898,
1014
+ -1.6191116571426392,
1015
+ -1.5754673480987549,
1016
+ -1.6087896823883057,
1017
+ -1.572089433670044,
1018
+ -1.5979163646697998,
1019
+ -1.5896975994110107,
1020
+ -1.7210109233856201,
1021
+ -1.559007167816162,
1022
+ -1.5680458545684814,
1023
+ -1.5563300848007202,
1024
+ -1.6043293476104736,
1025
+ -1.5922127962112427,
1026
+ -1.5927090644836426,
1027
+ -1.581242322921753,
1028
+ -1.5191965103149414,
1029
+ -1.4125746488571167,
1030
+ -1.4907222986221313,
1031
+ -1.3086503744125366,
1032
+ -1.0196993350982666,
1033
+ -0.8642669916152954,
1034
+ -0.7444685697555542,
1035
+ -0.6803299188613892,
1036
+ -0.6222341060638428,
1037
+ -0.5722401738166809,
1038
+ -0.5327720046043396,
1039
+ -0.5747119188308716,
1040
+ -0.5429865717887878,
1041
+ -0.5421769022941589,
1042
+ -0.4714232087135315,
1043
+ -0.5735390186309814,
1044
+ -0.4399084150791168,
1045
+ -0.49221763014793396,
1046
+ -0.4561785161495209,
1047
+ -0.3835972845554352,
1048
+ -0.4552410840988159,
1049
+ -0.3910060524940491,
1050
+ -0.42728784680366516,
1051
+ -0.3579067289829254,
1052
+ -0.42032092809677124,
1053
+ -0.3570646345615387,
1054
+ -0.36265188455581665,
1055
+ -0.3370177447795868,
1056
+ -0.3462562561035156,
1057
+ -0.31741368770599365,
1058
+ -0.3804982900619507,
1059
+ -0.33681613206863403,
1060
+ -0.32431018352508545,
1061
+ -0.30130457878112793,
1062
+ -0.30021288990974426,
1063
+ -0.3136861324310303,
1064
+ -0.3720722198486328,
1065
+ -0.3313670754432678,
1066
+ -0.33003127574920654,
1067
+ -0.3006082773208618,
1068
+ -0.2827286720275879,
1069
+ -0.28115639090538025,
1070
+ -0.30827274918556213,
1071
+ -0.2881247401237488,
1072
+ -0.28746354579925537,
1073
+ -0.32409948110580444,
1074
+ -0.2629616856575012,
1075
+ -0.21455107629299164,
1076
+ -0.32120198011398315,
1077
+ -0.2749188244342804,
1078
+ -0.24328647553920746,
1079
+ -0.20617544651031494,
1080
+ -0.25418204069137573,
1081
+ -0.21421004831790924,
1082
+ -0.23501364886760712,
1083
+ -0.21569274365901947,
1084
+ -0.27855417132377625,
1085
+ -0.217383474111557,
1086
+ -0.20980972051620483,
1087
+ -0.24906191229820251,
1088
+ -0.24639293551445007,
1089
+ -0.20644114911556244,
1090
+ -0.23124420642852783,
1091
+ -0.20180894434452057,
1092
+ -0.2518523037433624,
1093
+ -0.22521087527275085,
1094
+ -0.1894122213125229,
1095
+ -0.20228645205497742,
1096
+ -0.2452012002468109,
1097
+ -0.22208666801452637,
1098
+ -0.2159036099910736,
1099
+ -0.2118225246667862,
1100
+ -0.2133956402540207,
1101
+ -0.16279751062393188,
1102
+ -0.24200676381587982,
1103
+ -0.2112807035446167,
1104
+ -0.20928657054901123,
1105
+ -0.23227792978286743,
1106
+ -0.16352015733718872,
1107
+ -0.14952941238880157,
1108
+ -0.17578725516796112,
1109
+ -0.16035915911197662,
1110
+ -0.19215452671051025,
1111
+ -0.1737513244152069,
1112
+ -0.1933174580335617,
1113
+ -0.18029972910881042,
1114
+ -0.15852904319763184,
1115
+ -0.18122391402721405,
1116
+ -0.18878407776355743,
1117
+ -0.21673789620399475,
1118
+ -0.16333439946174622,
1119
+ -0.15893402695655823,
1120
+ -0.2106197327375412,
1121
+ -0.12788090109825134,
1122
+ -0.19891726970672607,
1123
+ -0.19253608584403992,
1124
+ -0.13897256553173065,
1125
+ -0.17408844828605652,
1126
+ -0.14527390897274017,
1127
+ -0.13148440420627594,
1128
+ -0.16394594311714172,
1129
+ -0.20199790596961975,
1130
+ -0.20452159643173218,
1131
+ -0.12705852091312408,
1132
+ -0.1237156018614769,
1133
+ -0.14167487621307373,
1134
+ -0.12115234136581421,
1135
+ -0.15484929084777832,
1136
+ -0.1473502814769745,
1137
+ -0.13023601472377777,
1138
+ -0.12042754888534546,
1139
+ -0.15715979039669037,
1140
+ -0.10967076569795609,
1141
+ -0.12870651483535767,
1142
+ -0.12807932496070862,
1143
+ -0.14650602638721466,
1144
+ -0.12239541858434677,
1145
+ -0.15736448764801025,
1146
+ -0.10068048536777496,
1147
+ -0.1070597916841507,
1148
+ -0.10414526611566544,
1149
+ -0.17113865911960602,
1150
+ -0.12484883517026901,
1151
+ -0.10050682723522186,
1152
+ -0.08561678975820541,
1153
+ -0.1087525337934494,
1154
+ -0.10938119888305664,
1155
+ -0.12639160454273224,
1156
+ -0.09981365501880646,
1157
+ -0.14637455344200134,
1158
+ -0.07250282168388367,
1159
+ -0.104531429708004,
1160
+ -0.10568559914827347,
1161
+ -0.09498116374015808,
1162
+ -0.08961202949285507,
1163
+ -0.10917086899280548,
1164
+ -0.08308960497379303,
1165
+ -0.10303566604852676,
1166
+ -0.09634371846914291,
1167
+ -0.10571286827325821,
1168
+ -0.08474351465702057,
1169
+ -0.12209111452102661,
1170
+ -0.09178029745817184,
1171
+ -0.07351583987474442,
1172
+ -0.0787777528166771,
1173
+ -0.10475990176200867,
1174
+ -0.13661758601665497,
1175
+ -0.07112528383731842,
1176
+ -0.07447189092636108,
1177
+ -0.08673693239688873,
1178
+ -0.08659523725509644,
1179
+ -0.09658211469650269,
1180
+ -0.08267847448587418,
1181
+ -0.06712014973163605,
1182
+ -0.14302897453308105,
1183
+ -0.08876700699329376,
1184
+ -0.06501232832670212,
1185
+ -0.09453508257865906,
1186
+ -0.08969758450984955,
1187
+ -0.07390053570270538,
1188
+ -0.0661381259560585,
1189
+ -0.06384944915771484,
1190
+ -0.08109883219003677,
1191
+ -0.0680072084069252,
1192
+ -0.08103962242603302,
1193
+ -0.04586905613541603,
1194
+ -0.07267068326473236,
1195
+ -0.08090422302484512,
1196
+ -0.07110242545604706,
1197
+ -0.05409397929906845,
1198
+ -0.04269455373287201,
1199
+ -0.06583482027053833,
1200
+ -0.07937608659267426,
1201
+ -0.07524216175079346,
1202
+ -0.06517204642295837,
1203
+ -0.07612097263336182,
1204
+ -0.052849315106868744,
1205
+ -0.07370105385780334,
1206
+ -0.07042257487773895,
1207
+ -0.05312580615282059,
1208
+ -0.04139900207519531,
1209
+ -0.06719101965427399,
1210
+ -0.06405308842658997,
1211
+ -0.06315374374389648,
1212
+ -0.06275524944067001,
1213
+ -0.041907232254743576,
1214
+ -0.07002557069063187,
1215
+ -0.05053453519940376,
1216
+ -0.06433310359716415,
1217
+ -0.052391860634088516,
1218
+ -0.04545298591256142,
1219
+ -0.037478815764188766,
1220
+ -0.046212367713451385,
1221
+ -0.05429388955235481,
1222
+ -0.060085806995630264,
1223
+ -0.04596419259905815,
1224
+ -0.03929342329502106,
1225
+ -0.05037174001336098,
1226
+ -0.057066384702920914,
1227
+ -0.04145510122179985,
1228
+ -0.050410572439432144,
1229
+ -0.07036355882883072,
1230
+ -0.0491868332028389,
1231
+ -0.04512714967131615,
1232
+ -0.0338466539978981,
1233
+ -0.038909655064344406,
1234
+ -0.03232991695404053,
1235
+ -0.0797240287065506,
1236
+ -0.04530204460024834,
1237
+ -0.03190861642360687,
1238
+ -0.03206954523921013,
1239
+ -0.0403728149831295,
1240
+ -0.030958812683820724,
1241
+ -0.03265200927853584,
1242
+ -0.03706395998597145,
1243
+ -0.02355104126036167,
1244
+ -0.035033151507377625,
1245
+ -0.03803236037492752,
1246
+ -0.03734046220779419,
1247
+ -0.03714447841048241,
1248
+ -0.04277036339044571,
1249
+ -0.044874515384435654
1250
+ ],
1251
+ "abs_loss": [
1252
+ 2.777390480041504,
1253
+ 2.7542929649353027,
1254
+ 2.6910240650177,
1255
+ 2.6029257774353027,
1256
+ 2.49186372756958,
1257
+ 2.375990867614746,
1258
+ 2.3502631187438965,
1259
+ 2.308225631713867,
1260
+ 2.187129497528076,
1261
+ 2.2456979751586914,
1262
+ 2.1835029125213623,
1263
+ 2.165350914001465,
1264
+ 2.0977091789245605,
1265
+ 2.1832118034362793,
1266
+ 2.0973477363586426,
1267
+ 2.115016222000122,
1268
+ 2.146544933319092,
1269
+ 2.0843350887298584,
1270
+ 2.0572328567504883,
1271
+ 1.9873418807983398,
1272
+ 1.582409381866455,
1273
+ 1.1125017404556274,
1274
+ 0.9802367091178894,
1275
+ 0.9867104887962341,
1276
+ 0.8765336275100708,
1277
+ 0.9114257097244263,
1278
+ 0.9439901113510132,
1279
+ 0.9020074605941772,
1280
+ 0.849125862121582,
1281
+ 0.732757031917572,
1282
+ 0.6503767371177673,
1283
+ 0.6647205352783203,
1284
+ 0.626185417175293,
1285
+ 0.6453863382339478,
1286
+ 0.5542699098587036,
1287
+ 0.6062915325164795,
1288
+ 0.5217954516410828,
1289
+ 0.542735755443573,
1290
+ 0.6098823547363281,
1291
+ 0.4961710572242737,
1292
+ 0.516142725944519,
1293
+ 0.5891120433807373,
1294
+ 0.5462960004806519,
1295
+ 0.5471148490905762,
1296
+ 0.5368908643722534,
1297
+ 0.5415256023406982,
1298
+ 0.5650905966758728,
1299
+ 0.4759629964828491,
1300
+ 0.48722296953201294,
1301
+ 0.5060516595840454,
1302
+ 0.5123686790466309,
1303
+ 0.5332933664321899,
1304
+ 0.4913908541202545,
1305
+ 0.5090692043304443,
1306
+ 0.5381864309310913,
1307
+ 0.49255263805389404,
1308
+ 0.45616644620895386,
1309
+ 0.4980049431324005,
1310
+ 0.46533700823783875,
1311
+ 0.5103980302810669,
1312
+ 0.5361555218696594,
1313
+ 0.523546576499939,
1314
+ 0.5736702084541321,
1315
+ 0.5269625186920166,
1316
+ 0.47481662034988403,
1317
+ 0.5128247141838074,
1318
+ 0.45774513483047485,
1319
+ 0.47311192750930786,
1320
+ 0.5796756148338318,
1321
+ 0.4752861261367798,
1322
+ 0.4487062692642212,
1323
+ 0.3354308307170868,
1324
+ 0.31262338161468506,
1325
+ 0.3893863558769226,
1326
+ 0.24947258830070496,
1327
+ 0.32958728075027466,
1328
+ 0.2973918914794922,
1329
+ 0.2644157111644745,
1330
+ 0.32219040393829346,
1331
+ 0.27280551195144653,
1332
+ 0.22958531975746155,
1333
+ 0.2734881043434143,
1334
+ 0.282461553812027,
1335
+ 0.25209349393844604,
1336
+ 0.2485329508781433,
1337
+ 0.21366889774799347,
1338
+ 0.2146233320236206,
1339
+ 0.19329425692558289,
1340
+ 0.1748945415019989,
1341
+ 0.22702203691005707,
1342
+ 0.19403311610221863,
1343
+ 0.20346319675445557,
1344
+ 0.21548908948898315,
1345
+ 0.24604284763336182,
1346
+ 0.28499865531921387,
1347
+ 0.24369443953037262,
1348
+ 0.19881168007850647,
1349
+ 0.21112880110740662,
1350
+ 0.20992335677146912,
1351
+ 0.2196955531835556,
1352
+ 0.21074308454990387,
1353
+ 0.24281440675258636,
1354
+ 0.2148689329624176,
1355
+ 0.15726089477539062,
1356
+ 0.17713592946529388,
1357
+ 0.18005093932151794,
1358
+ 0.15527662634849548,
1359
+ 0.1784200370311737,
1360
+ 0.18204009532928467,
1361
+ 0.13945381343364716,
1362
+ 0.16688433289527893,
1363
+ 0.12064576148986816,
1364
+ 0.11875905096530914,
1365
+ 0.11682071536779404,
1366
+ 0.10268653929233551,
1367
+ 0.12855763733386993,
1368
+ 0.09095726907253265,
1369
+ 0.07905097305774689,
1370
+ 0.07472017407417297,
1371
+ 0.07584404945373535,
1372
+ 0.07616132497787476,
1373
+ 0.06104925274848938,
1374
+ 0.06016627326607704,
1375
+ 0.09960777312517166,
1376
+ 0.053712934255599976,
1377
+ 0.0893075242638588,
1378
+ 0.07951012253761292,
1379
+ 0.08070825040340424,
1380
+ 0.078128382563591,
1381
+ 0.06435772776603699,
1382
+ 0.06134745851159096,
1383
+ 0.09688157588243484,
1384
+ 0.049335725605487823,
1385
+ 0.06774897128343582,
1386
+ 0.0524895079433918,
1387
+ 0.07479576766490936,
1388
+ 0.066282257437706,
1389
+ 0.08091644942760468,
1390
+ 0.057373810559511185,
1391
+ 0.05920691043138504,
1392
+ 0.03549985587596893,
1393
+ 0.034693390130996704,
1394
+ 0.1043175756931305,
1395
+ 0.046148549765348434,
1396
+ 0.0611160509288311,
1397
+ 0.06718748807907104,
1398
+ 0.06168418005108833,
1399
+ 0.046257708221673965,
1400
+ 0.042010292410850525,
1401
+ 0.03786591440439224,
1402
+ 0.04676896333694458,
1403
+ 0.04182325303554535,
1404
+ 0.054382406175136566,
1405
+ 0.06026673689484596,
1406
+ 0.02561812289059162,
1407
+ 0.03377419710159302,
1408
+ 0.03337690979242325,
1409
+ 0.02650095522403717,
1410
+ 0.027271989732980728,
1411
+ 0.028183620423078537,
1412
+ 0.031203310936689377,
1413
+ 0.06414103507995605,
1414
+ 0.03632226958870888,
1415
+ 0.042460061609745026,
1416
+ 0.048993006348609924,
1417
+ 0.038919635117053986,
1418
+ 0.028393317013978958,
1419
+ 0.01862436719238758,
1420
+ 0.03290107101202011,
1421
+ 0.025886476039886475,
1422
+ 0.031114492565393448,
1423
+ 0.04478691518306732,
1424
+ 0.024170350283384323,
1425
+ 0.02472083270549774,
1426
+ 0.04190833494067192,
1427
+ 0.02411479689180851,
1428
+ 0.01534140482544899,
1429
+ 0.024496104568243027,
1430
+ 0.03568828105926514,
1431
+ 0.02154652588069439,
1432
+ 0.011340830475091934,
1433
+ 0.017682110890746117,
1434
+ 0.014485195279121399,
1435
+ 0.01631789095699787,
1436
+ 0.013543538749217987,
1437
+ 0.013808045536279678,
1438
+ 0.02450021170079708,
1439
+ 0.03066507913172245,
1440
+ 0.020564699545502663,
1441
+ 0.015590582974255085,
1442
+ 0.017335735261440277,
1443
+ 0.023811744526028633,
1444
+ 0.0059436894953250885,
1445
+ 0.011603141203522682,
1446
+ 0.02749473974108696,
1447
+ 0.014896477572619915,
1448
+ 0.009585765190422535,
1449
+ 0.02212778851389885,
1450
+ 0.014556828886270523,
1451
+ 0.0058863405138254166,
1452
+ 0.016437437385320663,
1453
+ 0.011743432842195034,
1454
+ 0.019322680309414864,
1455
+ 0.0323767364025116,
1456
+ 0.013688751496374607,
1457
+ 0.012714856304228306,
1458
+ 0.008867435157299042,
1459
+ 0.01705610193312168,
1460
+ 0.010245328769087791,
1461
+ 0.019361324608325958,
1462
+ 0.009954091161489487,
1463
+ 0.003815968055278063,
1464
+ 0.005069333128631115,
1465
+ 0.021628838032484055,
1466
+ 0.013429581187665462,
1467
+ 0.04039314389228821,
1468
+ 0.008578795939683914,
1469
+ 0.009801072999835014,
1470
+ 0.009786183014512062,
1471
+ 0.009284639731049538,
1472
+ 0.005527643486857414,
1473
+ 0.007528270129114389,
1474
+ 0.005455834325402975,
1475
+ 0.013145661912858486,
1476
+ 0.015458343550562859,
1477
+ 0.005277408752590418,
1478
+ 0.011443623341619968,
1479
+ 0.011221352964639664,
1480
+ 0.011266663670539856,
1481
+ 0.00862051360309124,
1482
+ 0.007774342782795429,
1483
+ 0.006529485806822777,
1484
+ 0.008653920143842697,
1485
+ 0.015745297074317932,
1486
+ 0.021161241456866264,
1487
+ 0.008661377243697643,
1488
+ 0.017117857933044434,
1489
+ 0.006823975592851639,
1490
+ 0.008625506423413754,
1491
+ 0.011471963487565517,
1492
+ 0.010647810995578766,
1493
+ 0.006814572028815746,
1494
+ 0.016460467129945755,
1495
+ 0.006403671577572823,
1496
+ 0.0105741573497653,
1497
+ 0.006004702299833298,
1498
+ 0.015992794185876846,
1499
+ 0.008600767701864243,
1500
+ 0.0034296754747629166,
1501
+ 0.0049955351278185844,
1502
+ 0.004791652783751488,
1503
+ 0.003410188015550375,
1504
+ 0.007148274220526218,
1505
+ 0.007265172898769379,
1506
+ 0.0025874958373606205,
1507
+ 0.0029066037386655807,
1508
+ 0.002836958970874548,
1509
+ 0.0024897046387195587,
1510
+ 0.003422972746193409,
1511
+ 0.003125639632344246,
1512
+ 0.006093741860240698,
1513
+ 0.005198986269533634,
1514
+ 0.010119442827999592,
1515
+ 0.005335838533937931,
1516
+ 0.004960666410624981,
1517
+ 0.004177124239504337,
1518
+ 0.010487631894648075,
1519
+ 0.008371005766093731,
1520
+ 0.0095920879393816,
1521
+ 0.01057339645922184,
1522
+ 0.002690997440367937,
1523
+ 0.004933019634336233,
1524
+ 0.015536258928477764,
1525
+ 0.007761161774396896,
1526
+ 0.012462147511541843,
1527
+ 0.00429706322029233,
1528
+ 0.011079523712396622,
1529
+ 0.006766865029931068,
1530
+ 0.0027411379851400852,
1531
+ 0.005167646333575249,
1532
+ 0.007353625725954771,
1533
+ 0.004310181830078363,
1534
+ 0.012359142303466797,
1535
+ 0.006466764025390148,
1536
+ 0.004514474421739578,
1537
+ 0.006774740293622017,
1538
+ 0.00518967118114233,
1539
+ 0.015222007408738136,
1540
+ 0.0020467271097004414,
1541
+ 0.0024294336326420307,
1542
+ 0.0062983036041259766,
1543
+ 0.0029271598905324936,
1544
+ 0.0017828027484938502,
1545
+ 0.0019189594313502312,
1546
+ 0.002218303270637989,
1547
+ 0.007079057861119509,
1548
+ 0.002842569025233388,
1549
+ 0.0016404844354838133,
1550
+ 0.0045338887721300125,
1551
+ 0.00198090891353786,
1552
+ 0.00721738999709487,
1553
+ 0.01009969413280487,
1554
+ 0.002119706943631172,
1555
+ 0.0031860843300819397,
1556
+ 0.0018541456665843725,
1557
+ 0.003260502126067877,
1558
+ 0.004363999702036381,
1559
+ 0.0026570260524749756,
1560
+ 0.002687884261831641,
1561
+ 0.002293722704052925
1562
+ ],
1563
+ "zipf_loss": [
1564
+ 7.6127448081970215,
1565
+ 6.560031890869141,
1566
+ 4.745188236236572,
1567
+ 3.2618415355682373,
1568
+ 2.1962172985076904,
1569
+ 1.5923216342926025,
1570
+ 1.354483962059021,
1571
+ 1.2681208848953247,
1572
+ 1.2373836040496826,
1573
+ 1.2225723266601562,
1574
+ 1.2173283100128174,
1575
+ 1.213942289352417,
1576
+ 1.2174179553985596,
1577
+ 1.2151143550872803,
1578
+ 1.2137184143066406,
1579
+ 1.2088106870651245,
1580
+ 1.2077224254608154,
1581
+ 1.1978174448013306,
1582
+ 1.1687562465667725,
1583
+ 1.1087398529052734,
1584
+ 0.8629053831100464,
1585
+ 0.3959582448005676,
1586
+ 0.23563054203987122,
1587
+ 0.17050686478614807,
1588
+ 0.1450600028038025,
1589
+ 0.12911982834339142,
1590
+ 0.10734735429286957,
1591
+ 0.10648790746927261,
1592
+ 0.09062816202640533,
1593
+ 0.07731463760137558,
1594
+ 0.07260370254516602,
1595
+ 0.062209468334913254,
1596
+ 0.06401385366916656,
1597
+ 0.05821589380502701,
1598
+ 0.05336278676986694,
1599
+ 0.0466669499874115,
1600
+ 0.04917123541235924,
1601
+ 0.039436183869838715,
1602
+ 0.03985200077295303,
1603
+ 0.04416624829173088,
1604
+ 0.04149801284074783,
1605
+ 0.0357244610786438,
1606
+ 0.03366192802786827,
1607
+ 0.032449569553136826,
1608
+ 0.0325043722987175,
1609
+ 0.03409337252378464,
1610
+ 0.033035531640052795,
1611
+ 0.03465601056814194,
1612
+ 0.037785038352012634,
1613
+ 0.03705432638525963,
1614
+ 0.030172869563102722,
1615
+ 0.02783973515033722,
1616
+ 0.028856545686721802,
1617
+ 0.030020926147699356,
1618
+ 0.030901029706001282,
1619
+ 0.028302010148763657,
1620
+ 0.02984202839434147,
1621
+ 0.032194413244724274,
1622
+ 0.026962529867887497,
1623
+ 0.031096048653125763,
1624
+ 0.03323424607515335,
1625
+ 0.02694561704993248,
1626
+ 0.03594813868403435,
1627
+ 0.024985717609524727,
1628
+ 0.04459930956363678,
1629
+ 0.02188541740179062,
1630
+ 0.023173801600933075,
1631
+ 0.04950184375047684,
1632
+ 0.024272765964269638,
1633
+ 0.026018138974905014,
1634
+ 0.04331601411104202,
1635
+ 0.05347788333892822,
1636
+ 0.03953485190868378,
1637
+ 0.024928828701376915,
1638
+ 0.07287538051605225,
1639
+ 0.023491470143198967,
1640
+ 0.02255459874868393,
1641
+ 0.024743758141994476,
1642
+ 0.027193520218133926,
1643
+ 0.014394879341125488,
1644
+ 0.03747980669140816,
1645
+ 0.02450854703783989,
1646
+ 0.020215902477502823,
1647
+ 0.044792540371418,
1648
+ 0.036999303847551346,
1649
+ 0.028868593275547028,
1650
+ 0.02605552226305008,
1651
+ 0.02938155084848404,
1652
+ 0.030934154987335205,
1653
+ 0.015242088586091995,
1654
+ 0.025429606437683105,
1655
+ 0.02240702509880066,
1656
+ 0.03182249516248703,
1657
+ 0.02542036399245262,
1658
+ 0.03173244744539261,
1659
+ 0.030296631157398224,
1660
+ 0.02697805128991604,
1661
+ 0.027246324345469475,
1662
+ 0.017310013994574547,
1663
+ 0.01958380453288555,
1664
+ 0.023600636050105095,
1665
+ 0.0163872167468071,
1666
+ 0.013189305551350117,
1667
+ 0.02490093745291233,
1668
+ 0.017116166651248932,
1669
+ 0.02017567679286003,
1670
+ 0.01355794444680214,
1671
+ 0.01500363927334547,
1672
+ 0.01922685280442238,
1673
+ 0.022741524502635002,
1674
+ 0.01637580804526806,
1675
+ 0.021647784858942032,
1676
+ 0.015100102871656418,
1677
+ 0.02415425516664982,
1678
+ 0.013393277302384377,
1679
+ 0.018925176933407784,
1680
+ 0.040671296417713165,
1681
+ 0.020430386066436768,
1682
+ 0.010690897703170776,
1683
+ 0.035674817860126495,
1684
+ 0.01943860575556755,
1685
+ 0.028722252696752548,
1686
+ 0.022555474191904068,
1687
+ 0.014461560174822807,
1688
+ 0.019902441650629044,
1689
+ 0.013716666959226131,
1690
+ 0.012766593135893345,
1691
+ 0.01441806647926569,
1692
+ 0.020736124366521835,
1693
+ 0.024645142257213593,
1694
+ 0.02903977409005165,
1695
+ 0.01580086722970009,
1696
+ 0.02655826136469841,
1697
+ 0.018773622810840607,
1698
+ 0.015203597024083138,
1699
+ 0.017828665673732758,
1700
+ 0.022959239780902863,
1701
+ 0.032549865543842316,
1702
+ 0.015442498959600925,
1703
+ 0.015154856257140636,
1704
+ 0.025023728609085083,
1705
+ 0.017577601596713066,
1706
+ 0.04055590182542801,
1707
+ 0.019285151734948158,
1708
+ 0.019074421375989914,
1709
+ 0.007944503799080849,
1710
+ 0.0286155566573143,
1711
+ 0.02142779529094696,
1712
+ 0.012145567685365677,
1713
+ 0.025629814714193344,
1714
+ 0.04196229577064514,
1715
+ 0.018138017505407333,
1716
+ 0.016676833853125572,
1717
+ 0.031539205461740494,
1718
+ 0.012097734957933426,
1719
+ 0.03129406273365021,
1720
+ 0.011660464107990265,
1721
+ 0.02433932013809681,
1722
+ 0.020786013454198837,
1723
+ 0.011796524748206139,
1724
+ 0.029945924878120422,
1725
+ 0.029332082718610764,
1726
+ 0.02250237949192524,
1727
+ 0.008093947544693947,
1728
+ 0.008209604769945145,
1729
+ 0.02308596670627594,
1730
+ 0.03256992995738983,
1731
+ 0.017165306955575943,
1732
+ 0.009232302196323872,
1733
+ 0.03768755868077278,
1734
+ 0.026887444779276848,
1735
+ 0.015677180141210556,
1736
+ 0.01965784654021263,
1737
+ 0.01795666478574276,
1738
+ 0.019405048340559006,
1739
+ 0.015932783484458923,
1740
+ 0.02040497213602066,
1741
+ 0.0166013166308403,
1742
+ 0.01721831038594246,
1743
+ 0.021042343229055405,
1744
+ 0.04215270280838013,
1745
+ 0.023067686706781387,
1746
+ 0.012493138201534748,
1747
+ 0.01804201304912567,
1748
+ 0.015948686748743057,
1749
+ 0.02262052521109581,
1750
+ 0.03393382579088211,
1751
+ 0.0271836519241333,
1752
+ 0.026306526735424995,
1753
+ 0.026804517954587936,
1754
+ 0.010530227795243263,
1755
+ 0.01816735416650772,
1756
+ 0.027958549559116364,
1757
+ 0.01788981258869171,
1758
+ 0.024663256481289864,
1759
+ 0.01645573601126671,
1760
+ 0.007001818157732487,
1761
+ 0.04263361543416977,
1762
+ 0.022924071177840233,
1763
+ 0.017064398154616356,
1764
+ 0.016751211136579514,
1765
+ 0.0226193405687809,
1766
+ 0.010964600369334221,
1767
+ 0.028468243777751923,
1768
+ 0.014901716262102127,
1769
+ 0.029592378064990044,
1770
+ 0.019627047702670097,
1771
+ 0.016322851181030273,
1772
+ 0.02954556792974472,
1773
+ 0.018655192106962204,
1774
+ 0.020159626379609108,
1775
+ 0.012884648516774178,
1776
+ 0.01959625631570816,
1777
+ 0.042504213750362396,
1778
+ 0.02368829771876335,
1779
+ 0.01636890508234501,
1780
+ 0.02133912965655327,
1781
+ 0.022723492234945297,
1782
+ 0.010148895904421806,
1783
+ 0.02370261587202549,
1784
+ 0.015237944200634956,
1785
+ 0.015952318906784058,
1786
+ 0.015685973688960075,
1787
+ 0.024476774036884308,
1788
+ 0.008148754015564919,
1789
+ 0.019251490011811256,
1790
+ 0.02093036286532879,
1791
+ 0.0167714674025774,
1792
+ 0.023497289046645164,
1793
+ 0.018064919859170914,
1794
+ 0.021980443969368935,
1795
+ 0.024071721360087395,
1796
+ 0.009300675243139267,
1797
+ 0.02432986907660961,
1798
+ 0.01323446910828352,
1799
+ 0.025605402886867523,
1800
+ 0.022004632279276848,
1801
+ 0.024696262553334236,
1802
+ 0.011458626948297024,
1803
+ 0.015526635572314262,
1804
+ 0.032606691122055054,
1805
+ 0.03476012125611305,
1806
+ 0.014715206809341908,
1807
+ 0.014199046418070793,
1808
+ 0.019919952377676964,
1809
+ 0.01950252801179886,
1810
+ 0.01666855439543724,
1811
+ 0.013112653978168964,
1812
+ 0.018902208656072617,
1813
+ 0.01876382902264595,
1814
+ 0.015077623538672924,
1815
+ 0.009238878265023232,
1816
+ 0.01138590183109045,
1817
+ 0.009724806994199753,
1818
+ 0.028115125373005867,
1819
+ 0.02156449854373932,
1820
+ 0.021593233570456505,
1821
+ 0.014687166549265385,
1822
+ 0.011910850182175636,
1823
+ 0.012632545083761215,
1824
+ 0.013373291119933128,
1825
+ 0.027460210025310516,
1826
+ 0.015320975333452225,
1827
+ 0.011845862492918968,
1828
+ 0.00722916703671217,
1829
+ 0.012848971411585808,
1830
+ 0.02046278491616249,
1831
+ 0.01790623366832733,
1832
+ 0.014951449818909168,
1833
+ 0.008621307089924812,
1834
+ 0.01714271306991577,
1835
+ 0.025045320391654968,
1836
+ 0.022870264947414398,
1837
+ 0.019705796614289284,
1838
+ 0.008724011480808258,
1839
+ 0.013330519199371338,
1840
+ 0.010288799181580544,
1841
+ 0.016523845493793488,
1842
+ 0.010460881516337395,
1843
+ 0.0172421894967556,
1844
+ 0.015159675851464272,
1845
+ 0.029577387496829033,
1846
+ 0.017727192491292953,
1847
+ 0.015862464904785156,
1848
+ 0.013833096250891685,
1849
+ 0.01868520677089691,
1850
+ 0.032360661774873734,
1851
+ 0.012623627670109272,
1852
+ 0.011180063709616661,
1853
+ 0.023935578763484955,
1854
+ 0.01221864391118288,
1855
+ 0.017148122191429138,
1856
+ 0.00921904481947422,
1857
+ 0.01488802395761013,
1858
+ 0.02933511696755886,
1859
+ 0.01066274382174015,
1860
+ 0.011872964911162853,
1861
+ 0.030374063178896904,
1862
+ 0.017614852637052536,
1863
+ 0.013273060321807861,
1864
+ 0.014252067543566227,
1865
+ 0.0119790593162179,
1866
+ 0.012053417041897774,
1867
+ 0.01714882254600525,
1868
+ 0.026015477254986763,
1869
+ 0.01101711206138134,
1870
+ 0.02366754040122032,
1871
+ 0.027670545503497124,
1872
+ 0.03956326097249985,
1873
+ 0.013280421495437622
1874
+ ],
1875
+ "denoise_loss": [],
1876
+ "ortho_loss": [
1877
+ 0.8031302690505981,
1878
+ 0.651446521282196,
1879
+ 0.47225630283355713,
1880
+ 0.31398698687553406,
1881
+ 0.2344164401292801,
1882
+ 0.20158666372299194,
1883
+ 0.1811789870262146,
1884
+ 0.11740656942129135,
1885
+ 0.09180840104818344,
1886
+ 0.06979136914014816,
1887
+ 0.05881809443235397,
1888
+ 0.05668292194604874,
1889
+ 0.05968532711267471,
1890
+ 0.06590636074542999,
1891
+ 0.07760761678218842,
1892
+ 0.07676749676465988,
1893
+ 0.08586236834526062,
1894
+ 0.08619170635938644,
1895
+ 0.08521468937397003,
1896
+ 0.09206206351518631,
1897
+ 0.0947783812880516,
1898
+ 0.10129841417074203,
1899
+ 0.10299093276262283,
1900
+ 0.1065870001912117,
1901
+ 0.10834246873855591,
1902
+ 0.11157213151454926,
1903
+ 0.11360572278499603,
1904
+ 0.11754754185676575,
1905
+ 0.12079672515392303,
1906
+ 0.12221942842006683,
1907
+ 0.12430651485919952,
1908
+ 0.12570339441299438,
1909
+ 0.12773926556110382,
1910
+ 0.13032616674900055,
1911
+ 0.1337440013885498,
1912
+ 0.13685867190361023,
1913
+ 0.1394176036119461,
1914
+ 0.14119425415992737,
1915
+ 0.143585667014122,
1916
+ 0.1459008753299713,
1917
+ 0.14823469519615173,
1918
+ 0.1483970731496811,
1919
+ 0.14824025332927704,
1920
+ 0.1483682096004486,
1921
+ 0.14987003803253174,
1922
+ 0.1468847692012787,
1923
+ 0.14886698126792908,
1924
+ 0.149628683924675,
1925
+ 0.14818134903907776,
1926
+ 0.1488112509250641,
1927
+ 0.1479089856147766,
1928
+ 0.14857356250286102,
1929
+ 0.14692968130111694,
1930
+ 0.14757348597049713,
1931
+ 0.15208891034126282,
1932
+ 0.15442827343940735,
1933
+ 0.15509766340255737,
1934
+ 0.1590951681137085,
1935
+ 0.1531846821308136,
1936
+ 0.15168388187885284,
1937
+ 0.15258321166038513,
1938
+ 0.15024863183498383,
1939
+ 0.15156753361225128,
1940
+ 0.15119343996047974,
1941
+ 0.15037044882774353,
1942
+ 0.15048056840896606,
1943
+ 0.14808736741542816,
1944
+ 0.14513351023197174,
1945
+ 0.1465653032064438,
1946
+ 0.14518895745277405,
1947
+ 0.1469978243112564,
1948
+ 0.15150853991508484,
1949
+ 0.1535106748342514,
1950
+ 0.15811696648597717,
1951
+ 0.15943248569965363,
1952
+ 0.15731456875801086,
1953
+ 0.1617055982351303,
1954
+ 0.16405713558197021,
1955
+ 0.16909068822860718,
1956
+ 0.17723920941352844,
1957
+ 0.17886748909950256,
1958
+ 0.17061243951320648,
1959
+ 0.17493830621242523,
1960
+ 0.17122139036655426,
1961
+ 0.16704106330871582,
1962
+ 0.1666063666343689,
1963
+ 0.1669788807630539,
1964
+ 0.16966800391674042,
1965
+ 0.17728915810585022,
1966
+ 0.17715327441692352,
1967
+ 0.17924952507019043,
1968
+ 0.1768399178981781,
1969
+ 0.1799253523349762,
1970
+ 0.18971866369247437,
1971
+ 0.21061910688877106,
1972
+ 0.22413702309131622,
1973
+ 0.23895341157913208,
1974
+ 0.25049567222595215,
1975
+ 0.2607962489128113,
1976
+ 0.2692263424396515,
1977
+ 0.28197380900382996,
1978
+ 0.28492170572280884,
1979
+ 0.2932630479335785,
1980
+ 0.29921630024909973,
1981
+ 0.30437731742858887,
1982
+ 0.3101743161678314,
1983
+ 0.3136626183986664,
1984
+ 0.31526586413383484,
1985
+ 0.32267218828201294,
1986
+ 0.33414366841316223,
1987
+ 0.3383929133415222,
1988
+ 0.343045175075531,
1989
+ 0.3495849072933197,
1990
+ 0.35210493206977844,
1991
+ 0.3652360439300537,
1992
+ 0.36629679799079895,
1993
+ 0.3676069676876068,
1994
+ 0.3763442933559418,
1995
+ 0.38191697001457214,
1996
+ 0.38559967279434204,
1997
+ 0.39005047082901,
1998
+ 0.39169827103614807,
1999
+ 0.3972143232822418,
2000
+ 0.3990357220172882,
2001
+ 0.40587127208709717,
2002
+ 0.4073086678981781,
2003
+ 0.4106364846229553,
2004
+ 0.4139386713504791,
2005
+ 0.4195164144039154,
2006
+ 0.4218643307685852,
2007
+ 0.43074914813041687,
2008
+ 0.43609270453453064,
2009
+ 0.43693414330482483,
2010
+ 0.43645963072776794,
2011
+ 0.43526560068130493,
2012
+ 0.43738865852355957,
2013
+ 0.43702515959739685,
2014
+ 0.43787628412246704,
2015
+ 0.4392624795436859,
2016
+ 0.4444485902786255,
2017
+ 0.4473108649253845,
2018
+ 0.4466269016265869,
2019
+ 0.44968798756599426,
2020
+ 0.4528096616268158,
2021
+ 0.4538198411464691,
2022
+ 0.46537908911705017,
2023
+ 0.46137139201164246,
2024
+ 0.46286407113075256,
2025
+ 0.4660347104072571,
2026
+ 0.4669730067253113,
2027
+ 0.4688158929347992,
2028
+ 0.4694839417934418,
2029
+ 0.47653937339782715,
2030
+ 0.47856423258781433,
2031
+ 0.47925111651420593,
2032
+ 0.4842240810394287,
2033
+ 0.4890192151069641,
2034
+ 0.4899299144744873,
2035
+ 0.49078568816185,
2036
+ 0.48639532923698425,
2037
+ 0.48752135038375854,
2038
+ 0.4861641228199005,
2039
+ 0.48675820231437683,
2040
+ 0.4877900779247284,
2041
+ 0.49160829186439514,
2042
+ 0.492164671421051,
2043
+ 0.48940518498420715,
2044
+ 0.48711976408958435,
2045
+ 0.4914919137954712,
2046
+ 0.4937744438648224,
2047
+ 0.49668481945991516,
2048
+ 0.4990174472332001,
2049
+ 0.49750903248786926,
2050
+ 0.5013089776039124,
2051
+ 0.5032296180725098,
2052
+ 0.5059557557106018,
2053
+ 0.5062442421913147,
2054
+ 0.5080885887145996,
2055
+ 0.5070073008537292,
2056
+ 0.5054982900619507,
2057
+ 0.5073270201683044,
2058
+ 0.5032066702842712,
2059
+ 0.5031166076660156,
2060
+ 0.5061224102973938,
2061
+ 0.5110673308372498,
2062
+ 0.5123271346092224,
2063
+ 0.5108535289764404,
2064
+ 0.5125726461410522,
2065
+ 0.5130029916763306,
2066
+ 0.5180069804191589,
2067
+ 0.5202614068984985,
2068
+ 0.5197465419769287,
2069
+ 0.521242082118988,
2070
+ 0.5211664438247681,
2071
+ 0.5246459245681763,
2072
+ 0.5352731347084045,
2073
+ 0.5375922322273254,
2074
+ 0.5366690158843994,
2075
+ 0.538623571395874,
2076
+ 0.538221538066864,
2077
+ 0.5386557579040527,
2078
+ 0.5386679172515869,
2079
+ 0.5378957390785217,
2080
+ 0.5390077829360962,
2081
+ 0.5402559041976929,
2082
+ 0.5461403727531433,
2083
+ 0.5466548800468445,
2084
+ 0.5490771532058716,
2085
+ 0.5516842007637024,
2086
+ 0.551599383354187,
2087
+ 0.5516263842582703,
2088
+ 0.5547515749931335,
2089
+ 0.5528894066810608,
2090
+ 0.5557861328125,
2091
+ 0.5564415454864502,
2092
+ 0.5575445294380188,
2093
+ 0.5567478537559509,
2094
+ 0.5571569204330444,
2095
+ 0.5580320358276367,
2096
+ 0.5580832362174988,
2097
+ 0.5589568018913269,
2098
+ 0.5598948001861572,
2099
+ 0.5620438456535339,
2100
+ 0.5638320446014404,
2101
+ 0.5632127523422241,
2102
+ 0.5648950338363647,
2103
+ 0.5680603384971619,
2104
+ 0.5679644346237183,
2105
+ 0.5684031248092651,
2106
+ 0.5670228004455566,
2107
+ 0.5679007768630981,
2108
+ 0.5674344897270203,
2109
+ 0.5691047310829163,
2110
+ 0.5682027339935303,
2111
+ 0.5701022744178772,
2112
+ 0.5724801421165466,
2113
+ 0.5727242827415466,
2114
+ 0.5743642449378967,
2115
+ 0.5754973292350769,
2116
+ 0.5763208866119385,
2117
+ 0.5771183967590332,
2118
+ 0.5775476694107056,
2119
+ 0.5774152874946594,
2120
+ 0.5786145925521851,
2121
+ 0.5791900753974915,
2122
+ 0.5807589292526245,
2123
+ 0.5780942440032959,
2124
+ 0.5789430141448975,
2125
+ 0.5790625810623169,
2126
+ 0.580161988735199,
2127
+ 0.5809789299964905,
2128
+ 0.583286702632904,
2129
+ 0.5834190845489502,
2130
+ 0.5843989253044128,
2131
+ 0.5873239040374756,
2132
+ 0.5864567160606384,
2133
+ 0.5904589891433716,
2134
+ 0.5906545519828796,
2135
+ 0.5907052755355835,
2136
+ 0.5911244750022888,
2137
+ 0.5919567942619324,
2138
+ 0.591834545135498,
2139
+ 0.5913709402084351,
2140
+ 0.5923407077789307,
2141
+ 0.5932527184486389,
2142
+ 0.5939968228340149,
2143
+ 0.5941485166549683,
2144
+ 0.5949186086654663,
2145
+ 0.5945107936859131,
2146
+ 0.5946792960166931,
2147
+ 0.5944833159446716,
2148
+ 0.5948854088783264,
2149
+ 0.5956472158432007,
2150
+ 0.5962466597557068,
2151
+ 0.5968529582023621,
2152
+ 0.5970098972320557,
2153
+ 0.5972112417221069,
2154
+ 0.5973919630050659,
2155
+ 0.5978026390075684,
2156
+ 0.5975343585014343,
2157
+ 0.5981355309486389,
2158
+ 0.5980138182640076,
2159
+ 0.598423182964325,
2160
+ 0.598626971244812,
2161
+ 0.5991927981376648,
2162
+ 0.5995078086853027,
2163
+ 0.6002234220504761,
2164
+ 0.6004067063331604,
2165
+ 0.6008868217468262,
2166
+ 0.6006950736045837,
2167
+ 0.6007959246635437,
2168
+ 0.60096275806427,
2169
+ 0.6009566187858582,
2170
+ 0.601643979549408,
2171
+ 0.6017308831214905,
2172
+ 0.6019169688224792,
2173
+ 0.6020408868789673,
2174
+ 0.6028541922569275,
2175
+ 0.6031910181045532,
2176
+ 0.6032954454421997,
2177
+ 0.6035951375961304,
2178
+ 0.6039335131645203,
2179
+ 0.6041980981826782,
2180
+ 0.6043713688850403,
2181
+ 0.6045557260513306,
2182
+ 0.6045573353767395,
2183
+ 0.6046279072761536,
2184
+ 0.6046212911605835,
2185
+ 0.6046490669250488,
2186
+ 0.6049583554267883
2187
+ ],
2188
+ "lr": [
2189
+ 4.188034188034189e-06,
2190
+ 8.461538461538462e-06,
2191
+ 1.2735042735042738e-05,
2192
+ 1.700854700854701e-05,
2193
+ 2.1282051282051282e-05,
2194
+ 2.5555555555555557e-05,
2195
+ 2.9829059829059833e-05,
2196
+ 3.4102564102564105e-05,
2197
+ 3.837606837606838e-05,
2198
+ 4e-05,
2199
+ 4e-05,
2200
+ 4e-05,
2201
+ 4e-05,
2202
+ 4e-05,
2203
+ 4e-05,
2204
+ 4e-05,
2205
+ 4e-05,
2206
+ 4e-05,
2207
+ 4e-05,
2208
+ 4e-05,
2209
+ 4e-05,
2210
+ 4e-05,
2211
+ 4e-05,
2212
+ 4e-05,
2213
+ 4e-05,
2214
+ 4e-05,
2215
+ 4e-05,
2216
+ 4e-05,
2217
+ 4e-05,
2218
+ 4e-05,
2219
+ 4e-05,
2220
+ 4e-05,
2221
+ 4e-05,
2222
+ 4e-05,
2223
+ 4e-05,
2224
+ 4e-05,
2225
+ 4e-05,
2226
+ 4e-05,
2227
+ 4e-05,
2228
+ 4e-05,
2229
+ 4e-05,
2230
+ 4e-05,
2231
+ 4e-05,
2232
+ 4e-05,
2233
+ 4e-05,
2234
+ 4e-05,
2235
+ 4e-05,
2236
+ 4e-05,
2237
+ 4e-05,
2238
+ 4e-05,
2239
+ 4e-05,
2240
+ 4e-05,
2241
+ 4e-05,
2242
+ 4e-05,
2243
+ 4e-05,
2244
+ 4e-05,
2245
+ 4e-05,
2246
+ 4e-05,
2247
+ 4e-05,
2248
+ 4e-05,
2249
+ 4e-05,
2250
+ 4e-05,
2251
+ 4e-05,
2252
+ 4e-05,
2253
+ 4e-05,
2254
+ 4e-05,
2255
+ 4e-05,
2256
+ 4e-05,
2257
+ 4e-05,
2258
+ 4e-05,
2259
+ 4e-05,
2260
+ 4e-05,
2261
+ 4e-05,
2262
+ 4e-05,
2263
+ 4e-05,
2264
+ 4e-05,
2265
+ 4e-05,
2266
+ 4e-05,
2267
+ 4e-05,
2268
+ 4e-05,
2269
+ 4e-05,
2270
+ 4e-05,
2271
+ 4e-05,
2272
+ 4e-05,
2273
+ 4e-05,
2274
+ 4e-05,
2275
+ 4e-05,
2276
+ 4e-05,
2277
+ 4e-05,
2278
+ 4e-05,
2279
+ 4e-05,
2280
+ 4e-05,
2281
+ 4e-05,
2282
+ 4e-05,
2283
+ 4e-05,
2284
+ 4e-05,
2285
+ 4e-05,
2286
+ 4e-05,
2287
+ 4e-05,
2288
+ 4e-05,
2289
+ 4e-05,
2290
+ 4e-05,
2291
+ 4e-05,
2292
+ 4e-05,
2293
+ 4e-05,
2294
+ 4e-05,
2295
+ 4e-05,
2296
+ 4e-05,
2297
+ 4e-05,
2298
+ 4e-05,
2299
+ 4e-05,
2300
+ 4e-05,
2301
+ 4e-05,
2302
+ 4e-05,
2303
+ 4e-05,
2304
+ 4e-05,
2305
+ 4e-05,
2306
+ 4e-05,
2307
+ 4e-05,
2308
+ 4e-05,
2309
+ 4e-05,
2310
+ 4e-05,
2311
+ 4e-05,
2312
+ 4e-05,
2313
+ 4e-05,
2314
+ 4e-05,
2315
+ 4e-05,
2316
+ 4e-05,
2317
+ 4e-05,
2318
+ 4e-05,
2319
+ 4e-05,
2320
+ 4e-05,
2321
+ 4e-05,
2322
+ 4e-05,
2323
+ 4e-05,
2324
+ 4e-05,
2325
+ 4e-05,
2326
+ 4e-05,
2327
+ 4e-05,
2328
+ 4e-05,
2329
+ 4e-05,
2330
+ 4e-05,
2331
+ 4e-05,
2332
+ 4e-05,
2333
+ 4e-05,
2334
+ 4e-05,
2335
+ 4e-05,
2336
+ 4e-05,
2337
+ 4e-05,
2338
+ 4e-05,
2339
+ 4e-05,
2340
+ 4e-05,
2341
+ 4e-05,
2342
+ 4e-05,
2343
+ 4e-05,
2344
+ 4e-05,
2345
+ 4e-05,
2346
+ 4e-05,
2347
+ 4e-05,
2348
+ 4e-05,
2349
+ 4e-05,
2350
+ 4e-05,
2351
+ 4e-05,
2352
+ 4e-05,
2353
+ 4e-05,
2354
+ 4e-05,
2355
+ 4e-05,
2356
+ 4e-05,
2357
+ 4e-05,
2358
+ 4e-05,
2359
+ 4e-05,
2360
+ 4e-05,
2361
+ 4e-05,
2362
+ 4e-05,
2363
+ 4e-05,
2364
+ 4e-05,
2365
+ 4e-05,
2366
+ 4e-05,
2367
+ 4e-05,
2368
+ 4e-05,
2369
+ 4e-05,
2370
+ 4e-05,
2371
+ 4e-05,
2372
+ 4e-05,
2373
+ 4e-05,
2374
+ 4e-05,
2375
+ 4e-05,
2376
+ 4e-05,
2377
+ 4e-05,
2378
+ 3.992995647012267e-05,
2379
+ 3.963316185199842e-05,
2380
+ 3.933636723387416e-05,
2381
+ 3.90395726157499e-05,
2382
+ 3.874277799762565e-05,
2383
+ 3.844598337950139e-05,
2384
+ 3.814918876137713e-05,
2385
+ 3.785239414325287e-05,
2386
+ 3.7555599525128613e-05,
2387
+ 3.725880490700435e-05,
2388
+ 3.696201028888009e-05,
2389
+ 3.666521567075585e-05,
2390
+ 3.6368421052631585e-05,
2391
+ 3.607162643450732e-05,
2392
+ 3.577483181638307e-05,
2393
+ 3.547803719825881e-05,
2394
+ 3.518124258013455e-05,
2395
+ 3.4884447962010287e-05,
2396
+ 3.458765334388604e-05,
2397
+ 3.4290858725761776e-05,
2398
+ 3.399406410763751e-05,
2399
+ 3.3697269489513265e-05,
2400
+ 3.3400474871389e-05,
2401
+ 3.310368025326474e-05,
2402
+ 3.280688563514048e-05,
2403
+ 3.251009101701623e-05,
2404
+ 3.2213296398891967e-05,
2405
+ 3.191650178076771e-05,
2406
+ 3.1542540561931145e-05,
2407
+ 3.124574594380688e-05,
2408
+ 3.094895132568263e-05,
2409
+ 3.065215670755838e-05,
2410
+ 3.0355362089434113e-05,
2411
+ 3.0058567471309854e-05,
2412
+ 2.97617728531856e-05,
2413
+ 2.9464978235061336e-05,
2414
+ 2.9168183616937077e-05,
2415
+ 2.8871388998812818e-05,
2416
+ 2.857459438068857e-05,
2417
+ 2.8277799762564307e-05,
2418
+ 2.798100514444005e-05,
2419
+ 2.7684210526315793e-05,
2420
+ 2.738741590819153e-05,
2421
+ 2.709062129006727e-05,
2422
+ 2.6793826671943013e-05,
2423
+ 2.6497032053818764e-05,
2424
+ 2.62002374356945e-05,
2425
+ 2.5903442817570243e-05,
2426
+ 2.5606648199445987e-05,
2427
+ 2.5309853581321725e-05,
2428
+ 2.5013058963197466e-05,
2429
+ 2.4716264345073214e-05,
2430
+ 2.441946972694896e-05,
2431
+ 2.4122675108824693e-05,
2432
+ 2.3825880490700434e-05,
2433
+ 2.352908587257618e-05,
2434
+ 2.3232291254451916e-05,
2435
+ 2.293549663632766e-05,
2436
+ 2.2638702018203408e-05,
2437
+ 2.226474079936684e-05,
2438
+ 2.196794618124258e-05,
2439
+ 2.1671151563118328e-05,
2440
+ 2.1374356944994066e-05,
2441
+ 2.1077562326869803e-05,
2442
+ 2.0780767708745554e-05,
2443
+ 2.0483973090621296e-05,
2444
+ 2.018717847249703e-05,
2445
+ 1.989038385437277e-05,
2446
+ 1.959358923624852e-05,
2447
+ 1.929679461812426e-05,
2448
+ 1.8999999999999998e-05,
2449
+ 1.8703205381875746e-05,
2450
+ 1.8406410763751487e-05,
2451
+ 1.8109616145627224e-05,
2452
+ 1.7812821527502965e-05,
2453
+ 1.7516026909378713e-05,
2454
+ 1.7219232291254454e-05,
2455
+ 1.6922437673130192e-05,
2456
+ 1.662564305500594e-05,
2457
+ 1.632884843688168e-05,
2458
+ 1.603205381875742e-05,
2459
+ 1.573525920063316e-05,
2460
+ 1.5438464582508908e-05,
2461
+ 1.5141669964384647e-05,
2462
+ 1.4844875346260385e-05,
2463
+ 1.4548080728136134e-05,
2464
+ 1.4251286110011875e-05,
2465
+ 1.3954491491887611e-05,
2466
+ 1.3657696873763363e-05,
2467
+ 1.33609022556391e-05,
2468
+ 1.298694103680253e-05,
2469
+ 1.2690146418678277e-05,
2470
+ 1.2393351800554018e-05,
2471
+ 1.2096557182429756e-05,
2472
+ 1.1799762564305506e-05,
2473
+ 1.1502967946181245e-05,
2474
+ 1.1206173328056984e-05,
2475
+ 1.0909378709932724e-05,
2476
+ 1.0612584091808472e-05,
2477
+ 1.0315789473684213e-05,
2478
+ 1.0018994855559949e-05,
2479
+ 9.7222002374357e-06,
2480
+ 9.425405619311438e-06,
2481
+ 9.128611001187177e-06,
2482
+ 8.831816383062916e-06,
2483
+ 8.535021764938666e-06,
2484
+ 8.238227146814405e-06,
2485
+ 7.941432528690143e-06,
2486
+ 7.644637910565893e-06,
2487
+ 7.347843292441632e-06,
2488
+ 7.0510486743173715e-06,
2489
+ 6.75425405619311e-06,
2490
+ 6.45745943806886e-06,
2491
+ 6.160664819944598e-06,
2492
+ 5.8638702018203375e-06,
2493
+ 5.567075583696086e-06,
2494
+ 5.270280965571826e-06,
2495
+ 4.973486347447565e-06,
2496
+ 4.676691729323314e-06,
2497
+ 4.379897111199053e-06,
2498
+ 4.083102493074792e-06
2499
+ ],
2500
+ "emb_lr": [],
2501
+ "eval_step": [
2502
+ 1550,
2503
+ 3113,
2504
+ 4676,
2505
+ 6239,
2506
+ 7802,
2507
+ 9365,
2508
+ 10928,
2509
+ 12491,
2510
+ 14054,
2511
+ 15617
2512
+ ],
2513
+ "eval_accuracy": [
2514
+ 0.53,
2515
+ 0.92,
2516
+ 1.0,
2517
+ 0.99,
2518
+ 0.99,
2519
+ 1.0,
2520
+ 1.0,
2521
+ 1.0,
2522
+ 1.0,
2523
+ 1.0
2524
+ ]
2525
+ },
2526
+ "final_accuracy": 1.0,
2527
+ "sft_eval": {
2528
+ "config": {
2529
+ "ops": "add_sub",
2530
+ "K": null,
2531
+ "mode": "sft",
2532
+ "n_digits": 6,
2533
+ "n_per_split": 100
2534
+ },
2535
+ "splits": {
2536
+ "add_S0": {
2537
+ "full_accuracy": 0.97,
2538
+ "n_examples": 100,
2539
+ "per_subtask": {
2540
+ "SA": {
2541
+ "accuracy": 0.9950413223140496,
2542
+ "count": 605
2543
+ },
2544
+ "SS": {
2545
+ "accuracy": 1.0,
2546
+ "count": 95
2547
+ }
2548
+ }
2549
+ },
2550
+ "add_S1": {
2551
+ "full_accuracy": 0.98,
2552
+ "n_examples": 100,
2553
+ "per_subtask": {
2554
+ "SA": {
2555
+ "accuracy": 0.9950980392156863,
2556
+ "count": 204
2557
+ },
2558
+ "SC": {
2559
+ "accuracy": 1.0,
2560
+ "count": 169
2561
+ },
2562
+ "SS": {
2563
+ "accuracy": 1.0,
2564
+ "count": 31
2565
+ },
2566
+ "UC": {
2567
+ "accuracy": 0.9966216216216216,
2568
+ "count": 296
2569
+ }
2570
+ }
2571
+ },
2572
+ "add_S2": {
2573
+ "full_accuracy": 0.95,
2574
+ "n_examples": 100,
2575
+ "per_subtask": {
2576
+ "SA": {
2577
+ "accuracy": 1.0,
2578
+ "count": 163
2579
+ },
2580
+ "SC": {
2581
+ "accuracy": 0.9923076923076923,
2582
+ "count": 130
2583
+ },
2584
+ "SS": {
2585
+ "accuracy": 0.9885057471264368,
2586
+ "count": 87
2587
+ },
2588
+ "UC": {
2589
+ "accuracy": 0.9852216748768473,
2590
+ "count": 203
2591
+ },
2592
+ "US": {
2593
+ "accuracy": 1.0,
2594
+ "count": 117
2595
+ }
2596
+ }
2597
+ },
2598
+ "add_S3": {
2599
+ "full_accuracy": 0.81,
2600
+ "n_examples": 100,
2601
+ "per_subtask": {
2602
+ "SA": {
2603
+ "accuracy": 1.0,
2604
+ "count": 121
2605
+ },
2606
+ "SC": {
2607
+ "accuracy": 0.9917355371900827,
2608
+ "count": 121
2609
+ },
2610
+ "SS": {
2611
+ "accuracy": 1.0,
2612
+ "count": 49
2613
+ },
2614
+ "UC": {
2615
+ "accuracy": 0.9032258064516129,
2616
+ "count": 186
2617
+ },
2618
+ "US": {
2619
+ "accuracy": 0.9955156950672646,
2620
+ "count": 223
2621
+ }
2622
+ }
2623
+ },
2624
+ "add_S4": {
2625
+ "full_accuracy": 0.43,
2626
+ "n_examples": 100,
2627
+ "per_subtask": {
2628
+ "SA": {
2629
+ "accuracy": 1.0,
2630
+ "count": 104
2631
+ },
2632
+ "SC": {
2633
+ "accuracy": 1.0,
2634
+ "count": 106
2635
+ },
2636
+ "SS": {
2637
+ "accuracy": 1.0,
2638
+ "count": 23
2639
+ },
2640
+ "UC": {
2641
+ "accuracy": 0.675,
2642
+ "count": 160
2643
+ },
2644
+ "US": {
2645
+ "accuracy": 0.8957654723127035,
2646
+ "count": 307
2647
+ }
2648
+ }
2649
+ },
2650
+ "add_S5": {
2651
+ "full_accuracy": 0.2,
2652
+ "n_examples": 100,
2653
+ "per_subtask": {
2654
+ "SA": {
2655
+ "accuracy": 1.0,
2656
+ "count": 100
2657
+ },
2658
+ "SC": {
2659
+ "accuracy": 1.0,
2660
+ "count": 100
2661
+ },
2662
+ "UC": {
2663
+ "accuracy": 0.47,
2664
+ "count": 100
2665
+ },
2666
+ "US": {
2667
+ "accuracy": 0.67,
2668
+ "count": 400
2669
+ }
2670
+ }
2671
+ },
2672
+ "add_S6": {
2673
+ "full_accuracy": 0.3,
2674
+ "n_examples": 100,
2675
+ "per_subtask": {
2676
+ "SC": {
2677
+ "accuracy": 1.0,
2678
+ "count": 100
2679
+ },
2680
+ "UC": {
2681
+ "accuracy": 0.34,
2682
+ "count": 100
2683
+ },
2684
+ "US": {
2685
+ "accuracy": 0.636,
2686
+ "count": 500
2687
+ }
2688
+ }
2689
+ },
2690
+ "add_random": {
2691
+ "full_accuracy": 0.96,
2692
+ "n_examples": 200,
2693
+ "per_subtask": {
2694
+ "SA": {
2695
+ "accuracy": 0.9955257270693513,
2696
+ "count": 447
2697
+ },
2698
+ "SC": {
2699
+ "accuracy": 0.99375,
2700
+ "count": 320
2701
+ },
2702
+ "SS": {
2703
+ "accuracy": 0.9821428571428571,
2704
+ "count": 56
2705
+ },
2706
+ "UC": {
2707
+ "accuracy": 0.994328922495274,
2708
+ "count": 529
2709
+ },
2710
+ "US": {
2711
+ "accuracy": 0.9791666666666666,
2712
+ "count": 48
2713
+ }
2714
+ }
2715
+ },
2716
+ "add_C3": {
2717
+ "full_accuracy": 0.83,
2718
+ "n_examples": 100,
2719
+ "per_subtask": {
2720
+ "SA": {
2721
+ "accuracy": 0.9966666666666667,
2722
+ "count": 300
2723
+ },
2724
+ "SC": {
2725
+ "accuracy": 1.0,
2726
+ "count": 100
2727
+ },
2728
+ "UC": {
2729
+ "accuracy": 0.917098445595855,
2730
+ "count": 193
2731
+ },
2732
+ "US": {
2733
+ "accuracy": 0.9532710280373832,
2734
+ "count": 107
2735
+ }
2736
+ }
2737
+ },
2738
+ "add_C4": {
2739
+ "full_accuracy": 0.83,
2740
+ "n_examples": 100,
2741
+ "per_subtask": {
2742
+ "SA": {
2743
+ "accuracy": 1.0,
2744
+ "count": 200
2745
+ },
2746
+ "SC": {
2747
+ "accuracy": 1.0,
2748
+ "count": 100
2749
+ },
2750
+ "UC": {
2751
+ "accuracy": 0.9375,
2752
+ "count": 256
2753
+ },
2754
+ "US": {
2755
+ "accuracy": 0.9652777777777778,
2756
+ "count": 144
2757
+ }
2758
+ }
2759
+ },
2760
+ "add_C5": {
2761
+ "full_accuracy": 0.78,
2762
+ "n_examples": 100,
2763
+ "per_subtask": {
2764
+ "SA": {
2765
+ "accuracy": 1.0,
2766
+ "count": 100
2767
+ },
2768
+ "SC": {
2769
+ "accuracy": 1.0,
2770
+ "count": 100
2771
+ },
2772
+ "UC": {
2773
+ "accuracy": 0.9313725490196079,
2774
+ "count": 306
2775
+ },
2776
+ "US": {
2777
+ "accuracy": 0.9536082474226805,
2778
+ "count": 194
2779
+ }
2780
+ }
2781
+ },
2782
+ "add_C6": {
2783
+ "full_accuracy": 0.87,
2784
+ "n_examples": 100,
2785
+ "per_subtask": {
2786
+ "SC": {
2787
+ "accuracy": 1.0,
2788
+ "count": 100
2789
+ },
2790
+ "UC": {
2791
+ "accuracy": 0.9672131147540983,
2792
+ "count": 366
2793
+ },
2794
+ "US": {
2795
+ "accuracy": 0.9786324786324786,
2796
+ "count": 234
2797
+ }
2798
+ }
2799
+ },
2800
+ "sub_M0": {
2801
+ "full_accuracy": 0.98,
2802
+ "n_examples": 100,
2803
+ "per_subtask": {
2804
+ "MD": {
2805
+ "accuracy": 0.9966722129783694,
2806
+ "count": 601
2807
+ },
2808
+ "ME": {
2809
+ "accuracy": 1.0,
2810
+ "count": 99
2811
+ }
2812
+ }
2813
+ },
2814
+ "sub_M1": {
2815
+ "full_accuracy": 0.97,
2816
+ "n_examples": 100,
2817
+ "per_subtask": {
2818
+ "MD": {
2819
+ "accuracy": 0.989247311827957,
2820
+ "count": 279
2821
+ },
2822
+ "MB": {
2823
+ "accuracy": 1.0,
2824
+ "count": 145
2825
+ },
2826
+ "ME": {
2827
+ "accuracy": 1.0,
2828
+ "count": 24
2829
+ },
2830
+ "UB": {
2831
+ "accuracy": 1.0,
2832
+ "count": 252
2833
+ }
2834
+ }
2835
+ },
2836
+ "sub_M2": {
2837
+ "full_accuracy": 0.95,
2838
+ "n_examples": 100,
2839
+ "per_subtask": {
2840
+ "MD": {
2841
+ "accuracy": 0.9906103286384976,
2842
+ "count": 213
2843
+ },
2844
+ "MB": {
2845
+ "accuracy": 1.0,
2846
+ "count": 113
2847
+ },
2848
+ "ME": {
2849
+ "accuracy": 1.0,
2850
+ "count": 85
2851
+ },
2852
+ "UB": {
2853
+ "accuracy": 0.9834254143646409,
2854
+ "count": 181
2855
+ },
2856
+ "UD": {
2857
+ "accuracy": 1.0,
2858
+ "count": 108
2859
+ }
2860
+ }
2861
+ },
2862
+ "sub_M3": {
2863
+ "full_accuracy": 0.81,
2864
+ "n_examples": 100,
2865
+ "per_subtask": {
2866
+ "MD": {
2867
+ "accuracy": 1.0,
2868
+ "count": 179
2869
+ },
2870
+ "MB": {
2871
+ "accuracy": 0.9902912621359223,
2872
+ "count": 103
2873
+ },
2874
+ "ME": {
2875
+ "accuracy": 1.0,
2876
+ "count": 56
2877
+ },
2878
+ "UB": {
2879
+ "accuracy": 0.8791946308724832,
2880
+ "count": 149
2881
+ },
2882
+ "UD": {
2883
+ "accuracy": 1.0,
2884
+ "count": 213
2885
+ }
2886
+ }
2887
+ },
2888
+ "sub_M4": {
2889
+ "full_accuracy": 0.32,
2890
+ "n_examples": 100,
2891
+ "per_subtask": {
2892
+ "MD": {
2893
+ "accuracy": 1.0,
2894
+ "count": 200
2895
+ },
2896
+ "MB": {
2897
+ "accuracy": 1.0,
2898
+ "count": 100
2899
+ },
2900
+ "UB": {
2901
+ "accuracy": 0.51,
2902
+ "count": 100
2903
+ },
2904
+ "UD": {
2905
+ "accuracy": 0.8833333333333333,
2906
+ "count": 300
2907
+ }
2908
+ }
2909
+ },
2910
+ "sub_M5": {
2911
+ "full_accuracy": 0.19,
2912
+ "n_examples": 100,
2913
+ "per_subtask": {
2914
+ "MD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 100
2917
+ },
2918
+ "MB": {
2919
+ "accuracy": 1.0,
2920
+ "count": 100
2921
+ },
2922
+ "UB": {
2923
+ "accuracy": 0.59,
2924
+ "count": 100
2925
+ },
2926
+ "UD": {
2927
+ "accuracy": 0.7125,
2928
+ "count": 400
2929
+ }
2930
+ }
2931
+ },
2932
+ "sub_random": {
2933
+ "full_accuracy": 0.965,
2934
+ "n_examples": 200,
2935
+ "per_subtask": {
2936
+ "MD": {
2937
+ "accuracy": 0.9916666666666667,
2938
+ "count": 600
2939
+ },
2940
+ "MB": {
2941
+ "accuracy": 1.0,
2942
+ "count": 267
2943
+ },
2944
+ "ME": {
2945
+ "accuracy": 1.0,
2946
+ "count": 53
2947
+ },
2948
+ "UB": {
2949
+ "accuracy": 0.9954441913439636,
2950
+ "count": 439
2951
+ },
2952
+ "UD": {
2953
+ "accuracy": 1.0,
2954
+ "count": 41
2955
+ }
2956
+ }
2957
+ },
2958
+ "sub_B3": {
2959
+ "full_accuracy": 0.8,
2960
+ "n_examples": 100,
2961
+ "per_subtask": {
2962
+ "MD": {
2963
+ "accuracy": 0.9866666666666667,
2964
+ "count": 300
2965
+ },
2966
+ "MB": {
2967
+ "accuracy": 1.0,
2968
+ "count": 100
2969
+ },
2970
+ "UB": {
2971
+ "accuracy": 0.9137055837563451,
2972
+ "count": 197
2973
+ },
2974
+ "UD": {
2975
+ "accuracy": 1.0,
2976
+ "count": 103
2977
+ }
2978
+ }
2979
+ },
2980
+ "sub_B4": {
2981
+ "full_accuracy": 0.78,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "MD": {
2985
+ "accuracy": 0.995,
2986
+ "count": 200
2987
+ },
2988
+ "MB": {
2989
+ "accuracy": 1.0,
2990
+ "count": 100
2991
+ },
2992
+ "UB": {
2993
+ "accuracy": 0.9311740890688259,
2994
+ "count": 247
2995
+ },
2996
+ "UD": {
2997
+ "accuracy": 0.954248366013072,
2998
+ "count": 153
2999
+ }
3000
+ }
3001
+ },
3002
+ "sub_B5": {
3003
+ "full_accuracy": 0.88,
3004
+ "n_examples": 100,
3005
+ "per_subtask": {
3006
+ "MD": {
3007
+ "accuracy": 1.0,
3008
+ "count": 100
3009
+ },
3010
+ "MB": {
3011
+ "accuracy": 1.0,
3012
+ "count": 100
3013
+ },
3014
+ "UB": {
3015
+ "accuracy": 0.9664429530201343,
3016
+ "count": 298
3017
+ },
3018
+ "UD": {
3019
+ "accuracy": 0.9801980198019802,
3020
+ "count": 202
3021
+ }
3022
+ }
3023
+ }
3024
+ },
3025
+ "summary": {
3026
+ "overall_accuracy": 0.77,
3027
+ "total_examples": 2400,
3028
+ "n_splits": 22
3029
+ }
3030
+ },
3031
+ "sorl_eval": {
3032
+ "config": {
3033
+ "ops": "add_sub",
3034
+ "K": 4,
3035
+ "mode": "sorl",
3036
+ "n_digits": 6,
3037
+ "n_per_split": 100
3038
+ },
3039
+ "splits": {
3040
+ "add_S0": {
3041
+ "full_accuracy": 1.0,
3042
+ "n_examples": 100,
3043
+ "per_subtask": {
3044
+ "SA": {
3045
+ "accuracy": 1.0,
3046
+ "count": 605
3047
+ },
3048
+ "SS": {
3049
+ "accuracy": 1.0,
3050
+ "count": 95
3051
+ }
3052
+ }
3053
+ },
3054
+ "add_S1": {
3055
+ "full_accuracy": 1.0,
3056
+ "n_examples": 100,
3057
+ "per_subtask": {
3058
+ "SA": {
3059
+ "accuracy": 1.0,
3060
+ "count": 204
3061
+ },
3062
+ "SC": {
3063
+ "accuracy": 1.0,
3064
+ "count": 169
3065
+ },
3066
+ "SS": {
3067
+ "accuracy": 1.0,
3068
+ "count": 31
3069
+ },
3070
+ "UC": {
3071
+ "accuracy": 1.0,
3072
+ "count": 296
3073
+ }
3074
+ }
3075
+ },
3076
+ "add_S2": {
3077
+ "full_accuracy": 1.0,
3078
+ "n_examples": 100,
3079
+ "per_subtask": {
3080
+ "SA": {
3081
+ "accuracy": 1.0,
3082
+ "count": 163
3083
+ },
3084
+ "SC": {
3085
+ "accuracy": 1.0,
3086
+ "count": 130
3087
+ },
3088
+ "SS": {
3089
+ "accuracy": 1.0,
3090
+ "count": 87
3091
+ },
3092
+ "UC": {
3093
+ "accuracy": 1.0,
3094
+ "count": 203
3095
+ },
3096
+ "US": {
3097
+ "accuracy": 1.0,
3098
+ "count": 117
3099
+ }
3100
+ }
3101
+ },
3102
+ "add_S3": {
3103
+ "full_accuracy": 1.0,
3104
+ "n_examples": 100,
3105
+ "per_subtask": {
3106
+ "SA": {
3107
+ "accuracy": 1.0,
3108
+ "count": 121
3109
+ },
3110
+ "SC": {
3111
+ "accuracy": 1.0,
3112
+ "count": 121
3113
+ },
3114
+ "SS": {
3115
+ "accuracy": 1.0,
3116
+ "count": 49
3117
+ },
3118
+ "UC": {
3119
+ "accuracy": 1.0,
3120
+ "count": 186
3121
+ },
3122
+ "US": {
3123
+ "accuracy": 1.0,
3124
+ "count": 223
3125
+ }
3126
+ }
3127
+ },
3128
+ "add_S4": {
3129
+ "full_accuracy": 1.0,
3130
+ "n_examples": 100,
3131
+ "per_subtask": {
3132
+ "SA": {
3133
+ "accuracy": 1.0,
3134
+ "count": 104
3135
+ },
3136
+ "SC": {
3137
+ "accuracy": 1.0,
3138
+ "count": 106
3139
+ },
3140
+ "SS": {
3141
+ "accuracy": 1.0,
3142
+ "count": 23
3143
+ },
3144
+ "UC": {
3145
+ "accuracy": 1.0,
3146
+ "count": 160
3147
+ },
3148
+ "US": {
3149
+ "accuracy": 1.0,
3150
+ "count": 307
3151
+ }
3152
+ }
3153
+ },
3154
+ "add_S5": {
3155
+ "full_accuracy": 1.0,
3156
+ "n_examples": 100,
3157
+ "per_subtask": {
3158
+ "SA": {
3159
+ "accuracy": 1.0,
3160
+ "count": 100
3161
+ },
3162
+ "SC": {
3163
+ "accuracy": 1.0,
3164
+ "count": 100
3165
+ },
3166
+ "UC": {
3167
+ "accuracy": 1.0,
3168
+ "count": 100
3169
+ },
3170
+ "US": {
3171
+ "accuracy": 1.0,
3172
+ "count": 400
3173
+ }
3174
+ }
3175
+ },
3176
+ "add_S6": {
3177
+ "full_accuracy": 1.0,
3178
+ "n_examples": 100,
3179
+ "per_subtask": {
3180
+ "SC": {
3181
+ "accuracy": 1.0,
3182
+ "count": 100
3183
+ },
3184
+ "UC": {
3185
+ "accuracy": 1.0,
3186
+ "count": 100
3187
+ },
3188
+ "US": {
3189
+ "accuracy": 1.0,
3190
+ "count": 500
3191
+ }
3192
+ }
3193
+ },
3194
+ "add_random": {
3195
+ "full_accuracy": 1.0,
3196
+ "n_examples": 200,
3197
+ "per_subtask": {
3198
+ "SA": {
3199
+ "accuracy": 1.0,
3200
+ "count": 447
3201
+ },
3202
+ "SC": {
3203
+ "accuracy": 1.0,
3204
+ "count": 320
3205
+ },
3206
+ "SS": {
3207
+ "accuracy": 1.0,
3208
+ "count": 56
3209
+ },
3210
+ "UC": {
3211
+ "accuracy": 1.0,
3212
+ "count": 529
3213
+ },
3214
+ "US": {
3215
+ "accuracy": 1.0,
3216
+ "count": 48
3217
+ }
3218
+ }
3219
+ },
3220
+ "add_C3": {
3221
+ "full_accuracy": 1.0,
3222
+ "n_examples": 100,
3223
+ "per_subtask": {
3224
+ "SA": {
3225
+ "accuracy": 1.0,
3226
+ "count": 300
3227
+ },
3228
+ "SC": {
3229
+ "accuracy": 1.0,
3230
+ "count": 100
3231
+ },
3232
+ "UC": {
3233
+ "accuracy": 1.0,
3234
+ "count": 193
3235
+ },
3236
+ "US": {
3237
+ "accuracy": 1.0,
3238
+ "count": 107
3239
+ }
3240
+ }
3241
+ },
3242
+ "add_C4": {
3243
+ "full_accuracy": 1.0,
3244
+ "n_examples": 100,
3245
+ "per_subtask": {
3246
+ "SA": {
3247
+ "accuracy": 1.0,
3248
+ "count": 200
3249
+ },
3250
+ "SC": {
3251
+ "accuracy": 1.0,
3252
+ "count": 100
3253
+ },
3254
+ "UC": {
3255
+ "accuracy": 1.0,
3256
+ "count": 256
3257
+ },
3258
+ "US": {
3259
+ "accuracy": 1.0,
3260
+ "count": 144
3261
+ }
3262
+ }
3263
+ },
3264
+ "add_C5": {
3265
+ "full_accuracy": 1.0,
3266
+ "n_examples": 100,
3267
+ "per_subtask": {
3268
+ "SA": {
3269
+ "accuracy": 1.0,
3270
+ "count": 100
3271
+ },
3272
+ "SC": {
3273
+ "accuracy": 1.0,
3274
+ "count": 100
3275
+ },
3276
+ "UC": {
3277
+ "accuracy": 1.0,
3278
+ "count": 306
3279
+ },
3280
+ "US": {
3281
+ "accuracy": 1.0,
3282
+ "count": 194
3283
+ }
3284
+ }
3285
+ },
3286
+ "add_C6": {
3287
+ "full_accuracy": 1.0,
3288
+ "n_examples": 100,
3289
+ "per_subtask": {
3290
+ "SC": {
3291
+ "accuracy": 1.0,
3292
+ "count": 100
3293
+ },
3294
+ "UC": {
3295
+ "accuracy": 1.0,
3296
+ "count": 366
3297
+ },
3298
+ "US": {
3299
+ "accuracy": 1.0,
3300
+ "count": 234
3301
+ }
3302
+ }
3303
+ },
3304
+ "sub_M0": {
3305
+ "full_accuracy": 1.0,
3306
+ "n_examples": 100,
3307
+ "per_subtask": {
3308
+ "MD": {
3309
+ "accuracy": 1.0,
3310
+ "count": 601
3311
+ },
3312
+ "ME": {
3313
+ "accuracy": 1.0,
3314
+ "count": 99
3315
+ }
3316
+ }
3317
+ },
3318
+ "sub_M1": {
3319
+ "full_accuracy": 1.0,
3320
+ "n_examples": 100,
3321
+ "per_subtask": {
3322
+ "MD": {
3323
+ "accuracy": 1.0,
3324
+ "count": 279
3325
+ },
3326
+ "MB": {
3327
+ "accuracy": 1.0,
3328
+ "count": 145
3329
+ },
3330
+ "ME": {
3331
+ "accuracy": 1.0,
3332
+ "count": 24
3333
+ },
3334
+ "UB": {
3335
+ "accuracy": 1.0,
3336
+ "count": 252
3337
+ }
3338
+ }
3339
+ },
3340
+ "sub_M2": {
3341
+ "full_accuracy": 1.0,
3342
+ "n_examples": 100,
3343
+ "per_subtask": {
3344
+ "MD": {
3345
+ "accuracy": 1.0,
3346
+ "count": 213
3347
+ },
3348
+ "MB": {
3349
+ "accuracy": 1.0,
3350
+ "count": 113
3351
+ },
3352
+ "ME": {
3353
+ "accuracy": 1.0,
3354
+ "count": 85
3355
+ },
3356
+ "UB": {
3357
+ "accuracy": 1.0,
3358
+ "count": 181
3359
+ },
3360
+ "UD": {
3361
+ "accuracy": 1.0,
3362
+ "count": 108
3363
+ }
3364
+ }
3365
+ },
3366
+ "sub_M3": {
3367
+ "full_accuracy": 1.0,
3368
+ "n_examples": 100,
3369
+ "per_subtask": {
3370
+ "MD": {
3371
+ "accuracy": 1.0,
3372
+ "count": 179
3373
+ },
3374
+ "MB": {
3375
+ "accuracy": 1.0,
3376
+ "count": 103
3377
+ },
3378
+ "ME": {
3379
+ "accuracy": 1.0,
3380
+ "count": 56
3381
+ },
3382
+ "UB": {
3383
+ "accuracy": 1.0,
3384
+ "count": 149
3385
+ },
3386
+ "UD": {
3387
+ "accuracy": 1.0,
3388
+ "count": 213
3389
+ }
3390
+ }
3391
+ },
3392
+ "sub_M4": {
3393
+ "full_accuracy": 1.0,
3394
+ "n_examples": 100,
3395
+ "per_subtask": {
3396
+ "MD": {
3397
+ "accuracy": 1.0,
3398
+ "count": 200
3399
+ },
3400
+ "MB": {
3401
+ "accuracy": 1.0,
3402
+ "count": 100
3403
+ },
3404
+ "UB": {
3405
+ "accuracy": 1.0,
3406
+ "count": 100
3407
+ },
3408
+ "UD": {
3409
+ "accuracy": 1.0,
3410
+ "count": 300
3411
+ }
3412
+ }
3413
+ },
3414
+ "sub_M5": {
3415
+ "full_accuracy": 1.0,
3416
+ "n_examples": 100,
3417
+ "per_subtask": {
3418
+ "MD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 100
3421
+ },
3422
+ "MB": {
3423
+ "accuracy": 1.0,
3424
+ "count": 100
3425
+ },
3426
+ "UB": {
3427
+ "accuracy": 1.0,
3428
+ "count": 100
3429
+ },
3430
+ "UD": {
3431
+ "accuracy": 1.0,
3432
+ "count": 400
3433
+ }
3434
+ }
3435
+ },
3436
+ "sub_random": {
3437
+ "full_accuracy": 1.0,
3438
+ "n_examples": 200,
3439
+ "per_subtask": {
3440
+ "MD": {
3441
+ "accuracy": 1.0,
3442
+ "count": 600
3443
+ },
3444
+ "MB": {
3445
+ "accuracy": 1.0,
3446
+ "count": 267
3447
+ },
3448
+ "ME": {
3449
+ "accuracy": 1.0,
3450
+ "count": 53
3451
+ },
3452
+ "UB": {
3453
+ "accuracy": 1.0,
3454
+ "count": 439
3455
+ },
3456
+ "UD": {
3457
+ "accuracy": 1.0,
3458
+ "count": 41
3459
+ }
3460
+ }
3461
+ },
3462
+ "sub_B3": {
3463
+ "full_accuracy": 1.0,
3464
+ "n_examples": 100,
3465
+ "per_subtask": {
3466
+ "MD": {
3467
+ "accuracy": 1.0,
3468
+ "count": 300
3469
+ },
3470
+ "MB": {
3471
+ "accuracy": 1.0,
3472
+ "count": 100
3473
+ },
3474
+ "UB": {
3475
+ "accuracy": 1.0,
3476
+ "count": 197
3477
+ },
3478
+ "UD": {
3479
+ "accuracy": 1.0,
3480
+ "count": 103
3481
+ }
3482
+ }
3483
+ },
3484
+ "sub_B4": {
3485
+ "full_accuracy": 1.0,
3486
+ "n_examples": 100,
3487
+ "per_subtask": {
3488
+ "MD": {
3489
+ "accuracy": 1.0,
3490
+ "count": 200
3491
+ },
3492
+ "MB": {
3493
+ "accuracy": 1.0,
3494
+ "count": 100
3495
+ },
3496
+ "UB": {
3497
+ "accuracy": 1.0,
3498
+ "count": 247
3499
+ },
3500
+ "UD": {
3501
+ "accuracy": 1.0,
3502
+ "count": 153
3503
+ }
3504
+ }
3505
+ },
3506
+ "sub_B5": {
3507
+ "full_accuracy": 1.0,
3508
+ "n_examples": 100,
3509
+ "per_subtask": {
3510
+ "MD": {
3511
+ "accuracy": 1.0,
3512
+ "count": 100
3513
+ },
3514
+ "MB": {
3515
+ "accuracy": 1.0,
3516
+ "count": 100
3517
+ },
3518
+ "UB": {
3519
+ "accuracy": 1.0,
3520
+ "count": 298
3521
+ },
3522
+ "UD": {
3523
+ "accuracy": 1.0,
3524
+ "count": 202
3525
+ }
3526
+ }
3527
+ }
3528
+ },
3529
+ "summary": {
3530
+ "overall_accuracy": 1.0,
3531
+ "total_examples": 2400,
3532
+ "n_splits": 22
3533
+ }
3534
+ },
3535
+ "sorl_overall_accuracy": 1.0,
3536
+ "sft_overall_accuracy": 0.77
3537
+ }
add_sub_sorl_v1_abs16_100K/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:8af91a334202c57fddfa057167168e0fee38a83b32cdc8a0f5a722fbcd79a8a5
3
+ size 650328152
add_sub_sorl_v1_abs16_100K/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 4,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 4e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 10,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 1562,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs16_K4_100K",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 2,
61
+ "n_head": 3,
62
+ "n_embd": 510,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 16,
65
+ "dataset_size": 100000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 162505382,
71
+ "run_name": "add_sub_sorl_v1_abs16_100K",
72
+ "git_commit": "f447da529caceac8c7d256cbb2cd185cbc50feac",
73
+ "timestamp": "2026-04-12T18:46:45.514385+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "nhhjduxx",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/nhhjduxx",
81
+ "final_accuracy": 1.0,
82
+ "sft_accuracy": 0.77,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }