amirali1985 commited on
Commit
2fb3204
·
verified ·
1 Parent(s): db98d23

Upload add_sub_sorl_v1_abs50_100K

Browse files
add_sub_sorl_v1_abs50_100K/config.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 510,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 2040,
15
+ "layer_types": [
16
+ "full_attention",
17
+ "full_attention"
18
+ ],
19
+ "max_position_embeddings": 128,
20
+ "max_window_layers": 28,
21
+ "model_type": "qwen3",
22
+ "num_attention_heads": 3,
23
+ "num_hidden_layers": 2,
24
+ "num_key_value_heads": 3,
25
+ "pad_token_id": null,
26
+ "rms_norm_eps": 1e-06,
27
+ "rope_parameters": {
28
+ "rope_theta": 10000.0,
29
+ "rope_type": "default"
30
+ },
31
+ "sliding_window": null,
32
+ "tie_word_embeddings": false,
33
+ "transformers_version": "5.5.0",
34
+ "use_cache": true,
35
+ "use_sliding_window": false,
36
+ "vocab_size": 151694
37
+ }
add_sub_sorl_v1_abs50_100K/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs50_100K/metrics.json ADDED
@@ -0,0 +1,3537 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 800,
20
+ 850,
21
+ 900,
22
+ 950,
23
+ 1000,
24
+ 1050,
25
+ 1100,
26
+ 1150,
27
+ 1200,
28
+ 1250,
29
+ 1300,
30
+ 1350,
31
+ 1400,
32
+ 1450,
33
+ 1500,
34
+ 1550,
35
+ 1613,
36
+ 1663,
37
+ 1713,
38
+ 1763,
39
+ 1813,
40
+ 1863,
41
+ 1913,
42
+ 1963,
43
+ 2013,
44
+ 2063,
45
+ 2113,
46
+ 2163,
47
+ 2213,
48
+ 2263,
49
+ 2313,
50
+ 2363,
51
+ 2413,
52
+ 2463,
53
+ 2513,
54
+ 2563,
55
+ 2613,
56
+ 2663,
57
+ 2713,
58
+ 2763,
59
+ 2813,
60
+ 2863,
61
+ 2913,
62
+ 2963,
63
+ 3013,
64
+ 3063,
65
+ 3113,
66
+ 3176,
67
+ 3226,
68
+ 3276,
69
+ 3326,
70
+ 3376,
71
+ 3426,
72
+ 3476,
73
+ 3526,
74
+ 3576,
75
+ 3626,
76
+ 3676,
77
+ 3726,
78
+ 3776,
79
+ 3826,
80
+ 3876,
81
+ 3926,
82
+ 3976,
83
+ 4026,
84
+ 4076,
85
+ 4126,
86
+ 4176,
87
+ 4226,
88
+ 4276,
89
+ 4326,
90
+ 4376,
91
+ 4426,
92
+ 4476,
93
+ 4526,
94
+ 4576,
95
+ 4626,
96
+ 4676,
97
+ 4739,
98
+ 4789,
99
+ 4839,
100
+ 4889,
101
+ 4939,
102
+ 4989,
103
+ 5039,
104
+ 5089,
105
+ 5139,
106
+ 5189,
107
+ 5239,
108
+ 5289,
109
+ 5339,
110
+ 5389,
111
+ 5439,
112
+ 5489,
113
+ 5539,
114
+ 5589,
115
+ 5639,
116
+ 5689,
117
+ 5739,
118
+ 5789,
119
+ 5839,
120
+ 5889,
121
+ 5939,
122
+ 5989,
123
+ 6039,
124
+ 6089,
125
+ 6139,
126
+ 6189,
127
+ 6239,
128
+ 6302,
129
+ 6352,
130
+ 6402,
131
+ 6452,
132
+ 6502,
133
+ 6552,
134
+ 6602,
135
+ 6652,
136
+ 6702,
137
+ 6752,
138
+ 6802,
139
+ 6852,
140
+ 6902,
141
+ 6952,
142
+ 7002,
143
+ 7052,
144
+ 7102,
145
+ 7152,
146
+ 7202,
147
+ 7252,
148
+ 7302,
149
+ 7352,
150
+ 7402,
151
+ 7452,
152
+ 7502,
153
+ 7552,
154
+ 7602,
155
+ 7652,
156
+ 7702,
157
+ 7752,
158
+ 7802,
159
+ 7865,
160
+ 7915,
161
+ 7965,
162
+ 8015,
163
+ 8065,
164
+ 8115,
165
+ 8165,
166
+ 8215,
167
+ 8265,
168
+ 8315,
169
+ 8365,
170
+ 8415,
171
+ 8465,
172
+ 8515,
173
+ 8565,
174
+ 8615,
175
+ 8665,
176
+ 8715,
177
+ 8765,
178
+ 8815,
179
+ 8865,
180
+ 8915,
181
+ 8965,
182
+ 9015,
183
+ 9065,
184
+ 9115,
185
+ 9165,
186
+ 9215,
187
+ 9265,
188
+ 9315,
189
+ 9365,
190
+ 9428,
191
+ 9478,
192
+ 9528,
193
+ 9578,
194
+ 9628,
195
+ 9678,
196
+ 9728,
197
+ 9778,
198
+ 9828,
199
+ 9878,
200
+ 9928,
201
+ 9978,
202
+ 10028,
203
+ 10078,
204
+ 10128,
205
+ 10178,
206
+ 10228,
207
+ 10278,
208
+ 10328,
209
+ 10378,
210
+ 10428,
211
+ 10478,
212
+ 10528,
213
+ 10578,
214
+ 10628,
215
+ 10678,
216
+ 10728,
217
+ 10778,
218
+ 10828,
219
+ 10878,
220
+ 10928,
221
+ 10991,
222
+ 11041,
223
+ 11091,
224
+ 11141,
225
+ 11191,
226
+ 11241,
227
+ 11291,
228
+ 11341,
229
+ 11391,
230
+ 11441,
231
+ 11491,
232
+ 11541,
233
+ 11591,
234
+ 11641,
235
+ 11691,
236
+ 11741,
237
+ 11791,
238
+ 11841,
239
+ 11891,
240
+ 11941,
241
+ 11991,
242
+ 12041,
243
+ 12091,
244
+ 12141,
245
+ 12191,
246
+ 12241,
247
+ 12291,
248
+ 12341,
249
+ 12391,
250
+ 12441,
251
+ 12491,
252
+ 12554,
253
+ 12604,
254
+ 12654,
255
+ 12704,
256
+ 12754,
257
+ 12804,
258
+ 12854,
259
+ 12904,
260
+ 12954,
261
+ 13004,
262
+ 13054,
263
+ 13104,
264
+ 13154,
265
+ 13204,
266
+ 13254,
267
+ 13304,
268
+ 13354,
269
+ 13404,
270
+ 13454,
271
+ 13504,
272
+ 13554,
273
+ 13604,
274
+ 13654,
275
+ 13704,
276
+ 13754,
277
+ 13804,
278
+ 13854,
279
+ 13904,
280
+ 13954,
281
+ 14004,
282
+ 14054,
283
+ 14117,
284
+ 14167,
285
+ 14217,
286
+ 14267,
287
+ 14317,
288
+ 14367,
289
+ 14417,
290
+ 14467,
291
+ 14517,
292
+ 14567,
293
+ 14617,
294
+ 14667,
295
+ 14717,
296
+ 14767,
297
+ 14817,
298
+ 14867,
299
+ 14917,
300
+ 14967,
301
+ 15017,
302
+ 15067,
303
+ 15117,
304
+ 15167,
305
+ 15217,
306
+ 15267,
307
+ 15317,
308
+ 15367,
309
+ 15417,
310
+ 15467,
311
+ 15517,
312
+ 15567,
313
+ 15617
314
+ ],
315
+ "loss": [
316
+ 15.902643203735352,
317
+ 11.699418067932129,
318
+ 8.803803443908691,
319
+ 7.566174030303955,
320
+ 4.88871955871582,
321
+ 3.483307123184204,
322
+ 2.9673330783843994,
323
+ 2.5199191570281982,
324
+ 2.359388828277588,
325
+ 1.899479627609253,
326
+ 2.3249804973602295,
327
+ 1.472941279411316,
328
+ 1.3966615200042725,
329
+ 0.7510354518890381,
330
+ 0.8818374872207642,
331
+ 0.6415048837661743,
332
+ 0.2329241931438446,
333
+ -1.0738698244094849,
334
+ -2.200684070587158,
335
+ -3.7577319145202637,
336
+ -5.699623107910156,
337
+ -7.358343124389648,
338
+ -9.194567680358887,
339
+ -9.076865196228027,
340
+ -10.468391418457031,
341
+ -10.008020401000977,
342
+ -11.121683120727539,
343
+ -10.967080116271973,
344
+ -11.859116554260254,
345
+ -12.660564422607422,
346
+ -12.601607322692871,
347
+ -13.966347694396973,
348
+ -14.086410522460938,
349
+ -13.412335395812988,
350
+ -14.228898048400879,
351
+ -13.165425300598145,
352
+ -14.058863639831543,
353
+ -14.419401168823242,
354
+ -14.229293823242188,
355
+ -13.882869720458984,
356
+ -13.9789457321167,
357
+ -14.555558204650879,
358
+ -14.0433988571167,
359
+ -13.979240417480469,
360
+ -13.299639701843262,
361
+ -14.608553886413574,
362
+ -14.117591857910156,
363
+ -14.673713684082031,
364
+ -14.202105522155762,
365
+ -14.54289722442627,
366
+ -14.768146514892578,
367
+ -14.255924224853516,
368
+ -14.07961654663086,
369
+ -14.165740013122559,
370
+ -14.195342063903809,
371
+ -13.844704627990723,
372
+ -13.554451942443848,
373
+ -13.777854919433594,
374
+ -14.790366172790527,
375
+ -14.977351188659668,
376
+ -14.2539644241333,
377
+ -14.452176094055176,
378
+ -13.604500770568848,
379
+ -14.904753684997559,
380
+ -14.828282356262207,
381
+ -14.090341567993164,
382
+ -14.200688362121582,
383
+ -13.650691032409668,
384
+ -14.073995590209961,
385
+ -13.802224159240723,
386
+ -13.814070701599121,
387
+ -13.819828987121582,
388
+ -14.0003023147583,
389
+ -14.25842571258545,
390
+ -14.026065826416016,
391
+ -13.91340446472168,
392
+ -14.058174133300781,
393
+ -13.821667671203613,
394
+ -13.962796211242676,
395
+ -14.399702072143555,
396
+ -14.518136978149414,
397
+ -13.377851486206055,
398
+ -13.583179473876953,
399
+ -13.494460105895996,
400
+ -13.96147346496582,
401
+ -13.965815544128418,
402
+ -13.858078002929688,
403
+ -13.814715385437012,
404
+ -13.289409637451172,
405
+ -12.859536170959473,
406
+ -13.226099014282227,
407
+ -12.458443641662598,
408
+ -12.99895191192627,
409
+ -11.597752571105957,
410
+ -9.364056587219238,
411
+ -8.954510688781738,
412
+ -7.378148078918457,
413
+ -6.393317699432373,
414
+ -5.539052963256836,
415
+ -5.486110210418701,
416
+ -5.265102863311768,
417
+ -5.159455299377441,
418
+ -5.0415449142456055,
419
+ -4.666078567504883,
420
+ -4.503330707550049,
421
+ -4.285207748413086,
422
+ -4.761104106903076,
423
+ -4.316300392150879,
424
+ -4.36053991317749,
425
+ -4.242866039276123,
426
+ -4.096912384033203,
427
+ -3.6605536937713623,
428
+ -4.064852237701416,
429
+ -3.8849408626556396,
430
+ -3.7402796745300293,
431
+ -3.6939871311187744,
432
+ -3.523607015609741,
433
+ -3.4979679584503174,
434
+ -3.4444966316223145,
435
+ -3.978267192840576,
436
+ -3.5759990215301514,
437
+ -4.023746013641357,
438
+ -3.0218427181243896,
439
+ -2.863001585006714,
440
+ -3.637617826461792,
441
+ -3.0398430824279785,
442
+ -3.461866855621338,
443
+ -3.11603045463562,
444
+ -2.969511032104492,
445
+ -2.728440761566162,
446
+ -2.7764720916748047,
447
+ -2.940053939819336,
448
+ -3.051244020462036,
449
+ -2.4871532917022705,
450
+ -2.6896591186523438,
451
+ -2.540485382080078,
452
+ -2.511063575744629,
453
+ -2.0412261486053467,
454
+ -2.4017343521118164,
455
+ -2.4651193618774414,
456
+ -2.7034363746643066,
457
+ -2.403578758239746,
458
+ -2.633699655532837,
459
+ -2.240712881088257,
460
+ -2.4593920707702637,
461
+ -2.367264986038208,
462
+ -2.406060218811035,
463
+ -2.497303009033203,
464
+ -2.8190865516662598,
465
+ -2.6294970512390137,
466
+ -2.728332281112671,
467
+ -2.1717090606689453,
468
+ -2.995640993118286,
469
+ -2.4550960063934326,
470
+ -1.9697117805480957,
471
+ -2.655184030532837,
472
+ -2.454906702041626,
473
+ -2.5678441524505615,
474
+ -2.4128735065460205,
475
+ -2.195981740951538,
476
+ -2.3848819732666016,
477
+ -2.210343599319458,
478
+ -2.582068920135498,
479
+ -2.196033000946045,
480
+ -1.967943787574768,
481
+ -1.9972151517868042,
482
+ -2.089529275894165,
483
+ -1.7043302059173584,
484
+ -2.0483813285827637,
485
+ -1.7416160106658936,
486
+ -1.8610892295837402,
487
+ -2.122062921524048,
488
+ -2.2287797927856445,
489
+ -2.1510496139526367,
490
+ -2.003434419631958,
491
+ -1.7898396253585815,
492
+ -2.3351781368255615,
493
+ -2.1391477584838867,
494
+ -2.124420642852783,
495
+ -2.0292270183563232,
496
+ -1.5877554416656494,
497
+ -1.8878551721572876,
498
+ -2.184229850769043,
499
+ -1.8811503648757935,
500
+ -1.7677620649337769,
501
+ -1.7471814155578613,
502
+ -1.7462050914764404,
503
+ -1.8536919355392456,
504
+ -2.1378421783447266,
505
+ -1.875000238418579,
506
+ -1.9442965984344482,
507
+ -1.61328125,
508
+ -1.7730133533477783,
509
+ -1.60498046875,
510
+ -1.8977247476577759,
511
+ -1.7701810598373413,
512
+ -1.9182641506195068,
513
+ -1.8594216108322144,
514
+ -1.627413272857666,
515
+ -1.6685473918914795,
516
+ -1.5593777894973755,
517
+ -1.8531725406646729,
518
+ -1.741038203239441,
519
+ -1.72149658203125,
520
+ -1.6873160600662231,
521
+ -1.7354228496551514,
522
+ -1.3678635358810425,
523
+ -1.6457551717758179,
524
+ -1.7738306522369385,
525
+ -1.7181503772735596,
526
+ -1.7335387468338013,
527
+ -1.284615397453308,
528
+ -1.6187137365341187,
529
+ -1.4650169610977173,
530
+ -1.4392532110214233,
531
+ -1.804498314857483,
532
+ -1.5744978189468384,
533
+ -1.5620957612991333,
534
+ -1.311811923980713,
535
+ -1.3705101013183594,
536
+ -1.072982668876648,
537
+ -1.311877727508545,
538
+ -1.4170998334884644,
539
+ -1.4101189374923706,
540
+ -1.3157600164413452,
541
+ -1.3691258430480957,
542
+ -1.5042686462402344,
543
+ -1.7621362209320068,
544
+ -1.4440076351165771,
545
+ -1.480931043624878,
546
+ -1.4486089944839478,
547
+ -1.3105967044830322,
548
+ -1.2870160341262817,
549
+ -1.6739288568496704,
550
+ -1.3392441272735596,
551
+ -1.3649474382400513,
552
+ -1.27271568775177,
553
+ -1.4094288349151611,
554
+ -1.6764694452285767,
555
+ -1.3893120288848877,
556
+ -1.4240716695785522,
557
+ -1.4635239839553833,
558
+ -1.5566202402114868,
559
+ -1.1928588151931763,
560
+ -1.3678373098373413,
561
+ -1.729019045829773,
562
+ -1.371423602104187,
563
+ -1.1183242797851562,
564
+ -1.2645045518875122,
565
+ -1.2355653047561646,
566
+ -1.2753121852874756,
567
+ -1.1917059421539307,
568
+ -1.4308631420135498,
569
+ -1.143221139907837,
570
+ -1.1318707466125488,
571
+ -1.1786340475082397,
572
+ -1.1008967161178589,
573
+ -1.2262732982635498,
574
+ -1.1759511232376099,
575
+ -1.2019951343536377,
576
+ -1.4008299112319946,
577
+ -1.0337084531784058,
578
+ -1.3461097478866577,
579
+ -1.2970634698867798,
580
+ -1.4298337697982788,
581
+ -1.3009860515594482,
582
+ -1.0590935945510864,
583
+ -1.0305430889129639,
584
+ -1.357376217842102,
585
+ -1.109458088874817,
586
+ -1.2143073081970215,
587
+ -0.9586305022239685,
588
+ -1.138513207435608,
589
+ -1.0083967447280884,
590
+ -1.3379303216934204,
591
+ -1.3722052574157715,
592
+ -1.1853731870651245,
593
+ -1.3719193935394287,
594
+ -1.2580769062042236,
595
+ -0.8599216938018799,
596
+ -1.0621342658996582,
597
+ -1.0587685108184814,
598
+ -1.0981093645095825,
599
+ -1.1308614015579224,
600
+ -0.868450403213501,
601
+ -1.2680256366729736,
602
+ -1.1257991790771484,
603
+ -0.8759847283363342,
604
+ -1.1675376892089844,
605
+ -1.3457125425338745,
606
+ -1.151440978050232,
607
+ -0.9569621086120605,
608
+ -0.8542989492416382,
609
+ -1.124998927116394,
610
+ -1.0205310583114624,
611
+ -1.2389376163482666,
612
+ -1.1499571800231934,
613
+ -0.9360352754592896,
614
+ -0.9703195691108704,
615
+ -1.0978248119354248,
616
+ -0.9414624571800232,
617
+ -1.074188232421875,
618
+ -0.8543161153793335,
619
+ -0.9937012791633606,
620
+ -1.123839020729065,
621
+ -0.9685264825820923,
622
+ -1.0889569520950317,
623
+ -1.1003398895263672,
624
+ -1.2492115497589111,
625
+ -1.1496220827102661
626
+ ],
627
+ "base_loss": [
628
+ 10.600613594055176,
629
+ 8.055359840393066,
630
+ 7.324338436126709,
631
+ 6.316225528717041,
632
+ 5.33962345123291,
633
+ 3.5689940452575684,
634
+ 2.1874196529388428,
635
+ 2.047659158706665,
636
+ 1.899756669998169,
637
+ 1.84453284740448,
638
+ 1.83500075340271,
639
+ 1.820839524269104,
640
+ 1.8651269674301147,
641
+ 1.8551760911941528,
642
+ 1.8548781871795654,
643
+ 1.8376959562301636,
644
+ 1.7977161407470703,
645
+ 1.8850847482681274,
646
+ 1.8461447954177856,
647
+ 1.9221431016921997,
648
+ 1.94983971118927,
649
+ 1.9527097940444946,
650
+ 1.997671365737915,
651
+ 1.8204795122146606,
652
+ 1.8524330854415894,
653
+ 1.7538738250732422,
654
+ 1.8139578104019165,
655
+ 1.677846074104309,
656
+ 1.6989243030548096,
657
+ 1.7410989999771118,
658
+ 1.655508041381836,
659
+ 1.7551666498184204,
660
+ 1.7356339693069458,
661
+ 1.6838182210922241,
662
+ 1.7027080059051514,
663
+ 1.6092866659164429,
664
+ 1.7314802408218384,
665
+ 1.715027093887329,
666
+ 1.6868661642074585,
667
+ 1.6269105672836304,
668
+ 1.6311454772949219,
669
+ 1.668233036994934,
670
+ 1.6192152500152588,
671
+ 1.6262046098709106,
672
+ 1.5721343755722046,
673
+ 1.6828041076660156,
674
+ 1.6095987558364868,
675
+ 1.678329586982727,
676
+ 1.6124516725540161,
677
+ 1.656113624572754,
678
+ 1.6720694303512573,
679
+ 1.6209814548492432,
680
+ 1.6137975454330444,
681
+ 1.618564248085022,
682
+ 1.604408860206604,
683
+ 1.602517008781433,
684
+ 1.5463826656341553,
685
+ 1.5854791402816772,
686
+ 1.6620441675186157,
687
+ 1.6873973608016968,
688
+ 1.6140778064727783,
689
+ 1.6244564056396484,
690
+ 1.55022394657135,
691
+ 1.6899614334106445,
692
+ 1.6684008836746216,
693
+ 1.5978590250015259,
694
+ 1.5932568311691284,
695
+ 1.5419341325759888,
696
+ 1.585222840309143,
697
+ 1.549852967262268,
698
+ 1.5714552402496338,
699
+ 1.5638586282730103,
700
+ 1.591749906539917,
701
+ 1.6070278882980347,
702
+ 1.5776277780532837,
703
+ 1.559006929397583,
704
+ 1.5761176347732544,
705
+ 1.55569589138031,
706
+ 1.5638123750686646,
707
+ 1.629416823387146,
708
+ 1.6225910186767578,
709
+ 1.5065295696258545,
710
+ 1.5395022630691528,
711
+ 1.5159441232681274,
712
+ 1.5644861459732056,
713
+ 1.5675691366195679,
714
+ 1.5587130784988403,
715
+ 1.547330617904663,
716
+ 1.4885733127593994,
717
+ 1.4435430765151978,
718
+ 1.489171028137207,
719
+ 1.4163488149642944,
720
+ 1.459105372428894,
721
+ 1.307129144668579,
722
+ 1.0703612565994263,
723
+ 1.0271738767623901,
724
+ 0.837945282459259,
725
+ 0.7230348587036133,
726
+ 0.6405311822891235,
727
+ 0.628436267375946,
728
+ 0.5976390242576599,
729
+ 0.5854808688163757,
730
+ 0.575773298740387,
731
+ 0.5387369394302368,
732
+ 0.5131381750106812,
733
+ 0.5131796598434448,
734
+ 0.5391896367073059,
735
+ 0.5001967549324036,
736
+ 0.5120877027511597,
737
+ 0.486084520816803,
738
+ 0.46478286385536194,
739
+ 0.4414048194885254,
740
+ 0.4803733229637146,
741
+ 0.46711090207099915,
742
+ 0.4299696087837219,
743
+ 0.42117783427238464,
744
+ 0.4076921343803406,
745
+ 0.4038875997066498,
746
+ 0.40442657470703125,
747
+ 0.4533192217350006,
748
+ 0.40610095858573914,
749
+ 0.4571431577205658,
750
+ 0.34926196932792664,
751
+ 0.32839104533195496,
752
+ 0.4149651527404785,
753
+ 0.35457661747932434,
754
+ 0.39466795325279236,
755
+ 0.3604254424571991,
756
+ 0.34129220247268677,
757
+ 0.3307943344116211,
758
+ 0.341112345457077,
759
+ 0.3433581292629242,
760
+ 0.35467222332954407,
761
+ 0.2954230308532715,
762
+ 0.30940061807632446,
763
+ 0.29190659523010254,
764
+ 0.2927117347717285,
765
+ 0.2889794707298279,
766
+ 0.27745234966278076,
767
+ 0.28490832448005676,
768
+ 0.30999067425727844,
769
+ 0.2780962288379669,
770
+ 0.3009397089481354,
771
+ 0.2622397243976593,
772
+ 0.28423628211021423,
773
+ 0.27033689618110657,
774
+ 0.2779816687107086,
775
+ 0.28508269786834717,
776
+ 0.32521364092826843,
777
+ 0.30002689361572266,
778
+ 0.3127082288265228,
779
+ 0.2539328336715698,
780
+ 0.34114691615104675,
781
+ 0.2819333076477051,
782
+ 0.22665226459503174,
783
+ 0.3118877410888672,
784
+ 0.2800125479698181,
785
+ 0.2952449917793274,
786
+ 0.2765387296676636,
787
+ 0.2516744136810303,
788
+ 0.2749289870262146,
789
+ 0.25773903727531433,
790
+ 0.29442644119262695,
791
+ 0.2525728940963745,
792
+ 0.22910907864570618,
793
+ 0.2300143986940384,
794
+ 0.23990151286125183,
795
+ 0.19912955164909363,
796
+ 0.2360854595899582,
797
+ 0.20227625966072083,
798
+ 0.22241690754890442,
799
+ 0.24504487216472626,
800
+ 0.2558191418647766,
801
+ 0.2501135468482971,
802
+ 0.24015279114246368,
803
+ 0.2100088745355606,
804
+ 0.26677006483078003,
805
+ 0.24530638754367828,
806
+ 0.24426667392253876,
807
+ 0.2331373691558838,
808
+ 0.19073544442653656,
809
+ 0.22259521484375,
810
+ 0.24970708787441254,
811
+ 0.2161264270544052,
812
+ 0.2031947523355484,
813
+ 0.21564003825187683,
814
+ 0.20861132442951202,
815
+ 0.21454143524169922,
816
+ 0.24643942713737488,
817
+ 0.21691389381885529,
818
+ 0.22348442673683167,
819
+ 0.18823209404945374,
820
+ 0.2069559544324875,
821
+ 0.18679584562778473,
822
+ 0.21719010174274445,
823
+ 0.20488974452018738,
824
+ 0.2214232236146927,
825
+ 0.21512725949287415,
826
+ 0.19134248793125153,
827
+ 0.19260181486606598,
828
+ 0.18412649631500244,
829
+ 0.21456657350063324,
830
+ 0.2016887664794922,
831
+ 0.19858768582344055,
832
+ 0.19533206522464752,
833
+ 0.20168212056159973,
834
+ 0.16193492710590363,
835
+ 0.19368301331996918,
836
+ 0.2038613110780716,
837
+ 0.19840362668037415,
838
+ 0.19922426342964172,
839
+ 0.1515156775712967,
840
+ 0.18695905804634094,
841
+ 0.16931875050067902,
842
+ 0.166876882314682,
843
+ 0.2077115923166275,
844
+ 0.18261513113975525,
845
+ 0.19456270337104797,
846
+ 0.15236473083496094,
847
+ 0.16070771217346191,
848
+ 0.12959973514080048,
849
+ 0.15200302004814148,
850
+ 0.16590280830860138,
851
+ 0.16575734317302704,
852
+ 0.15350034832954407,
853
+ 0.1595541387796402,
854
+ 0.17597787082195282,
855
+ 0.20311801135540009,
856
+ 0.1688549518585205,
857
+ 0.1727948933839798,
858
+ 0.1690131574869156,
859
+ 0.15285637974739075,
860
+ 0.16618596017360687,
861
+ 0.19473372399806976,
862
+ 0.15762819349765778,
863
+ 0.1584198772907257,
864
+ 0.1480090171098709,
865
+ 0.16284768283367157,
866
+ 0.19359400868415833,
867
+ 0.1614084392786026,
868
+ 0.16409209370613098,
869
+ 0.17155098915100098,
870
+ 0.18065497279167175,
871
+ 0.14004693925380707,
872
+ 0.15952065587043762,
873
+ 0.20549999177455902,
874
+ 0.15970775485038757,
875
+ 0.13161496818065643,
876
+ 0.14953382313251495,
877
+ 0.14466509222984314,
878
+ 0.1497855931520462,
879
+ 0.13885840773582458,
880
+ 0.16562673449516296,
881
+ 0.13649068772792816,
882
+ 0.13283535838127136,
883
+ 0.13889345526695251,
884
+ 0.12941350042819977,
885
+ 0.1436983197927475,
886
+ 0.13811363279819489,
887
+ 0.1401999294757843,
888
+ 0.1643994301557541,
889
+ 0.12299828976392746,
890
+ 0.1573929339647293,
891
+ 0.15119539201259613,
892
+ 0.1654321849346161,
893
+ 0.1522522121667862,
894
+ 0.1256517618894577,
895
+ 0.12073888629674911,
896
+ 0.15730193257331848,
897
+ 0.130019873380661,
898
+ 0.14194072782993317,
899
+ 0.11307316273450851,
900
+ 0.13339151442050934,
901
+ 0.11858965456485748,
902
+ 0.15607216954231262,
903
+ 0.16128577291965485,
904
+ 0.13758909702301025,
905
+ 0.15931521356105804,
906
+ 0.14577162265777588,
907
+ 0.10462959855794907,
908
+ 0.12486211210489273,
909
+ 0.1258380115032196,
910
+ 0.12735985219478607,
911
+ 0.1331641972064972,
912
+ 0.10633667558431625,
913
+ 0.14881311357021332,
914
+ 0.13217094540596008,
915
+ 0.10351573675870895,
916
+ 0.13661159574985504,
917
+ 0.15756379067897797,
918
+ 0.13544346392154694,
919
+ 0.1127428486943245,
920
+ 0.1042342409491539,
921
+ 0.13166454434394836,
922
+ 0.1192726120352745,
923
+ 0.14546307921409607,
924
+ 0.1336200088262558,
925
+ 0.11115437000989914,
926
+ 0.11539566516876221,
927
+ 0.12923398613929749,
928
+ 0.11169678717851639,
929
+ 0.12668605148792267,
930
+ 0.10387875139713287,
931
+ 0.11678438633680344,
932
+ 0.1315682828426361,
933
+ 0.11594482511281967,
934
+ 0.12925221025943756,
935
+ 0.12967567145824432,
936
+ 0.14690859615802765,
937
+ 0.1365702897310257
938
+ ],
939
+ "info_loss": [
940
+ -0.13031387329101562,
941
+ -0.2066669464111328,
942
+ -0.2755417823791504,
943
+ -0.17154979705810547,
944
+ -0.24880743026733398,
945
+ -0.13640594482421875,
946
+ -0.026891708374023438,
947
+ -0.05095040798187256,
948
+ -0.049540162086486816,
949
+ -0.0891730785369873,
950
+ -0.045008301734924316,
951
+ -0.12970876693725586,
952
+ -0.14089536666870117,
953
+ -0.20433330535888672,
954
+ -0.19143426418304443,
955
+ -0.21313905715942383,
956
+ -0.2502744197845459,
957
+ -0.38831961154937744,
958
+ -0.49465155601501465,
959
+ -0.6518208980560303,
960
+ -0.8392997980117798,
961
+ -0.9978586435317993,
962
+ -1.17745840549469,
963
+ -1.1390786170959473,
964
+ -1.2744295597076416,
965
+ -1.211988925933838,
966
+ -1.3272581100463867,
967
+ -1.2952699661254883,
968
+ -1.3856745958328247,
969
+ -1.4671963453292847,
970
+ -1.4519892930984497,
971
+ -1.597023367881775,
972
+ -1.6061583757400513,
973
+ -1.5312066078186035,
974
+ -1.6143242120742798,
975
+ -1.4986706972122192,
976
+ -1.5996477603912354,
977
+ -1.6335408687591553,
978
+ -1.6122527122497559,
979
+ -1.570066213607788,
980
+ -1.579962968826294,
981
+ -1.6396890878677368,
982
+ -1.5841457843780518,
983
+ -1.575208306312561,
984
+ -1.5022691488265991,
985
+ -1.6440784931182861,
986
+ -1.5869543552398682,
987
+ -1.6497031450271606,
988
+ -1.5939735174179077,
989
+ -1.6334444284439087,
990
+ -1.6568560600280762,
991
+ -1.5998594760894775,
992
+ -1.581986665725708,
993
+ -1.5905956029891968,
994
+ -1.5907115936279297,
995
+ -1.5560940504074097,
996
+ -1.5234050750732422,
997
+ -1.5467263460159302,
998
+ -1.6563700437545776,
999
+ -1.6779274940490723,
1000
+ -1.5964152812957764,
1001
+ -1.6166232824325562,
1002
+ -1.5258904695510864,
1003
+ -1.6699669361114502,
1004
+ -1.6600831747055054,
1005
+ -1.5807301998138428,
1006
+ -1.5883736610412598,
1007
+ -1.5307484865188599,
1008
+ -1.5745688676834106,
1009
+ -1.5450665950775146,
1010
+ -1.5481033325195312,
1011
+ -1.547301173210144,
1012
+ -1.5675588846206665,
1013
+ -1.5962055921554565,
1014
+ -1.5689582824707031,
1015
+ -1.5564454793930054,
1016
+ -1.572546124458313,
1017
+ -1.5471404790878296,
1018
+ -1.5624316930770874,
1019
+ -1.6135194301605225,
1020
+ -1.6212087869644165,
1021
+ -1.496882438659668,
1022
+ -1.520615816116333,
1023
+ -1.5109580755233765,
1024
+ -1.5607216358184814,
1025
+ -1.5615829229354858,
1026
+ -1.550378680229187,
1027
+ -1.544190764427185,
1028
+ -1.4874019622802734,
1029
+ -1.4380072355270386,
1030
+ -1.480360984802246,
1031
+ -1.394813060760498,
1032
+ -1.453619360923767,
1033
+ -1.297343373298645,
1034
+ -1.0534307956695557,
1035
+ -1.005746603012085,
1036
+ -0.8305511474609375,
1037
+ -0.7186072468757629,
1038
+ -0.6269640326499939,
1039
+ -0.619566798210144,
1040
+ -0.5929027795791626,
1041
+ -0.5840208530426025,
1042
+ -0.5696229934692383,
1043
+ -0.5284737944602966,
1044
+ -0.5102920532226562,
1045
+ -0.4880736172199249,
1046
+ -0.5378124713897705,
1047
+ -0.48980799317359924,
1048
+ -0.49561572074890137,
1049
+ -0.48140832781791687,
1050
+ -0.46326401829719543,
1051
+ -0.4183923304080963,
1052
+ -0.46459925174713135,
1053
+ -0.44236481189727783,
1054
+ -0.42633071541786194,
1055
+ -0.41896840929985046,
1056
+ -0.40066781640052795,
1057
+ -0.39869606494903564,
1058
+ -0.39415228366851807,
1059
+ -0.45243293046951294,
1060
+ -0.4048759937286377,
1061
+ -0.4549127221107483,
1062
+ -0.34433242678642273,
1063
+ -0.32652151584625244,
1064
+ -0.4136870205402374,
1065
+ -0.3449402451515198,
1066
+ -0.39311540126800537,
1067
+ -0.3551430106163025,
1068
+ -0.33927783370018005,
1069
+ -0.3140522241592407,
1070
+ -0.32230740785598755,
1071
+ -0.338846892118454,
1072
+ -0.3474924564361572,
1073
+ -0.2882997691631317,
1074
+ -0.30800995230674744,
1075
+ -0.29021155834198,
1076
+ -0.2878582179546356,
1077
+ -0.24030187726020813,
1078
+ -0.2739948034286499,
1079
+ -0.2833787798881531,
1080
+ -0.3085416555404663,
1081
+ -0.27547958493232727,
1082
+ -0.3008471131324768,
1083
+ -0.2574741542339325,
1084
+ -0.2813914120197296,
1085
+ -0.26996612548828125,
1086
+ -0.27560850977897644,
1087
+ -0.2844357490539551,
1088
+ -0.32192084193229675,
1089
+ -0.29908621311187744,
1090
+ -0.31156912446022034,
1091
+ -0.24919772148132324,
1092
+ -0.3408443033695221,
1093
+ -0.2812892198562622,
1094
+ -0.22597096860408783,
1095
+ -0.3030546009540558,
1096
+ -0.2796410024166107,
1097
+ -0.2941798269748688,
1098
+ -0.275758296251297,
1099
+ -0.25148695707321167,
1100
+ -0.2745201885700226,
1101
+ -0.2549305260181427,
1102
+ -0.2942931354045868,
1103
+ -0.25231873989105225,
1104
+ -0.2267131805419922,
1105
+ -0.22994287312030792,
1106
+ -0.23979350924491882,
1107
+ -0.19787666201591492,
1108
+ -0.2359994351863861,
1109
+ -0.20195798575878143,
1110
+ -0.21586523950099945,
1111
+ -0.24478033185005188,
1112
+ -0.2553216218948364,
1113
+ -0.24894730746746063,
1114
+ -0.23246027529239655,
1115
+ -0.2087734043598175,
1116
+ -0.26657262444496155,
1117
+ -0.2449118047952652,
1118
+ -0.24412254989147186,
1119
+ -0.232756569981575,
1120
+ -0.18617703020572662,
1121
+ -0.22069711983203888,
1122
+ -0.24964895844459534,
1123
+ -0.21589621901512146,
1124
+ -0.2029203623533249,
1125
+ -0.20315486192703247,
1126
+ -0.2021145224571228,
1127
+ -0.2130969911813736,
1128
+ -0.24579359591007233,
1129
+ -0.21634463965892792,
1130
+ -0.2222777009010315,
1131
+ -0.1872347742319107,
1132
+ -0.2061428278684616,
1133
+ -0.18646681308746338,
1134
+ -0.2170478254556656,
1135
+ -0.2047279179096222,
1136
+ -0.2211330085992813,
1137
+ -0.21506346762180328,
1138
+ -0.18883828818798065,
1139
+ -0.19202345609664917,
1140
+ -0.18082721531391144,
1141
+ -0.2144140899181366,
1142
+ -0.20128116011619568,
1143
+ -0.1985008269548416,
1144
+ -0.19459839165210724,
1145
+ -0.20164254307746887,
1146
+ -0.16043563187122345,
1147
+ -0.1908424198627472,
1148
+ -0.20383040606975555,
1149
+ -0.19826574623584747,
1150
+ -0.19916637241840363,
1151
+ -0.1495133340358734,
1152
+ -0.18693779408931732,
1153
+ -0.1692177951335907,
1154
+ -0.16684888303279877,
1155
+ -0.20739074051380157,
1156
+ -0.1820777952671051,
1157
+ -0.18337459862232208,
1158
+ -0.15228356420993805,
1159
+ -0.16066615283489227,
1160
+ -0.12708906829357147,
1161
+ -0.1518956869840622,
1162
+ -0.16585469245910645,
1163
+ -0.16565538942813873,
1164
+ -0.15341567993164062,
1165
+ -0.159390389919281,
1166
+ -0.17527149617671967,
1167
+ -0.2030913531780243,
1168
+ -0.16879497468471527,
1169
+ -0.1726958453655243,
1170
+ -0.16900011897087097,
1171
+ -0.15276168286800385,
1172
+ -0.15299995243549347,
1173
+ -0.1930725872516632,
1174
+ -0.1576014757156372,
1175
+ -0.15811686217784882,
1176
+ -0.14795033633708954,
1177
+ -0.16282221674919128,
1178
+ -0.1934397965669632,
1179
+ -0.1610974222421646,
1180
+ -0.16405907273292542,
1181
+ -0.17148086428642273,
1182
+ -0.18048837780952454,
1183
+ -0.13926289975643158,
1184
+ -0.1594965010881424,
1185
+ -0.19997486472129822,
1186
+ -0.1596875786781311,
1187
+ -0.13160035014152527,
1188
+ -0.14948993921279907,
1189
+ -0.14455373585224152,
1190
+ -0.14896586537361145,
1191
+ -0.13855019211769104,
1192
+ -0.16561074554920197,
1193
+ -0.13647276163101196,
1194
+ -0.13281981647014618,
1195
+ -0.13887101411819458,
1196
+ -0.12921711802482605,
1197
+ -0.14366890490055084,
1198
+ -0.13803906738758087,
1199
+ -0.14018695056438446,
1200
+ -0.16434404253959656,
1201
+ -0.12230131030082703,
1202
+ -0.15738020837306976,
1203
+ -0.1511777937412262,
1204
+ -0.16526386141777039,
1205
+ -0.1522277593612671,
1206
+ -0.1256326287984848,
1207
+ -0.12071990221738815,
1208
+ -0.15727737545967102,
1209
+ -0.12999925017356873,
1210
+ -0.14192911982536316,
1211
+ -0.11304624378681183,
1212
+ -0.13336944580078125,
1213
+ -0.11857951432466507,
1214
+ -0.15606282651424408,
1215
+ -0.16127531230449677,
1216
+ -0.13757632672786713,
1217
+ -0.1592911183834076,
1218
+ -0.14575687050819397,
1219
+ -0.10454907268285751,
1220
+ -0.12483809143304825,
1221
+ -0.12575353682041168,
1222
+ -0.1273241937160492,
1223
+ -0.13314658403396606,
1224
+ -0.106038898229599,
1225
+ -0.1488012969493866,
1226
+ -0.13211604952812195,
1227
+ -0.10350042581558228,
1228
+ -0.1365896314382553,
1229
+ -0.15755146741867065,
1230
+ -0.13538393378257751,
1231
+ -0.11269137263298035,
1232
+ -0.1029544547200203,
1233
+ -0.13163983821868896,
1234
+ -0.11926034837961197,
1235
+ -0.14545533061027527,
1236
+ -0.13361108303070068,
1237
+ -0.11113712936639786,
1238
+ -0.11538238078355789,
1239
+ -0.1292199194431305,
1240
+ -0.11164633929729462,
1241
+ -0.12667834758758545,
1242
+ -0.10387279838323593,
1243
+ -0.11676009744405746,
1244
+ -0.13150247931480408,
1245
+ -0.1159355640411377,
1246
+ -0.1292443424463272,
1247
+ -0.12966513633728027,
1248
+ -0.14678968489170074,
1249
+ -0.13655707240104675
1250
+ ],
1251
+ "abs_loss": [
1252
+ 3.9078216552734375,
1253
+ 3.8666019439697266,
1254
+ 3.7847700119018555,
1255
+ 3.7433247566223145,
1256
+ 3.5915701389312744,
1257
+ 3.1314046382904053,
1258
+ 2.939772605895996,
1259
+ 2.8470466136932373,
1260
+ 2.801816940307617,
1261
+ 2.7607271671295166,
1262
+ 2.7303786277770996,
1263
+ 2.8693246841430664,
1264
+ 2.7541182041168213,
1265
+ 2.786644220352173,
1266
+ 2.819948196411133,
1267
+ 2.7823843955993652,
1268
+ 2.878891944885254,
1269
+ 2.85870099067688,
1270
+ 2.8717331886291504,
1271
+ 2.7764925956726074,
1272
+ 2.707761287689209,
1273
+ 2.735921859741211,
1274
+ 2.5215401649475098,
1275
+ 2.1574792861938477,
1276
+ 1.8795905113220215,
1277
+ 1.5430264472961426,
1278
+ 1.5506346225738525,
1279
+ 1.5533703565597534,
1280
+ 1.527092695236206,
1281
+ 1.2919174432754517,
1282
+ 1.4574626684188843,
1283
+ 1.4619550704956055,
1284
+ 1.3512728214263916,
1285
+ 1.2696706056594849,
1286
+ 1.2495325803756714,
1287
+ 1.2649794816970825,
1288
+ 1.1889044046401978,
1289
+ 1.3659778833389282,
1290
+ 1.4574460983276367,
1291
+ 1.2646446228027344,
1292
+ 1.1096229553222656,
1293
+ 1.1550531387329102,
1294
+ 1.2933039665222168,
1295
+ 0.9491195678710938,
1296
+ 1.0319973230361938,
1297
+ 0.7447066307067871,
1298
+ 0.9592666625976562,
1299
+ 1.0832123756408691,
1300
+ 0.9912242889404297,
1301
+ 0.8530040979385376,
1302
+ 0.8741682767868042,
1303
+ 0.7585433721542358,
1304
+ 0.9221714735031128,
1305
+ 0.6913226842880249,
1306
+ 0.8177131414413452,
1307
+ 0.8079922199249268,
1308
+ 0.691746711730957,
1309
+ 0.7857188582420349,
1310
+ 0.6209266185760498,
1311
+ 0.7075135707855225,
1312
+ 0.4876062870025635,
1313
+ 0.604632556438446,
1314
+ 0.6973446607589722,
1315
+ 0.6192052364349365,
1316
+ 0.6596052646636963,
1317
+ 0.44709309935569763,
1318
+ 0.6409910917282104,
1319
+ 0.6577365398406982,
1320
+ 0.6532579660415649,
1321
+ 0.5378486514091492,
1322
+ 0.572986364364624,
1323
+ 0.5970069169998169,
1324
+ 0.4469451308250427,
1325
+ 0.48649829626083374,
1326
+ 0.5458441972732544,
1327
+ 0.5435513257980347,
1328
+ 0.5201212167739868,
1329
+ 0.45395076274871826,
1330
+ 0.7439022660255432,
1331
+ 0.41333064436912537,
1332
+ 0.521793007850647,
1333
+ 0.5093913078308105,
1334
+ 0.5536577701568604,
1335
+ 0.5998554229736328,
1336
+ 0.48121434450149536,
1337
+ 0.4819636940956116,
1338
+ 0.403691828250885,
1339
+ 0.5651859641075134,
1340
+ 0.44529423117637634,
1341
+ 0.4128825068473816,
1342
+ 0.4012378752231598,
1343
+ 0.3511068820953369,
1344
+ 0.45841652154922485,
1345
+ 0.38696128129959106,
1346
+ 0.39995282888412476,
1347
+ 0.49512308835983276,
1348
+ 0.5003008842468262,
1349
+ 0.44825389981269836,
1350
+ 0.474168598651886,
1351
+ 0.40235957503318787,
1352
+ 0.4273836016654968,
1353
+ 0.3681586980819702,
1354
+ 0.43717366456985474,
1355
+ 0.3908582925796509,
1356
+ 0.41014623641967773,
1357
+ 0.520478367805481,
1358
+ 0.30796822905540466,
1359
+ 0.412836492061615,
1360
+ 0.5451231002807617,
1361
+ 0.3523538112640381,
1362
+ 0.4003564119338989,
1363
+ 0.4728928804397583,
1364
+ 0.432488352060318,
1365
+ 0.4737667441368103,
1366
+ 0.4488798975944519,
1367
+ 0.37335819005966187,
1368
+ 0.29797255992889404,
1369
+ 0.48575296998023987,
1370
+ 0.3987618684768677,
1371
+ 0.4103950262069702,
1372
+ 0.4353116452693939,
1373
+ 0.29200854897499084,
1374
+ 0.4710025191307068,
1375
+ 0.40061938762664795,
1376
+ 0.448482871055603,
1377
+ 0.2979411482810974,
1378
+ 0.3269108533859253,
1379
+ 0.42152369022369385,
1380
+ 0.3489609360694885,
1381
+ 0.4247787594795227,
1382
+ 0.2711609899997711,
1383
+ 0.36050915718078613,
1384
+ 0.47094184160232544,
1385
+ 0.3136920928955078,
1386
+ 0.42449045181274414,
1387
+ 0.35395294427871704,
1388
+ 0.3839690089225769,
1389
+ 0.24007722735404968,
1390
+ 0.35046425461769104,
1391
+ 0.37765806913375854,
1392
+ 0.3609406650066376,
1393
+ 0.32252731919288635,
1394
+ 0.3516649603843689,
1395
+ 0.2885376513004303,
1396
+ 0.39194509387016296,
1397
+ 0.32523733377456665,
1398
+ 0.41631102561950684,
1399
+ 0.3914733827114105,
1400
+ 0.30636662244796753,
1401
+ 0.3401767611503601,
1402
+ 0.3878169655799866,
1403
+ 0.24963311851024628,
1404
+ 0.42236530780792236,
1405
+ 0.39474695920944214,
1406
+ 0.400269091129303,
1407
+ 0.27627962827682495,
1408
+ 0.3362012207508087,
1409
+ 0.4149481952190399,
1410
+ 0.34324753284454346,
1411
+ 0.26619914174079895,
1412
+ 0.3912666440010071,
1413
+ 0.32785266637802124,
1414
+ 0.36352622509002686,
1415
+ 0.32938316464424133,
1416
+ 0.3147716522216797,
1417
+ 0.3593710958957672,
1418
+ 0.36116552352905273,
1419
+ 0.4445563852787018,
1420
+ 0.291462779045105,
1421
+ 0.3341894745826721,
1422
+ 0.2950514554977417,
1423
+ 0.47399190068244934,
1424
+ 0.28137409687042236,
1425
+ 0.3779450058937073,
1426
+ 0.3186456561088562,
1427
+ 0.2613189220428467,
1428
+ 0.29720720648765564,
1429
+ 0.3354172110557556,
1430
+ 0.36834996938705444,
1431
+ 0.28894710540771484,
1432
+ 0.40493836998939514,
1433
+ 0.3791912794113159,
1434
+ 0.2588992118835449,
1435
+ 0.3034725785255432,
1436
+ 0.2535718083381653,
1437
+ 0.27278196811676025,
1438
+ 0.28785043954849243,
1439
+ 0.3741530478000641,
1440
+ 0.3258816599845886,
1441
+ 0.2943769097328186,
1442
+ 0.2505449950695038,
1443
+ 0.3018356263637543,
1444
+ 0.3233311176300049,
1445
+ 0.2627747058868408,
1446
+ 0.3656883239746094,
1447
+ 0.27431416511535645,
1448
+ 0.319694459438324,
1449
+ 0.35664820671081543,
1450
+ 0.24510787427425385,
1451
+ 0.21204662322998047,
1452
+ 0.3086380660533905,
1453
+ 0.22820687294006348,
1454
+ 0.3071877360343933,
1455
+ 0.24265898764133453,
1456
+ 0.30144238471984863,
1457
+ 0.36596065759658813,
1458
+ 0.302855908870697,
1459
+ 0.3670097589492798,
1460
+ 0.286008358001709,
1461
+ 0.3439257740974426,
1462
+ 0.36988365650177,
1463
+ 0.23277288675308228,
1464
+ 0.22205711901187897,
1465
+ 0.31526389718055725,
1466
+ 0.3289754390716553,
1467
+ 0.2893524169921875,
1468
+ 0.2731555700302124,
1469
+ 0.30137956142425537,
1470
+ 0.3124421238899231,
1471
+ 0.3032505512237549,
1472
+ 0.28976911306381226,
1473
+ 0.3287695050239563,
1474
+ 0.3032025098800659,
1475
+ 0.30797237157821655,
1476
+ 0.25027644634246826,
1477
+ 0.37846702337265015,
1478
+ 0.2393101304769516,
1479
+ 0.36551088094711304,
1480
+ 0.29606664180755615,
1481
+ 0.2943345010280609,
1482
+ 0.3079445958137512,
1483
+ 0.3069365918636322,
1484
+ 0.18928225338459015,
1485
+ 0.31161224842071533,
1486
+ 0.26681971549987793,
1487
+ 0.34095317125320435,
1488
+ 0.2580564320087433,
1489
+ 0.37255945801734924,
1490
+ 0.2797882556915283,
1491
+ 0.2936325669288635,
1492
+ 0.21242846548557281,
1493
+ 0.37606096267700195,
1494
+ 0.32313060760498047,
1495
+ 0.28985854983329773,
1496
+ 0.30060988664627075,
1497
+ 0.26349306106567383,
1498
+ 0.23728032410144806,
1499
+ 0.24237170815467834,
1500
+ 0.3466225862503052,
1501
+ 0.262248158454895,
1502
+ 0.3313555121421814,
1503
+ 0.24145424365997314,
1504
+ 0.2583176791667938,
1505
+ 0.35590845346450806,
1506
+ 0.22335973381996155,
1507
+ 0.44185110926628113,
1508
+ 0.27968838810920715,
1509
+ 0.3198820650577545,
1510
+ 0.28301069140434265,
1511
+ 0.2559143304824829,
1512
+ 0.2832440733909607,
1513
+ 0.3193395137786865,
1514
+ 0.27422747015953064,
1515
+ 0.2709762454032898,
1516
+ 0.21882885694503784,
1517
+ 0.22499187290668488,
1518
+ 0.24804788827896118,
1519
+ 0.2699471414089203,
1520
+ 0.28384077548980713,
1521
+ 0.2389158308506012,
1522
+ 0.2748531699180603,
1523
+ 0.2611979842185974,
1524
+ 0.26433876156806946,
1525
+ 0.26748785376548767,
1526
+ 0.27537328004837036,
1527
+ 0.3269525170326233,
1528
+ 0.2332027107477188,
1529
+ 0.3006930649280548,
1530
+ 0.23841100931167603,
1531
+ 0.2991859018802643,
1532
+ 0.29406994581222534,
1533
+ 0.2334449291229248,
1534
+ 0.2323375940322876,
1535
+ 0.2632378339767456,
1536
+ 0.2660562992095947,
1537
+ 0.2756766676902771,
1538
+ 0.2961580157279968,
1539
+ 0.2223338484764099,
1540
+ 0.2187422513961792,
1541
+ 0.21723613142967224,
1542
+ 0.24943313002586365,
1543
+ 0.2962314784526825,
1544
+ 0.2896310091018677,
1545
+ 0.24327483773231506,
1546
+ 0.2072056531906128,
1547
+ 0.337163507938385,
1548
+ 0.20089191198349,
1549
+ 0.3238508403301239,
1550
+ 0.29043346643447876,
1551
+ 0.3112029433250427,
1552
+ 0.2868446111679077,
1553
+ 0.20166978240013123,
1554
+ 0.2161874771118164,
1555
+ 0.23737166821956635,
1556
+ 0.2567029893398285,
1557
+ 0.22636567056179047,
1558
+ 0.333919882774353,
1559
+ 0.19082900881767273,
1560
+ 0.38755038380622864,
1561
+ 0.3178732097148895
1562
+ ],
1563
+ "zipf_loss": [
1564
+ 6.214385986328125,
1565
+ 5.32406759262085,
1566
+ 3.8564059734344482,
1567
+ 2.591114044189453,
1568
+ 1.678013563156128,
1569
+ 0.9652321934700012,
1570
+ 0.7548532485961914,
1571
+ 0.6970594525337219,
1572
+ 0.6748520731925964,
1573
+ 0.6706048250198364,
1574
+ 0.6670247912406921,
1575
+ 0.6622569561004639,
1576
+ 0.6650763750076294,
1577
+ 0.6605280041694641,
1578
+ 0.6593071222305298,
1579
+ 0.6569610834121704,
1580
+ 0.6500630378723145,
1581
+ 0.638371467590332,
1582
+ 0.6125134229660034,
1583
+ 0.5606845617294312,
1584
+ 0.47275885939598083,
1585
+ 0.3939410448074341,
1586
+ 0.3301907777786255,
1587
+ 0.27769359946250916,
1588
+ 0.2355114072561264,
1589
+ 0.20369206368923187,
1590
+ 0.18187572062015533,
1591
+ 0.15243616700172424,
1592
+ 0.1459963172674179,
1593
+ 0.14110854268074036,
1594
+ 0.1170307844877243,
1595
+ 0.10252369940280914,
1596
+ 0.10441293567419052,
1597
+ 0.08894531428813934,
1598
+ 0.0866827666759491,
1599
+ 0.08549686521291733,
1600
+ 0.08724188059568405,
1601
+ 0.06438370048999786,
1602
+ 0.06062450259923935,
1603
+ 0.06441779434680939,
1604
+ 0.07857652753591537,
1605
+ 0.05759456753730774,
1606
+ 0.04951252043247223,
1607
+ 0.05172610282897949,
1608
+ 0.04771823436021805,
1609
+ 0.07495627552270889,
1610
+ 0.04642573744058609,
1611
+ 0.036667607724666595,
1612
+ 0.026056334376335144,
1613
+ 0.05013240873813629,
1614
+ 0.0409291610121727,
1615
+ 0.04583451896905899,
1616
+ 0.03423535078763962,
1617
+ 0.05251985043287277,
1618
+ 0.025593411177396774,
1619
+ 0.032919563353061676,
1620
+ 0.06404099613428116,
1621
+ 0.02535686269402504,
1622
+ 0.04919612035155296,
1623
+ 0.04377426952123642,
1624
+ 0.04735066741704941,
1625
+ 0.029137253761291504,
1626
+ 0.03444506227970123,
1627
+ 0.043033648282289505,
1628
+ 0.03818806633353233,
1629
+ 0.07439252734184265,
1630
+ 0.025692259892821312,
1631
+ 0.04908574000000954,
1632
+ 0.021144278347492218,
1633
+ 0.04480339586734772,
1634
+ 0.03820859268307686,
1635
+ 0.029622916132211685,
1636
+ 0.03884103149175644,
1637
+ 0.04795222356915474,
1638
+ 0.03130391985177994,
1639
+ 0.037689074873924255,
1640
+ 0.03915674239397049,
1641
+ 0.04864725470542908,
1642
+ 0.023318255320191383,
1643
+ 0.06474263966083527,
1644
+ 0.01918068714439869,
1645
+ 0.033503539860248566,
1646
+ 0.028110641986131668,
1647
+ 0.03919079899787903,
1648
+ 0.03313414752483368,
1649
+ 0.034248415380716324,
1650
+ 0.04662713035941124,
1651
+ 0.0233431588858366,
1652
+ 0.05150822177529335,
1653
+ 0.03570423647761345,
1654
+ 0.04821627587080002,
1655
+ 0.03822769969701767,
1656
+ 0.03229536488652229,
1657
+ 0.029855959117412567,
1658
+ 0.05989418923854828,
1659
+ 0.02627028524875641,
1660
+ 0.039387792348861694,
1661
+ 0.024894418194890022,
1662
+ 0.042639803141355515,
1663
+ 0.040886059403419495,
1664
+ 0.023547116667032242,
1665
+ 0.05845678225159645,
1666
+ 0.03519462049007416,
1667
+ 0.040836598724126816,
1668
+ 0.04543702304363251,
1669
+ 0.030301017686724663,
1670
+ 0.04703367501497269,
1671
+ 0.040298864245414734,
1672
+ 0.02901679463684559,
1673
+ 0.04989728331565857,
1674
+ 0.030909691005945206,
1675
+ 0.03467531502246857,
1676
+ 0.0575178861618042,
1677
+ 0.024219483137130737,
1678
+ 0.048169784247875214,
1679
+ 0.03718308359384537,
1680
+ 0.04558166116476059,
1681
+ 0.036529719829559326,
1682
+ 0.05272334814071655,
1683
+ 0.051703374832868576,
1684
+ 0.023128744214773178,
1685
+ 0.0390365906059742,
1686
+ 0.025119362398982048,
1687
+ 0.033760469406843185,
1688
+ 0.03943914920091629,
1689
+ 0.02518836222589016,
1690
+ 0.041928377002477646,
1691
+ 0.032821983098983765,
1692
+ 0.047079045325517654,
1693
+ 0.03880929946899414,
1694
+ 0.07837331295013428,
1695
+ 0.06900592893362045,
1696
+ 0.021914267912507057,
1697
+ 0.06905221939086914,
1698
+ 0.03859081119298935,
1699
+ 0.034328341484069824,
1700
+ 0.03641020506620407,
1701
+ 0.04880528897047043,
1702
+ 0.025715112686157227,
1703
+ 0.04599444568157196,
1704
+ 0.03589567169547081,
1705
+ 0.04086793214082718,
1706
+ 0.038665153086185455,
1707
+ 0.04293541610240936,
1708
+ 0.03109125979244709,
1709
+ 0.02953575924038887,
1710
+ 0.030412163585424423,
1711
+ 0.022824294865131378,
1712
+ 0.04427170008420944,
1713
+ 0.027320725843310356,
1714
+ 0.03586902096867561,
1715
+ 0.041371818631887436,
1716
+ 0.029418550431728363,
1717
+ 0.03638826310634613,
1718
+ 0.023318560793995857,
1719
+ 0.03584618121385574,
1720
+ 0.027870723977684975,
1721
+ 0.03721432760357857,
1722
+ 0.03384622931480408,
1723
+ 0.04059351608157158,
1724
+ 0.04626419022679329,
1725
+ 0.048437267541885376,
1726
+ 0.03008340299129486,
1727
+ 0.04164348542690277,
1728
+ 0.03860174119472504,
1729
+ 0.036262135952711105,
1730
+ 0.032387636601924896,
1731
+ 0.030851230025291443,
1732
+ 0.046381473541259766,
1733
+ 0.04226874187588692,
1734
+ 0.04564111679792404,
1735
+ 0.03329605609178543,
1736
+ 0.04047981649637222,
1737
+ 0.05051535367965698,
1738
+ 0.04915095865726471,
1739
+ 0.06175360083580017,
1740
+ 0.03405715897679329,
1741
+ 0.03112226165831089,
1742
+ 0.03570321202278137,
1743
+ 0.036306604743003845,
1744
+ 0.042785484343767166,
1745
+ 0.05860166251659393,
1746
+ 0.036662742495536804,
1747
+ 0.03133822977542877,
1748
+ 0.032889679074287415,
1749
+ 0.041448868811130524,
1750
+ 0.03754384070634842,
1751
+ 0.025321388617157936,
1752
+ 0.04106614738702774,
1753
+ 0.042094629257917404,
1754
+ 0.02994142472743988,
1755
+ 0.040650829672813416,
1756
+ 0.04912589117884636,
1757
+ 0.0466143824160099,
1758
+ 0.018994512036442757,
1759
+ 0.04477697238326073,
1760
+ 0.03967338800430298,
1761
+ 0.04042107239365578,
1762
+ 0.04511641338467598,
1763
+ 0.03788059949874878,
1764
+ 0.0339040532708168,
1765
+ 0.05358113348484039,
1766
+ 0.039365921169519424,
1767
+ 0.040658168494701385,
1768
+ 0.033191531896591187,
1769
+ 0.04272434860467911,
1770
+ 0.04427221789956093,
1771
+ 0.032284997403621674,
1772
+ 0.0320112444460392,
1773
+ 0.0317109152674675,
1774
+ 0.0219123512506485,
1775
+ 0.03572501614689827,
1776
+ 0.04149950295686722,
1777
+ 0.026315785944461823,
1778
+ 0.029461124911904335,
1779
+ 0.03276225924491882,
1780
+ 0.03634945675730705,
1781
+ 0.04694950208067894,
1782
+ 0.027414850890636444,
1783
+ 0.04511871933937073,
1784
+ 0.03933146595954895,
1785
+ 0.022199109196662903,
1786
+ 0.04522397369146347,
1787
+ 0.04988035932183266,
1788
+ 0.03986883535981178,
1789
+ 0.027377299964427948,
1790
+ 0.0485374853014946,
1791
+ 0.029108263552188873,
1792
+ 0.045480526983737946,
1793
+ 0.04379906505346298,
1794
+ 0.04158465191721916,
1795
+ 0.03347010537981987,
1796
+ 0.05786935240030289,
1797
+ 0.030902042984962463,
1798
+ 0.05246037244796753,
1799
+ 0.023706108331680298,
1800
+ 0.03297300636768341,
1801
+ 0.018689725548028946,
1802
+ 0.03635568171739578,
1803
+ 0.03089042566716671,
1804
+ 0.031184107065200806,
1805
+ 0.042127594351768494,
1806
+ 0.03529534116387367,
1807
+ 0.030737370252609253,
1808
+ 0.03754604235291481,
1809
+ 0.038880299776792526,
1810
+ 0.04201637953519821,
1811
+ 0.041827209293842316,
1812
+ 0.04619868844747543,
1813
+ 0.03908207267522812,
1814
+ 0.03142523765563965,
1815
+ 0.030792005360126495,
1816
+ 0.03378566727042198,
1817
+ 0.049424830824136734,
1818
+ 0.041156038641929626,
1819
+ 0.026997443288564682,
1820
+ 0.033892180770635605,
1821
+ 0.03472912311553955,
1822
+ 0.03802477568387985,
1823
+ 0.03408318758010864,
1824
+ 0.04988682270050049,
1825
+ 0.03437255322933197,
1826
+ 0.042876578867435455,
1827
+ 0.03642142564058304,
1828
+ 0.0354897603392601,
1829
+ 0.04654018580913544,
1830
+ 0.04677622392773628,
1831
+ 0.02892228029668331,
1832
+ 0.02971148118376732,
1833
+ 0.03662301227450371,
1834
+ 0.035557832568883896,
1835
+ 0.03263894468545914,
1836
+ 0.03535591810941696,
1837
+ 0.03206000477075577,
1838
+ 0.039088472723960876,
1839
+ 0.04656688868999481,
1840
+ 0.029480742290616035,
1841
+ 0.03160722553730011,
1842
+ 0.029878996312618256,
1843
+ 0.05102085694670677,
1844
+ 0.03197754546999931,
1845
+ 0.049584321677684784,
1846
+ 0.024539010599255562,
1847
+ 0.04111644625663757,
1848
+ 0.05899637192487717,
1849
+ 0.04360661655664444,
1850
+ 0.0335746705532074,
1851
+ 0.03327043727040291,
1852
+ 0.039872907102108,
1853
+ 0.05051466077566147,
1854
+ 0.04201159626245499,
1855
+ 0.027585603296756744,
1856
+ 0.04204836115241051,
1857
+ 0.0354074202477932,
1858
+ 0.03207923471927643,
1859
+ 0.036436282098293304,
1860
+ 0.032444484531879425,
1861
+ 0.03179655596613884,
1862
+ 0.03906530886888504,
1863
+ 0.03402011841535568,
1864
+ 0.034619688987731934,
1865
+ 0.0457422100007534,
1866
+ 0.05891440436244011,
1867
+ 0.03337816148996353,
1868
+ 0.03394727408885956,
1869
+ 0.05224776268005371,
1870
+ 0.040842294692993164,
1871
+ 0.0475529283285141,
1872
+ 0.033021535724401474,
1873
+ 0.047591038048267365
1874
+ ],
1875
+ "denoise_loss": [],
1876
+ "ortho_loss": [
1877
+ 0.8366642594337463,
1878
+ 0.6618494391441345,
1879
+ 0.4207803010940552,
1880
+ 0.2298196405172348,
1881
+ 0.14970402419567108,
1882
+ 0.1140080913901329,
1883
+ 0.10427522659301758,
1884
+ 0.0827057734131813,
1885
+ 0.06960917264223099,
1886
+ 0.05503741651773453,
1887
+ 0.05058750510215759,
1888
+ 0.05038199946284294,
1889
+ 0.05585004389286041,
1890
+ 0.06042852997779846,
1891
+ 0.06079588457942009,
1892
+ 0.0625748559832573,
1893
+ 0.06289029866456985,
1894
+ 0.0685804933309555,
1895
+ 0.07292303442955017,
1896
+ 0.07979366183280945,
1897
+ 0.08727797120809555,
1898
+ 0.0949409008026123,
1899
+ 0.10431933403015137,
1900
+ 0.11506061255931854,
1901
+ 0.12235318869352341,
1902
+ 0.12447769939899445,
1903
+ 0.1303531378507614,
1904
+ 0.13381065428256989,
1905
+ 0.13906820118427277,
1906
+ 0.1462385207414627,
1907
+ 0.1518447995185852,
1908
+ 0.1605212688446045,
1909
+ 0.16572725772857666,
1910
+ 0.17025168240070343,
1911
+ 0.17526577413082123,
1912
+ 0.17968608438968658,
1913
+ 0.18079596757888794,
1914
+ 0.18310832977294922,
1915
+ 0.18538832664489746,
1916
+ 0.18738751113414764,
1917
+ 0.1883198767900467,
1918
+ 0.19103409349918365,
1919
+ 0.19147978723049164,
1920
+ 0.19242602586746216,
1921
+ 0.19312480092048645,
1922
+ 0.1932714581489563,
1923
+ 0.19615623354911804,
1924
+ 0.19566021859645844,
1925
+ 0.19523394107818604,
1926
+ 0.1961299479007721,
1927
+ 0.1973007321357727,
1928
+ 0.1989651769399643,
1929
+ 0.19842150807380676,
1930
+ 0.1993802934885025,
1931
+ 0.19886934757232666,
1932
+ 0.198268860578537,
1933
+ 0.19719672203063965,
1934
+ 0.19572870433330536,
1935
+ 0.1973220258951187,
1936
+ 0.20049990713596344,
1937
+ 0.20039710402488708,
1938
+ 0.2033097892999649,
1939
+ 0.2010970264673233,
1940
+ 0.20181842148303986,
1941
+ 0.20380006730556488,
1942
+ 0.2043500393629074,
1943
+ 0.2046346813440323,
1944
+ 0.20441186428070068,
1945
+ 0.20420598983764648,
1946
+ 0.2034817487001419,
1947
+ 0.20542271435260773,
1948
+ 0.20938640832901,
1949
+ 0.21274727582931519,
1950
+ 0.21205349266529083,
1951
+ 0.21244817972183228,
1952
+ 0.21338209509849548,
1953
+ 0.21705076098442078,
1954
+ 0.2178974449634552,
1955
+ 0.21980583667755127,
1956
+ 0.2239789366722107,
1957
+ 0.22352708876132965,
1958
+ 0.22076594829559326,
1959
+ 0.22033487260341644,
1960
+ 0.22331355512142181,
1961
+ 0.22360210120677948,
1962
+ 0.2238202840089798,
1963
+ 0.2251146286725998,
1964
+ 0.22160764038562775,
1965
+ 0.21952784061431885,
1966
+ 0.22078844904899597,
1967
+ 0.22575822472572327,
1968
+ 0.22670726478099823,
1969
+ 0.22682377696037292,
1970
+ 0.2287573516368866,
1971
+ 0.2323237657546997,
1972
+ 0.2338673323392868,
1973
+ 0.23920448124408722,
1974
+ 0.24087820947170258,
1975
+ 0.24260224401950836,
1976
+ 0.24455730617046356,
1977
+ 0.2473645806312561,
1978
+ 0.251116007566452,
1979
+ 0.2551710903644562,
1980
+ 0.25852328538894653,
1981
+ 0.26045820116996765,
1982
+ 0.2623943090438843,
1983
+ 0.2626422345638275,
1984
+ 0.2616928517818451,
1985
+ 0.26257553696632385,
1986
+ 0.2634384036064148,
1987
+ 0.26375117897987366,
1988
+ 0.26420125365257263,
1989
+ 0.2640562653541565,
1990
+ 0.2633400559425354,
1991
+ 0.2652282118797302,
1992
+ 0.26459839940071106,
1993
+ 0.26582202315330505,
1994
+ 0.2638816237449646,
1995
+ 0.2658769488334656,
1996
+ 0.2657202482223511,
1997
+ 0.2675725817680359,
1998
+ 0.26992014050483704,
1999
+ 0.26918625831604004,
2000
+ 0.27417024970054626,
2001
+ 0.27616775035858154,
2002
+ 0.2779380679130554,
2003
+ 0.2797730267047882,
2004
+ 0.27854591608047485,
2005
+ 0.27968814969062805,
2006
+ 0.2813499867916107,
2007
+ 0.2842121124267578,
2008
+ 0.2838771343231201,
2009
+ 0.28416967391967773,
2010
+ 0.28685376048088074,
2011
+ 0.2878960967063904,
2012
+ 0.2890807092189789,
2013
+ 0.28659626841545105,
2014
+ 0.287469744682312,
2015
+ 0.28806453943252563,
2016
+ 0.28970998525619507,
2017
+ 0.2926311194896698,
2018
+ 0.29450523853302,
2019
+ 0.2961150109767914,
2020
+ 0.2974989116191864,
2021
+ 0.2956659495830536,
2022
+ 0.29489144682884216,
2023
+ 0.2940598726272583,
2024
+ 0.29574665427207947,
2025
+ 0.296213835477829,
2026
+ 0.29641327261924744,
2027
+ 0.2989657521247864,
2028
+ 0.2979440987110138,
2029
+ 0.3012530505657196,
2030
+ 0.30332884192466736,
2031
+ 0.30361616611480713,
2032
+ 0.3021412789821625,
2033
+ 0.30142006278038025,
2034
+ 0.30223923921585083,
2035
+ 0.3061709403991699,
2036
+ 0.30908504128456116,
2037
+ 0.30920276045799255,
2038
+ 0.3092802166938782,
2039
+ 0.31009936332702637,
2040
+ 0.311633437871933,
2041
+ 0.3131062090396881,
2042
+ 0.31248563528060913,
2043
+ 0.31225261092185974,
2044
+ 0.31379827857017517,
2045
+ 0.3157505393028259,
2046
+ 0.31856241822242737,
2047
+ 0.3162039518356323,
2048
+ 0.3176734745502472,
2049
+ 0.3194302022457123,
2050
+ 0.3206985592842102,
2051
+ 0.3208954930305481,
2052
+ 0.3191499412059784,
2053
+ 0.3219895362854004,
2054
+ 0.32294604182243347,
2055
+ 0.32299721240997314,
2056
+ 0.32279571890830994,
2057
+ 0.3272733986377716,
2058
+ 0.32830968499183655,
2059
+ 0.3312630355358124,
2060
+ 0.33160510659217834,
2061
+ 0.3297317326068878,
2062
+ 0.3290911614894867,
2063
+ 0.32943281531333923,
2064
+ 0.33006271719932556,
2065
+ 0.33111897110939026,
2066
+ 0.3323107659816742,
2067
+ 0.3330026865005493,
2068
+ 0.33500078320503235,
2069
+ 0.33705705404281616,
2070
+ 0.3376968204975128,
2071
+ 0.3371988534927368,
2072
+ 0.33931219577789307,
2073
+ 0.33796313405036926,
2074
+ 0.339562326669693,
2075
+ 0.34457653760910034,
2076
+ 0.3443189561367035,
2077
+ 0.34598836302757263,
2078
+ 0.3451504707336426,
2079
+ 0.34450599551200867,
2080
+ 0.3459540009498596,
2081
+ 0.34577634930610657,
2082
+ 0.3469638228416443,
2083
+ 0.34592297673225403,
2084
+ 0.3467676639556885,
2085
+ 0.34918463230133057,
2086
+ 0.3507835865020752,
2087
+ 0.35098275542259216,
2088
+ 0.3524107038974762,
2089
+ 0.3526849150657654,
2090
+ 0.3539811074733734,
2091
+ 0.3557855486869812,
2092
+ 0.3547760546207428,
2093
+ 0.35506218671798706,
2094
+ 0.35701730847358704,
2095
+ 0.35708531737327576,
2096
+ 0.3578985035419464,
2097
+ 0.35822007060050964,
2098
+ 0.3598053455352783,
2099
+ 0.3599563539028168,
2100
+ 0.35986557602882385,
2101
+ 0.3597034513950348,
2102
+ 0.360770046710968,
2103
+ 0.36094164848327637,
2104
+ 0.3624958395957947,
2105
+ 0.3637600243091583,
2106
+ 0.3650926351547241,
2107
+ 0.3679355978965759,
2108
+ 0.36923104524612427,
2109
+ 0.37015196681022644,
2110
+ 0.3716208040714264,
2111
+ 0.37223806977272034,
2112
+ 0.3734593093395233,
2113
+ 0.3734816312789917,
2114
+ 0.3747451603412628,
2115
+ 0.37534624338150024,
2116
+ 0.37503674626350403,
2117
+ 0.3756308853626251,
2118
+ 0.3763791024684906,
2119
+ 0.3763023316860199,
2120
+ 0.3765925467014313,
2121
+ 0.374718576669693,
2122
+ 0.37464314699172974,
2123
+ 0.3744320869445801,
2124
+ 0.3761724829673767,
2125
+ 0.377485066652298,
2126
+ 0.37841469049453735,
2127
+ 0.3784253001213074,
2128
+ 0.37860018014907837,
2129
+ 0.3785088360309601,
2130
+ 0.3798028826713562,
2131
+ 0.3795837163925171,
2132
+ 0.3801801800727844,
2133
+ 0.38101083040237427,
2134
+ 0.3811332583427429,
2135
+ 0.38183483481407166,
2136
+ 0.38436123728752136,
2137
+ 0.3843342363834381,
2138
+ 0.3858630657196045,
2139
+ 0.3854551613330841,
2140
+ 0.38591232895851135,
2141
+ 0.3870542347431183,
2142
+ 0.387127161026001,
2143
+ 0.3882277309894562,
2144
+ 0.3888079524040222,
2145
+ 0.38914212584495544,
2146
+ 0.3892621397972107,
2147
+ 0.38910847902297974,
2148
+ 0.38890260457992554,
2149
+ 0.38967669010162354,
2150
+ 0.3896617293357849,
2151
+ 0.39047491550445557,
2152
+ 0.3920934200286865,
2153
+ 0.3925377428531647,
2154
+ 0.3925579786300659,
2155
+ 0.39288005232810974,
2156
+ 0.39340248703956604,
2157
+ 0.39419203996658325,
2158
+ 0.3946855962276459,
2159
+ 0.3945488929748535,
2160
+ 0.3940354585647583,
2161
+ 0.39542973041534424,
2162
+ 0.39583808183670044,
2163
+ 0.3957192599773407,
2164
+ 0.3959352970123291,
2165
+ 0.39639943838119507,
2166
+ 0.39707598090171814,
2167
+ 0.3968469500541687,
2168
+ 0.39755985140800476,
2169
+ 0.3978676199913025,
2170
+ 0.39900830388069153,
2171
+ 0.3994162678718567,
2172
+ 0.3995503783226013,
2173
+ 0.40007805824279785,
2174
+ 0.4004404842853546,
2175
+ 0.4010798931121826,
2176
+ 0.40130743384361267,
2177
+ 0.40163904428482056,
2178
+ 0.4020545184612274,
2179
+ 0.4020858407020569,
2180
+ 0.4020998477935791,
2181
+ 0.40228092670440674,
2182
+ 0.40249043703079224,
2183
+ 0.4024031460285187,
2184
+ 0.4025253653526306,
2185
+ 0.40290385484695435,
2186
+ 0.4028412997722626
2187
+ ],
2188
+ "lr": [
2189
+ 4.188034188034189e-06,
2190
+ 8.461538461538462e-06,
2191
+ 1.2735042735042738e-05,
2192
+ 1.700854700854701e-05,
2193
+ 2.1282051282051282e-05,
2194
+ 2.5555555555555557e-05,
2195
+ 2.9829059829059833e-05,
2196
+ 3.4102564102564105e-05,
2197
+ 3.837606837606838e-05,
2198
+ 4e-05,
2199
+ 4e-05,
2200
+ 4e-05,
2201
+ 4e-05,
2202
+ 4e-05,
2203
+ 4e-05,
2204
+ 4e-05,
2205
+ 4e-05,
2206
+ 4e-05,
2207
+ 4e-05,
2208
+ 4e-05,
2209
+ 4e-05,
2210
+ 4e-05,
2211
+ 4e-05,
2212
+ 4e-05,
2213
+ 4e-05,
2214
+ 4e-05,
2215
+ 4e-05,
2216
+ 4e-05,
2217
+ 4e-05,
2218
+ 4e-05,
2219
+ 4e-05,
2220
+ 4e-05,
2221
+ 4e-05,
2222
+ 4e-05,
2223
+ 4e-05,
2224
+ 4e-05,
2225
+ 4e-05,
2226
+ 4e-05,
2227
+ 4e-05,
2228
+ 4e-05,
2229
+ 4e-05,
2230
+ 4e-05,
2231
+ 4e-05,
2232
+ 4e-05,
2233
+ 4e-05,
2234
+ 4e-05,
2235
+ 4e-05,
2236
+ 4e-05,
2237
+ 4e-05,
2238
+ 4e-05,
2239
+ 4e-05,
2240
+ 4e-05,
2241
+ 4e-05,
2242
+ 4e-05,
2243
+ 4e-05,
2244
+ 4e-05,
2245
+ 4e-05,
2246
+ 4e-05,
2247
+ 4e-05,
2248
+ 4e-05,
2249
+ 4e-05,
2250
+ 4e-05,
2251
+ 4e-05,
2252
+ 4e-05,
2253
+ 4e-05,
2254
+ 4e-05,
2255
+ 4e-05,
2256
+ 4e-05,
2257
+ 4e-05,
2258
+ 4e-05,
2259
+ 4e-05,
2260
+ 4e-05,
2261
+ 4e-05,
2262
+ 4e-05,
2263
+ 4e-05,
2264
+ 4e-05,
2265
+ 4e-05,
2266
+ 4e-05,
2267
+ 4e-05,
2268
+ 4e-05,
2269
+ 4e-05,
2270
+ 4e-05,
2271
+ 4e-05,
2272
+ 4e-05,
2273
+ 4e-05,
2274
+ 4e-05,
2275
+ 4e-05,
2276
+ 4e-05,
2277
+ 4e-05,
2278
+ 4e-05,
2279
+ 4e-05,
2280
+ 4e-05,
2281
+ 4e-05,
2282
+ 4e-05,
2283
+ 4e-05,
2284
+ 4e-05,
2285
+ 4e-05,
2286
+ 4e-05,
2287
+ 4e-05,
2288
+ 4e-05,
2289
+ 4e-05,
2290
+ 4e-05,
2291
+ 4e-05,
2292
+ 4e-05,
2293
+ 4e-05,
2294
+ 4e-05,
2295
+ 4e-05,
2296
+ 4e-05,
2297
+ 4e-05,
2298
+ 4e-05,
2299
+ 4e-05,
2300
+ 4e-05,
2301
+ 4e-05,
2302
+ 4e-05,
2303
+ 4e-05,
2304
+ 4e-05,
2305
+ 4e-05,
2306
+ 4e-05,
2307
+ 4e-05,
2308
+ 4e-05,
2309
+ 4e-05,
2310
+ 4e-05,
2311
+ 4e-05,
2312
+ 4e-05,
2313
+ 4e-05,
2314
+ 4e-05,
2315
+ 4e-05,
2316
+ 4e-05,
2317
+ 4e-05,
2318
+ 4e-05,
2319
+ 4e-05,
2320
+ 4e-05,
2321
+ 4e-05,
2322
+ 4e-05,
2323
+ 4e-05,
2324
+ 4e-05,
2325
+ 4e-05,
2326
+ 4e-05,
2327
+ 4e-05,
2328
+ 4e-05,
2329
+ 4e-05,
2330
+ 4e-05,
2331
+ 4e-05,
2332
+ 4e-05,
2333
+ 4e-05,
2334
+ 4e-05,
2335
+ 4e-05,
2336
+ 4e-05,
2337
+ 4e-05,
2338
+ 4e-05,
2339
+ 4e-05,
2340
+ 4e-05,
2341
+ 4e-05,
2342
+ 4e-05,
2343
+ 4e-05,
2344
+ 4e-05,
2345
+ 4e-05,
2346
+ 4e-05,
2347
+ 4e-05,
2348
+ 4e-05,
2349
+ 4e-05,
2350
+ 4e-05,
2351
+ 4e-05,
2352
+ 4e-05,
2353
+ 4e-05,
2354
+ 4e-05,
2355
+ 4e-05,
2356
+ 4e-05,
2357
+ 4e-05,
2358
+ 4e-05,
2359
+ 4e-05,
2360
+ 4e-05,
2361
+ 4e-05,
2362
+ 4e-05,
2363
+ 4e-05,
2364
+ 4e-05,
2365
+ 4e-05,
2366
+ 4e-05,
2367
+ 4e-05,
2368
+ 4e-05,
2369
+ 4e-05,
2370
+ 4e-05,
2371
+ 4e-05,
2372
+ 4e-05,
2373
+ 4e-05,
2374
+ 4e-05,
2375
+ 4e-05,
2376
+ 4e-05,
2377
+ 4e-05,
2378
+ 3.992995647012267e-05,
2379
+ 3.963316185199842e-05,
2380
+ 3.933636723387416e-05,
2381
+ 3.90395726157499e-05,
2382
+ 3.874277799762565e-05,
2383
+ 3.844598337950139e-05,
2384
+ 3.814918876137713e-05,
2385
+ 3.785239414325287e-05,
2386
+ 3.7555599525128613e-05,
2387
+ 3.725880490700435e-05,
2388
+ 3.696201028888009e-05,
2389
+ 3.666521567075585e-05,
2390
+ 3.6368421052631585e-05,
2391
+ 3.607162643450732e-05,
2392
+ 3.577483181638307e-05,
2393
+ 3.547803719825881e-05,
2394
+ 3.518124258013455e-05,
2395
+ 3.4884447962010287e-05,
2396
+ 3.458765334388604e-05,
2397
+ 3.4290858725761776e-05,
2398
+ 3.399406410763751e-05,
2399
+ 3.3697269489513265e-05,
2400
+ 3.3400474871389e-05,
2401
+ 3.310368025326474e-05,
2402
+ 3.280688563514048e-05,
2403
+ 3.251009101701623e-05,
2404
+ 3.2213296398891967e-05,
2405
+ 3.191650178076771e-05,
2406
+ 3.1542540561931145e-05,
2407
+ 3.124574594380688e-05,
2408
+ 3.094895132568263e-05,
2409
+ 3.065215670755838e-05,
2410
+ 3.0355362089434113e-05,
2411
+ 3.0058567471309854e-05,
2412
+ 2.97617728531856e-05,
2413
+ 2.9464978235061336e-05,
2414
+ 2.9168183616937077e-05,
2415
+ 2.8871388998812818e-05,
2416
+ 2.857459438068857e-05,
2417
+ 2.8277799762564307e-05,
2418
+ 2.798100514444005e-05,
2419
+ 2.7684210526315793e-05,
2420
+ 2.738741590819153e-05,
2421
+ 2.709062129006727e-05,
2422
+ 2.6793826671943013e-05,
2423
+ 2.6497032053818764e-05,
2424
+ 2.62002374356945e-05,
2425
+ 2.5903442817570243e-05,
2426
+ 2.5606648199445987e-05,
2427
+ 2.5309853581321725e-05,
2428
+ 2.5013058963197466e-05,
2429
+ 2.4716264345073214e-05,
2430
+ 2.441946972694896e-05,
2431
+ 2.4122675108824693e-05,
2432
+ 2.3825880490700434e-05,
2433
+ 2.352908587257618e-05,
2434
+ 2.3232291254451916e-05,
2435
+ 2.293549663632766e-05,
2436
+ 2.2638702018203408e-05,
2437
+ 2.226474079936684e-05,
2438
+ 2.196794618124258e-05,
2439
+ 2.1671151563118328e-05,
2440
+ 2.1374356944994066e-05,
2441
+ 2.1077562326869803e-05,
2442
+ 2.0780767708745554e-05,
2443
+ 2.0483973090621296e-05,
2444
+ 2.018717847249703e-05,
2445
+ 1.989038385437277e-05,
2446
+ 1.959358923624852e-05,
2447
+ 1.929679461812426e-05,
2448
+ 1.8999999999999998e-05,
2449
+ 1.8703205381875746e-05,
2450
+ 1.8406410763751487e-05,
2451
+ 1.8109616145627224e-05,
2452
+ 1.7812821527502965e-05,
2453
+ 1.7516026909378713e-05,
2454
+ 1.7219232291254454e-05,
2455
+ 1.6922437673130192e-05,
2456
+ 1.662564305500594e-05,
2457
+ 1.632884843688168e-05,
2458
+ 1.603205381875742e-05,
2459
+ 1.573525920063316e-05,
2460
+ 1.5438464582508908e-05,
2461
+ 1.5141669964384647e-05,
2462
+ 1.4844875346260385e-05,
2463
+ 1.4548080728136134e-05,
2464
+ 1.4251286110011875e-05,
2465
+ 1.3954491491887611e-05,
2466
+ 1.3657696873763363e-05,
2467
+ 1.33609022556391e-05,
2468
+ 1.298694103680253e-05,
2469
+ 1.2690146418678277e-05,
2470
+ 1.2393351800554018e-05,
2471
+ 1.2096557182429756e-05,
2472
+ 1.1799762564305506e-05,
2473
+ 1.1502967946181245e-05,
2474
+ 1.1206173328056984e-05,
2475
+ 1.0909378709932724e-05,
2476
+ 1.0612584091808472e-05,
2477
+ 1.0315789473684213e-05,
2478
+ 1.0018994855559949e-05,
2479
+ 9.7222002374357e-06,
2480
+ 9.425405619311438e-06,
2481
+ 9.128611001187177e-06,
2482
+ 8.831816383062916e-06,
2483
+ 8.535021764938666e-06,
2484
+ 8.238227146814405e-06,
2485
+ 7.941432528690143e-06,
2486
+ 7.644637910565893e-06,
2487
+ 7.347843292441632e-06,
2488
+ 7.0510486743173715e-06,
2489
+ 6.75425405619311e-06,
2490
+ 6.45745943806886e-06,
2491
+ 6.160664819944598e-06,
2492
+ 5.8638702018203375e-06,
2493
+ 5.567075583696086e-06,
2494
+ 5.270280965571826e-06,
2495
+ 4.973486347447565e-06,
2496
+ 4.676691729323314e-06,
2497
+ 4.379897111199053e-06,
2498
+ 4.083102493074792e-06
2499
+ ],
2500
+ "emb_lr": [],
2501
+ "eval_step": [
2502
+ 1550,
2503
+ 3113,
2504
+ 4676,
2505
+ 6239,
2506
+ 7802,
2507
+ 9365,
2508
+ 10928,
2509
+ 12491,
2510
+ 14054,
2511
+ 15617
2512
+ ],
2513
+ "eval_accuracy": [
2514
+ 0.57,
2515
+ 0.94,
2516
+ 0.94,
2517
+ 0.99,
2518
+ 0.97,
2519
+ 1.0,
2520
+ 0.99,
2521
+ 1.0,
2522
+ 1.0,
2523
+ 1.0
2524
+ ]
2525
+ },
2526
+ "final_accuracy": 0.9995833333333334,
2527
+ "sft_eval": {
2528
+ "config": {
2529
+ "ops": "add_sub",
2530
+ "K": null,
2531
+ "mode": "sft",
2532
+ "n_digits": 6,
2533
+ "n_per_split": 100
2534
+ },
2535
+ "splits": {
2536
+ "add_S0": {
2537
+ "full_accuracy": 0.84,
2538
+ "n_examples": 100,
2539
+ "per_subtask": {
2540
+ "SA": {
2541
+ "accuracy": 0.9735537190082645,
2542
+ "count": 605
2543
+ },
2544
+ "SS": {
2545
+ "accuracy": 0.968421052631579,
2546
+ "count": 95
2547
+ }
2548
+ }
2549
+ },
2550
+ "add_S1": {
2551
+ "full_accuracy": 0.86,
2552
+ "n_examples": 100,
2553
+ "per_subtask": {
2554
+ "SA": {
2555
+ "accuracy": 0.9656862745098039,
2556
+ "count": 204
2557
+ },
2558
+ "SC": {
2559
+ "accuracy": 0.9881656804733728,
2560
+ "count": 169
2561
+ },
2562
+ "SS": {
2563
+ "accuracy": 1.0,
2564
+ "count": 31
2565
+ },
2566
+ "UC": {
2567
+ "accuracy": 0.9763513513513513,
2568
+ "count": 296
2569
+ }
2570
+ }
2571
+ },
2572
+ "add_S2": {
2573
+ "full_accuracy": 0.6,
2574
+ "n_examples": 100,
2575
+ "per_subtask": {
2576
+ "SA": {
2577
+ "accuracy": 0.9877300613496932,
2578
+ "count": 163
2579
+ },
2580
+ "SC": {
2581
+ "accuracy": 0.9230769230769231,
2582
+ "count": 130
2583
+ },
2584
+ "SS": {
2585
+ "accuracy": 0.9195402298850575,
2586
+ "count": 87
2587
+ },
2588
+ "UC": {
2589
+ "accuracy": 0.8669950738916257,
2590
+ "count": 203
2591
+ },
2592
+ "US": {
2593
+ "accuracy": 0.9914529914529915,
2594
+ "count": 117
2595
+ }
2596
+ }
2597
+ },
2598
+ "add_S3": {
2599
+ "full_accuracy": 0.5,
2600
+ "n_examples": 100,
2601
+ "per_subtask": {
2602
+ "SA": {
2603
+ "accuracy": 0.9917355371900827,
2604
+ "count": 121
2605
+ },
2606
+ "SC": {
2607
+ "accuracy": 0.9834710743801653,
2608
+ "count": 121
2609
+ },
2610
+ "SS": {
2611
+ "accuracy": 1.0,
2612
+ "count": 49
2613
+ },
2614
+ "UC": {
2615
+ "accuracy": 0.8010752688172043,
2616
+ "count": 186
2617
+ },
2618
+ "US": {
2619
+ "accuracy": 0.8430493273542601,
2620
+ "count": 223
2621
+ }
2622
+ }
2623
+ },
2624
+ "add_S4": {
2625
+ "full_accuracy": 0.52,
2626
+ "n_examples": 100,
2627
+ "per_subtask": {
2628
+ "SA": {
2629
+ "accuracy": 0.9903846153846154,
2630
+ "count": 104
2631
+ },
2632
+ "SC": {
2633
+ "accuracy": 0.9716981132075472,
2634
+ "count": 106
2635
+ },
2636
+ "SS": {
2637
+ "accuracy": 1.0,
2638
+ "count": 23
2639
+ },
2640
+ "UC": {
2641
+ "accuracy": 0.79375,
2642
+ "count": 160
2643
+ },
2644
+ "US": {
2645
+ "accuracy": 0.752442996742671,
2646
+ "count": 307
2647
+ }
2648
+ }
2649
+ },
2650
+ "add_S5": {
2651
+ "full_accuracy": 0.44,
2652
+ "n_examples": 100,
2653
+ "per_subtask": {
2654
+ "SA": {
2655
+ "accuracy": 1.0,
2656
+ "count": 100
2657
+ },
2658
+ "SC": {
2659
+ "accuracy": 0.99,
2660
+ "count": 100
2661
+ },
2662
+ "UC": {
2663
+ "accuracy": 0.6,
2664
+ "count": 100
2665
+ },
2666
+ "US": {
2667
+ "accuracy": 0.56,
2668
+ "count": 400
2669
+ }
2670
+ }
2671
+ },
2672
+ "add_S6": {
2673
+ "full_accuracy": 0.51,
2674
+ "n_examples": 100,
2675
+ "per_subtask": {
2676
+ "SC": {
2677
+ "accuracy": 1.0,
2678
+ "count": 100
2679
+ },
2680
+ "UC": {
2681
+ "accuracy": 0.58,
2682
+ "count": 100
2683
+ },
2684
+ "US": {
2685
+ "accuracy": 0.638,
2686
+ "count": 500
2687
+ }
2688
+ }
2689
+ },
2690
+ "add_random": {
2691
+ "full_accuracy": 0.86,
2692
+ "n_examples": 200,
2693
+ "per_subtask": {
2694
+ "SA": {
2695
+ "accuracy": 0.9821029082774049,
2696
+ "count": 447
2697
+ },
2698
+ "SC": {
2699
+ "accuracy": 0.99375,
2700
+ "count": 320
2701
+ },
2702
+ "SS": {
2703
+ "accuracy": 0.9821428571428571,
2704
+ "count": 56
2705
+ },
2706
+ "UC": {
2707
+ "accuracy": 0.9659735349716446,
2708
+ "count": 529
2709
+ },
2710
+ "US": {
2711
+ "accuracy": 1.0,
2712
+ "count": 48
2713
+ }
2714
+ }
2715
+ },
2716
+ "add_C3": {
2717
+ "full_accuracy": 0.67,
2718
+ "n_examples": 100,
2719
+ "per_subtask": {
2720
+ "SA": {
2721
+ "accuracy": 1.0,
2722
+ "count": 300
2723
+ },
2724
+ "SC": {
2725
+ "accuracy": 1.0,
2726
+ "count": 100
2727
+ },
2728
+ "UC": {
2729
+ "accuracy": 0.844559585492228,
2730
+ "count": 193
2731
+ },
2732
+ "US": {
2733
+ "accuracy": 0.822429906542056,
2734
+ "count": 107
2735
+ }
2736
+ }
2737
+ },
2738
+ "add_C4": {
2739
+ "full_accuracy": 0.53,
2740
+ "n_examples": 100,
2741
+ "per_subtask": {
2742
+ "SA": {
2743
+ "accuracy": 1.0,
2744
+ "count": 200
2745
+ },
2746
+ "SC": {
2747
+ "accuracy": 1.0,
2748
+ "count": 100
2749
+ },
2750
+ "UC": {
2751
+ "accuracy": 0.8359375,
2752
+ "count": 256
2753
+ },
2754
+ "US": {
2755
+ "accuracy": 0.8402777777777778,
2756
+ "count": 144
2757
+ }
2758
+ }
2759
+ },
2760
+ "add_C5": {
2761
+ "full_accuracy": 0.53,
2762
+ "n_examples": 100,
2763
+ "per_subtask": {
2764
+ "SA": {
2765
+ "accuracy": 1.0,
2766
+ "count": 100
2767
+ },
2768
+ "SC": {
2769
+ "accuracy": 1.0,
2770
+ "count": 100
2771
+ },
2772
+ "UC": {
2773
+ "accuracy": 0.8464052287581699,
2774
+ "count": 306
2775
+ },
2776
+ "US": {
2777
+ "accuracy": 0.8247422680412371,
2778
+ "count": 194
2779
+ }
2780
+ }
2781
+ },
2782
+ "add_C6": {
2783
+ "full_accuracy": 0.47,
2784
+ "n_examples": 100,
2785
+ "per_subtask": {
2786
+ "SC": {
2787
+ "accuracy": 1.0,
2788
+ "count": 100
2789
+ },
2790
+ "UC": {
2791
+ "accuracy": 0.8387978142076503,
2792
+ "count": 366
2793
+ },
2794
+ "US": {
2795
+ "accuracy": 0.8846153846153846,
2796
+ "count": 234
2797
+ }
2798
+ }
2799
+ },
2800
+ "sub_M0": {
2801
+ "full_accuracy": 0.87,
2802
+ "n_examples": 100,
2803
+ "per_subtask": {
2804
+ "MD": {
2805
+ "accuracy": 0.978369384359401,
2806
+ "count": 601
2807
+ },
2808
+ "ME": {
2809
+ "accuracy": 0.9696969696969697,
2810
+ "count": 99
2811
+ }
2812
+ }
2813
+ },
2814
+ "sub_M1": {
2815
+ "full_accuracy": 0.9,
2816
+ "n_examples": 100,
2817
+ "per_subtask": {
2818
+ "MD": {
2819
+ "accuracy": 0.982078853046595,
2820
+ "count": 279
2821
+ },
2822
+ "MB": {
2823
+ "accuracy": 0.993103448275862,
2824
+ "count": 145
2825
+ },
2826
+ "ME": {
2827
+ "accuracy": 1.0,
2828
+ "count": 24
2829
+ },
2830
+ "UB": {
2831
+ "accuracy": 0.9841269841269841,
2832
+ "count": 252
2833
+ }
2834
+ }
2835
+ },
2836
+ "sub_M2": {
2837
+ "full_accuracy": 0.57,
2838
+ "n_examples": 100,
2839
+ "per_subtask": {
2840
+ "MD": {
2841
+ "accuracy": 0.9906103286384976,
2842
+ "count": 213
2843
+ },
2844
+ "MB": {
2845
+ "accuracy": 0.9911504424778761,
2846
+ "count": 113
2847
+ },
2848
+ "ME": {
2849
+ "accuracy": 1.0,
2850
+ "count": 85
2851
+ },
2852
+ "UB": {
2853
+ "accuracy": 0.7624309392265194,
2854
+ "count": 181
2855
+ },
2856
+ "UD": {
2857
+ "accuracy": 0.9814814814814815,
2858
+ "count": 108
2859
+ }
2860
+ }
2861
+ },
2862
+ "sub_M3": {
2863
+ "full_accuracy": 0.25,
2864
+ "n_examples": 100,
2865
+ "per_subtask": {
2866
+ "MD": {
2867
+ "accuracy": 1.0,
2868
+ "count": 179
2869
+ },
2870
+ "MB": {
2871
+ "accuracy": 0.9902912621359223,
2872
+ "count": 103
2873
+ },
2874
+ "ME": {
2875
+ "accuracy": 1.0,
2876
+ "count": 56
2877
+ },
2878
+ "UB": {
2879
+ "accuracy": 0.6510067114093959,
2880
+ "count": 149
2881
+ },
2882
+ "UD": {
2883
+ "accuracy": 0.676056338028169,
2884
+ "count": 213
2885
+ }
2886
+ }
2887
+ },
2888
+ "sub_M4": {
2889
+ "full_accuracy": 0.18,
2890
+ "n_examples": 100,
2891
+ "per_subtask": {
2892
+ "MD": {
2893
+ "accuracy": 1.0,
2894
+ "count": 200
2895
+ },
2896
+ "MB": {
2897
+ "accuracy": 1.0,
2898
+ "count": 100
2899
+ },
2900
+ "UB": {
2901
+ "accuracy": 0.41,
2902
+ "count": 100
2903
+ },
2904
+ "UD": {
2905
+ "accuracy": 0.47333333333333333,
2906
+ "count": 300
2907
+ }
2908
+ }
2909
+ },
2910
+ "sub_M5": {
2911
+ "full_accuracy": 0.32,
2912
+ "n_examples": 100,
2913
+ "per_subtask": {
2914
+ "MD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 100
2917
+ },
2918
+ "MB": {
2919
+ "accuracy": 1.0,
2920
+ "count": 100
2921
+ },
2922
+ "UB": {
2923
+ "accuracy": 0.38,
2924
+ "count": 100
2925
+ },
2926
+ "UD": {
2927
+ "accuracy": 0.465,
2928
+ "count": 400
2929
+ }
2930
+ }
2931
+ },
2932
+ "sub_random": {
2933
+ "full_accuracy": 0.83,
2934
+ "n_examples": 200,
2935
+ "per_subtask": {
2936
+ "MD": {
2937
+ "accuracy": 0.9866666666666667,
2938
+ "count": 600
2939
+ },
2940
+ "MB": {
2941
+ "accuracy": 0.9887640449438202,
2942
+ "count": 267
2943
+ },
2944
+ "ME": {
2945
+ "accuracy": 0.9811320754716981,
2946
+ "count": 53
2947
+ },
2948
+ "UB": {
2949
+ "accuracy": 0.9521640091116174,
2950
+ "count": 439
2951
+ },
2952
+ "UD": {
2953
+ "accuracy": 0.9024390243902439,
2954
+ "count": 41
2955
+ }
2956
+ }
2957
+ },
2958
+ "sub_B3": {
2959
+ "full_accuracy": 0.6,
2960
+ "n_examples": 100,
2961
+ "per_subtask": {
2962
+ "MD": {
2963
+ "accuracy": 0.9933333333333333,
2964
+ "count": 300
2965
+ },
2966
+ "MB": {
2967
+ "accuracy": 1.0,
2968
+ "count": 100
2969
+ },
2970
+ "UB": {
2971
+ "accuracy": 0.8223350253807107,
2972
+ "count": 197
2973
+ },
2974
+ "UD": {
2975
+ "accuracy": 0.7864077669902912,
2976
+ "count": 103
2977
+ }
2978
+ }
2979
+ },
2980
+ "sub_B4": {
2981
+ "full_accuracy": 0.47,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "MD": {
2985
+ "accuracy": 1.0,
2986
+ "count": 200
2987
+ },
2988
+ "MB": {
2989
+ "accuracy": 1.0,
2990
+ "count": 100
2991
+ },
2992
+ "UB": {
2993
+ "accuracy": 0.8340080971659919,
2994
+ "count": 247
2995
+ },
2996
+ "UD": {
2997
+ "accuracy": 0.7058823529411765,
2998
+ "count": 153
2999
+ }
3000
+ }
3001
+ },
3002
+ "sub_B5": {
3003
+ "full_accuracy": 0.34,
3004
+ "n_examples": 100,
3005
+ "per_subtask": {
3006
+ "MD": {
3007
+ "accuracy": 1.0,
3008
+ "count": 100
3009
+ },
3010
+ "MB": {
3011
+ "accuracy": 1.0,
3012
+ "count": 100
3013
+ },
3014
+ "UB": {
3015
+ "accuracy": 0.785234899328859,
3016
+ "count": 298
3017
+ },
3018
+ "UD": {
3019
+ "accuracy": 0.7178217821782178,
3020
+ "count": 202
3021
+ }
3022
+ }
3023
+ }
3024
+ },
3025
+ "summary": {
3026
+ "overall_accuracy": 0.5975,
3027
+ "total_examples": 2400,
3028
+ "n_splits": 22
3029
+ }
3030
+ },
3031
+ "sorl_eval": {
3032
+ "config": {
3033
+ "ops": "add_sub",
3034
+ "K": 4,
3035
+ "mode": "sorl",
3036
+ "n_digits": 6,
3037
+ "n_per_split": 100
3038
+ },
3039
+ "splits": {
3040
+ "add_S0": {
3041
+ "full_accuracy": 1.0,
3042
+ "n_examples": 100,
3043
+ "per_subtask": {
3044
+ "SA": {
3045
+ "accuracy": 1.0,
3046
+ "count": 605
3047
+ },
3048
+ "SS": {
3049
+ "accuracy": 1.0,
3050
+ "count": 95
3051
+ }
3052
+ }
3053
+ },
3054
+ "add_S1": {
3055
+ "full_accuracy": 1.0,
3056
+ "n_examples": 100,
3057
+ "per_subtask": {
3058
+ "SA": {
3059
+ "accuracy": 1.0,
3060
+ "count": 204
3061
+ },
3062
+ "SC": {
3063
+ "accuracy": 1.0,
3064
+ "count": 169
3065
+ },
3066
+ "SS": {
3067
+ "accuracy": 1.0,
3068
+ "count": 31
3069
+ },
3070
+ "UC": {
3071
+ "accuracy": 1.0,
3072
+ "count": 296
3073
+ }
3074
+ }
3075
+ },
3076
+ "add_S2": {
3077
+ "full_accuracy": 1.0,
3078
+ "n_examples": 100,
3079
+ "per_subtask": {
3080
+ "SA": {
3081
+ "accuracy": 1.0,
3082
+ "count": 163
3083
+ },
3084
+ "SC": {
3085
+ "accuracy": 1.0,
3086
+ "count": 130
3087
+ },
3088
+ "SS": {
3089
+ "accuracy": 1.0,
3090
+ "count": 87
3091
+ },
3092
+ "UC": {
3093
+ "accuracy": 1.0,
3094
+ "count": 203
3095
+ },
3096
+ "US": {
3097
+ "accuracy": 1.0,
3098
+ "count": 117
3099
+ }
3100
+ }
3101
+ },
3102
+ "add_S3": {
3103
+ "full_accuracy": 1.0,
3104
+ "n_examples": 100,
3105
+ "per_subtask": {
3106
+ "SA": {
3107
+ "accuracy": 1.0,
3108
+ "count": 121
3109
+ },
3110
+ "SC": {
3111
+ "accuracy": 1.0,
3112
+ "count": 121
3113
+ },
3114
+ "SS": {
3115
+ "accuracy": 1.0,
3116
+ "count": 49
3117
+ },
3118
+ "UC": {
3119
+ "accuracy": 1.0,
3120
+ "count": 186
3121
+ },
3122
+ "US": {
3123
+ "accuracy": 1.0,
3124
+ "count": 223
3125
+ }
3126
+ }
3127
+ },
3128
+ "add_S4": {
3129
+ "full_accuracy": 1.0,
3130
+ "n_examples": 100,
3131
+ "per_subtask": {
3132
+ "SA": {
3133
+ "accuracy": 1.0,
3134
+ "count": 104
3135
+ },
3136
+ "SC": {
3137
+ "accuracy": 1.0,
3138
+ "count": 106
3139
+ },
3140
+ "SS": {
3141
+ "accuracy": 1.0,
3142
+ "count": 23
3143
+ },
3144
+ "UC": {
3145
+ "accuracy": 1.0,
3146
+ "count": 160
3147
+ },
3148
+ "US": {
3149
+ "accuracy": 1.0,
3150
+ "count": 307
3151
+ }
3152
+ }
3153
+ },
3154
+ "add_S5": {
3155
+ "full_accuracy": 1.0,
3156
+ "n_examples": 100,
3157
+ "per_subtask": {
3158
+ "SA": {
3159
+ "accuracy": 1.0,
3160
+ "count": 100
3161
+ },
3162
+ "SC": {
3163
+ "accuracy": 1.0,
3164
+ "count": 100
3165
+ },
3166
+ "UC": {
3167
+ "accuracy": 1.0,
3168
+ "count": 100
3169
+ },
3170
+ "US": {
3171
+ "accuracy": 1.0,
3172
+ "count": 400
3173
+ }
3174
+ }
3175
+ },
3176
+ "add_S6": {
3177
+ "full_accuracy": 0.99,
3178
+ "n_examples": 100,
3179
+ "per_subtask": {
3180
+ "SC": {
3181
+ "accuracy": 1.0,
3182
+ "count": 100
3183
+ },
3184
+ "UC": {
3185
+ "accuracy": 0.99,
3186
+ "count": 100
3187
+ },
3188
+ "US": {
3189
+ "accuracy": 1.0,
3190
+ "count": 500
3191
+ }
3192
+ }
3193
+ },
3194
+ "add_random": {
3195
+ "full_accuracy": 1.0,
3196
+ "n_examples": 200,
3197
+ "per_subtask": {
3198
+ "SA": {
3199
+ "accuracy": 1.0,
3200
+ "count": 447
3201
+ },
3202
+ "SC": {
3203
+ "accuracy": 1.0,
3204
+ "count": 320
3205
+ },
3206
+ "SS": {
3207
+ "accuracy": 1.0,
3208
+ "count": 56
3209
+ },
3210
+ "UC": {
3211
+ "accuracy": 1.0,
3212
+ "count": 529
3213
+ },
3214
+ "US": {
3215
+ "accuracy": 1.0,
3216
+ "count": 48
3217
+ }
3218
+ }
3219
+ },
3220
+ "add_C3": {
3221
+ "full_accuracy": 1.0,
3222
+ "n_examples": 100,
3223
+ "per_subtask": {
3224
+ "SA": {
3225
+ "accuracy": 1.0,
3226
+ "count": 300
3227
+ },
3228
+ "SC": {
3229
+ "accuracy": 1.0,
3230
+ "count": 100
3231
+ },
3232
+ "UC": {
3233
+ "accuracy": 1.0,
3234
+ "count": 193
3235
+ },
3236
+ "US": {
3237
+ "accuracy": 1.0,
3238
+ "count": 107
3239
+ }
3240
+ }
3241
+ },
3242
+ "add_C4": {
3243
+ "full_accuracy": 1.0,
3244
+ "n_examples": 100,
3245
+ "per_subtask": {
3246
+ "SA": {
3247
+ "accuracy": 1.0,
3248
+ "count": 200
3249
+ },
3250
+ "SC": {
3251
+ "accuracy": 1.0,
3252
+ "count": 100
3253
+ },
3254
+ "UC": {
3255
+ "accuracy": 1.0,
3256
+ "count": 256
3257
+ },
3258
+ "US": {
3259
+ "accuracy": 1.0,
3260
+ "count": 144
3261
+ }
3262
+ }
3263
+ },
3264
+ "add_C5": {
3265
+ "full_accuracy": 1.0,
3266
+ "n_examples": 100,
3267
+ "per_subtask": {
3268
+ "SA": {
3269
+ "accuracy": 1.0,
3270
+ "count": 100
3271
+ },
3272
+ "SC": {
3273
+ "accuracy": 1.0,
3274
+ "count": 100
3275
+ },
3276
+ "UC": {
3277
+ "accuracy": 1.0,
3278
+ "count": 306
3279
+ },
3280
+ "US": {
3281
+ "accuracy": 1.0,
3282
+ "count": 194
3283
+ }
3284
+ }
3285
+ },
3286
+ "add_C6": {
3287
+ "full_accuracy": 1.0,
3288
+ "n_examples": 100,
3289
+ "per_subtask": {
3290
+ "SC": {
3291
+ "accuracy": 1.0,
3292
+ "count": 100
3293
+ },
3294
+ "UC": {
3295
+ "accuracy": 1.0,
3296
+ "count": 366
3297
+ },
3298
+ "US": {
3299
+ "accuracy": 1.0,
3300
+ "count": 234
3301
+ }
3302
+ }
3303
+ },
3304
+ "sub_M0": {
3305
+ "full_accuracy": 1.0,
3306
+ "n_examples": 100,
3307
+ "per_subtask": {
3308
+ "MD": {
3309
+ "accuracy": 1.0,
3310
+ "count": 601
3311
+ },
3312
+ "ME": {
3313
+ "accuracy": 1.0,
3314
+ "count": 99
3315
+ }
3316
+ }
3317
+ },
3318
+ "sub_M1": {
3319
+ "full_accuracy": 1.0,
3320
+ "n_examples": 100,
3321
+ "per_subtask": {
3322
+ "MD": {
3323
+ "accuracy": 1.0,
3324
+ "count": 279
3325
+ },
3326
+ "MB": {
3327
+ "accuracy": 1.0,
3328
+ "count": 145
3329
+ },
3330
+ "ME": {
3331
+ "accuracy": 1.0,
3332
+ "count": 24
3333
+ },
3334
+ "UB": {
3335
+ "accuracy": 1.0,
3336
+ "count": 252
3337
+ }
3338
+ }
3339
+ },
3340
+ "sub_M2": {
3341
+ "full_accuracy": 1.0,
3342
+ "n_examples": 100,
3343
+ "per_subtask": {
3344
+ "MD": {
3345
+ "accuracy": 1.0,
3346
+ "count": 213
3347
+ },
3348
+ "MB": {
3349
+ "accuracy": 1.0,
3350
+ "count": 113
3351
+ },
3352
+ "ME": {
3353
+ "accuracy": 1.0,
3354
+ "count": 85
3355
+ },
3356
+ "UB": {
3357
+ "accuracy": 1.0,
3358
+ "count": 181
3359
+ },
3360
+ "UD": {
3361
+ "accuracy": 1.0,
3362
+ "count": 108
3363
+ }
3364
+ }
3365
+ },
3366
+ "sub_M3": {
3367
+ "full_accuracy": 1.0,
3368
+ "n_examples": 100,
3369
+ "per_subtask": {
3370
+ "MD": {
3371
+ "accuracy": 1.0,
3372
+ "count": 179
3373
+ },
3374
+ "MB": {
3375
+ "accuracy": 1.0,
3376
+ "count": 103
3377
+ },
3378
+ "ME": {
3379
+ "accuracy": 1.0,
3380
+ "count": 56
3381
+ },
3382
+ "UB": {
3383
+ "accuracy": 1.0,
3384
+ "count": 149
3385
+ },
3386
+ "UD": {
3387
+ "accuracy": 1.0,
3388
+ "count": 213
3389
+ }
3390
+ }
3391
+ },
3392
+ "sub_M4": {
3393
+ "full_accuracy": 1.0,
3394
+ "n_examples": 100,
3395
+ "per_subtask": {
3396
+ "MD": {
3397
+ "accuracy": 1.0,
3398
+ "count": 200
3399
+ },
3400
+ "MB": {
3401
+ "accuracy": 1.0,
3402
+ "count": 100
3403
+ },
3404
+ "UB": {
3405
+ "accuracy": 1.0,
3406
+ "count": 100
3407
+ },
3408
+ "UD": {
3409
+ "accuracy": 1.0,
3410
+ "count": 300
3411
+ }
3412
+ }
3413
+ },
3414
+ "sub_M5": {
3415
+ "full_accuracy": 1.0,
3416
+ "n_examples": 100,
3417
+ "per_subtask": {
3418
+ "MD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 100
3421
+ },
3422
+ "MB": {
3423
+ "accuracy": 1.0,
3424
+ "count": 100
3425
+ },
3426
+ "UB": {
3427
+ "accuracy": 1.0,
3428
+ "count": 100
3429
+ },
3430
+ "UD": {
3431
+ "accuracy": 1.0,
3432
+ "count": 400
3433
+ }
3434
+ }
3435
+ },
3436
+ "sub_random": {
3437
+ "full_accuracy": 1.0,
3438
+ "n_examples": 200,
3439
+ "per_subtask": {
3440
+ "MD": {
3441
+ "accuracy": 1.0,
3442
+ "count": 600
3443
+ },
3444
+ "MB": {
3445
+ "accuracy": 1.0,
3446
+ "count": 267
3447
+ },
3448
+ "ME": {
3449
+ "accuracy": 1.0,
3450
+ "count": 53
3451
+ },
3452
+ "UB": {
3453
+ "accuracy": 1.0,
3454
+ "count": 439
3455
+ },
3456
+ "UD": {
3457
+ "accuracy": 1.0,
3458
+ "count": 41
3459
+ }
3460
+ }
3461
+ },
3462
+ "sub_B3": {
3463
+ "full_accuracy": 1.0,
3464
+ "n_examples": 100,
3465
+ "per_subtask": {
3466
+ "MD": {
3467
+ "accuracy": 1.0,
3468
+ "count": 300
3469
+ },
3470
+ "MB": {
3471
+ "accuracy": 1.0,
3472
+ "count": 100
3473
+ },
3474
+ "UB": {
3475
+ "accuracy": 1.0,
3476
+ "count": 197
3477
+ },
3478
+ "UD": {
3479
+ "accuracy": 1.0,
3480
+ "count": 103
3481
+ }
3482
+ }
3483
+ },
3484
+ "sub_B4": {
3485
+ "full_accuracy": 1.0,
3486
+ "n_examples": 100,
3487
+ "per_subtask": {
3488
+ "MD": {
3489
+ "accuracy": 1.0,
3490
+ "count": 200
3491
+ },
3492
+ "MB": {
3493
+ "accuracy": 1.0,
3494
+ "count": 100
3495
+ },
3496
+ "UB": {
3497
+ "accuracy": 1.0,
3498
+ "count": 247
3499
+ },
3500
+ "UD": {
3501
+ "accuracy": 1.0,
3502
+ "count": 153
3503
+ }
3504
+ }
3505
+ },
3506
+ "sub_B5": {
3507
+ "full_accuracy": 1.0,
3508
+ "n_examples": 100,
3509
+ "per_subtask": {
3510
+ "MD": {
3511
+ "accuracy": 1.0,
3512
+ "count": 100
3513
+ },
3514
+ "MB": {
3515
+ "accuracy": 1.0,
3516
+ "count": 100
3517
+ },
3518
+ "UB": {
3519
+ "accuracy": 1.0,
3520
+ "count": 298
3521
+ },
3522
+ "UD": {
3523
+ "accuracy": 1.0,
3524
+ "count": 202
3525
+ }
3526
+ }
3527
+ }
3528
+ },
3529
+ "summary": {
3530
+ "overall_accuracy": 0.9995833333333334,
3531
+ "total_examples": 2400,
3532
+ "n_splits": 22
3533
+ }
3534
+ },
3535
+ "sorl_overall_accuracy": 0.9995833333333334,
3536
+ "sft_overall_accuracy": 0.5975
3537
+ }
add_sub_sorl_v1_abs50_100K/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:5bd150c526b37100df70f046080caac9d1b4124a923943541ae41a3475fa4044
3
+ size 650466940
add_sub_sorl_v1_abs50_100K/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 4,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 4e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 10,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 1562,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs50_K4_100K",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 2,
61
+ "n_head": 3,
62
+ "n_embd": 510,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 50,
65
+ "dataset_size": 100000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 162540062,
71
+ "run_name": "add_sub_sorl_v1_abs50_100K",
72
+ "git_commit": "f447da529caceac8c7d256cbb2cd185cbc50feac",
73
+ "timestamp": "2026-04-12T13:02:58.777416+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "jy8qmsel",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/jy8qmsel",
81
+ "final_accuracy": 0.9995833333333334,
82
+ "sft_accuracy": 0.5975,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }