amirali1985 commited on
Commit
920df69
·
verified ·
1 Parent(s): 067b743

Upload add_sub_sorl_v1_abs20_100K

Browse files
add_sub_sorl_v1_abs20_100K/config.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 510,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 2040,
15
+ "layer_types": [
16
+ "full_attention",
17
+ "full_attention"
18
+ ],
19
+ "max_position_embeddings": 128,
20
+ "max_window_layers": 28,
21
+ "model_type": "qwen3",
22
+ "num_attention_heads": 3,
23
+ "num_hidden_layers": 2,
24
+ "num_key_value_heads": 3,
25
+ "pad_token_id": null,
26
+ "rms_norm_eps": 1e-06,
27
+ "rope_parameters": {
28
+ "rope_theta": 10000.0,
29
+ "rope_type": "default"
30
+ },
31
+ "sliding_window": null,
32
+ "tie_word_embeddings": false,
33
+ "transformers_version": "5.5.0",
34
+ "use_cache": true,
35
+ "use_sliding_window": false,
36
+ "vocab_size": 151664
37
+ }
add_sub_sorl_v1_abs20_100K/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs20_100K/metrics.json ADDED
@@ -0,0 +1,3537 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 800,
20
+ 850,
21
+ 900,
22
+ 950,
23
+ 1000,
24
+ 1050,
25
+ 1100,
26
+ 1150,
27
+ 1200,
28
+ 1250,
29
+ 1300,
30
+ 1350,
31
+ 1400,
32
+ 1450,
33
+ 1500,
34
+ 1550,
35
+ 1613,
36
+ 1663,
37
+ 1713,
38
+ 1763,
39
+ 1813,
40
+ 1863,
41
+ 1913,
42
+ 1963,
43
+ 2013,
44
+ 2063,
45
+ 2113,
46
+ 2163,
47
+ 2213,
48
+ 2263,
49
+ 2313,
50
+ 2363,
51
+ 2413,
52
+ 2463,
53
+ 2513,
54
+ 2563,
55
+ 2613,
56
+ 2663,
57
+ 2713,
58
+ 2763,
59
+ 2813,
60
+ 2863,
61
+ 2913,
62
+ 2963,
63
+ 3013,
64
+ 3063,
65
+ 3113,
66
+ 3176,
67
+ 3226,
68
+ 3276,
69
+ 3326,
70
+ 3376,
71
+ 3426,
72
+ 3476,
73
+ 3526,
74
+ 3576,
75
+ 3626,
76
+ 3676,
77
+ 3726,
78
+ 3776,
79
+ 3826,
80
+ 3876,
81
+ 3926,
82
+ 3976,
83
+ 4026,
84
+ 4076,
85
+ 4126,
86
+ 4176,
87
+ 4226,
88
+ 4276,
89
+ 4326,
90
+ 4376,
91
+ 4426,
92
+ 4476,
93
+ 4526,
94
+ 4576,
95
+ 4626,
96
+ 4676,
97
+ 4739,
98
+ 4789,
99
+ 4839,
100
+ 4889,
101
+ 4939,
102
+ 4989,
103
+ 5039,
104
+ 5089,
105
+ 5139,
106
+ 5189,
107
+ 5239,
108
+ 5289,
109
+ 5339,
110
+ 5389,
111
+ 5439,
112
+ 5489,
113
+ 5539,
114
+ 5589,
115
+ 5639,
116
+ 5689,
117
+ 5739,
118
+ 5789,
119
+ 5839,
120
+ 5889,
121
+ 5939,
122
+ 5989,
123
+ 6039,
124
+ 6089,
125
+ 6139,
126
+ 6189,
127
+ 6239,
128
+ 6302,
129
+ 6352,
130
+ 6402,
131
+ 6452,
132
+ 6502,
133
+ 6552,
134
+ 6602,
135
+ 6652,
136
+ 6702,
137
+ 6752,
138
+ 6802,
139
+ 6852,
140
+ 6902,
141
+ 6952,
142
+ 7002,
143
+ 7052,
144
+ 7102,
145
+ 7152,
146
+ 7202,
147
+ 7252,
148
+ 7302,
149
+ 7352,
150
+ 7402,
151
+ 7452,
152
+ 7502,
153
+ 7552,
154
+ 7602,
155
+ 7652,
156
+ 7702,
157
+ 7752,
158
+ 7802,
159
+ 7865,
160
+ 7915,
161
+ 7965,
162
+ 8015,
163
+ 8065,
164
+ 8115,
165
+ 8165,
166
+ 8215,
167
+ 8265,
168
+ 8315,
169
+ 8365,
170
+ 8415,
171
+ 8465,
172
+ 8515,
173
+ 8565,
174
+ 8615,
175
+ 8665,
176
+ 8715,
177
+ 8765,
178
+ 8815,
179
+ 8865,
180
+ 8915,
181
+ 8965,
182
+ 9015,
183
+ 9065,
184
+ 9115,
185
+ 9165,
186
+ 9215,
187
+ 9265,
188
+ 9315,
189
+ 9365,
190
+ 9428,
191
+ 9478,
192
+ 9528,
193
+ 9578,
194
+ 9628,
195
+ 9678,
196
+ 9728,
197
+ 9778,
198
+ 9828,
199
+ 9878,
200
+ 9928,
201
+ 9978,
202
+ 10028,
203
+ 10078,
204
+ 10128,
205
+ 10178,
206
+ 10228,
207
+ 10278,
208
+ 10328,
209
+ 10378,
210
+ 10428,
211
+ 10478,
212
+ 10528,
213
+ 10578,
214
+ 10628,
215
+ 10678,
216
+ 10728,
217
+ 10778,
218
+ 10828,
219
+ 10878,
220
+ 10928,
221
+ 10991,
222
+ 11041,
223
+ 11091,
224
+ 11141,
225
+ 11191,
226
+ 11241,
227
+ 11291,
228
+ 11341,
229
+ 11391,
230
+ 11441,
231
+ 11491,
232
+ 11541,
233
+ 11591,
234
+ 11641,
235
+ 11691,
236
+ 11741,
237
+ 11791,
238
+ 11841,
239
+ 11891,
240
+ 11941,
241
+ 11991,
242
+ 12041,
243
+ 12091,
244
+ 12141,
245
+ 12191,
246
+ 12241,
247
+ 12291,
248
+ 12341,
249
+ 12391,
250
+ 12441,
251
+ 12491,
252
+ 12554,
253
+ 12604,
254
+ 12654,
255
+ 12704,
256
+ 12754,
257
+ 12804,
258
+ 12854,
259
+ 12904,
260
+ 12954,
261
+ 13004,
262
+ 13054,
263
+ 13104,
264
+ 13154,
265
+ 13204,
266
+ 13254,
267
+ 13304,
268
+ 13354,
269
+ 13404,
270
+ 13454,
271
+ 13504,
272
+ 13554,
273
+ 13604,
274
+ 13654,
275
+ 13704,
276
+ 13754,
277
+ 13804,
278
+ 13854,
279
+ 13904,
280
+ 13954,
281
+ 14004,
282
+ 14054,
283
+ 14117,
284
+ 14167,
285
+ 14217,
286
+ 14267,
287
+ 14317,
288
+ 14367,
289
+ 14417,
290
+ 14467,
291
+ 14517,
292
+ 14567,
293
+ 14617,
294
+ 14667,
295
+ 14717,
296
+ 14767,
297
+ 14817,
298
+ 14867,
299
+ 14917,
300
+ 14967,
301
+ 15017,
302
+ 15067,
303
+ 15117,
304
+ 15167,
305
+ 15217,
306
+ 15267,
307
+ 15317,
308
+ 15367,
309
+ 15417,
310
+ 15467,
311
+ 15517,
312
+ 15567,
313
+ 15617
314
+ ],
315
+ "loss": [
316
+ 16.79209327697754,
317
+ 11.760915756225586,
318
+ 8.9793062210083,
319
+ 7.396918296813965,
320
+ 5.559861183166504,
321
+ 3.38045597076416,
322
+ 3.2124176025390625,
323
+ 2.7785732746124268,
324
+ 2.1971092224121094,
325
+ 2.2191262245178223,
326
+ 2.200740337371826,
327
+ 2.009458541870117,
328
+ 2.3492300510406494,
329
+ 1.3246259689331055,
330
+ 1.1564584970474243,
331
+ 1.4707976579666138,
332
+ 1.1582921743392944,
333
+ 1.1815707683563232,
334
+ 1.0310959815979004,
335
+ 0.8539774417877197,
336
+ 0.6265650987625122,
337
+ 0.34309226274490356,
338
+ -1.3883473873138428,
339
+ -4.232861518859863,
340
+ -7.910555362701416,
341
+ -9.498554229736328,
342
+ -10.19212818145752,
343
+ -9.983817100524902,
344
+ -10.945733070373535,
345
+ -11.837502479553223,
346
+ -12.18378734588623,
347
+ -14.094343185424805,
348
+ -13.795543670654297,
349
+ -13.354608535766602,
350
+ -14.1011962890625,
351
+ -13.137774467468262,
352
+ -13.852112770080566,
353
+ -14.57231616973877,
354
+ -14.43851375579834,
355
+ -13.860637664794922,
356
+ -13.924348831176758,
357
+ -14.35501480102539,
358
+ -14.115457534790039,
359
+ -13.824909210205078,
360
+ -13.434500694274902,
361
+ -14.72733211517334,
362
+ -14.331260681152344,
363
+ -14.202347755432129,
364
+ -13.94506549835205,
365
+ -14.042664527893066,
366
+ -14.731111526489258,
367
+ -14.021833419799805,
368
+ -14.107925415039062,
369
+ -14.056807518005371,
370
+ -14.242992401123047,
371
+ -13.928154945373535,
372
+ -13.331207275390625,
373
+ -13.890643119812012,
374
+ -14.211116790771484,
375
+ -14.563620567321777,
376
+ -14.260629653930664,
377
+ -14.320273399353027,
378
+ -13.844810485839844,
379
+ -14.332328796386719,
380
+ -14.851007461547852,
381
+ -14.306427001953125,
382
+ -14.03696346282959,
383
+ -14.060243606567383,
384
+ -14.329286575317383,
385
+ -13.870020866394043,
386
+ -13.720074653625488,
387
+ -13.800219535827637,
388
+ -14.182469367980957,
389
+ -13.952445983886719,
390
+ -14.123272895812988,
391
+ -14.184364318847656,
392
+ -14.153197288513184,
393
+ -13.918373107910156,
394
+ -14.013357162475586,
395
+ -14.240181922912598,
396
+ -14.764949798583984,
397
+ -13.324590682983398,
398
+ -13.444450378417969,
399
+ -13.710700988769531,
400
+ -13.82218074798584,
401
+ -13.838254928588867,
402
+ -13.597502708435059,
403
+ -13.516195297241211,
404
+ -12.035502433776855,
405
+ -10.981066703796387,
406
+ -11.022160530090332,
407
+ -8.873615264892578,
408
+ -8.038102149963379,
409
+ -6.47631311416626,
410
+ -5.598836898803711,
411
+ -6.26401948928833,
412
+ -5.333451271057129,
413
+ -4.918493270874023,
414
+ -4.710961818695068,
415
+ -4.534127712249756,
416
+ -4.869874000549316,
417
+ -4.14800500869751,
418
+ -4.459377765655518,
419
+ -3.720736503601074,
420
+ -4.470472812652588,
421
+ -3.9317538738250732,
422
+ -3.9913244247436523,
423
+ -3.6918787956237793,
424
+ -4.0778326988220215,
425
+ -3.3936843872070312,
426
+ -3.625615119934082,
427
+ -3.606598138809204,
428
+ -4.296830177307129,
429
+ -3.634775161743164,
430
+ -3.6730377674102783,
431
+ -3.0592892169952393,
432
+ -3.2307827472686768,
433
+ -3.299914598464966,
434
+ -3.612592935562134,
435
+ -3.362389087677002,
436
+ -3.043623208999634,
437
+ -3.2935516834259033,
438
+ -2.8091166019439697,
439
+ -3.3286819458007812,
440
+ -2.8308053016662598,
441
+ -3.2010338306427,
442
+ -3.375739574432373,
443
+ -3.0267436504364014,
444
+ -3.4792568683624268,
445
+ -2.9172184467315674,
446
+ -2.8592689037323,
447
+ -2.985954761505127,
448
+ -2.883500337600708,
449
+ -2.8080453872680664,
450
+ -2.6712381839752197,
451
+ -2.6109540462493896,
452
+ -3.006927251815796,
453
+ -3.044006586074829,
454
+ -2.3167779445648193,
455
+ -2.9145047664642334,
456
+ -2.413074254989624,
457
+ -2.2815890312194824,
458
+ -2.9332025051116943,
459
+ -2.440556287765503,
460
+ -2.3241117000579834,
461
+ -2.8669636249542236,
462
+ -2.4647488594055176,
463
+ -2.8345627784729004,
464
+ -2.40256404876709,
465
+ -2.841010570526123,
466
+ -2.350149154663086,
467
+ -2.423363208770752,
468
+ -2.970334529876709,
469
+ -2.630432605743408,
470
+ -2.3789308071136475,
471
+ -2.4599573612213135,
472
+ -2.0926942825317383,
473
+ -2.4133481979370117,
474
+ -2.117722988128662,
475
+ -2.2958366870880127,
476
+ -2.039107084274292,
477
+ -1.819115400314331,
478
+ -2.396491765975952,
479
+ -2.4824070930480957,
480
+ -1.8121613264083862,
481
+ -1.8639214038848877,
482
+ -2.159947633743286,
483
+ -1.6071596145629883,
484
+ -1.9000400304794312,
485
+ -1.7521079778671265,
486
+ -1.766842007637024,
487
+ -2.0209553241729736,
488
+ -1.7798255681991577,
489
+ -1.9496805667877197,
490
+ -1.8481358289718628,
491
+ -1.724064588546753,
492
+ -1.9545000791549683,
493
+ -2.355841875076294,
494
+ -1.8106406927108765,
495
+ -1.8370072841644287,
496
+ -2.237955331802368,
497
+ -1.6500630378723145,
498
+ -1.7646278142929077,
499
+ -1.7661163806915283,
500
+ -1.6755574941635132,
501
+ -1.4729588031768799,
502
+ -1.6085923910140991,
503
+ -1.3132957220077515,
504
+ -1.8922404050827026,
505
+ -1.5854400396347046,
506
+ -1.712070107460022,
507
+ -1.273451566696167,
508
+ -1.352250576019287,
509
+ -1.3046519756317139,
510
+ -1.3954737186431885,
511
+ -1.7703322172164917,
512
+ -1.4283695220947266,
513
+ -1.0123875141143799,
514
+ -1.6394275426864624,
515
+ -1.4428489208221436,
516
+ -1.4007066488265991,
517
+ -1.282835841178894,
518
+ -1.3286669254302979,
519
+ -1.479001522064209,
520
+ -1.1670639514923096,
521
+ -1.3329111337661743,
522
+ -0.9665555357933044,
523
+ -1.2764699459075928,
524
+ -0.9801934957504272,
525
+ -0.9535375237464905,
526
+ -1.1150256395339966,
527
+ -1.0306384563446045,
528
+ -1.2519457340240479,
529
+ -1.1996408700942993,
530
+ -1.1164659261703491,
531
+ -1.1038587093353271,
532
+ -1.3577220439910889,
533
+ -1.2127302885055542,
534
+ -0.8137933015823364,
535
+ -0.8732357025146484,
536
+ -0.8328045606613159,
537
+ -0.9246251583099365,
538
+ -0.6932074427604675,
539
+ -1.1156266927719116,
540
+ -0.9569106101989746,
541
+ -0.8504764437675476,
542
+ -1.128698468208313,
543
+ -0.9255280494689941,
544
+ -0.8243647813796997,
545
+ -0.9268491864204407,
546
+ -0.7702681422233582,
547
+ -0.7200023531913757,
548
+ -0.9779446125030518,
549
+ -0.7897813320159912,
550
+ -0.800619900226593,
551
+ -0.7645387053489685,
552
+ -1.1333955526351929,
553
+ -0.8054041266441345,
554
+ -0.8093994855880737,
555
+ -0.8673604726791382,
556
+ -0.9816060066223145,
557
+ -0.5911740064620972,
558
+ -0.9720580577850342,
559
+ -0.5948343873023987,
560
+ -0.8260560631752014,
561
+ -0.591710090637207,
562
+ -1.003006935119629,
563
+ -0.7442401647567749,
564
+ -0.6731335520744324,
565
+ -0.9030881524085999,
566
+ -0.9331020712852478,
567
+ -0.5333653688430786,
568
+ -0.7962002754211426,
569
+ -0.4459095001220703,
570
+ -0.5970262289047241,
571
+ -0.6425231695175171,
572
+ -0.9427562355995178,
573
+ -0.5024524927139282,
574
+ -0.4325365424156189,
575
+ -0.6038902997970581,
576
+ -0.6784700155258179,
577
+ -0.44050002098083496,
578
+ -0.5332865715026855,
579
+ -0.6820433139801025,
580
+ -0.6055371761322021,
581
+ -0.9522186517715454,
582
+ -0.6130183935165405,
583
+ -0.46341240406036377,
584
+ -0.3951411843299866,
585
+ -0.5626518726348877,
586
+ -0.5533226132392883,
587
+ -0.5690665245056152,
588
+ -0.4580327272415161,
589
+ -0.41125890612602234,
590
+ -0.6303701996803284,
591
+ -0.5366156697273254,
592
+ -0.5488389134407043,
593
+ -0.5357339382171631,
594
+ -0.4944663643836975,
595
+ -0.35123932361602783,
596
+ -0.652963399887085,
597
+ -0.5450815558433533,
598
+ -0.45467543601989746,
599
+ -0.7127432823181152,
600
+ -0.2613491415977478,
601
+ -0.5923411846160889,
602
+ -0.5586081147193909,
603
+ -0.4944308400154114,
604
+ -0.4661834239959717,
605
+ -0.6500449180603027,
606
+ -0.4541547894477844,
607
+ -0.35607436299324036,
608
+ -0.33617547154426575,
609
+ -0.4879729151725769,
610
+ -0.5594838857650757,
611
+ -0.5726749897003174,
612
+ -0.40385618805885315,
613
+ -0.475053995847702,
614
+ -0.2922070026397705,
615
+ -0.38074222207069397,
616
+ -0.37540552020072937,
617
+ -0.3134785592556,
618
+ -0.36059361696243286,
619
+ -0.2543281316757202,
620
+ -0.4130215346813202,
621
+ -0.40772899985313416,
622
+ -0.3520417809486389,
623
+ -0.3371984660625458,
624
+ -0.39990484714508057,
625
+ -0.309539794921875
626
+ ],
627
+ "base_loss": [
628
+ 10.586007118225098,
629
+ 8.107672691345215,
630
+ 7.379012107849121,
631
+ 6.3848748207092285,
632
+ 5.396872043609619,
633
+ 3.847005844116211,
634
+ 2.3134782314300537,
635
+ 2.067183017730713,
636
+ 1.9377295970916748,
637
+ 1.8367758989334106,
638
+ 1.861541509628296,
639
+ 1.8085911273956299,
640
+ 1.8419133424758911,
641
+ 1.8773196935653687,
642
+ 1.8867391347885132,
643
+ 1.859654426574707,
644
+ 1.8019094467163086,
645
+ 1.8483047485351562,
646
+ 1.8342684507369995,
647
+ 1.8257976770401,
648
+ 1.8153953552246094,
649
+ 1.8469390869140625,
650
+ 1.9652775526046753,
651
+ 1.8965301513671875,
652
+ 1.9381773471832275,
653
+ 1.8259631395339966,
654
+ 1.8266514539718628,
655
+ 1.7139222621917725,
656
+ 1.7167195081710815,
657
+ 1.7782014608383179,
658
+ 1.6776527166366577,
659
+ 1.8053874969482422,
660
+ 1.7560675144195557,
661
+ 1.6971855163574219,
662
+ 1.7088196277618408,
663
+ 1.6051843166351318,
664
+ 1.6757994890213013,
665
+ 1.7263540029525757,
666
+ 1.7008579969406128,
667
+ 1.6428000926971436,
668
+ 1.6273185014724731,
669
+ 1.6862186193466187,
670
+ 1.6371279954910278,
671
+ 1.5970579385757446,
672
+ 1.57394540309906,
673
+ 1.6870296001434326,
674
+ 1.632698655128479,
675
+ 1.6635228395462036,
676
+ 1.6213722229003906,
677
+ 1.629797101020813,
678
+ 1.6824833154678345,
679
+ 1.6239286661148071,
680
+ 1.6119505167007446,
681
+ 1.5938571691513062,
682
+ 1.6186141967773438,
683
+ 1.5952460765838623,
684
+ 1.5063362121582031,
685
+ 1.586992859840393,
686
+ 1.615220308303833,
687
+ 1.657053828239441,
688
+ 1.6130435466766357,
689
+ 1.6204346418380737,
690
+ 1.5717500448226929,
691
+ 1.642485499382019,
692
+ 1.6788948774337769,
693
+ 1.6228059530258179,
694
+ 1.5818979740142822,
695
+ 1.5864309072494507,
696
+ 1.622089147567749,
697
+ 1.5611313581466675,
698
+ 1.5610262155532837,
699
+ 1.5713090896606445,
700
+ 1.6062123775482178,
701
+ 1.573341727256775,
702
+ 1.5900599956512451,
703
+ 1.5899255275726318,
704
+ 1.5931357145309448,
705
+ 1.5644103288650513,
706
+ 1.5822985172271729,
707
+ 1.596530556678772,
708
+ 1.6685844659805298,
709
+ 1.5111242532730103,
710
+ 1.5387582778930664,
711
+ 1.5349165201187134,
712
+ 1.551059365272522,
713
+ 1.5500211715698242,
714
+ 1.543041467666626,
715
+ 1.5183570384979248,
716
+ 1.3714021444320679,
717
+ 1.2309716939926147,
718
+ 1.2376619577407837,
719
+ 1.0026013851165771,
720
+ 0.9183998107910156,
721
+ 0.7370001673698425,
722
+ 0.6448150277137756,
723
+ 0.7149214148521423,
724
+ 0.6043591499328613,
725
+ 0.5601844191551208,
726
+ 0.5388034582138062,
727
+ 0.5181083083152771,
728
+ 0.5605003833770752,
729
+ 0.49011102318763733,
730
+ 0.5158273577690125,
731
+ 0.4581403136253357,
732
+ 0.5093480348587036,
733
+ 0.45746392011642456,
734
+ 0.45303425192832947,
735
+ 0.425349622964859,
736
+ 0.4693649113178253,
737
+ 0.3835274875164032,
738
+ 0.4172529876232147,
739
+ 0.41681861877441406,
740
+ 0.4847046732902527,
741
+ 0.4129360616207123,
742
+ 0.42312076687812805,
743
+ 0.35800203680992126,
744
+ 0.3648161292076111,
745
+ 0.3770079016685486,
746
+ 0.40686485171318054,
747
+ 0.38254112005233765,
748
+ 0.37254366278648376,
749
+ 0.37317603826522827,
750
+ 0.3200540542602539,
751
+ 0.37506431341171265,
752
+ 0.3308878540992737,
753
+ 0.3618965744972229,
754
+ 0.3816489279270172,
755
+ 0.3562702536582947,
756
+ 0.3953951895236969,
757
+ 0.32903555035591125,
758
+ 0.32740649580955505,
759
+ 0.33960676193237305,
760
+ 0.32806164026260376,
761
+ 0.32601025700569153,
762
+ 0.3013496398925781,
763
+ 0.30211371183395386,
764
+ 0.3403961956501007,
765
+ 0.3543865382671356,
766
+ 0.28074967861175537,
767
+ 0.3316064178943634,
768
+ 0.3044281005859375,
769
+ 0.27025267481803894,
770
+ 0.3354354500770569,
771
+ 0.27548614144325256,
772
+ 0.2650213837623596,
773
+ 0.3234979212284088,
774
+ 0.27871283888816833,
775
+ 0.31963029503822327,
776
+ 0.2700897455215454,
777
+ 0.31936904788017273,
778
+ 0.2772665321826935,
779
+ 0.27345913648605347,
780
+ 0.3624987006187439,
781
+ 0.29634755849838257,
782
+ 0.2699447274208069,
783
+ 0.28019237518310547,
784
+ 0.237746924161911,
785
+ 0.27120015025138855,
786
+ 0.23963557183742523,
787
+ 0.2580537796020508,
788
+ 0.23053193092346191,
789
+ 0.21056635677814484,
790
+ 0.2714405357837677,
791
+ 0.2802487909793854,
792
+ 0.20902177691459656,
793
+ 0.21195857226848602,
794
+ 0.2431097775697708,
795
+ 0.20361550152301788,
796
+ 0.21543630957603455,
797
+ 0.2017604559659958,
798
+ 0.20477354526519775,
799
+ 0.23138846457004547,
800
+ 0.2045169174671173,
801
+ 0.22018848359584808,
802
+ 0.2100868970155716,
803
+ 0.19771385192871094,
804
+ 0.22226355969905853,
805
+ 0.264514297246933,
806
+ 0.2051856517791748,
807
+ 0.2082277536392212,
808
+ 0.2532007396221161,
809
+ 0.18809524178504944,
810
+ 0.19889818131923676,
811
+ 0.1996307224035263,
812
+ 0.18925443291664124,
813
+ 0.16877637803554535,
814
+ 0.18221449851989746,
815
+ 0.15362408757209778,
816
+ 0.2141164392232895,
817
+ 0.19857670366764069,
818
+ 0.1922067403793335,
819
+ 0.14474739134311676,
820
+ 0.15556621551513672,
821
+ 0.15097951889038086,
822
+ 0.15775156021118164,
823
+ 0.20066706836223602,
824
+ 0.16310788691043854,
825
+ 0.11550626903772354,
826
+ 0.18654581904411316,
827
+ 0.16781851649284363,
828
+ 0.16049368679523468,
829
+ 0.1473221480846405,
830
+ 0.1495732069015503,
831
+ 0.17065215110778809,
832
+ 0.13307374715805054,
833
+ 0.152320995926857,
834
+ 0.12603043019771576,
835
+ 0.14552898705005646,
836
+ 0.11096616834402084,
837
+ 0.12645430862903595,
838
+ 0.12620307505130768,
839
+ 0.11763323843479156,
840
+ 0.1407073736190796,
841
+ 0.13632047176361084,
842
+ 0.12582434713840485,
843
+ 0.1250101625919342,
844
+ 0.1541365534067154,
845
+ 0.1393197476863861,
846
+ 0.09302148967981339,
847
+ 0.10151750594377518,
848
+ 0.0948488712310791,
849
+ 0.10472721606492996,
850
+ 0.07927661389112473,
851
+ 0.12834584712982178,
852
+ 0.10900652408599854,
853
+ 0.09752453863620758,
854
+ 0.12911449372768402,
855
+ 0.10582436621189117,
856
+ 0.09543760865926743,
857
+ 0.10628031194210052,
858
+ 0.08750653266906738,
859
+ 0.08285124599933624,
860
+ 0.11356587707996368,
861
+ 0.09127108007669449,
862
+ 0.09202581644058228,
863
+ 0.08853127062320709,
864
+ 0.1286425143480301,
865
+ 0.09253621101379395,
866
+ 0.09237678349018097,
867
+ 0.09881012886762619,
868
+ 0.11309915781021118,
869
+ 0.06982738524675369,
870
+ 0.11200392246246338,
871
+ 0.07380207628011703,
872
+ 0.09455603361129761,
873
+ 0.08327490836381912,
874
+ 0.11884456127882004,
875
+ 0.08556420356035233,
876
+ 0.07721924036741257,
877
+ 0.10405800491571426,
878
+ 0.10802986472845078,
879
+ 0.0619015209376812,
880
+ 0.09264067560434341,
881
+ 0.052628617733716965,
882
+ 0.06948359310626984,
883
+ 0.07375140488147736,
884
+ 0.10751468688249588,
885
+ 0.059202563017606735,
886
+ 0.05111440271139145,
887
+ 0.07033004611730576,
888
+ 0.07828278094530106,
889
+ 0.05393128842115402,
890
+ 0.06128722056746483,
891
+ 0.07815670967102051,
892
+ 0.06989593803882599,
893
+ 0.11021001636981964,
894
+ 0.07014123350381851,
895
+ 0.05431556701660156,
896
+ 0.04903032258152962,
897
+ 0.06756965816020966,
898
+ 0.06432704627513885,
899
+ 0.065272256731987,
900
+ 0.055248379707336426,
901
+ 0.04900113865733147,
902
+ 0.07290402799844742,
903
+ 0.06393275409936905,
904
+ 0.06356173008680344,
905
+ 0.061554115265607834,
906
+ 0.05799867957830429,
907
+ 0.04246802255511284,
908
+ 0.07636731117963791,
909
+ 0.06435016542673111,
910
+ 0.05432090908288956,
911
+ 0.0806860476732254,
912
+ 0.032122932374477386,
913
+ 0.06914357095956802,
914
+ 0.06491504609584808,
915
+ 0.05827094987034798,
916
+ 0.054308123886585236,
917
+ 0.07501593977212906,
918
+ 0.0526263602077961,
919
+ 0.04181347414851189,
920
+ 0.039931390434503555,
921
+ 0.05918297544121742,
922
+ 0.06463120877742767,
923
+ 0.06513258814811707,
924
+ 0.04770168289542198,
925
+ 0.05509531870484352,
926
+ 0.03441275283694267,
927
+ 0.04434604197740555,
928
+ 0.04428449645638466,
929
+ 0.03709632158279419,
930
+ 0.04441501945257187,
931
+ 0.031395334750413895,
932
+ 0.04886626824736595,
933
+ 0.048341091722249985,
934
+ 0.04275854304432869,
935
+ 0.03998516872525215,
936
+ 0.04799428954720497,
937
+ 0.036228783428668976
938
+ ],
939
+ "info_loss": [
940
+ -0.15445613861083984,
941
+ -0.30521535873413086,
942
+ -0.33514976501464844,
943
+ -0.2423076629638672,
944
+ -0.22414731979370117,
945
+ -0.21929526329040527,
946
+ -0.05562019348144531,
947
+ -0.06447577476501465,
948
+ -0.10581016540527344,
949
+ -0.09356296062469482,
950
+ -0.09634482860565186,
951
+ -0.11017370223999023,
952
+ -0.0791999101638794,
953
+ -0.1850351095199585,
954
+ -0.20321202278137207,
955
+ -0.16833889484405518,
956
+ -0.193231463432312,
957
+ -0.19600355625152588,
958
+ -0.20949387550354004,
959
+ -0.22645235061645508,
960
+ -0.24515342712402344,
961
+ -0.2723342180252075,
962
+ -0.4342762231826782,
963
+ -0.6718428134918213,
964
+ -1.0231105089187622,
965
+ -1.161816120147705,
966
+ -1.2269487380981445,
967
+ -1.1914074420928955,
968
+ -1.2881202697753906,
969
+ -1.3813605308532715,
970
+ -1.4050863981246948,
971
+ -1.6068695783615112,
972
+ -1.5710461139678955,
973
+ -1.5195889472961426,
974
+ -1.5950535535812378,
975
+ -1.4887698888778687,
976
+ -1.5665760040283203,
977
+ -1.6432299613952637,
978
+ -1.6273547410964966,
979
+ -1.5630104541778564,
980
+ -1.5676462650299072,
981
+ -1.6183618307113647,
982
+ -1.5868898630142212,
983
+ -1.5539655685424805,
984
+ -1.5116292238235474,
985
+ -1.651062250137329,
986
+ -1.6061369180679321,
987
+ -1.596465826034546,
988
+ -1.5648189783096313,
989
+ -1.575344443321228,
990
+ -1.6500952243804932,
991
+ -1.5725255012512207,
992
+ -1.5798263549804688,
993
+ -1.5728739500045776,
994
+ -1.5940080881118774,
995
+ -1.56052565574646,
996
+ -1.492093801498413,
997
+ -1.5564193725585938,
998
+ -1.5899673700332642,
999
+ -1.62934410572052,
1000
+ -1.5959336757659912,
1001
+ -1.6007269620895386,
1002
+ -1.548478364944458,
1003
+ -1.6044995784759521,
1004
+ -1.6587224006652832,
1005
+ -1.5995573997497559,
1006
+ -1.5684024095535278,
1007
+ -1.5705070495605469,
1008
+ -1.6026567220687866,
1009
+ -1.5486727952957153,
1010
+ -1.535772681236267,
1011
+ -1.5439412593841553,
1012
+ -1.584057331085205,
1013
+ -1.558900237083435,
1014
+ -1.576781153678894,
1015
+ -1.5832421779632568,
1016
+ -1.5791561603546143,
1017
+ -1.552700161933899,
1018
+ -1.564715027809143,
1019
+ -1.5883455276489258,
1020
+ -1.649574637413025,
1021
+ -1.4878178834915161,
1022
+ -1.5020684003829956,
1023
+ -1.5291961431503296,
1024
+ -1.5412322282791138,
1025
+ -1.5425528287887573,
1026
+ -1.5176763534545898,
1027
+ -1.5075466632843018,
1028
+ -1.3453041315078735,
1029
+ -1.225195050239563,
1030
+ -1.230076551437378,
1031
+ -0.9917240142822266,
1032
+ -0.9002496004104614,
1033
+ -0.7257813215255737,
1034
+ -0.627955973148346,
1035
+ -0.702584445476532,
1036
+ -0.5982261896133423,
1037
+ -0.5509673357009888,
1038
+ -0.52879798412323,
1039
+ -0.5094592571258545,
1040
+ -0.5463420152664185,
1041
+ -0.4676706790924072,
1042
+ -0.5010921359062195,
1043
+ -0.42104434967041016,
1044
+ -0.5016980767250061,
1045
+ -0.44333311915397644,
1046
+ -0.4491637349128723,
1047
+ -0.41619834303855896,
1048
+ -0.45768746733665466,
1049
+ -0.38130971789360046,
1050
+ -0.4073494076728821,
1051
+ -0.4051756262779236,
1052
+ -0.48252367973327637,
1053
+ -0.4091421365737915,
1054
+ -0.41321682929992676,
1055
+ -0.3475387990474701,
1056
+ -0.36227160692214966,
1057
+ -0.37115997076034546,
1058
+ -0.40533366799354553,
1059
+ -0.3791196346282959,
1060
+ -0.3453383147716522,
1061
+ -0.3705844283103943,
1062
+ -0.3160562217235565,
1063
+ -0.37396329641342163,
1064
+ -0.3193526864051819,
1065
+ -0.3590923249721527,
1066
+ -0.3784433603286743,
1067
+ -0.34086278080940247,
1068
+ -0.39094415307044983,
1069
+ -0.32851776480674744,
1070
+ -0.3225290775299072,
1071
+ -0.3373115360736847,
1072
+ -0.32603776454925537,
1073
+ -0.31833845376968384,
1074
+ -0.30103644728660583,
1075
+ -0.29578495025634766,
1076
+ -0.3381631672382355,
1077
+ -0.34345051646232605,
1078
+ -0.26141223311424255,
1079
+ -0.3276233971118927,
1080
+ -0.27610301971435547,
1081
+ -0.25706273317337036,
1082
+ -0.33176058530807495,
1083
+ -0.2745024263858795,
1084
+ -0.26327911019325256,
1085
+ -0.32142817974090576,
1086
+ -0.27793800830841064,
1087
+ -0.31895729899406433,
1088
+ -0.269852876663208,
1089
+ -0.3181893527507782,
1090
+ -0.26604339480400085,
1091
+ -0.27203503251075745,
1092
+ -0.33593982458114624,
1093
+ -0.29593273997306824,
1094
+ -0.2677503228187561,
1095
+ -0.27708810567855835,
1096
+ -0.2359430193901062,
1097
+ -0.27079394459724426,
1098
+ -0.23935742676258087,
1099
+ -0.2577801048755646,
1100
+ -0.23017160594463348,
1101
+ -0.20575203001499176,
1102
+ -0.27097365260124207,
1103
+ -0.27916964888572693,
1104
+ -0.20397672057151794,
1105
+ -0.2101304978132248,
1106
+ -0.24271747469902039,
1107
+ -0.1844528317451477,
1108
+ -0.2136078029870987,
1109
+ -0.19852235913276672,
1110
+ -0.19974885880947113,
1111
+ -0.22834879159927368,
1112
+ -0.20318017899990082,
1113
+ -0.21981891989707947,
1114
+ -0.2098880559206009,
1115
+ -0.19651731848716736,
1116
+ -0.22166648507118225,
1117
+ -0.26429232954978943,
1118
+ -0.20456388592720032,
1119
+ -0.20760402083396912,
1120
+ -0.2527919411659241,
1121
+ -0.18789386749267578,
1122
+ -0.19866003096103668,
1123
+ -0.19909249246120453,
1124
+ -0.18893584609031677,
1125
+ -0.1676982194185257,
1126
+ -0.1821356564760208,
1127
+ -0.1496611088514328,
1128
+ -0.21364998817443848,
1129
+ -0.1831970065832138,
1130
+ -0.1920301467180252,
1131
+ -0.1444585919380188,
1132
+ -0.15324868261814117,
1133
+ -0.14899079501628876,
1134
+ -0.15737591683864594,
1135
+ -0.20000284910202026,
1136
+ -0.16270118951797485,
1137
+ -0.11530550569295883,
1138
+ -0.18561191856861115,
1139
+ -0.16256596148014069,
1140
+ -0.1590348333120346,
1141
+ -0.1453976184129715,
1142
+ -0.14942869544029236,
1143
+ -0.16788814961910248,
1144
+ -0.1324063390493393,
1145
+ -0.15227428078651428,
1146
+ -0.11355708539485931,
1147
+ -0.14508508145809174,
1148
+ -0.11089273542165756,
1149
+ -0.11030630022287369,
1150
+ -0.1258462518453598,
1151
+ -0.11682376265525818,
1152
+ -0.1406470388174057,
1153
+ -0.13544175028800964,
1154
+ -0.1257992535829544,
1155
+ -0.1247929185628891,
1156
+ -0.1540917307138443,
1157
+ -0.13887283205986023,
1158
+ -0.09298080950975418,
1159
+ -0.10008486360311508,
1160
+ -0.09452833235263824,
1161
+ -0.1043253168463707,
1162
+ -0.07922310382127762,
1163
+ -0.12828916311264038,
1164
+ -0.10898083448410034,
1165
+ -0.09729553759098053,
1166
+ -0.12906037271022797,
1167
+ -0.10519947111606598,
1168
+ -0.09539952129125595,
1169
+ -0.10615312308073044,
1170
+ -0.08748174458742142,
1171
+ -0.08279362320899963,
1172
+ -0.11350344866514206,
1173
+ -0.09122669696807861,
1174
+ -0.09114734828472137,
1175
+ -0.08846383541822433,
1176
+ -0.12862056493759155,
1177
+ -0.09247587621212006,
1178
+ -0.09224685281515121,
1179
+ -0.09877295047044754,
1180
+ -0.11255116760730743,
1181
+ -0.06978656351566315,
1182
+ -0.11130283772945404,
1183
+ -0.07027405500411987,
1184
+ -0.09452458471059799,
1185
+ -0.06903683394193649,
1186
+ -0.11835796386003494,
1187
+ -0.08533279597759247,
1188
+ -0.0771995559334755,
1189
+ -0.1040348932147026,
1190
+ -0.10743240267038345,
1191
+ -0.06186848506331444,
1192
+ -0.09235931187868118,
1193
+ -0.052592772990465164,
1194
+ -0.06904541701078415,
1195
+ -0.07371632754802704,
1196
+ -0.10741108655929565,
1197
+ -0.05915733799338341,
1198
+ -0.051066379994153976,
1199
+ -0.06972707062959671,
1200
+ -0.07821008563041687,
1201
+ -0.05367730185389519,
1202
+ -0.06125984713435173,
1203
+ -0.07813957333564758,
1204
+ -0.06986301392316818,
1205
+ -0.11017470806837082,
1206
+ -0.06996914744377136,
1207
+ -0.05427330732345581,
1208
+ -0.049014732241630554,
1209
+ -0.06484035402536392,
1210
+ -0.06430783122777939,
1211
+ -0.0652451142668724,
1212
+ -0.05466066673398018,
1213
+ -0.048970337957143784,
1214
+ -0.07287704199552536,
1215
+ -0.06392456591129303,
1216
+ -0.0635431781411171,
1217
+ -0.06152886897325516,
1218
+ -0.057876963168382645,
1219
+ -0.042413853108882904,
1220
+ -0.07633647322654724,
1221
+ -0.0643203929066658,
1222
+ -0.05429358035326004,
1223
+ -0.08066803961992264,
1224
+ -0.03210672363638878,
1225
+ -0.06904635578393936,
1226
+ -0.06490110605955124,
1227
+ -0.05825822427868843,
1228
+ -0.05428257957100868,
1229
+ -0.07499688118696213,
1230
+ -0.05260239541530609,
1231
+ -0.04178810492157936,
1232
+ -0.0398712232708931,
1233
+ -0.05697103217244148,
1234
+ -0.06460782140493393,
1235
+ -0.06512656062841415,
1236
+ -0.0476703867316246,
1237
+ -0.05507079139351845,
1238
+ -0.034406691789627075,
1239
+ -0.044332895427942276,
1240
+ -0.0440828800201416,
1241
+ -0.03708498552441597,
1242
+ -0.0444052554666996,
1243
+ -0.0313878059387207,
1244
+ -0.04885256662964821,
1245
+ -0.04832703247666359,
1246
+ -0.04275417700409889,
1247
+ -0.039977606385946274,
1248
+ -0.04798528552055359,
1249
+ -0.036218736320734024
1250
+ ],
1251
+ "abs_loss": [
1252
+ 2.9939699172973633,
1253
+ 2.9671630859375,
1254
+ 2.884432315826416,
1255
+ 2.8786685466766357,
1256
+ 2.776923179626465,
1257
+ 2.5604119300842285,
1258
+ 2.4716804027557373,
1259
+ 2.3948922157287598,
1260
+ 2.30157470703125,
1261
+ 2.370891571044922,
1262
+ 2.3342669010162354,
1263
+ 2.3448739051818848,
1264
+ 2.310504198074341,
1265
+ 2.3500261306762695,
1266
+ 2.317657232284546,
1267
+ 2.2523250579833984,
1268
+ 2.266146183013916,
1269
+ 2.295795202255249,
1270
+ 2.3130407333374023,
1271
+ 2.391406536102295,
1272
+ 2.162468433380127,
1273
+ 2.2781295776367188,
1274
+ 1.9174010753631592,
1275
+ 1.5865317583084106,
1276
+ 1.27726149559021,
1277
+ 1.1252155303955078,
1278
+ 1.095202922821045,
1279
+ 1.0401458740234375,
1280
+ 0.9953299760818481,
1281
+ 0.9434686899185181,
1282
+ 0.9169909954071045,
1283
+ 0.926274299621582,
1284
+ 0.8359701037406921,
1285
+ 0.7653440833091736,
1286
+ 0.8254138231277466,
1287
+ 0.8021069765090942,
1288
+ 0.7468331456184387,
1289
+ 0.7645702362060547,
1290
+ 0.8108381628990173,
1291
+ 0.6716663241386414,
1292
+ 0.746320366859436,
1293
+ 0.7823787927627563,
1294
+ 0.6703470945358276,
1295
+ 0.6590404510498047,
1296
+ 0.5716877579689026,
1297
+ 0.5281146764755249,
1298
+ 0.5692504644393921,
1299
+ 0.5552536249160767,
1300
+ 0.49144041538238525,
1301
+ 0.49382561445236206,
1302
+ 0.5187468528747559,
1303
+ 0.4593263268470764,
1304
+ 0.43579062819480896,
1305
+ 0.3469533622264862,
1306
+ 0.3825676143169403,
1307
+ 0.42909789085388184,
1308
+ 0.453450471162796,
1309
+ 0.42889830470085144,
1310
+ 0.4658021926879883,
1311
+ 0.3615960478782654,
1312
+ 0.3724570870399475,
1313
+ 0.3933645486831665,
1314
+ 0.3598719835281372,
1315
+ 0.3870697319507599,
1316
+ 0.32773709297180176,
1317
+ 0.3438999652862549,
1318
+ 0.3137407600879669,
1319
+ 0.34169697761535645,
1320
+ 0.3478160500526428,
1321
+ 0.3136068284511566,
1322
+ 0.2495996057987213,
1323
+ 0.3967747986316681,
1324
+ 0.3151877522468567,
1325
+ 0.2217535525560379,
1326
+ 0.2176458090543747,
1327
+ 0.19214972853660583,
1328
+ 0.27432841062545776,
1329
+ 0.1991918683052063,
1330
+ 0.27142807841300964,
1331
+ 0.15668797492980957,
1332
+ 0.18449118733406067,
1333
+ 0.19276940822601318,
1334
+ 0.245790496468544,
1335
+ 0.25198858976364136,
1336
+ 0.18245406448841095,
1337
+ 0.1920507699251175,
1338
+ 0.23409833014011383,
1339
+ 0.15946322679519653,
1340
+ 0.28308606147766113,
1341
+ 0.229856938123703,
1342
+ 0.14451345801353455,
1343
+ 0.22815349698066711,
1344
+ 0.28472089767456055,
1345
+ 0.13943305611610413,
1346
+ 0.1525324136018753,
1347
+ 0.1800794005393982,
1348
+ 0.1788015067577362,
1349
+ 0.14676126837730408,
1350
+ 0.1801275610923767,
1351
+ 0.1274595558643341,
1352
+ 0.20488670468330383,
1353
+ 0.18262898921966553,
1354
+ 0.13823282718658447,
1355
+ 0.14368613064289093,
1356
+ 0.16121840476989746,
1357
+ 0.14759963750839233,
1358
+ 0.16873055696487427,
1359
+ 0.12227734923362732,
1360
+ 0.20998935401439667,
1361
+ 0.1513805091381073,
1362
+ 0.14927320182323456,
1363
+ 0.16616597771644592,
1364
+ 0.11357106268405914,
1365
+ 0.1548023819923401,
1366
+ 0.09905439615249634,
1367
+ 0.12770454585552216,
1368
+ 0.1254686415195465,
1369
+ 0.16130158305168152,
1370
+ 0.14453987777233124,
1371
+ 0.09974582493305206,
1372
+ 0.1397075355052948,
1373
+ 0.0725528672337532,
1374
+ 0.1555742621421814,
1375
+ 0.15362101793289185,
1376
+ 0.13945335149765015,
1377
+ 0.0919971913099289,
1378
+ 0.0827254205942154,
1379
+ 0.0957292690873146,
1380
+ 0.10747053474187851,
1381
+ 0.06503817439079285,
1382
+ 0.15155860781669617,
1383
+ 0.04873042181134224,
1384
+ 0.08255958557128906,
1385
+ 0.08030789345502853,
1386
+ 0.1114988625049591,
1387
+ 0.06541724503040314,
1388
+ 0.08628928661346436,
1389
+ 0.10699835419654846,
1390
+ 0.08059462904930115,
1391
+ 0.061577748507261276,
1392
+ 0.11694025248289108,
1393
+ 0.06307436525821686,
1394
+ 0.09791208803653717,
1395
+ 0.08975191414356232,
1396
+ 0.06224038451910019,
1397
+ 0.09754665940999985,
1398
+ 0.08535797894001007,
1399
+ 0.04807925969362259,
1400
+ 0.09415542334318161,
1401
+ 0.07146130502223969,
1402
+ 0.059969738125801086,
1403
+ 0.04297126829624176,
1404
+ 0.0620364174246788,
1405
+ 0.1250634789466858,
1406
+ 0.0725262314081192,
1407
+ 0.03369183838367462,
1408
+ 0.06068193167448044,
1409
+ 0.08214086294174194,
1410
+ 0.03255259618163109,
1411
+ 0.058612044900655746,
1412
+ 0.0757773369550705,
1413
+ 0.08017509430646896,
1414
+ 0.06201693415641785,
1415
+ 0.10843746364116669,
1416
+ 0.07148608565330505,
1417
+ 0.06171827018260956,
1418
+ 0.06407183408737183,
1419
+ 0.06668765842914581,
1420
+ 0.0908898115158081,
1421
+ 0.05957251414656639,
1422
+ 0.05260217934846878,
1423
+ 0.051984988152980804,
1424
+ 0.0426282063126564,
1425
+ 0.06798090785741806,
1426
+ 0.05817725509405136,
1427
+ 0.04371039941906929,
1428
+ 0.04418366029858589,
1429
+ 0.0658913254737854,
1430
+ 0.07025420665740967,
1431
+ 0.06737496703863144,
1432
+ 0.0334327295422554,
1433
+ 0.05061866343021393,
1434
+ 0.03713146224617958,
1435
+ 0.06372493505477905,
1436
+ 0.05535414442420006,
1437
+ 0.06243645027279854,
1438
+ 0.05203639715909958,
1439
+ 0.034955430775880814,
1440
+ 0.03983978554606438,
1441
+ 0.04079217463731766,
1442
+ 0.07475005090236664,
1443
+ 0.04801257699728012,
1444
+ 0.04809274151921272,
1445
+ 0.05396736413240433,
1446
+ 0.0625157505273819,
1447
+ 0.04173329472541809,
1448
+ 0.04280892014503479,
1449
+ 0.052977219223976135,
1450
+ 0.05912243202328682,
1451
+ 0.03089144080877304,
1452
+ 0.04570259898900986,
1453
+ 0.07775736600160599,
1454
+ 0.040590133517980576,
1455
+ 0.034856513142585754,
1456
+ 0.029137877747416496,
1457
+ 0.049085311591625214,
1458
+ 0.03855056315660477,
1459
+ 0.038246601819992065,
1460
+ 0.04657942056655884,
1461
+ 0.05626664310693741,
1462
+ 0.04340174049139023,
1463
+ 0.044082626700401306,
1464
+ 0.045361317694187164,
1465
+ 0.04138324409723282,
1466
+ 0.04377198964357376,
1467
+ 0.035163700580596924,
1468
+ 0.05173082649707794,
1469
+ 0.024585846811532974,
1470
+ 0.06613926589488983,
1471
+ 0.05189907178282738,
1472
+ 0.05301932990550995,
1473
+ 0.06153346598148346,
1474
+ 0.05094657838344574,
1475
+ 0.03458717092871666,
1476
+ 0.07255750894546509,
1477
+ 0.05777464807033539,
1478
+ 0.060308024287223816,
1479
+ 0.05367795377969742,
1480
+ 0.040390580892562866,
1481
+ 0.050002336502075195,
1482
+ 0.045242227613925934,
1483
+ 0.067792147397995,
1484
+ 0.03644957393407822,
1485
+ 0.036423034965991974,
1486
+ 0.039786197245121,
1487
+ 0.05897361785173416,
1488
+ 0.043324150145053864,
1489
+ 0.04928205907344818,
1490
+ 0.07481065392494202,
1491
+ 0.0536021813750267,
1492
+ 0.031223205849528313,
1493
+ 0.04402320832014084,
1494
+ 0.03952324390411377,
1495
+ 0.028211724013090134,
1496
+ 0.052927181124687195,
1497
+ 0.04173257201910019,
1498
+ 0.045009590685367584,
1499
+ 0.04482002928853035,
1500
+ 0.03669920563697815,
1501
+ 0.03860503435134888,
1502
+ 0.03810741752386093,
1503
+ 0.039218682795763016,
1504
+ 0.039497148245573044,
1505
+ 0.041818778961896896,
1506
+ 0.11109116673469543,
1507
+ 0.061651840806007385,
1508
+ 0.03293173015117645,
1509
+ 0.07021323591470718,
1510
+ 0.06279326975345612,
1511
+ 0.06056281179189682,
1512
+ 0.045141540467739105,
1513
+ 0.0443272665143013,
1514
+ 0.035209350287914276,
1515
+ 0.06140761077404022,
1516
+ 0.0379883348941803,
1517
+ 0.03811391070485115,
1518
+ 0.028341155499219894,
1519
+ 0.071586973965168,
1520
+ 0.037841156125068665,
1521
+ 0.032516077160835266,
1522
+ 0.06419142335653305,
1523
+ 0.04541822522878647,
1524
+ 0.04437222331762314,
1525
+ 0.04506922513246536,
1526
+ 0.06423269212245941,
1527
+ 0.06794172525405884,
1528
+ 0.04708072543144226,
1529
+ 0.0491417795419693,
1530
+ 0.04793268069624901,
1531
+ 0.056407395750284195,
1532
+ 0.04668997973203659,
1533
+ 0.03361371532082558,
1534
+ 0.04420556128025055,
1535
+ 0.04584401845932007,
1536
+ 0.058124154806137085,
1537
+ 0.05075351148843765,
1538
+ 0.04762536659836769,
1539
+ 0.028166018426418304,
1540
+ 0.039246730506420135,
1541
+ 0.024372506886720657,
1542
+ 0.02869992144405842,
1543
+ 0.04107384383678436,
1544
+ 0.037586912512779236,
1545
+ 0.02720024436712265,
1546
+ 0.05294787138700485,
1547
+ 0.04108988493680954,
1548
+ 0.06844684481620789,
1549
+ 0.04962025582790375,
1550
+ 0.04507195204496384,
1551
+ 0.0377793088555336,
1552
+ 0.03338238596916199,
1553
+ 0.029339665547013283,
1554
+ 0.041972436010837555,
1555
+ 0.0436406284570694,
1556
+ 0.04341753572225571,
1557
+ 0.038430675864219666,
1558
+ 0.0455116331577301,
1559
+ 0.03734186291694641,
1560
+ 0.039723582565784454,
1561
+ 0.04171336814761162
1562
+ ],
1563
+ "zipf_loss": [
1564
+ 7.451250076293945,
1565
+ 6.408680438995361,
1566
+ 4.66334867477417,
1567
+ 3.1472527980804443,
1568
+ 2.12677001953125,
1569
+ 1.4703617095947266,
1570
+ 1.2079733610153198,
1571
+ 1.1166588068008423,
1572
+ 1.0873239040374756,
1573
+ 1.0808907747268677,
1574
+ 1.0692203044891357,
1575
+ 1.0681169033050537,
1576
+ 1.068265438079834,
1577
+ 1.062654733657837,
1578
+ 1.0700738430023193,
1579
+ 1.0692996978759766,
1580
+ 1.0620827674865723,
1581
+ 1.063722014427185,
1582
+ 1.060462236404419,
1583
+ 1.0535626411437988,
1584
+ 1.0464571714401245,
1585
+ 0.9916824102401733,
1586
+ 0.7973968982696533,
1587
+ 0.4303833246231079,
1588
+ 0.25464576482772827,
1589
+ 0.18112242221832275,
1590
+ 0.14118769764900208,
1591
+ 0.11231985688209534,
1592
+ 0.11921684443950653,
1593
+ 0.10355470329523087,
1594
+ 0.09772571921348572,
1595
+ 0.07633695006370544,
1596
+ 0.07525299489498138,
1597
+ 0.06756086647510529,
1598
+ 0.05797893926501274,
1599
+ 0.0645289495587349,
1600
+ 0.06316487491130829,
1601
+ 0.05717369168996811,
1602
+ 0.05309152975678444,
1603
+ 0.059500209987163544,
1604
+ 0.05016370862722397,
1605
+ 0.06414783000946045,
1606
+ 0.049277856945991516,
1607
+ 0.05178428068757057,
1608
+ 0.050677619874477386,
1609
+ 0.04344857484102249,
1610
+ 0.04048430174589157,
1611
+ 0.043262459337711334,
1612
+ 0.03260765224695206,
1613
+ 0.0316011905670166,
1614
+ 0.035481661558151245,
1615
+ 0.03355970233678818,
1616
+ 0.03480807691812515,
1617
+ 0.04337979480624199,
1618
+ 0.04021717607975006,
1619
+ 0.03894573450088501,
1620
+ 0.03804963082075119,
1621
+ 0.0436682403087616,
1622
+ 0.026756424456834793,
1623
+ 0.03660731017589569,
1624
+ 0.0484175942838192,
1625
+ 0.027224961668252945,
1626
+ 0.03223637491464615,
1627
+ 0.031474702060222626,
1628
+ 0.0245464276522398,
1629
+ 0.03195098042488098,
1630
+ 0.0337882936000824,
1631
+ 0.024226512759923935,
1632
+ 0.04041041061282158,
1633
+ 0.0242144837975502,
1634
+ 0.05166645348072052,
1635
+ 0.028206858783960342,
1636
+ 0.02037244290113449,
1637
+ 0.04103923961520195,
1638
+ 0.03271396830677986,
1639
+ 0.0389174148440361,
1640
+ 0.01779547706246376,
1641
+ 0.024298420175909996,
1642
+ 0.02435200661420822,
1643
+ 0.0310731902718544,
1644
+ 0.043762996792793274,
1645
+ 0.023186862468719482,
1646
+ 0.012896795757114887,
1647
+ 0.021145079284906387,
1648
+ 0.020835932344198227,
1649
+ 0.018047045916318893,
1650
+ 0.012810098007321358,
1651
+ 0.024966878816485405,
1652
+ 0.017827903851866722,
1653
+ 0.016926929354667664,
1654
+ 0.026491889730095863,
1655
+ 0.018207557499408722,
1656
+ 0.017522133886814117,
1657
+ 0.030557341873645782,
1658
+ 0.020654890686273575,
1659
+ 0.028896065428853035,
1660
+ 0.026571379974484444,
1661
+ 0.016319354996085167,
1662
+ 0.020202092826366425,
1663
+ 0.029610808938741684,
1664
+ 0.012557116337120533,
1665
+ 0.02032800018787384,
1666
+ 0.021892979741096497,
1667
+ 0.01719818264245987,
1668
+ 0.02103794738650322,
1669
+ 0.02935318648815155,
1670
+ 0.030405551195144653,
1671
+ 0.03252723067998886,
1672
+ 0.00867812056094408,
1673
+ 0.02074713632464409,
1674
+ 0.015698475763201714,
1675
+ 0.011722991243004799,
1676
+ 0.03234492614865303,
1677
+ 0.028229666873812675,
1678
+ 0.02610444463789463,
1679
+ 0.04532650113105774,
1680
+ 0.014570198953151703,
1681
+ 0.01854710280895233,
1682
+ 0.019424980506300926,
1683
+ 0.03629154711961746,
1684
+ 0.023245664313435555,
1685
+ 0.03186134248971939,
1686
+ 0.01583409681916237,
1687
+ 0.020524701103568077,
1688
+ 0.01788824424147606,
1689
+ 0.018793335184454918,
1690
+ 0.018772277981042862,
1691
+ 0.016040731221437454,
1692
+ 0.024042334407567978,
1693
+ 0.032419975847005844,
1694
+ 0.023459697142243385,
1695
+ 0.04268075153231621,
1696
+ 0.040559835731983185,
1697
+ 0.041297949850559235,
1698
+ 0.026626912876963615,
1699
+ 0.038240011781454086,
1700
+ 0.025679288432002068,
1701
+ 0.025412321090698242,
1702
+ 0.008535143919289112,
1703
+ 0.023964766412973404,
1704
+ 0.03183385357260704,
1705
+ 0.012478039599955082,
1706
+ 0.039176903665065765,
1707
+ 0.02000630460679531,
1708
+ 0.037433817982673645,
1709
+ 0.014065584167838097,
1710
+ 0.02738261967897415,
1711
+ 0.03057205118238926,
1712
+ 0.016459379345178604,
1713
+ 0.014367847703397274,
1714
+ 0.0270213820040226,
1715
+ 0.019230935722589493,
1716
+ 0.02036147192120552,
1717
+ 0.020041000097990036,
1718
+ 0.021374955773353577,
1719
+ 0.02736235409975052,
1720
+ 0.0229208841919899,
1721
+ 0.015176897868514061,
1722
+ 0.03296041488647461,
1723
+ 0.018049122765660286,
1724
+ 0.024499420076608658,
1725
+ 0.0198210421949625,
1726
+ 0.03560253605246544,
1727
+ 0.018196703866124153,
1728
+ 0.011435543186962605,
1729
+ 0.01925329864025116,
1730
+ 0.01771029829978943,
1731
+ 0.027084290981292725,
1732
+ 0.011512783356010914,
1733
+ 0.025397945195436478,
1734
+ 0.020612847059965134,
1735
+ 0.02594551257789135,
1736
+ 0.04319647699594498,
1737
+ 0.021521996706724167,
1738
+ 0.03484001383185387,
1739
+ 0.03902372717857361,
1740
+ 0.0354827418923378,
1741
+ 0.01597800850868225,
1742
+ 0.022786952555179596,
1743
+ 0.024067774415016174,
1744
+ 0.033419813960790634,
1745
+ 0.03571859002113342,
1746
+ 0.019361130893230438,
1747
+ 0.018805410712957382,
1748
+ 0.01901128701865673,
1749
+ 0.029003391042351723,
1750
+ 0.025346096605062485,
1751
+ 0.026195811107754707,
1752
+ 0.026159092783927917,
1753
+ 0.04387412592768669,
1754
+ 0.008549627847969532,
1755
+ 0.02158566564321518,
1756
+ 0.01986076310276985,
1757
+ 0.028879765421152115,
1758
+ 0.014282393269240856,
1759
+ 0.02485613524913788,
1760
+ 0.03125353530049324,
1761
+ 0.01986345276236534,
1762
+ 0.024233564734458923,
1763
+ 0.011902973987162113,
1764
+ 0.024577759206295013,
1765
+ 0.016042353585362434,
1766
+ 0.011987978592514992,
1767
+ 0.025742169469594955,
1768
+ 0.021011892706155777,
1769
+ 0.032602109014987946,
1770
+ 0.03912978619337082,
1771
+ 0.025027155876159668,
1772
+ 0.013109790161252022,
1773
+ 0.017444519326090813,
1774
+ 0.012893719598650932,
1775
+ 0.015557706356048584,
1776
+ 0.009281215257942677,
1777
+ 0.014317827299237251,
1778
+ 0.011324967257678509,
1779
+ 0.015544028021395206,
1780
+ 0.023885592818260193,
1781
+ 0.034219738095998764,
1782
+ 0.016379375010728836,
1783
+ 0.02090553380548954,
1784
+ 0.012327917851507664,
1785
+ 0.007747444324195385,
1786
+ 0.014652317389845848,
1787
+ 0.03546038642525673,
1788
+ 0.016635488718748093,
1789
+ 0.019176919013261795,
1790
+ 0.026759976521134377,
1791
+ 0.015274486504495144,
1792
+ 0.0301537923514843,
1793
+ 0.023401426151394844,
1794
+ 0.012518497183918953,
1795
+ 0.01830344647169113,
1796
+ 0.0398789681494236,
1797
+ 0.027572210878133774,
1798
+ 0.01484921295195818,
1799
+ 0.02567104622721672,
1800
+ 0.019835088402032852,
1801
+ 0.021890200674533844,
1802
+ 0.013211222365498543,
1803
+ 0.016198618337512016,
1804
+ 0.027684208005666733,
1805
+ 0.03246186301112175,
1806
+ 0.025014076381921768,
1807
+ 0.031282939016819,
1808
+ 0.019341079518198967,
1809
+ 0.01121007651090622,
1810
+ 0.05722726881504059,
1811
+ 0.01904161088168621,
1812
+ 0.017972854897379875,
1813
+ 0.029342208057641983,
1814
+ 0.02938135340809822,
1815
+ 0.01949606090784073,
1816
+ 0.030802447348833084,
1817
+ 0.02320772409439087,
1818
+ 0.012835274450480938,
1819
+ 0.014723509550094604,
1820
+ 0.020546797662973404,
1821
+ 0.022897016257047653,
1822
+ 0.0207335464656353,
1823
+ 0.016994059085845947,
1824
+ 0.020833881571888924,
1825
+ 0.03790897876024246,
1826
+ 0.014503776095807552,
1827
+ 0.015054943971335888,
1828
+ 0.019398193806409836,
1829
+ 0.03550693765282631,
1830
+ 0.013697671703994274,
1831
+ 0.017846396192908287,
1832
+ 0.04219169169664383,
1833
+ 0.014930365607142448,
1834
+ 0.019009530544281006,
1835
+ 0.013570532202720642,
1836
+ 0.028888355940580368,
1837
+ 0.024936437606811523,
1838
+ 0.019072866067290306,
1839
+ 0.03190300613641739,
1840
+ 0.01832304522395134,
1841
+ 0.013086436316370964,
1842
+ 0.021511321887373924,
1843
+ 0.02479047141969204,
1844
+ 0.02936503291130066,
1845
+ 0.030410798266530037,
1846
+ 0.029518894851207733,
1847
+ 0.0086666289716959,
1848
+ 0.02178276889026165,
1849
+ 0.023903440684080124,
1850
+ 0.02072538062930107,
1851
+ 0.027063846588134766,
1852
+ 0.018409613519906998,
1853
+ 0.022470705211162567,
1854
+ 0.016372838988900185,
1855
+ 0.015885839238762856,
1856
+ 0.018846673890948296,
1857
+ 0.019834408536553383,
1858
+ 0.016668323427438736,
1859
+ 0.009349048137664795,
1860
+ 0.018301332369446754,
1861
+ 0.015596598386764526,
1862
+ 0.012940001673996449,
1863
+ 0.014462772756814957,
1864
+ 0.017800532281398773,
1865
+ 0.017340993508696556,
1866
+ 0.03484665974974632,
1867
+ 0.023790506646037102,
1868
+ 0.022296089679002762,
1869
+ 0.023357149213552475,
1870
+ 0.02819024957716465,
1871
+ 0.018858222290873528,
1872
+ 0.027981378138065338,
1873
+ 0.012247433885931969
1874
+ ],
1875
+ "denoise_loss": [],
1876
+ "ortho_loss": [
1877
+ 0.8152768015861511,
1878
+ 0.6726512312889099,
1879
+ 0.4814867675304413,
1880
+ 0.33432450890541077,
1881
+ 0.23814408481121063,
1882
+ 0.19757285714149475,
1883
+ 0.15554194152355194,
1884
+ 0.11246888339519501,
1885
+ 0.08865009248256683,
1886
+ 0.06748250871896744,
1887
+ 0.053425274789333344,
1888
+ 0.046865254640579224,
1889
+ 0.045605823397636414,
1890
+ 0.05257435888051987,
1891
+ 0.05854204297065735,
1892
+ 0.05769485980272293,
1893
+ 0.05553864315152168,
1894
+ 0.05860234424471855,
1895
+ 0.05860647186636925,
1896
+ 0.061698440462350845,
1897
+ 0.05941865220665932,
1898
+ 0.0612298808991909,
1899
+ 0.06598775833845139,
1900
+ 0.07615455240011215,
1901
+ 0.08855517953634262,
1902
+ 0.09619942307472229,
1903
+ 0.10664940625429153,
1904
+ 0.11464599519968033,
1905
+ 0.12268520891666412,
1906
+ 0.12900641560554504,
1907
+ 0.13469013571739197,
1908
+ 0.14923489093780518,
1909
+ 0.1556326299905777,
1910
+ 0.1598109006881714,
1911
+ 0.16741205751895905,
1912
+ 0.17854365706443787,
1913
+ 0.18381978571414948,
1914
+ 0.18534529209136963,
1915
+ 0.19115521013736725,
1916
+ 0.2001439779996872,
1917
+ 0.19999121129512787,
1918
+ 0.1972033977508545,
1919
+ 0.2024083286523819,
1920
+ 0.21319273114204407,
1921
+ 0.2191774547100067,
1922
+ 0.22613489627838135,
1923
+ 0.23462429642677307,
1924
+ 0.236800879240036,
1925
+ 0.23339171707630157,
1926
+ 0.23247872292995453,
1927
+ 0.22817456722259521,
1928
+ 0.23328275978565216,
1929
+ 0.22897255420684814,
1930
+ 0.2329391986131668,
1931
+ 0.2300928682088852,
1932
+ 0.23787039518356323,
1933
+ 0.23789697885513306,
1934
+ 0.2353580743074417,
1935
+ 0.2348659485578537,
1936
+ 0.2367279827594757,
1937
+ 0.23499399423599243,
1938
+ 0.22776924073696136,
1939
+ 0.23030073940753937,
1940
+ 0.2326144278049469,
1941
+ 0.2361035943031311,
1942
+ 0.2445068508386612,
1943
+ 0.24152973294258118,
1944
+ 0.2450699806213379,
1945
+ 0.24448467791080475,
1946
+ 0.250771701335907,
1947
+ 0.25215527415275574,
1948
+ 0.25353771448135376,
1949
+ 0.25054094195365906,
1950
+ 0.2454148232936859,
1951
+ 0.24659790098667145,
1952
+ 0.2457381933927536,
1953
+ 0.2508152425289154,
1954
+ 0.24626988172531128,
1955
+ 0.24414300918579102,
1956
+ 0.24193887412548065,
1957
+ 0.24609608948230743,
1958
+ 0.2430245280265808,
1959
+ 0.23835469782352448,
1960
+ 0.2364993542432785,
1961
+ 0.23474615812301636,
1962
+ 0.24188847839832306,
1963
+ 0.24022173881530762,
1964
+ 0.23649728298187256,
1965
+ 0.24024173617362976,
1966
+ 0.2449282854795456,
1967
+ 0.24722281098365784,
1968
+ 0.25538912415504456,
1969
+ 0.25413841009140015,
1970
+ 0.2641955316066742,
1971
+ 0.26872268319129944,
1972
+ 0.27901124954223633,
1973
+ 0.2832791209220886,
1974
+ 0.28473448753356934,
1975
+ 0.2893539071083069,
1976
+ 0.2969771921634674,
1977
+ 0.29966458678245544,
1978
+ 0.30459243059158325,
1979
+ 0.3059445023536682,
1980
+ 0.3044772744178772,
1981
+ 0.30405980348587036,
1982
+ 0.300637423992157,
1983
+ 0.3052726089954376,
1984
+ 0.3074321150779724,
1985
+ 0.3125714659690857,
1986
+ 0.3208770453929901,
1987
+ 0.3181338310241699,
1988
+ 0.31461143493652344,
1989
+ 0.3183312714099884,
1990
+ 0.32154226303100586,
1991
+ 0.3266172707080841,
1992
+ 0.3271406590938568,
1993
+ 0.3389417231082916,
1994
+ 0.3395279049873352,
1995
+ 0.3419077694416046,
1996
+ 0.3445950448513031,
1997
+ 0.35119402408599854,
1998
+ 0.3521731495857239,
1999
+ 0.35495105385780334,
2000
+ 0.36074918508529663,
2001
+ 0.36458420753479004,
2002
+ 0.36634451150894165,
2003
+ 0.371910035610199,
2004
+ 0.37581852078437805,
2005
+ 0.37285804748535156,
2006
+ 0.3766673505306244,
2007
+ 0.3756151497364044,
2008
+ 0.3773656189441681,
2009
+ 0.38035324215888977,
2010
+ 0.3852686882019043,
2011
+ 0.38913479447364807,
2012
+ 0.3900114595890045,
2013
+ 0.3948867619037628,
2014
+ 0.39293619990348816,
2015
+ 0.39555761218070984,
2016
+ 0.39592522382736206,
2017
+ 0.4046226143836975,
2018
+ 0.4075220823287964,
2019
+ 0.41104447841644287,
2020
+ 0.4172528088092804,
2021
+ 0.42129790782928467,
2022
+ 0.4249556362628937,
2023
+ 0.4267517328262329,
2024
+ 0.4287163317203522,
2025
+ 0.42599666118621826,
2026
+ 0.4283166229724884,
2027
+ 0.4292852580547333,
2028
+ 0.42729437351226807,
2029
+ 0.4295491576194763,
2030
+ 0.43094563484191895,
2031
+ 0.43256476521492004,
2032
+ 0.42930275201797485,
2033
+ 0.4368947148323059,
2034
+ 0.4383367896080017,
2035
+ 0.438157320022583,
2036
+ 0.4425742030143738,
2037
+ 0.4478302299976349,
2038
+ 0.45160001516342163,
2039
+ 0.4514777958393097,
2040
+ 0.4540557265281677,
2041
+ 0.45384475588798523,
2042
+ 0.45008739829063416,
2043
+ 0.4541735351085663,
2044
+ 0.45228561758995056,
2045
+ 0.4530966579914093,
2046
+ 0.453407883644104,
2047
+ 0.45556169748306274,
2048
+ 0.453635573387146,
2049
+ 0.449773371219635,
2050
+ 0.45001477003097534,
2051
+ 0.4513933062553406,
2052
+ 0.44678571820259094,
2053
+ 0.4457469880580902,
2054
+ 0.44657009840011597,
2055
+ 0.4523846507072449,
2056
+ 0.45246222615242004,
2057
+ 0.45434319972991943,
2058
+ 0.4541180431842804,
2059
+ 0.4578692615032196,
2060
+ 0.45711302757263184,
2061
+ 0.46016860008239746,
2062
+ 0.4629407227039337,
2063
+ 0.4631102979183197,
2064
+ 0.4657675623893738,
2065
+ 0.4634703993797302,
2066
+ 0.46504759788513184,
2067
+ 0.46310746669769287,
2068
+ 0.46426522731781006,
2069
+ 0.4652872085571289,
2070
+ 0.46551936864852905,
2071
+ 0.4635309875011444,
2072
+ 0.4650011360645294,
2073
+ 0.46778714656829834,
2074
+ 0.47348666191101074,
2075
+ 0.4748757779598236,
2076
+ 0.47525838017463684,
2077
+ 0.4781689941883087,
2078
+ 0.48228567838668823,
2079
+ 0.4811077117919922,
2080
+ 0.4817521274089813,
2081
+ 0.48237502574920654,
2082
+ 0.4820065498352051,
2083
+ 0.4831085503101349,
2084
+ 0.48647210001945496,
2085
+ 0.4832170307636261,
2086
+ 0.48424914479255676,
2087
+ 0.48679521679878235,
2088
+ 0.4905107319355011,
2089
+ 0.49074456095695496,
2090
+ 0.4933336079120636,
2091
+ 0.49535050988197327,
2092
+ 0.4951172173023224,
2093
+ 0.49591314792633057,
2094
+ 0.4948977530002594,
2095
+ 0.49568623304367065,
2096
+ 0.5002222657203674,
2097
+ 0.5023362040519714,
2098
+ 0.5024778842926025,
2099
+ 0.5055652856826782,
2100
+ 0.5075784921646118,
2101
+ 0.5095406770706177,
2102
+ 0.5118539929389954,
2103
+ 0.511347770690918,
2104
+ 0.5117764472961426,
2105
+ 0.5124334096908569,
2106
+ 0.5130148530006409,
2107
+ 0.5133326053619385,
2108
+ 0.515716016292572,
2109
+ 0.5170972347259521,
2110
+ 0.5180520415306091,
2111
+ 0.5196098685264587,
2112
+ 0.5221031308174133,
2113
+ 0.522267758846283,
2114
+ 0.5233892798423767,
2115
+ 0.5227095484733582,
2116
+ 0.5232641100883484,
2117
+ 0.5240395069122314,
2118
+ 0.5247151851654053,
2119
+ 0.5254992246627808,
2120
+ 0.5263919234275818,
2121
+ 0.5275459289550781,
2122
+ 0.5269024968147278,
2123
+ 0.5272529125213623,
2124
+ 0.5291876792907715,
2125
+ 0.5285334587097168,
2126
+ 0.5293962359428406,
2127
+ 0.5301678776741028,
2128
+ 0.5318194031715393,
2129
+ 0.5315480828285217,
2130
+ 0.5318052768707275,
2131
+ 0.5330978035926819,
2132
+ 0.5335772037506104,
2133
+ 0.5345197319984436,
2134
+ 0.5347660779953003,
2135
+ 0.5355949401855469,
2136
+ 0.5359938144683838,
2137
+ 0.5357021689414978,
2138
+ 0.5360286235809326,
2139
+ 0.5362545251846313,
2140
+ 0.5360153913497925,
2141
+ 0.5356314778327942,
2142
+ 0.5356934666633606,
2143
+ 0.5366938710212708,
2144
+ 0.5371251702308655,
2145
+ 0.5377495884895325,
2146
+ 0.5385035872459412,
2147
+ 0.5396519899368286,
2148
+ 0.5399116277694702,
2149
+ 0.5400606393814087,
2150
+ 0.5396886467933655,
2151
+ 0.5392147302627563,
2152
+ 0.5406867265701294,
2153
+ 0.541016161441803,
2154
+ 0.5407205820083618,
2155
+ 0.5415191650390625,
2156
+ 0.5420059561729431,
2157
+ 0.5414324402809143,
2158
+ 0.5414032340049744,
2159
+ 0.541130006313324,
2160
+ 0.541287362575531,
2161
+ 0.5413640141487122,
2162
+ 0.5415932536125183,
2163
+ 0.5416753888130188,
2164
+ 0.5421273112297058,
2165
+ 0.5426938533782959,
2166
+ 0.5429869890213013,
2167
+ 0.5438989400863647,
2168
+ 0.54445481300354,
2169
+ 0.544770359992981,
2170
+ 0.5452145338058472,
2171
+ 0.5455626249313354,
2172
+ 0.5453451871871948,
2173
+ 0.5460649728775024,
2174
+ 0.5464237928390503,
2175
+ 0.5463855266571045,
2176
+ 0.5465420484542847,
2177
+ 0.5464277267456055,
2178
+ 0.5472511053085327,
2179
+ 0.5475924015045166,
2180
+ 0.5475457906723022,
2181
+ 0.5479155778884888,
2182
+ 0.5478512048721313,
2183
+ 0.5478373765945435,
2184
+ 0.547956645488739,
2185
+ 0.5484586954116821,
2186
+ 0.5486555695533752
2187
+ ],
2188
+ "lr": [
2189
+ 4.188034188034189e-06,
2190
+ 8.461538461538462e-06,
2191
+ 1.2735042735042738e-05,
2192
+ 1.700854700854701e-05,
2193
+ 2.1282051282051282e-05,
2194
+ 2.5555555555555557e-05,
2195
+ 2.9829059829059833e-05,
2196
+ 3.4102564102564105e-05,
2197
+ 3.837606837606838e-05,
2198
+ 4e-05,
2199
+ 4e-05,
2200
+ 4e-05,
2201
+ 4e-05,
2202
+ 4e-05,
2203
+ 4e-05,
2204
+ 4e-05,
2205
+ 4e-05,
2206
+ 4e-05,
2207
+ 4e-05,
2208
+ 4e-05,
2209
+ 4e-05,
2210
+ 4e-05,
2211
+ 4e-05,
2212
+ 4e-05,
2213
+ 4e-05,
2214
+ 4e-05,
2215
+ 4e-05,
2216
+ 4e-05,
2217
+ 4e-05,
2218
+ 4e-05,
2219
+ 4e-05,
2220
+ 4e-05,
2221
+ 4e-05,
2222
+ 4e-05,
2223
+ 4e-05,
2224
+ 4e-05,
2225
+ 4e-05,
2226
+ 4e-05,
2227
+ 4e-05,
2228
+ 4e-05,
2229
+ 4e-05,
2230
+ 4e-05,
2231
+ 4e-05,
2232
+ 4e-05,
2233
+ 4e-05,
2234
+ 4e-05,
2235
+ 4e-05,
2236
+ 4e-05,
2237
+ 4e-05,
2238
+ 4e-05,
2239
+ 4e-05,
2240
+ 4e-05,
2241
+ 4e-05,
2242
+ 4e-05,
2243
+ 4e-05,
2244
+ 4e-05,
2245
+ 4e-05,
2246
+ 4e-05,
2247
+ 4e-05,
2248
+ 4e-05,
2249
+ 4e-05,
2250
+ 4e-05,
2251
+ 4e-05,
2252
+ 4e-05,
2253
+ 4e-05,
2254
+ 4e-05,
2255
+ 4e-05,
2256
+ 4e-05,
2257
+ 4e-05,
2258
+ 4e-05,
2259
+ 4e-05,
2260
+ 4e-05,
2261
+ 4e-05,
2262
+ 4e-05,
2263
+ 4e-05,
2264
+ 4e-05,
2265
+ 4e-05,
2266
+ 4e-05,
2267
+ 4e-05,
2268
+ 4e-05,
2269
+ 4e-05,
2270
+ 4e-05,
2271
+ 4e-05,
2272
+ 4e-05,
2273
+ 4e-05,
2274
+ 4e-05,
2275
+ 4e-05,
2276
+ 4e-05,
2277
+ 4e-05,
2278
+ 4e-05,
2279
+ 4e-05,
2280
+ 4e-05,
2281
+ 4e-05,
2282
+ 4e-05,
2283
+ 4e-05,
2284
+ 4e-05,
2285
+ 4e-05,
2286
+ 4e-05,
2287
+ 4e-05,
2288
+ 4e-05,
2289
+ 4e-05,
2290
+ 4e-05,
2291
+ 4e-05,
2292
+ 4e-05,
2293
+ 4e-05,
2294
+ 4e-05,
2295
+ 4e-05,
2296
+ 4e-05,
2297
+ 4e-05,
2298
+ 4e-05,
2299
+ 4e-05,
2300
+ 4e-05,
2301
+ 4e-05,
2302
+ 4e-05,
2303
+ 4e-05,
2304
+ 4e-05,
2305
+ 4e-05,
2306
+ 4e-05,
2307
+ 4e-05,
2308
+ 4e-05,
2309
+ 4e-05,
2310
+ 4e-05,
2311
+ 4e-05,
2312
+ 4e-05,
2313
+ 4e-05,
2314
+ 4e-05,
2315
+ 4e-05,
2316
+ 4e-05,
2317
+ 4e-05,
2318
+ 4e-05,
2319
+ 4e-05,
2320
+ 4e-05,
2321
+ 4e-05,
2322
+ 4e-05,
2323
+ 4e-05,
2324
+ 4e-05,
2325
+ 4e-05,
2326
+ 4e-05,
2327
+ 4e-05,
2328
+ 4e-05,
2329
+ 4e-05,
2330
+ 4e-05,
2331
+ 4e-05,
2332
+ 4e-05,
2333
+ 4e-05,
2334
+ 4e-05,
2335
+ 4e-05,
2336
+ 4e-05,
2337
+ 4e-05,
2338
+ 4e-05,
2339
+ 4e-05,
2340
+ 4e-05,
2341
+ 4e-05,
2342
+ 4e-05,
2343
+ 4e-05,
2344
+ 4e-05,
2345
+ 4e-05,
2346
+ 4e-05,
2347
+ 4e-05,
2348
+ 4e-05,
2349
+ 4e-05,
2350
+ 4e-05,
2351
+ 4e-05,
2352
+ 4e-05,
2353
+ 4e-05,
2354
+ 4e-05,
2355
+ 4e-05,
2356
+ 4e-05,
2357
+ 4e-05,
2358
+ 4e-05,
2359
+ 4e-05,
2360
+ 4e-05,
2361
+ 4e-05,
2362
+ 4e-05,
2363
+ 4e-05,
2364
+ 4e-05,
2365
+ 4e-05,
2366
+ 4e-05,
2367
+ 4e-05,
2368
+ 4e-05,
2369
+ 4e-05,
2370
+ 4e-05,
2371
+ 4e-05,
2372
+ 4e-05,
2373
+ 4e-05,
2374
+ 4e-05,
2375
+ 4e-05,
2376
+ 4e-05,
2377
+ 4e-05,
2378
+ 3.992995647012267e-05,
2379
+ 3.963316185199842e-05,
2380
+ 3.933636723387416e-05,
2381
+ 3.90395726157499e-05,
2382
+ 3.874277799762565e-05,
2383
+ 3.844598337950139e-05,
2384
+ 3.814918876137713e-05,
2385
+ 3.785239414325287e-05,
2386
+ 3.7555599525128613e-05,
2387
+ 3.725880490700435e-05,
2388
+ 3.696201028888009e-05,
2389
+ 3.666521567075585e-05,
2390
+ 3.6368421052631585e-05,
2391
+ 3.607162643450732e-05,
2392
+ 3.577483181638307e-05,
2393
+ 3.547803719825881e-05,
2394
+ 3.518124258013455e-05,
2395
+ 3.4884447962010287e-05,
2396
+ 3.458765334388604e-05,
2397
+ 3.4290858725761776e-05,
2398
+ 3.399406410763751e-05,
2399
+ 3.3697269489513265e-05,
2400
+ 3.3400474871389e-05,
2401
+ 3.310368025326474e-05,
2402
+ 3.280688563514048e-05,
2403
+ 3.251009101701623e-05,
2404
+ 3.2213296398891967e-05,
2405
+ 3.191650178076771e-05,
2406
+ 3.1542540561931145e-05,
2407
+ 3.124574594380688e-05,
2408
+ 3.094895132568263e-05,
2409
+ 3.065215670755838e-05,
2410
+ 3.0355362089434113e-05,
2411
+ 3.0058567471309854e-05,
2412
+ 2.97617728531856e-05,
2413
+ 2.9464978235061336e-05,
2414
+ 2.9168183616937077e-05,
2415
+ 2.8871388998812818e-05,
2416
+ 2.857459438068857e-05,
2417
+ 2.8277799762564307e-05,
2418
+ 2.798100514444005e-05,
2419
+ 2.7684210526315793e-05,
2420
+ 2.738741590819153e-05,
2421
+ 2.709062129006727e-05,
2422
+ 2.6793826671943013e-05,
2423
+ 2.6497032053818764e-05,
2424
+ 2.62002374356945e-05,
2425
+ 2.5903442817570243e-05,
2426
+ 2.5606648199445987e-05,
2427
+ 2.5309853581321725e-05,
2428
+ 2.5013058963197466e-05,
2429
+ 2.4716264345073214e-05,
2430
+ 2.441946972694896e-05,
2431
+ 2.4122675108824693e-05,
2432
+ 2.3825880490700434e-05,
2433
+ 2.352908587257618e-05,
2434
+ 2.3232291254451916e-05,
2435
+ 2.293549663632766e-05,
2436
+ 2.2638702018203408e-05,
2437
+ 2.226474079936684e-05,
2438
+ 2.196794618124258e-05,
2439
+ 2.1671151563118328e-05,
2440
+ 2.1374356944994066e-05,
2441
+ 2.1077562326869803e-05,
2442
+ 2.0780767708745554e-05,
2443
+ 2.0483973090621296e-05,
2444
+ 2.018717847249703e-05,
2445
+ 1.989038385437277e-05,
2446
+ 1.959358923624852e-05,
2447
+ 1.929679461812426e-05,
2448
+ 1.8999999999999998e-05,
2449
+ 1.8703205381875746e-05,
2450
+ 1.8406410763751487e-05,
2451
+ 1.8109616145627224e-05,
2452
+ 1.7812821527502965e-05,
2453
+ 1.7516026909378713e-05,
2454
+ 1.7219232291254454e-05,
2455
+ 1.6922437673130192e-05,
2456
+ 1.662564305500594e-05,
2457
+ 1.632884843688168e-05,
2458
+ 1.603205381875742e-05,
2459
+ 1.573525920063316e-05,
2460
+ 1.5438464582508908e-05,
2461
+ 1.5141669964384647e-05,
2462
+ 1.4844875346260385e-05,
2463
+ 1.4548080728136134e-05,
2464
+ 1.4251286110011875e-05,
2465
+ 1.3954491491887611e-05,
2466
+ 1.3657696873763363e-05,
2467
+ 1.33609022556391e-05,
2468
+ 1.298694103680253e-05,
2469
+ 1.2690146418678277e-05,
2470
+ 1.2393351800554018e-05,
2471
+ 1.2096557182429756e-05,
2472
+ 1.1799762564305506e-05,
2473
+ 1.1502967946181245e-05,
2474
+ 1.1206173328056984e-05,
2475
+ 1.0909378709932724e-05,
2476
+ 1.0612584091808472e-05,
2477
+ 1.0315789473684213e-05,
2478
+ 1.0018994855559949e-05,
2479
+ 9.7222002374357e-06,
2480
+ 9.425405619311438e-06,
2481
+ 9.128611001187177e-06,
2482
+ 8.831816383062916e-06,
2483
+ 8.535021764938666e-06,
2484
+ 8.238227146814405e-06,
2485
+ 7.941432528690143e-06,
2486
+ 7.644637910565893e-06,
2487
+ 7.347843292441632e-06,
2488
+ 7.0510486743173715e-06,
2489
+ 6.75425405619311e-06,
2490
+ 6.45745943806886e-06,
2491
+ 6.160664819944598e-06,
2492
+ 5.8638702018203375e-06,
2493
+ 5.567075583696086e-06,
2494
+ 5.270280965571826e-06,
2495
+ 4.973486347447565e-06,
2496
+ 4.676691729323314e-06,
2497
+ 4.379897111199053e-06,
2498
+ 4.083102493074792e-06
2499
+ ],
2500
+ "emb_lr": [],
2501
+ "eval_step": [
2502
+ 1550,
2503
+ 3113,
2504
+ 4676,
2505
+ 6239,
2506
+ 7802,
2507
+ 9365,
2508
+ 10928,
2509
+ 12491,
2510
+ 14054,
2511
+ 15617
2512
+ ],
2513
+ "eval_accuracy": [
2514
+ 0.46,
2515
+ 0.94,
2516
+ 0.9,
2517
+ 0.99,
2518
+ 0.98,
2519
+ 1.0,
2520
+ 1.0,
2521
+ 1.0,
2522
+ 1.0,
2523
+ 1.0
2524
+ ]
2525
+ },
2526
+ "final_accuracy": 0.9958333333333333,
2527
+ "sft_eval": {
2528
+ "config": {
2529
+ "ops": "add_sub",
2530
+ "K": null,
2531
+ "mode": "sft",
2532
+ "n_digits": 6,
2533
+ "n_per_split": 100
2534
+ },
2535
+ "splits": {
2536
+ "add_S0": {
2537
+ "full_accuracy": 1.0,
2538
+ "n_examples": 100,
2539
+ "per_subtask": {
2540
+ "SA": {
2541
+ "accuracy": 1.0,
2542
+ "count": 605
2543
+ },
2544
+ "SS": {
2545
+ "accuracy": 1.0,
2546
+ "count": 95
2547
+ }
2548
+ }
2549
+ },
2550
+ "add_S1": {
2551
+ "full_accuracy": 0.96,
2552
+ "n_examples": 100,
2553
+ "per_subtask": {
2554
+ "SA": {
2555
+ "accuracy": 0.9950980392156863,
2556
+ "count": 204
2557
+ },
2558
+ "SC": {
2559
+ "accuracy": 0.9940828402366864,
2560
+ "count": 169
2561
+ },
2562
+ "SS": {
2563
+ "accuracy": 1.0,
2564
+ "count": 31
2565
+ },
2566
+ "UC": {
2567
+ "accuracy": 0.9932432432432432,
2568
+ "count": 296
2569
+ }
2570
+ }
2571
+ },
2572
+ "add_S2": {
2573
+ "full_accuracy": 0.98,
2574
+ "n_examples": 100,
2575
+ "per_subtask": {
2576
+ "SA": {
2577
+ "accuracy": 1.0,
2578
+ "count": 163
2579
+ },
2580
+ "SC": {
2581
+ "accuracy": 0.9923076923076923,
2582
+ "count": 130
2583
+ },
2584
+ "SS": {
2585
+ "accuracy": 0.9885057471264368,
2586
+ "count": 87
2587
+ },
2588
+ "UC": {
2589
+ "accuracy": 1.0,
2590
+ "count": 203
2591
+ },
2592
+ "US": {
2593
+ "accuracy": 1.0,
2594
+ "count": 117
2595
+ }
2596
+ }
2597
+ },
2598
+ "add_S3": {
2599
+ "full_accuracy": 0.71,
2600
+ "n_examples": 100,
2601
+ "per_subtask": {
2602
+ "SA": {
2603
+ "accuracy": 1.0,
2604
+ "count": 121
2605
+ },
2606
+ "SC": {
2607
+ "accuracy": 0.9917355371900827,
2608
+ "count": 121
2609
+ },
2610
+ "SS": {
2611
+ "accuracy": 1.0,
2612
+ "count": 49
2613
+ },
2614
+ "UC": {
2615
+ "accuracy": 0.8494623655913979,
2616
+ "count": 186
2617
+ },
2618
+ "US": {
2619
+ "accuracy": 0.9910313901345291,
2620
+ "count": 223
2621
+ }
2622
+ }
2623
+ },
2624
+ "add_S4": {
2625
+ "full_accuracy": 0.52,
2626
+ "n_examples": 100,
2627
+ "per_subtask": {
2628
+ "SA": {
2629
+ "accuracy": 1.0,
2630
+ "count": 104
2631
+ },
2632
+ "SC": {
2633
+ "accuracy": 1.0,
2634
+ "count": 106
2635
+ },
2636
+ "SS": {
2637
+ "accuracy": 1.0,
2638
+ "count": 23
2639
+ },
2640
+ "UC": {
2641
+ "accuracy": 0.7375,
2642
+ "count": 160
2643
+ },
2644
+ "US": {
2645
+ "accuracy": 0.8892508143322475,
2646
+ "count": 307
2647
+ }
2648
+ }
2649
+ },
2650
+ "add_S5": {
2651
+ "full_accuracy": 0.33,
2652
+ "n_examples": 100,
2653
+ "per_subtask": {
2654
+ "SA": {
2655
+ "accuracy": 1.0,
2656
+ "count": 100
2657
+ },
2658
+ "SC": {
2659
+ "accuracy": 1.0,
2660
+ "count": 100
2661
+ },
2662
+ "UC": {
2663
+ "accuracy": 0.44,
2664
+ "count": 100
2665
+ },
2666
+ "US": {
2667
+ "accuracy": 0.7025,
2668
+ "count": 400
2669
+ }
2670
+ }
2671
+ },
2672
+ "add_S6": {
2673
+ "full_accuracy": 0.63,
2674
+ "n_examples": 100,
2675
+ "per_subtask": {
2676
+ "SC": {
2677
+ "accuracy": 1.0,
2678
+ "count": 100
2679
+ },
2680
+ "UC": {
2681
+ "accuracy": 0.66,
2682
+ "count": 100
2683
+ },
2684
+ "US": {
2685
+ "accuracy": 0.784,
2686
+ "count": 500
2687
+ }
2688
+ }
2689
+ },
2690
+ "add_random": {
2691
+ "full_accuracy": 0.985,
2692
+ "n_examples": 200,
2693
+ "per_subtask": {
2694
+ "SA": {
2695
+ "accuracy": 1.0,
2696
+ "count": 447
2697
+ },
2698
+ "SC": {
2699
+ "accuracy": 1.0,
2700
+ "count": 320
2701
+ },
2702
+ "SS": {
2703
+ "accuracy": 1.0,
2704
+ "count": 56
2705
+ },
2706
+ "UC": {
2707
+ "accuracy": 0.994328922495274,
2708
+ "count": 529
2709
+ },
2710
+ "US": {
2711
+ "accuracy": 1.0,
2712
+ "count": 48
2713
+ }
2714
+ }
2715
+ },
2716
+ "add_C3": {
2717
+ "full_accuracy": 0.88,
2718
+ "n_examples": 100,
2719
+ "per_subtask": {
2720
+ "SA": {
2721
+ "accuracy": 1.0,
2722
+ "count": 300
2723
+ },
2724
+ "SC": {
2725
+ "accuracy": 1.0,
2726
+ "count": 100
2727
+ },
2728
+ "UC": {
2729
+ "accuracy": 0.9378238341968912,
2730
+ "count": 193
2731
+ },
2732
+ "US": {
2733
+ "accuracy": 1.0,
2734
+ "count": 107
2735
+ }
2736
+ }
2737
+ },
2738
+ "add_C4": {
2739
+ "full_accuracy": 0.78,
2740
+ "n_examples": 100,
2741
+ "per_subtask": {
2742
+ "SA": {
2743
+ "accuracy": 1.0,
2744
+ "count": 200
2745
+ },
2746
+ "SC": {
2747
+ "accuracy": 1.0,
2748
+ "count": 100
2749
+ },
2750
+ "UC": {
2751
+ "accuracy": 0.921875,
2752
+ "count": 256
2753
+ },
2754
+ "US": {
2755
+ "accuracy": 0.9236111111111112,
2756
+ "count": 144
2757
+ }
2758
+ }
2759
+ },
2760
+ "add_C5": {
2761
+ "full_accuracy": 0.74,
2762
+ "n_examples": 100,
2763
+ "per_subtask": {
2764
+ "SA": {
2765
+ "accuracy": 1.0,
2766
+ "count": 100
2767
+ },
2768
+ "SC": {
2769
+ "accuracy": 0.99,
2770
+ "count": 100
2771
+ },
2772
+ "UC": {
2773
+ "accuracy": 0.9183006535947712,
2774
+ "count": 306
2775
+ },
2776
+ "US": {
2777
+ "accuracy": 0.9329896907216495,
2778
+ "count": 194
2779
+ }
2780
+ }
2781
+ },
2782
+ "add_C6": {
2783
+ "full_accuracy": 0.76,
2784
+ "n_examples": 100,
2785
+ "per_subtask": {
2786
+ "SC": {
2787
+ "accuracy": 1.0,
2788
+ "count": 100
2789
+ },
2790
+ "UC": {
2791
+ "accuracy": 0.9371584699453552,
2792
+ "count": 366
2793
+ },
2794
+ "US": {
2795
+ "accuracy": 0.9743589743589743,
2796
+ "count": 234
2797
+ }
2798
+ }
2799
+ },
2800
+ "sub_M0": {
2801
+ "full_accuracy": 0.98,
2802
+ "n_examples": 100,
2803
+ "per_subtask": {
2804
+ "MD": {
2805
+ "accuracy": 0.9966722129783694,
2806
+ "count": 601
2807
+ },
2808
+ "ME": {
2809
+ "accuracy": 0.9797979797979798,
2810
+ "count": 99
2811
+ }
2812
+ }
2813
+ },
2814
+ "sub_M1": {
2815
+ "full_accuracy": 0.96,
2816
+ "n_examples": 100,
2817
+ "per_subtask": {
2818
+ "MD": {
2819
+ "accuracy": 0.989247311827957,
2820
+ "count": 279
2821
+ },
2822
+ "MB": {
2823
+ "accuracy": 0.993103448275862,
2824
+ "count": 145
2825
+ },
2826
+ "ME": {
2827
+ "accuracy": 1.0,
2828
+ "count": 24
2829
+ },
2830
+ "UB": {
2831
+ "accuracy": 1.0,
2832
+ "count": 252
2833
+ }
2834
+ }
2835
+ },
2836
+ "sub_M2": {
2837
+ "full_accuracy": 0.98,
2838
+ "n_examples": 100,
2839
+ "per_subtask": {
2840
+ "MD": {
2841
+ "accuracy": 0.9953051643192489,
2842
+ "count": 213
2843
+ },
2844
+ "MB": {
2845
+ "accuracy": 1.0,
2846
+ "count": 113
2847
+ },
2848
+ "ME": {
2849
+ "accuracy": 1.0,
2850
+ "count": 85
2851
+ },
2852
+ "UB": {
2853
+ "accuracy": 0.994475138121547,
2854
+ "count": 181
2855
+ },
2856
+ "UD": {
2857
+ "accuracy": 1.0,
2858
+ "count": 108
2859
+ }
2860
+ }
2861
+ },
2862
+ "sub_M3": {
2863
+ "full_accuracy": 0.78,
2864
+ "n_examples": 100,
2865
+ "per_subtask": {
2866
+ "MD": {
2867
+ "accuracy": 1.0,
2868
+ "count": 179
2869
+ },
2870
+ "MB": {
2871
+ "accuracy": 0.9902912621359223,
2872
+ "count": 103
2873
+ },
2874
+ "ME": {
2875
+ "accuracy": 1.0,
2876
+ "count": 56
2877
+ },
2878
+ "UB": {
2879
+ "accuracy": 0.8590604026845637,
2880
+ "count": 149
2881
+ },
2882
+ "UD": {
2883
+ "accuracy": 1.0,
2884
+ "count": 213
2885
+ }
2886
+ }
2887
+ },
2888
+ "sub_M4": {
2889
+ "full_accuracy": 0.4,
2890
+ "n_examples": 100,
2891
+ "per_subtask": {
2892
+ "MD": {
2893
+ "accuracy": 1.0,
2894
+ "count": 200
2895
+ },
2896
+ "MB": {
2897
+ "accuracy": 1.0,
2898
+ "count": 100
2899
+ },
2900
+ "UB": {
2901
+ "accuracy": 0.62,
2902
+ "count": 100
2903
+ },
2904
+ "UD": {
2905
+ "accuracy": 0.8566666666666667,
2906
+ "count": 300
2907
+ }
2908
+ }
2909
+ },
2910
+ "sub_M5": {
2911
+ "full_accuracy": 0.32,
2912
+ "n_examples": 100,
2913
+ "per_subtask": {
2914
+ "MD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 100
2917
+ },
2918
+ "MB": {
2919
+ "accuracy": 1.0,
2920
+ "count": 100
2921
+ },
2922
+ "UB": {
2923
+ "accuracy": 0.69,
2924
+ "count": 100
2925
+ },
2926
+ "UD": {
2927
+ "accuracy": 0.7375,
2928
+ "count": 400
2929
+ }
2930
+ }
2931
+ },
2932
+ "sub_random": {
2933
+ "full_accuracy": 0.945,
2934
+ "n_examples": 200,
2935
+ "per_subtask": {
2936
+ "MD": {
2937
+ "accuracy": 0.9866666666666667,
2938
+ "count": 600
2939
+ },
2940
+ "MB": {
2941
+ "accuracy": 1.0,
2942
+ "count": 267
2943
+ },
2944
+ "ME": {
2945
+ "accuracy": 1.0,
2946
+ "count": 53
2947
+ },
2948
+ "UB": {
2949
+ "accuracy": 0.9908883826879271,
2950
+ "count": 439
2951
+ },
2952
+ "UD": {
2953
+ "accuracy": 1.0,
2954
+ "count": 41
2955
+ }
2956
+ }
2957
+ },
2958
+ "sub_B3": {
2959
+ "full_accuracy": 0.86,
2960
+ "n_examples": 100,
2961
+ "per_subtask": {
2962
+ "MD": {
2963
+ "accuracy": 0.9933333333333333,
2964
+ "count": 300
2965
+ },
2966
+ "MB": {
2967
+ "accuracy": 1.0,
2968
+ "count": 100
2969
+ },
2970
+ "UB": {
2971
+ "accuracy": 0.949238578680203,
2972
+ "count": 197
2973
+ },
2974
+ "UD": {
2975
+ "accuracy": 0.9611650485436893,
2976
+ "count": 103
2977
+ }
2978
+ }
2979
+ },
2980
+ "sub_B4": {
2981
+ "full_accuracy": 0.82,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "MD": {
2985
+ "accuracy": 0.99,
2986
+ "count": 200
2987
+ },
2988
+ "MB": {
2989
+ "accuracy": 1.0,
2990
+ "count": 100
2991
+ },
2992
+ "UB": {
2993
+ "accuracy": 0.9433198380566802,
2994
+ "count": 247
2995
+ },
2996
+ "UD": {
2997
+ "accuracy": 0.9607843137254902,
2998
+ "count": 153
2999
+ }
3000
+ }
3001
+ },
3002
+ "sub_B5": {
3003
+ "full_accuracy": 0.87,
3004
+ "n_examples": 100,
3005
+ "per_subtask": {
3006
+ "MD": {
3007
+ "accuracy": 1.0,
3008
+ "count": 100
3009
+ },
3010
+ "MB": {
3011
+ "accuracy": 1.0,
3012
+ "count": 100
3013
+ },
3014
+ "UB": {
3015
+ "accuracy": 0.9630872483221476,
3016
+ "count": 298
3017
+ },
3018
+ "UD": {
3019
+ "accuracy": 0.9900990099009901,
3020
+ "count": 202
3021
+ }
3022
+ }
3023
+ }
3024
+ },
3025
+ "summary": {
3026
+ "overall_accuracy": 0.7966666666666666,
3027
+ "total_examples": 2400,
3028
+ "n_splits": 22
3029
+ }
3030
+ },
3031
+ "sorl_eval": {
3032
+ "config": {
3033
+ "ops": "add_sub",
3034
+ "K": 4,
3035
+ "mode": "sorl",
3036
+ "n_digits": 6,
3037
+ "n_per_split": 100
3038
+ },
3039
+ "splits": {
3040
+ "add_S0": {
3041
+ "full_accuracy": 1.0,
3042
+ "n_examples": 100,
3043
+ "per_subtask": {
3044
+ "SA": {
3045
+ "accuracy": 1.0,
3046
+ "count": 605
3047
+ },
3048
+ "SS": {
3049
+ "accuracy": 1.0,
3050
+ "count": 95
3051
+ }
3052
+ }
3053
+ },
3054
+ "add_S1": {
3055
+ "full_accuracy": 1.0,
3056
+ "n_examples": 100,
3057
+ "per_subtask": {
3058
+ "SA": {
3059
+ "accuracy": 1.0,
3060
+ "count": 204
3061
+ },
3062
+ "SC": {
3063
+ "accuracy": 1.0,
3064
+ "count": 169
3065
+ },
3066
+ "SS": {
3067
+ "accuracy": 1.0,
3068
+ "count": 31
3069
+ },
3070
+ "UC": {
3071
+ "accuracy": 1.0,
3072
+ "count": 296
3073
+ }
3074
+ }
3075
+ },
3076
+ "add_S2": {
3077
+ "full_accuracy": 1.0,
3078
+ "n_examples": 100,
3079
+ "per_subtask": {
3080
+ "SA": {
3081
+ "accuracy": 1.0,
3082
+ "count": 163
3083
+ },
3084
+ "SC": {
3085
+ "accuracy": 1.0,
3086
+ "count": 130
3087
+ },
3088
+ "SS": {
3089
+ "accuracy": 1.0,
3090
+ "count": 87
3091
+ },
3092
+ "UC": {
3093
+ "accuracy": 1.0,
3094
+ "count": 203
3095
+ },
3096
+ "US": {
3097
+ "accuracy": 1.0,
3098
+ "count": 117
3099
+ }
3100
+ }
3101
+ },
3102
+ "add_S3": {
3103
+ "full_accuracy": 1.0,
3104
+ "n_examples": 100,
3105
+ "per_subtask": {
3106
+ "SA": {
3107
+ "accuracy": 1.0,
3108
+ "count": 121
3109
+ },
3110
+ "SC": {
3111
+ "accuracy": 1.0,
3112
+ "count": 121
3113
+ },
3114
+ "SS": {
3115
+ "accuracy": 1.0,
3116
+ "count": 49
3117
+ },
3118
+ "UC": {
3119
+ "accuracy": 1.0,
3120
+ "count": 186
3121
+ },
3122
+ "US": {
3123
+ "accuracy": 1.0,
3124
+ "count": 223
3125
+ }
3126
+ }
3127
+ },
3128
+ "add_S4": {
3129
+ "full_accuracy": 1.0,
3130
+ "n_examples": 100,
3131
+ "per_subtask": {
3132
+ "SA": {
3133
+ "accuracy": 1.0,
3134
+ "count": 104
3135
+ },
3136
+ "SC": {
3137
+ "accuracy": 1.0,
3138
+ "count": 106
3139
+ },
3140
+ "SS": {
3141
+ "accuracy": 1.0,
3142
+ "count": 23
3143
+ },
3144
+ "UC": {
3145
+ "accuracy": 1.0,
3146
+ "count": 160
3147
+ },
3148
+ "US": {
3149
+ "accuracy": 1.0,
3150
+ "count": 307
3151
+ }
3152
+ }
3153
+ },
3154
+ "add_S5": {
3155
+ "full_accuracy": 0.96,
3156
+ "n_examples": 100,
3157
+ "per_subtask": {
3158
+ "SA": {
3159
+ "accuracy": 1.0,
3160
+ "count": 100
3161
+ },
3162
+ "SC": {
3163
+ "accuracy": 1.0,
3164
+ "count": 100
3165
+ },
3166
+ "UC": {
3167
+ "accuracy": 0.96,
3168
+ "count": 100
3169
+ },
3170
+ "US": {
3171
+ "accuracy": 1.0,
3172
+ "count": 400
3173
+ }
3174
+ }
3175
+ },
3176
+ "add_S6": {
3177
+ "full_accuracy": 1.0,
3178
+ "n_examples": 100,
3179
+ "per_subtask": {
3180
+ "SC": {
3181
+ "accuracy": 1.0,
3182
+ "count": 100
3183
+ },
3184
+ "UC": {
3185
+ "accuracy": 1.0,
3186
+ "count": 100
3187
+ },
3188
+ "US": {
3189
+ "accuracy": 1.0,
3190
+ "count": 500
3191
+ }
3192
+ }
3193
+ },
3194
+ "add_random": {
3195
+ "full_accuracy": 1.0,
3196
+ "n_examples": 200,
3197
+ "per_subtask": {
3198
+ "SA": {
3199
+ "accuracy": 1.0,
3200
+ "count": 447
3201
+ },
3202
+ "SC": {
3203
+ "accuracy": 1.0,
3204
+ "count": 320
3205
+ },
3206
+ "SS": {
3207
+ "accuracy": 1.0,
3208
+ "count": 56
3209
+ },
3210
+ "UC": {
3211
+ "accuracy": 1.0,
3212
+ "count": 529
3213
+ },
3214
+ "US": {
3215
+ "accuracy": 1.0,
3216
+ "count": 48
3217
+ }
3218
+ }
3219
+ },
3220
+ "add_C3": {
3221
+ "full_accuracy": 1.0,
3222
+ "n_examples": 100,
3223
+ "per_subtask": {
3224
+ "SA": {
3225
+ "accuracy": 1.0,
3226
+ "count": 300
3227
+ },
3228
+ "SC": {
3229
+ "accuracy": 1.0,
3230
+ "count": 100
3231
+ },
3232
+ "UC": {
3233
+ "accuracy": 1.0,
3234
+ "count": 193
3235
+ },
3236
+ "US": {
3237
+ "accuracy": 1.0,
3238
+ "count": 107
3239
+ }
3240
+ }
3241
+ },
3242
+ "add_C4": {
3243
+ "full_accuracy": 1.0,
3244
+ "n_examples": 100,
3245
+ "per_subtask": {
3246
+ "SA": {
3247
+ "accuracy": 1.0,
3248
+ "count": 200
3249
+ },
3250
+ "SC": {
3251
+ "accuracy": 1.0,
3252
+ "count": 100
3253
+ },
3254
+ "UC": {
3255
+ "accuracy": 1.0,
3256
+ "count": 256
3257
+ },
3258
+ "US": {
3259
+ "accuracy": 1.0,
3260
+ "count": 144
3261
+ }
3262
+ }
3263
+ },
3264
+ "add_C5": {
3265
+ "full_accuracy": 1.0,
3266
+ "n_examples": 100,
3267
+ "per_subtask": {
3268
+ "SA": {
3269
+ "accuracy": 1.0,
3270
+ "count": 100
3271
+ },
3272
+ "SC": {
3273
+ "accuracy": 1.0,
3274
+ "count": 100
3275
+ },
3276
+ "UC": {
3277
+ "accuracy": 1.0,
3278
+ "count": 306
3279
+ },
3280
+ "US": {
3281
+ "accuracy": 1.0,
3282
+ "count": 194
3283
+ }
3284
+ }
3285
+ },
3286
+ "add_C6": {
3287
+ "full_accuracy": 1.0,
3288
+ "n_examples": 100,
3289
+ "per_subtask": {
3290
+ "SC": {
3291
+ "accuracy": 1.0,
3292
+ "count": 100
3293
+ },
3294
+ "UC": {
3295
+ "accuracy": 1.0,
3296
+ "count": 366
3297
+ },
3298
+ "US": {
3299
+ "accuracy": 1.0,
3300
+ "count": 234
3301
+ }
3302
+ }
3303
+ },
3304
+ "sub_M0": {
3305
+ "full_accuracy": 1.0,
3306
+ "n_examples": 100,
3307
+ "per_subtask": {
3308
+ "MD": {
3309
+ "accuracy": 1.0,
3310
+ "count": 601
3311
+ },
3312
+ "ME": {
3313
+ "accuracy": 1.0,
3314
+ "count": 99
3315
+ }
3316
+ }
3317
+ },
3318
+ "sub_M1": {
3319
+ "full_accuracy": 1.0,
3320
+ "n_examples": 100,
3321
+ "per_subtask": {
3322
+ "MD": {
3323
+ "accuracy": 1.0,
3324
+ "count": 279
3325
+ },
3326
+ "MB": {
3327
+ "accuracy": 1.0,
3328
+ "count": 145
3329
+ },
3330
+ "ME": {
3331
+ "accuracy": 1.0,
3332
+ "count": 24
3333
+ },
3334
+ "UB": {
3335
+ "accuracy": 1.0,
3336
+ "count": 252
3337
+ }
3338
+ }
3339
+ },
3340
+ "sub_M2": {
3341
+ "full_accuracy": 1.0,
3342
+ "n_examples": 100,
3343
+ "per_subtask": {
3344
+ "MD": {
3345
+ "accuracy": 1.0,
3346
+ "count": 213
3347
+ },
3348
+ "MB": {
3349
+ "accuracy": 1.0,
3350
+ "count": 113
3351
+ },
3352
+ "ME": {
3353
+ "accuracy": 1.0,
3354
+ "count": 85
3355
+ },
3356
+ "UB": {
3357
+ "accuracy": 1.0,
3358
+ "count": 181
3359
+ },
3360
+ "UD": {
3361
+ "accuracy": 1.0,
3362
+ "count": 108
3363
+ }
3364
+ }
3365
+ },
3366
+ "sub_M3": {
3367
+ "full_accuracy": 1.0,
3368
+ "n_examples": 100,
3369
+ "per_subtask": {
3370
+ "MD": {
3371
+ "accuracy": 1.0,
3372
+ "count": 179
3373
+ },
3374
+ "MB": {
3375
+ "accuracy": 1.0,
3376
+ "count": 103
3377
+ },
3378
+ "ME": {
3379
+ "accuracy": 1.0,
3380
+ "count": 56
3381
+ },
3382
+ "UB": {
3383
+ "accuracy": 1.0,
3384
+ "count": 149
3385
+ },
3386
+ "UD": {
3387
+ "accuracy": 1.0,
3388
+ "count": 213
3389
+ }
3390
+ }
3391
+ },
3392
+ "sub_M4": {
3393
+ "full_accuracy": 0.98,
3394
+ "n_examples": 100,
3395
+ "per_subtask": {
3396
+ "MD": {
3397
+ "accuracy": 1.0,
3398
+ "count": 200
3399
+ },
3400
+ "MB": {
3401
+ "accuracy": 1.0,
3402
+ "count": 100
3403
+ },
3404
+ "UB": {
3405
+ "accuracy": 0.98,
3406
+ "count": 100
3407
+ },
3408
+ "UD": {
3409
+ "accuracy": 1.0,
3410
+ "count": 300
3411
+ }
3412
+ }
3413
+ },
3414
+ "sub_M5": {
3415
+ "full_accuracy": 0.96,
3416
+ "n_examples": 100,
3417
+ "per_subtask": {
3418
+ "MD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 100
3421
+ },
3422
+ "MB": {
3423
+ "accuracy": 1.0,
3424
+ "count": 100
3425
+ },
3426
+ "UB": {
3427
+ "accuracy": 0.96,
3428
+ "count": 100
3429
+ },
3430
+ "UD": {
3431
+ "accuracy": 1.0,
3432
+ "count": 400
3433
+ }
3434
+ }
3435
+ },
3436
+ "sub_random": {
3437
+ "full_accuracy": 1.0,
3438
+ "n_examples": 200,
3439
+ "per_subtask": {
3440
+ "MD": {
3441
+ "accuracy": 1.0,
3442
+ "count": 600
3443
+ },
3444
+ "MB": {
3445
+ "accuracy": 1.0,
3446
+ "count": 267
3447
+ },
3448
+ "ME": {
3449
+ "accuracy": 1.0,
3450
+ "count": 53
3451
+ },
3452
+ "UB": {
3453
+ "accuracy": 1.0,
3454
+ "count": 439
3455
+ },
3456
+ "UD": {
3457
+ "accuracy": 1.0,
3458
+ "count": 41
3459
+ }
3460
+ }
3461
+ },
3462
+ "sub_B3": {
3463
+ "full_accuracy": 1.0,
3464
+ "n_examples": 100,
3465
+ "per_subtask": {
3466
+ "MD": {
3467
+ "accuracy": 1.0,
3468
+ "count": 300
3469
+ },
3470
+ "MB": {
3471
+ "accuracy": 1.0,
3472
+ "count": 100
3473
+ },
3474
+ "UB": {
3475
+ "accuracy": 1.0,
3476
+ "count": 197
3477
+ },
3478
+ "UD": {
3479
+ "accuracy": 1.0,
3480
+ "count": 103
3481
+ }
3482
+ }
3483
+ },
3484
+ "sub_B4": {
3485
+ "full_accuracy": 1.0,
3486
+ "n_examples": 100,
3487
+ "per_subtask": {
3488
+ "MD": {
3489
+ "accuracy": 1.0,
3490
+ "count": 200
3491
+ },
3492
+ "MB": {
3493
+ "accuracy": 1.0,
3494
+ "count": 100
3495
+ },
3496
+ "UB": {
3497
+ "accuracy": 1.0,
3498
+ "count": 247
3499
+ },
3500
+ "UD": {
3501
+ "accuracy": 1.0,
3502
+ "count": 153
3503
+ }
3504
+ }
3505
+ },
3506
+ "sub_B5": {
3507
+ "full_accuracy": 1.0,
3508
+ "n_examples": 100,
3509
+ "per_subtask": {
3510
+ "MD": {
3511
+ "accuracy": 1.0,
3512
+ "count": 100
3513
+ },
3514
+ "MB": {
3515
+ "accuracy": 1.0,
3516
+ "count": 100
3517
+ },
3518
+ "UB": {
3519
+ "accuracy": 1.0,
3520
+ "count": 298
3521
+ },
3522
+ "UD": {
3523
+ "accuracy": 1.0,
3524
+ "count": 202
3525
+ }
3526
+ }
3527
+ }
3528
+ },
3529
+ "summary": {
3530
+ "overall_accuracy": 0.9958333333333333,
3531
+ "total_examples": 2400,
3532
+ "n_splits": 22
3533
+ }
3534
+ },
3535
+ "sorl_overall_accuracy": 0.9958333333333333,
3536
+ "sft_overall_accuracy": 0.7966666666666666
3537
+ }
add_sub_sorl_v1_abs20_100K/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:bb9ee27e51d6420f0e02315ecdd519a27da3ee37260946d31d57b82f22e4a5db
3
+ size 650344480
add_sub_sorl_v1_abs20_100K/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 4,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 4e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 10,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 1562,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs20_K4_100K",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 2,
61
+ "n_head": 3,
62
+ "n_embd": 510,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 20,
65
+ "dataset_size": 100000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 162509462,
71
+ "run_name": "add_sub_sorl_v1_abs20_100K",
72
+ "git_commit": "f447da529caceac8c7d256cbb2cd185cbc50feac",
73
+ "timestamp": "2026-04-12T13:58:49.377924+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "xn0zx2ga",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/xn0zx2ga",
81
+ "final_accuracy": 0.9958333333333333,
82
+ "sft_accuracy": 0.7966666666666666,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }