amirali1985 commited on
Commit
a7f386a
·
verified ·
1 Parent(s): 2fb3204

Upload add_sub_sorl_v1_abs10_100K

Browse files
add_sub_sorl_v1_abs10_100K/config.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 510,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 2040,
15
+ "layer_types": [
16
+ "full_attention",
17
+ "full_attention"
18
+ ],
19
+ "max_position_embeddings": 128,
20
+ "max_window_layers": 28,
21
+ "model_type": "qwen3",
22
+ "num_attention_heads": 3,
23
+ "num_hidden_layers": 2,
24
+ "num_key_value_heads": 3,
25
+ "pad_token_id": null,
26
+ "rms_norm_eps": 1e-06,
27
+ "rope_parameters": {
28
+ "rope_theta": 10000.0,
29
+ "rope_type": "default"
30
+ },
31
+ "sliding_window": null,
32
+ "tie_word_embeddings": false,
33
+ "transformers_version": "5.5.0",
34
+ "use_cache": true,
35
+ "use_sliding_window": false,
36
+ "vocab_size": 151654
37
+ }
add_sub_sorl_v1_abs10_100K/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs10_100K/metrics.json ADDED
@@ -0,0 +1,3537 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 800,
20
+ 850,
21
+ 900,
22
+ 950,
23
+ 1000,
24
+ 1050,
25
+ 1100,
26
+ 1150,
27
+ 1200,
28
+ 1250,
29
+ 1300,
30
+ 1350,
31
+ 1400,
32
+ 1450,
33
+ 1500,
34
+ 1550,
35
+ 1613,
36
+ 1663,
37
+ 1713,
38
+ 1763,
39
+ 1813,
40
+ 1863,
41
+ 1913,
42
+ 1963,
43
+ 2013,
44
+ 2063,
45
+ 2113,
46
+ 2163,
47
+ 2213,
48
+ 2263,
49
+ 2313,
50
+ 2363,
51
+ 2413,
52
+ 2463,
53
+ 2513,
54
+ 2563,
55
+ 2613,
56
+ 2663,
57
+ 2713,
58
+ 2763,
59
+ 2813,
60
+ 2863,
61
+ 2913,
62
+ 2963,
63
+ 3013,
64
+ 3063,
65
+ 3113,
66
+ 3176,
67
+ 3226,
68
+ 3276,
69
+ 3326,
70
+ 3376,
71
+ 3426,
72
+ 3476,
73
+ 3526,
74
+ 3576,
75
+ 3626,
76
+ 3676,
77
+ 3726,
78
+ 3776,
79
+ 3826,
80
+ 3876,
81
+ 3926,
82
+ 3976,
83
+ 4026,
84
+ 4076,
85
+ 4126,
86
+ 4176,
87
+ 4226,
88
+ 4276,
89
+ 4326,
90
+ 4376,
91
+ 4426,
92
+ 4476,
93
+ 4526,
94
+ 4576,
95
+ 4626,
96
+ 4676,
97
+ 4739,
98
+ 4789,
99
+ 4839,
100
+ 4889,
101
+ 4939,
102
+ 4989,
103
+ 5039,
104
+ 5089,
105
+ 5139,
106
+ 5189,
107
+ 5239,
108
+ 5289,
109
+ 5339,
110
+ 5389,
111
+ 5439,
112
+ 5489,
113
+ 5539,
114
+ 5589,
115
+ 5639,
116
+ 5689,
117
+ 5739,
118
+ 5789,
119
+ 5839,
120
+ 5889,
121
+ 5939,
122
+ 5989,
123
+ 6039,
124
+ 6089,
125
+ 6139,
126
+ 6189,
127
+ 6239,
128
+ 6302,
129
+ 6352,
130
+ 6402,
131
+ 6452,
132
+ 6502,
133
+ 6552,
134
+ 6602,
135
+ 6652,
136
+ 6702,
137
+ 6752,
138
+ 6802,
139
+ 6852,
140
+ 6902,
141
+ 6952,
142
+ 7002,
143
+ 7052,
144
+ 7102,
145
+ 7152,
146
+ 7202,
147
+ 7252,
148
+ 7302,
149
+ 7352,
150
+ 7402,
151
+ 7452,
152
+ 7502,
153
+ 7552,
154
+ 7602,
155
+ 7652,
156
+ 7702,
157
+ 7752,
158
+ 7802,
159
+ 7865,
160
+ 7915,
161
+ 7965,
162
+ 8015,
163
+ 8065,
164
+ 8115,
165
+ 8165,
166
+ 8215,
167
+ 8265,
168
+ 8315,
169
+ 8365,
170
+ 8415,
171
+ 8465,
172
+ 8515,
173
+ 8565,
174
+ 8615,
175
+ 8665,
176
+ 8715,
177
+ 8765,
178
+ 8815,
179
+ 8865,
180
+ 8915,
181
+ 8965,
182
+ 9015,
183
+ 9065,
184
+ 9115,
185
+ 9165,
186
+ 9215,
187
+ 9265,
188
+ 9315,
189
+ 9365,
190
+ 9428,
191
+ 9478,
192
+ 9528,
193
+ 9578,
194
+ 9628,
195
+ 9678,
196
+ 9728,
197
+ 9778,
198
+ 9828,
199
+ 9878,
200
+ 9928,
201
+ 9978,
202
+ 10028,
203
+ 10078,
204
+ 10128,
205
+ 10178,
206
+ 10228,
207
+ 10278,
208
+ 10328,
209
+ 10378,
210
+ 10428,
211
+ 10478,
212
+ 10528,
213
+ 10578,
214
+ 10628,
215
+ 10678,
216
+ 10728,
217
+ 10778,
218
+ 10828,
219
+ 10878,
220
+ 10928,
221
+ 10991,
222
+ 11041,
223
+ 11091,
224
+ 11141,
225
+ 11191,
226
+ 11241,
227
+ 11291,
228
+ 11341,
229
+ 11391,
230
+ 11441,
231
+ 11491,
232
+ 11541,
233
+ 11591,
234
+ 11641,
235
+ 11691,
236
+ 11741,
237
+ 11791,
238
+ 11841,
239
+ 11891,
240
+ 11941,
241
+ 11991,
242
+ 12041,
243
+ 12091,
244
+ 12141,
245
+ 12191,
246
+ 12241,
247
+ 12291,
248
+ 12341,
249
+ 12391,
250
+ 12441,
251
+ 12491,
252
+ 12554,
253
+ 12604,
254
+ 12654,
255
+ 12704,
256
+ 12754,
257
+ 12804,
258
+ 12854,
259
+ 12904,
260
+ 12954,
261
+ 13004,
262
+ 13054,
263
+ 13104,
264
+ 13154,
265
+ 13204,
266
+ 13254,
267
+ 13304,
268
+ 13354,
269
+ 13404,
270
+ 13454,
271
+ 13504,
272
+ 13554,
273
+ 13604,
274
+ 13654,
275
+ 13704,
276
+ 13754,
277
+ 13804,
278
+ 13854,
279
+ 13904,
280
+ 13954,
281
+ 14004,
282
+ 14054,
283
+ 14117,
284
+ 14167,
285
+ 14217,
286
+ 14267,
287
+ 14317,
288
+ 14367,
289
+ 14417,
290
+ 14467,
291
+ 14517,
292
+ 14567,
293
+ 14617,
294
+ 14667,
295
+ 14717,
296
+ 14767,
297
+ 14817,
298
+ 14867,
299
+ 14917,
300
+ 14967,
301
+ 15017,
302
+ 15067,
303
+ 15117,
304
+ 15167,
305
+ 15217,
306
+ 15267,
307
+ 15317,
308
+ 15367,
309
+ 15417,
310
+ 15467,
311
+ 15517,
312
+ 15567,
313
+ 15617
314
+ ],
315
+ "loss": [
316
+ 17.898242950439453,
317
+ 12.17095947265625,
318
+ 10.000726699829102,
319
+ 8.469908714294434,
320
+ 5.317510604858398,
321
+ 4.32233190536499,
322
+ 3.622828960418701,
323
+ 2.805741786956787,
324
+ 3.010690689086914,
325
+ 2.483719825744629,
326
+ 2.4329562187194824,
327
+ 2.0066065788269043,
328
+ 2.3034160137176514,
329
+ 1.6520445346832275,
330
+ 1.269864559173584,
331
+ 1.2628942728042603,
332
+ 0.8415369987487793,
333
+ 0.4964118003845215,
334
+ -0.6137298345565796,
335
+ -1.0917762517929077,
336
+ -3.30086088180542,
337
+ -5.9570698738098145,
338
+ -8.474160194396973,
339
+ -9.07567024230957,
340
+ -10.399657249450684,
341
+ -10.898626327514648,
342
+ -11.817375183105469,
343
+ -11.275421142578125,
344
+ -13.070290565490723,
345
+ -13.372167587280273,
346
+ -13.27103328704834,
347
+ -14.676581382751465,
348
+ -14.48254108428955,
349
+ -14.171213150024414,
350
+ -14.453689575195312,
351
+ -14.307726860046387,
352
+ -14.525967597961426,
353
+ -14.91265869140625,
354
+ -14.669103622436523,
355
+ -14.205328941345215,
356
+ -14.213898658752441,
357
+ -14.720457077026367,
358
+ -14.26444149017334,
359
+ -14.46597671508789,
360
+ -13.868637084960938,
361
+ -14.853498458862305,
362
+ -14.440397262573242,
363
+ -14.689319610595703,
364
+ -14.972709655761719,
365
+ -14.901583671569824,
366
+ -15.340761184692383,
367
+ -15.013080596923828,
368
+ -14.612590789794922,
369
+ -14.974559783935547,
370
+ -14.508498191833496,
371
+ -14.355701446533203,
372
+ -12.855260848999023,
373
+ -12.074932098388672,
374
+ -11.211496353149414,
375
+ -10.11567497253418,
376
+ -8.155570030212402,
377
+ -7.4798760414123535,
378
+ -6.254654407501221,
379
+ -6.687215805053711,
380
+ -6.552494049072266,
381
+ -5.425172328948975,
382
+ -5.611931324005127,
383
+ -4.553066253662109,
384
+ -4.747787952423096,
385
+ -4.689442157745361,
386
+ -4.176784038543701,
387
+ -4.077182769775391,
388
+ -4.381514072418213,
389
+ -4.524280071258545,
390
+ -5.140686988830566,
391
+ -3.7790939807891846,
392
+ -3.596569299697876,
393
+ -3.590451240539551,
394
+ -4.132176876068115,
395
+ -3.858391761779785,
396
+ -3.7297918796539307,
397
+ -3.5094447135925293,
398
+ -3.3534436225891113,
399
+ -3.800368070602417,
400
+ -3.373728036880493,
401
+ -3.301117420196533,
402
+ -3.8689463138580322,
403
+ -2.935724973678589,
404
+ -3.1455042362213135,
405
+ -3.1886491775512695,
406
+ -3.0887057781219482,
407
+ -2.891690254211426,
408
+ -3.128448486328125,
409
+ -2.6364502906799316,
410
+ -2.9243524074554443,
411
+ -2.4197757244110107,
412
+ -2.991380214691162,
413
+ -2.23624324798584,
414
+ -2.7561862468719482,
415
+ -2.6544461250305176,
416
+ -2.244197368621826,
417
+ -2.360046625137329,
418
+ -2.3621275424957275,
419
+ -2.2447409629821777,
420
+ -2.5257372856140137,
421
+ -2.61136794090271,
422
+ -2.6983206272125244,
423
+ -2.5952131748199463,
424
+ -2.236645221710205,
425
+ -2.2343759536743164,
426
+ -2.2564358711242676,
427
+ -2.0840580463409424,
428
+ -2.0381150245666504,
429
+ -3.134915828704834,
430
+ -2.1949312686920166,
431
+ -2.674781322479248,
432
+ -1.872277855873108,
433
+ -2.0133588314056396,
434
+ -2.323359966278076,
435
+ -2.209495782852173,
436
+ -2.056077241897583,
437
+ -2.3222715854644775,
438
+ -1.850269079208374,
439
+ -2.011166572570801,
440
+ -2.423705816268921,
441
+ -1.995131254196167,
442
+ -2.2757530212402344,
443
+ -2.1609740257263184,
444
+ -1.8811988830566406,
445
+ -2.178713083267212,
446
+ -2.0915629863739014,
447
+ -2.2504334449768066,
448
+ -1.9422235488891602,
449
+ -1.9811478853225708,
450
+ -1.689926028251648,
451
+ -1.8429358005523682,
452
+ -2.013540267944336,
453
+ -2.1036672592163086,
454
+ -1.8045049905776978,
455
+ -1.5718125104904175,
456
+ -2.1454601287841797,
457
+ -1.6350609064102173,
458
+ -1.978631615638733,
459
+ -1.6527613401412964,
460
+ -1.8721427917480469,
461
+ -1.604819655418396,
462
+ -1.5306353569030762,
463
+ -2.0175392627716064,
464
+ -1.8658630847930908,
465
+ -1.6680402755737305,
466
+ -1.6254310607910156,
467
+ -1.4316753149032593,
468
+ -1.957127332687378,
469
+ -1.3733186721801758,
470
+ -1.5614428520202637,
471
+ -1.6985728740692139,
472
+ -1.528280258178711,
473
+ -1.4709199666976929,
474
+ -1.6057331562042236,
475
+ -1.5918432474136353,
476
+ -1.8127381801605225,
477
+ -1.3713455200195312,
478
+ -2.157377004623413,
479
+ -1.8324764966964722,
480
+ -1.5383961200714111,
481
+ -1.2715643644332886,
482
+ -1.43584144115448,
483
+ -1.363757610321045,
484
+ -1.2672580480575562,
485
+ -1.0625731945037842,
486
+ -1.0825140476226807,
487
+ -1.4479258060455322,
488
+ -1.4802824258804321,
489
+ -1.6093518733978271,
490
+ -1.3037806749343872,
491
+ -1.1348497867584229,
492
+ -1.1780712604522705,
493
+ -1.3891611099243164,
494
+ -1.2522574663162231,
495
+ -1.2620816230773926,
496
+ -1.1609874963760376,
497
+ -1.3132126331329346,
498
+ -1.2223495244979858,
499
+ -0.9222760200500488,
500
+ -0.9897661805152893,
501
+ -1.2174392938613892,
502
+ -1.2716630697250366,
503
+ -0.9742103219032288,
504
+ -1.4609808921813965,
505
+ -0.9385769367218018,
506
+ -1.05704927444458,
507
+ -0.7617784738540649,
508
+ -0.7693957090377808,
509
+ -0.8679118752479553,
510
+ -0.9695261716842651,
511
+ -0.7272455096244812,
512
+ -1.128410816192627,
513
+ -0.5502809286117554,
514
+ -0.6828831434249878,
515
+ -0.6310953497886658,
516
+ -0.6145992875099182,
517
+ -1.0135717391967773,
518
+ -0.6107086539268494,
519
+ -1.1609718799591064,
520
+ -0.9355491399765015,
521
+ -1.138651967048645,
522
+ -0.7039048075675964,
523
+ -0.7265371680259705,
524
+ -0.7398449778556824,
525
+ -1.1441463232040405,
526
+ -0.716513991355896,
527
+ -0.549831748008728,
528
+ -0.6496762037277222,
529
+ -0.5133782029151917,
530
+ -0.7706650495529175,
531
+ -0.6165258884429932,
532
+ -0.5687806606292725,
533
+ -0.4623892605304718,
534
+ -0.5749399065971375,
535
+ -0.4525548219680786,
536
+ -0.5484775900840759,
537
+ -0.39739224314689636,
538
+ -0.2298678755760193,
539
+ -0.5226291418075562,
540
+ -0.44217923283576965,
541
+ -0.45984476804733276,
542
+ -0.3971169888973236,
543
+ -0.2655782103538513,
544
+ -0.30226850509643555,
545
+ -0.5683307647705078,
546
+ -0.7837846875190735,
547
+ -0.2775364816188812,
548
+ -0.40293148159980774,
549
+ -0.39146527647972107,
550
+ -0.3872049152851105,
551
+ -0.2855488955974579,
552
+ -0.3582993745803833,
553
+ -0.29680517315864563,
554
+ -0.3545703887939453,
555
+ -0.5397948622703552,
556
+ -0.43307721614837646,
557
+ -0.4876730442047119,
558
+ -0.5343471169471741,
559
+ -0.21957853436470032,
560
+ -0.39358770847320557,
561
+ 0.015100548975169659,
562
+ -0.42391523718833923,
563
+ -0.4264887571334839,
564
+ -0.14468659460544586,
565
+ -0.20275095105171204,
566
+ -0.35929185152053833,
567
+ -0.34941935539245605,
568
+ -0.48810499906539917,
569
+ -0.08532863110303879,
570
+ -0.3265494108200073,
571
+ -0.3058772683143616,
572
+ -0.39665207266807556,
573
+ -0.2523774802684784,
574
+ -0.20658715069293976,
575
+ -0.21619853377342224,
576
+ -0.18327531218528748,
577
+ -0.23171119391918182,
578
+ -0.21158039569854736,
579
+ -0.275308758020401,
580
+ -0.18174022436141968,
581
+ -0.27848175168037415,
582
+ -0.16791534423828125,
583
+ -0.21869049966335297,
584
+ -0.12352351099252701,
585
+ -0.2989782691001892,
586
+ -0.2069055289030075,
587
+ -0.13711804151535034,
588
+ -0.04984921216964722,
589
+ -0.04339553415775299,
590
+ -0.14695435762405396,
591
+ -0.16203084588050842,
592
+ -0.1392071545124054,
593
+ -0.13278606534004211,
594
+ -0.11039897799491882,
595
+ -0.07540819048881531,
596
+ -0.1325184851884842,
597
+ -0.21475887298583984,
598
+ -0.10040821135044098,
599
+ -0.15006886422634125,
600
+ -0.03858878090977669,
601
+ -0.15046735107898712,
602
+ -0.08435267210006714,
603
+ -0.10838817805051804,
604
+ -0.15623150765895844,
605
+ -0.18306495249271393,
606
+ -0.0787075012922287,
607
+ -0.0882338136434555,
608
+ -0.1638314425945282,
609
+ -0.12283475697040558,
610
+ -0.11741890758275986,
611
+ -0.08260732144117355,
612
+ -0.04303062707185745,
613
+ -0.10231343656778336,
614
+ -0.07560180127620697,
615
+ -0.052348893135786057,
616
+ -0.10580295324325562,
617
+ -0.06423408538103104,
618
+ -0.15607650578022003,
619
+ -0.02391888201236725,
620
+ -0.13538967072963715,
621
+ -0.08471515774726868,
622
+ -0.09317309409379959,
623
+ -0.048827387392520905,
624
+ -0.16070179641246796,
625
+ -0.07308726012706757
626
+ ],
627
+ "base_loss": [
628
+ 10.568315505981445,
629
+ 8.143197059631348,
630
+ 7.364155292510986,
631
+ 6.420115947723389,
632
+ 5.458926200866699,
633
+ 3.896120548248291,
634
+ 2.368774890899658,
635
+ 2.12823224067688,
636
+ 1.9438966512680054,
637
+ 1.8385487794876099,
638
+ 1.8635467290878296,
639
+ 1.8358601331710815,
640
+ 1.8607227802276611,
641
+ 1.867401361465454,
642
+ 1.8732596635818481,
643
+ 1.8480777740478516,
644
+ 1.8224256038665771,
645
+ 1.887178659439087,
646
+ 1.8829847574234009,
647
+ 1.9112404584884644,
648
+ 1.8766212463378906,
649
+ 1.9506890773773193,
650
+ 1.9369127750396729,
651
+ 1.809589147567749,
652
+ 1.8270591497421265,
653
+ 1.7747080326080322,
654
+ 1.804424524307251,
655
+ 1.6654764413833618,
656
+ 1.751176118850708,
657
+ 1.7893718481063843,
658
+ 1.712988257408142,
659
+ 1.8015085458755493,
660
+ 1.7446907758712769,
661
+ 1.6956506967544556,
662
+ 1.7068536281585693,
663
+ 1.650771141052246,
664
+ 1.6782304048538208,
665
+ 1.6954421997070312,
666
+ 1.6798969507217407,
667
+ 1.628057837486267,
668
+ 1.61090886592865,
669
+ 1.6740840673446655,
670
+ 1.6245861053466797,
671
+ 1.63609778881073,
672
+ 1.56288743019104,
673
+ 1.6816425323486328,
674
+ 1.6284650564193726,
675
+ 1.6451350450515747,
676
+ 1.6970590353012085,
677
+ 1.6629184484481812,
678
+ 1.716318964958191,
679
+ 1.6742541790008545,
680
+ 1.6343353986740112,
681
+ 1.6724300384521484,
682
+ 1.6198190450668335,
683
+ 1.6007970571517944,
684
+ 1.451180100440979,
685
+ 1.3689472675323486,
686
+ 1.2527589797973633,
687
+ 1.1551610231399536,
688
+ 0.9227293133735657,
689
+ 0.8394975662231445,
690
+ 0.7029710412025452,
691
+ 0.7575051188468933,
692
+ 0.7359369993209839,
693
+ 0.6122614741325378,
694
+ 0.6277788877487183,
695
+ 0.5123354196548462,
696
+ 0.5338669419288635,
697
+ 0.5280805826187134,
698
+ 0.46961620450019836,
699
+ 0.46630558371543884,
700
+ 0.49189749360084534,
701
+ 0.5055493712425232,
702
+ 0.5758814215660095,
703
+ 0.4242982268333435,
704
+ 0.40284016728401184,
705
+ 0.4024098217487335,
706
+ 0.46268826723098755,
707
+ 0.43445953726768494,
708
+ 0.4170833230018616,
709
+ 0.3946475386619568,
710
+ 0.37832775712013245,
711
+ 0.426046222448349,
712
+ 0.37859299778938293,
713
+ 0.3699304163455963,
714
+ 0.4385518431663513,
715
+ 0.3466642200946808,
716
+ 0.3540719449520111,
717
+ 0.356463223695755,
718
+ 0.3454909324645996,
719
+ 0.32347074151039124,
720
+ 0.3511905074119568,
721
+ 0.2992519736289978,
722
+ 0.3298533260822296,
723
+ 0.27088990807533264,
724
+ 0.33507975935935974,
725
+ 0.25134751200675964,
726
+ 0.3087560534477234,
727
+ 0.29757770895957947,
728
+ 0.251931369304657,
729
+ 0.26579374074935913,
730
+ 0.2649250626564026,
731
+ 0.25241801142692566,
732
+ 0.28240329027175903,
733
+ 0.2957579791545868,
734
+ 0.30345407128334045,
735
+ 0.2916712760925293,
736
+ 0.25145572423934937,
737
+ 0.2508265972137451,
738
+ 0.2539704442024231,
739
+ 0.23422227799892426,
740
+ 0.23018407821655273,
741
+ 0.35051247477531433,
742
+ 0.25069090723991394,
743
+ 0.32541435956954956,
744
+ 0.21303556859493256,
745
+ 0.22561796009540558,
746
+ 0.2612958550453186,
747
+ 0.24799372255802155,
748
+ 0.23154176771640778,
749
+ 0.2606547474861145,
750
+ 0.21254435181617737,
751
+ 0.22772814333438873,
752
+ 0.27201953530311584,
753
+ 0.22492162883281708,
754
+ 0.2579091191291809,
755
+ 0.2427002340555191,
756
+ 0.22184371948242188,
757
+ 0.24444580078125,
758
+ 0.23784099519252777,
759
+ 0.2554014027118683,
760
+ 0.21875402331352234,
761
+ 0.22619032859802246,
762
+ 0.19057056307792664,
763
+ 0.20802749693393707,
764
+ 0.22737279534339905,
765
+ 0.23751647770404816,
766
+ 0.20238709449768066,
767
+ 0.18440593779087067,
768
+ 0.24258053302764893,
769
+ 0.1829206496477127,
770
+ 0.22208870947360992,
771
+ 0.18690092861652374,
772
+ 0.20956198871135712,
773
+ 0.18001887202262878,
774
+ 0.1723724603652954,
775
+ 0.22669336199760437,
776
+ 0.2112317830324173,
777
+ 0.18780024349689484,
778
+ 0.18407921493053436,
779
+ 0.1614924669265747,
780
+ 0.2193380743265152,
781
+ 0.15642760694026947,
782
+ 0.1785077303647995,
783
+ 0.19131197035312653,
784
+ 0.1719256490468979,
785
+ 0.16998495161533356,
786
+ 0.18009281158447266,
787
+ 0.1786258965730667,
788
+ 0.20350196957588196,
789
+ 0.15445144474506378,
790
+ 0.24213048815727234,
791
+ 0.20611858367919922,
792
+ 0.1730114370584488,
793
+ 0.14370106160640717,
794
+ 0.16377748548984528,
795
+ 0.15389804542064667,
796
+ 0.14356811344623566,
797
+ 0.14054524898529053,
798
+ 0.12244506925344467,
799
+ 0.1635432243347168,
800
+ 0.16939735412597656,
801
+ 0.18151232600212097,
802
+ 0.1470525562763214,
803
+ 0.1271251142024994,
804
+ 0.13306169211864471,
805
+ 0.15618088841438293,
806
+ 0.1405344009399414,
807
+ 0.14169029891490936,
808
+ 0.1312611699104309,
809
+ 0.15000268816947937,
810
+ 0.13788385689258575,
811
+ 0.10699386149644852,
812
+ 0.11203130334615707,
813
+ 0.1377689689397812,
814
+ 0.14300259947776794,
815
+ 0.11074953526258469,
816
+ 0.16385547816753387,
817
+ 0.106101393699646,
818
+ 0.11837797611951828,
819
+ 0.08841868489980698,
820
+ 0.08911939710378647,
821
+ 0.09771926701068878,
822
+ 0.10882412642240524,
823
+ 0.08234436064958572,
824
+ 0.12939295172691345,
825
+ 0.0629371628165245,
826
+ 0.07891169935464859,
827
+ 0.07331836223602295,
828
+ 0.06941264122724533,
829
+ 0.1135721355676651,
830
+ 0.06897144019603729,
831
+ 0.13211266696453094,
832
+ 0.10580595582723618,
833
+ 0.12884125113487244,
834
+ 0.07908945530653,
835
+ 0.08248370885848999,
836
+ 0.0836305096745491,
837
+ 0.12909452617168427,
838
+ 0.08136750757694244,
839
+ 0.06289603561162949,
840
+ 0.07312337309122086,
841
+ 0.0587802417576313,
842
+ 0.0881800428032875,
843
+ 0.06981097906827927,
844
+ 0.0647372454404831,
845
+ 0.05323735252022743,
846
+ 0.0651235431432724,
847
+ 0.05145469680428505,
848
+ 0.06290210038423538,
849
+ 0.045060139149427414,
850
+ 0.02635861560702324,
851
+ 0.06054062023758888,
852
+ 0.05092387646436691,
853
+ 0.051927804946899414,
854
+ 0.04568718746304512,
855
+ 0.05043186619877815,
856
+ 0.03472381457686424,
857
+ 0.06507039815187454,
858
+ 0.08881647139787674,
859
+ 0.03155577555298805,
860
+ 0.04574210196733475,
861
+ 0.04629113897681236,
862
+ 0.04489707201719284,
863
+ 0.03378498926758766,
864
+ 0.04083876684308052,
865
+ 0.04593208059668541,
866
+ 0.04099803417921066,
867
+ 0.061005882918834686,
868
+ 0.050650376826524734,
869
+ 0.057167086750268936,
870
+ 0.06097138673067093,
871
+ 0.026157842949032784,
872
+ 0.04480227455496788,
873
+ 0.03374704346060753,
874
+ 0.04900706559419632,
875
+ 0.048461027443408966,
876
+ 0.017718875780701637,
877
+ 0.023490795865654945,
878
+ 0.04097198694944382,
879
+ 0.04008692502975464,
880
+ 0.055264316499233246,
881
+ 0.010471915826201439,
882
+ 0.03744228929281235,
883
+ 0.035062629729509354,
884
+ 0.0454421266913414,
885
+ 0.03002260811626911,
886
+ 0.023973463103175163,
887
+ 0.025306016206741333,
888
+ 0.02189379557967186,
889
+ 0.027451980859041214,
890
+ 0.025912059471011162,
891
+ 0.03169391676783562,
892
+ 0.021139992401003838,
893
+ 0.032432056963443756,
894
+ 0.019880054518580437,
895
+ 0.02606010250747204,
896
+ 0.014689230360090733,
897
+ 0.03407203033566475,
898
+ 0.02402709797024727,
899
+ 0.017139960080385208,
900
+ 0.009125121869146824,
901
+ 0.006708136759698391,
902
+ 0.01757701113820076,
903
+ 0.019256500527262688,
904
+ 0.017534470185637474,
905
+ 0.015949562191963196,
906
+ 0.01345624215900898,
907
+ 0.009886420331895351,
908
+ 0.01634773425757885,
909
+ 0.024979816749691963,
910
+ 0.013034196570515633,
911
+ 0.018518775701522827,
912
+ 0.007457684725522995,
913
+ 0.01740308478474617,
914
+ 0.011986021883785725,
915
+ 0.01300106942653656,
916
+ 0.01853434555232525,
917
+ 0.021597137674689293,
918
+ 0.01134154386818409,
919
+ 0.011389104649424553,
920
+ 0.01879272796213627,
921
+ 0.014911564067006111,
922
+ 0.013964526355266571,
923
+ 0.011024332605302334,
924
+ 0.006991051137447357,
925
+ 0.012699066661298275,
926
+ 0.009297139011323452,
927
+ 0.007379917893558741,
928
+ 0.013352419249713421,
929
+ 0.008603994734585285,
930
+ 0.018944447860121727,
931
+ 0.00466900784522295,
932
+ 0.016725314781069756,
933
+ 0.01058161724358797,
934
+ 0.01205870695412159,
935
+ 0.007595142815262079,
936
+ 0.019408103078603745,
937
+ 0.009309765882790089
938
+ ],
939
+ "info_loss": [
940
+ -0.1958761215209961,
941
+ -0.408872127532959,
942
+ -0.33576154708862305,
943
+ -0.22092151641845703,
944
+ -0.31899309158325195,
945
+ -0.19400596618652344,
946
+ -0.08042073249816895,
947
+ -0.12741851806640625,
948
+ -0.08406126499176025,
949
+ -0.12506330013275146,
950
+ -0.13188695907592773,
951
+ -0.1713271141052246,
952
+ -0.14365017414093018,
953
+ -0.20933854579925537,
954
+ -0.2477884292602539,
955
+ -0.24557054042816162,
956
+ -0.2851436138153076,
957
+ -0.3258519172668457,
958
+ -0.4353005886077881,
959
+ -0.4823911190032959,
960
+ -0.6876966953277588,
961
+ -0.9192705154418945,
962
+ -1.093753457069397,
963
+ -1.1159758567810059,
964
+ -1.2424697875976562,
965
+ -1.283799648284912,
966
+ -1.3774747848510742,
967
+ -1.3076419830322266,
968
+ -1.4936635494232178,
969
+ -1.5272959470748901,
970
+ -1.509727120399475,
971
+ -1.65697181224823,
972
+ -1.6324580907821655,
973
+ -1.5960543155670166,
974
+ -1.62422776222229,
975
+ -1.6046651601791382,
976
+ -1.6272552013397217,
977
+ -1.668359398841858,
978
+ -1.6423128843307495,
979
+ -1.5906425714492798,
980
+ -1.58965265750885,
981
+ -1.6462726593017578,
982
+ -1.5967046022415161,
983
+ -1.6165791749954224,
984
+ -1.5496994256973267,
985
+ -1.6593738794326782,
986
+ -1.6130362749099731,
987
+ -1.6383200883865356,
988
+ -1.6712359189987183,
989
+ -1.6604275703430176,
990
+ -1.7099218368530273,
991
+ -1.6720092296600342,
992
+ -1.6285072565078735,
993
+ -1.6703423261642456,
994
+ -1.616640329360962,
995
+ -1.5992320775985718,
996
+ -1.4349874258041382,
997
+ -1.347501516342163,
998
+ -1.2491847276687622,
999
+ -1.1298017501831055,
1000
+ -0.9112951755523682,
1001
+ -0.8348812460899353,
1002
+ -0.7004478573799133,
1003
+ -0.7471547722816467,
1004
+ -0.7329674959182739,
1005
+ -0.6061534285545349,
1006
+ -0.6268084645271301,
1007
+ -0.5092931389808655,
1008
+ -0.5315150022506714,
1009
+ -0.5259316563606262,
1010
+ -0.46720921993255615,
1011
+ -0.4566917419433594,
1012
+ -0.48945683240890503,
1013
+ -0.5048118829727173,
1014
+ -0.5754508376121521,
1015
+ -0.42379122972488403,
1016
+ -0.4020898640155792,
1017
+ -0.4019421637058258,
1018
+ -0.46214649081230164,
1019
+ -0.433444082736969,
1020
+ -0.416523814201355,
1021
+ -0.3938884437084198,
1022
+ -0.3746926188468933,
1023
+ -0.42470821738243103,
1024
+ -0.3775221109390259,
1025
+ -0.3694234788417816,
1026
+ -0.4327273666858673,
1027
+ -0.33102893829345703,
1028
+ -0.35362643003463745,
1029
+ -0.35618698596954346,
1030
+ -0.3451445698738098,
1031
+ -0.3230594992637634,
1032
+ -0.3498040735721588,
1033
+ -0.2983073890209198,
1034
+ -0.328479528427124,
1035
+ -0.2706272006034851,
1036
+ -0.33466997742652893,
1037
+ -0.25122931599617004,
1038
+ -0.30850228667259216,
1039
+ -0.29735299944877625,
1040
+ -0.2517610788345337,
1041
+ -0.26403889060020447,
1042
+ -0.26419973373413086,
1043
+ -0.2520931363105774,
1044
+ -0.2822090983390808,
1045
+ -0.2948746681213379,
1046
+ -0.30327367782592773,
1047
+ -0.29149749875068665,
1048
+ -0.25109487771987915,
1049
+ -0.25057077407836914,
1050
+ -0.2531075179576874,
1051
+ -0.23408158123493195,
1052
+ -0.2298281192779541,
1053
+ -0.3504043221473694,
1054
+ -0.24677129089832306,
1055
+ -0.3017372190952301,
1056
+ -0.2120485156774521,
1057
+ -0.22554655373096466,
1058
+ -0.26121786236763,
1059
+ -0.24792437255382538,
1060
+ -0.2300400584936142,
1061
+ -0.2605368196964264,
1062
+ -0.20973044633865356,
1063
+ -0.22753840684890747,
1064
+ -0.27192503213882446,
1065
+ -0.2248055338859558,
1066
+ -0.2550696134567261,
1067
+ -0.24217553436756134,
1068
+ -0.21174460649490356,
1069
+ -0.24400071799755096,
1070
+ -0.23711474239826202,
1071
+ -0.25497865676879883,
1072
+ -0.2180212289094925,
1073
+ -0.2259577214717865,
1074
+ -0.1904374063014984,
1075
+ -0.20753498375415802,
1076
+ -0.22714219987392426,
1077
+ -0.23731212317943573,
1078
+ -0.20226487517356873,
1079
+ -0.17811334133148193,
1080
+ -0.24165070056915283,
1081
+ -0.18276356160640717,
1082
+ -0.22199979424476624,
1083
+ -0.18578781187534332,
1084
+ -0.20945100486278534,
1085
+ -0.17994889616966248,
1086
+ -0.17219844460487366,
1087
+ -0.22660747170448303,
1088
+ -0.20932692289352417,
1089
+ -0.18746373057365417,
1090
+ -0.18371479213237762,
1091
+ -0.1613215059041977,
1092
+ -0.2192639261484146,
1093
+ -0.15637393295764923,
1094
+ -0.17581233382225037,
1095
+ -0.19124145805835724,
1096
+ -0.17119184136390686,
1097
+ -0.16722899675369263,
1098
+ -0.17996202409267426,
1099
+ -0.1783156394958496,
1100
+ -0.20310139656066895,
1101
+ -0.15436813235282898,
1102
+ -0.24130144715309143,
1103
+ -0.20557448267936707,
1104
+ -0.17239594459533691,
1105
+ -0.14307594299316406,
1106
+ -0.16181223094463348,
1107
+ -0.1532348245382309,
1108
+ -0.14306606352329254,
1109
+ -0.12188619375228882,
1110
+ -0.12194667011499405,
1111
+ -0.16347120702266693,
1112
+ -0.1671372354030609,
1113
+ -0.18076840043067932,
1114
+ -0.1464703232049942,
1115
+ -0.12702254951000214,
1116
+ -0.13300567865371704,
1117
+ -0.15573778748512268,
1118
+ -0.14048932492733002,
1119
+ -0.1415444314479828,
1120
+ -0.131224125623703,
1121
+ -0.1496949940919876,
1122
+ -0.1377827525138855,
1123
+ -0.10693496465682983,
1124
+ -0.11159024387598038,
1125
+ -0.13759806752204895,
1126
+ -0.14285747706890106,
1127
+ -0.10937677323818207,
1128
+ -0.16366244852542877,
1129
+ -0.10602877289056778,
1130
+ -0.1183440312743187,
1131
+ -0.08684682101011276,
1132
+ -0.08878514170646667,
1133
+ -0.097652867436409,
1134
+ -0.10875992476940155,
1135
+ -0.0822797417640686,
1136
+ -0.12756849825382233,
1137
+ -0.0629057064652443,
1138
+ -0.0781344622373581,
1139
+ -0.0717904195189476,
1140
+ -0.0689859539270401,
1141
+ -0.11354324966669083,
1142
+ -0.0689539909362793,
1143
+ -0.13209789991378784,
1144
+ -0.10523242503404617,
1145
+ -0.12857557833194733,
1146
+ -0.07905884832143784,
1147
+ -0.08211970329284668,
1148
+ -0.08358220756053925,
1149
+ -0.12888899445533752,
1150
+ -0.08076901733875275,
1151
+ -0.06234963238239288,
1152
+ -0.07308661192655563,
1153
+ -0.05873045697808266,
1154
+ -0.0879305899143219,
1155
+ -0.06941428035497665,
1156
+ -0.06471981108188629,
1157
+ -0.05259700119495392,
1158
+ -0.06507353484630585,
1159
+ -0.05134617164731026,
1160
+ -0.062194351106882095,
1161
+ -0.04503596946597099,
1162
+ -0.026294687762856483,
1163
+ -0.060498833656311035,
1164
+ -0.05090045928955078,
1165
+ -0.05191384255886078,
1166
+ -0.0455852746963501,
1167
+ -0.03276360034942627,
1168
+ -0.034416913986206055,
1169
+ -0.06487513333559036,
1170
+ -0.08880289644002914,
1171
+ -0.03150329738855362,
1172
+ -0.045720167458057404,
1173
+ -0.04626934602856636,
1174
+ -0.044708702713251114,
1175
+ -0.0337369404733181,
1176
+ -0.040805280208587646,
1177
+ -0.03534899652004242,
1178
+ -0.040939390659332275,
1179
+ -0.06097675859928131,
1180
+ -0.05063151195645332,
1181
+ -0.05713341385126114,
1182
+ -0.060942329466342926,
1183
+ -0.02614479325711727,
1184
+ -0.04479479789733887,
1185
+ -0.0025909747928380966,
1186
+ -0.04899991303682327,
1187
+ -0.04843590781092644,
1188
+ -0.017695382237434387,
1189
+ -0.023478390648961067,
1190
+ -0.0409560464322567,
1191
+ -0.040065813809633255,
1192
+ -0.05523411184549332,
1193
+ -0.010462231934070587,
1194
+ -0.037393707782030106,
1195
+ -0.03504030406475067,
1196
+ -0.04541987553238869,
1197
+ -0.030009526759386063,
1198
+ -0.023965151980519295,
1199
+ -0.025134364143013954,
1200
+ -0.021883761510252953,
1201
+ -0.027442272752523422,
1202
+ -0.025906745344400406,
1203
+ -0.031664200127124786,
1204
+ -0.02112094685435295,
1205
+ -0.03222130611538887,
1206
+ -0.019869931042194366,
1207
+ -0.02602902054786682,
1208
+ -0.014678400941193104,
1209
+ -0.03405144065618515,
1210
+ -0.024011127650737762,
1211
+ -0.017130805179476738,
1212
+ -0.00910995900630951,
1213
+ -0.006597171537578106,
1214
+ -0.017515825107693672,
1215
+ -0.019251558929681778,
1216
+ -0.017495347186923027,
1217
+ -0.015909546986222267,
1218
+ -0.013114679604768753,
1219
+ -0.009829901158809662,
1220
+ -0.01633986458182335,
1221
+ -0.024949651211500168,
1222
+ -0.012981235980987549,
1223
+ -0.018510917201638222,
1224
+ -0.007451067212969065,
1225
+ -0.01737871952354908,
1226
+ -0.011973484419286251,
1227
+ -0.01299270335584879,
1228
+ -0.01852962002158165,
1229
+ -0.021585263311862946,
1230
+ -0.011337866075336933,
1231
+ -0.01138055045157671,
1232
+ -0.01878957450389862,
1233
+ -0.014898382127285004,
1234
+ -0.013961542397737503,
1235
+ -0.011020154692232609,
1236
+ -0.0068219625391066074,
1237
+ -0.01268070936203003,
1238
+ -0.009293211624026299,
1239
+ -0.007372069638222456,
1240
+ -0.01334339939057827,
1241
+ -0.008575188927352428,
1242
+ -0.01893424242734909,
1243
+ -0.004299005027860403,
1244
+ -0.01672191545367241,
1245
+ -0.010577057488262653,
1246
+ -0.012055435217916965,
1247
+ -0.007592372130602598,
1248
+ -0.01940261386334896,
1249
+ -0.0093060452491045
1250
+ ],
1251
+ "abs_loss": [
1252
+ 2.299344062805176,
1253
+ 2.260986328125,
1254
+ 2.1556284427642822,
1255
+ 2.104736328125,
1256
+ 1.9904539585113525,
1257
+ 1.9295542240142822,
1258
+ 1.8402255773544312,
1259
+ 1.8242886066436768,
1260
+ 1.7795265913009644,
1261
+ 1.8407790660858154,
1262
+ 1.8398520946502686,
1263
+ 1.849395990371704,
1264
+ 1.843975305557251,
1265
+ 1.8516335487365723,
1266
+ 1.7879228591918945,
1267
+ 1.788717269897461,
1268
+ 1.759417176246643,
1269
+ 1.8009793758392334,
1270
+ 1.7452125549316406,
1271
+ 1.7425484657287598,
1272
+ 1.555834412574768,
1273
+ 1.1474618911743164,
1274
+ 0.8454347848892212,
1275
+ 0.704007625579834,
1276
+ 0.6705518364906311,
1277
+ 0.609591007232666,
1278
+ 0.6524008512496948,
1279
+ 0.6311492919921875,
1280
+ 0.5775978565216064,
1281
+ 0.5621682405471802,
1282
+ 0.5438365936279297,
1283
+ 0.44852185249328613,
1284
+ 0.5401815176010132,
1285
+ 0.4914752244949341,
1286
+ 0.4704228639602661,
1287
+ 0.4958714246749878,
1288
+ 0.3765189051628113,
1289
+ 0.4290388226509094,
1290
+ 0.4278205335140228,
1291
+ 0.4029718339443207,
1292
+ 0.363197386264801,
1293
+ 0.3876047730445862,
1294
+ 0.35308271646499634,
1295
+ 0.4169761538505554,
1296
+ 0.4003360867500305,
1297
+ 0.36092817783355713,
1298
+ 0.2622601389884949,
1299
+ 0.21992714703083038,
1300
+ 0.22185902297496796,
1301
+ 0.22628647089004517,
1302
+ 0.1717938482761383,
1303
+ 0.13614629209041595,
1304
+ 0.23006287217140198,
1305
+ 0.12394532561302185,
1306
+ 0.19495609402656555,
1307
+ 0.11710832267999649,
1308
+ 0.12505380809307098,
1309
+ 0.1392887979745865,
1310
+ 0.13805821537971497,
1311
+ 0.11470522731542587,
1312
+ 0.12912991642951965,
1313
+ 0.1577836573123932,
1314
+ 0.10746321082115173,
1315
+ 0.12499044835567474,
1316
+ 0.08797664940357208,
1317
+ 0.15068618953227997,
1318
+ 0.09933540225028992,
1319
+ 0.08326271176338196,
1320
+ 0.1302133947610855,
1321
+ 0.09028597921133041,
1322
+ 0.11054735630750656,
1323
+ 0.0894804447889328,
1324
+ 0.09026975929737091,
1325
+ 0.07138688862323761,
1326
+ 0.06727860867977142,
1327
+ 0.07304547727108002,
1328
+ 0.06594955921173096,
1329
+ 0.07161735743284225,
1330
+ 0.062283098697662354,
1331
+ 0.06454157084226608,
1332
+ 0.04927849397063255,
1333
+ 0.06570068001747131,
1334
+ 0.056670963764190674,
1335
+ 0.05045980215072632,
1336
+ 0.05004817619919777,
1337
+ 0.06310935318470001,
1338
+ 0.06392456591129303,
1339
+ 0.06564883887767792,
1340
+ 0.05773782730102539,
1341
+ 0.061772946268320084,
1342
+ 0.05797974392771721,
1343
+ 0.07630695402622223,
1344
+ 0.06167856603860855,
1345
+ 0.07231593132019043,
1346
+ 0.11075171828269958,
1347
+ 0.04661320522427559,
1348
+ 0.0489351823925972,
1349
+ 0.0893353521823883,
1350
+ 0.060487184673547745,
1351
+ 0.09393326193094254,
1352
+ 0.03158995509147644,
1353
+ 0.055979665368795395,
1354
+ 0.06557424366474152,
1355
+ 0.05441770330071449,
1356
+ 0.04168401658535004,
1357
+ 0.0773334950208664,
1358
+ 0.07367226481437683,
1359
+ 0.04429794102907181,
1360
+ 0.0793289840221405,
1361
+ 0.052316803485155106,
1362
+ 0.06733226776123047,
1363
+ 0.03158876299858093,
1364
+ 0.034266795963048935,
1365
+ 0.054954931139945984,
1366
+ 0.04762925207614899,
1367
+ 0.043583113700151443,
1368
+ 0.04020775109529495,
1369
+ 0.03741905838251114,
1370
+ 0.035040151327848434,
1371
+ 0.04534371942281723,
1372
+ 0.03905560076236725,
1373
+ 0.037578366696834564,
1374
+ 0.032150596380233765,
1375
+ 0.029294807463884354,
1376
+ 0.024255525320768356,
1377
+ 0.027897939085960388,
1378
+ 0.023556236177682877,
1379
+ 0.022768860682845116,
1380
+ 0.038224779069423676,
1381
+ 0.023875029757618904,
1382
+ 0.020412296056747437,
1383
+ 0.02970881760120392,
1384
+ 0.022083569318056107,
1385
+ 0.04237690567970276,
1386
+ 0.04460488259792328,
1387
+ 0.030337054282426834,
1388
+ 0.027709612622857094,
1389
+ 0.06888288259506226,
1390
+ 0.039946548640728,
1391
+ 0.042287010699510574,
1392
+ 0.029126375913619995,
1393
+ 0.025236384943127632,
1394
+ 0.02371005341410637,
1395
+ 0.027542464435100555,
1396
+ 0.025641027837991714,
1397
+ 0.021950792521238327,
1398
+ 0.036771371960639954,
1399
+ 0.025186948478221893,
1400
+ 0.02962624467909336,
1401
+ 0.053835876286029816,
1402
+ 0.03475363925099373,
1403
+ 0.01969662308692932,
1404
+ 0.022654570639133453,
1405
+ 0.03054218366742134,
1406
+ 0.037232786417007446,
1407
+ 0.028109990060329437,
1408
+ 0.03265418857336044,
1409
+ 0.02478908933699131,
1410
+ 0.02990144118666649,
1411
+ 0.03199092298746109,
1412
+ 0.02706174924969673,
1413
+ 0.028437677770853043,
1414
+ 0.060366686433553696,
1415
+ 0.022765610367059708,
1416
+ 0.015636730939149857,
1417
+ 0.027268197387456894,
1418
+ 0.023486804217100143,
1419
+ 0.038214731961488724,
1420
+ 0.01846570149064064,
1421
+ 0.03504270315170288,
1422
+ 0.021792110055685043,
1423
+ 0.017945710569620132,
1424
+ 0.011015732772648335,
1425
+ 0.0115514462813735,
1426
+ 0.016857855021953583,
1427
+ 0.009889829903841019,
1428
+ 0.017013514414429665,
1429
+ 0.0045443433336913586,
1430
+ 0.01444745808839798,
1431
+ 0.014259792864322662,
1432
+ 0.014394810423254967,
1433
+ 0.009073961526155472,
1434
+ 0.013447131961584091,
1435
+ 0.004474250599741936,
1436
+ 0.011651335284113884,
1437
+ 0.005200245417654514,
1438
+ 0.004128721076995134,
1439
+ 0.00229267543181777,
1440
+ 0.00947949942201376,
1441
+ 0.007636476308107376,
1442
+ 0.009588472545146942,
1443
+ 0.0010691049974411726,
1444
+ 0.004199020564556122,
1445
+ 0.006084855180233717,
1446
+ 0.02109791524708271,
1447
+ 0.005467078648507595,
1448
+ 0.02420104667544365,
1449
+ 0.002727311570197344,
1450
+ 0.008652322925627232,
1451
+ 0.011295134201645851,
1452
+ 0.0014467908767983317,
1453
+ 0.0038114560302346945,
1454
+ 0.005532393231987953,
1455
+ 0.00694839796051383,
1456
+ 0.004151223227381706,
1457
+ 0.0009016941185109317,
1458
+ 0.0006601667264476418,
1459
+ 0.004251205362379551,
1460
+ 0.00760949170216918,
1461
+ 0.012696701101958752,
1462
+ 0.008532650768756866,
1463
+ 0.001909587299451232,
1464
+ 0.0026952014304697514,
1465
+ 0.004836875945329666,
1466
+ 0.004397994838654995,
1467
+ 0.0006370687624439597,
1468
+ 0.0008205081103369594,
1469
+ 0.00705351447686553,
1470
+ 0.0013074338203296065,
1471
+ 0.022862592712044716,
1472
+ 0.002685739891603589,
1473
+ 0.0011106947204098105,
1474
+ 0.0010044374503195286,
1475
+ 0.011497174389660358,
1476
+ 0.0011244597844779491,
1477
+ 0.0008501890697516501,
1478
+ 0.01461706217378378,
1479
+ 0.0003344400611240417,
1480
+ 0.00048674835124984384,
1481
+ 0.0014398308703675866,
1482
+ 0.004889882635325193,
1483
+ 0.0050505525432527065,
1484
+ 0.00018931939848698676,
1485
+ 0.0003458811843302101,
1486
+ 0.002722643781453371,
1487
+ 0.0002332775911781937,
1488
+ 0.0013001272454857826,
1489
+ 0.00021184541401453316,
1490
+ 0.0009218329796567559,
1491
+ 0.0027250817511230707,
1492
+ 0.00031440556631423533,
1493
+ 0.0002346429682802409,
1494
+ 0.001220405800268054,
1495
+ 0.0018606358207762241,
1496
+ 0.0035638727713376284,
1497
+ 0.0016847129445523024,
1498
+ 0.014343084767460823,
1499
+ 0.0011122154537588358,
1500
+ 0.00010775879491120577,
1501
+ 0.002860118169337511,
1502
+ 0.0009351018234156072,
1503
+ 0.0001049952843459323,
1504
+ 0.0015063899336382747,
1505
+ 0.0004531373269855976,
1506
+ 0.0006659829523414373,
1507
+ 0.0001711525401333347,
1508
+ 0.0008639515144750476,
1509
+ 0.0004461331118363887,
1510
+ 0.0006608754047192633,
1511
+ 0.0036144552286714315,
1512
+ 0.0006740841781720519,
1513
+ 0.032447319477796555,
1514
+ 0.0007009927649050951,
1515
+ 0.00489542493596673,
1516
+ 0.00434274785220623,
1517
+ 8.473070920445025e-05,
1518
+ 0.000703380152117461,
1519
+ 0.006214356981217861,
1520
+ 0.00016676468658261,
1521
+ 0.0009907478233799338,
1522
+ 0.0025063965003937483,
1523
+ 0.0011624305043369532,
1524
+ 0.00016601078095845878,
1525
+ 0.0006969748064875603,
1526
+ 0.007066912017762661,
1527
+ 0.003668984165415168,
1528
+ 7.324820762732998e-05,
1529
+ 0.0028977978508919477,
1530
+ 0.005441818851977587,
1531
+ 0.0004984366241842508,
1532
+ 0.0017339475452899933,
1533
+ 0.00023327581584453583,
1534
+ 0.0001926865370478481,
1535
+ 0.0012457568664103746,
1536
+ 0.0007202249835245311,
1537
+ 0.000402639911044389,
1538
+ 0.0013670185580849648,
1539
+ 3.5127817682223395e-05,
1540
+ 0.00021311761520337313,
1541
+ 0.002809969475492835,
1542
+ 4.842525959247723e-05,
1543
+ 0.000630392343737185,
1544
+ 9.536967263557017e-05,
1545
+ 0.00013890725676901639,
1546
+ 0.0004332676762714982,
1547
+ 0.0023571839556097984,
1548
+ 0.00031570333521813154,
1549
+ 4.98054432682693e-05,
1550
+ 9.038536518346518e-05,
1551
+ 8.741506462683901e-05,
1552
+ 0.0017366388346999884,
1553
+ 0.015279402956366539,
1554
+ 0.009888592176139355,
1555
+ 0.0007309710490517318,
1556
+ 0.0001263176091015339,
1557
+ 0.0015627600951120257,
1558
+ 3.972904960392043e-05,
1559
+ 0.00020485775894485414,
1560
+ 0.0020928476005792618,
1561
+ 0.01206766813993454
1562
+ ],
1563
+ "zipf_loss": [
1564
+ 9.058754920959473,
1565
+ 7.890384674072266,
1566
+ 5.778624534606934,
1567
+ 4.048534393310547,
1568
+ 2.8494701385498047,
1569
+ 2.1733155250549316,
1570
+ 1.8742389678955078,
1571
+ 1.76926589012146,
1572
+ 1.7294540405273438,
1573
+ 1.7117260694503784,
1574
+ 1.7042937278747559,
1575
+ 1.699077844619751,
1576
+ 1.694797396659851,
1577
+ 1.692865252494812,
1578
+ 1.6956968307495117,
1579
+ 1.691650152206421,
1580
+ 1.694605827331543,
1581
+ 1.6876543760299683,
1582
+ 1.6817702054977417,
1583
+ 1.6466394662857056,
1584
+ 1.5439013242721558,
1585
+ 1.1701998710632324,
1586
+ 0.44191816449165344,
1587
+ 0.2040979564189911,
1588
+ 0.1309266984462738,
1589
+ 0.10370349138975143,
1590
+ 0.08770886063575745,
1591
+ 0.07240704447031021,
1592
+ 0.0574091337621212,
1593
+ 0.0552031472325325,
1594
+ 0.05886688455939293,
1595
+ 0.04677460715174675,
1596
+ 0.04333113506436348,
1597
+ 0.04453083872795105,
1598
+ 0.034692052751779556,
1599
+ 0.03856681287288666,
1600
+ 0.0307029876857996,
1601
+ 0.032588567584753036,
1602
+ 0.03134528174996376,
1603
+ 0.03274175524711609,
1604
+ 0.03539920970797539,
1605
+ 0.029425304383039474,
1606
+ 0.04271072894334793,
1607
+ 0.022020675241947174,
1608
+ 0.025436237454414368,
1609
+ 0.0225045308470726,
1610
+ 0.0352756530046463,
1611
+ 0.02675449475646019,
1612
+ 0.020403895527124405,
1613
+ 0.017143985256552696,
1614
+ 0.024958601221442223,
1615
+ 0.01914350688457489,
1616
+ 0.015139289200305939,
1617
+ 0.04403791204094887,
1618
+ 0.018589705228805542,
1619
+ 0.024111982434988022,
1620
+ 0.0309278666973114,
1621
+ 0.01720796898007393,
1622
+ 0.013786230236291885,
1623
+ 0.015711206942796707,
1624
+ 0.02173854038119316,
1625
+ 0.013659925200045109,
1626
+ 0.036106519401073456,
1627
+ 0.014328142628073692,
1628
+ 0.03244594484567642,
1629
+ 0.009032469242811203,
1630
+ 0.018440525978803635,
1631
+ 0.01920383982360363,
1632
+ 0.020473865792155266,
1633
+ 0.032765328884124756,
1634
+ 0.014637406915426254,
1635
+ 0.01448108535259962,
1636
+ 0.012129629030823708,
1637
+ 0.011150146834552288,
1638
+ 0.031212156638503075,
1639
+ 0.02721549943089485,
1640
+ 0.014894500374794006,
1641
+ 0.019399020820856094,
1642
+ 0.020370926707983017,
1643
+ 0.03513526916503906,
1644
+ 0.013435397297143936,
1645
+ 0.02822204679250717,
1646
+ 0.009487655013799667,
1647
+ 0.015622190199792385,
1648
+ 0.017895258963108063,
1649
+ 0.016876041889190674,
1650
+ 0.013383161276578903,
1651
+ 0.021335359662771225,
1652
+ 0.030914466828107834,
1653
+ 0.010580360889434814,
1654
+ 0.011451056227087975,
1655
+ 0.007803402841091156,
1656
+ 0.012233724817633629,
1657
+ 0.040140219032764435,
1658
+ 0.019514363259077072,
1659
+ 0.010945022106170654,
1660
+ 0.015346281230449677,
1661
+ 0.015768669545650482,
1662
+ 0.014031963422894478,
1663
+ 0.012113187462091446,
1664
+ 0.018322959542274475,
1665
+ 0.008950436487793922,
1666
+ 0.008387358859181404,
1667
+ 0.01833055168390274,
1668
+ 0.009781958535313606,
1669
+ 0.03388731926679611,
1670
+ 0.023594915866851807,
1671
+ 0.02366054803133011,
1672
+ 0.014914799481630325,
1673
+ 0.01527368277311325,
1674
+ 0.013935800641775131,
1675
+ 0.01937665417790413,
1676
+ 0.026555389165878296,
1677
+ 0.013119127601385117,
1678
+ 0.017327692359685898,
1679
+ 0.01281806081533432,
1680
+ 0.03115082159638405,
1681
+ 0.01274685375392437,
1682
+ 0.024018671363592148,
1683
+ 0.01721969060599804,
1684
+ 0.008875923231244087,
1685
+ 0.0186840258538723,
1686
+ 0.03127584606409073,
1687
+ 0.03355969488620758,
1688
+ 0.02109907940030098,
1689
+ 0.02521275356411934,
1690
+ 0.014678552746772766,
1691
+ 0.015803975984454155,
1692
+ 0.010580860078334808,
1693
+ 0.01446072943508625,
1694
+ 0.039702266454696655,
1695
+ 0.04098086804151535,
1696
+ 0.017026258632540703,
1697
+ 0.04800141602754593,
1698
+ 0.019417084753513336,
1699
+ 0.021352805197238922,
1700
+ 0.0277378149330616,
1701
+ 0.025049306452274323,
1702
+ 0.011761985719203949,
1703
+ 0.02068621665239334,
1704
+ 0.025553595274686813,
1705
+ 0.0071304067969322205,
1706
+ 0.016906581819057465,
1707
+ 0.01546161063015461,
1708
+ 0.010241236537694931,
1709
+ 0.012455351650714874,
1710
+ 0.015299420803785324,
1711
+ 0.019323330372571945,
1712
+ 0.013211840763688087,
1713
+ 0.013413187116384506,
1714
+ 0.024162352085113525,
1715
+ 0.01807761937379837,
1716
+ 0.013908561319112778,
1717
+ 0.03093879669904709,
1718
+ 0.0144495889544487,
1719
+ 0.019718807190656662,
1720
+ 0.00844704918563366,
1721
+ 0.028906114399433136,
1722
+ 0.010804221034049988,
1723
+ 0.009488066658377647,
1724
+ 0.012067637406289577,
1725
+ 0.015040576457977295,
1726
+ 0.007470171898603439,
1727
+ 0.014873256906867027,
1728
+ 0.010988231748342514,
1729
+ 0.012767143547534943,
1730
+ 0.016154780983924866,
1731
+ 0.010871181264519691,
1732
+ 0.017987877130508423,
1733
+ 0.012239239178597927,
1734
+ 0.012328235432505608,
1735
+ 0.021448515355587006,
1736
+ 0.02059098333120346,
1737
+ 0.015664558857679367,
1738
+ 0.01218429021537304,
1739
+ 0.007261655293405056,
1740
+ 0.017222527414560318,
1741
+ 0.011581387370824814,
1742
+ 0.010656767524778843,
1743
+ 0.010246491059660912,
1744
+ 0.018553227186203003,
1745
+ 0.03282719478011131,
1746
+ 0.0162493996322155,
1747
+ 0.03963233903050423,
1748
+ 0.012939762324094772,
1749
+ 0.020252341404557228,
1750
+ 0.013496289029717445,
1751
+ 0.00857863575220108,
1752
+ 0.010840233415365219,
1753
+ 0.014845713973045349,
1754
+ 0.007054360583424568,
1755
+ 0.01816418580710888,
1756
+ 0.02891641855239868,
1757
+ 0.010288992896676064,
1758
+ 0.00713920034468174,
1759
+ 0.012660834938287735,
1760
+ 0.015461052767932415,
1761
+ 0.015566255897283554,
1762
+ 0.018684573471546173,
1763
+ 0.012360978871583939,
1764
+ 0.005702901631593704,
1765
+ 0.007907480001449585,
1766
+ 0.009306533262133598,
1767
+ 0.02719968557357788,
1768
+ 0.010554085485637188,
1769
+ 0.018172377720475197,
1770
+ 0.007528157904744148,
1771
+ 0.01175107154995203,
1772
+ 0.011585632339119911,
1773
+ 0.014379439875483513,
1774
+ 0.008955443277955055,
1775
+ 0.010577559471130371,
1776
+ 0.007796976715326309,
1777
+ 0.014662452042102814,
1778
+ 0.020020950585603714,
1779
+ 0.0077422186732292175,
1780
+ 0.013598084449768066,
1781
+ 0.009638023562729359,
1782
+ 0.010541138239204884,
1783
+ 0.007165942341089249,
1784
+ 0.010295277461409569,
1785
+ 0.007796257734298706,
1786
+ 0.006619937717914581,
1787
+ 0.020668882876634598,
1788
+ 0.01578902080655098,
1789
+ 0.007280856370925903,
1790
+ 0.011586855165660381,
1791
+ 0.011592477560043335,
1792
+ 0.007128148805350065,
1793
+ 0.015206173062324524,
1794
+ 0.014938851818442345,
1795
+ 0.00543565209954977,
1796
+ 0.008509164676070213,
1797
+ 0.024902423843741417,
1798
+ 0.014712754637002945,
1799
+ 0.018012208864092827,
1800
+ 0.008784620091319084,
1801
+ 0.010731510818004608,
1802
+ 0.013733292929828167,
1803
+ 0.00869428925216198,
1804
+ 0.022556070238351822,
1805
+ 0.02647048607468605,
1806
+ 0.013982734642922878,
1807
+ 0.015525490045547485,
1808
+ 0.009201617911458015,
1809
+ 0.007094781845808029,
1810
+ 0.015642520040273666,
1811
+ 0.009298092685639858,
1812
+ 0.014537567272782326,
1813
+ 0.00825614295899868,
1814
+ 0.009203104302287102,
1815
+ 0.011141359806060791,
1816
+ 0.008821116760373116,
1817
+ 0.008776454254984856,
1818
+ 0.009878752753138542,
1819
+ 0.009446032345294952,
1820
+ 0.012018155306577682,
1821
+ 0.017650537192821503,
1822
+ 0.009024819359183311,
1823
+ 0.009477643296122551,
1824
+ 0.013601088896393776,
1825
+ 0.012014838866889477,
1826
+ 0.021504897624254227,
1827
+ 0.009149780496954918,
1828
+ 0.007894977927207947,
1829
+ 0.01129077933728695,
1830
+ 0.010833574458956718,
1831
+ 0.014918159693479538,
1832
+ 0.00855458527803421,
1833
+ 0.00736504141241312,
1834
+ 0.008928017690777779,
1835
+ 0.016933809965848923,
1836
+ 0.03210865706205368,
1837
+ 0.01579834707081318,
1838
+ 0.009920194745063782,
1839
+ 0.010861337184906006,
1840
+ 0.018204521387815475,
1841
+ 0.010070055723190308,
1842
+ 0.006747391074895859,
1843
+ 0.012954551726579666,
1844
+ 0.014359045773744583,
1845
+ 0.009734511375427246,
1846
+ 0.01635069027543068,
1847
+ 0.016396958380937576,
1848
+ 0.028392184525728226,
1849
+ 0.005876493640244007,
1850
+ 0.023259446024894714,
1851
+ 0.008534284308552742,
1852
+ 0.010509041137993336,
1853
+ 0.010909554548561573,
1854
+ 0.023324768990278244,
1855
+ 0.014119546860456467,
1856
+ 0.005262024700641632,
1857
+ 0.01122361421585083,
1858
+ 0.008188644424080849,
1859
+ 0.016334168612957,
1860
+ 0.018166374415159225,
1861
+ 0.011789614334702492,
1862
+ 0.008024140261113644,
1863
+ 0.013983141630887985,
1864
+ 0.014104964211583138,
1865
+ 0.01138586550951004,
1866
+ 0.013332624919712543,
1867
+ 0.014329064637422562,
1868
+ 0.015091532841324806,
1869
+ 0.010317517444491386,
1870
+ 0.015318581834435463,
1871
+ 0.019480697810649872,
1872
+ 0.013706950470805168,
1873
+ 0.00945664569735527
1874
+ ],
1875
+ "denoise_loss": [],
1876
+ "ortho_loss": [
1877
+ 0.7847321629524231,
1878
+ 0.6201837658882141,
1879
+ 0.485784113407135,
1880
+ 0.35137468576431274,
1881
+ 0.2879585325717926,
1882
+ 0.24915075302124023,
1883
+ 0.21809658408164978,
1884
+ 0.16125144064426422,
1885
+ 0.13464920222759247,
1886
+ 0.11504802852869034,
1887
+ 0.10673171281814575,
1888
+ 0.1009758859872818,
1889
+ 0.10426314175128937,
1890
+ 0.10648877918720245,
1891
+ 0.10758698731660843,
1892
+ 0.10554790496826172,
1893
+ 0.09970692545175552,
1894
+ 0.10068698972463608,
1895
+ 0.1037362664937973,
1896
+ 0.11161494255065918,
1897
+ 0.11507049202919006,
1898
+ 0.1317492574453354,
1899
+ 0.14284595847129822,
1900
+ 0.14627856016159058,
1901
+ 0.15046416223049164,
1902
+ 0.1489173024892807,
1903
+ 0.15455691516399384,
1904
+ 0.15504224598407745,
1905
+ 0.15456973016262054,
1906
+ 0.15529467165470123,
1907
+ 0.15482097864151,
1908
+ 0.1637507677078247,
1909
+ 0.16011153161525726,
1910
+ 0.1651749312877655,
1911
+ 0.1716211438179016,
1912
+ 0.17574329674243927,
1913
+ 0.15954194962978363,
1914
+ 0.1582264006137848,
1915
+ 0.15588511526584625,
1916
+ 0.1600116342306137,
1917
+ 0.15758398175239563,
1918
+ 0.1619112193584442,
1919
+ 0.16302575170993805,
1920
+ 0.15522991120815277,
1921
+ 0.16260525584220886,
1922
+ 0.15874461829662323,
1923
+ 0.15806731581687927,
1924
+ 0.16073763370513916,
1925
+ 0.16050544381141663,
1926
+ 0.16037650406360626,
1927
+ 0.1638392060995102,
1928
+ 0.16640426218509674,
1929
+ 0.16966049373149872,
1930
+ 0.17420445382595062,
1931
+ 0.17574597895145416,
1932
+ 0.1799435168504715,
1933
+ 0.18488837778568268,
1934
+ 0.19086268544197083,
1935
+ 0.19754229485988617,
1936
+ 0.20065085589885712,
1937
+ 0.20717096328735352,
1938
+ 0.22641225159168243,
1939
+ 0.22547413408756256,
1940
+ 0.2379624992609024,
1941
+ 0.24835960566997528,
1942
+ 0.2551441490650177,
1943
+ 0.26230356097221375,
1944
+ 0.26771965622901917,
1945
+ 0.27327385544776917,
1946
+ 0.27560171484947205,
1947
+ 0.2836180627346039,
1948
+ 0.28607603907585144,
1949
+ 0.28698083758354187,
1950
+ 0.28780463337898254,
1951
+ 0.28826531767845154,
1952
+ 0.29221728444099426,
1953
+ 0.29222774505615234,
1954
+ 0.3024168312549591,
1955
+ 0.3035641312599182,
1956
+ 0.30658817291259766,
1957
+ 0.3131972849369049,
1958
+ 0.3128298223018646,
1959
+ 0.3272259831428528,
1960
+ 0.3372877538204193,
1961
+ 0.344853013753891,
1962
+ 0.347524493932724,
1963
+ 0.34524956345558167,
1964
+ 0.3452718257904053,
1965
+ 0.34162092208862305,
1966
+ 0.34223735332489014,
1967
+ 0.3512662351131439,
1968
+ 0.349275141954422,
1969
+ 0.35955575108528137,
1970
+ 0.36343318223953247,
1971
+ 0.3586910367012024,
1972
+ 0.35721367597579956,
1973
+ 0.3625499904155731,
1974
+ 0.3687310218811035,
1975
+ 0.37282317876815796,
1976
+ 0.37235260009765625,
1977
+ 0.3716725707054138,
1978
+ 0.37703198194503784,
1979
+ 0.38177719712257385,
1980
+ 0.38606080412864685,
1981
+ 0.39012834429740906,
1982
+ 0.39147788286209106,
1983
+ 0.3895938992500305,
1984
+ 0.39241254329681396,
1985
+ 0.3979438841342926,
1986
+ 0.4000576436519623,
1987
+ 0.39591819047927856,
1988
+ 0.3956204056739807,
1989
+ 0.3989535868167877,
1990
+ 0.400198370218277,
1991
+ 0.4030740261077881,
1992
+ 0.4027870297431946,
1993
+ 0.4019368290901184,
1994
+ 0.4043729305267334,
1995
+ 0.40525487065315247,
1996
+ 0.4084034562110901,
1997
+ 0.4060479998588562,
1998
+ 0.40902647376060486,
1999
+ 0.40762025117874146,
2000
+ 0.40840235352516174,
2001
+ 0.41167858242988586,
2002
+ 0.4119378924369812,
2003
+ 0.4134664833545685,
2004
+ 0.41601672768592834,
2005
+ 0.42163756489753723,
2006
+ 0.42329949140548706,
2007
+ 0.4231146574020386,
2008
+ 0.4070468544960022,
2009
+ 0.410058856010437,
2010
+ 0.41018280386924744,
2011
+ 0.4142322242259979,
2012
+ 0.4147290587425232,
2013
+ 0.41209307312965393,
2014
+ 0.41136229038238525,
2015
+ 0.41243118047714233,
2016
+ 0.41491344571113586,
2017
+ 0.4101180136203766,
2018
+ 0.41006335616111755,
2019
+ 0.40823736786842346,
2020
+ 0.4069826006889343,
2021
+ 0.409622460603714,
2022
+ 0.41260066628456116,
2023
+ 0.4101448953151703,
2024
+ 0.41018062829971313,
2025
+ 0.4115578234195709,
2026
+ 0.4015924334526062,
2027
+ 0.40146732330322266,
2028
+ 0.4005260467529297,
2029
+ 0.40929973125457764,
2030
+ 0.41000333428382874,
2031
+ 0.4101176857948303,
2032
+ 0.41058748960494995,
2033
+ 0.41650286316871643,
2034
+ 0.41580337285995483,
2035
+ 0.4170321226119995,
2036
+ 0.4204050302505493,
2037
+ 0.4221915900707245,
2038
+ 0.41944631934165955,
2039
+ 0.41892117261886597,
2040
+ 0.4185391068458557,
2041
+ 0.4206126928329468,
2042
+ 0.4234926998615265,
2043
+ 0.419546514749527,
2044
+ 0.4183448553085327,
2045
+ 0.4203522801399231,
2046
+ 0.42284834384918213,
2047
+ 0.42296749353408813,
2048
+ 0.42207303643226624,
2049
+ 0.42741724848747253,
2050
+ 0.43038639426231384,
2051
+ 0.4332205653190613,
2052
+ 0.43608179688453674,
2053
+ 0.43772828578948975,
2054
+ 0.4389691650867462,
2055
+ 0.4399281144142151,
2056
+ 0.43813154101371765,
2057
+ 0.43532952666282654,
2058
+ 0.43657514452934265,
2059
+ 0.43844500184059143,
2060
+ 0.4404738247394562,
2061
+ 0.44257253408432007,
2062
+ 0.4390065670013428,
2063
+ 0.4419112503528595,
2064
+ 0.44427263736724854,
2065
+ 0.4463488757610321,
2066
+ 0.4405331611633301,
2067
+ 0.4419408142566681,
2068
+ 0.44285067915916443,
2069
+ 0.443846732378006,
2070
+ 0.4430800676345825,
2071
+ 0.44508397579193115,
2072
+ 0.4468174874782562,
2073
+ 0.4474944770336151,
2074
+ 0.4521268308162689,
2075
+ 0.4507824778556824,
2076
+ 0.4480542242527008,
2077
+ 0.4508533179759979,
2078
+ 0.45075565576553345,
2079
+ 0.4510415196418762,
2080
+ 0.45447415113449097,
2081
+ 0.45526012778282166,
2082
+ 0.4589647948741913,
2083
+ 0.45821577310562134,
2084
+ 0.4597731828689575,
2085
+ 0.4576256275177002,
2086
+ 0.458015501499176,
2087
+ 0.4577544033527374,
2088
+ 0.45788660645484924,
2089
+ 0.46253782510757446,
2090
+ 0.4643017053604126,
2091
+ 0.46533340215682983,
2092
+ 0.4694773554801941,
2093
+ 0.4710234999656677,
2094
+ 0.474755197763443,
2095
+ 0.4747978448867798,
2096
+ 0.47470852732658386,
2097
+ 0.4768957793712616,
2098
+ 0.4764065742492676,
2099
+ 0.4771294593811035,
2100
+ 0.4750293493270874,
2101
+ 0.4773629903793335,
2102
+ 0.4821653664112091,
2103
+ 0.4824097156524658,
2104
+ 0.48181289434432983,
2105
+ 0.48094648122787476,
2106
+ 0.48161426186561584,
2107
+ 0.4826149046421051,
2108
+ 0.48084303736686707,
2109
+ 0.4804546535015106,
2110
+ 0.4814865291118622,
2111
+ 0.48577627539634705,
2112
+ 0.48592525720596313,
2113
+ 0.48632577061653137,
2114
+ 0.4861513376235962,
2115
+ 0.48470595479011536,
2116
+ 0.4860209822654724,
2117
+ 0.48682039976119995,
2118
+ 0.4872964024543762,
2119
+ 0.4871342182159424,
2120
+ 0.48852646350860596,
2121
+ 0.4895513355731964,
2122
+ 0.48887261748313904,
2123
+ 0.4911658465862274,
2124
+ 0.4918389618396759,
2125
+ 0.49207761883735657,
2126
+ 0.4916519820690155,
2127
+ 0.49232858419418335,
2128
+ 0.49125486612319946,
2129
+ 0.49178799986839294,
2130
+ 0.4918094277381897,
2131
+ 0.4970461130142212,
2132
+ 0.4971783757209778,
2133
+ 0.4979783892631531,
2134
+ 0.4978001117706299,
2135
+ 0.49840614199638367,
2136
+ 0.4982592761516571,
2137
+ 0.4988299310207367,
2138
+ 0.4990873634815216,
2139
+ 0.4977569282054901,
2140
+ 0.4987112283706665,
2141
+ 0.4936622381210327,
2142
+ 0.4934949278831482,
2143
+ 0.4944172501564026,
2144
+ 0.4960152506828308,
2145
+ 0.4952702224254608,
2146
+ 0.49674108624458313,
2147
+ 0.4976678788661957,
2148
+ 0.49840182065963745,
2149
+ 0.5009401440620422,
2150
+ 0.5002650618553162,
2151
+ 0.5008472800254822,
2152
+ 0.5004611015319824,
2153
+ 0.500277042388916,
2154
+ 0.5007216930389404,
2155
+ 0.5007331371307373,
2156
+ 0.5008963942527771,
2157
+ 0.5007463097572327,
2158
+ 0.5002378821372986,
2159
+ 0.5010074377059937,
2160
+ 0.5006035566329956,
2161
+ 0.5012862682342529,
2162
+ 0.5009413957595825,
2163
+ 0.5010911822319031,
2164
+ 0.5015745759010315,
2165
+ 0.501132607460022,
2166
+ 0.5010624527931213,
2167
+ 0.501613199710846,
2168
+ 0.5014798045158386,
2169
+ 0.5017808675765991,
2170
+ 0.5021051168441772,
2171
+ 0.5025299191474915,
2172
+ 0.5023022890090942,
2173
+ 0.5030853748321533,
2174
+ 0.5032898783683777,
2175
+ 0.5033749938011169,
2176
+ 0.5042749643325806,
2177
+ 0.5036572813987732,
2178
+ 0.5036152601242065,
2179
+ 0.5036109089851379,
2180
+ 0.504612386226654,
2181
+ 0.5043815970420837,
2182
+ 0.5043673515319824,
2183
+ 0.5048116445541382,
2184
+ 0.5051637291908264,
2185
+ 0.5053876638412476,
2186
+ 0.5054917335510254
2187
+ ],
2188
+ "lr": [
2189
+ 4.188034188034189e-06,
2190
+ 8.461538461538462e-06,
2191
+ 1.2735042735042738e-05,
2192
+ 1.700854700854701e-05,
2193
+ 2.1282051282051282e-05,
2194
+ 2.5555555555555557e-05,
2195
+ 2.9829059829059833e-05,
2196
+ 3.4102564102564105e-05,
2197
+ 3.837606837606838e-05,
2198
+ 4e-05,
2199
+ 4e-05,
2200
+ 4e-05,
2201
+ 4e-05,
2202
+ 4e-05,
2203
+ 4e-05,
2204
+ 4e-05,
2205
+ 4e-05,
2206
+ 4e-05,
2207
+ 4e-05,
2208
+ 4e-05,
2209
+ 4e-05,
2210
+ 4e-05,
2211
+ 4e-05,
2212
+ 4e-05,
2213
+ 4e-05,
2214
+ 4e-05,
2215
+ 4e-05,
2216
+ 4e-05,
2217
+ 4e-05,
2218
+ 4e-05,
2219
+ 4e-05,
2220
+ 4e-05,
2221
+ 4e-05,
2222
+ 4e-05,
2223
+ 4e-05,
2224
+ 4e-05,
2225
+ 4e-05,
2226
+ 4e-05,
2227
+ 4e-05,
2228
+ 4e-05,
2229
+ 4e-05,
2230
+ 4e-05,
2231
+ 4e-05,
2232
+ 4e-05,
2233
+ 4e-05,
2234
+ 4e-05,
2235
+ 4e-05,
2236
+ 4e-05,
2237
+ 4e-05,
2238
+ 4e-05,
2239
+ 4e-05,
2240
+ 4e-05,
2241
+ 4e-05,
2242
+ 4e-05,
2243
+ 4e-05,
2244
+ 4e-05,
2245
+ 4e-05,
2246
+ 4e-05,
2247
+ 4e-05,
2248
+ 4e-05,
2249
+ 4e-05,
2250
+ 4e-05,
2251
+ 4e-05,
2252
+ 4e-05,
2253
+ 4e-05,
2254
+ 4e-05,
2255
+ 4e-05,
2256
+ 4e-05,
2257
+ 4e-05,
2258
+ 4e-05,
2259
+ 4e-05,
2260
+ 4e-05,
2261
+ 4e-05,
2262
+ 4e-05,
2263
+ 4e-05,
2264
+ 4e-05,
2265
+ 4e-05,
2266
+ 4e-05,
2267
+ 4e-05,
2268
+ 4e-05,
2269
+ 4e-05,
2270
+ 4e-05,
2271
+ 4e-05,
2272
+ 4e-05,
2273
+ 4e-05,
2274
+ 4e-05,
2275
+ 4e-05,
2276
+ 4e-05,
2277
+ 4e-05,
2278
+ 4e-05,
2279
+ 4e-05,
2280
+ 4e-05,
2281
+ 4e-05,
2282
+ 4e-05,
2283
+ 4e-05,
2284
+ 4e-05,
2285
+ 4e-05,
2286
+ 4e-05,
2287
+ 4e-05,
2288
+ 4e-05,
2289
+ 4e-05,
2290
+ 4e-05,
2291
+ 4e-05,
2292
+ 4e-05,
2293
+ 4e-05,
2294
+ 4e-05,
2295
+ 4e-05,
2296
+ 4e-05,
2297
+ 4e-05,
2298
+ 4e-05,
2299
+ 4e-05,
2300
+ 4e-05,
2301
+ 4e-05,
2302
+ 4e-05,
2303
+ 4e-05,
2304
+ 4e-05,
2305
+ 4e-05,
2306
+ 4e-05,
2307
+ 4e-05,
2308
+ 4e-05,
2309
+ 4e-05,
2310
+ 4e-05,
2311
+ 4e-05,
2312
+ 4e-05,
2313
+ 4e-05,
2314
+ 4e-05,
2315
+ 4e-05,
2316
+ 4e-05,
2317
+ 4e-05,
2318
+ 4e-05,
2319
+ 4e-05,
2320
+ 4e-05,
2321
+ 4e-05,
2322
+ 4e-05,
2323
+ 4e-05,
2324
+ 4e-05,
2325
+ 4e-05,
2326
+ 4e-05,
2327
+ 4e-05,
2328
+ 4e-05,
2329
+ 4e-05,
2330
+ 4e-05,
2331
+ 4e-05,
2332
+ 4e-05,
2333
+ 4e-05,
2334
+ 4e-05,
2335
+ 4e-05,
2336
+ 4e-05,
2337
+ 4e-05,
2338
+ 4e-05,
2339
+ 4e-05,
2340
+ 4e-05,
2341
+ 4e-05,
2342
+ 4e-05,
2343
+ 4e-05,
2344
+ 4e-05,
2345
+ 4e-05,
2346
+ 4e-05,
2347
+ 4e-05,
2348
+ 4e-05,
2349
+ 4e-05,
2350
+ 4e-05,
2351
+ 4e-05,
2352
+ 4e-05,
2353
+ 4e-05,
2354
+ 4e-05,
2355
+ 4e-05,
2356
+ 4e-05,
2357
+ 4e-05,
2358
+ 4e-05,
2359
+ 4e-05,
2360
+ 4e-05,
2361
+ 4e-05,
2362
+ 4e-05,
2363
+ 4e-05,
2364
+ 4e-05,
2365
+ 4e-05,
2366
+ 4e-05,
2367
+ 4e-05,
2368
+ 4e-05,
2369
+ 4e-05,
2370
+ 4e-05,
2371
+ 4e-05,
2372
+ 4e-05,
2373
+ 4e-05,
2374
+ 4e-05,
2375
+ 4e-05,
2376
+ 4e-05,
2377
+ 4e-05,
2378
+ 3.992995647012267e-05,
2379
+ 3.963316185199842e-05,
2380
+ 3.933636723387416e-05,
2381
+ 3.90395726157499e-05,
2382
+ 3.874277799762565e-05,
2383
+ 3.844598337950139e-05,
2384
+ 3.814918876137713e-05,
2385
+ 3.785239414325287e-05,
2386
+ 3.7555599525128613e-05,
2387
+ 3.725880490700435e-05,
2388
+ 3.696201028888009e-05,
2389
+ 3.666521567075585e-05,
2390
+ 3.6368421052631585e-05,
2391
+ 3.607162643450732e-05,
2392
+ 3.577483181638307e-05,
2393
+ 3.547803719825881e-05,
2394
+ 3.518124258013455e-05,
2395
+ 3.4884447962010287e-05,
2396
+ 3.458765334388604e-05,
2397
+ 3.4290858725761776e-05,
2398
+ 3.399406410763751e-05,
2399
+ 3.3697269489513265e-05,
2400
+ 3.3400474871389e-05,
2401
+ 3.310368025326474e-05,
2402
+ 3.280688563514048e-05,
2403
+ 3.251009101701623e-05,
2404
+ 3.2213296398891967e-05,
2405
+ 3.191650178076771e-05,
2406
+ 3.1542540561931145e-05,
2407
+ 3.124574594380688e-05,
2408
+ 3.094895132568263e-05,
2409
+ 3.065215670755838e-05,
2410
+ 3.0355362089434113e-05,
2411
+ 3.0058567471309854e-05,
2412
+ 2.97617728531856e-05,
2413
+ 2.9464978235061336e-05,
2414
+ 2.9168183616937077e-05,
2415
+ 2.8871388998812818e-05,
2416
+ 2.857459438068857e-05,
2417
+ 2.8277799762564307e-05,
2418
+ 2.798100514444005e-05,
2419
+ 2.7684210526315793e-05,
2420
+ 2.738741590819153e-05,
2421
+ 2.709062129006727e-05,
2422
+ 2.6793826671943013e-05,
2423
+ 2.6497032053818764e-05,
2424
+ 2.62002374356945e-05,
2425
+ 2.5903442817570243e-05,
2426
+ 2.5606648199445987e-05,
2427
+ 2.5309853581321725e-05,
2428
+ 2.5013058963197466e-05,
2429
+ 2.4716264345073214e-05,
2430
+ 2.441946972694896e-05,
2431
+ 2.4122675108824693e-05,
2432
+ 2.3825880490700434e-05,
2433
+ 2.352908587257618e-05,
2434
+ 2.3232291254451916e-05,
2435
+ 2.293549663632766e-05,
2436
+ 2.2638702018203408e-05,
2437
+ 2.226474079936684e-05,
2438
+ 2.196794618124258e-05,
2439
+ 2.1671151563118328e-05,
2440
+ 2.1374356944994066e-05,
2441
+ 2.1077562326869803e-05,
2442
+ 2.0780767708745554e-05,
2443
+ 2.0483973090621296e-05,
2444
+ 2.018717847249703e-05,
2445
+ 1.989038385437277e-05,
2446
+ 1.959358923624852e-05,
2447
+ 1.929679461812426e-05,
2448
+ 1.8999999999999998e-05,
2449
+ 1.8703205381875746e-05,
2450
+ 1.8406410763751487e-05,
2451
+ 1.8109616145627224e-05,
2452
+ 1.7812821527502965e-05,
2453
+ 1.7516026909378713e-05,
2454
+ 1.7219232291254454e-05,
2455
+ 1.6922437673130192e-05,
2456
+ 1.662564305500594e-05,
2457
+ 1.632884843688168e-05,
2458
+ 1.603205381875742e-05,
2459
+ 1.573525920063316e-05,
2460
+ 1.5438464582508908e-05,
2461
+ 1.5141669964384647e-05,
2462
+ 1.4844875346260385e-05,
2463
+ 1.4548080728136134e-05,
2464
+ 1.4251286110011875e-05,
2465
+ 1.3954491491887611e-05,
2466
+ 1.3657696873763363e-05,
2467
+ 1.33609022556391e-05,
2468
+ 1.298694103680253e-05,
2469
+ 1.2690146418678277e-05,
2470
+ 1.2393351800554018e-05,
2471
+ 1.2096557182429756e-05,
2472
+ 1.1799762564305506e-05,
2473
+ 1.1502967946181245e-05,
2474
+ 1.1206173328056984e-05,
2475
+ 1.0909378709932724e-05,
2476
+ 1.0612584091808472e-05,
2477
+ 1.0315789473684213e-05,
2478
+ 1.0018994855559949e-05,
2479
+ 9.7222002374357e-06,
2480
+ 9.425405619311438e-06,
2481
+ 9.128611001187177e-06,
2482
+ 8.831816383062916e-06,
2483
+ 8.535021764938666e-06,
2484
+ 8.238227146814405e-06,
2485
+ 7.941432528690143e-06,
2486
+ 7.644637910565893e-06,
2487
+ 7.347843292441632e-06,
2488
+ 7.0510486743173715e-06,
2489
+ 6.75425405619311e-06,
2490
+ 6.45745943806886e-06,
2491
+ 6.160664819944598e-06,
2492
+ 5.8638702018203375e-06,
2493
+ 5.567075583696086e-06,
2494
+ 5.270280965571826e-06,
2495
+ 4.973486347447565e-06,
2496
+ 4.676691729323314e-06,
2497
+ 4.379897111199053e-06,
2498
+ 4.083102493074792e-06
2499
+ ],
2500
+ "emb_lr": [],
2501
+ "eval_step": [
2502
+ 1550,
2503
+ 3113,
2504
+ 4676,
2505
+ 6239,
2506
+ 7802,
2507
+ 9365,
2508
+ 10928,
2509
+ 12491,
2510
+ 14054,
2511
+ 15617
2512
+ ],
2513
+ "eval_accuracy": [
2514
+ 0.6,
2515
+ 1.0,
2516
+ 1.0,
2517
+ 0.99,
2518
+ 1.0,
2519
+ 1.0,
2520
+ 1.0,
2521
+ 1.0,
2522
+ 1.0,
2523
+ 1.0
2524
+ ]
2525
+ },
2526
+ "final_accuracy": 1.0,
2527
+ "sft_eval": {
2528
+ "config": {
2529
+ "ops": "add_sub",
2530
+ "K": null,
2531
+ "mode": "sft",
2532
+ "n_digits": 6,
2533
+ "n_per_split": 100
2534
+ },
2535
+ "splits": {
2536
+ "add_S0": {
2537
+ "full_accuracy": 1.0,
2538
+ "n_examples": 100,
2539
+ "per_subtask": {
2540
+ "SA": {
2541
+ "accuracy": 1.0,
2542
+ "count": 605
2543
+ },
2544
+ "SS": {
2545
+ "accuracy": 1.0,
2546
+ "count": 95
2547
+ }
2548
+ }
2549
+ },
2550
+ "add_S1": {
2551
+ "full_accuracy": 1.0,
2552
+ "n_examples": 100,
2553
+ "per_subtask": {
2554
+ "SA": {
2555
+ "accuracy": 1.0,
2556
+ "count": 204
2557
+ },
2558
+ "SC": {
2559
+ "accuracy": 1.0,
2560
+ "count": 169
2561
+ },
2562
+ "SS": {
2563
+ "accuracy": 1.0,
2564
+ "count": 31
2565
+ },
2566
+ "UC": {
2567
+ "accuracy": 1.0,
2568
+ "count": 296
2569
+ }
2570
+ }
2571
+ },
2572
+ "add_S2": {
2573
+ "full_accuracy": 0.99,
2574
+ "n_examples": 100,
2575
+ "per_subtask": {
2576
+ "SA": {
2577
+ "accuracy": 1.0,
2578
+ "count": 163
2579
+ },
2580
+ "SC": {
2581
+ "accuracy": 1.0,
2582
+ "count": 130
2583
+ },
2584
+ "SS": {
2585
+ "accuracy": 1.0,
2586
+ "count": 87
2587
+ },
2588
+ "UC": {
2589
+ "accuracy": 0.9950738916256158,
2590
+ "count": 203
2591
+ },
2592
+ "US": {
2593
+ "accuracy": 0.9914529914529915,
2594
+ "count": 117
2595
+ }
2596
+ }
2597
+ },
2598
+ "add_S3": {
2599
+ "full_accuracy": 0.95,
2600
+ "n_examples": 100,
2601
+ "per_subtask": {
2602
+ "SA": {
2603
+ "accuracy": 0.9917355371900827,
2604
+ "count": 121
2605
+ },
2606
+ "SC": {
2607
+ "accuracy": 1.0,
2608
+ "count": 121
2609
+ },
2610
+ "SS": {
2611
+ "accuracy": 1.0,
2612
+ "count": 49
2613
+ },
2614
+ "UC": {
2615
+ "accuracy": 0.978494623655914,
2616
+ "count": 186
2617
+ },
2618
+ "US": {
2619
+ "accuracy": 1.0,
2620
+ "count": 223
2621
+ }
2622
+ }
2623
+ },
2624
+ "add_S4": {
2625
+ "full_accuracy": 0.87,
2626
+ "n_examples": 100,
2627
+ "per_subtask": {
2628
+ "SA": {
2629
+ "accuracy": 1.0,
2630
+ "count": 104
2631
+ },
2632
+ "SC": {
2633
+ "accuracy": 1.0,
2634
+ "count": 106
2635
+ },
2636
+ "SS": {
2637
+ "accuracy": 1.0,
2638
+ "count": 23
2639
+ },
2640
+ "UC": {
2641
+ "accuracy": 0.91875,
2642
+ "count": 160
2643
+ },
2644
+ "US": {
2645
+ "accuracy": 0.996742671009772,
2646
+ "count": 307
2647
+ }
2648
+ }
2649
+ },
2650
+ "add_S5": {
2651
+ "full_accuracy": 0.61,
2652
+ "n_examples": 100,
2653
+ "per_subtask": {
2654
+ "SA": {
2655
+ "accuracy": 1.0,
2656
+ "count": 100
2657
+ },
2658
+ "SC": {
2659
+ "accuracy": 1.0,
2660
+ "count": 100
2661
+ },
2662
+ "UC": {
2663
+ "accuracy": 0.64,
2664
+ "count": 100
2665
+ },
2666
+ "US": {
2667
+ "accuracy": 0.93,
2668
+ "count": 400
2669
+ }
2670
+ }
2671
+ },
2672
+ "add_S6": {
2673
+ "full_accuracy": 0.6,
2674
+ "n_examples": 100,
2675
+ "per_subtask": {
2676
+ "SC": {
2677
+ "accuracy": 1.0,
2678
+ "count": 100
2679
+ },
2680
+ "UC": {
2681
+ "accuracy": 0.6,
2682
+ "count": 100
2683
+ },
2684
+ "US": {
2685
+ "accuracy": 0.878,
2686
+ "count": 500
2687
+ }
2688
+ }
2689
+ },
2690
+ "add_random": {
2691
+ "full_accuracy": 0.99,
2692
+ "n_examples": 200,
2693
+ "per_subtask": {
2694
+ "SA": {
2695
+ "accuracy": 0.9977628635346756,
2696
+ "count": 447
2697
+ },
2698
+ "SC": {
2699
+ "accuracy": 0.996875,
2700
+ "count": 320
2701
+ },
2702
+ "SS": {
2703
+ "accuracy": 1.0,
2704
+ "count": 56
2705
+ },
2706
+ "UC": {
2707
+ "accuracy": 1.0,
2708
+ "count": 529
2709
+ },
2710
+ "US": {
2711
+ "accuracy": 1.0,
2712
+ "count": 48
2713
+ }
2714
+ }
2715
+ },
2716
+ "add_C3": {
2717
+ "full_accuracy": 0.98,
2718
+ "n_examples": 100,
2719
+ "per_subtask": {
2720
+ "SA": {
2721
+ "accuracy": 1.0,
2722
+ "count": 300
2723
+ },
2724
+ "SC": {
2725
+ "accuracy": 1.0,
2726
+ "count": 100
2727
+ },
2728
+ "UC": {
2729
+ "accuracy": 0.9896373056994818,
2730
+ "count": 193
2731
+ },
2732
+ "US": {
2733
+ "accuracy": 0.9906542056074766,
2734
+ "count": 107
2735
+ }
2736
+ }
2737
+ },
2738
+ "add_C4": {
2739
+ "full_accuracy": 0.99,
2740
+ "n_examples": 100,
2741
+ "per_subtask": {
2742
+ "SA": {
2743
+ "accuracy": 1.0,
2744
+ "count": 200
2745
+ },
2746
+ "SC": {
2747
+ "accuracy": 1.0,
2748
+ "count": 100
2749
+ },
2750
+ "UC": {
2751
+ "accuracy": 0.99609375,
2752
+ "count": 256
2753
+ },
2754
+ "US": {
2755
+ "accuracy": 1.0,
2756
+ "count": 144
2757
+ }
2758
+ }
2759
+ },
2760
+ "add_C5": {
2761
+ "full_accuracy": 0.91,
2762
+ "n_examples": 100,
2763
+ "per_subtask": {
2764
+ "SA": {
2765
+ "accuracy": 1.0,
2766
+ "count": 100
2767
+ },
2768
+ "SC": {
2769
+ "accuracy": 1.0,
2770
+ "count": 100
2771
+ },
2772
+ "UC": {
2773
+ "accuracy": 0.9705882352941176,
2774
+ "count": 306
2775
+ },
2776
+ "US": {
2777
+ "accuracy": 0.979381443298969,
2778
+ "count": 194
2779
+ }
2780
+ }
2781
+ },
2782
+ "add_C6": {
2783
+ "full_accuracy": 0.99,
2784
+ "n_examples": 100,
2785
+ "per_subtask": {
2786
+ "SC": {
2787
+ "accuracy": 1.0,
2788
+ "count": 100
2789
+ },
2790
+ "UC": {
2791
+ "accuracy": 0.9972677595628415,
2792
+ "count": 366
2793
+ },
2794
+ "US": {
2795
+ "accuracy": 1.0,
2796
+ "count": 234
2797
+ }
2798
+ }
2799
+ },
2800
+ "sub_M0": {
2801
+ "full_accuracy": 0.98,
2802
+ "n_examples": 100,
2803
+ "per_subtask": {
2804
+ "MD": {
2805
+ "accuracy": 0.9966722129783694,
2806
+ "count": 601
2807
+ },
2808
+ "ME": {
2809
+ "accuracy": 1.0,
2810
+ "count": 99
2811
+ }
2812
+ }
2813
+ },
2814
+ "sub_M1": {
2815
+ "full_accuracy": 0.99,
2816
+ "n_examples": 100,
2817
+ "per_subtask": {
2818
+ "MD": {
2819
+ "accuracy": 1.0,
2820
+ "count": 279
2821
+ },
2822
+ "MB": {
2823
+ "accuracy": 1.0,
2824
+ "count": 145
2825
+ },
2826
+ "ME": {
2827
+ "accuracy": 1.0,
2828
+ "count": 24
2829
+ },
2830
+ "UB": {
2831
+ "accuracy": 0.996031746031746,
2832
+ "count": 252
2833
+ }
2834
+ }
2835
+ },
2836
+ "sub_M2": {
2837
+ "full_accuracy": 1.0,
2838
+ "n_examples": 100,
2839
+ "per_subtask": {
2840
+ "MD": {
2841
+ "accuracy": 1.0,
2842
+ "count": 213
2843
+ },
2844
+ "MB": {
2845
+ "accuracy": 1.0,
2846
+ "count": 113
2847
+ },
2848
+ "ME": {
2849
+ "accuracy": 1.0,
2850
+ "count": 85
2851
+ },
2852
+ "UB": {
2853
+ "accuracy": 1.0,
2854
+ "count": 181
2855
+ },
2856
+ "UD": {
2857
+ "accuracy": 1.0,
2858
+ "count": 108
2859
+ }
2860
+ }
2861
+ },
2862
+ "sub_M3": {
2863
+ "full_accuracy": 0.96,
2864
+ "n_examples": 100,
2865
+ "per_subtask": {
2866
+ "MD": {
2867
+ "accuracy": 1.0,
2868
+ "count": 179
2869
+ },
2870
+ "MB": {
2871
+ "accuracy": 1.0,
2872
+ "count": 103
2873
+ },
2874
+ "ME": {
2875
+ "accuracy": 1.0,
2876
+ "count": 56
2877
+ },
2878
+ "UB": {
2879
+ "accuracy": 0.9731543624161074,
2880
+ "count": 149
2881
+ },
2882
+ "UD": {
2883
+ "accuracy": 1.0,
2884
+ "count": 213
2885
+ }
2886
+ }
2887
+ },
2888
+ "sub_M4": {
2889
+ "full_accuracy": 0.65,
2890
+ "n_examples": 100,
2891
+ "per_subtask": {
2892
+ "MD": {
2893
+ "accuracy": 1.0,
2894
+ "count": 200
2895
+ },
2896
+ "MB": {
2897
+ "accuracy": 1.0,
2898
+ "count": 100
2899
+ },
2900
+ "UB": {
2901
+ "accuracy": 0.67,
2902
+ "count": 100
2903
+ },
2904
+ "UD": {
2905
+ "accuracy": 0.95,
2906
+ "count": 300
2907
+ }
2908
+ }
2909
+ },
2910
+ "sub_M5": {
2911
+ "full_accuracy": 0.48,
2912
+ "n_examples": 100,
2913
+ "per_subtask": {
2914
+ "MD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 100
2917
+ },
2918
+ "MB": {
2919
+ "accuracy": 1.0,
2920
+ "count": 100
2921
+ },
2922
+ "UB": {
2923
+ "accuracy": 0.75,
2924
+ "count": 100
2925
+ },
2926
+ "UD": {
2927
+ "accuracy": 0.8725,
2928
+ "count": 400
2929
+ }
2930
+ }
2931
+ },
2932
+ "sub_random": {
2933
+ "full_accuracy": 0.995,
2934
+ "n_examples": 200,
2935
+ "per_subtask": {
2936
+ "MD": {
2937
+ "accuracy": 1.0,
2938
+ "count": 600
2939
+ },
2940
+ "MB": {
2941
+ "accuracy": 0.9962546816479401,
2942
+ "count": 267
2943
+ },
2944
+ "ME": {
2945
+ "accuracy": 1.0,
2946
+ "count": 53
2947
+ },
2948
+ "UB": {
2949
+ "accuracy": 1.0,
2950
+ "count": 439
2951
+ },
2952
+ "UD": {
2953
+ "accuracy": 1.0,
2954
+ "count": 41
2955
+ }
2956
+ }
2957
+ },
2958
+ "sub_B3": {
2959
+ "full_accuracy": 0.86,
2960
+ "n_examples": 100,
2961
+ "per_subtask": {
2962
+ "MD": {
2963
+ "accuracy": 0.9966666666666667,
2964
+ "count": 300
2965
+ },
2966
+ "MB": {
2967
+ "accuracy": 1.0,
2968
+ "count": 100
2969
+ },
2970
+ "UB": {
2971
+ "accuracy": 0.9543147208121827,
2972
+ "count": 197
2973
+ },
2974
+ "UD": {
2975
+ "accuracy": 0.9514563106796117,
2976
+ "count": 103
2977
+ }
2978
+ }
2979
+ },
2980
+ "sub_B4": {
2981
+ "full_accuracy": 0.92,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "MD": {
2985
+ "accuracy": 1.0,
2986
+ "count": 200
2987
+ },
2988
+ "MB": {
2989
+ "accuracy": 1.0,
2990
+ "count": 100
2991
+ },
2992
+ "UB": {
2993
+ "accuracy": 0.9676113360323887,
2994
+ "count": 247
2995
+ },
2996
+ "UD": {
2997
+ "accuracy": 0.9803921568627451,
2998
+ "count": 153
2999
+ }
3000
+ }
3001
+ },
3002
+ "sub_B5": {
3003
+ "full_accuracy": 0.98,
3004
+ "n_examples": 100,
3005
+ "per_subtask": {
3006
+ "MD": {
3007
+ "accuracy": 1.0,
3008
+ "count": 100
3009
+ },
3010
+ "MB": {
3011
+ "accuracy": 1.0,
3012
+ "count": 100
3013
+ },
3014
+ "UB": {
3015
+ "accuracy": 0.9966442953020134,
3016
+ "count": 298
3017
+ },
3018
+ "UD": {
3019
+ "accuracy": 0.995049504950495,
3020
+ "count": 202
3021
+ }
3022
+ }
3023
+ }
3024
+ },
3025
+ "summary": {
3026
+ "overall_accuracy": 0.9033333333333333,
3027
+ "total_examples": 2400,
3028
+ "n_splits": 22
3029
+ }
3030
+ },
3031
+ "sorl_eval": {
3032
+ "config": {
3033
+ "ops": "add_sub",
3034
+ "K": 4,
3035
+ "mode": "sorl",
3036
+ "n_digits": 6,
3037
+ "n_per_split": 100
3038
+ },
3039
+ "splits": {
3040
+ "add_S0": {
3041
+ "full_accuracy": 1.0,
3042
+ "n_examples": 100,
3043
+ "per_subtask": {
3044
+ "SA": {
3045
+ "accuracy": 1.0,
3046
+ "count": 605
3047
+ },
3048
+ "SS": {
3049
+ "accuracy": 1.0,
3050
+ "count": 95
3051
+ }
3052
+ }
3053
+ },
3054
+ "add_S1": {
3055
+ "full_accuracy": 1.0,
3056
+ "n_examples": 100,
3057
+ "per_subtask": {
3058
+ "SA": {
3059
+ "accuracy": 1.0,
3060
+ "count": 204
3061
+ },
3062
+ "SC": {
3063
+ "accuracy": 1.0,
3064
+ "count": 169
3065
+ },
3066
+ "SS": {
3067
+ "accuracy": 1.0,
3068
+ "count": 31
3069
+ },
3070
+ "UC": {
3071
+ "accuracy": 1.0,
3072
+ "count": 296
3073
+ }
3074
+ }
3075
+ },
3076
+ "add_S2": {
3077
+ "full_accuracy": 1.0,
3078
+ "n_examples": 100,
3079
+ "per_subtask": {
3080
+ "SA": {
3081
+ "accuracy": 1.0,
3082
+ "count": 163
3083
+ },
3084
+ "SC": {
3085
+ "accuracy": 1.0,
3086
+ "count": 130
3087
+ },
3088
+ "SS": {
3089
+ "accuracy": 1.0,
3090
+ "count": 87
3091
+ },
3092
+ "UC": {
3093
+ "accuracy": 1.0,
3094
+ "count": 203
3095
+ },
3096
+ "US": {
3097
+ "accuracy": 1.0,
3098
+ "count": 117
3099
+ }
3100
+ }
3101
+ },
3102
+ "add_S3": {
3103
+ "full_accuracy": 1.0,
3104
+ "n_examples": 100,
3105
+ "per_subtask": {
3106
+ "SA": {
3107
+ "accuracy": 1.0,
3108
+ "count": 121
3109
+ },
3110
+ "SC": {
3111
+ "accuracy": 1.0,
3112
+ "count": 121
3113
+ },
3114
+ "SS": {
3115
+ "accuracy": 1.0,
3116
+ "count": 49
3117
+ },
3118
+ "UC": {
3119
+ "accuracy": 1.0,
3120
+ "count": 186
3121
+ },
3122
+ "US": {
3123
+ "accuracy": 1.0,
3124
+ "count": 223
3125
+ }
3126
+ }
3127
+ },
3128
+ "add_S4": {
3129
+ "full_accuracy": 1.0,
3130
+ "n_examples": 100,
3131
+ "per_subtask": {
3132
+ "SA": {
3133
+ "accuracy": 1.0,
3134
+ "count": 104
3135
+ },
3136
+ "SC": {
3137
+ "accuracy": 1.0,
3138
+ "count": 106
3139
+ },
3140
+ "SS": {
3141
+ "accuracy": 1.0,
3142
+ "count": 23
3143
+ },
3144
+ "UC": {
3145
+ "accuracy": 1.0,
3146
+ "count": 160
3147
+ },
3148
+ "US": {
3149
+ "accuracy": 1.0,
3150
+ "count": 307
3151
+ }
3152
+ }
3153
+ },
3154
+ "add_S5": {
3155
+ "full_accuracy": 1.0,
3156
+ "n_examples": 100,
3157
+ "per_subtask": {
3158
+ "SA": {
3159
+ "accuracy": 1.0,
3160
+ "count": 100
3161
+ },
3162
+ "SC": {
3163
+ "accuracy": 1.0,
3164
+ "count": 100
3165
+ },
3166
+ "UC": {
3167
+ "accuracy": 1.0,
3168
+ "count": 100
3169
+ },
3170
+ "US": {
3171
+ "accuracy": 1.0,
3172
+ "count": 400
3173
+ }
3174
+ }
3175
+ },
3176
+ "add_S6": {
3177
+ "full_accuracy": 1.0,
3178
+ "n_examples": 100,
3179
+ "per_subtask": {
3180
+ "SC": {
3181
+ "accuracy": 1.0,
3182
+ "count": 100
3183
+ },
3184
+ "UC": {
3185
+ "accuracy": 1.0,
3186
+ "count": 100
3187
+ },
3188
+ "US": {
3189
+ "accuracy": 1.0,
3190
+ "count": 500
3191
+ }
3192
+ }
3193
+ },
3194
+ "add_random": {
3195
+ "full_accuracy": 1.0,
3196
+ "n_examples": 200,
3197
+ "per_subtask": {
3198
+ "SA": {
3199
+ "accuracy": 1.0,
3200
+ "count": 447
3201
+ },
3202
+ "SC": {
3203
+ "accuracy": 1.0,
3204
+ "count": 320
3205
+ },
3206
+ "SS": {
3207
+ "accuracy": 1.0,
3208
+ "count": 56
3209
+ },
3210
+ "UC": {
3211
+ "accuracy": 1.0,
3212
+ "count": 529
3213
+ },
3214
+ "US": {
3215
+ "accuracy": 1.0,
3216
+ "count": 48
3217
+ }
3218
+ }
3219
+ },
3220
+ "add_C3": {
3221
+ "full_accuracy": 1.0,
3222
+ "n_examples": 100,
3223
+ "per_subtask": {
3224
+ "SA": {
3225
+ "accuracy": 1.0,
3226
+ "count": 300
3227
+ },
3228
+ "SC": {
3229
+ "accuracy": 1.0,
3230
+ "count": 100
3231
+ },
3232
+ "UC": {
3233
+ "accuracy": 1.0,
3234
+ "count": 193
3235
+ },
3236
+ "US": {
3237
+ "accuracy": 1.0,
3238
+ "count": 107
3239
+ }
3240
+ }
3241
+ },
3242
+ "add_C4": {
3243
+ "full_accuracy": 1.0,
3244
+ "n_examples": 100,
3245
+ "per_subtask": {
3246
+ "SA": {
3247
+ "accuracy": 1.0,
3248
+ "count": 200
3249
+ },
3250
+ "SC": {
3251
+ "accuracy": 1.0,
3252
+ "count": 100
3253
+ },
3254
+ "UC": {
3255
+ "accuracy": 1.0,
3256
+ "count": 256
3257
+ },
3258
+ "US": {
3259
+ "accuracy": 1.0,
3260
+ "count": 144
3261
+ }
3262
+ }
3263
+ },
3264
+ "add_C5": {
3265
+ "full_accuracy": 1.0,
3266
+ "n_examples": 100,
3267
+ "per_subtask": {
3268
+ "SA": {
3269
+ "accuracy": 1.0,
3270
+ "count": 100
3271
+ },
3272
+ "SC": {
3273
+ "accuracy": 1.0,
3274
+ "count": 100
3275
+ },
3276
+ "UC": {
3277
+ "accuracy": 1.0,
3278
+ "count": 306
3279
+ },
3280
+ "US": {
3281
+ "accuracy": 1.0,
3282
+ "count": 194
3283
+ }
3284
+ }
3285
+ },
3286
+ "add_C6": {
3287
+ "full_accuracy": 1.0,
3288
+ "n_examples": 100,
3289
+ "per_subtask": {
3290
+ "SC": {
3291
+ "accuracy": 1.0,
3292
+ "count": 100
3293
+ },
3294
+ "UC": {
3295
+ "accuracy": 1.0,
3296
+ "count": 366
3297
+ },
3298
+ "US": {
3299
+ "accuracy": 1.0,
3300
+ "count": 234
3301
+ }
3302
+ }
3303
+ },
3304
+ "sub_M0": {
3305
+ "full_accuracy": 1.0,
3306
+ "n_examples": 100,
3307
+ "per_subtask": {
3308
+ "MD": {
3309
+ "accuracy": 1.0,
3310
+ "count": 601
3311
+ },
3312
+ "ME": {
3313
+ "accuracy": 1.0,
3314
+ "count": 99
3315
+ }
3316
+ }
3317
+ },
3318
+ "sub_M1": {
3319
+ "full_accuracy": 1.0,
3320
+ "n_examples": 100,
3321
+ "per_subtask": {
3322
+ "MD": {
3323
+ "accuracy": 1.0,
3324
+ "count": 279
3325
+ },
3326
+ "MB": {
3327
+ "accuracy": 1.0,
3328
+ "count": 145
3329
+ },
3330
+ "ME": {
3331
+ "accuracy": 1.0,
3332
+ "count": 24
3333
+ },
3334
+ "UB": {
3335
+ "accuracy": 1.0,
3336
+ "count": 252
3337
+ }
3338
+ }
3339
+ },
3340
+ "sub_M2": {
3341
+ "full_accuracy": 1.0,
3342
+ "n_examples": 100,
3343
+ "per_subtask": {
3344
+ "MD": {
3345
+ "accuracy": 1.0,
3346
+ "count": 213
3347
+ },
3348
+ "MB": {
3349
+ "accuracy": 1.0,
3350
+ "count": 113
3351
+ },
3352
+ "ME": {
3353
+ "accuracy": 1.0,
3354
+ "count": 85
3355
+ },
3356
+ "UB": {
3357
+ "accuracy": 1.0,
3358
+ "count": 181
3359
+ },
3360
+ "UD": {
3361
+ "accuracy": 1.0,
3362
+ "count": 108
3363
+ }
3364
+ }
3365
+ },
3366
+ "sub_M3": {
3367
+ "full_accuracy": 1.0,
3368
+ "n_examples": 100,
3369
+ "per_subtask": {
3370
+ "MD": {
3371
+ "accuracy": 1.0,
3372
+ "count": 179
3373
+ },
3374
+ "MB": {
3375
+ "accuracy": 1.0,
3376
+ "count": 103
3377
+ },
3378
+ "ME": {
3379
+ "accuracy": 1.0,
3380
+ "count": 56
3381
+ },
3382
+ "UB": {
3383
+ "accuracy": 1.0,
3384
+ "count": 149
3385
+ },
3386
+ "UD": {
3387
+ "accuracy": 1.0,
3388
+ "count": 213
3389
+ }
3390
+ }
3391
+ },
3392
+ "sub_M4": {
3393
+ "full_accuracy": 1.0,
3394
+ "n_examples": 100,
3395
+ "per_subtask": {
3396
+ "MD": {
3397
+ "accuracy": 1.0,
3398
+ "count": 200
3399
+ },
3400
+ "MB": {
3401
+ "accuracy": 1.0,
3402
+ "count": 100
3403
+ },
3404
+ "UB": {
3405
+ "accuracy": 1.0,
3406
+ "count": 100
3407
+ },
3408
+ "UD": {
3409
+ "accuracy": 1.0,
3410
+ "count": 300
3411
+ }
3412
+ }
3413
+ },
3414
+ "sub_M5": {
3415
+ "full_accuracy": 1.0,
3416
+ "n_examples": 100,
3417
+ "per_subtask": {
3418
+ "MD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 100
3421
+ },
3422
+ "MB": {
3423
+ "accuracy": 1.0,
3424
+ "count": 100
3425
+ },
3426
+ "UB": {
3427
+ "accuracy": 1.0,
3428
+ "count": 100
3429
+ },
3430
+ "UD": {
3431
+ "accuracy": 1.0,
3432
+ "count": 400
3433
+ }
3434
+ }
3435
+ },
3436
+ "sub_random": {
3437
+ "full_accuracy": 1.0,
3438
+ "n_examples": 200,
3439
+ "per_subtask": {
3440
+ "MD": {
3441
+ "accuracy": 1.0,
3442
+ "count": 600
3443
+ },
3444
+ "MB": {
3445
+ "accuracy": 1.0,
3446
+ "count": 267
3447
+ },
3448
+ "ME": {
3449
+ "accuracy": 1.0,
3450
+ "count": 53
3451
+ },
3452
+ "UB": {
3453
+ "accuracy": 1.0,
3454
+ "count": 439
3455
+ },
3456
+ "UD": {
3457
+ "accuracy": 1.0,
3458
+ "count": 41
3459
+ }
3460
+ }
3461
+ },
3462
+ "sub_B3": {
3463
+ "full_accuracy": 1.0,
3464
+ "n_examples": 100,
3465
+ "per_subtask": {
3466
+ "MD": {
3467
+ "accuracy": 1.0,
3468
+ "count": 300
3469
+ },
3470
+ "MB": {
3471
+ "accuracy": 1.0,
3472
+ "count": 100
3473
+ },
3474
+ "UB": {
3475
+ "accuracy": 1.0,
3476
+ "count": 197
3477
+ },
3478
+ "UD": {
3479
+ "accuracy": 1.0,
3480
+ "count": 103
3481
+ }
3482
+ }
3483
+ },
3484
+ "sub_B4": {
3485
+ "full_accuracy": 1.0,
3486
+ "n_examples": 100,
3487
+ "per_subtask": {
3488
+ "MD": {
3489
+ "accuracy": 1.0,
3490
+ "count": 200
3491
+ },
3492
+ "MB": {
3493
+ "accuracy": 1.0,
3494
+ "count": 100
3495
+ },
3496
+ "UB": {
3497
+ "accuracy": 1.0,
3498
+ "count": 247
3499
+ },
3500
+ "UD": {
3501
+ "accuracy": 1.0,
3502
+ "count": 153
3503
+ }
3504
+ }
3505
+ },
3506
+ "sub_B5": {
3507
+ "full_accuracy": 1.0,
3508
+ "n_examples": 100,
3509
+ "per_subtask": {
3510
+ "MD": {
3511
+ "accuracy": 1.0,
3512
+ "count": 100
3513
+ },
3514
+ "MB": {
3515
+ "accuracy": 1.0,
3516
+ "count": 100
3517
+ },
3518
+ "UB": {
3519
+ "accuracy": 1.0,
3520
+ "count": 298
3521
+ },
3522
+ "UD": {
3523
+ "accuracy": 1.0,
3524
+ "count": 202
3525
+ }
3526
+ }
3527
+ }
3528
+ },
3529
+ "summary": {
3530
+ "overall_accuracy": 1.0,
3531
+ "total_examples": 2400,
3532
+ "n_splits": 22
3533
+ }
3534
+ },
3535
+ "sorl_overall_accuracy": 1.0,
3536
+ "sft_overall_accuracy": 0.9033333333333333
3537
+ }
add_sub_sorl_v1_abs10_100K/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:7efc43879466cf8cb61bccdd2456daca0af63923b61b39df6ff053d15d3d7d91
3
+ size 650303660
add_sub_sorl_v1_abs10_100K/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 4,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 4e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 10,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 1562,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs10_K4_100K",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 2,
61
+ "n_head": 3,
62
+ "n_embd": 510,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 10,
65
+ "dataset_size": 100000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 162499262,
71
+ "run_name": "add_sub_sorl_v1_abs10_100K",
72
+ "git_commit": "f447da529caceac8c7d256cbb2cd185cbc50feac",
73
+ "timestamp": "2026-04-12T13:33:48.858792+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "ym82ypoo",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/ym82ypoo",
81
+ "final_accuracy": 1.0,
82
+ "sft_accuracy": 0.9033333333333333,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }