amirali1985 commited on
Commit
a2c9d65
·
verified ·
1 Parent(s): faac3ac

Upload add_sub_sorl_v1_abs20_K1_100K

Browse files
add_sub_sorl_v1_abs20_K1_100K/config.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 510,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 2040,
15
+ "layer_types": [
16
+ "full_attention",
17
+ "full_attention"
18
+ ],
19
+ "max_position_embeddings": 128,
20
+ "max_window_layers": 28,
21
+ "model_type": "qwen3",
22
+ "num_attention_heads": 3,
23
+ "num_hidden_layers": 2,
24
+ "num_key_value_heads": 3,
25
+ "pad_token_id": null,
26
+ "rms_norm_eps": 1e-06,
27
+ "rope_parameters": {
28
+ "rope_theta": 10000.0,
29
+ "rope_type": "default"
30
+ },
31
+ "sliding_window": null,
32
+ "tie_word_embeddings": false,
33
+ "transformers_version": "5.5.0",
34
+ "use_cache": true,
35
+ "use_sliding_window": false,
36
+ "vocab_size": 151664
37
+ }
add_sub_sorl_v1_abs20_K1_100K/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs20_K1_100K/metrics.json ADDED
@@ -0,0 +1,3537 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 800,
20
+ 850,
21
+ 900,
22
+ 950,
23
+ 1000,
24
+ 1050,
25
+ 1100,
26
+ 1150,
27
+ 1200,
28
+ 1250,
29
+ 1300,
30
+ 1350,
31
+ 1400,
32
+ 1450,
33
+ 1500,
34
+ 1550,
35
+ 1613,
36
+ 1663,
37
+ 1713,
38
+ 1763,
39
+ 1813,
40
+ 1863,
41
+ 1913,
42
+ 1963,
43
+ 2013,
44
+ 2063,
45
+ 2113,
46
+ 2163,
47
+ 2213,
48
+ 2263,
49
+ 2313,
50
+ 2363,
51
+ 2413,
52
+ 2463,
53
+ 2513,
54
+ 2563,
55
+ 2613,
56
+ 2663,
57
+ 2713,
58
+ 2763,
59
+ 2813,
60
+ 2863,
61
+ 2913,
62
+ 2963,
63
+ 3013,
64
+ 3063,
65
+ 3113,
66
+ 3176,
67
+ 3226,
68
+ 3276,
69
+ 3326,
70
+ 3376,
71
+ 3426,
72
+ 3476,
73
+ 3526,
74
+ 3576,
75
+ 3626,
76
+ 3676,
77
+ 3726,
78
+ 3776,
79
+ 3826,
80
+ 3876,
81
+ 3926,
82
+ 3976,
83
+ 4026,
84
+ 4076,
85
+ 4126,
86
+ 4176,
87
+ 4226,
88
+ 4276,
89
+ 4326,
90
+ 4376,
91
+ 4426,
92
+ 4476,
93
+ 4526,
94
+ 4576,
95
+ 4626,
96
+ 4676,
97
+ 4739,
98
+ 4789,
99
+ 4839,
100
+ 4889,
101
+ 4939,
102
+ 4989,
103
+ 5039,
104
+ 5089,
105
+ 5139,
106
+ 5189,
107
+ 5239,
108
+ 5289,
109
+ 5339,
110
+ 5389,
111
+ 5439,
112
+ 5489,
113
+ 5539,
114
+ 5589,
115
+ 5639,
116
+ 5689,
117
+ 5739,
118
+ 5789,
119
+ 5839,
120
+ 5889,
121
+ 5939,
122
+ 5989,
123
+ 6039,
124
+ 6089,
125
+ 6139,
126
+ 6189,
127
+ 6239,
128
+ 6302,
129
+ 6352,
130
+ 6402,
131
+ 6452,
132
+ 6502,
133
+ 6552,
134
+ 6602,
135
+ 6652,
136
+ 6702,
137
+ 6752,
138
+ 6802,
139
+ 6852,
140
+ 6902,
141
+ 6952,
142
+ 7002,
143
+ 7052,
144
+ 7102,
145
+ 7152,
146
+ 7202,
147
+ 7252,
148
+ 7302,
149
+ 7352,
150
+ 7402,
151
+ 7452,
152
+ 7502,
153
+ 7552,
154
+ 7602,
155
+ 7652,
156
+ 7702,
157
+ 7752,
158
+ 7802,
159
+ 7865,
160
+ 7915,
161
+ 7965,
162
+ 8015,
163
+ 8065,
164
+ 8115,
165
+ 8165,
166
+ 8215,
167
+ 8265,
168
+ 8315,
169
+ 8365,
170
+ 8415,
171
+ 8465,
172
+ 8515,
173
+ 8565,
174
+ 8615,
175
+ 8665,
176
+ 8715,
177
+ 8765,
178
+ 8815,
179
+ 8865,
180
+ 8915,
181
+ 8965,
182
+ 9015,
183
+ 9065,
184
+ 9115,
185
+ 9165,
186
+ 9215,
187
+ 9265,
188
+ 9315,
189
+ 9365,
190
+ 9428,
191
+ 9478,
192
+ 9528,
193
+ 9578,
194
+ 9628,
195
+ 9678,
196
+ 9728,
197
+ 9778,
198
+ 9828,
199
+ 9878,
200
+ 9928,
201
+ 9978,
202
+ 10028,
203
+ 10078,
204
+ 10128,
205
+ 10178,
206
+ 10228,
207
+ 10278,
208
+ 10328,
209
+ 10378,
210
+ 10428,
211
+ 10478,
212
+ 10528,
213
+ 10578,
214
+ 10628,
215
+ 10678,
216
+ 10728,
217
+ 10778,
218
+ 10828,
219
+ 10878,
220
+ 10928,
221
+ 10991,
222
+ 11041,
223
+ 11091,
224
+ 11141,
225
+ 11191,
226
+ 11241,
227
+ 11291,
228
+ 11341,
229
+ 11391,
230
+ 11441,
231
+ 11491,
232
+ 11541,
233
+ 11591,
234
+ 11641,
235
+ 11691,
236
+ 11741,
237
+ 11791,
238
+ 11841,
239
+ 11891,
240
+ 11941,
241
+ 11991,
242
+ 12041,
243
+ 12091,
244
+ 12141,
245
+ 12191,
246
+ 12241,
247
+ 12291,
248
+ 12341,
249
+ 12391,
250
+ 12441,
251
+ 12491,
252
+ 12554,
253
+ 12604,
254
+ 12654,
255
+ 12704,
256
+ 12754,
257
+ 12804,
258
+ 12854,
259
+ 12904,
260
+ 12954,
261
+ 13004,
262
+ 13054,
263
+ 13104,
264
+ 13154,
265
+ 13204,
266
+ 13254,
267
+ 13304,
268
+ 13354,
269
+ 13404,
270
+ 13454,
271
+ 13504,
272
+ 13554,
273
+ 13604,
274
+ 13654,
275
+ 13704,
276
+ 13754,
277
+ 13804,
278
+ 13854,
279
+ 13904,
280
+ 13954,
281
+ 14004,
282
+ 14054,
283
+ 14117,
284
+ 14167,
285
+ 14217,
286
+ 14267,
287
+ 14317,
288
+ 14367,
289
+ 14417,
290
+ 14467,
291
+ 14517,
292
+ 14567,
293
+ 14617,
294
+ 14667,
295
+ 14717,
296
+ 14767,
297
+ 14817,
298
+ 14867,
299
+ 14917,
300
+ 14967,
301
+ 15017,
302
+ 15067,
303
+ 15117,
304
+ 15167,
305
+ 15217,
306
+ 15267,
307
+ 15317,
308
+ 15367,
309
+ 15417,
310
+ 15467,
311
+ 15517,
312
+ 15567,
313
+ 15617
314
+ ],
315
+ "loss": [
316
+ 0.7572331428527832,
317
+ -4.1088128089904785,
318
+ 4.92240047454834,
319
+ 6.863762378692627,
320
+ 4.62153434753418,
321
+ 3.7265849113464355,
322
+ 2.634976387023926,
323
+ 2.671053409576416,
324
+ 2.7696900367736816,
325
+ 2.258213520050049,
326
+ 2.16804838180542,
327
+ 1.5210580825805664,
328
+ 0.6210905313491821,
329
+ -3.2670226097106934,
330
+ -5.004988670349121,
331
+ -3.6877942085266113,
332
+ -2.2799763679504395,
333
+ -1.0594818592071533,
334
+ -0.467401385307312,
335
+ -1.0743809938430786,
336
+ -1.5555450916290283,
337
+ -1.736448049545288,
338
+ -0.9791319370269775,
339
+ -1.049828052520752,
340
+ -0.8316065669059753,
341
+ -0.9291037321090698,
342
+ -0.10457479953765869,
343
+ -0.20095288753509521,
344
+ -0.548839807510376,
345
+ -0.3219412565231323,
346
+ -0.36635565757751465,
347
+ -0.3528318405151367,
348
+ 0.026454448699951172,
349
+ -0.07644355297088623,
350
+ -0.32562559843063354,
351
+ -0.17350387573242188,
352
+ -0.2866344451904297,
353
+ -0.5754052400588989,
354
+ -0.2641051411628723,
355
+ 0.035104185342788696,
356
+ -0.684080958366394,
357
+ -0.493069589138031,
358
+ -0.5354839563369751,
359
+ -0.4995620846748352,
360
+ -0.3217971622943878,
361
+ -0.3521539568901062,
362
+ -0.4038366675376892,
363
+ -0.6195577383041382,
364
+ -0.5501360297203064,
365
+ -0.5692479610443115,
366
+ -0.7562788128852844,
367
+ -0.9780133366584778,
368
+ -0.7792848944664001,
369
+ -0.6671980619430542,
370
+ -0.8792123794555664,
371
+ -0.6089744567871094,
372
+ -0.6482593417167664,
373
+ -0.9847323894500732,
374
+ -1.0424913167953491,
375
+ -0.9844663739204407,
376
+ -0.79583740234375,
377
+ -0.9576754570007324,
378
+ -0.49776551127433777,
379
+ -0.4625418782234192,
380
+ -0.6531974077224731,
381
+ -1.1888946294784546,
382
+ -0.6440246105194092,
383
+ -0.6820342540740967,
384
+ -0.8137439489364624,
385
+ -0.6066876649856567,
386
+ -0.5646378397941589,
387
+ -0.9681340456008911,
388
+ -0.9584231376647949,
389
+ -0.6563090085983276,
390
+ -0.6814383864402771,
391
+ -1.0258846282958984,
392
+ -0.39244240522384644,
393
+ -0.8771434426307678,
394
+ -1.1061186790466309,
395
+ -1.0608580112457275,
396
+ -1.0042860507965088,
397
+ -0.6980247497558594,
398
+ -0.7052803039550781,
399
+ -0.7784515619277954,
400
+ -0.6134355664253235,
401
+ -0.9554014205932617,
402
+ -0.8785175681114197,
403
+ -0.6864355802536011,
404
+ -0.935036838054657,
405
+ -0.9437254667282104,
406
+ -1.2484549283981323,
407
+ -0.923052191734314,
408
+ -0.6445103287696838,
409
+ -0.7176944017410278,
410
+ -0.7207449674606323,
411
+ -0.8866404294967651,
412
+ -0.8694981932640076,
413
+ -0.35646361112594604,
414
+ -0.9853545427322388,
415
+ -0.7620975375175476,
416
+ -1.0418447256088257,
417
+ -0.36955496668815613,
418
+ -0.6847604513168335,
419
+ -0.6237123012542725,
420
+ -0.652388334274292,
421
+ -0.5494027733802795,
422
+ -0.5900116562843323,
423
+ -1.251389741897583,
424
+ -0.4885002374649048,
425
+ -0.9727175235748291,
426
+ -0.9167803525924683,
427
+ -0.4562698006629944,
428
+ -0.8879244327545166,
429
+ -0.8562024235725403,
430
+ -0.4748397767543793,
431
+ -0.44835585355758667,
432
+ -0.5543228387832642,
433
+ -0.6463515758514404,
434
+ -0.5022682547569275,
435
+ -0.7029032707214355,
436
+ -0.5944797396659851,
437
+ -0.4108027219772339,
438
+ -0.7498533725738525,
439
+ -0.38277798891067505,
440
+ -0.7727941274642944,
441
+ -0.7939614057540894,
442
+ -0.5801682472229004,
443
+ -0.32728078961372375,
444
+ -0.5926397442817688,
445
+ -0.6610171794891357,
446
+ -0.8355449438095093,
447
+ -0.4640677869319916,
448
+ -0.5959733724594116,
449
+ -0.3957676887512207,
450
+ -0.640071451663971,
451
+ -0.5187087655067444,
452
+ -0.37623360753059387,
453
+ -0.38300931453704834,
454
+ -0.4762595295906067,
455
+ -0.28993842005729675,
456
+ -0.5762218832969666,
457
+ -0.3432050943374634,
458
+ -0.7931725382804871,
459
+ -0.4460122585296631,
460
+ -0.3992304801940918,
461
+ -0.6115362644195557,
462
+ -0.3439960777759552,
463
+ -0.24094384908676147,
464
+ -0.22449710965156555,
465
+ -0.8024484515190125,
466
+ -0.29573333263397217,
467
+ -0.31872105598449707,
468
+ -0.07722895592451096,
469
+ -0.3788284659385681,
470
+ -0.6425816416740417,
471
+ -0.3196375072002411,
472
+ -0.5695381760597229,
473
+ -0.4219270646572113,
474
+ -0.5712203979492188,
475
+ -0.2495477944612503,
476
+ -0.24825827777385712,
477
+ -0.2586551606655121,
478
+ -0.44450560212135315,
479
+ -0.7753189206123352,
480
+ -0.30905574560165405,
481
+ -0.38787487149238586,
482
+ -0.28502145409584045,
483
+ -0.24729561805725098,
484
+ -0.24524784088134766,
485
+ -0.3243459463119507,
486
+ -0.4287901520729065,
487
+ -0.1906277984380722,
488
+ -0.3011859059333801,
489
+ -0.5004443526268005,
490
+ -0.3690613806247711,
491
+ -0.38381528854370117,
492
+ -0.4024859666824341,
493
+ -0.36327192187309265,
494
+ -0.6053040027618408,
495
+ -0.5427647233009338,
496
+ -0.4430527091026306,
497
+ -0.5658628344535828,
498
+ -0.300243616104126,
499
+ -0.4288637042045593,
500
+ -0.33472129702568054,
501
+ -0.30738216638565063,
502
+ -0.4212794899940491,
503
+ -0.4448728859424591,
504
+ -0.5388637185096741,
505
+ -0.3537139594554901,
506
+ -0.4183817207813263,
507
+ -0.6248802542686462,
508
+ -0.5340408682823181,
509
+ -0.14217877388000488,
510
+ -0.26273924112319946,
511
+ -0.26890474557876587,
512
+ -0.4285196363925934,
513
+ -0.23147913813591003,
514
+ -0.16399525105953217,
515
+ -0.2418072670698166,
516
+ -0.36358749866485596,
517
+ -0.3002931773662567,
518
+ -0.12276255339384079,
519
+ -0.18128184974193573,
520
+ -0.3129577934741974,
521
+ -0.2123219519853592,
522
+ -0.21718193590641022,
523
+ -0.352618008852005,
524
+ -0.28210005164146423,
525
+ -0.32711076736450195,
526
+ -0.11082524061203003,
527
+ -0.5531051754951477,
528
+ -0.35493436455726624,
529
+ -0.27564260363578796,
530
+ -0.2803899645805359,
531
+ -0.45139968395233154,
532
+ 0.003664538264274597,
533
+ -0.14456573128700256,
534
+ -0.15059120953083038,
535
+ -0.2755080759525299,
536
+ -0.12048216164112091,
537
+ -0.2820596396923065,
538
+ -0.28085094690322876,
539
+ -0.38926786184310913,
540
+ -0.26719021797180176,
541
+ -0.16140715777873993,
542
+ -0.14905700087547302,
543
+ -0.35209745168685913,
544
+ -0.25925999879837036,
545
+ -0.33221739530563354,
546
+ -0.101854607462883,
547
+ -0.15131431818008423,
548
+ -0.3242277503013611,
549
+ -0.20929203927516937,
550
+ -0.17773771286010742,
551
+ -0.1078529879450798,
552
+ -0.10825538635253906,
553
+ -0.18695253133773804,
554
+ -0.11143551766872406,
555
+ -0.22275972366333008,
556
+ -0.1643391102552414,
557
+ -0.20426253974437714,
558
+ -0.34204161167144775,
559
+ -0.12181445956230164,
560
+ -0.03151487559080124,
561
+ -0.20848126709461212,
562
+ -0.182655468583107,
563
+ -0.17660343647003174,
564
+ -0.11328932642936707,
565
+ -0.12237479537725449,
566
+ -0.09103978425264359,
567
+ -0.1942792385816574,
568
+ -0.08818943798542023,
569
+ -0.02035299502313137,
570
+ -0.010144004598259926,
571
+ -0.20345327258110046,
572
+ -0.2162674218416214,
573
+ -0.038134634494781494,
574
+ -0.11628672480583191,
575
+ -0.06826280802488327,
576
+ -0.18298408389091492,
577
+ -0.17394717037677765,
578
+ -0.09377621114253998,
579
+ -0.12375708669424057,
580
+ -0.062440089881420135,
581
+ -0.28978002071380615,
582
+ -0.4227134585380554,
583
+ -0.1515023559331894,
584
+ -0.0605059489607811,
585
+ -0.16949521005153656,
586
+ -0.05131351202726364,
587
+ -0.02367829531431198,
588
+ -0.07569480687379837,
589
+ -0.04092489555478096,
590
+ -0.012895889580249786,
591
+ -0.0176103338599205,
592
+ -0.21457606554031372,
593
+ -0.062300629913806915,
594
+ -0.05682635307312012,
595
+ -0.12275825440883636,
596
+ -0.039571259170770645,
597
+ -0.10159416496753693,
598
+ -0.05951068922877312,
599
+ -0.059655021876096725,
600
+ -0.026829242706298828,
601
+ -0.1999252587556839,
602
+ -0.01361328549683094,
603
+ -0.04596453532576561,
604
+ -0.05472489818930626,
605
+ -0.01935693621635437,
606
+ -0.07774822413921356,
607
+ -0.045203112065792084,
608
+ -0.06574356555938721,
609
+ -0.1723708063364029,
610
+ -0.034418124705553055,
611
+ -0.1686779260635376,
612
+ 0.003089960664510727,
613
+ -0.05640334635972977,
614
+ 0.0044072396121919155,
615
+ -0.012165093794465065,
616
+ -0.02255118265748024,
617
+ -0.013711551204323769,
618
+ -0.04891897737979889,
619
+ 0.0010970900766551495,
620
+ -0.12209063023328781,
621
+ -0.015328139066696167,
622
+ -0.07129570841789246,
623
+ 0.0028486475348472595,
624
+ -0.007078210357576609,
625
+ -0.0018760920502245426
626
+ ],
627
+ "base_loss": [
628
+ 11.348176956176758,
629
+ 9.658164024353027,
630
+ 8.175503730773926,
631
+ 6.755279541015625,
632
+ 5.456831932067871,
633
+ 3.536381959915161,
634
+ 2.2111237049102783,
635
+ 2.020595073699951,
636
+ 1.8831709623336792,
637
+ 1.8164139986038208,
638
+ 1.8264715671539307,
639
+ 1.789453387260437,
640
+ 1.827249526977539,
641
+ 1.7979072332382202,
642
+ 1.65717351436615,
643
+ 1.3548482656478882,
644
+ 1.092720866203308,
645
+ 0.8811156153678894,
646
+ 0.7566943168640137,
647
+ 0.7505759596824646,
648
+ 0.7253063321113586,
649
+ 0.6461313962936401,
650
+ 0.5313529372215271,
651
+ 0.4853276312351227,
652
+ 0.41144293546676636,
653
+ 0.43505552411079407,
654
+ 0.35781002044677734,
655
+ 0.3662125766277313,
656
+ 0.3105466365814209,
657
+ 0.32540789246559143,
658
+ 0.32633766531944275,
659
+ 0.2660132348537445,
660
+ 0.2095886915922165,
661
+ 0.23939529061317444,
662
+ 0.21866437792778015,
663
+ 0.2298569679260254,
664
+ 0.2129904329776764,
665
+ 0.2077513486146927,
666
+ 0.19318965077400208,
667
+ 0.22784128785133362,
668
+ 0.21969671547412872,
669
+ 0.1694052368402481,
670
+ 0.1979457288980484,
671
+ 0.18826699256896973,
672
+ 0.1579810231924057,
673
+ 0.1744004338979721,
674
+ 0.13743995130062103,
675
+ 0.18059197068214417,
676
+ 0.2032344490289688,
677
+ 0.1726742684841156,
678
+ 0.1709929257631302,
679
+ 0.19687053561210632,
680
+ 0.1973063200712204,
681
+ 0.17787732183933258,
682
+ 0.2129112035036087,
683
+ 0.17937204241752625,
684
+ 0.1486138254404068,
685
+ 0.16416920721530914,
686
+ 0.18011467158794403,
687
+ 0.16545338928699493,
688
+ 0.15337659418582916,
689
+ 0.1535557061433792,
690
+ 0.15468788146972656,
691
+ 0.10868119448423386,
692
+ 0.12626560032367706,
693
+ 0.1853545755147934,
694
+ 0.13237892091274261,
695
+ 0.12765221297740936,
696
+ 0.1245928630232811,
697
+ 0.11368465423583984,
698
+ 0.10360479354858398,
699
+ 0.16353169083595276,
700
+ 0.14328661561012268,
701
+ 0.12675049901008606,
702
+ 0.11431024968624115,
703
+ 0.14487215876579285,
704
+ 0.09992139786481857,
705
+ 0.14056676626205444,
706
+ 0.15103816986083984,
707
+ 0.1489901840686798,
708
+ 0.14176549017429352,
709
+ 0.10614297538995743,
710
+ 0.11745451390743256,
711
+ 0.11934898793697357,
712
+ 0.1094503402709961,
713
+ 0.12906691431999207,
714
+ 0.13131670653820038,
715
+ 0.11526160687208176,
716
+ 0.12292040884494781,
717
+ 0.13772085309028625,
718
+ 0.16186226904392242,
719
+ 0.12914633750915527,
720
+ 0.09511610120534897,
721
+ 0.0917370468378067,
722
+ 0.1102045401930809,
723
+ 0.11891024559736252,
724
+ 0.12637022137641907,
725
+ 0.07427643984556198,
726
+ 0.1217934712767601,
727
+ 0.1061604842543602,
728
+ 0.1304951310157776,
729
+ 0.07702717930078506,
730
+ 0.09671071916818619,
731
+ 0.09373380988836288,
732
+ 0.08524361997842789,
733
+ 0.08898228406906128,
734
+ 0.08046979457139969,
735
+ 0.16282297670841217,
736
+ 0.0659712627530098,
737
+ 0.12500140070915222,
738
+ 0.11204084008932114,
739
+ 0.06858927011489868,
740
+ 0.13379588723182678,
741
+ 0.10761930048465729,
742
+ 0.10035061836242676,
743
+ 0.06445668637752533,
744
+ 0.07547269761562347,
745
+ 0.08173443377017975,
746
+ 0.06381353735923767,
747
+ 0.08800162374973297,
748
+ 0.08381403982639313,
749
+ 0.05515104532241821,
750
+ 0.09454596042633057,
751
+ 0.06685151904821396,
752
+ 0.09162329137325287,
753
+ 0.11063210666179657,
754
+ 0.07126855850219727,
755
+ 0.04556313902139664,
756
+ 0.08401603251695633,
757
+ 0.08215134590864182,
758
+ 0.11719880998134613,
759
+ 0.06366000324487686,
760
+ 0.07958980649709702,
761
+ 0.05134474113583565,
762
+ 0.08279245346784592,
763
+ 0.06308238208293915,
764
+ 0.060220010578632355,
765
+ 0.08741027861833572,
766
+ 0.06228303164243698,
767
+ 0.04039480909705162,
768
+ 0.07642487436532974,
769
+ 0.05590095743536949,
770
+ 0.10389459133148193,
771
+ 0.05273384600877762,
772
+ 0.05174679681658745,
773
+ 0.07798067480325699,
774
+ 0.042904146015644073,
775
+ 0.05566927418112755,
776
+ 0.045218586921691895,
777
+ 0.092104971408844,
778
+ 0.040956515818834305,
779
+ 0.04299997538328171,
780
+ 0.09489194303750992,
781
+ 0.05761682242155075,
782
+ 0.078117735683918,
783
+ 0.05063673108816147,
784
+ 0.06737948954105377,
785
+ 0.052483730018138885,
786
+ 0.07632990926504135,
787
+ 0.032999370247125626,
788
+ 0.039553042501211166,
789
+ 0.03946533799171448,
790
+ 0.05298209190368652,
791
+ 0.12058936059474945,
792
+ 0.03645765781402588,
793
+ 0.04938702657818794,
794
+ 0.03373356908559799,
795
+ 0.03559574857354164,
796
+ 0.03654894232749939,
797
+ 0.04033171385526657,
798
+ 0.05728921294212341,
799
+ 0.04139111563563347,
800
+ 0.03515798598527908,
801
+ 0.05767108127474785,
802
+ 0.044614315032958984,
803
+ 0.054069630801677704,
804
+ 0.04794895276427269,
805
+ 0.04255472868680954,
806
+ 0.07275857776403427,
807
+ 0.06676798313856125,
808
+ 0.052579283714294434,
809
+ 0.06576798111200333,
810
+ 0.03866137936711311,
811
+ 0.05096651241183281,
812
+ 0.04090649634599686,
813
+ 0.03765810281038284,
814
+ 0.05055162310600281,
815
+ 0.05141264200210571,
816
+ 0.06436275690793991,
817
+ 0.042909521609544754,
818
+ 0.0481412447988987,
819
+ 0.07364120334386826,
820
+ 0.06127581372857094,
821
+ 0.032087262719869614,
822
+ 0.03204682469367981,
823
+ 0.031952571123838425,
824
+ 0.05041082575917244,
825
+ 0.027917351573705673,
826
+ 0.04051786661148071,
827
+ 0.028488488867878914,
828
+ 0.04157419130206108,
829
+ 0.038279034197330475,
830
+ 0.032214123755693436,
831
+ 0.03714577108621597,
832
+ 0.037206947803497314,
833
+ 0.0253861453384161,
834
+ 0.026984112337231636,
835
+ 0.0403747633099556,
836
+ 0.0341695211827755,
837
+ 0.0387321300804615,
838
+ 0.014403988607227802,
839
+ 0.064630888402462,
840
+ 0.04145904257893562,
841
+ 0.03234080597758293,
842
+ 0.040043167769908905,
843
+ 0.05187687277793884,
844
+ 0.042458124458789825,
845
+ 0.020632952451705933,
846
+ 0.018148887902498245,
847
+ 0.03218194842338562,
848
+ 0.014508134685456753,
849
+ 0.0322672538459301,
850
+ 0.03237120062112808,
851
+ 0.04743164777755737,
852
+ 0.03177398070693016,
853
+ 0.020632823929190636,
854
+ 0.018216822296380997,
855
+ 0.040302302688360214,
856
+ 0.03021249547600746,
857
+ 0.0410601980984211,
858
+ 0.011937438510358334,
859
+ 0.017787184566259384,
860
+ 0.03788934275507927,
861
+ 0.024480637162923813,
862
+ 0.021386442705988884,
863
+ 0.013995553366839886,
864
+ 0.013218357227742672,
865
+ 0.02170519344508648,
866
+ 0.013265741057693958,
867
+ 0.027774328365921974,
868
+ 0.019175902009010315,
869
+ 0.023694012314081192,
870
+ 0.03891494497656822,
871
+ 0.014863639138638973,
872
+ 0.00477577606216073,
873
+ 0.024596700444817543,
874
+ 0.022156761959195137,
875
+ 0.020905090495944023,
876
+ 0.013665799982845783,
877
+ 0.014746705070137978,
878
+ 0.011086123064160347,
879
+ 0.0223664790391922,
880
+ 0.012526833452284336,
881
+ 0.0031596629414707422,
882
+ 0.002147423569113016,
883
+ 0.023116543889045715,
884
+ 0.024747014045715332,
885
+ 0.00506470026448369,
886
+ 0.014170246198773384,
887
+ 0.008654003031551838,
888
+ 0.02848130464553833,
889
+ 0.020278919488191605,
890
+ 0.012490171007812023,
891
+ 0.014678877778351307,
892
+ 0.00794923398643732,
893
+ 0.03411915898323059,
894
+ 0.04834481701254845,
895
+ 0.017941590398550034,
896
+ 0.007513564545661211,
897
+ 0.021018287166953087,
898
+ 0.006819728761911392,
899
+ 0.0053443750366568565,
900
+ 0.0091599952429533,
901
+ 0.005529830697923899,
902
+ 0.002496313536539674,
903
+ 0.0027466346509754658,
904
+ 0.024676257744431496,
905
+ 0.008029204793274403,
906
+ 0.006855060812085867,
907
+ 0.014386625960469246,
908
+ 0.0055620549246668816,
909
+ 0.012134808115661144,
910
+ 0.007098639849573374,
911
+ 0.0077147227711975574,
912
+ 0.004118192009627819,
913
+ 0.023535089567303658,
914
+ 0.003320255083963275,
915
+ 0.005930927116423845,
916
+ 0.00807294249534607,
917
+ 0.003055460285395384,
918
+ 0.009166034869849682,
919
+ 0.005424796603620052,
920
+ 0.008324241265654564,
921
+ 0.01967540755867958,
922
+ 0.004747512750327587,
923
+ 0.02126237377524376,
924
+ 0.0005846708663739264,
925
+ 0.007051372434943914,
926
+ 0.0002061913546640426,
927
+ 0.0030558311846107244,
928
+ 0.003224612446501851,
929
+ 0.0018434918019920588,
930
+ 0.006465771701186895,
931
+ 0.0005574421375058591,
932
+ 0.014160649850964546,
933
+ 0.002493246691301465,
934
+ 0.009521164000034332,
935
+ 0.0007089687860570848,
936
+ 0.0015819991240277886,
937
+ 0.0009139505564235151
938
+ ],
939
+ "info_loss": [
940
+ -1.8398351669311523,
941
+ -2.044219970703125,
942
+ -0.838585376739502,
943
+ -0.33407068252563477,
944
+ -0.3052663803100586,
945
+ -0.13642120361328125,
946
+ -0.095794677734375,
947
+ -0.06758511066436768,
948
+ -0.042688846588134766,
949
+ -0.08711934089660645,
950
+ -0.09618604183197021,
951
+ -0.15716540813446045,
952
+ -0.2509937286376953,
953
+ -0.6369593143463135,
954
+ -0.7974681258201599,
955
+ -0.6359913349151611,
956
+ -0.46846145391464233,
957
+ -0.3248310685157776,
958
+ -0.25287580490112305,
959
+ -0.3106302320957184,
960
+ -0.3546713590621948,
961
+ -0.3641493022441864,
962
+ -0.273483544588089,
963
+ -0.2744779586791992,
964
+ -0.23988062143325806,
965
+ -0.24504630267620087,
966
+ -0.15258248150348663,
967
+ -0.1542072743177414,
968
+ -0.18088553845882416,
969
+ -0.1555505096912384,
970
+ -0.149787038564682,
971
+ -0.13772223889827728,
972
+ -0.0854477509856224,
973
+ -0.09826163947582245,
974
+ -0.11604318022727966,
975
+ -0.09581506252288818,
976
+ -0.10112380236387253,
977
+ -0.12665539979934692,
978
+ -0.09326464682817459,
979
+ -0.06344161927700043,
980
+ -0.13222730159759521,
981
+ -0.104347825050354,
982
+ -0.11384182423353195,
983
+ -0.1089448556303978,
984
+ -0.08756814897060394,
985
+ -0.0905868411064148,
986
+ -0.08477367460727692,
987
+ -0.11827360093593597,
988
+ -0.10568773746490479,
989
+ -0.10404142737388611,
990
+ -0.1266840696334839,
991
+ -0.1466711312532425,
992
+ -0.12933440506458282,
993
+ -0.11368615925312042,
994
+ -0.13761311769485474,
995
+ -0.10902324318885803,
996
+ -0.10882501304149628,
997
+ -0.14210256934165955,
998
+ -0.14836953580379486,
999
+ -0.1389470100402832,
1000
+ -0.11975423991680145,
1001
+ -0.1351478099822998,
1002
+ -0.08715786784887314,
1003
+ -0.07842544466257095,
1004
+ -0.09658178687095642,
1005
+ -0.16036082804203033,
1006
+ -0.09417106211185455,
1007
+ -0.10182587802410126,
1008
+ -0.11284688860177994,
1009
+ -0.09305805712938309,
1010
+ -0.08438123017549515,
1011
+ -0.13175822794437408,
1012
+ -0.12518969178199768,
1013
+ -0.09319722652435303,
1014
+ -0.09480932354927063,
1015
+ -0.12968377768993378,
1016
+ -0.06403618305921555,
1017
+ -0.11741723865270615,
1018
+ -0.1366928070783615,
1019
+ -0.13349445164203644,
1020
+ -0.12730760872364044,
1021
+ -0.09400708973407745,
1022
+ -0.09622948616743088,
1023
+ -0.1036338061094284,
1024
+ -0.08669906854629517,
1025
+ -0.12010125070810318,
1026
+ -0.11021239310503006,
1027
+ -0.09275370836257935,
1028
+ -0.11714392155408859,
1029
+ -0.12018654495477676,
1030
+ -0.1536489725112915,
1031
+ -0.1171664223074913,
1032
+ -0.08353244513273239,
1033
+ -0.0887352004647255,
1034
+ -0.09289058297872543,
1035
+ -0.11061441898345947,
1036
+ -0.10907161980867386,
1037
+ -0.05115537345409393,
1038
+ -0.11878849565982819,
1039
+ -0.09420275688171387,
1040
+ -0.12510739266872406,
1041
+ -0.053283724933862686,
1042
+ -0.0857665091753006,
1043
+ -0.07793471962213516,
1044
+ -0.08139720559120178,
1045
+ -0.07023963332176208,
1046
+ -0.07186076045036316,
1047
+ -0.14707539975643158,
1048
+ -0.06280907988548279,
1049
+ -0.11592680215835571,
1050
+ -0.10717639327049255,
1051
+ -0.057251229882240295,
1052
+ -0.10630366206169128,
1053
+ -0.10139380395412445,
1054
+ -0.061158884316682816,
1055
+ -0.056418031454086304,
1056
+ -0.06789487600326538,
1057
+ -0.07788398861885071,
1058
+ -0.060629621148109436,
1059
+ -0.08452030271291733,
1060
+ -0.0716065838932991,
1061
+ -0.04956388100981712,
1062
+ -0.08785617351531982,
1063
+ -0.0487699881196022,
1064
+ -0.08978073298931122,
1065
+ -0.09475350379943848,
1066
+ -0.06840009242296219,
1067
+ -0.040759943425655365,
1068
+ -0.07073906064033508,
1069
+ -0.07734540849924088,
1070
+ -0.0987088680267334,
1071
+ -0.05639068782329559,
1072
+ -0.0698167011141777,
1073
+ -0.04775746911764145,
1074
+ -0.07557619363069534,
1075
+ -0.060415416955947876,
1076
+ -0.04605577141046524,
1077
+ -0.04938408359885216,
1078
+ -0.057204946875572205,
1079
+ -0.035225678235292435,
1080
+ -0.06689294427633286,
1081
+ -0.043324247002601624,
1082
+ -0.09226767718791962,
1083
+ -0.05179920047521591,
1084
+ -0.04669686406850815,
1085
+ -0.07118741422891617,
1086
+ -0.04146597161889076,
1087
+ -0.03165189176797867,
1088
+ -0.02891518361866474,
1089
+ -0.09099714457988739,
1090
+ -0.035399775952100754,
1091
+ -0.038294870406389236,
1092
+ -0.01871110498905182,
1093
+ -0.04552214592695236,
1094
+ -0.07339572161436081,
1095
+ -0.038483861833810806,
1096
+ -0.06585320085287094,
1097
+ -0.049296606332063675,
1098
+ -0.06631350517272949,
1099
+ -0.029588188976049423,
1100
+ -0.0302404947578907,
1101
+ -0.0314614474773407,
1102
+ -0.05152343586087227,
1103
+ -0.09130795300006866,
1104
+ -0.03613182157278061,
1105
+ -0.04537980258464813,
1106
+ -0.033348198980093,
1107
+ -0.029755849391222,
1108
+ -0.030010968446731567,
1109
+ -0.03732753172516823,
1110
+ -0.049935776740312576,
1111
+ -0.025189371779561043,
1112
+ -0.03477514162659645,
1113
+ -0.05707725137472153,
1114
+ -0.043004587292671204,
1115
+ -0.045877423137426376,
1116
+ -0.046664442867040634,
1117
+ -0.041824620217084885,
1118
+ -0.06901447474956512,
1119
+ -0.06288215517997742,
1120
+ -0.05149596557021141,
1121
+ -0.06445349752902985,
1122
+ -0.03541754558682442,
1123
+ -0.049192287027835846,
1124
+ -0.038704704493284225,
1125
+ -0.036120712757110596,
1126
+ -0.04903409257531166,
1127
+ -0.05070880427956581,
1128
+ -0.061793144792318344,
1129
+ -0.040628403425216675,
1130
+ -0.047824926674366,
1131
+ -0.07112540304660797,
1132
+ -0.06083229184150696,
1133
+ -0.01826101914048195,
1134
+ -0.03086796961724758,
1135
+ -0.031452205032110214,
1136
+ -0.048829350620508194,
1137
+ -0.026968374848365784,
1138
+ -0.021961364895105362,
1139
+ -0.028025884181261063,
1140
+ -0.04135384038090706,
1141
+ -0.03508465737104416,
1142
+ -0.016960009932518005,
1143
+ -0.022921666502952576,
1144
+ -0.03624604269862175,
1145
+ -0.025064673274755478,
1146
+ -0.02591349557042122,
1147
+ -0.040236517786979675,
1148
+ -0.032556332647800446,
1149
+ -0.03791283816099167,
1150
+ -0.013542335480451584,
1151
+ -0.06294728815555573,
1152
+ -0.040674854069948196,
1153
+ -0.03192960098385811,
1154
+ -0.0330173633992672,
1155
+ -0.051272425800561905,
1156
+ -0.004900109022855759,
1157
+ -0.017937397584319115,
1158
+ -0.018043598160147667,
1159
+ -0.03205059468746185,
1160
+ -0.014335359446704388,
1161
+ -0.032214973121881485,
1162
+ -0.03230881690979004,
1163
+ -0.045075856149196625,
1164
+ -0.031128181144595146,
1165
+ -0.019158950075507164,
1166
+ -0.017802739515900612,
1167
+ -0.04021153226494789,
1168
+ -0.030147938057780266,
1169
+ -0.038002341985702515,
1170
+ -0.011879323050379753,
1171
+ -0.017573650926351547,
1172
+ -0.03767099231481552,
1173
+ -0.02429858222603798,
1174
+ -0.02132408693432808,
1175
+ -0.013935096561908722,
1176
+ -0.013111663050949574,
1177
+ -0.021667780354619026,
1178
+ -0.013213922269642353,
1179
+ -0.026040207594633102,
1180
+ -0.019114220514893532,
1181
+ -0.02366098389029503,
1182
+ -0.03878571465611458,
1183
+ -0.01483581680804491,
1184
+ -0.004753402899950743,
1185
+ -0.023840337991714478,
1186
+ -0.0216221921145916,
1187
+ -0.02087859809398651,
1188
+ -0.013629944063723087,
1189
+ -0.014400054700672626,
1190
+ -0.011008127592504025,
1191
+ -0.02231239341199398,
1192
+ -0.010912548750638962,
1193
+ -0.0031244936399161816,
1194
+ -0.0020974816288799047,
1195
+ -0.023091357201337814,
1196
+ -0.024715369567275047,
1197
+ -0.005042221862822771,
1198
+ -0.014116048812866211,
1199
+ -0.00861935131251812,
1200
+ -0.02197342738509178,
1201
+ -0.020171964541077614,
1202
+ -0.011772380210459232,
1203
+ -0.014535006135702133,
1204
+ -0.007877267897129059,
1205
+ -0.033622365444898605,
1206
+ -0.04830646514892578,
1207
+ -0.01788763701915741,
1208
+ -0.007491616066545248,
1209
+ -0.02010720781981945,
1210
+ -0.006792391184717417,
1211
+ -0.003747388254851103,
1212
+ -0.009139390662312508,
1213
+ -0.005510346032679081,
1214
+ -0.0024173881392925978,
1215
+ -0.002727402839809656,
1216
+ -0.024651682004332542,
1217
+ -0.008005335927009583,
1218
+ -0.006814910564571619,
1219
+ -0.01432492583990097,
1220
+ -0.00548264104872942,
1221
+ -0.012113568373024464,
1222
+ -0.0070703052915632725,
1223
+ -0.007505388930439949,
1224
+ -0.004096816293895245,
1225
+ -0.02349882200360298,
1226
+ -0.0032955810893326998,
1227
+ -0.005902600008994341,
1228
+ -0.007054865825921297,
1229
+ -0.0030397968366742134,
1230
+ -0.009042835794389248,
1231
+ -0.005407304503023624,
1232
+ -0.008200021460652351,
1233
+ -0.019657833501696587,
1234
+ -0.004734076093882322,
1235
+ -0.020061146467924118,
1236
+ -0.0005704064387828112,
1237
+ -0.007034923415631056,
1238
+ -0.00017200679576490074,
1239
+ -0.0030426119919866323,
1240
+ -0.00316312862560153,
1241
+ -0.0018213725415989757,
1242
+ -0.006453771144151688,
1243
+ -0.000545549439266324,
1244
+ -0.014146880246698856,
1245
+ -0.002480157418176532,
1246
+ -0.009492229670286179,
1247
+ -0.000697301875334233,
1248
+ -0.001564358244650066,
1249
+ -0.0009014341048896313
1250
+ ],
1251
+ "abs_loss": [
1252
+ 2.9938933849334717,
1253
+ 2.9749977588653564,
1254
+ 2.93611741065979,
1255
+ 2.8215205669403076,
1256
+ 2.6753578186035156,
1257
+ 2.4742519855499268,
1258
+ 2.442002058029175,
1259
+ 2.42311429977417,
1260
+ 2.454895257949829,
1261
+ 2.455317497253418,
1262
+ 2.4329206943511963,
1263
+ 2.419623374938965,
1264
+ 2.4380531311035156,
1265
+ 2.436211347579956,
1266
+ 2.4310152530670166,
1267
+ 2.4455997943878174,
1268
+ 2.4148261547088623,
1269
+ 2.4034602642059326,
1270
+ 2.3583991527557373,
1271
+ 2.2303736209869385,
1272
+ 2.189007043838501,
1273
+ 2.1008894443511963,
1274
+ 2.037555456161499,
1275
+ 1.927724838256836,
1276
+ 1.7091485261917114,
1277
+ 1.6011953353881836,
1278
+ 1.4509927034378052,
1279
+ 1.3542317152023315,
1280
+ 1.260477900505066,
1281
+ 1.1403446197509766,
1282
+ 0.9959344863891602,
1283
+ 0.9764981269836426,
1284
+ 0.8602082133293152,
1285
+ 0.8042932152748108,
1286
+ 0.7840302586555481,
1287
+ 0.7407229542732239,
1288
+ 0.7090451121330261,
1289
+ 0.6747018694877625,
1290
+ 0.6812026500701904,
1291
+ 0.6362624764442444,
1292
+ 0.5427495241165161,
1293
+ 0.5825626850128174,
1294
+ 0.5656066536903381,
1295
+ 0.5304238200187683,
1296
+ 0.5704765915870667,
1297
+ 0.46333324909210205,
1298
+ 0.4362069368362427,
1299
+ 0.4433794319629669,
1300
+ 0.3897620439529419,
1301
+ 0.4148775339126587,
1302
+ 0.41411861777305603,
1303
+ 0.3951142132282257,
1304
+ 0.39505401253700256,
1305
+ 0.368399053812027,
1306
+ 0.38996458053588867,
1307
+ 0.40069326758384705,
1308
+ 0.35118377208709717,
1309
+ 0.3709304630756378,
1310
+ 0.30766066908836365,
1311
+ 0.28643709421157837,
1312
+ 0.307537704706192,
1313
+ 0.26411768794059753,
1314
+ 0.24873606860637665,
1315
+ 0.24062480032444,
1316
+ 0.2723563015460968,
1317
+ 0.2632524371147156,
1318
+ 0.2322479486465454,
1319
+ 0.2408895492553711,
1320
+ 0.19072508811950684,
1321
+ 0.2258065938949585,
1322
+ 0.20723851025104523,
1323
+ 0.22509582340717316,
1324
+ 0.2040308117866516,
1325
+ 0.22623562812805176,
1326
+ 0.20279943943023682,
1327
+ 0.16436998546123505,
1328
+ 0.1703117936849594,
1329
+ 0.19735081493854523,
1330
+ 0.17114202678203583,
1331
+ 0.18872618675231934,
1332
+ 0.18236549198627472,
1333
+ 0.17763422429561615,
1334
+ 0.17430095374584198,
1335
+ 0.14133577048778534,
1336
+ 0.18916980922222137,
1337
+ 0.16085992753505707,
1338
+ 0.16394765675067902,
1339
+ 0.1651025265455246,
1340
+ 0.16129319369792938,
1341
+ 0.16508719325065613,
1342
+ 0.16133813560009003,
1343
+ 0.1461344212293625,
1344
+ 0.13233846426010132,
1345
+ 0.14676137268543243,
1346
+ 0.1407933235168457,
1347
+ 0.13859213888645172,
1348
+ 0.13539771735668182,
1349
+ 0.10955790430307388,
1350
+ 0.1257605254650116,
1351
+ 0.11575054377317429,
1352
+ 0.10865107923746109,
1353
+ 0.11954519897699356,
1354
+ 0.11063772439956665,
1355
+ 0.1199750304222107,
1356
+ 0.14249856770038605,
1357
+ 0.12310238927602768,
1358
+ 0.10610493272542953,
1359
+ 0.10531586408615112,
1360
+ 0.12927508354187012,
1361
+ 0.12472269684076309,
1362
+ 0.11823070794343948,
1363
+ 0.10072892904281616,
1364
+ 0.10399831086397171,
1365
+ 0.11885204166173935,
1366
+ 0.10525098443031311,
1367
+ 0.09697303175926208,
1368
+ 0.09991861134767532,
1369
+ 0.07801462709903717,
1370
+ 0.12320420145988464,
1371
+ 0.09257522970438004,
1372
+ 0.09562268108129501,
1373
+ 0.09805417060852051,
1374
+ 0.0943652018904686,
1375
+ 0.0889117494225502,
1376
+ 0.08721182495355606,
1377
+ 0.11119433492422104,
1378
+ 0.06671595573425293,
1379
+ 0.10498549789190292,
1380
+ 0.09113067388534546,
1381
+ 0.06254053115844727,
1382
+ 0.07475905120372772,
1383
+ 0.09587674587965012,
1384
+ 0.06692967563867569,
1385
+ 0.07371363043785095,
1386
+ 0.06730442494153976,
1387
+ 0.06787613034248352,
1388
+ 0.09451959282159805,
1389
+ 0.05706527829170227,
1390
+ 0.08041390031576157,
1391
+ 0.052461009472608566,
1392
+ 0.06363413482904434,
1393
+ 0.07634305953979492,
1394
+ 0.07341243326663971,
1395
+ 0.05652907118201256,
1396
+ 0.04334472492337227,
1397
+ 0.06914454698562622,
1398
+ 0.048156093806028366,
1399
+ 0.068581223487854,
1400
+ 0.05636994168162346,
1401
+ 0.06884375214576721,
1402
+ 0.04884235933423042,
1403
+ 0.047733258455991745,
1404
+ 0.052274663001298904,
1405
+ 0.04276375100016594,
1406
+ 0.04133615270256996,
1407
+ 0.04700519144535065,
1408
+ 0.03698791190981865,
1409
+ 0.04827089235186577,
1410
+ 0.05317207798361778,
1411
+ 0.030071159824728966,
1412
+ 0.06499289721250534,
1413
+ 0.041782211512327194,
1414
+ 0.04565069451928139,
1415
+ 0.04445822909474373,
1416
+ 0.06319693475961685,
1417
+ 0.046127449721097946,
1418
+ 0.046332791447639465,
1419
+ 0.038911569863557816,
1420
+ 0.03652055561542511,
1421
+ 0.040581800043582916,
1422
+ 0.03712296485900879,
1423
+ 0.042434900999069214,
1424
+ 0.041029203683137894,
1425
+ 0.04779548943042755,
1426
+ 0.044525399804115295,
1427
+ 0.032833222299814224,
1428
+ 0.04053442180156708,
1429
+ 0.03886010870337486,
1430
+ 0.03976539522409439,
1431
+ 0.027735590934753418,
1432
+ 0.04368611052632332,
1433
+ 0.021648764610290527,
1434
+ 0.04334479942917824,
1435
+ 0.028875714167952538,
1436
+ 0.05094917118549347,
1437
+ 0.036913394927978516,
1438
+ 0.03653205931186676,
1439
+ 0.04565936326980591,
1440
+ 0.04067688807845116,
1441
+ 0.03329917788505554,
1442
+ 0.021196315065026283,
1443
+ 0.028443718329072,
1444
+ 0.038855601102113724,
1445
+ 0.02844543196260929,
1446
+ 0.027145447209477425,
1447
+ 0.030981509014964104,
1448
+ 0.024207519367337227,
1449
+ 0.034038834273815155,
1450
+ 0.03773678466677666,
1451
+ 0.01800752617418766,
1452
+ 0.02666519582271576,
1453
+ 0.0208128709346056,
1454
+ 0.02491801418364048,
1455
+ 0.012329664081335068,
1456
+ 0.023850271478295326,
1457
+ 0.025254761800169945,
1458
+ 0.030552169308066368,
1459
+ 0.019725842401385307,
1460
+ 0.0271352156996727,
1461
+ 0.0175436083227396,
1462
+ 0.019106363877654076,
1463
+ 0.03091115690767765,
1464
+ 0.022990381345152855,
1465
+ 0.023444881662726402,
1466
+ 0.02155453898012638,
1467
+ 0.016893990337848663,
1468
+ 0.024599524214863777,
1469
+ 0.02393362484872341,
1470
+ 0.0212771724909544,
1471
+ 0.035765379667282104,
1472
+ 0.018335390836000443,
1473
+ 0.022814542055130005,
1474
+ 0.017440618947148323,
1475
+ 0.020681465044617653,
1476
+ 0.02412932924926281,
1477
+ 0.016143223270773888,
1478
+ 0.025536412373185158,
1479
+ 0.02186231128871441,
1480
+ 0.02213762141764164,
1481
+ 0.02496977336704731,
1482
+ 0.021429985761642456,
1483
+ 0.01813187263906002,
1484
+ 0.022595709189772606,
1485
+ 0.01267828419804573,
1486
+ 0.02139400504529476,
1487
+ 0.030547169968485832,
1488
+ 0.012931725941598415,
1489
+ 0.0202499907463789,
1490
+ 0.01977205090224743,
1491
+ 0.0094446474686265,
1492
+ 0.02570066787302494,
1493
+ 0.013433116488158703,
1494
+ 0.014218248426914215,
1495
+ 0.01797904632985592,
1496
+ 0.016701532527804375,
1497
+ 0.012059773318469524,
1498
+ 0.012821301817893982,
1499
+ 0.008677738718688488,
1500
+ 0.015291091986000538,
1501
+ 0.016353486105799675,
1502
+ 0.012689098715782166,
1503
+ 0.011004486121237278,
1504
+ 0.009067011065781116,
1505
+ 0.011839977465569973,
1506
+ 0.010253990069031715,
1507
+ 0.010401847772300243,
1508
+ 0.009730520658195019,
1509
+ 0.009363397024571896,
1510
+ 0.0159695353358984,
1511
+ 0.0190542321652174,
1512
+ 0.00840098224580288,
1513
+ 0.01213742047548294,
1514
+ 0.008595985360443592,
1515
+ 0.004637958016246557,
1516
+ 0.003987576346844435,
1517
+ 0.014758736826479435,
1518
+ 0.00895618461072445,
1519
+ 0.007945787161588669,
1520
+ 0.006248538848012686,
1521
+ 0.008503042161464691,
1522
+ 0.007997240871191025,
1523
+ 0.0030844148714095354,
1524
+ 0.008163300342857838,
1525
+ 0.007821774110198021,
1526
+ 0.0069182440638542175,
1527
+ 0.005710149649530649,
1528
+ 0.007785602007061243,
1529
+ 0.004901018459349871,
1530
+ 0.008665218017995358,
1531
+ 0.00488354591652751,
1532
+ 0.010418585501611233,
1533
+ 0.010181576013565063,
1534
+ 0.00493974843993783,
1535
+ 0.006040124222636223,
1536
+ 0.008254206739366055,
1537
+ 0.005456992890685797,
1538
+ 0.008817612193524837,
1539
+ 0.005491325631737709,
1540
+ 0.004182519391179085,
1541
+ 0.003974607679992914,
1542
+ 0.0037016738206148148,
1543
+ 0.006753202527761459,
1544
+ 0.004019949119538069,
1545
+ 0.004432115703821182,
1546
+ 0.004973252769559622,
1547
+ 0.004932798445224762,
1548
+ 0.003272750647738576,
1549
+ 0.002955566393211484,
1550
+ 0.004928942304104567,
1551
+ 0.007794182747602463,
1552
+ 0.00529333995655179,
1553
+ 0.0034571022260934114,
1554
+ 0.007893756031990051,
1555
+ 0.005533301737159491,
1556
+ 0.004806728567928076,
1557
+ 0.009191330522298813,
1558
+ 0.004205226432532072,
1559
+ 0.0019827077630907297,
1560
+ 0.0018654415616765618,
1561
+ 0.0034071195404976606
1562
+ ],
1563
+ "zipf_loss": [
1564
+ 7.508018493652344,
1565
+ 6.377723217010498,
1566
+ 4.839138984680176,
1567
+ 3.1670374870300293,
1568
+ 1.9498305320739746,
1569
+ 1.3069896697998047,
1570
+ 1.137599229812622,
1571
+ 1.0839978456497192,
1572
+ 1.0679179430007935,
1573
+ 1.0674612522125244,
1574
+ 1.0601451396942139,
1575
+ 1.0612964630126953,
1576
+ 1.0599730014801025,
1577
+ 1.0610418319702148,
1578
+ 1.0694173574447632,
1579
+ 1.0727109909057617,
1580
+ 1.0704345703125,
1581
+ 1.0673670768737793,
1582
+ 1.0688223838806152,
1583
+ 1.0583080053329468,
1584
+ 1.0469615459442139,
1585
+ 1.0488247871398926,
1586
+ 1.0205949544906616,
1587
+ 1.0168514251708984,
1588
+ 0.9848416447639465,
1589
+ 0.9261842966079712,
1590
+ 0.9183406829833984,
1591
+ 0.8394840955734253,
1592
+ 0.8234212398529053,
1593
+ 0.794121503829956,
1594
+ 0.7055836915969849,
1595
+ 0.6607275009155273,
1596
+ 0.5853224396705627,
1597
+ 0.586348295211792,
1598
+ 0.5377388596534729,
1599
+ 0.4807174801826477,
1600
+ 0.44070863723754883,
1601
+ 0.4159272015094757,
1602
+ 0.4072313904762268,
1603
+ 0.37805286049842834,
1604
+ 0.36422038078308105,
1605
+ 0.3227471709251404,
1606
+ 0.3484278619289398,
1607
+ 0.348577082157135,
1608
+ 0.33885565400123596,
1609
+ 0.3329806923866272,
1610
+ 0.2628393769264221,
1611
+ 0.3382484018802643,
1612
+ 0.2645307183265686,
1613
+ 0.2570043206214905,
1614
+ 0.2981570363044739,
1615
+ 0.2523159384727478,
1616
+ 0.27724748849868774,
1617
+ 0.2549462616443634,
1618
+ 0.2450110763311386,
1619
+ 0.26181653141975403,
1620
+ 0.25625860691070557,
1621
+ 0.2350311577320099,
1622
+ 0.23032346367835999,
1623
+ 0.21090656518936157,
1624
+ 0.21757470071315765,
1625
+ 0.21383513510227203,
1626
+ 0.19425168633460999,
1627
+ 0.18896891176700592,
1628
+ 0.15911924839019775,
1629
+ 0.20303383469581604,
1630
+ 0.14208224415779114,
1631
+ 0.18448331952095032,
1632
+ 0.17105945944786072,
1633
+ 0.18762755393981934,
1634
+ 0.15484575927257538,
1635
+ 0.16340693831443787,
1636
+ 0.12978410720825195,
1637
+ 0.1262892186641693,
1638
+ 0.13206464052200317,
1639
+ 0.10964392125606537,
1640
+ 0.13096685707569122,
1641
+ 0.13672703504562378,
1642
+ 0.09265706688165665,
1643
+ 0.1062237098813057,
1644
+ 0.10878805816173553,
1645
+ 0.11813965439796448,
1646
+ 0.12212994694709778,
1647
+ 0.1244039535522461,
1648
+ 0.12518781423568726,
1649
+ 0.10045816004276276,
1650
+ 0.07589489966630936,
1651
+ 0.10932967066764832,
1652
+ 0.09735257178544998,
1653
+ 0.103910431265831,
1654
+ 0.11003872752189636,
1655
+ 0.1048523336648941,
1656
+ 0.08246423304080963,
1657
+ 0.06324440985918045,
1658
+ 0.08387705683708191,
1659
+ 0.08673429489135742,
1660
+ 0.08130808174610138,
1661
+ 0.06985792517662048,
1662
+ 0.0681607574224472,
1663
+ 0.06219450384378433,
1664
+ 0.06786900013685226,
1665
+ 0.074300616979599,
1666
+ 0.06513010710477829,
1667
+ 0.04990356042981148,
1668
+ 0.06209024041891098,
1669
+ 0.05170098692178726,
1670
+ 0.03751566633582115,
1671
+ 0.04600973427295685,
1672
+ 0.06069177761673927,
1673
+ 0.04907681420445442,
1674
+ 0.03111977130174637,
1675
+ 0.037580300122499466,
1676
+ 0.030916567891836166,
1677
+ 0.03823115676641464,
1678
+ 0.025873342528939247,
1679
+ 0.04167042672634125,
1680
+ 0.03916134685277939,
1681
+ 0.04295240342617035,
1682
+ 0.027893977239727974,
1683
+ 0.04504067078232765,
1684
+ 0.028209812939167023,
1685
+ 0.01987963728606701,
1686
+ 0.02472582831978798,
1687
+ 0.029179174453020096,
1688
+ 0.024668727070093155,
1689
+ 0.031822070479393005,
1690
+ 0.025892505422234535,
1691
+ 0.024256976321339607,
1692
+ 0.021621791645884514,
1693
+ 0.024031449109315872,
1694
+ 0.0268690288066864,
1695
+ 0.026591423898935318,
1696
+ 0.015910949558019638,
1697
+ 0.023090887814760208,
1698
+ 0.026167571544647217,
1699
+ 0.015575386583805084,
1700
+ 0.014652129262685776,
1701
+ 0.017714740708470345,
1702
+ 0.025465546175837517,
1703
+ 0.016677433624863625,
1704
+ 0.009919259697198868,
1705
+ 0.02650211751461029,
1706
+ 0.01826842874288559,
1707
+ 0.013593020848929882,
1708
+ 0.011656910181045532,
1709
+ 0.015442749485373497,
1710
+ 0.022943882271647453,
1711
+ 0.013047667220234871,
1712
+ 0.013799160718917847,
1713
+ 0.008533666841685772,
1714
+ 0.012423652224242687,
1715
+ 0.01645432412624359,
1716
+ 0.009762682020664215,
1717
+ 0.014499807730317116,
1718
+ 0.009124213829636574,
1719
+ 0.00986386463046074,
1720
+ 0.01791560649871826,
1721
+ 0.013728177174925804,
1722
+ 0.010267551988363266,
1723
+ 0.010327628813683987,
1724
+ 0.00809432566165924,
1725
+ 0.012315742671489716,
1726
+ 0.013181609101593494,
1727
+ 0.012725376524031162,
1728
+ 0.009485132992267609,
1729
+ 0.011923369020223618,
1730
+ 0.01009367872029543,
1731
+ 0.01077595166862011,
1732
+ 0.014660831540822983,
1733
+ 0.004539459012448788,
1734
+ 0.009566102176904678,
1735
+ 0.015631314367055893,
1736
+ 0.007304617669433355,
1737
+ 0.007877523079514503,
1738
+ 0.011917642317712307,
1739
+ 0.017605988308787346,
1740
+ 0.012156074866652489,
1741
+ 0.008533544838428497,
1742
+ 0.00810571201145649,
1743
+ 0.01651523821055889,
1744
+ 0.014959052205085754,
1745
+ 0.010739190503954887,
1746
+ 0.010935965925455093,
1747
+ 0.009205074980854988,
1748
+ 0.006324338261038065,
1749
+ 0.012475525960326195,
1750
+ 0.014856601133942604,
1751
+ 0.006236622110009193,
1752
+ 0.010637265630066395,
1753
+ 0.006330633535981178,
1754
+ 0.009606647305190563,
1755
+ 0.0098881796002388,
1756
+ 0.009120631963014603,
1757
+ 0.00549960695207119,
1758
+ 0.011179102584719658,
1759
+ 0.010566587559878826,
1760
+ 0.006942258682101965,
1761
+ 0.006883366033434868,
1762
+ 0.011326853185892105,
1763
+ 0.008162328973412514,
1764
+ 0.005710173398256302,
1765
+ 0.010193098336458206,
1766
+ 0.012131622061133385,
1767
+ 0.009556088596582413,
1768
+ 0.00991067849099636,
1769
+ 0.010413167998194695,
1770
+ 0.011913683265447617,
1771
+ 0.007399837486445904,
1772
+ 0.00658019632101059,
1773
+ 0.011531122960150242,
1774
+ 0.008283493109047413,
1775
+ 0.008645711466670036,
1776
+ 0.008056065067648888,
1777
+ 0.008968126960098743,
1778
+ 0.007585056126117706,
1779
+ 0.007758310530334711,
1780
+ 0.007747551426291466,
1781
+ 0.011781929060816765,
1782
+ 0.009568164125084877,
1783
+ 0.009239370934665203,
1784
+ 0.006529760546982288,
1785
+ 0.005541387014091015,
1786
+ 0.008121967315673828,
1787
+ 0.011990927159786224,
1788
+ 0.00990463886409998,
1789
+ 0.007935209199786186,
1790
+ 0.008199924603104591,
1791
+ 0.007529303431510925,
1792
+ 0.009793114848434925,
1793
+ 0.00424883421510458,
1794
+ 0.002858188934624195,
1795
+ 0.004821814596652985,
1796
+ 0.0123332804068923,
1797
+ 0.007945295423269272,
1798
+ 0.011977298185229301,
1799
+ 0.014447704888880253,
1800
+ 0.008349712006747723,
1801
+ 0.005995080806314945,
1802
+ 0.005460754968225956,
1803
+ 0.00892355665564537,
1804
+ 0.0050571211613714695,
1805
+ 0.007309983018785715,
1806
+ 0.005478726699948311,
1807
+ 0.009882170706987381,
1808
+ 0.009573226794600487,
1809
+ 0.004119419492781162,
1810
+ 0.010127575136721134,
1811
+ 0.010409685783088207,
1812
+ 0.007815204560756683,
1813
+ 0.005243698600679636,
1814
+ 0.006686466280370951,
1815
+ 0.005377766210585833,
1816
+ 0.007502518594264984,
1817
+ 0.006548281759023666,
1818
+ 0.007657989859580994,
1819
+ 0.0033035678789019585,
1820
+ 0.005166221875697374,
1821
+ 0.006286541000008583,
1822
+ 0.009106560610234737,
1823
+ 0.00737127847969532,
1824
+ 0.0074288020841777325,
1825
+ 0.006279816851019859,
1826
+ 0.010597821325063705,
1827
+ 0.00645030289888382,
1828
+ 0.007984600961208344,
1829
+ 0.010848619975149632,
1830
+ 0.011110762134194374,
1831
+ 0.00863784458488226,
1832
+ 0.006271792575716972,
1833
+ 0.009708289057016373,
1834
+ 0.008990945294499397,
1835
+ 0.008142768405377865,
1836
+ 0.005722767673432827,
1837
+ 0.007866553962230682,
1838
+ 0.008089855313301086,
1839
+ 0.006346045061945915,
1840
+ 0.006485946010798216,
1841
+ 0.009233424440026283,
1842
+ 0.0036011715419590473,
1843
+ 0.005616024136543274,
1844
+ 0.008651234209537506,
1845
+ 0.006388550158590078,
1846
+ 0.0035997512750327587,
1847
+ 0.007080127485096455,
1848
+ 0.00919530913233757,
1849
+ 0.010982177220284939,
1850
+ 0.015140509232878685,
1851
+ 0.006581403315067291,
1852
+ 0.0073325661942362785,
1853
+ 0.007588110864162445,
1854
+ 0.0031439396552741528,
1855
+ 0.0027698143385350704,
1856
+ 0.007530405186116695,
1857
+ 0.004088919144123793,
1858
+ 0.007677796296775341,
1859
+ 0.010177896358072758,
1860
+ 0.007882079109549522,
1861
+ 0.006598957814276218,
1862
+ 0.005428222008049488,
1863
+ 0.014425776898860931,
1864
+ 0.0053261565044522285,
1865
+ 0.002312971744686365,
1866
+ 0.008363589644432068,
1867
+ 0.0054418123327195644,
1868
+ 0.00473686121404171,
1869
+ 0.006061055231839418,
1870
+ 0.013684902340173721,
1871
+ 0.008914426900446415,
1872
+ 0.006796828005462885,
1873
+ 0.005883586592972279
1874
+ ],
1875
+ "denoise_loss": [],
1876
+ "ortho_loss": [
1877
+ 0.9357067942619324,
1878
+ 0.6422317624092102,
1879
+ 0.4942902624607086,
1880
+ 0.29429781436920166,
1881
+ 0.24794542789459229,
1882
+ 0.22385038435459137,
1883
+ 0.19311273097991943,
1884
+ 0.17221230268478394,
1885
+ 0.1324591189622879,
1886
+ 0.11966486275196075,
1887
+ 0.11843959987163544,
1888
+ 0.12658552825450897,
1889
+ 0.14483223855495453,
1890
+ 0.16538843512535095,
1891
+ 0.20255842804908752,
1892
+ 0.22847242653369904,
1893
+ 0.22890633344650269,
1894
+ 0.23279890418052673,
1895
+ 0.23943206667900085,
1896
+ 0.24902619421482086,
1897
+ 0.25732555985450745,
1898
+ 0.2688867747783661,
1899
+ 0.27691540122032166,
1900
+ 0.28126972913742065,
1901
+ 0.28658929467201233,
1902
+ 0.2880364656448364,
1903
+ 0.28995969891548157,
1904
+ 0.29220712184906006,
1905
+ 0.28871554136276245,
1906
+ 0.2893725335597992,
1907
+ 0.2871643602848053,
1908
+ 0.2876298725605011,
1909
+ 0.28997722268104553,
1910
+ 0.2891787588596344,
1911
+ 0.29156380891799927,
1912
+ 0.2962709665298462,
1913
+ 0.2925257086753845,
1914
+ 0.2928231954574585,
1915
+ 0.2951858937740326,
1916
+ 0.29334795475006104,
1917
+ 0.2914734482765198,
1918
+ 0.2910447418689728,
1919
+ 0.2899889349937439,
1920
+ 0.28629210591316223,
1921
+ 0.29511505365371704,
1922
+ 0.2950782775878906,
1923
+ 0.2912893295288086,
1924
+ 0.29630428552627563,
1925
+ 0.2931010127067566,
1926
+ 0.29433175921440125,
1927
+ 0.29263049364089966,
1928
+ 0.2946012616157532,
1929
+ 0.2915116846561432,
1930
+ 0.28947049379348755,
1931
+ 0.29247814416885376,
1932
+ 0.2980205714702606,
1933
+ 0.29925838112831116,
1934
+ 0.2982354760169983,
1935
+ 0.29646483063697815,
1936
+ 0.2910875678062439,
1937
+ 0.29541441798210144,
1938
+ 0.2931373715400696,
1939
+ 0.29201871156692505,
1940
+ 0.29173851013183594,
1941
+ 0.2976354658603668,
1942
+ 0.28784075379371643,
1943
+ 0.2869347035884857,
1944
+ 0.29056474566459656,
1945
+ 0.2957608997821808,
1946
+ 0.298565536737442,
1947
+ 0.299645334482193,
1948
+ 0.2973152995109558,
1949
+ 0.29361268877983093,
1950
+ 0.29091721773147583,
1951
+ 0.29167798161506653,
1952
+ 0.29417839646339417,
1953
+ 0.29681408405303955,
1954
+ 0.2925621271133423,
1955
+ 0.2890797257423401,
1956
+ 0.2903701663017273,
1957
+ 0.2845795154571533,
1958
+ 0.284394234418869,
1959
+ 0.2800513505935669,
1960
+ 0.28083544969558716,
1961
+ 0.2749250531196594,
1962
+ 0.2757197320461273,
1963
+ 0.2729575037956238,
1964
+ 0.27686187624931335,
1965
+ 0.27504122257232666,
1966
+ 0.28050342202186584,
1967
+ 0.28639787435531616,
1968
+ 0.28382253646850586,
1969
+ 0.277944952249527,
1970
+ 0.27306732535362244,
1971
+ 0.2733241617679596,
1972
+ 0.27030202746391296,
1973
+ 0.2679824233055115,
1974
+ 0.2663925588130951,
1975
+ 0.26683127880096436,
1976
+ 0.2637677788734436,
1977
+ 0.2603582441806793,
1978
+ 0.26671767234802246,
1979
+ 0.26803871989250183,
1980
+ 0.27057039737701416,
1981
+ 0.2696698009967804,
1982
+ 0.26371487975120544,
1983
+ 0.2667105495929718,
1984
+ 0.26532647013664246,
1985
+ 0.2622978687286377,
1986
+ 0.26921921968460083,
1987
+ 0.2694823741912842,
1988
+ 0.26909205317497253,
1989
+ 0.2656244933605194,
1990
+ 0.26089727878570557,
1991
+ 0.26395392417907715,
1992
+ 0.2611384093761444,
1993
+ 0.26153337955474854,
1994
+ 0.25924792885780334,
1995
+ 0.26162704825401306,
1996
+ 0.2616712749004364,
1997
+ 0.26247167587280273,
1998
+ 0.25996118783950806,
1999
+ 0.25641125440597534,
2000
+ 0.2608923017978668,
2001
+ 0.2578441798686981,
2002
+ 0.2561759948730469,
2003
+ 0.2589804530143738,
2004
+ 0.2574058175086975,
2005
+ 0.2559970021247864,
2006
+ 0.2558385133743286,
2007
+ 0.2543094754219055,
2008
+ 0.2562011480331421,
2009
+ 0.25481194257736206,
2010
+ 0.2569066882133484,
2011
+ 0.25113925337791443,
2012
+ 0.24666552245616913,
2013
+ 0.24779640138149261,
2014
+ 0.24791672825813293,
2015
+ 0.24761070311069489,
2016
+ 0.2466919869184494,
2017
+ 0.24797818064689636,
2018
+ 0.24688461422920227,
2019
+ 0.24983103573322296,
2020
+ 0.24891504645347595,
2021
+ 0.25042685866355896,
2022
+ 0.2474178969860077,
2023
+ 0.2462024837732315,
2024
+ 0.24414153397083282,
2025
+ 0.23954972624778748,
2026
+ 0.23531906306743622,
2027
+ 0.23609355092048645,
2028
+ 0.23189228773117065,
2029
+ 0.23293961584568024,
2030
+ 0.23709818720817566,
2031
+ 0.23996911942958832,
2032
+ 0.24068787693977356,
2033
+ 0.23669955134391785,
2034
+ 0.2375536561012268,
2035
+ 0.23852285742759705,
2036
+ 0.23809772729873657,
2037
+ 0.23809972405433655,
2038
+ 0.23904356360435486,
2039
+ 0.23542122542858124,
2040
+ 0.2393740713596344,
2041
+ 0.24114780128002167,
2042
+ 0.23833809792995453,
2043
+ 0.23236897587776184,
2044
+ 0.23552101850509644,
2045
+ 0.23300562798976898,
2046
+ 0.23094601929187775,
2047
+ 0.23226290941238403,
2048
+ 0.2343435138463974,
2049
+ 0.23637379705905914,
2050
+ 0.23456497490406036,
2051
+ 0.2347889095544815,
2052
+ 0.23816919326782227,
2053
+ 0.23527134954929352,
2054
+ 0.23826108872890472,
2055
+ 0.24391894042491913,
2056
+ 0.24607284367084503,
2057
+ 0.2448626160621643,
2058
+ 0.24438802897930145,
2059
+ 0.24572844803333282,
2060
+ 0.2432861477136612,
2061
+ 0.24532926082611084,
2062
+ 0.2422964870929718,
2063
+ 0.24091248214244843,
2064
+ 0.23530641198158264,
2065
+ 0.2347714751958847,
2066
+ 0.234837606549263,
2067
+ 0.23736950755119324,
2068
+ 0.23760047554969788,
2069
+ 0.23290078341960907,
2070
+ 0.23271754384040833,
2071
+ 0.23291030526161194,
2072
+ 0.23450066149234772,
2073
+ 0.23524610698223114,
2074
+ 0.23219306766986847,
2075
+ 0.23220641911029816,
2076
+ 0.23640581965446472,
2077
+ 0.23277226090431213,
2078
+ 0.22785478830337524,
2079
+ 0.22684350609779358,
2080
+ 0.22504018247127533,
2081
+ 0.22346368432044983,
2082
+ 0.22450341284275055,
2083
+ 0.22281962633132935,
2084
+ 0.22338008880615234,
2085
+ 0.22406215965747833,
2086
+ 0.22416630387306213,
2087
+ 0.2298343926668167,
2088
+ 0.23191460967063904,
2089
+ 0.23138746619224548,
2090
+ 0.23130297660827637,
2091
+ 0.22848114371299744,
2092
+ 0.22782231867313385,
2093
+ 0.22623401880264282,
2094
+ 0.2287047654390335,
2095
+ 0.22918124496936798,
2096
+ 0.22987119853496552,
2097
+ 0.23187166452407837,
2098
+ 0.23239445686340332,
2099
+ 0.23223066329956055,
2100
+ 0.2323235124349594,
2101
+ 0.23177029192447662,
2102
+ 0.23191207647323608,
2103
+ 0.23621831834316254,
2104
+ 0.23637987673282623,
2105
+ 0.23628520965576172,
2106
+ 0.23547324538230896,
2107
+ 0.23612439632415771,
2108
+ 0.23981040716171265,
2109
+ 0.2413926124572754,
2110
+ 0.24188148975372314,
2111
+ 0.24439086019992828,
2112
+ 0.24338805675506592,
2113
+ 0.24359260499477386,
2114
+ 0.24382725358009338,
2115
+ 0.24250797927379608,
2116
+ 0.2431001514196396,
2117
+ 0.2415461540222168,
2118
+ 0.2424304038286209,
2119
+ 0.24104849994182587,
2120
+ 0.24240747094154358,
2121
+ 0.2422892451286316,
2122
+ 0.2426515370607376,
2123
+ 0.24490493535995483,
2124
+ 0.24562010169029236,
2125
+ 0.24731475114822388,
2126
+ 0.24622128903865814,
2127
+ 0.24710728228092194,
2128
+ 0.24945400655269623,
2129
+ 0.24861550331115723,
2130
+ 0.2490844428539276,
2131
+ 0.24981819093227386,
2132
+ 0.25292736291885376,
2133
+ 0.2526569962501526,
2134
+ 0.25513604283332825,
2135
+ 0.25599491596221924,
2136
+ 0.25455906987190247,
2137
+ 0.2546842098236084,
2138
+ 0.25445064902305603,
2139
+ 0.25372451543807983,
2140
+ 0.2546672821044922,
2141
+ 0.25446799397468567,
2142
+ 0.2542880177497864,
2143
+ 0.25482404232025146,
2144
+ 0.2552380859851837,
2145
+ 0.25651663541793823,
2146
+ 0.25693514943122864,
2147
+ 0.2579176723957062,
2148
+ 0.25768107175827026,
2149
+ 0.2592007517814636,
2150
+ 0.2582704424858093,
2151
+ 0.2580220103263855,
2152
+ 0.25747179985046387,
2153
+ 0.25709253549575806,
2154
+ 0.25713810324668884,
2155
+ 0.2573889493942261,
2156
+ 0.25913330912590027,
2157
+ 0.2583840787410736,
2158
+ 0.2594054639339447,
2159
+ 0.2599242031574249,
2160
+ 0.2603592872619629,
2161
+ 0.2603609263896942,
2162
+ 0.26061707735061646,
2163
+ 0.2606254816055298,
2164
+ 0.2607192397117615,
2165
+ 0.2604772448539734,
2166
+ 0.2601570188999176,
2167
+ 0.26017218828201294,
2168
+ 0.26030242443084717,
2169
+ 0.260734498500824,
2170
+ 0.26047825813293457,
2171
+ 0.2604830861091614,
2172
+ 0.260887086391449,
2173
+ 0.26124802231788635,
2174
+ 0.2611342668533325,
2175
+ 0.26165759563446045,
2176
+ 0.26253366470336914,
2177
+ 0.2626202702522278,
2178
+ 0.2630818486213684,
2179
+ 0.2632027268409729,
2180
+ 0.26326560974121094,
2181
+ 0.2637380063533783,
2182
+ 0.263968825340271,
2183
+ 0.2642729878425598,
2184
+ 0.26452895998954773,
2185
+ 0.26446181535720825,
2186
+ 0.26452890038490295
2187
+ ],
2188
+ "lr": [
2189
+ 4.188034188034189e-06,
2190
+ 8.461538461538462e-06,
2191
+ 1.2735042735042738e-05,
2192
+ 1.700854700854701e-05,
2193
+ 2.1282051282051282e-05,
2194
+ 2.5555555555555557e-05,
2195
+ 2.9829059829059833e-05,
2196
+ 3.4102564102564105e-05,
2197
+ 3.837606837606838e-05,
2198
+ 4e-05,
2199
+ 4e-05,
2200
+ 4e-05,
2201
+ 4e-05,
2202
+ 4e-05,
2203
+ 4e-05,
2204
+ 4e-05,
2205
+ 4e-05,
2206
+ 4e-05,
2207
+ 4e-05,
2208
+ 4e-05,
2209
+ 4e-05,
2210
+ 4e-05,
2211
+ 4e-05,
2212
+ 4e-05,
2213
+ 4e-05,
2214
+ 4e-05,
2215
+ 4e-05,
2216
+ 4e-05,
2217
+ 4e-05,
2218
+ 4e-05,
2219
+ 4e-05,
2220
+ 4e-05,
2221
+ 4e-05,
2222
+ 4e-05,
2223
+ 4e-05,
2224
+ 4e-05,
2225
+ 4e-05,
2226
+ 4e-05,
2227
+ 4e-05,
2228
+ 4e-05,
2229
+ 4e-05,
2230
+ 4e-05,
2231
+ 4e-05,
2232
+ 4e-05,
2233
+ 4e-05,
2234
+ 4e-05,
2235
+ 4e-05,
2236
+ 4e-05,
2237
+ 4e-05,
2238
+ 4e-05,
2239
+ 4e-05,
2240
+ 4e-05,
2241
+ 4e-05,
2242
+ 4e-05,
2243
+ 4e-05,
2244
+ 4e-05,
2245
+ 4e-05,
2246
+ 4e-05,
2247
+ 4e-05,
2248
+ 4e-05,
2249
+ 4e-05,
2250
+ 4e-05,
2251
+ 4e-05,
2252
+ 4e-05,
2253
+ 4e-05,
2254
+ 4e-05,
2255
+ 4e-05,
2256
+ 4e-05,
2257
+ 4e-05,
2258
+ 4e-05,
2259
+ 4e-05,
2260
+ 4e-05,
2261
+ 4e-05,
2262
+ 4e-05,
2263
+ 4e-05,
2264
+ 4e-05,
2265
+ 4e-05,
2266
+ 4e-05,
2267
+ 4e-05,
2268
+ 4e-05,
2269
+ 4e-05,
2270
+ 4e-05,
2271
+ 4e-05,
2272
+ 4e-05,
2273
+ 4e-05,
2274
+ 4e-05,
2275
+ 4e-05,
2276
+ 4e-05,
2277
+ 4e-05,
2278
+ 4e-05,
2279
+ 4e-05,
2280
+ 4e-05,
2281
+ 4e-05,
2282
+ 4e-05,
2283
+ 4e-05,
2284
+ 4e-05,
2285
+ 4e-05,
2286
+ 4e-05,
2287
+ 4e-05,
2288
+ 4e-05,
2289
+ 4e-05,
2290
+ 4e-05,
2291
+ 4e-05,
2292
+ 4e-05,
2293
+ 4e-05,
2294
+ 4e-05,
2295
+ 4e-05,
2296
+ 4e-05,
2297
+ 4e-05,
2298
+ 4e-05,
2299
+ 4e-05,
2300
+ 4e-05,
2301
+ 4e-05,
2302
+ 4e-05,
2303
+ 4e-05,
2304
+ 4e-05,
2305
+ 4e-05,
2306
+ 4e-05,
2307
+ 4e-05,
2308
+ 4e-05,
2309
+ 4e-05,
2310
+ 4e-05,
2311
+ 4e-05,
2312
+ 4e-05,
2313
+ 4e-05,
2314
+ 4e-05,
2315
+ 4e-05,
2316
+ 4e-05,
2317
+ 4e-05,
2318
+ 4e-05,
2319
+ 4e-05,
2320
+ 4e-05,
2321
+ 4e-05,
2322
+ 4e-05,
2323
+ 4e-05,
2324
+ 4e-05,
2325
+ 4e-05,
2326
+ 4e-05,
2327
+ 4e-05,
2328
+ 4e-05,
2329
+ 4e-05,
2330
+ 4e-05,
2331
+ 4e-05,
2332
+ 4e-05,
2333
+ 4e-05,
2334
+ 4e-05,
2335
+ 4e-05,
2336
+ 4e-05,
2337
+ 4e-05,
2338
+ 4e-05,
2339
+ 4e-05,
2340
+ 4e-05,
2341
+ 4e-05,
2342
+ 4e-05,
2343
+ 4e-05,
2344
+ 4e-05,
2345
+ 4e-05,
2346
+ 4e-05,
2347
+ 4e-05,
2348
+ 4e-05,
2349
+ 4e-05,
2350
+ 4e-05,
2351
+ 4e-05,
2352
+ 4e-05,
2353
+ 4e-05,
2354
+ 4e-05,
2355
+ 4e-05,
2356
+ 4e-05,
2357
+ 4e-05,
2358
+ 4e-05,
2359
+ 4e-05,
2360
+ 4e-05,
2361
+ 4e-05,
2362
+ 4e-05,
2363
+ 4e-05,
2364
+ 4e-05,
2365
+ 4e-05,
2366
+ 4e-05,
2367
+ 4e-05,
2368
+ 4e-05,
2369
+ 4e-05,
2370
+ 4e-05,
2371
+ 4e-05,
2372
+ 4e-05,
2373
+ 4e-05,
2374
+ 4e-05,
2375
+ 4e-05,
2376
+ 4e-05,
2377
+ 4e-05,
2378
+ 3.992995647012267e-05,
2379
+ 3.963316185199842e-05,
2380
+ 3.933636723387416e-05,
2381
+ 3.90395726157499e-05,
2382
+ 3.874277799762565e-05,
2383
+ 3.844598337950139e-05,
2384
+ 3.814918876137713e-05,
2385
+ 3.785239414325287e-05,
2386
+ 3.7555599525128613e-05,
2387
+ 3.725880490700435e-05,
2388
+ 3.696201028888009e-05,
2389
+ 3.666521567075585e-05,
2390
+ 3.6368421052631585e-05,
2391
+ 3.607162643450732e-05,
2392
+ 3.577483181638307e-05,
2393
+ 3.547803719825881e-05,
2394
+ 3.518124258013455e-05,
2395
+ 3.4884447962010287e-05,
2396
+ 3.458765334388604e-05,
2397
+ 3.4290858725761776e-05,
2398
+ 3.399406410763751e-05,
2399
+ 3.3697269489513265e-05,
2400
+ 3.3400474871389e-05,
2401
+ 3.310368025326474e-05,
2402
+ 3.280688563514048e-05,
2403
+ 3.251009101701623e-05,
2404
+ 3.2213296398891967e-05,
2405
+ 3.191650178076771e-05,
2406
+ 3.1542540561931145e-05,
2407
+ 3.124574594380688e-05,
2408
+ 3.094895132568263e-05,
2409
+ 3.065215670755838e-05,
2410
+ 3.0355362089434113e-05,
2411
+ 3.0058567471309854e-05,
2412
+ 2.97617728531856e-05,
2413
+ 2.9464978235061336e-05,
2414
+ 2.9168183616937077e-05,
2415
+ 2.8871388998812818e-05,
2416
+ 2.857459438068857e-05,
2417
+ 2.8277799762564307e-05,
2418
+ 2.798100514444005e-05,
2419
+ 2.7684210526315793e-05,
2420
+ 2.738741590819153e-05,
2421
+ 2.709062129006727e-05,
2422
+ 2.6793826671943013e-05,
2423
+ 2.6497032053818764e-05,
2424
+ 2.62002374356945e-05,
2425
+ 2.5903442817570243e-05,
2426
+ 2.5606648199445987e-05,
2427
+ 2.5309853581321725e-05,
2428
+ 2.5013058963197466e-05,
2429
+ 2.4716264345073214e-05,
2430
+ 2.441946972694896e-05,
2431
+ 2.4122675108824693e-05,
2432
+ 2.3825880490700434e-05,
2433
+ 2.352908587257618e-05,
2434
+ 2.3232291254451916e-05,
2435
+ 2.293549663632766e-05,
2436
+ 2.2638702018203408e-05,
2437
+ 2.226474079936684e-05,
2438
+ 2.196794618124258e-05,
2439
+ 2.1671151563118328e-05,
2440
+ 2.1374356944994066e-05,
2441
+ 2.1077562326869803e-05,
2442
+ 2.0780767708745554e-05,
2443
+ 2.0483973090621296e-05,
2444
+ 2.018717847249703e-05,
2445
+ 1.989038385437277e-05,
2446
+ 1.959358923624852e-05,
2447
+ 1.929679461812426e-05,
2448
+ 1.8999999999999998e-05,
2449
+ 1.8703205381875746e-05,
2450
+ 1.8406410763751487e-05,
2451
+ 1.8109616145627224e-05,
2452
+ 1.7812821527502965e-05,
2453
+ 1.7516026909378713e-05,
2454
+ 1.7219232291254454e-05,
2455
+ 1.6922437673130192e-05,
2456
+ 1.662564305500594e-05,
2457
+ 1.632884843688168e-05,
2458
+ 1.603205381875742e-05,
2459
+ 1.573525920063316e-05,
2460
+ 1.5438464582508908e-05,
2461
+ 1.5141669964384647e-05,
2462
+ 1.4844875346260385e-05,
2463
+ 1.4548080728136134e-05,
2464
+ 1.4251286110011875e-05,
2465
+ 1.3954491491887611e-05,
2466
+ 1.3657696873763363e-05,
2467
+ 1.33609022556391e-05,
2468
+ 1.298694103680253e-05,
2469
+ 1.2690146418678277e-05,
2470
+ 1.2393351800554018e-05,
2471
+ 1.2096557182429756e-05,
2472
+ 1.1799762564305506e-05,
2473
+ 1.1502967946181245e-05,
2474
+ 1.1206173328056984e-05,
2475
+ 1.0909378709932724e-05,
2476
+ 1.0612584091808472e-05,
2477
+ 1.0315789473684213e-05,
2478
+ 1.0018994855559949e-05,
2479
+ 9.7222002374357e-06,
2480
+ 9.425405619311438e-06,
2481
+ 9.128611001187177e-06,
2482
+ 8.831816383062916e-06,
2483
+ 8.535021764938666e-06,
2484
+ 8.238227146814405e-06,
2485
+ 7.941432528690143e-06,
2486
+ 7.644637910565893e-06,
2487
+ 7.347843292441632e-06,
2488
+ 7.0510486743173715e-06,
2489
+ 6.75425405619311e-06,
2490
+ 6.45745943806886e-06,
2491
+ 6.160664819944598e-06,
2492
+ 5.8638702018203375e-06,
2493
+ 5.567075583696086e-06,
2494
+ 5.270280965571826e-06,
2495
+ 4.973486347447565e-06,
2496
+ 4.676691729323314e-06,
2497
+ 4.379897111199053e-06,
2498
+ 4.083102493074792e-06
2499
+ ],
2500
+ "emb_lr": [],
2501
+ "eval_step": [
2502
+ 1550,
2503
+ 3113,
2504
+ 4676,
2505
+ 6239,
2506
+ 7802,
2507
+ 9365,
2508
+ 10928,
2509
+ 12491,
2510
+ 14054,
2511
+ 15617
2512
+ ],
2513
+ "eval_accuracy": [
2514
+ 0.0,
2515
+ 0.0,
2516
+ 0.0,
2517
+ 0.0,
2518
+ 0.0,
2519
+ 0.0,
2520
+ 0.0,
2521
+ 0.0,
2522
+ 0.0,
2523
+ 0.0
2524
+ ]
2525
+ },
2526
+ "final_accuracy": 0.9858333333333333,
2527
+ "sft_eval": {
2528
+ "config": {
2529
+ "ops": "add_sub",
2530
+ "K": null,
2531
+ "mode": "sft",
2532
+ "n_digits": 6,
2533
+ "n_per_split": 100
2534
+ },
2535
+ "splits": {
2536
+ "add_S0": {
2537
+ "full_accuracy": 1.0,
2538
+ "n_examples": 100,
2539
+ "per_subtask": {
2540
+ "SA": {
2541
+ "accuracy": 1.0,
2542
+ "count": 605
2543
+ },
2544
+ "SS": {
2545
+ "accuracy": 1.0,
2546
+ "count": 95
2547
+ }
2548
+ }
2549
+ },
2550
+ "add_S1": {
2551
+ "full_accuracy": 1.0,
2552
+ "n_examples": 100,
2553
+ "per_subtask": {
2554
+ "SA": {
2555
+ "accuracy": 1.0,
2556
+ "count": 204
2557
+ },
2558
+ "SC": {
2559
+ "accuracy": 1.0,
2560
+ "count": 169
2561
+ },
2562
+ "SS": {
2563
+ "accuracy": 1.0,
2564
+ "count": 31
2565
+ },
2566
+ "UC": {
2567
+ "accuracy": 1.0,
2568
+ "count": 296
2569
+ }
2570
+ }
2571
+ },
2572
+ "add_S2": {
2573
+ "full_accuracy": 1.0,
2574
+ "n_examples": 100,
2575
+ "per_subtask": {
2576
+ "SA": {
2577
+ "accuracy": 1.0,
2578
+ "count": 163
2579
+ },
2580
+ "SC": {
2581
+ "accuracy": 1.0,
2582
+ "count": 130
2583
+ },
2584
+ "SS": {
2585
+ "accuracy": 1.0,
2586
+ "count": 87
2587
+ },
2588
+ "UC": {
2589
+ "accuracy": 1.0,
2590
+ "count": 203
2591
+ },
2592
+ "US": {
2593
+ "accuracy": 1.0,
2594
+ "count": 117
2595
+ }
2596
+ }
2597
+ },
2598
+ "add_S3": {
2599
+ "full_accuracy": 0.99,
2600
+ "n_examples": 100,
2601
+ "per_subtask": {
2602
+ "SA": {
2603
+ "accuracy": 1.0,
2604
+ "count": 121
2605
+ },
2606
+ "SC": {
2607
+ "accuracy": 1.0,
2608
+ "count": 121
2609
+ },
2610
+ "SS": {
2611
+ "accuracy": 1.0,
2612
+ "count": 49
2613
+ },
2614
+ "UC": {
2615
+ "accuracy": 0.9946236559139785,
2616
+ "count": 186
2617
+ },
2618
+ "US": {
2619
+ "accuracy": 1.0,
2620
+ "count": 223
2621
+ }
2622
+ }
2623
+ },
2624
+ "add_S4": {
2625
+ "full_accuracy": 0.88,
2626
+ "n_examples": 100,
2627
+ "per_subtask": {
2628
+ "SA": {
2629
+ "accuracy": 1.0,
2630
+ "count": 104
2631
+ },
2632
+ "SC": {
2633
+ "accuracy": 1.0,
2634
+ "count": 106
2635
+ },
2636
+ "SS": {
2637
+ "accuracy": 1.0,
2638
+ "count": 23
2639
+ },
2640
+ "UC": {
2641
+ "accuracy": 0.925,
2642
+ "count": 160
2643
+ },
2644
+ "US": {
2645
+ "accuracy": 1.0,
2646
+ "count": 307
2647
+ }
2648
+ }
2649
+ },
2650
+ "add_S5": {
2651
+ "full_accuracy": 0.78,
2652
+ "n_examples": 100,
2653
+ "per_subtask": {
2654
+ "SA": {
2655
+ "accuracy": 1.0,
2656
+ "count": 100
2657
+ },
2658
+ "SC": {
2659
+ "accuracy": 1.0,
2660
+ "count": 100
2661
+ },
2662
+ "UC": {
2663
+ "accuracy": 0.84,
2664
+ "count": 100
2665
+ },
2666
+ "US": {
2667
+ "accuracy": 0.955,
2668
+ "count": 400
2669
+ }
2670
+ }
2671
+ },
2672
+ "add_S6": {
2673
+ "full_accuracy": 0.93,
2674
+ "n_examples": 100,
2675
+ "per_subtask": {
2676
+ "SC": {
2677
+ "accuracy": 1.0,
2678
+ "count": 100
2679
+ },
2680
+ "UC": {
2681
+ "accuracy": 0.94,
2682
+ "count": 100
2683
+ },
2684
+ "US": {
2685
+ "accuracy": 0.98,
2686
+ "count": 500
2687
+ }
2688
+ }
2689
+ },
2690
+ "add_random": {
2691
+ "full_accuracy": 0.995,
2692
+ "n_examples": 200,
2693
+ "per_subtask": {
2694
+ "SA": {
2695
+ "accuracy": 1.0,
2696
+ "count": 447
2697
+ },
2698
+ "SC": {
2699
+ "accuracy": 1.0,
2700
+ "count": 320
2701
+ },
2702
+ "SS": {
2703
+ "accuracy": 1.0,
2704
+ "count": 56
2705
+ },
2706
+ "UC": {
2707
+ "accuracy": 0.998109640831758,
2708
+ "count": 529
2709
+ },
2710
+ "US": {
2711
+ "accuracy": 1.0,
2712
+ "count": 48
2713
+ }
2714
+ }
2715
+ },
2716
+ "add_C3": {
2717
+ "full_accuracy": 0.99,
2718
+ "n_examples": 100,
2719
+ "per_subtask": {
2720
+ "SA": {
2721
+ "accuracy": 1.0,
2722
+ "count": 300
2723
+ },
2724
+ "SC": {
2725
+ "accuracy": 1.0,
2726
+ "count": 100
2727
+ },
2728
+ "UC": {
2729
+ "accuracy": 0.9948186528497409,
2730
+ "count": 193
2731
+ },
2732
+ "US": {
2733
+ "accuracy": 1.0,
2734
+ "count": 107
2735
+ }
2736
+ }
2737
+ },
2738
+ "add_C4": {
2739
+ "full_accuracy": 0.98,
2740
+ "n_examples": 100,
2741
+ "per_subtask": {
2742
+ "SA": {
2743
+ "accuracy": 1.0,
2744
+ "count": 200
2745
+ },
2746
+ "SC": {
2747
+ "accuracy": 1.0,
2748
+ "count": 100
2749
+ },
2750
+ "UC": {
2751
+ "accuracy": 0.9921875,
2752
+ "count": 256
2753
+ },
2754
+ "US": {
2755
+ "accuracy": 1.0,
2756
+ "count": 144
2757
+ }
2758
+ }
2759
+ },
2760
+ "add_C5": {
2761
+ "full_accuracy": 0.95,
2762
+ "n_examples": 100,
2763
+ "per_subtask": {
2764
+ "SA": {
2765
+ "accuracy": 1.0,
2766
+ "count": 100
2767
+ },
2768
+ "SC": {
2769
+ "accuracy": 1.0,
2770
+ "count": 100
2771
+ },
2772
+ "UC": {
2773
+ "accuracy": 0.9836601307189542,
2774
+ "count": 306
2775
+ },
2776
+ "US": {
2777
+ "accuracy": 0.9948453608247423,
2778
+ "count": 194
2779
+ }
2780
+ }
2781
+ },
2782
+ "add_C6": {
2783
+ "full_accuracy": 0.98,
2784
+ "n_examples": 100,
2785
+ "per_subtask": {
2786
+ "SC": {
2787
+ "accuracy": 1.0,
2788
+ "count": 100
2789
+ },
2790
+ "UC": {
2791
+ "accuracy": 0.9972677595628415,
2792
+ "count": 366
2793
+ },
2794
+ "US": {
2795
+ "accuracy": 0.9957264957264957,
2796
+ "count": 234
2797
+ }
2798
+ }
2799
+ },
2800
+ "sub_M0": {
2801
+ "full_accuracy": 1.0,
2802
+ "n_examples": 100,
2803
+ "per_subtask": {
2804
+ "MD": {
2805
+ "accuracy": 1.0,
2806
+ "count": 601
2807
+ },
2808
+ "ME": {
2809
+ "accuracy": 1.0,
2810
+ "count": 99
2811
+ }
2812
+ }
2813
+ },
2814
+ "sub_M1": {
2815
+ "full_accuracy": 1.0,
2816
+ "n_examples": 100,
2817
+ "per_subtask": {
2818
+ "MD": {
2819
+ "accuracy": 1.0,
2820
+ "count": 279
2821
+ },
2822
+ "MB": {
2823
+ "accuracy": 1.0,
2824
+ "count": 145
2825
+ },
2826
+ "ME": {
2827
+ "accuracy": 1.0,
2828
+ "count": 24
2829
+ },
2830
+ "UB": {
2831
+ "accuracy": 1.0,
2832
+ "count": 252
2833
+ }
2834
+ }
2835
+ },
2836
+ "sub_M2": {
2837
+ "full_accuracy": 1.0,
2838
+ "n_examples": 100,
2839
+ "per_subtask": {
2840
+ "MD": {
2841
+ "accuracy": 1.0,
2842
+ "count": 213
2843
+ },
2844
+ "MB": {
2845
+ "accuracy": 1.0,
2846
+ "count": 113
2847
+ },
2848
+ "ME": {
2849
+ "accuracy": 1.0,
2850
+ "count": 85
2851
+ },
2852
+ "UB": {
2853
+ "accuracy": 1.0,
2854
+ "count": 181
2855
+ },
2856
+ "UD": {
2857
+ "accuracy": 1.0,
2858
+ "count": 108
2859
+ }
2860
+ }
2861
+ },
2862
+ "sub_M3": {
2863
+ "full_accuracy": 0.95,
2864
+ "n_examples": 100,
2865
+ "per_subtask": {
2866
+ "MD": {
2867
+ "accuracy": 1.0,
2868
+ "count": 179
2869
+ },
2870
+ "MB": {
2871
+ "accuracy": 1.0,
2872
+ "count": 103
2873
+ },
2874
+ "ME": {
2875
+ "accuracy": 1.0,
2876
+ "count": 56
2877
+ },
2878
+ "UB": {
2879
+ "accuracy": 0.9664429530201343,
2880
+ "count": 149
2881
+ },
2882
+ "UD": {
2883
+ "accuracy": 1.0,
2884
+ "count": 213
2885
+ }
2886
+ }
2887
+ },
2888
+ "sub_M4": {
2889
+ "full_accuracy": 0.54,
2890
+ "n_examples": 100,
2891
+ "per_subtask": {
2892
+ "MD": {
2893
+ "accuracy": 1.0,
2894
+ "count": 200
2895
+ },
2896
+ "MB": {
2897
+ "accuracy": 1.0,
2898
+ "count": 100
2899
+ },
2900
+ "UB": {
2901
+ "accuracy": 0.57,
2902
+ "count": 100
2903
+ },
2904
+ "UD": {
2905
+ "accuracy": 0.94,
2906
+ "count": 300
2907
+ }
2908
+ }
2909
+ },
2910
+ "sub_M5": {
2911
+ "full_accuracy": 0.29,
2912
+ "n_examples": 100,
2913
+ "per_subtask": {
2914
+ "MD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 100
2917
+ },
2918
+ "MB": {
2919
+ "accuracy": 1.0,
2920
+ "count": 100
2921
+ },
2922
+ "UB": {
2923
+ "accuracy": 0.38,
2924
+ "count": 100
2925
+ },
2926
+ "UD": {
2927
+ "accuracy": 0.7825,
2928
+ "count": 400
2929
+ }
2930
+ }
2931
+ },
2932
+ "sub_random": {
2933
+ "full_accuracy": 1.0,
2934
+ "n_examples": 200,
2935
+ "per_subtask": {
2936
+ "MD": {
2937
+ "accuracy": 1.0,
2938
+ "count": 600
2939
+ },
2940
+ "MB": {
2941
+ "accuracy": 1.0,
2942
+ "count": 267
2943
+ },
2944
+ "ME": {
2945
+ "accuracy": 1.0,
2946
+ "count": 53
2947
+ },
2948
+ "UB": {
2949
+ "accuracy": 1.0,
2950
+ "count": 439
2951
+ },
2952
+ "UD": {
2953
+ "accuracy": 1.0,
2954
+ "count": 41
2955
+ }
2956
+ }
2957
+ },
2958
+ "sub_B3": {
2959
+ "full_accuracy": 0.92,
2960
+ "n_examples": 100,
2961
+ "per_subtask": {
2962
+ "MD": {
2963
+ "accuracy": 1.0,
2964
+ "count": 300
2965
+ },
2966
+ "MB": {
2967
+ "accuracy": 1.0,
2968
+ "count": 100
2969
+ },
2970
+ "UB": {
2971
+ "accuracy": 0.9593908629441624,
2972
+ "count": 197
2973
+ },
2974
+ "UD": {
2975
+ "accuracy": 1.0,
2976
+ "count": 103
2977
+ }
2978
+ }
2979
+ },
2980
+ "sub_B4": {
2981
+ "full_accuracy": 0.92,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "MD": {
2985
+ "accuracy": 1.0,
2986
+ "count": 200
2987
+ },
2988
+ "MB": {
2989
+ "accuracy": 1.0,
2990
+ "count": 100
2991
+ },
2992
+ "UB": {
2993
+ "accuracy": 0.9676113360323887,
2994
+ "count": 247
2995
+ },
2996
+ "UD": {
2997
+ "accuracy": 0.9803921568627451,
2998
+ "count": 153
2999
+ }
3000
+ }
3001
+ },
3002
+ "sub_B5": {
3003
+ "full_accuracy": 0.93,
3004
+ "n_examples": 100,
3005
+ "per_subtask": {
3006
+ "MD": {
3007
+ "accuracy": 1.0,
3008
+ "count": 100
3009
+ },
3010
+ "MB": {
3011
+ "accuracy": 1.0,
3012
+ "count": 100
3013
+ },
3014
+ "UB": {
3015
+ "accuracy": 0.9832214765100671,
3016
+ "count": 298
3017
+ },
3018
+ "UD": {
3019
+ "accuracy": 0.9752475247524752,
3020
+ "count": 202
3021
+ }
3022
+ }
3023
+ }
3024
+ },
3025
+ "summary": {
3026
+ "overall_accuracy": 0.9170833333333334,
3027
+ "total_examples": 2400,
3028
+ "n_splits": 22
3029
+ }
3030
+ },
3031
+ "sorl_eval": {
3032
+ "config": {
3033
+ "ops": "add_sub",
3034
+ "K": 1,
3035
+ "mode": "sorl",
3036
+ "n_digits": 6,
3037
+ "n_per_split": 100
3038
+ },
3039
+ "splits": {
3040
+ "add_S0": {
3041
+ "full_accuracy": 1.0,
3042
+ "n_examples": 100,
3043
+ "per_subtask": {
3044
+ "SA": {
3045
+ "accuracy": 1.0,
3046
+ "count": 605
3047
+ },
3048
+ "SS": {
3049
+ "accuracy": 1.0,
3050
+ "count": 95
3051
+ }
3052
+ }
3053
+ },
3054
+ "add_S1": {
3055
+ "full_accuracy": 1.0,
3056
+ "n_examples": 100,
3057
+ "per_subtask": {
3058
+ "SA": {
3059
+ "accuracy": 1.0,
3060
+ "count": 204
3061
+ },
3062
+ "SC": {
3063
+ "accuracy": 1.0,
3064
+ "count": 169
3065
+ },
3066
+ "SS": {
3067
+ "accuracy": 1.0,
3068
+ "count": 31
3069
+ },
3070
+ "UC": {
3071
+ "accuracy": 1.0,
3072
+ "count": 296
3073
+ }
3074
+ }
3075
+ },
3076
+ "add_S2": {
3077
+ "full_accuracy": 1.0,
3078
+ "n_examples": 100,
3079
+ "per_subtask": {
3080
+ "SA": {
3081
+ "accuracy": 1.0,
3082
+ "count": 163
3083
+ },
3084
+ "SC": {
3085
+ "accuracy": 1.0,
3086
+ "count": 130
3087
+ },
3088
+ "SS": {
3089
+ "accuracy": 1.0,
3090
+ "count": 87
3091
+ },
3092
+ "UC": {
3093
+ "accuracy": 1.0,
3094
+ "count": 203
3095
+ },
3096
+ "US": {
3097
+ "accuracy": 1.0,
3098
+ "count": 117
3099
+ }
3100
+ }
3101
+ },
3102
+ "add_S3": {
3103
+ "full_accuracy": 1.0,
3104
+ "n_examples": 100,
3105
+ "per_subtask": {
3106
+ "SA": {
3107
+ "accuracy": 1.0,
3108
+ "count": 121
3109
+ },
3110
+ "SC": {
3111
+ "accuracy": 1.0,
3112
+ "count": 121
3113
+ },
3114
+ "SS": {
3115
+ "accuracy": 1.0,
3116
+ "count": 49
3117
+ },
3118
+ "UC": {
3119
+ "accuracy": 1.0,
3120
+ "count": 186
3121
+ },
3122
+ "US": {
3123
+ "accuracy": 1.0,
3124
+ "count": 223
3125
+ }
3126
+ }
3127
+ },
3128
+ "add_S4": {
3129
+ "full_accuracy": 1.0,
3130
+ "n_examples": 100,
3131
+ "per_subtask": {
3132
+ "SA": {
3133
+ "accuracy": 1.0,
3134
+ "count": 104
3135
+ },
3136
+ "SC": {
3137
+ "accuracy": 1.0,
3138
+ "count": 106
3139
+ },
3140
+ "SS": {
3141
+ "accuracy": 1.0,
3142
+ "count": 23
3143
+ },
3144
+ "UC": {
3145
+ "accuracy": 1.0,
3146
+ "count": 160
3147
+ },
3148
+ "US": {
3149
+ "accuracy": 1.0,
3150
+ "count": 307
3151
+ }
3152
+ }
3153
+ },
3154
+ "add_S5": {
3155
+ "full_accuracy": 0.98,
3156
+ "n_examples": 100,
3157
+ "per_subtask": {
3158
+ "SA": {
3159
+ "accuracy": 1.0,
3160
+ "count": 100
3161
+ },
3162
+ "SC": {
3163
+ "accuracy": 1.0,
3164
+ "count": 100
3165
+ },
3166
+ "UC": {
3167
+ "accuracy": 0.98,
3168
+ "count": 100
3169
+ },
3170
+ "US": {
3171
+ "accuracy": 1.0,
3172
+ "count": 400
3173
+ }
3174
+ }
3175
+ },
3176
+ "add_S6": {
3177
+ "full_accuracy": 0.87,
3178
+ "n_examples": 100,
3179
+ "per_subtask": {
3180
+ "SC": {
3181
+ "accuracy": 1.0,
3182
+ "count": 100
3183
+ },
3184
+ "UC": {
3185
+ "accuracy": 0.87,
3186
+ "count": 100
3187
+ },
3188
+ "US": {
3189
+ "accuracy": 0.994,
3190
+ "count": 500
3191
+ }
3192
+ }
3193
+ },
3194
+ "add_random": {
3195
+ "full_accuracy": 1.0,
3196
+ "n_examples": 200,
3197
+ "per_subtask": {
3198
+ "SA": {
3199
+ "accuracy": 1.0,
3200
+ "count": 447
3201
+ },
3202
+ "SC": {
3203
+ "accuracy": 1.0,
3204
+ "count": 320
3205
+ },
3206
+ "SS": {
3207
+ "accuracy": 1.0,
3208
+ "count": 56
3209
+ },
3210
+ "UC": {
3211
+ "accuracy": 1.0,
3212
+ "count": 529
3213
+ },
3214
+ "US": {
3215
+ "accuracy": 1.0,
3216
+ "count": 48
3217
+ }
3218
+ }
3219
+ },
3220
+ "add_C3": {
3221
+ "full_accuracy": 1.0,
3222
+ "n_examples": 100,
3223
+ "per_subtask": {
3224
+ "SA": {
3225
+ "accuracy": 1.0,
3226
+ "count": 300
3227
+ },
3228
+ "SC": {
3229
+ "accuracy": 1.0,
3230
+ "count": 100
3231
+ },
3232
+ "UC": {
3233
+ "accuracy": 1.0,
3234
+ "count": 193
3235
+ },
3236
+ "US": {
3237
+ "accuracy": 1.0,
3238
+ "count": 107
3239
+ }
3240
+ }
3241
+ },
3242
+ "add_C4": {
3243
+ "full_accuracy": 1.0,
3244
+ "n_examples": 100,
3245
+ "per_subtask": {
3246
+ "SA": {
3247
+ "accuracy": 1.0,
3248
+ "count": 200
3249
+ },
3250
+ "SC": {
3251
+ "accuracy": 1.0,
3252
+ "count": 100
3253
+ },
3254
+ "UC": {
3255
+ "accuracy": 1.0,
3256
+ "count": 256
3257
+ },
3258
+ "US": {
3259
+ "accuracy": 1.0,
3260
+ "count": 144
3261
+ }
3262
+ }
3263
+ },
3264
+ "add_C5": {
3265
+ "full_accuracy": 0.99,
3266
+ "n_examples": 100,
3267
+ "per_subtask": {
3268
+ "SA": {
3269
+ "accuracy": 1.0,
3270
+ "count": 100
3271
+ },
3272
+ "SC": {
3273
+ "accuracy": 1.0,
3274
+ "count": 100
3275
+ },
3276
+ "UC": {
3277
+ "accuracy": 0.9967320261437909,
3278
+ "count": 306
3279
+ },
3280
+ "US": {
3281
+ "accuracy": 1.0,
3282
+ "count": 194
3283
+ }
3284
+ }
3285
+ },
3286
+ "add_C6": {
3287
+ "full_accuracy": 1.0,
3288
+ "n_examples": 100,
3289
+ "per_subtask": {
3290
+ "SC": {
3291
+ "accuracy": 1.0,
3292
+ "count": 100
3293
+ },
3294
+ "UC": {
3295
+ "accuracy": 1.0,
3296
+ "count": 366
3297
+ },
3298
+ "US": {
3299
+ "accuracy": 1.0,
3300
+ "count": 234
3301
+ }
3302
+ }
3303
+ },
3304
+ "sub_M0": {
3305
+ "full_accuracy": 1.0,
3306
+ "n_examples": 100,
3307
+ "per_subtask": {
3308
+ "MD": {
3309
+ "accuracy": 1.0,
3310
+ "count": 601
3311
+ },
3312
+ "ME": {
3313
+ "accuracy": 1.0,
3314
+ "count": 99
3315
+ }
3316
+ }
3317
+ },
3318
+ "sub_M1": {
3319
+ "full_accuracy": 1.0,
3320
+ "n_examples": 100,
3321
+ "per_subtask": {
3322
+ "MD": {
3323
+ "accuracy": 1.0,
3324
+ "count": 279
3325
+ },
3326
+ "MB": {
3327
+ "accuracy": 1.0,
3328
+ "count": 145
3329
+ },
3330
+ "ME": {
3331
+ "accuracy": 1.0,
3332
+ "count": 24
3333
+ },
3334
+ "UB": {
3335
+ "accuracy": 1.0,
3336
+ "count": 252
3337
+ }
3338
+ }
3339
+ },
3340
+ "sub_M2": {
3341
+ "full_accuracy": 1.0,
3342
+ "n_examples": 100,
3343
+ "per_subtask": {
3344
+ "MD": {
3345
+ "accuracy": 1.0,
3346
+ "count": 213
3347
+ },
3348
+ "MB": {
3349
+ "accuracy": 1.0,
3350
+ "count": 113
3351
+ },
3352
+ "ME": {
3353
+ "accuracy": 1.0,
3354
+ "count": 85
3355
+ },
3356
+ "UB": {
3357
+ "accuracy": 1.0,
3358
+ "count": 181
3359
+ },
3360
+ "UD": {
3361
+ "accuracy": 1.0,
3362
+ "count": 108
3363
+ }
3364
+ }
3365
+ },
3366
+ "sub_M3": {
3367
+ "full_accuracy": 1.0,
3368
+ "n_examples": 100,
3369
+ "per_subtask": {
3370
+ "MD": {
3371
+ "accuracy": 1.0,
3372
+ "count": 179
3373
+ },
3374
+ "MB": {
3375
+ "accuracy": 1.0,
3376
+ "count": 103
3377
+ },
3378
+ "ME": {
3379
+ "accuracy": 1.0,
3380
+ "count": 56
3381
+ },
3382
+ "UB": {
3383
+ "accuracy": 1.0,
3384
+ "count": 149
3385
+ },
3386
+ "UD": {
3387
+ "accuracy": 1.0,
3388
+ "count": 213
3389
+ }
3390
+ }
3391
+ },
3392
+ "sub_M4": {
3393
+ "full_accuracy": 0.99,
3394
+ "n_examples": 100,
3395
+ "per_subtask": {
3396
+ "MD": {
3397
+ "accuracy": 1.0,
3398
+ "count": 200
3399
+ },
3400
+ "MB": {
3401
+ "accuracy": 1.0,
3402
+ "count": 100
3403
+ },
3404
+ "UB": {
3405
+ "accuracy": 1.0,
3406
+ "count": 100
3407
+ },
3408
+ "UD": {
3409
+ "accuracy": 0.9966666666666667,
3410
+ "count": 300
3411
+ }
3412
+ }
3413
+ },
3414
+ "sub_M5": {
3415
+ "full_accuracy": 0.83,
3416
+ "n_examples": 100,
3417
+ "per_subtask": {
3418
+ "MD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 100
3421
+ },
3422
+ "MB": {
3423
+ "accuracy": 1.0,
3424
+ "count": 100
3425
+ },
3426
+ "UB": {
3427
+ "accuracy": 0.83,
3428
+ "count": 100
3429
+ },
3430
+ "UD": {
3431
+ "accuracy": 1.0,
3432
+ "count": 400
3433
+ }
3434
+ }
3435
+ },
3436
+ "sub_random": {
3437
+ "full_accuracy": 1.0,
3438
+ "n_examples": 200,
3439
+ "per_subtask": {
3440
+ "MD": {
3441
+ "accuracy": 1.0,
3442
+ "count": 600
3443
+ },
3444
+ "MB": {
3445
+ "accuracy": 1.0,
3446
+ "count": 267
3447
+ },
3448
+ "ME": {
3449
+ "accuracy": 1.0,
3450
+ "count": 53
3451
+ },
3452
+ "UB": {
3453
+ "accuracy": 1.0,
3454
+ "count": 439
3455
+ },
3456
+ "UD": {
3457
+ "accuracy": 1.0,
3458
+ "count": 41
3459
+ }
3460
+ }
3461
+ },
3462
+ "sub_B3": {
3463
+ "full_accuracy": 1.0,
3464
+ "n_examples": 100,
3465
+ "per_subtask": {
3466
+ "MD": {
3467
+ "accuracy": 1.0,
3468
+ "count": 300
3469
+ },
3470
+ "MB": {
3471
+ "accuracy": 1.0,
3472
+ "count": 100
3473
+ },
3474
+ "UB": {
3475
+ "accuracy": 1.0,
3476
+ "count": 197
3477
+ },
3478
+ "UD": {
3479
+ "accuracy": 1.0,
3480
+ "count": 103
3481
+ }
3482
+ }
3483
+ },
3484
+ "sub_B4": {
3485
+ "full_accuracy": 1.0,
3486
+ "n_examples": 100,
3487
+ "per_subtask": {
3488
+ "MD": {
3489
+ "accuracy": 1.0,
3490
+ "count": 200
3491
+ },
3492
+ "MB": {
3493
+ "accuracy": 1.0,
3494
+ "count": 100
3495
+ },
3496
+ "UB": {
3497
+ "accuracy": 1.0,
3498
+ "count": 247
3499
+ },
3500
+ "UD": {
3501
+ "accuracy": 1.0,
3502
+ "count": 153
3503
+ }
3504
+ }
3505
+ },
3506
+ "sub_B5": {
3507
+ "full_accuracy": 1.0,
3508
+ "n_examples": 100,
3509
+ "per_subtask": {
3510
+ "MD": {
3511
+ "accuracy": 1.0,
3512
+ "count": 100
3513
+ },
3514
+ "MB": {
3515
+ "accuracy": 1.0,
3516
+ "count": 100
3517
+ },
3518
+ "UB": {
3519
+ "accuracy": 1.0,
3520
+ "count": 298
3521
+ },
3522
+ "UD": {
3523
+ "accuracy": 1.0,
3524
+ "count": 202
3525
+ }
3526
+ }
3527
+ }
3528
+ },
3529
+ "summary": {
3530
+ "overall_accuracy": 0.9858333333333333,
3531
+ "total_examples": 2400,
3532
+ "n_splits": 22
3533
+ }
3534
+ },
3535
+ "sorl_overall_accuracy": 0.9858333333333333,
3536
+ "sft_overall_accuracy": 0.9170833333333334
3537
+ }
add_sub_sorl_v1_abs20_K1_100K/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:00ab15b3dfdae14e16bf2bb7ab9f48696c6c51d2a284e8286fa0c0579ff346da
3
+ size 650344480
add_sub_sorl_v1_abs20_K1_100K/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 1,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 4e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 10,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 1562,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs20_K1_100K",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 2,
61
+ "n_head": 3,
62
+ "n_embd": 510,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 20,
65
+ "dataset_size": 100000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 162509462,
71
+ "run_name": "add_sub_sorl_v1_abs20_K1_100K",
72
+ "git_commit": "f447da529caceac8c7d256cbb2cd185cbc50feac",
73
+ "timestamp": "2026-04-12T09:26:23.026154+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "3jjelhsq",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/3jjelhsq",
81
+ "final_accuracy": 0.9858333333333333,
82
+ "sft_accuracy": 0.9170833333333334,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }