amirali1985 commited on
Commit
5baa93c
·
verified ·
1 Parent(s): f543f14

Upload add_sub_sorl_v1_abs16_K1_100K

Browse files
add_sub_sorl_v1_abs16_K1_100K/config.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 510,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 2040,
15
+ "layer_types": [
16
+ "full_attention",
17
+ "full_attention"
18
+ ],
19
+ "max_position_embeddings": 128,
20
+ "max_window_layers": 28,
21
+ "model_type": "qwen3",
22
+ "num_attention_heads": 3,
23
+ "num_hidden_layers": 2,
24
+ "num_key_value_heads": 3,
25
+ "pad_token_id": null,
26
+ "rms_norm_eps": 1e-06,
27
+ "rope_parameters": {
28
+ "rope_theta": 10000.0,
29
+ "rope_type": "default"
30
+ },
31
+ "sliding_window": null,
32
+ "tie_word_embeddings": false,
33
+ "transformers_version": "5.5.0",
34
+ "use_cache": true,
35
+ "use_sliding_window": false,
36
+ "vocab_size": 151660
37
+ }
add_sub_sorl_v1_abs16_K1_100K/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs16_K1_100K/metrics.json ADDED
@@ -0,0 +1,3537 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 800,
20
+ 850,
21
+ 900,
22
+ 950,
23
+ 1000,
24
+ 1050,
25
+ 1100,
26
+ 1150,
27
+ 1200,
28
+ 1250,
29
+ 1300,
30
+ 1350,
31
+ 1400,
32
+ 1450,
33
+ 1500,
34
+ 1550,
35
+ 1613,
36
+ 1663,
37
+ 1713,
38
+ 1763,
39
+ 1813,
40
+ 1863,
41
+ 1913,
42
+ 1963,
43
+ 2013,
44
+ 2063,
45
+ 2113,
46
+ 2163,
47
+ 2213,
48
+ 2263,
49
+ 2313,
50
+ 2363,
51
+ 2413,
52
+ 2463,
53
+ 2513,
54
+ 2563,
55
+ 2613,
56
+ 2663,
57
+ 2713,
58
+ 2763,
59
+ 2813,
60
+ 2863,
61
+ 2913,
62
+ 2963,
63
+ 3013,
64
+ 3063,
65
+ 3113,
66
+ 3176,
67
+ 3226,
68
+ 3276,
69
+ 3326,
70
+ 3376,
71
+ 3426,
72
+ 3476,
73
+ 3526,
74
+ 3576,
75
+ 3626,
76
+ 3676,
77
+ 3726,
78
+ 3776,
79
+ 3826,
80
+ 3876,
81
+ 3926,
82
+ 3976,
83
+ 4026,
84
+ 4076,
85
+ 4126,
86
+ 4176,
87
+ 4226,
88
+ 4276,
89
+ 4326,
90
+ 4376,
91
+ 4426,
92
+ 4476,
93
+ 4526,
94
+ 4576,
95
+ 4626,
96
+ 4676,
97
+ 4739,
98
+ 4789,
99
+ 4839,
100
+ 4889,
101
+ 4939,
102
+ 4989,
103
+ 5039,
104
+ 5089,
105
+ 5139,
106
+ 5189,
107
+ 5239,
108
+ 5289,
109
+ 5339,
110
+ 5389,
111
+ 5439,
112
+ 5489,
113
+ 5539,
114
+ 5589,
115
+ 5639,
116
+ 5689,
117
+ 5739,
118
+ 5789,
119
+ 5839,
120
+ 5889,
121
+ 5939,
122
+ 5989,
123
+ 6039,
124
+ 6089,
125
+ 6139,
126
+ 6189,
127
+ 6239,
128
+ 6302,
129
+ 6352,
130
+ 6402,
131
+ 6452,
132
+ 6502,
133
+ 6552,
134
+ 6602,
135
+ 6652,
136
+ 6702,
137
+ 6752,
138
+ 6802,
139
+ 6852,
140
+ 6902,
141
+ 6952,
142
+ 7002,
143
+ 7052,
144
+ 7102,
145
+ 7152,
146
+ 7202,
147
+ 7252,
148
+ 7302,
149
+ 7352,
150
+ 7402,
151
+ 7452,
152
+ 7502,
153
+ 7552,
154
+ 7602,
155
+ 7652,
156
+ 7702,
157
+ 7752,
158
+ 7802,
159
+ 7865,
160
+ 7915,
161
+ 7965,
162
+ 8015,
163
+ 8065,
164
+ 8115,
165
+ 8165,
166
+ 8215,
167
+ 8265,
168
+ 8315,
169
+ 8365,
170
+ 8415,
171
+ 8465,
172
+ 8515,
173
+ 8565,
174
+ 8615,
175
+ 8665,
176
+ 8715,
177
+ 8765,
178
+ 8815,
179
+ 8865,
180
+ 8915,
181
+ 8965,
182
+ 9015,
183
+ 9065,
184
+ 9115,
185
+ 9165,
186
+ 9215,
187
+ 9265,
188
+ 9315,
189
+ 9365,
190
+ 9428,
191
+ 9478,
192
+ 9528,
193
+ 9578,
194
+ 9628,
195
+ 9678,
196
+ 9728,
197
+ 9778,
198
+ 9828,
199
+ 9878,
200
+ 9928,
201
+ 9978,
202
+ 10028,
203
+ 10078,
204
+ 10128,
205
+ 10178,
206
+ 10228,
207
+ 10278,
208
+ 10328,
209
+ 10378,
210
+ 10428,
211
+ 10478,
212
+ 10528,
213
+ 10578,
214
+ 10628,
215
+ 10678,
216
+ 10728,
217
+ 10778,
218
+ 10828,
219
+ 10878,
220
+ 10928,
221
+ 10991,
222
+ 11041,
223
+ 11091,
224
+ 11141,
225
+ 11191,
226
+ 11241,
227
+ 11291,
228
+ 11341,
229
+ 11391,
230
+ 11441,
231
+ 11491,
232
+ 11541,
233
+ 11591,
234
+ 11641,
235
+ 11691,
236
+ 11741,
237
+ 11791,
238
+ 11841,
239
+ 11891,
240
+ 11941,
241
+ 11991,
242
+ 12041,
243
+ 12091,
244
+ 12141,
245
+ 12191,
246
+ 12241,
247
+ 12291,
248
+ 12341,
249
+ 12391,
250
+ 12441,
251
+ 12491,
252
+ 12554,
253
+ 12604,
254
+ 12654,
255
+ 12704,
256
+ 12754,
257
+ 12804,
258
+ 12854,
259
+ 12904,
260
+ 12954,
261
+ 13004,
262
+ 13054,
263
+ 13104,
264
+ 13154,
265
+ 13204,
266
+ 13254,
267
+ 13304,
268
+ 13354,
269
+ 13404,
270
+ 13454,
271
+ 13504,
272
+ 13554,
273
+ 13604,
274
+ 13654,
275
+ 13704,
276
+ 13754,
277
+ 13804,
278
+ 13854,
279
+ 13904,
280
+ 13954,
281
+ 14004,
282
+ 14054,
283
+ 14117,
284
+ 14167,
285
+ 14217,
286
+ 14267,
287
+ 14317,
288
+ 14367,
289
+ 14417,
290
+ 14467,
291
+ 14517,
292
+ 14567,
293
+ 14617,
294
+ 14667,
295
+ 14717,
296
+ 14767,
297
+ 14817,
298
+ 14867,
299
+ 14917,
300
+ 14967,
301
+ 15017,
302
+ 15067,
303
+ 15117,
304
+ 15167,
305
+ 15217,
306
+ 15267,
307
+ 15317,
308
+ 15367,
309
+ 15417,
310
+ 15467,
311
+ 15517,
312
+ 15567,
313
+ 15617
314
+ ],
315
+ "loss": [
316
+ 0.5577878952026367,
317
+ -5.576192378997803,
318
+ 2.92632794380188,
319
+ 6.3677544593811035,
320
+ 4.931706428527832,
321
+ 3.444701671600342,
322
+ 2.8243117332458496,
323
+ 2.680835723876953,
324
+ 2.8331117630004883,
325
+ 2.1978397369384766,
326
+ 1.785182237625122,
327
+ -1.0539252758026123,
328
+ -4.413449764251709,
329
+ -4.683836936950684,
330
+ -1.8393806219100952,
331
+ -0.9088308811187744,
332
+ -0.6606338024139404,
333
+ -1.037458896636963,
334
+ -0.8005858659744263,
335
+ -0.8346942663192749,
336
+ -1.2183023691177368,
337
+ -1.3451085090637207,
338
+ -0.7315034866333008,
339
+ -0.8666692972183228,
340
+ -0.9414889216423035,
341
+ -0.8544734716415405,
342
+ -0.5415238738059998,
343
+ -0.672846794128418,
344
+ -0.4627988338470459,
345
+ -0.5561841726303101,
346
+ -0.1339910626411438,
347
+ -0.2756516933441162,
348
+ -0.5867788791656494,
349
+ -0.23007673025131226,
350
+ -0.3725597858428955,
351
+ -0.013699114322662354,
352
+ -0.35232609510421753,
353
+ -0.31320029497146606,
354
+ -0.2628806233406067,
355
+ -0.434626042842865,
356
+ -0.5744713544845581,
357
+ -0.6800232529640198,
358
+ -0.3654564619064331,
359
+ -0.0633208155632019,
360
+ -0.2754508852958679,
361
+ -0.2020871639251709,
362
+ -0.4733316898345947,
363
+ -0.8693190813064575,
364
+ -0.46003156900405884,
365
+ -0.8825334310531616,
366
+ -0.8942903280258179,
367
+ -1.2861601114273071,
368
+ -1.5128978490829468,
369
+ -0.6883290410041809,
370
+ -1.2115806341171265,
371
+ -0.935728907585144,
372
+ -0.6558809280395508,
373
+ -1.1138315200805664,
374
+ -0.9283034205436707,
375
+ -1.3189666271209717,
376
+ -1.0786223411560059,
377
+ -1.179178237915039,
378
+ -1.2783474922180176,
379
+ -0.6550447344779968,
380
+ -0.973206102848053,
381
+ -0.771237850189209,
382
+ -0.9966790080070496,
383
+ -0.6994829773902893,
384
+ -0.7976064085960388,
385
+ -1.0985994338989258,
386
+ -0.5450573563575745,
387
+ -1.087911605834961,
388
+ -0.4879663586616516,
389
+ -0.7040844559669495,
390
+ -0.8600607514381409,
391
+ -0.7831844091415405,
392
+ -0.8913910984992981,
393
+ -0.8135383725166321,
394
+ -0.40366506576538086,
395
+ -0.5484676957130432,
396
+ -0.8509911298751831,
397
+ -0.5910856127738953,
398
+ -0.8854434490203857,
399
+ -1.198923945426941,
400
+ -0.8080556988716125,
401
+ -0.8257648944854736,
402
+ -0.6811696887016296,
403
+ -1.00200617313385,
404
+ -0.5987846851348877,
405
+ -0.85723477602005,
406
+ -1.3445595502853394,
407
+ -0.7796697616577148,
408
+ -0.9819375872612,
409
+ -0.7470568418502808,
410
+ -0.9209647178649902,
411
+ -0.623537540435791,
412
+ -0.8396660089492798,
413
+ -0.6690676212310791,
414
+ -0.5330244898796082,
415
+ -0.8458381295204163,
416
+ -0.9740660786628723,
417
+ -0.678127646446228,
418
+ -0.8426990509033203,
419
+ -0.8173584342002869,
420
+ -0.7635793089866638,
421
+ -0.37154561281204224,
422
+ -0.9728248119354248,
423
+ -0.9165170192718506,
424
+ -0.7311003804206848,
425
+ -0.5706267356872559,
426
+ -0.6835071444511414,
427
+ -0.3656216263771057,
428
+ -0.7594492435455322,
429
+ -0.6943159699440002,
430
+ -0.6790836453437805,
431
+ -0.7314068078994751,
432
+ -0.41682055592536926,
433
+ -0.4713362157344818,
434
+ -0.6050920486450195,
435
+ -0.841689944267273,
436
+ -0.7866406440734863,
437
+ -0.6980839967727661,
438
+ -0.47133585810661316,
439
+ -0.5978288054466248,
440
+ -0.6560570001602173,
441
+ -0.939233124256134,
442
+ -0.5798382759094238,
443
+ -0.48743996024131775,
444
+ -0.47128695249557495,
445
+ -0.8070036172866821,
446
+ -0.5778757333755493,
447
+ -0.22780683636665344,
448
+ -0.667661190032959,
449
+ -0.5630581378936768,
450
+ -0.645453155040741,
451
+ -0.619208574295044,
452
+ -0.5602623820304871,
453
+ -0.5149906873703003,
454
+ -0.7394415140151978,
455
+ -0.41501176357269287,
456
+ -0.579079270362854,
457
+ -0.42966264486312866,
458
+ -0.5831737518310547,
459
+ -0.36663153767585754,
460
+ -0.4568398594856262,
461
+ -0.5816318392753601,
462
+ -0.5446640253067017,
463
+ -0.47866857051849365,
464
+ -0.7518670558929443,
465
+ -0.4315052330493927,
466
+ -0.3823014199733734,
467
+ -0.40160974860191345,
468
+ -0.48745039105415344,
469
+ -0.7215253114700317,
470
+ -0.8161004185676575,
471
+ -0.3937722444534302,
472
+ -0.5529089570045471,
473
+ -0.633216142654419,
474
+ -0.7760704755783081,
475
+ -0.45726412534713745,
476
+ -0.4600589871406555,
477
+ -0.40411585569381714,
478
+ -0.48922643065452576,
479
+ -0.8256374001502991,
480
+ -0.27839645743370056,
481
+ -0.407863974571228,
482
+ -0.39419299364089966,
483
+ -0.5296006798744202,
484
+ -0.3459760546684265,
485
+ -0.4361375570297241,
486
+ -0.5114823579788208,
487
+ -0.3106434643268585,
488
+ -0.2481333464384079,
489
+ -0.3319697082042694,
490
+ -0.18109464645385742,
491
+ -0.5356259942054749,
492
+ -0.4689697027206421,
493
+ -0.5654739141464233,
494
+ -0.47701480984687805,
495
+ -0.419188916683197,
496
+ -0.3699048161506653,
497
+ -0.6753526329994202,
498
+ -0.5219122171401978,
499
+ -0.31527984142303467,
500
+ -0.4246196448802948,
501
+ -0.31242042779922485,
502
+ -0.6311987638473511,
503
+ -0.32913297414779663,
504
+ -0.3731696903705597,
505
+ -0.19184648990631104,
506
+ -0.3655150532722473,
507
+ -0.5271936655044556,
508
+ -0.5268361568450928,
509
+ -0.24535509943962097,
510
+ -0.34898850321769714,
511
+ -0.24170918762683868,
512
+ -0.7559969425201416,
513
+ -0.37633776664733887,
514
+ -0.17248903214931488,
515
+ -0.2222592979669571,
516
+ -0.4376280605792999,
517
+ -0.6540775299072266,
518
+ -0.3511269688606262,
519
+ -0.5187884569168091,
520
+ -0.20915870368480682,
521
+ -0.4059593975543976,
522
+ -0.2472882866859436,
523
+ -0.37154513597488403,
524
+ -0.3132503032684326,
525
+ -0.3342345058917999,
526
+ -0.35975271463394165,
527
+ -0.19919808208942413,
528
+ -0.5088240504264832,
529
+ -0.2929310202598572,
530
+ -0.30848902463912964,
531
+ -0.23250284790992737,
532
+ -0.39344364404678345,
533
+ -0.1125437468290329,
534
+ -0.2144632339477539,
535
+ -0.23171943426132202,
536
+ -0.21659919619560242,
537
+ -0.270476371049881,
538
+ -0.09964442253112793,
539
+ -0.45995014905929565,
540
+ -0.39641156792640686,
541
+ -0.31215667724609375,
542
+ -0.3928333818912506,
543
+ -0.5351556539535522,
544
+ -0.10821276158094406,
545
+ -0.2813533544540405,
546
+ -0.18374423682689667,
547
+ -0.31148767471313477,
548
+ -0.194771870970726,
549
+ -0.17680102586746216,
550
+ -0.15086638927459717,
551
+ -0.2995645999908447,
552
+ -0.06749001145362854,
553
+ -0.3007539212703705,
554
+ -0.2840707302093506,
555
+ -0.20631617307662964,
556
+ -0.37892067432403564,
557
+ -0.1025107353925705,
558
+ -0.4783245325088501,
559
+ -0.09549982100725174,
560
+ -0.049792978912591934,
561
+ -0.15029171109199524,
562
+ -0.38813191652297974,
563
+ -0.3833778500556946,
564
+ -0.1451372355222702,
565
+ -0.29522666335105896,
566
+ -0.21452951431274414,
567
+ -0.17052190005779266,
568
+ -0.21188636124134064,
569
+ -0.09555578976869583,
570
+ -0.04320298880338669,
571
+ -0.2637097239494324,
572
+ -0.10791129618883133,
573
+ -0.2244073450565338,
574
+ -0.22246918082237244,
575
+ -0.0481291189789772,
576
+ -0.15195731818675995,
577
+ -0.0761508047580719,
578
+ -0.18744207918643951,
579
+ -0.06599161773920059,
580
+ -0.13524764776229858,
581
+ -0.24970178306102753,
582
+ -0.27204227447509766,
583
+ -0.06557333469390869,
584
+ -0.05200962722301483,
585
+ -0.11020062863826752,
586
+ -0.082196444272995,
587
+ -0.06147323176264763,
588
+ -0.1582547277212143,
589
+ -0.09557494521141052,
590
+ -0.06250099837779999,
591
+ -0.04475772753357887,
592
+ -0.23515015840530396,
593
+ -0.025078849866986275,
594
+ -0.037300847470760345,
595
+ -0.10369005054235458,
596
+ -0.0211623627692461,
597
+ -0.17572464048862457,
598
+ 0.12815015017986298,
599
+ -0.15703743696212769,
600
+ -0.04601459950208664,
601
+ -0.07747994363307953,
602
+ -0.0768294706940651,
603
+ -0.11141927540302277,
604
+ -0.09336625784635544,
605
+ -0.08718496561050415,
606
+ -0.024220900610089302,
607
+ -0.1684415489435196,
608
+ -0.10317432135343552,
609
+ -0.07274491339921951,
610
+ -0.04384593665599823,
611
+ -0.10860706865787506,
612
+ -0.04664432629942894,
613
+ -0.060206394642591476,
614
+ -0.00010688882321119308,
615
+ -0.16355904936790466,
616
+ -0.001930472906678915,
617
+ 0.0015387262683361769,
618
+ -0.03080066479742527,
619
+ -0.013441846705973148,
620
+ -0.18671223521232605,
621
+ -0.014116063714027405,
622
+ -0.00717591680586338,
623
+ -0.006398052908480167,
624
+ -0.013063499704003334,
625
+ 0.0017607174813747406
626
+ ],
627
+ "base_loss": [
628
+ 11.33397388458252,
629
+ 9.697375297546387,
630
+ 8.228904724121094,
631
+ 6.828713893890381,
632
+ 5.360694885253906,
633
+ 3.647108793258667,
634
+ 2.2145321369171143,
635
+ 2.0256307125091553,
636
+ 1.882012128829956,
637
+ 1.801147222518921,
638
+ 1.808428168296814,
639
+ 1.7667168378829956,
640
+ 1.8179380893707275,
641
+ 1.4938572645187378,
642
+ 1.0333566665649414,
643
+ 0.8400124311447144,
644
+ 0.7365804314613342,
645
+ 0.7016572952270508,
646
+ 0.5986067056655884,
647
+ 0.5793089270591736,
648
+ 0.5988584756851196,
649
+ 0.5955408811569214,
650
+ 0.5806025862693787,
651
+ 0.47322675585746765,
652
+ 0.4693293571472168,
653
+ 0.4685460031032562,
654
+ 0.45813649892807007,
655
+ 0.4436396658420563,
656
+ 0.3591185510158539,
657
+ 0.37346377968788147,
658
+ 0.31526660919189453,
659
+ 0.27813777327537537,
660
+ 0.2814022898674011,
661
+ 0.2628602087497711,
662
+ 0.21686474978923798,
663
+ 0.200835719704628,
664
+ 0.21639907360076904,
665
+ 0.19699202477931976,
666
+ 0.19921962916851044,
667
+ 0.25362253189086914,
668
+ 0.22252197563648224,
669
+ 0.2003440111875534,
670
+ 0.1434318721294403,
671
+ 0.1448654979467392,
672
+ 0.1587533950805664,
673
+ 0.14443540573120117,
674
+ 0.15725888311862946,
675
+ 0.1821482926607132,
676
+ 0.16362155973911285,
677
+ 0.16335923969745636,
678
+ 0.1399972140789032,
679
+ 0.21047517657279968,
680
+ 0.2520601451396942,
681
+ 0.12363635003566742,
682
+ 0.20099785923957825,
683
+ 0.17165043950080872,
684
+ 0.1295781433582306,
685
+ 0.1577463150024414,
686
+ 0.1423770636320114,
687
+ 0.18621452152729034,
688
+ 0.15476252138614655,
689
+ 0.1751738339662552,
690
+ 0.2001466006040573,
691
+ 0.1015189066529274,
692
+ 0.15296132862567902,
693
+ 0.13563570380210876,
694
+ 0.15313532948493958,
695
+ 0.12401551753282547,
696
+ 0.120963454246521,
697
+ 0.1488175392150879,
698
+ 0.1064835861325264,
699
+ 0.1720968335866928,
700
+ 0.11307518929243088,
701
+ 0.11429997533559799,
702
+ 0.11505492776632309,
703
+ 0.12347052991390228,
704
+ 0.11809030920267105,
705
+ 0.10877188295125961,
706
+ 0.12448655813932419,
707
+ 0.09284628182649612,
708
+ 0.12196465581655502,
709
+ 0.0911141186952591,
710
+ 0.1277979016304016,
711
+ 0.1557869166135788,
712
+ 0.10748206079006195,
713
+ 0.1222173348069191,
714
+ 0.10195999592542648,
715
+ 0.12632085382938385,
716
+ 0.09333528578281403,
717
+ 0.1125306561589241,
718
+ 0.20255793631076813,
719
+ 0.10652425140142441,
720
+ 0.12565617263317108,
721
+ 0.08823127299547195,
722
+ 0.112433061003685,
723
+ 0.1077231839299202,
724
+ 0.11770574003458023,
725
+ 0.0980721190571785,
726
+ 0.06952495872974396,
727
+ 0.13095995783805847,
728
+ 0.11997576802968979,
729
+ 0.08410906046628952,
730
+ 0.10747019201517105,
731
+ 0.09736161679029465,
732
+ 0.09167403727769852,
733
+ 0.077176533639431,
734
+ 0.11459974199533463,
735
+ 0.11962968856096268,
736
+ 0.10145970433950424,
737
+ 0.0934385433793068,
738
+ 0.08291459083557129,
739
+ 0.08955997228622437,
740
+ 0.09785062074661255,
741
+ 0.09278756380081177,
742
+ 0.08140374720096588,
743
+ 0.09077442437410355,
744
+ 0.06354185193777084,
745
+ 0.0802765041589737,
746
+ 0.07504796981811523,
747
+ 0.10086948424577713,
748
+ 0.09547056257724762,
749
+ 0.08453293144702911,
750
+ 0.07368914037942886,
751
+ 0.07332005351781845,
752
+ 0.07625468820333481,
753
+ 0.11547034233808517,
754
+ 0.09177985042333603,
755
+ 0.09278776496648788,
756
+ 0.06013501435518265,
757
+ 0.09825111925601959,
758
+ 0.10280166566371918,
759
+ 0.048720959573984146,
760
+ 0.08903590589761734,
761
+ 0.07288584858179092,
762
+ 0.0784422978758812,
763
+ 0.07730279117822647,
764
+ 0.07461636513471603,
765
+ 0.06492268294095993,
766
+ 0.10379330068826675,
767
+ 0.05712369456887245,
768
+ 0.0705806091427803,
769
+ 0.05283525958657265,
770
+ 0.11746769398450851,
771
+ 0.04911088943481445,
772
+ 0.06225346773862839,
773
+ 0.07111300528049469,
774
+ 0.06430380791425705,
775
+ 0.056710679084062576,
776
+ 0.09580206871032715,
777
+ 0.05351073667407036,
778
+ 0.05775975435972214,
779
+ 0.04881032556295395,
780
+ 0.10242227464914322,
781
+ 0.08975668996572495,
782
+ 0.1047421470284462,
783
+ 0.05592641234397888,
784
+ 0.08422555029392242,
785
+ 0.09594937413930893,
786
+ 0.09964465349912643,
787
+ 0.05885830894112587,
788
+ 0.0627526119351387,
789
+ 0.05889914557337761,
790
+ 0.05978791043162346,
791
+ 0.11384613811969757,
792
+ 0.04738619178533554,
793
+ 0.051085881888866425,
794
+ 0.04796541482210159,
795
+ 0.0731235221028328,
796
+ 0.045254748314619064,
797
+ 0.050247080624103546,
798
+ 0.060893941670656204,
799
+ 0.04258085414767265,
800
+ 0.03052467480301857,
801
+ 0.04046378657221794,
802
+ 0.03291342407464981,
803
+ 0.0679231509566307,
804
+ 0.054861005395650864,
805
+ 0.0646156519651413,
806
+ 0.05885514244437218,
807
+ 0.05755404010415077,
808
+ 0.06085504963994026,
809
+ 0.09060827642679214,
810
+ 0.07897806912660599,
811
+ 0.038967352360486984,
812
+ 0.04996843263506889,
813
+ 0.04916781932115555,
814
+ 0.07155297696590424,
815
+ 0.04094274714589119,
816
+ 0.0858810767531395,
817
+ 0.039560504257678986,
818
+ 0.05347173660993576,
819
+ 0.06020087003707886,
820
+ 0.06770100444555283,
821
+ 0.03783196955919266,
822
+ 0.040525078773498535,
823
+ 0.03269848972558975,
824
+ 0.09151533991098404,
825
+ 0.04719338193535805,
826
+ 0.033506568521261215,
827
+ 0.03560910373926163,
828
+ 0.05119560286402702,
829
+ 0.08401036262512207,
830
+ 0.043813493102788925,
831
+ 0.058830466121435165,
832
+ 0.034354109317064285,
833
+ 0.050553202629089355,
834
+ 0.028983136638998985,
835
+ 0.054248273372650146,
836
+ 0.06970725208520889,
837
+ 0.04324648901820183,
838
+ 0.04174510017037392,
839
+ 0.036401160061359406,
840
+ 0.05823252350091934,
841
+ 0.03477806597948074,
842
+ 0.03613588958978653,
843
+ 0.03327057138085365,
844
+ 0.051082976162433624,
845
+ 0.025655852630734444,
846
+ 0.03574183210730553,
847
+ 0.029712524265050888,
848
+ 0.025071779265999794,
849
+ 0.03150422126054764,
850
+ 0.011905641295015812,
851
+ 0.05418887734413147,
852
+ 0.04765428975224495,
853
+ 0.03708108887076378,
854
+ 0.04620677977800369,
855
+ 0.06262367218732834,
856
+ 0.013509207405149937,
857
+ 0.03320235386490822,
858
+ 0.021982263773679733,
859
+ 0.03584248572587967,
860
+ 0.022798042744398117,
861
+ 0.0208269115537405,
862
+ 0.018050367012619972,
863
+ 0.034046467393636703,
864
+ 0.010257250629365444,
865
+ 0.03578177094459534,
866
+ 0.03314688429236412,
867
+ 0.027281632646918297,
868
+ 0.04790187254548073,
869
+ 0.013754768297076225,
870
+ 0.053806185722351074,
871
+ 0.011845839209854603,
872
+ 0.014848830178380013,
873
+ 0.0174210574477911,
874
+ 0.044416483491659164,
875
+ 0.043724652379751205,
876
+ 0.017058920115232468,
877
+ 0.03628867119550705,
878
+ 0.02449323795735836,
879
+ 0.019823655486106873,
880
+ 0.02813252992928028,
881
+ 0.011511008255183697,
882
+ 0.0067415363155305386,
883
+ 0.029995249584317207,
884
+ 0.014533408917486668,
885
+ 0.025971829891204834,
886
+ 0.025442421436309814,
887
+ 0.0151898842304945,
888
+ 0.02171529270708561,
889
+ 0.010393083095550537,
890
+ 0.021415045484900475,
891
+ 0.007882730104029179,
892
+ 0.015499244444072247,
893
+ 0.029081273823976517,
894
+ 0.031534165143966675,
895
+ 0.008034524507820606,
896
+ 0.006916637998074293,
897
+ 0.014973251149058342,
898
+ 0.0100376782938838,
899
+ 0.007728648837655783,
900
+ 0.01831640489399433,
901
+ 0.011213655583560467,
902
+ 0.007832633331418037,
903
+ 0.005861278157681227,
904
+ 0.02696451172232628,
905
+ 0.0031450821552425623,
906
+ 0.004722945392131805,
907
+ 0.012314162217080593,
908
+ 0.0028751466888934374,
909
+ 0.019880356267094612,
910
+ 0.024764133617281914,
911
+ 0.01799626462161541,
912
+ 0.006194784305989742,
913
+ 0.009251789189875126,
914
+ 0.009436463937163353,
915
+ 0.012919851578772068,
916
+ 0.010917981155216694,
917
+ 0.011143622919917107,
918
+ 0.0032752251718193293,
919
+ 0.02041933499276638,
920
+ 0.013105714693665504,
921
+ 0.00845302827656269,
922
+ 0.005595696158707142,
923
+ 0.013482270762324333,
924
+ 0.006255302578210831,
925
+ 0.007237650919705629,
926
+ 0.0008033419726416469,
927
+ 0.0185103602707386,
928
+ 0.0007832656847313046,
929
+ 0.000437746086390689,
930
+ 0.0038669146597385406,
931
+ 0.0022584940306842327,
932
+ 0.021514346823096275,
933
+ 0.002147300634533167,
934
+ 0.0020445866975933313,
935
+ 0.0016196088399738073,
936
+ 0.0020003675017505884,
937
+ 0.00033240352058783174
938
+ ],
939
+ "info_loss": [
940
+ -1.8722295761108398,
941
+ -2.2108302116394043,
942
+ -1.0570645332336426,
943
+ -0.41002845764160156,
944
+ -0.2738471031188965,
945
+ -0.19143915176391602,
946
+ -0.09005904197692871,
947
+ -0.08029019832611084,
948
+ -0.049259066581726074,
949
+ -0.10430407524108887,
950
+ -0.1458674669265747,
951
+ -0.42581772804260254,
952
+ -0.7660454511642456,
953
+ -0.7605015635490417,
954
+ -0.42735755443573,
955
+ -0.3107941746711731,
956
+ -0.2712852656841278,
957
+ -0.3018323481082916,
958
+ -0.2649194598197937,
959
+ -0.2597028911113739,
960
+ -0.29537349939346313,
961
+ -0.3107622563838959,
962
+ -0.24403095245361328,
963
+ -0.24395069479942322,
964
+ -0.24592307209968567,
965
+ -0.23565277457237244,
966
+ -0.20078688859939575,
967
+ -0.2010294795036316,
968
+ -0.16992546617984772,
969
+ -0.18197181820869446,
970
+ -0.12281505763530731,
971
+ -0.12788164615631104,
972
+ -0.15659582614898682,
973
+ -0.11880415678024292,
974
+ -0.1262507140636444,
975
+ -0.08458173274993896,
976
+ -0.11665385216474533,
977
+ -0.11172604560852051,
978
+ -0.10635123401880264,
979
+ -0.1264892965555191,
980
+ -0.1336090862751007,
981
+ -0.13750332593917847,
982
+ -0.10439354181289673,
983
+ -0.06636995077133179,
984
+ -0.08734632283449173,
985
+ -0.07475010305643082,
986
+ -0.09220811724662781,
987
+ -0.137499138712883,
988
+ -0.09056003391742706,
989
+ -0.11914384365081787,
990
+ -0.11546589434146881,
991
+ -0.1596410572528839,
992
+ -0.1853722631931305,
993
+ -0.08901497721672058,
994
+ -0.14770330488681793,
995
+ -0.11823290586471558,
996
+ -0.08599165827035904,
997
+ -0.13189618289470673,
998
+ -0.11319698393344879,
999
+ -0.15432821214199066,
1000
+ -0.12706328928470612,
1001
+ -0.13852959871292114,
1002
+ -0.1510118544101715,
1003
+ -0.07841464132070541,
1004
+ -0.11543506383895874,
1005
+ -0.09320459514856339,
1006
+ -0.11888302117586136,
1007
+ -0.084896519780159,
1008
+ -0.09416110813617706,
1009
+ -0.12740209698677063,
1010
+ -0.06747395545244217,
1011
+ -0.12878276407718658,
1012
+ -0.06240946054458618,
1013
+ -0.08402750641107559,
1014
+ -0.099144347012043,
1015
+ -0.09311512112617493,
1016
+ -0.10234177857637405,
1017
+ -0.09399470686912537,
1018
+ -0.054853230714797974,
1019
+ -0.06678619980812073,
1020
+ -0.09873295575380325,
1021
+ -0.06962869316339493,
1022
+ -0.10274700820446014,
1023
+ -0.1372026950120926,
1024
+ -0.09274651855230331,
1025
+ -0.09610535204410553,
1026
+ -0.07988561689853668,
1027
+ -0.11397822946310043,
1028
+ -0.07051478326320648,
1029
+ -0.09783930331468582,
1030
+ -0.1560787409543991,
1031
+ -0.0905139222741127,
1032
+ -0.11244180053472519,
1033
+ -0.08502411842346191,
1034
+ -0.10473114252090454,
1035
+ -0.07410141825675964,
1036
+ -0.09664714336395264,
1037
+ -0.07763437181711197,
1038
+ -0.06174994260072708,
1039
+ -0.09884490072727203,
1040
+ -0.1106635257601738,
1041
+ -0.07729820907115936,
1042
+ -0.09621607512235641,
1043
+ -0.09244702011346817,
1044
+ -0.08659424632787704,
1045
+ -0.04580191895365715,
1046
+ -0.10990729928016663,
1047
+ -0.10430049151182175,
1048
+ -0.08413095772266388,
1049
+ -0.06764105707406998,
1050
+ -0.07739929109811783,
1051
+ -0.04647885635495186,
1052
+ -0.08686721324920654,
1053
+ -0.0795186385512352,
1054
+ -0.07688325643539429,
1055
+ -0.08349419385194778,
1056
+ -0.04904802143573761,
1057
+ -0.05629279464483261,
1058
+ -0.06858016550540924,
1059
+ -0.09524913877248764,
1060
+ -0.08893893659114838,
1061
+ -0.07907679677009583,
1062
+ -0.055403802543878555,
1063
+ -0.06796155124902725,
1064
+ -0.07397491484880447,
1065
+ -0.10638416558504105,
1066
+ -0.06868835538625717,
1067
+ -0.05880892649292946,
1068
+ -0.05406094342470169,
1069
+ -0.09153366833925247,
1070
+ -0.06931941211223602,
1071
+ -0.02864447981119156,
1072
+ -0.0771365761756897,
1073
+ -0.06434978544712067,
1074
+ -0.0733770877122879,
1075
+ -0.07072990387678146,
1076
+ -0.064170703291893,
1077
+ -0.05894353985786438,
1078
+ -0.08493777364492416,
1079
+ -0.04775642231106758,
1080
+ -0.06566251069307327,
1081
+ -0.048874225467443466,
1082
+ -0.07127480208873749,
1083
+ -0.042416784912347794,
1084
+ -0.05257882922887802,
1085
+ -0.06578890979290009,
1086
+ -0.06188692897558212,
1087
+ -0.054064612835645676,
1088
+ -0.08549480140209198,
1089
+ -0.049428876489400864,
1090
+ -0.04480578005313873,
1091
+ -0.045844681560993195,
1092
+ -0.05952483043074608,
1093
+ -0.08181554824113846,
1094
+ -0.09271662682294846,
1095
+ -0.04931681230664253,
1096
+ -0.0682697519659996,
1097
+ -0.07777585089206696,
1098
+ -0.09169674664735794,
1099
+ -0.05585508048534393,
1100
+ -0.056745074689388275,
1101
+ -0.0498771034181118,
1102
+ -0.056404877454042435,
1103
+ -0.09470423310995102,
1104
+ -0.03340289741754532,
1105
+ -0.04667876660823822,
1106
+ -0.04499981179833412,
1107
+ -0.06113607436418533,
1108
+ -0.04001234471797943,
1109
+ -0.04945958033204079,
1110
+ -0.05818415805697441,
1111
+ -0.03627463057637215,
1112
+ -0.028624065220355988,
1113
+ -0.03772645443677902,
1114
+ -0.02219102531671524,
1115
+ -0.06100322678685188,
1116
+ -0.05316488817334175,
1117
+ -0.06359907239675522,
1118
+ -0.05425305664539337,
1119
+ -0.04845690354704857,
1120
+ -0.04391637444496155,
1121
+ -0.07734991610050201,
1122
+ -0.06084549427032471,
1123
+ -0.03645513951778412,
1124
+ -0.048169709742069244,
1125
+ -0.036919742822647095,
1126
+ -0.07092147320508957,
1127
+ -0.03750623017549515,
1128
+ -0.04641468822956085,
1129
+ -0.02410457655787468,
1130
+ -0.04249722138047218,
1131
+ -0.05939014256000519,
1132
+ -0.06024573743343353,
1133
+ -0.0289095938205719,
1134
+ -0.039603594690561295,
1135
+ -0.02823018841445446,
1136
+ -0.0855451449751854,
1137
+ -0.04393450543284416,
1138
+ -0.021329475566744804,
1139
+ -0.02656519040465355,
1140
+ -0.049449898302555084,
1141
+ -0.07447291165590286,
1142
+ -0.04019889980554581,
1143
+ -0.05821258947253227,
1144
+ -0.024868115782737732,
1145
+ -0.04655325040221214,
1146
+ -0.02830430492758751,
1147
+ -0.043234482407569885,
1148
+ -0.03885981813073158,
1149
+ -0.038678355515003204,
1150
+ -0.041147783398628235,
1151
+ -0.024361640214920044,
1152
+ -0.05759088695049286,
1153
+ -0.03391062095761299,
1154
+ -0.03501441702246666,
1155
+ -0.02738049626350403,
1156
+ -0.045669812709093094,
1157
+ -0.014750971458852291,
1158
+ -0.026065301150083542,
1159
+ -0.027000879868865013,
1160
+ -0.02488401159644127,
1161
+ -0.031408023089170456,
1162
+ -0.01161701139062643,
1163
+ -0.05200820788741112,
1164
+ -0.046356432139873505,
1165
+ -0.03545088320970535,
1166
+ -0.0444461815059185,
1167
+ -0.06045794486999512,
1168
+ -0.013400518335402012,
1169
+ -0.0324067659676075,
1170
+ -0.021174244582653046,
1171
+ -0.035626500844955444,
1172
+ -0.022704709321260452,
1173
+ -0.020717144012451172,
1174
+ -0.01795428805053234,
1175
+ -0.0339086651802063,
1176
+ -0.00871788989752531,
1177
+ -0.03418224677443504,
1178
+ -0.03249115124344826,
1179
+ -0.023991618305444717,
1180
+ -0.043025609105825424,
1181
+ -0.012155727483332157,
1182
+ -0.05362624302506447,
1183
+ -0.011768711730837822,
1184
+ -0.00748388422653079,
1185
+ -0.017160627990961075,
1186
+ -0.044271551072597504,
1187
+ -0.04344240203499794,
1188
+ -0.016890574246644974,
1189
+ -0.03395989164710045,
1190
+ -0.02439269982278347,
1191
+ -0.019768577069044113,
1192
+ -0.024975083768367767,
1193
+ -0.011333119124174118,
1194
+ -0.005900434218347073,
1195
+ -0.02994467318058014,
1196
+ -0.013382021337747574,
1197
+ -0.025662653148174286,
1198
+ -0.025401990860700607,
1199
+ -0.006823656149208546,
1200
+ -0.018227649852633476,
1201
+ -0.009130764752626419,
1202
+ -0.02137848362326622,
1203
+ -0.007732507772743702,
1204
+ -0.015459390357136726,
1205
+ -0.028814582154154778,
1206
+ -0.031098704785108566,
1207
+ -0.007990011014044285,
1208
+ -0.006862882524728775,
1209
+ -0.013380587100982666,
1210
+ -0.009976633824408054,
1211
+ -0.007156243547797203,
1212
+ -0.018262408673763275,
1213
+ -0.011157645843923092,
1214
+ -0.007779450621455908,
1215
+ -0.005826402921229601,
1216
+ -0.026892339810729027,
1217
+ -0.0030956417322158813,
1218
+ -0.0046788109466433525,
1219
+ -0.012022721581161022,
1220
+ -0.002801282564178109,
1221
+ -0.01982787251472473,
1222
+ 0.009974746033549309,
1223
+ -0.017948439344763756,
1224
+ -0.0061605749651789665,
1225
+ -0.009149443358182907,
1226
+ -0.00940472912043333,
1227
+ -0.012833412736654282,
1228
+ -0.010864147916436195,
1229
+ -0.010289489291608334,
1230
+ -0.00324008846655488,
1231
+ -0.019436735659837723,
1232
+ -0.012104923836886883,
1233
+ -0.008401187136769295,
1234
+ -0.005556115880608559,
1235
+ -0.013448841869831085,
1236
+ -0.006224552169442177,
1237
+ -0.007203326560556889,
1238
+ -0.000765089935157448,
1239
+ -0.018467390909790993,
1240
+ -0.0007461291970685124,
1241
+ -0.00041246030014008284,
1242
+ -0.0038027395494282246,
1243
+ -0.0021796596702188253,
1244
+ -0.021332552656531334,
1245
+ -0.002122311620041728,
1246
+ -0.002004181733354926,
1247
+ -0.0015925208572298288,
1248
+ -0.001970382872968912,
1249
+ -0.0003019475843757391
1250
+ ],
1251
+ "abs_loss": [
1252
+ 2.7695558071136475,
1253
+ 2.757258176803589,
1254
+ 2.714398145675659,
1255
+ 2.612370729446411,
1256
+ 2.4649007320404053,
1257
+ 2.323071002960205,
1258
+ 2.273024797439575,
1259
+ 2.2605059146881104,
1260
+ 2.2603180408477783,
1261
+ 2.263150453567505,
1262
+ 2.2445919513702393,
1263
+ 2.252319097518921,
1264
+ 2.178196907043457,
1265
+ 2.1821935176849365,
1266
+ 1.9552990198135376,
1267
+ 1.826480746269226,
1268
+ 1.7979575395584106,
1269
+ 1.5754321813583374,
1270
+ 1.51059091091156,
1271
+ 1.3168487548828125,
1272
+ 1.2136815786361694,
1273
+ 1.1017318964004517,
1274
+ 1.0320855379104614,
1275
+ 0.9946089386940002,
1276
+ 0.9091302752494812,
1277
+ 0.9446201920509338,
1278
+ 0.826180636882782,
1279
+ 0.8360268473625183,
1280
+ 0.7732840180397034,
1281
+ 0.6978147625923157,
1282
+ 0.7105684280395508,
1283
+ 0.6442034244537354,
1284
+ 0.6352532505989075,
1285
+ 0.5988442301750183,
1286
+ 0.5720152854919434,
1287
+ 0.6041375994682312,
1288
+ 0.5219680666923523,
1289
+ 0.505420982837677,
1290
+ 0.4944639205932617,
1291
+ 0.5343429446220398,
1292
+ 0.4464101791381836,
1293
+ 0.4692588746547699,
1294
+ 0.41510966420173645,
1295
+ 0.3662830889225006,
1296
+ 0.37847068905830383,
1297
+ 0.3181345760822296,
1298
+ 0.3445536196231842,
1299
+ 0.35482969880104065,
1300
+ 0.355588436126709,
1301
+ 0.3673471510410309,
1302
+ 0.3439052104949951,
1303
+ 0.2908039391040802,
1304
+ 0.32127058506011963,
1305
+ 0.2832740247249603,
1306
+ 0.27703914046287537,
1307
+ 0.23231802880764008,
1308
+ 0.24343381822109222,
1309
+ 0.24540118873119354,
1310
+ 0.19612455368041992,
1311
+ 0.17661559581756592,
1312
+ 0.22358156740665436,
1313
+ 0.16401363909244537,
1314
+ 0.18624664843082428,
1315
+ 0.15092390775680542,
1316
+ 0.15065866708755493,
1317
+ 0.13049976527690887,
1318
+ 0.11838517338037491,
1319
+ 0.11917757987976074,
1320
+ 0.13449154794216156,
1321
+ 0.11397969722747803,
1322
+ 0.13762305676937103,
1323
+ 0.13600696623325348,
1324
+ 0.11815961450338364,
1325
+ 0.11022745817899704,
1326
+ 0.07655175775289536,
1327
+ 0.09835848957300186,
1328
+ 0.09699732065200806,
1329
+ 0.08222716301679611,
1330
+ 0.06970739364624023,
1331
+ 0.07540616393089294,
1332
+ 0.07638673484325409,
1333
+ 0.07543123513460159,
1334
+ 0.06136744096875191,
1335
+ 0.07297835499048233,
1336
+ 0.06406604498624802,
1337
+ 0.06371459364891052,
1338
+ 0.05812959372997284,
1339
+ 0.06946182996034622,
1340
+ 0.04413483664393425,
1341
+ 0.05052522197365761,
1342
+ 0.060342367738485336,
1343
+ 0.07218147814273834,
1344
+ 0.05116567015647888,
1345
+ 0.05598502233624458,
1346
+ 0.04631705582141876,
1347
+ 0.03574751690030098,
1348
+ 0.055087048560380936,
1349
+ 0.04298175871372223,
1350
+ 0.05066549405455589,
1351
+ 0.04147268459200859,
1352
+ 0.0408233143389225,
1353
+ 0.045503806322813034,
1354
+ 0.03884589299559593,
1355
+ 0.04656253755092621,
1356
+ 0.03495315834879875,
1357
+ 0.03418383374810219,
1358
+ 0.02620612643659115,
1359
+ 0.03293178603053093,
1360
+ 0.030975719913840294,
1361
+ 0.044921740889549255,
1362
+ 0.04072905704379082,
1363
+ 0.0342169813811779,
1364
+ 0.02957664616405964,
1365
+ 0.03389245644211769,
1366
+ 0.023984842002391815,
1367
+ 0.01984020136296749,
1368
+ 0.03859636187553406,
1369
+ 0.04447132349014282,
1370
+ 0.017740679904818535,
1371
+ 0.03720969334244728,
1372
+ 0.019728712737560272,
1373
+ 0.01769821159541607,
1374
+ 0.021987849846482277,
1375
+ 0.0190268624573946,
1376
+ 0.016939802095294,
1377
+ 0.026036595925688744,
1378
+ 0.03319808840751648,
1379
+ 0.029679646715521812,
1380
+ 0.015514916740357876,
1381
+ 0.025532612577080727,
1382
+ 0.024698758497834206,
1383
+ 0.028365038335323334,
1384
+ 0.03000704012811184,
1385
+ 0.015057776123285294,
1386
+ 0.0270793866366148,
1387
+ 0.01922013610601425,
1388
+ 0.016823092475533485,
1389
+ 0.02009473741054535,
1390
+ 0.02750399149954319,
1391
+ 0.026774728670716286,
1392
+ 0.02902131713926792,
1393
+ 0.026612574234604836,
1394
+ 0.019634006544947624,
1395
+ 0.021729981526732445,
1396
+ 0.025850391015410423,
1397
+ 0.023152805864810944,
1398
+ 0.017385335639119148,
1399
+ 0.01789049804210663,
1400
+ 0.02443535067141056,
1401
+ 0.017224645242094994,
1402
+ 0.01826273463666439,
1403
+ 0.02485678531229496,
1404
+ 0.01320267841219902,
1405
+ 0.010790318250656128,
1406
+ 0.01471333485096693,
1407
+ 0.024667000398039818,
1408
+ 0.020168118178844452,
1409
+ 0.01574580743908882,
1410
+ 0.011433619074523449,
1411
+ 0.014809876680374146,
1412
+ 0.023700252175331116,
1413
+ 0.010335405357182026,
1414
+ 0.017168136313557625,
1415
+ 0.0254232045263052,
1416
+ 0.023459458723664284,
1417
+ 0.014551951549947262,
1418
+ 0.025152841582894325,
1419
+ 0.018016614019870758,
1420
+ 0.017615744844079018,
1421
+ 0.008140993304550648,
1422
+ 0.010460898280143738,
1423
+ 0.01902330107986927,
1424
+ 0.014583222568035126,
1425
+ 0.018572388216853142,
1426
+ 0.02234470844268799,
1427
+ 0.011642231605947018,
1428
+ 0.016363034024834633,
1429
+ 0.015224513597786427,
1430
+ 0.018041061237454414,
1431
+ 0.016325196251273155,
1432
+ 0.022254878655076027,
1433
+ 0.012667966075241566,
1434
+ 0.011075119487941265,
1435
+ 0.01190368551760912,
1436
+ 0.018234197050333023,
1437
+ 0.01418225932866335,
1438
+ 0.012023826129734516,
1439
+ 0.010663360357284546,
1440
+ 0.01986275613307953,
1441
+ 0.008102544583380222,
1442
+ 0.01361160445958376,
1443
+ 0.006008542608469725,
1444
+ 0.01946125365793705,
1445
+ 0.016349898651242256,
1446
+ 0.0203538965433836,
1447
+ 0.008983378298580647,
1448
+ 0.0072066509164869785,
1449
+ 0.009305398911237717,
1450
+ 0.013738664798438549,
1451
+ 0.008193968795239925,
1452
+ 0.006817294750362635,
1453
+ 0.009356106631457806,
1454
+ 0.009478329680860043,
1455
+ 0.011687666177749634,
1456
+ 0.01932637393474579,
1457
+ 0.022637570276856422,
1458
+ 0.01438119262456894,
1459
+ 0.012074408121407032,
1460
+ 0.011916994117200375,
1461
+ 0.011993207968771458,
1462
+ 0.013026487082242966,
1463
+ 0.012276235036551952,
1464
+ 0.02072794921696186,
1465
+ 0.0105925677344203,
1466
+ 0.01057432685047388,
1467
+ 0.010463658720254898,
1468
+ 0.02401764504611492,
1469
+ 0.00971772987395525,
1470
+ 0.01738486997783184,
1471
+ 0.0072584873996675014,
1472
+ 0.008841030299663544,
1473
+ 0.015144255943596363,
1474
+ 0.009510762058198452,
1475
+ 0.004616790451109409,
1476
+ 0.005089740734547377,
1477
+ 0.0033849384635686874,
1478
+ 0.009031621739268303,
1479
+ 0.0070746722631156445,
1480
+ 0.0038986431900411844,
1481
+ 0.014924501068890095,
1482
+ 0.005439704284071922,
1483
+ 0.012228280305862427,
1484
+ 0.006074471864849329,
1485
+ 0.0041548931039869785,
1486
+ 0.0036205865908414125,
1487
+ 0.003559892298653722,
1488
+ 0.0030162332113832235,
1489
+ 0.00596613110974431,
1490
+ 0.0046607633121311665,
1491
+ 0.00393908703699708,
1492
+ 0.008519414812326431,
1493
+ 0.008389890193939209,
1494
+ 0.004085652995854616,
1495
+ 0.0039666821248829365,
1496
+ 0.0025419110897928476,
1497
+ 0.004632981959730387,
1498
+ 0.003359271213412285,
1499
+ 0.006698184181004763,
1500
+ 0.0010022107744589448,
1501
+ 0.005775243043899536,
1502
+ 0.0029002123046666384,
1503
+ 0.0070551130920648575,
1504
+ 0.0052612400613725185,
1505
+ 0.005106158088892698,
1506
+ 0.007022228091955185,
1507
+ 0.004999684169888496,
1508
+ 0.022510403767228127,
1509
+ 0.007338444236665964,
1510
+ 0.003092102939262986,
1511
+ 0.003852828638628125,
1512
+ 0.007366009056568146,
1513
+ 0.002055574906989932,
1514
+ 0.002716584363952279,
1515
+ 0.004305695649236441,
1516
+ 0.0008842918905429542,
1517
+ 0.0020649160724133253,
1518
+ 0.00220546405762434,
1519
+ 0.0045172651298344135,
1520
+ 0.002134924754500389,
1521
+ 0.00198660627938807,
1522
+ 0.002547383075580001,
1523
+ 0.0018582269549369812,
1524
+ 0.004609962459653616,
1525
+ 0.0029482373502105474,
1526
+ 0.001209548208862543,
1527
+ 0.0038016096223145723,
1528
+ 0.0022803116589784622,
1529
+ 0.0009680527145974338,
1530
+ 0.0047198208048939705,
1531
+ 0.0018950551748275757,
1532
+ 0.002245184499770403,
1533
+ 0.004644941072911024,
1534
+ 0.003991647623479366,
1535
+ 0.00459820544347167,
1536
+ 0.003601460950449109,
1537
+ 0.0033293275628238916,
1538
+ 0.0008270890102721751,
1539
+ 0.0011858651414513588,
1540
+ 0.00523713231086731,
1541
+ 0.003144143847748637,
1542
+ 0.0052079614251852036,
1543
+ 0.0006806037272326648,
1544
+ 0.0058856843970716,
1545
+ 0.0013082782970741391,
1546
+ 0.0019983849488198757,
1547
+ 0.0007600346580147743,
1548
+ 0.0013144537806510925,
1549
+ 0.003953778184950352,
1550
+ 0.0017438801005482674,
1551
+ 0.0006400617421604693,
1552
+ 0.0023446576669812202,
1553
+ 0.005105599295347929,
1554
+ 0.0012087664799764752,
1555
+ 0.001198558951728046,
1556
+ 0.001190866343677044,
1557
+ 0.0010707571636885405,
1558
+ 0.004463807214051485,
1559
+ 0.0012607508106157184,
1560
+ 0.0013424685457721353,
1561
+ 0.0005274586728774011
1562
+ ],
1563
+ "zipf_loss": [
1564
+ 7.669154167175293,
1565
+ 6.559010028839111,
1566
+ 4.996628761291504,
1567
+ 3.3780879974365234,
1568
+ 2.062992572784424,
1569
+ 1.479677438735962,
1570
+ 1.2830677032470703,
1571
+ 1.2320564985275269,
1572
+ 1.2176584005355835,
1573
+ 1.2134181261062622,
1574
+ 1.2109695672988892,
1575
+ 1.2123031616210938,
1576
+ 1.211247444152832,
1577
+ 1.2091020345687866,
1578
+ 1.2053085565567017,
1579
+ 1.1764500141143799,
1580
+ 1.1358428001403809,
1581
+ 1.121664047241211,
1582
+ 1.0989431142807007,
1583
+ 1.0513408184051514,
1584
+ 1.015205979347229,
1585
+ 1.0567998886108398,
1586
+ 1.0249948501586914,
1587
+ 1.0001500844955444,
1588
+ 0.9574993252754211,
1589
+ 0.9390462636947632,
1590
+ 0.9255902171134949,
1591
+ 0.8102058172225952,
1592
+ 0.8000087738037109,
1593
+ 0.8202887773513794,
1594
+ 0.7078360915184021,
1595
+ 0.6606066226959229,
1596
+ 0.6342517137527466,
1597
+ 0.6352202296257019,
1598
+ 0.6158812046051025,
1599
+ 0.570868730545044,
1600
+ 0.5456165075302124,
1601
+ 0.5565260052680969,
1602
+ 0.5519656538963318,
1603
+ 0.5232100486755371,
1604
+ 0.49445641040802,
1605
+ 0.4477401375770569,
1606
+ 0.493536114692688,
1607
+ 0.41888487339019775,
1608
+ 0.40141189098358154,
1609
+ 0.36916500329971313,
1610
+ 0.2570352554321289,
1611
+ 0.28804102540016174,
1612
+ 0.24638836085796356,
1613
+ 0.10881100594997406,
1614
+ 0.0859808400273323,
1615
+ 0.07069482654333115,
1616
+ 0.056637559086084366,
1617
+ 0.04985696077346802,
1618
+ 0.03675064444541931,
1619
+ 0.05171795189380646,
1620
+ 0.05011414363980293,
1621
+ 0.02284391038119793,
1622
+ 0.041676875203847885,
1623
+ 0.020439328625798225,
1624
+ 0.014889881014823914,
1625
+ 0.01454250980168581,
1626
+ 0.012999804690480232,
1627
+ 0.012490401044487953,
1628
+ 0.013117315247654915,
1629
+ 0.0121223796159029,
1630
+ 0.02717740461230278,
1631
+ 0.01354890689253807,
1632
+ 0.009592078626155853,
1633
+ 0.015205960720777512,
1634
+ 0.009436314925551414,
1635
+ 0.014218422584235668,
1636
+ 0.011237069964408875,
1637
+ 0.010867897421121597,
1638
+ 0.008672598749399185,
1639
+ 0.014660419896245003,
1640
+ 0.004236647393554449,
1641
+ 0.009414155967533588,
1642
+ 0.0134099330753088,
1643
+ 0.019007394090294838,
1644
+ 0.006735099479556084,
1645
+ 0.006544078700244427,
1646
+ 0.008092062547802925,
1647
+ 0.010018263943493366,
1648
+ 0.005520849488675594,
1649
+ 0.006699803285300732,
1650
+ 0.009913476184010506,
1651
+ 0.004509104415774345,
1652
+ 0.008614420890808105,
1653
+ 0.0035750919487327337,
1654
+ 0.0076357703655958176,
1655
+ 0.011727109551429749,
1656
+ 0.011707671917974949,
1657
+ 0.009354616515338421,
1658
+ 0.009281913749873638,
1659
+ 0.006178762763738632,
1660
+ 0.0035909400321543217,
1661
+ 0.004905794281512499,
1662
+ 0.009883398190140724,
1663
+ 0.007503582630306482,
1664
+ 0.008511064574122429,
1665
+ 0.006195032503455877,
1666
+ 0.00810689851641655,
1667
+ 0.005093861371278763,
1668
+ 0.007193814031779766,
1669
+ 0.005878657102584839,
1670
+ 0.009027732536196709,
1671
+ 0.0035650311037898064,
1672
+ 0.00565190427005291,
1673
+ 0.00785311870276928,
1674
+ 0.0034982417710125446,
1675
+ 0.006185278296470642,
1676
+ 0.008414627984166145,
1677
+ 0.00469360314309597,
1678
+ 0.0059466976672410965,
1679
+ 0.010776687413454056,
1680
+ 0.006258154287934303,
1681
+ 0.006868111900985241,
1682
+ 0.0038875271566212177,
1683
+ 0.006210981868207455,
1684
+ 0.005305357277393341,
1685
+ 0.006381230428814888,
1686
+ 0.006814277730882168,
1687
+ 0.006563970353454351,
1688
+ 0.005743511952459812,
1689
+ 0.0065345969051122665,
1690
+ 0.011945639736950397,
1691
+ 0.004893606528639793,
1692
+ 0.007635968737304211,
1693
+ 0.00752865057438612,
1694
+ 0.010046824812889099,
1695
+ 0.007080474868416786,
1696
+ 0.011667938902974129,
1697
+ 0.00604804465547204,
1698
+ 0.007167487870901823,
1699
+ 0.008865633979439735,
1700
+ 0.005146023817360401,
1701
+ 0.007512568961828947,
1702
+ 0.0033924984745681286,
1703
+ 0.0027513052336871624,
1704
+ 0.004063080996274948,
1705
+ 0.0035831104032695293,
1706
+ 0.010143239051103592,
1707
+ 0.006252411752939224,
1708
+ 0.0041099111549556255,
1709
+ 0.002829005941748619,
1710
+ 0.008162900805473328,
1711
+ 0.0034778001718223095,
1712
+ 0.0048353467136621475,
1713
+ 0.00755035737529397,
1714
+ 0.006170344073325396,
1715
+ 0.0055410354398190975,
1716
+ 0.004055359400808811,
1717
+ 0.005794469267129898,
1718
+ 0.00485236058011651,
1719
+ 0.04100273922085762,
1720
+ 0.043546248227357864,
1721
+ 0.047018393874168396,
1722
+ 0.04010897874832153,
1723
+ 0.04094740003347397,
1724
+ 0.04226917028427124,
1725
+ 0.034722521901130676,
1726
+ 0.013317622244358063,
1727
+ 0.0050164926797151566,
1728
+ 0.005900361575186253,
1729
+ 0.006382612511515617,
1730
+ 0.005324410740286112,
1731
+ 0.006834868341684341,
1732
+ 0.007131056860089302,
1733
+ 0.0073970407247543335,
1734
+ 0.008419208228588104,
1735
+ 0.007619650103151798,
1736
+ 0.006124296225607395,
1737
+ 0.0029738247394561768,
1738
+ 0.005667706951498985,
1739
+ 0.0053189643658697605,
1740
+ 0.006181866396218538,
1741
+ 0.004378743004053831,
1742
+ 0.004856457933783531,
1743
+ 0.006193574983626604,
1744
+ 0.0061783939599990845,
1745
+ 0.006271403282880783,
1746
+ 0.006457127630710602,
1747
+ 0.009113837964832783,
1748
+ 0.005285582505166531,
1749
+ 0.006190958432853222,
1750
+ 0.005260601174086332,
1751
+ 0.003920216113328934,
1752
+ 0.003109836718067527,
1753
+ 0.0088285431265831,
1754
+ 0.004624238703399897,
1755
+ 0.005905993282794952,
1756
+ 0.00597411161288619,
1757
+ 0.0042738839983940125,
1758
+ 0.004486985504627228,
1759
+ 0.006995877251029015,
1760
+ 0.007218474522233009,
1761
+ 0.014883356168866158,
1762
+ 0.005925282835960388,
1763
+ 0.006964115425944328,
1764
+ 0.004993588663637638,
1765
+ 0.005705576855689287,
1766
+ 0.0061006853356957436,
1767
+ 0.0033382070250809193,
1768
+ 0.0032357140444219112,
1769
+ 0.006756148301064968,
1770
+ 0.005333520472049713,
1771
+ 0.005343958735466003,
1772
+ 0.004448914434760809,
1773
+ 0.00810321792960167,
1774
+ 0.008677376434206963,
1775
+ 0.006789557170122862,
1776
+ 0.006779493764042854,
1777
+ 0.010337872430682182,
1778
+ 0.004461814649403095,
1779
+ 0.006985191255807877,
1780
+ 0.009769750759005547,
1781
+ 0.008338341489434242,
1782
+ 0.008709460496902466,
1783
+ 0.00785098783671856,
1784
+ 0.006285048555582762,
1785
+ 0.01058521680533886,
1786
+ 0.0036689788103103638,
1787
+ 0.005481355357915163,
1788
+ 0.018989508971571922,
1789
+ 0.004932553041726351,
1790
+ 0.00451851449906826,
1791
+ 0.006092687137424946,
1792
+ 0.011893357150256634,
1793
+ 0.008019497618079185,
1794
+ 0.005471980199217796,
1795
+ 0.0077120475471019745,
1796
+ 0.008869717828929424,
1797
+ 0.009128015488386154,
1798
+ 0.010264063253998756,
1799
+ 0.005119603127241135,
1800
+ 0.009130019694566727,
1801
+ 0.0046901823952794075,
1802
+ 0.007227801717817783,
1803
+ 0.0059244707226753235,
1804
+ 0.0025816205888986588,
1805
+ 0.0044527817517519,
1806
+ 0.0037231813184916973,
1807
+ 0.009944789111614227,
1808
+ 0.009942839853465557,
1809
+ 0.0034302156418561935,
1810
+ 0.00983119010925293,
1811
+ 0.00665170606225729,
1812
+ 0.006609357427805662,
1813
+ 0.007506031543016434,
1814
+ 0.004614232107996941,
1815
+ 0.006634707562625408,
1816
+ 0.00920582003891468,
1817
+ 0.005753779783844948,
1818
+ 0.008357597514986992,
1819
+ 0.00524176936596632,
1820
+ 0.009124459698796272,
1821
+ 0.005513535812497139,
1822
+ 0.005799106787890196,
1823
+ 0.004532268270850182,
1824
+ 0.007867293432354927,
1825
+ 0.004558207467198372,
1826
+ 0.004656059667468071,
1827
+ 0.003020158503204584,
1828
+ 0.003758586011826992,
1829
+ 0.009156239219009876,
1830
+ 0.007190089672803879,
1831
+ 0.005840515252202749,
1832
+ 0.00948906596750021,
1833
+ 0.008433329872786999,
1834
+ 0.007277483120560646,
1835
+ 0.0021747304126620293,
1836
+ 0.005591952241957188,
1837
+ 0.004493037238717079,
1838
+ 0.007339922711253166,
1839
+ 0.007264859974384308,
1840
+ 0.006580689921975136,
1841
+ 0.0026356796734035015,
1842
+ 0.00429233442991972,
1843
+ 0.004033500328660011,
1844
+ 0.00375079782679677,
1845
+ 0.0022092361468821764,
1846
+ 0.0032393874134868383,
1847
+ 0.003990879748016596,
1848
+ 0.00903621967881918,
1849
+ 0.004429771099239588,
1850
+ 0.007698647677898407,
1851
+ 0.0038764220662415028,
1852
+ 0.0038335155695676804,
1853
+ 0.004251889884471893,
1854
+ 0.0043839626014232635,
1855
+ 0.0054384139366447926,
1856
+ 0.004180637653917074,
1857
+ 0.002683102386072278,
1858
+ 0.005919689312577248,
1859
+ 0.01232307031750679,
1860
+ 0.009214445948600769,
1861
+ 0.004193838220089674,
1862
+ 0.006566280499100685,
1863
+ 0.002540494315326214,
1864
+ 0.004513087682425976,
1865
+ 0.004715023562312126,
1866
+ 0.003238936886191368,
1867
+ 0.005976400338113308,
1868
+ 0.004979868419468403,
1869
+ 0.004852676764130592,
1870
+ 0.01037493348121643,
1871
+ 0.007781471125781536,
1872
+ 0.004505714867264032,
1873
+ 0.004395043943077326
1874
+ ],
1875
+ "denoise_loss": [],
1876
+ "ortho_loss": [
1877
+ 0.9198145866394043,
1878
+ 0.6551633477210999,
1879
+ 0.5257541537284851,
1880
+ 0.42173081636428833,
1881
+ 0.3018621802330017,
1882
+ 0.195886492729187,
1883
+ 0.150644451379776,
1884
+ 0.1258474886417389,
1885
+ 0.12946873903274536,
1886
+ 0.09569515287876129,
1887
+ 0.10323487222194672,
1888
+ 0.12677723169326782,
1889
+ 0.16025961935520172,
1890
+ 0.19041621685028076,
1891
+ 0.2066192328929901,
1892
+ 0.2271208018064499,
1893
+ 0.24800638854503632,
1894
+ 0.2565635144710541,
1895
+ 0.2705942392349243,
1896
+ 0.290367990732193,
1897
+ 0.3045266270637512,
1898
+ 0.3073248267173767,
1899
+ 0.31250330805778503,
1900
+ 0.31037792563438416,
1901
+ 0.315677672624588,
1902
+ 0.3114228844642639,
1903
+ 0.3105468153953552,
1904
+ 0.3135741949081421,
1905
+ 0.30231669545173645,
1906
+ 0.29873502254486084,
1907
+ 0.29192081093788147,
1908
+ 0.2933517396450043,
1909
+ 0.2920157313346863,
1910
+ 0.2938830256462097,
1911
+ 0.2886824309825897,
1912
+ 0.28544124960899353,
1913
+ 0.28644096851348877,
1914
+ 0.2897089719772339,
1915
+ 0.29015612602233887,
1916
+ 0.291336327791214,
1917
+ 0.2915355861186981,
1918
+ 0.2854246497154236,
1919
+ 0.27548834681510925,
1920
+ 0.2664736211299896,
1921
+ 0.26724085211753845,
1922
+ 0.27037864923477173,
1923
+ 0.27064433693885803,
1924
+ 0.2666192650794983,
1925
+ 0.2614651620388031,
1926
+ 0.261039137840271,
1927
+ 0.26465243101119995,
1928
+ 0.26105886697769165,
1929
+ 0.257486492395401,
1930
+ 0.254778653383255,
1931
+ 0.25796666741371155,
1932
+ 0.25369012355804443,
1933
+ 0.24878060817718506,
1934
+ 0.25096824765205383,
1935
+ 0.25279730558395386,
1936
+ 0.24874061346054077,
1937
+ 0.24506402015686035,
1938
+ 0.24815328419208527,
1939
+ 0.24886399507522583,
1940
+ 0.24957183003425598,
1941
+ 0.2510982155799866,
1942
+ 0.24786141514778137,
1943
+ 0.24842151999473572,
1944
+ 0.24109771847724915,
1945
+ 0.24033305048942566,
1946
+ 0.24120938777923584,
1947
+ 0.24030791223049164,
1948
+ 0.23503310978412628,
1949
+ 0.2326727658510208,
1950
+ 0.2296709269285202,
1951
+ 0.23139061033725739,
1952
+ 0.2293580323457718,
1953
+ 0.2292603999376297,
1954
+ 0.22952620685100555,
1955
+ 0.23281599581241608,
1956
+ 0.23360049724578857,
1957
+ 0.23076213896274567,
1958
+ 0.229042187333107,
1959
+ 0.2326192706823349,
1960
+ 0.23553304374217987,
1961
+ 0.2308352291584015,
1962
+ 0.22562457621097565,
1963
+ 0.2211405485868454,
1964
+ 0.21634133160114288,
1965
+ 0.21848219633102417,
1966
+ 0.21689638495445251,
1967
+ 0.21321192383766174,
1968
+ 0.21015682816505432,
1969
+ 0.2143428772687912,
1970
+ 0.21006622910499573,
1971
+ 0.21031954884529114,
1972
+ 0.20823293924331665,
1973
+ 0.2088361233472824,
1974
+ 0.20616331696510315,
1975
+ 0.20600469410419464,
1976
+ 0.21204686164855957,
1977
+ 0.213396817445755,
1978
+ 0.20801101624965668,
1979
+ 0.2040943056344986,
1980
+ 0.20433804392814636,
1981
+ 0.20261657238006592,
1982
+ 0.20230965316295624,
1983
+ 0.2002040445804596,
1984
+ 0.19732622802257538,
1985
+ 0.1936998963356018,
1986
+ 0.19260728359222412,
1987
+ 0.19174639880657196,
1988
+ 0.18709009885787964,
1989
+ 0.19108328223228455,
1990
+ 0.19075725972652435,
1991
+ 0.19367077946662903,
1992
+ 0.18925613164901733,
1993
+ 0.18720345199108124,
1994
+ 0.18714788556098938,
1995
+ 0.1857219785451889,
1996
+ 0.18250976502895355,
1997
+ 0.18321950733661652,
1998
+ 0.18575584888458252,
1999
+ 0.18673887848854065,
2000
+ 0.18795277178287506,
2001
+ 0.18284600973129272,
2002
+ 0.1859154999256134,
2003
+ 0.19134750962257385,
2004
+ 0.19157521426677704,
2005
+ 0.19418273866176605,
2006
+ 0.19611477851867676,
2007
+ 0.19762173295021057,
2008
+ 0.19960592687129974,
2009
+ 0.19484658539295197,
2010
+ 0.1920938342809677,
2011
+ 0.19605068862438202,
2012
+ 0.1998741626739502,
2013
+ 0.19696621596813202,
2014
+ 0.19233518838882446,
2015
+ 0.1940525770187378,
2016
+ 0.19531334936618805,
2017
+ 0.1941678524017334,
2018
+ 0.1895352452993393,
2019
+ 0.188797265291214,
2020
+ 0.18817740678787231,
2021
+ 0.18502366542816162,
2022
+ 0.18578609824180603,
2023
+ 0.18805979192256927,
2024
+ 0.18685424327850342,
2025
+ 0.18059173226356506,
2026
+ 0.1785411387681961,
2027
+ 0.18304483592510223,
2028
+ 0.1815871000289917,
2029
+ 0.18020877242088318,
2030
+ 0.1785038709640503,
2031
+ 0.17913782596588135,
2032
+ 0.18085111677646637,
2033
+ 0.17924872040748596,
2034
+ 0.18093283474445343,
2035
+ 0.17957285046577454,
2036
+ 0.17980830371379852,
2037
+ 0.1819077879190445,
2038
+ 0.18055644631385803,
2039
+ 0.17821896076202393,
2040
+ 0.1766616553068161,
2041
+ 0.1761750727891922,
2042
+ 0.17780886590480804,
2043
+ 0.17631782591342926,
2044
+ 0.17762765288352966,
2045
+ 0.1772899031639099,
2046
+ 0.1732548475265503,
2047
+ 0.17357861995697021,
2048
+ 0.1753465235233307,
2049
+ 0.17705193161964417,
2050
+ 0.17899462580680847,
2051
+ 0.18039874732494354,
2052
+ 0.17960233986377716,
2053
+ 0.17767232656478882,
2054
+ 0.17840833961963654,
2055
+ 0.17904219031333923,
2056
+ 0.1762559711933136,
2057
+ 0.17740243673324585,
2058
+ 0.1820743978023529,
2059
+ 0.18073254823684692,
2060
+ 0.17860734462738037,
2061
+ 0.1795828491449356,
2062
+ 0.17847418785095215,
2063
+ 0.18097732961177826,
2064
+ 0.1796371191740036,
2065
+ 0.17679157853126526,
2066
+ 0.17841604351997375,
2067
+ 0.17764584720134735,
2068
+ 0.17880985140800476,
2069
+ 0.1773495376110077,
2070
+ 0.1767076849937439,
2071
+ 0.17657145857810974,
2072
+ 0.17661401629447937,
2073
+ 0.1773444563150406,
2074
+ 0.17760634422302246,
2075
+ 0.17683789134025574,
2076
+ 0.17719542980194092,
2077
+ 0.17727608978748322,
2078
+ 0.17656034231185913,
2079
+ 0.17764820158481598,
2080
+ 0.175861656665802,
2081
+ 0.1761469841003418,
2082
+ 0.17879027128219604,
2083
+ 0.17545416951179504,
2084
+ 0.17584295570850372,
2085
+ 0.17725321650505066,
2086
+ 0.17724880576133728,
2087
+ 0.1775873601436615,
2088
+ 0.1769874095916748,
2089
+ 0.1775965392589569,
2090
+ 0.1793995201587677,
2091
+ 0.17863869667053223,
2092
+ 0.17909114062786102,
2093
+ 0.1779758185148239,
2094
+ 0.17678499221801758,
2095
+ 0.17685092985630035,
2096
+ 0.17727036774158478,
2097
+ 0.17810432612895966,
2098
+ 0.1758294552564621,
2099
+ 0.1793285757303238,
2100
+ 0.1807268261909485,
2101
+ 0.1795637607574463,
2102
+ 0.17858168482780457,
2103
+ 0.17781469225883484,
2104
+ 0.17838957905769348,
2105
+ 0.17817437648773193,
2106
+ 0.17893055081367493,
2107
+ 0.17974941432476044,
2108
+ 0.18173956871032715,
2109
+ 0.17994102835655212,
2110
+ 0.1794210821390152,
2111
+ 0.18177224695682526,
2112
+ 0.17975547909736633,
2113
+ 0.17758183181285858,
2114
+ 0.17822329699993134,
2115
+ 0.17720657587051392,
2116
+ 0.1767847090959549,
2117
+ 0.18060030043125153,
2118
+ 0.1803709715604782,
2119
+ 0.1815047562122345,
2120
+ 0.18107862770557404,
2121
+ 0.18273945152759552,
2122
+ 0.18144862353801727,
2123
+ 0.1819262057542801,
2124
+ 0.18287310004234314,
2125
+ 0.18173839151859283,
2126
+ 0.18238605558872223,
2127
+ 0.1825030893087387,
2128
+ 0.1808522492647171,
2129
+ 0.18008854985237122,
2130
+ 0.17948704957962036,
2131
+ 0.17876680195331573,
2132
+ 0.17993193864822388,
2133
+ 0.17882338166236877,
2134
+ 0.178974911570549,
2135
+ 0.17935578525066376,
2136
+ 0.17965644598007202,
2137
+ 0.18048611283302307,
2138
+ 0.17919977009296417,
2139
+ 0.17858874797821045,
2140
+ 0.1775817573070526,
2141
+ 0.17882919311523438,
2142
+ 0.17989391088485718,
2143
+ 0.1786574274301529,
2144
+ 0.18099862337112427,
2145
+ 0.18243511021137238,
2146
+ 0.18324783444404602,
2147
+ 0.18357829749584198,
2148
+ 0.18426436185836792,
2149
+ 0.18502143025398254,
2150
+ 0.18604235351085663,
2151
+ 0.1857336014509201,
2152
+ 0.18722490966320038,
2153
+ 0.1879812479019165,
2154
+ 0.1885811686515808,
2155
+ 0.19002453982830048,
2156
+ 0.19144999980926514,
2157
+ 0.19173073768615723,
2158
+ 0.19194410741329193,
2159
+ 0.19225633144378662,
2160
+ 0.19304108619689941,
2161
+ 0.19343622028827667,
2162
+ 0.1938202679157257,
2163
+ 0.19398020207881927,
2164
+ 0.19369561970233917,
2165
+ 0.19482459127902985,
2166
+ 0.19427832961082458,
2167
+ 0.19423837959766388,
2168
+ 0.1951482743024826,
2169
+ 0.19510076940059662,
2170
+ 0.1958136409521103,
2171
+ 0.19633986055850983,
2172
+ 0.19718037545681,
2173
+ 0.1969831883907318,
2174
+ 0.19735197722911835,
2175
+ 0.19798672199249268,
2176
+ 0.1981828659772873,
2177
+ 0.19840724766254425,
2178
+ 0.198574498295784,
2179
+ 0.19880661368370056,
2180
+ 0.1986214518547058,
2181
+ 0.1990007758140564,
2182
+ 0.1990588903427124,
2183
+ 0.1990559697151184,
2184
+ 0.19906410574913025,
2185
+ 0.19931460916996002,
2186
+ 0.19968949258327484
2187
+ ],
2188
+ "lr": [
2189
+ 4.188034188034189e-06,
2190
+ 8.461538461538462e-06,
2191
+ 1.2735042735042738e-05,
2192
+ 1.700854700854701e-05,
2193
+ 2.1282051282051282e-05,
2194
+ 2.5555555555555557e-05,
2195
+ 2.9829059829059833e-05,
2196
+ 3.4102564102564105e-05,
2197
+ 3.837606837606838e-05,
2198
+ 4e-05,
2199
+ 4e-05,
2200
+ 4e-05,
2201
+ 4e-05,
2202
+ 4e-05,
2203
+ 4e-05,
2204
+ 4e-05,
2205
+ 4e-05,
2206
+ 4e-05,
2207
+ 4e-05,
2208
+ 4e-05,
2209
+ 4e-05,
2210
+ 4e-05,
2211
+ 4e-05,
2212
+ 4e-05,
2213
+ 4e-05,
2214
+ 4e-05,
2215
+ 4e-05,
2216
+ 4e-05,
2217
+ 4e-05,
2218
+ 4e-05,
2219
+ 4e-05,
2220
+ 4e-05,
2221
+ 4e-05,
2222
+ 4e-05,
2223
+ 4e-05,
2224
+ 4e-05,
2225
+ 4e-05,
2226
+ 4e-05,
2227
+ 4e-05,
2228
+ 4e-05,
2229
+ 4e-05,
2230
+ 4e-05,
2231
+ 4e-05,
2232
+ 4e-05,
2233
+ 4e-05,
2234
+ 4e-05,
2235
+ 4e-05,
2236
+ 4e-05,
2237
+ 4e-05,
2238
+ 4e-05,
2239
+ 4e-05,
2240
+ 4e-05,
2241
+ 4e-05,
2242
+ 4e-05,
2243
+ 4e-05,
2244
+ 4e-05,
2245
+ 4e-05,
2246
+ 4e-05,
2247
+ 4e-05,
2248
+ 4e-05,
2249
+ 4e-05,
2250
+ 4e-05,
2251
+ 4e-05,
2252
+ 4e-05,
2253
+ 4e-05,
2254
+ 4e-05,
2255
+ 4e-05,
2256
+ 4e-05,
2257
+ 4e-05,
2258
+ 4e-05,
2259
+ 4e-05,
2260
+ 4e-05,
2261
+ 4e-05,
2262
+ 4e-05,
2263
+ 4e-05,
2264
+ 4e-05,
2265
+ 4e-05,
2266
+ 4e-05,
2267
+ 4e-05,
2268
+ 4e-05,
2269
+ 4e-05,
2270
+ 4e-05,
2271
+ 4e-05,
2272
+ 4e-05,
2273
+ 4e-05,
2274
+ 4e-05,
2275
+ 4e-05,
2276
+ 4e-05,
2277
+ 4e-05,
2278
+ 4e-05,
2279
+ 4e-05,
2280
+ 4e-05,
2281
+ 4e-05,
2282
+ 4e-05,
2283
+ 4e-05,
2284
+ 4e-05,
2285
+ 4e-05,
2286
+ 4e-05,
2287
+ 4e-05,
2288
+ 4e-05,
2289
+ 4e-05,
2290
+ 4e-05,
2291
+ 4e-05,
2292
+ 4e-05,
2293
+ 4e-05,
2294
+ 4e-05,
2295
+ 4e-05,
2296
+ 4e-05,
2297
+ 4e-05,
2298
+ 4e-05,
2299
+ 4e-05,
2300
+ 4e-05,
2301
+ 4e-05,
2302
+ 4e-05,
2303
+ 4e-05,
2304
+ 4e-05,
2305
+ 4e-05,
2306
+ 4e-05,
2307
+ 4e-05,
2308
+ 4e-05,
2309
+ 4e-05,
2310
+ 4e-05,
2311
+ 4e-05,
2312
+ 4e-05,
2313
+ 4e-05,
2314
+ 4e-05,
2315
+ 4e-05,
2316
+ 4e-05,
2317
+ 4e-05,
2318
+ 4e-05,
2319
+ 4e-05,
2320
+ 4e-05,
2321
+ 4e-05,
2322
+ 4e-05,
2323
+ 4e-05,
2324
+ 4e-05,
2325
+ 4e-05,
2326
+ 4e-05,
2327
+ 4e-05,
2328
+ 4e-05,
2329
+ 4e-05,
2330
+ 4e-05,
2331
+ 4e-05,
2332
+ 4e-05,
2333
+ 4e-05,
2334
+ 4e-05,
2335
+ 4e-05,
2336
+ 4e-05,
2337
+ 4e-05,
2338
+ 4e-05,
2339
+ 4e-05,
2340
+ 4e-05,
2341
+ 4e-05,
2342
+ 4e-05,
2343
+ 4e-05,
2344
+ 4e-05,
2345
+ 4e-05,
2346
+ 4e-05,
2347
+ 4e-05,
2348
+ 4e-05,
2349
+ 4e-05,
2350
+ 4e-05,
2351
+ 4e-05,
2352
+ 4e-05,
2353
+ 4e-05,
2354
+ 4e-05,
2355
+ 4e-05,
2356
+ 4e-05,
2357
+ 4e-05,
2358
+ 4e-05,
2359
+ 4e-05,
2360
+ 4e-05,
2361
+ 4e-05,
2362
+ 4e-05,
2363
+ 4e-05,
2364
+ 4e-05,
2365
+ 4e-05,
2366
+ 4e-05,
2367
+ 4e-05,
2368
+ 4e-05,
2369
+ 4e-05,
2370
+ 4e-05,
2371
+ 4e-05,
2372
+ 4e-05,
2373
+ 4e-05,
2374
+ 4e-05,
2375
+ 4e-05,
2376
+ 4e-05,
2377
+ 4e-05,
2378
+ 3.992995647012267e-05,
2379
+ 3.963316185199842e-05,
2380
+ 3.933636723387416e-05,
2381
+ 3.90395726157499e-05,
2382
+ 3.874277799762565e-05,
2383
+ 3.844598337950139e-05,
2384
+ 3.814918876137713e-05,
2385
+ 3.785239414325287e-05,
2386
+ 3.7555599525128613e-05,
2387
+ 3.725880490700435e-05,
2388
+ 3.696201028888009e-05,
2389
+ 3.666521567075585e-05,
2390
+ 3.6368421052631585e-05,
2391
+ 3.607162643450732e-05,
2392
+ 3.577483181638307e-05,
2393
+ 3.547803719825881e-05,
2394
+ 3.518124258013455e-05,
2395
+ 3.4884447962010287e-05,
2396
+ 3.458765334388604e-05,
2397
+ 3.4290858725761776e-05,
2398
+ 3.399406410763751e-05,
2399
+ 3.3697269489513265e-05,
2400
+ 3.3400474871389e-05,
2401
+ 3.310368025326474e-05,
2402
+ 3.280688563514048e-05,
2403
+ 3.251009101701623e-05,
2404
+ 3.2213296398891967e-05,
2405
+ 3.191650178076771e-05,
2406
+ 3.1542540561931145e-05,
2407
+ 3.124574594380688e-05,
2408
+ 3.094895132568263e-05,
2409
+ 3.065215670755838e-05,
2410
+ 3.0355362089434113e-05,
2411
+ 3.0058567471309854e-05,
2412
+ 2.97617728531856e-05,
2413
+ 2.9464978235061336e-05,
2414
+ 2.9168183616937077e-05,
2415
+ 2.8871388998812818e-05,
2416
+ 2.857459438068857e-05,
2417
+ 2.8277799762564307e-05,
2418
+ 2.798100514444005e-05,
2419
+ 2.7684210526315793e-05,
2420
+ 2.738741590819153e-05,
2421
+ 2.709062129006727e-05,
2422
+ 2.6793826671943013e-05,
2423
+ 2.6497032053818764e-05,
2424
+ 2.62002374356945e-05,
2425
+ 2.5903442817570243e-05,
2426
+ 2.5606648199445987e-05,
2427
+ 2.5309853581321725e-05,
2428
+ 2.5013058963197466e-05,
2429
+ 2.4716264345073214e-05,
2430
+ 2.441946972694896e-05,
2431
+ 2.4122675108824693e-05,
2432
+ 2.3825880490700434e-05,
2433
+ 2.352908587257618e-05,
2434
+ 2.3232291254451916e-05,
2435
+ 2.293549663632766e-05,
2436
+ 2.2638702018203408e-05,
2437
+ 2.226474079936684e-05,
2438
+ 2.196794618124258e-05,
2439
+ 2.1671151563118328e-05,
2440
+ 2.1374356944994066e-05,
2441
+ 2.1077562326869803e-05,
2442
+ 2.0780767708745554e-05,
2443
+ 2.0483973090621296e-05,
2444
+ 2.018717847249703e-05,
2445
+ 1.989038385437277e-05,
2446
+ 1.959358923624852e-05,
2447
+ 1.929679461812426e-05,
2448
+ 1.8999999999999998e-05,
2449
+ 1.8703205381875746e-05,
2450
+ 1.8406410763751487e-05,
2451
+ 1.8109616145627224e-05,
2452
+ 1.7812821527502965e-05,
2453
+ 1.7516026909378713e-05,
2454
+ 1.7219232291254454e-05,
2455
+ 1.6922437673130192e-05,
2456
+ 1.662564305500594e-05,
2457
+ 1.632884843688168e-05,
2458
+ 1.603205381875742e-05,
2459
+ 1.573525920063316e-05,
2460
+ 1.5438464582508908e-05,
2461
+ 1.5141669964384647e-05,
2462
+ 1.4844875346260385e-05,
2463
+ 1.4548080728136134e-05,
2464
+ 1.4251286110011875e-05,
2465
+ 1.3954491491887611e-05,
2466
+ 1.3657696873763363e-05,
2467
+ 1.33609022556391e-05,
2468
+ 1.298694103680253e-05,
2469
+ 1.2690146418678277e-05,
2470
+ 1.2393351800554018e-05,
2471
+ 1.2096557182429756e-05,
2472
+ 1.1799762564305506e-05,
2473
+ 1.1502967946181245e-05,
2474
+ 1.1206173328056984e-05,
2475
+ 1.0909378709932724e-05,
2476
+ 1.0612584091808472e-05,
2477
+ 1.0315789473684213e-05,
2478
+ 1.0018994855559949e-05,
2479
+ 9.7222002374357e-06,
2480
+ 9.425405619311438e-06,
2481
+ 9.128611001187177e-06,
2482
+ 8.831816383062916e-06,
2483
+ 8.535021764938666e-06,
2484
+ 8.238227146814405e-06,
2485
+ 7.941432528690143e-06,
2486
+ 7.644637910565893e-06,
2487
+ 7.347843292441632e-06,
2488
+ 7.0510486743173715e-06,
2489
+ 6.75425405619311e-06,
2490
+ 6.45745943806886e-06,
2491
+ 6.160664819944598e-06,
2492
+ 5.8638702018203375e-06,
2493
+ 5.567075583696086e-06,
2494
+ 5.270280965571826e-06,
2495
+ 4.973486347447565e-06,
2496
+ 4.676691729323314e-06,
2497
+ 4.379897111199053e-06,
2498
+ 4.083102493074792e-06
2499
+ ],
2500
+ "emb_lr": [],
2501
+ "eval_step": [
2502
+ 1550,
2503
+ 3113,
2504
+ 4676,
2505
+ 6239,
2506
+ 7802,
2507
+ 9365,
2508
+ 10928,
2509
+ 12491,
2510
+ 14054,
2511
+ 15617
2512
+ ],
2513
+ "eval_accuracy": [
2514
+ 0.0,
2515
+ 0.0,
2516
+ 0.0,
2517
+ 0.0,
2518
+ 0.0,
2519
+ 0.0,
2520
+ 0.0,
2521
+ 0.0,
2522
+ 0.0,
2523
+ 0.0
2524
+ ]
2525
+ },
2526
+ "final_accuracy": 0.9945833333333334,
2527
+ "sft_eval": {
2528
+ "config": {
2529
+ "ops": "add_sub",
2530
+ "K": null,
2531
+ "mode": "sft",
2532
+ "n_digits": 6,
2533
+ "n_per_split": 100
2534
+ },
2535
+ "splits": {
2536
+ "add_S0": {
2537
+ "full_accuracy": 1.0,
2538
+ "n_examples": 100,
2539
+ "per_subtask": {
2540
+ "SA": {
2541
+ "accuracy": 1.0,
2542
+ "count": 605
2543
+ },
2544
+ "SS": {
2545
+ "accuracy": 1.0,
2546
+ "count": 95
2547
+ }
2548
+ }
2549
+ },
2550
+ "add_S1": {
2551
+ "full_accuracy": 1.0,
2552
+ "n_examples": 100,
2553
+ "per_subtask": {
2554
+ "SA": {
2555
+ "accuracy": 1.0,
2556
+ "count": 204
2557
+ },
2558
+ "SC": {
2559
+ "accuracy": 1.0,
2560
+ "count": 169
2561
+ },
2562
+ "SS": {
2563
+ "accuracy": 1.0,
2564
+ "count": 31
2565
+ },
2566
+ "UC": {
2567
+ "accuracy": 1.0,
2568
+ "count": 296
2569
+ }
2570
+ }
2571
+ },
2572
+ "add_S2": {
2573
+ "full_accuracy": 1.0,
2574
+ "n_examples": 100,
2575
+ "per_subtask": {
2576
+ "SA": {
2577
+ "accuracy": 1.0,
2578
+ "count": 163
2579
+ },
2580
+ "SC": {
2581
+ "accuracy": 1.0,
2582
+ "count": 130
2583
+ },
2584
+ "SS": {
2585
+ "accuracy": 1.0,
2586
+ "count": 87
2587
+ },
2588
+ "UC": {
2589
+ "accuracy": 1.0,
2590
+ "count": 203
2591
+ },
2592
+ "US": {
2593
+ "accuracy": 1.0,
2594
+ "count": 117
2595
+ }
2596
+ }
2597
+ },
2598
+ "add_S3": {
2599
+ "full_accuracy": 0.98,
2600
+ "n_examples": 100,
2601
+ "per_subtask": {
2602
+ "SA": {
2603
+ "accuracy": 1.0,
2604
+ "count": 121
2605
+ },
2606
+ "SC": {
2607
+ "accuracy": 1.0,
2608
+ "count": 121
2609
+ },
2610
+ "SS": {
2611
+ "accuracy": 1.0,
2612
+ "count": 49
2613
+ },
2614
+ "UC": {
2615
+ "accuracy": 0.989247311827957,
2616
+ "count": 186
2617
+ },
2618
+ "US": {
2619
+ "accuracy": 1.0,
2620
+ "count": 223
2621
+ }
2622
+ }
2623
+ },
2624
+ "add_S4": {
2625
+ "full_accuracy": 0.79,
2626
+ "n_examples": 100,
2627
+ "per_subtask": {
2628
+ "SA": {
2629
+ "accuracy": 1.0,
2630
+ "count": 104
2631
+ },
2632
+ "SC": {
2633
+ "accuracy": 1.0,
2634
+ "count": 106
2635
+ },
2636
+ "SS": {
2637
+ "accuracy": 1.0,
2638
+ "count": 23
2639
+ },
2640
+ "UC": {
2641
+ "accuracy": 0.86875,
2642
+ "count": 160
2643
+ },
2644
+ "US": {
2645
+ "accuracy": 0.9869706840390879,
2646
+ "count": 307
2647
+ }
2648
+ }
2649
+ },
2650
+ "add_S5": {
2651
+ "full_accuracy": 0.64,
2652
+ "n_examples": 100,
2653
+ "per_subtask": {
2654
+ "SA": {
2655
+ "accuracy": 1.0,
2656
+ "count": 100
2657
+ },
2658
+ "SC": {
2659
+ "accuracy": 1.0,
2660
+ "count": 100
2661
+ },
2662
+ "UC": {
2663
+ "accuracy": 0.71,
2664
+ "count": 100
2665
+ },
2666
+ "US": {
2667
+ "accuracy": 0.9025,
2668
+ "count": 400
2669
+ }
2670
+ }
2671
+ },
2672
+ "add_S6": {
2673
+ "full_accuracy": 0.88,
2674
+ "n_examples": 100,
2675
+ "per_subtask": {
2676
+ "SC": {
2677
+ "accuracy": 1.0,
2678
+ "count": 100
2679
+ },
2680
+ "UC": {
2681
+ "accuracy": 0.94,
2682
+ "count": 100
2683
+ },
2684
+ "US": {
2685
+ "accuracy": 0.96,
2686
+ "count": 500
2687
+ }
2688
+ }
2689
+ },
2690
+ "add_random": {
2691
+ "full_accuracy": 1.0,
2692
+ "n_examples": 200,
2693
+ "per_subtask": {
2694
+ "SA": {
2695
+ "accuracy": 1.0,
2696
+ "count": 447
2697
+ },
2698
+ "SC": {
2699
+ "accuracy": 1.0,
2700
+ "count": 320
2701
+ },
2702
+ "SS": {
2703
+ "accuracy": 1.0,
2704
+ "count": 56
2705
+ },
2706
+ "UC": {
2707
+ "accuracy": 1.0,
2708
+ "count": 529
2709
+ },
2710
+ "US": {
2711
+ "accuracy": 1.0,
2712
+ "count": 48
2713
+ }
2714
+ }
2715
+ },
2716
+ "add_C3": {
2717
+ "full_accuracy": 0.99,
2718
+ "n_examples": 100,
2719
+ "per_subtask": {
2720
+ "SA": {
2721
+ "accuracy": 1.0,
2722
+ "count": 300
2723
+ },
2724
+ "SC": {
2725
+ "accuracy": 1.0,
2726
+ "count": 100
2727
+ },
2728
+ "UC": {
2729
+ "accuracy": 0.9948186528497409,
2730
+ "count": 193
2731
+ },
2732
+ "US": {
2733
+ "accuracy": 1.0,
2734
+ "count": 107
2735
+ }
2736
+ }
2737
+ },
2738
+ "add_C4": {
2739
+ "full_accuracy": 0.94,
2740
+ "n_examples": 100,
2741
+ "per_subtask": {
2742
+ "SA": {
2743
+ "accuracy": 0.995,
2744
+ "count": 200
2745
+ },
2746
+ "SC": {
2747
+ "accuracy": 1.0,
2748
+ "count": 100
2749
+ },
2750
+ "UC": {
2751
+ "accuracy": 0.98046875,
2752
+ "count": 256
2753
+ },
2754
+ "US": {
2755
+ "accuracy": 0.9930555555555556,
2756
+ "count": 144
2757
+ }
2758
+ }
2759
+ },
2760
+ "add_C5": {
2761
+ "full_accuracy": 0.92,
2762
+ "n_examples": 100,
2763
+ "per_subtask": {
2764
+ "SA": {
2765
+ "accuracy": 1.0,
2766
+ "count": 100
2767
+ },
2768
+ "SC": {
2769
+ "accuracy": 1.0,
2770
+ "count": 100
2771
+ },
2772
+ "UC": {
2773
+ "accuracy": 0.9738562091503268,
2774
+ "count": 306
2775
+ },
2776
+ "US": {
2777
+ "accuracy": 0.9948453608247423,
2778
+ "count": 194
2779
+ }
2780
+ }
2781
+ },
2782
+ "add_C6": {
2783
+ "full_accuracy": 1.0,
2784
+ "n_examples": 100,
2785
+ "per_subtask": {
2786
+ "SC": {
2787
+ "accuracy": 1.0,
2788
+ "count": 100
2789
+ },
2790
+ "UC": {
2791
+ "accuracy": 1.0,
2792
+ "count": 366
2793
+ },
2794
+ "US": {
2795
+ "accuracy": 1.0,
2796
+ "count": 234
2797
+ }
2798
+ }
2799
+ },
2800
+ "sub_M0": {
2801
+ "full_accuracy": 1.0,
2802
+ "n_examples": 100,
2803
+ "per_subtask": {
2804
+ "MD": {
2805
+ "accuracy": 1.0,
2806
+ "count": 601
2807
+ },
2808
+ "ME": {
2809
+ "accuracy": 1.0,
2810
+ "count": 99
2811
+ }
2812
+ }
2813
+ },
2814
+ "sub_M1": {
2815
+ "full_accuracy": 0.99,
2816
+ "n_examples": 100,
2817
+ "per_subtask": {
2818
+ "MD": {
2819
+ "accuracy": 1.0,
2820
+ "count": 279
2821
+ },
2822
+ "MB": {
2823
+ "accuracy": 1.0,
2824
+ "count": 145
2825
+ },
2826
+ "ME": {
2827
+ "accuracy": 1.0,
2828
+ "count": 24
2829
+ },
2830
+ "UB": {
2831
+ "accuracy": 0.996031746031746,
2832
+ "count": 252
2833
+ }
2834
+ }
2835
+ },
2836
+ "sub_M2": {
2837
+ "full_accuracy": 1.0,
2838
+ "n_examples": 100,
2839
+ "per_subtask": {
2840
+ "MD": {
2841
+ "accuracy": 1.0,
2842
+ "count": 213
2843
+ },
2844
+ "MB": {
2845
+ "accuracy": 1.0,
2846
+ "count": 113
2847
+ },
2848
+ "ME": {
2849
+ "accuracy": 1.0,
2850
+ "count": 85
2851
+ },
2852
+ "UB": {
2853
+ "accuracy": 1.0,
2854
+ "count": 181
2855
+ },
2856
+ "UD": {
2857
+ "accuracy": 1.0,
2858
+ "count": 108
2859
+ }
2860
+ }
2861
+ },
2862
+ "sub_M3": {
2863
+ "full_accuracy": 1.0,
2864
+ "n_examples": 100,
2865
+ "per_subtask": {
2866
+ "MD": {
2867
+ "accuracy": 1.0,
2868
+ "count": 179
2869
+ },
2870
+ "MB": {
2871
+ "accuracy": 1.0,
2872
+ "count": 103
2873
+ },
2874
+ "ME": {
2875
+ "accuracy": 1.0,
2876
+ "count": 56
2877
+ },
2878
+ "UB": {
2879
+ "accuracy": 1.0,
2880
+ "count": 149
2881
+ },
2882
+ "UD": {
2883
+ "accuracy": 1.0,
2884
+ "count": 213
2885
+ }
2886
+ }
2887
+ },
2888
+ "sub_M4": {
2889
+ "full_accuracy": 0.57,
2890
+ "n_examples": 100,
2891
+ "per_subtask": {
2892
+ "MD": {
2893
+ "accuracy": 1.0,
2894
+ "count": 200
2895
+ },
2896
+ "MB": {
2897
+ "accuracy": 1.0,
2898
+ "count": 100
2899
+ },
2900
+ "UB": {
2901
+ "accuracy": 0.58,
2902
+ "count": 100
2903
+ },
2904
+ "UD": {
2905
+ "accuracy": 0.9966666666666667,
2906
+ "count": 300
2907
+ }
2908
+ }
2909
+ },
2910
+ "sub_M5": {
2911
+ "full_accuracy": 0.35,
2912
+ "n_examples": 100,
2913
+ "per_subtask": {
2914
+ "MD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 100
2917
+ },
2918
+ "MB": {
2919
+ "accuracy": 1.0,
2920
+ "count": 100
2921
+ },
2922
+ "UB": {
2923
+ "accuracy": 0.61,
2924
+ "count": 100
2925
+ },
2926
+ "UD": {
2927
+ "accuracy": 0.86,
2928
+ "count": 400
2929
+ }
2930
+ }
2931
+ },
2932
+ "sub_random": {
2933
+ "full_accuracy": 1.0,
2934
+ "n_examples": 200,
2935
+ "per_subtask": {
2936
+ "MD": {
2937
+ "accuracy": 1.0,
2938
+ "count": 600
2939
+ },
2940
+ "MB": {
2941
+ "accuracy": 1.0,
2942
+ "count": 267
2943
+ },
2944
+ "ME": {
2945
+ "accuracy": 1.0,
2946
+ "count": 53
2947
+ },
2948
+ "UB": {
2949
+ "accuracy": 1.0,
2950
+ "count": 439
2951
+ },
2952
+ "UD": {
2953
+ "accuracy": 1.0,
2954
+ "count": 41
2955
+ }
2956
+ }
2957
+ },
2958
+ "sub_B3": {
2959
+ "full_accuracy": 0.99,
2960
+ "n_examples": 100,
2961
+ "per_subtask": {
2962
+ "MD": {
2963
+ "accuracy": 1.0,
2964
+ "count": 300
2965
+ },
2966
+ "MB": {
2967
+ "accuracy": 1.0,
2968
+ "count": 100
2969
+ },
2970
+ "UB": {
2971
+ "accuracy": 0.9949238578680203,
2972
+ "count": 197
2973
+ },
2974
+ "UD": {
2975
+ "accuracy": 1.0,
2976
+ "count": 103
2977
+ }
2978
+ }
2979
+ },
2980
+ "sub_B4": {
2981
+ "full_accuracy": 0.94,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "MD": {
2985
+ "accuracy": 1.0,
2986
+ "count": 200
2987
+ },
2988
+ "MB": {
2989
+ "accuracy": 1.0,
2990
+ "count": 100
2991
+ },
2992
+ "UB": {
2993
+ "accuracy": 0.9757085020242915,
2994
+ "count": 247
2995
+ },
2996
+ "UD": {
2997
+ "accuracy": 1.0,
2998
+ "count": 153
2999
+ }
3000
+ }
3001
+ },
3002
+ "sub_B5": {
3003
+ "full_accuracy": 0.98,
3004
+ "n_examples": 100,
3005
+ "per_subtask": {
3006
+ "MD": {
3007
+ "accuracy": 1.0,
3008
+ "count": 100
3009
+ },
3010
+ "MB": {
3011
+ "accuracy": 1.0,
3012
+ "count": 100
3013
+ },
3014
+ "UB": {
3015
+ "accuracy": 0.9966442953020134,
3016
+ "count": 298
3017
+ },
3018
+ "UD": {
3019
+ "accuracy": 0.995049504950495,
3020
+ "count": 202
3021
+ }
3022
+ }
3023
+ }
3024
+ },
3025
+ "summary": {
3026
+ "overall_accuracy": 0.9145833333333333,
3027
+ "total_examples": 2400,
3028
+ "n_splits": 22
3029
+ }
3030
+ },
3031
+ "sorl_eval": {
3032
+ "config": {
3033
+ "ops": "add_sub",
3034
+ "K": 1,
3035
+ "mode": "sorl",
3036
+ "n_digits": 6,
3037
+ "n_per_split": 100
3038
+ },
3039
+ "splits": {
3040
+ "add_S0": {
3041
+ "full_accuracy": 1.0,
3042
+ "n_examples": 100,
3043
+ "per_subtask": {
3044
+ "SA": {
3045
+ "accuracy": 1.0,
3046
+ "count": 605
3047
+ },
3048
+ "SS": {
3049
+ "accuracy": 1.0,
3050
+ "count": 95
3051
+ }
3052
+ }
3053
+ },
3054
+ "add_S1": {
3055
+ "full_accuracy": 1.0,
3056
+ "n_examples": 100,
3057
+ "per_subtask": {
3058
+ "SA": {
3059
+ "accuracy": 1.0,
3060
+ "count": 204
3061
+ },
3062
+ "SC": {
3063
+ "accuracy": 1.0,
3064
+ "count": 169
3065
+ },
3066
+ "SS": {
3067
+ "accuracy": 1.0,
3068
+ "count": 31
3069
+ },
3070
+ "UC": {
3071
+ "accuracy": 1.0,
3072
+ "count": 296
3073
+ }
3074
+ }
3075
+ },
3076
+ "add_S2": {
3077
+ "full_accuracy": 1.0,
3078
+ "n_examples": 100,
3079
+ "per_subtask": {
3080
+ "SA": {
3081
+ "accuracy": 1.0,
3082
+ "count": 163
3083
+ },
3084
+ "SC": {
3085
+ "accuracy": 1.0,
3086
+ "count": 130
3087
+ },
3088
+ "SS": {
3089
+ "accuracy": 1.0,
3090
+ "count": 87
3091
+ },
3092
+ "UC": {
3093
+ "accuracy": 1.0,
3094
+ "count": 203
3095
+ },
3096
+ "US": {
3097
+ "accuracy": 1.0,
3098
+ "count": 117
3099
+ }
3100
+ }
3101
+ },
3102
+ "add_S3": {
3103
+ "full_accuracy": 1.0,
3104
+ "n_examples": 100,
3105
+ "per_subtask": {
3106
+ "SA": {
3107
+ "accuracy": 1.0,
3108
+ "count": 121
3109
+ },
3110
+ "SC": {
3111
+ "accuracy": 1.0,
3112
+ "count": 121
3113
+ },
3114
+ "SS": {
3115
+ "accuracy": 1.0,
3116
+ "count": 49
3117
+ },
3118
+ "UC": {
3119
+ "accuracy": 1.0,
3120
+ "count": 186
3121
+ },
3122
+ "US": {
3123
+ "accuracy": 1.0,
3124
+ "count": 223
3125
+ }
3126
+ }
3127
+ },
3128
+ "add_S4": {
3129
+ "full_accuracy": 1.0,
3130
+ "n_examples": 100,
3131
+ "per_subtask": {
3132
+ "SA": {
3133
+ "accuracy": 1.0,
3134
+ "count": 104
3135
+ },
3136
+ "SC": {
3137
+ "accuracy": 1.0,
3138
+ "count": 106
3139
+ },
3140
+ "SS": {
3141
+ "accuracy": 1.0,
3142
+ "count": 23
3143
+ },
3144
+ "UC": {
3145
+ "accuracy": 1.0,
3146
+ "count": 160
3147
+ },
3148
+ "US": {
3149
+ "accuracy": 1.0,
3150
+ "count": 307
3151
+ }
3152
+ }
3153
+ },
3154
+ "add_S5": {
3155
+ "full_accuracy": 0.99,
3156
+ "n_examples": 100,
3157
+ "per_subtask": {
3158
+ "SA": {
3159
+ "accuracy": 1.0,
3160
+ "count": 100
3161
+ },
3162
+ "SC": {
3163
+ "accuracy": 1.0,
3164
+ "count": 100
3165
+ },
3166
+ "UC": {
3167
+ "accuracy": 0.99,
3168
+ "count": 100
3169
+ },
3170
+ "US": {
3171
+ "accuracy": 1.0,
3172
+ "count": 400
3173
+ }
3174
+ }
3175
+ },
3176
+ "add_S6": {
3177
+ "full_accuracy": 0.96,
3178
+ "n_examples": 100,
3179
+ "per_subtask": {
3180
+ "SC": {
3181
+ "accuracy": 1.0,
3182
+ "count": 100
3183
+ },
3184
+ "UC": {
3185
+ "accuracy": 0.96,
3186
+ "count": 100
3187
+ },
3188
+ "US": {
3189
+ "accuracy": 0.998,
3190
+ "count": 500
3191
+ }
3192
+ }
3193
+ },
3194
+ "add_random": {
3195
+ "full_accuracy": 1.0,
3196
+ "n_examples": 200,
3197
+ "per_subtask": {
3198
+ "SA": {
3199
+ "accuracy": 1.0,
3200
+ "count": 447
3201
+ },
3202
+ "SC": {
3203
+ "accuracy": 1.0,
3204
+ "count": 320
3205
+ },
3206
+ "SS": {
3207
+ "accuracy": 1.0,
3208
+ "count": 56
3209
+ },
3210
+ "UC": {
3211
+ "accuracy": 1.0,
3212
+ "count": 529
3213
+ },
3214
+ "US": {
3215
+ "accuracy": 1.0,
3216
+ "count": 48
3217
+ }
3218
+ }
3219
+ },
3220
+ "add_C3": {
3221
+ "full_accuracy": 1.0,
3222
+ "n_examples": 100,
3223
+ "per_subtask": {
3224
+ "SA": {
3225
+ "accuracy": 1.0,
3226
+ "count": 300
3227
+ },
3228
+ "SC": {
3229
+ "accuracy": 1.0,
3230
+ "count": 100
3231
+ },
3232
+ "UC": {
3233
+ "accuracy": 1.0,
3234
+ "count": 193
3235
+ },
3236
+ "US": {
3237
+ "accuracy": 1.0,
3238
+ "count": 107
3239
+ }
3240
+ }
3241
+ },
3242
+ "add_C4": {
3243
+ "full_accuracy": 0.99,
3244
+ "n_examples": 100,
3245
+ "per_subtask": {
3246
+ "SA": {
3247
+ "accuracy": 1.0,
3248
+ "count": 200
3249
+ },
3250
+ "SC": {
3251
+ "accuracy": 1.0,
3252
+ "count": 100
3253
+ },
3254
+ "UC": {
3255
+ "accuracy": 0.99609375,
3256
+ "count": 256
3257
+ },
3258
+ "US": {
3259
+ "accuracy": 1.0,
3260
+ "count": 144
3261
+ }
3262
+ }
3263
+ },
3264
+ "add_C5": {
3265
+ "full_accuracy": 1.0,
3266
+ "n_examples": 100,
3267
+ "per_subtask": {
3268
+ "SA": {
3269
+ "accuracy": 1.0,
3270
+ "count": 100
3271
+ },
3272
+ "SC": {
3273
+ "accuracy": 1.0,
3274
+ "count": 100
3275
+ },
3276
+ "UC": {
3277
+ "accuracy": 1.0,
3278
+ "count": 306
3279
+ },
3280
+ "US": {
3281
+ "accuracy": 1.0,
3282
+ "count": 194
3283
+ }
3284
+ }
3285
+ },
3286
+ "add_C6": {
3287
+ "full_accuracy": 1.0,
3288
+ "n_examples": 100,
3289
+ "per_subtask": {
3290
+ "SC": {
3291
+ "accuracy": 1.0,
3292
+ "count": 100
3293
+ },
3294
+ "UC": {
3295
+ "accuracy": 1.0,
3296
+ "count": 366
3297
+ },
3298
+ "US": {
3299
+ "accuracy": 1.0,
3300
+ "count": 234
3301
+ }
3302
+ }
3303
+ },
3304
+ "sub_M0": {
3305
+ "full_accuracy": 1.0,
3306
+ "n_examples": 100,
3307
+ "per_subtask": {
3308
+ "MD": {
3309
+ "accuracy": 1.0,
3310
+ "count": 601
3311
+ },
3312
+ "ME": {
3313
+ "accuracy": 1.0,
3314
+ "count": 99
3315
+ }
3316
+ }
3317
+ },
3318
+ "sub_M1": {
3319
+ "full_accuracy": 1.0,
3320
+ "n_examples": 100,
3321
+ "per_subtask": {
3322
+ "MD": {
3323
+ "accuracy": 1.0,
3324
+ "count": 279
3325
+ },
3326
+ "MB": {
3327
+ "accuracy": 1.0,
3328
+ "count": 145
3329
+ },
3330
+ "ME": {
3331
+ "accuracy": 1.0,
3332
+ "count": 24
3333
+ },
3334
+ "UB": {
3335
+ "accuracy": 1.0,
3336
+ "count": 252
3337
+ }
3338
+ }
3339
+ },
3340
+ "sub_M2": {
3341
+ "full_accuracy": 1.0,
3342
+ "n_examples": 100,
3343
+ "per_subtask": {
3344
+ "MD": {
3345
+ "accuracy": 1.0,
3346
+ "count": 213
3347
+ },
3348
+ "MB": {
3349
+ "accuracy": 1.0,
3350
+ "count": 113
3351
+ },
3352
+ "ME": {
3353
+ "accuracy": 1.0,
3354
+ "count": 85
3355
+ },
3356
+ "UB": {
3357
+ "accuracy": 1.0,
3358
+ "count": 181
3359
+ },
3360
+ "UD": {
3361
+ "accuracy": 1.0,
3362
+ "count": 108
3363
+ }
3364
+ }
3365
+ },
3366
+ "sub_M3": {
3367
+ "full_accuracy": 1.0,
3368
+ "n_examples": 100,
3369
+ "per_subtask": {
3370
+ "MD": {
3371
+ "accuracy": 1.0,
3372
+ "count": 179
3373
+ },
3374
+ "MB": {
3375
+ "accuracy": 1.0,
3376
+ "count": 103
3377
+ },
3378
+ "ME": {
3379
+ "accuracy": 1.0,
3380
+ "count": 56
3381
+ },
3382
+ "UB": {
3383
+ "accuracy": 1.0,
3384
+ "count": 149
3385
+ },
3386
+ "UD": {
3387
+ "accuracy": 1.0,
3388
+ "count": 213
3389
+ }
3390
+ }
3391
+ },
3392
+ "sub_M4": {
3393
+ "full_accuracy": 1.0,
3394
+ "n_examples": 100,
3395
+ "per_subtask": {
3396
+ "MD": {
3397
+ "accuracy": 1.0,
3398
+ "count": 200
3399
+ },
3400
+ "MB": {
3401
+ "accuracy": 1.0,
3402
+ "count": 100
3403
+ },
3404
+ "UB": {
3405
+ "accuracy": 1.0,
3406
+ "count": 100
3407
+ },
3408
+ "UD": {
3409
+ "accuracy": 1.0,
3410
+ "count": 300
3411
+ }
3412
+ }
3413
+ },
3414
+ "sub_M5": {
3415
+ "full_accuracy": 0.93,
3416
+ "n_examples": 100,
3417
+ "per_subtask": {
3418
+ "MD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 100
3421
+ },
3422
+ "MB": {
3423
+ "accuracy": 1.0,
3424
+ "count": 100
3425
+ },
3426
+ "UB": {
3427
+ "accuracy": 0.96,
3428
+ "count": 100
3429
+ },
3430
+ "UD": {
3431
+ "accuracy": 0.9925,
3432
+ "count": 400
3433
+ }
3434
+ }
3435
+ },
3436
+ "sub_random": {
3437
+ "full_accuracy": 1.0,
3438
+ "n_examples": 200,
3439
+ "per_subtask": {
3440
+ "MD": {
3441
+ "accuracy": 1.0,
3442
+ "count": 600
3443
+ },
3444
+ "MB": {
3445
+ "accuracy": 1.0,
3446
+ "count": 267
3447
+ },
3448
+ "ME": {
3449
+ "accuracy": 1.0,
3450
+ "count": 53
3451
+ },
3452
+ "UB": {
3453
+ "accuracy": 1.0,
3454
+ "count": 439
3455
+ },
3456
+ "UD": {
3457
+ "accuracy": 1.0,
3458
+ "count": 41
3459
+ }
3460
+ }
3461
+ },
3462
+ "sub_B3": {
3463
+ "full_accuracy": 1.0,
3464
+ "n_examples": 100,
3465
+ "per_subtask": {
3466
+ "MD": {
3467
+ "accuracy": 1.0,
3468
+ "count": 300
3469
+ },
3470
+ "MB": {
3471
+ "accuracy": 1.0,
3472
+ "count": 100
3473
+ },
3474
+ "UB": {
3475
+ "accuracy": 1.0,
3476
+ "count": 197
3477
+ },
3478
+ "UD": {
3479
+ "accuracy": 1.0,
3480
+ "count": 103
3481
+ }
3482
+ }
3483
+ },
3484
+ "sub_B4": {
3485
+ "full_accuracy": 1.0,
3486
+ "n_examples": 100,
3487
+ "per_subtask": {
3488
+ "MD": {
3489
+ "accuracy": 1.0,
3490
+ "count": 200
3491
+ },
3492
+ "MB": {
3493
+ "accuracy": 1.0,
3494
+ "count": 100
3495
+ },
3496
+ "UB": {
3497
+ "accuracy": 1.0,
3498
+ "count": 247
3499
+ },
3500
+ "UD": {
3501
+ "accuracy": 1.0,
3502
+ "count": 153
3503
+ }
3504
+ }
3505
+ },
3506
+ "sub_B5": {
3507
+ "full_accuracy": 1.0,
3508
+ "n_examples": 100,
3509
+ "per_subtask": {
3510
+ "MD": {
3511
+ "accuracy": 1.0,
3512
+ "count": 100
3513
+ },
3514
+ "MB": {
3515
+ "accuracy": 1.0,
3516
+ "count": 100
3517
+ },
3518
+ "UB": {
3519
+ "accuracy": 1.0,
3520
+ "count": 298
3521
+ },
3522
+ "UD": {
3523
+ "accuracy": 1.0,
3524
+ "count": 202
3525
+ }
3526
+ }
3527
+ }
3528
+ },
3529
+ "summary": {
3530
+ "overall_accuracy": 0.9945833333333334,
3531
+ "total_examples": 2400,
3532
+ "n_splits": 22
3533
+ }
3534
+ },
3535
+ "sorl_overall_accuracy": 0.9945833333333334,
3536
+ "sft_overall_accuracy": 0.9145833333333333
3537
+ }
add_sub_sorl_v1_abs16_K1_100K/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:2653ee350cd31d8cb32a9ea8e72573d552ba4ec8838802acee1f18aaf909b8af
3
+ size 650328152
add_sub_sorl_v1_abs16_K1_100K/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 1,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 4e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 10,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 1562,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs16_K1_100K",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 2,
61
+ "n_head": 3,
62
+ "n_embd": 510,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 16,
65
+ "dataset_size": 100000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 162505382,
71
+ "run_name": "add_sub_sorl_v1_abs16_K1_100K",
72
+ "git_commit": "f447da529caceac8c7d256cbb2cd185cbc50feac",
73
+ "timestamp": "2026-04-12T17:42:20.080941+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "79zwxeez",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/79zwxeez",
81
+ "final_accuracy": 0.9945833333333334,
82
+ "sft_accuracy": 0.9145833333333333,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }