amirali1985 commited on
Commit
4d3539f
·
verified ·
1 Parent(s): 5baa93c

Upload add_sub_sorl_v1_abs70_100K

Browse files
add_sub_sorl_v1_abs70_100K/config.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 510,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 2040,
15
+ "layer_types": [
16
+ "full_attention",
17
+ "full_attention"
18
+ ],
19
+ "max_position_embeddings": 128,
20
+ "max_window_layers": 28,
21
+ "model_type": "qwen3",
22
+ "num_attention_heads": 3,
23
+ "num_hidden_layers": 2,
24
+ "num_key_value_heads": 3,
25
+ "pad_token_id": null,
26
+ "rms_norm_eps": 1e-06,
27
+ "rope_parameters": {
28
+ "rope_theta": 10000.0,
29
+ "rope_type": "default"
30
+ },
31
+ "sliding_window": null,
32
+ "tie_word_embeddings": false,
33
+ "transformers_version": "5.5.0",
34
+ "use_cache": true,
35
+ "use_sliding_window": false,
36
+ "vocab_size": 151714
37
+ }
add_sub_sorl_v1_abs70_100K/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs70_100K/metrics.json ADDED
@@ -0,0 +1,3537 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 800,
20
+ 850,
21
+ 900,
22
+ 950,
23
+ 1000,
24
+ 1050,
25
+ 1100,
26
+ 1150,
27
+ 1200,
28
+ 1250,
29
+ 1300,
30
+ 1350,
31
+ 1400,
32
+ 1450,
33
+ 1500,
34
+ 1550,
35
+ 1613,
36
+ 1663,
37
+ 1713,
38
+ 1763,
39
+ 1813,
40
+ 1863,
41
+ 1913,
42
+ 1963,
43
+ 2013,
44
+ 2063,
45
+ 2113,
46
+ 2163,
47
+ 2213,
48
+ 2263,
49
+ 2313,
50
+ 2363,
51
+ 2413,
52
+ 2463,
53
+ 2513,
54
+ 2563,
55
+ 2613,
56
+ 2663,
57
+ 2713,
58
+ 2763,
59
+ 2813,
60
+ 2863,
61
+ 2913,
62
+ 2963,
63
+ 3013,
64
+ 3063,
65
+ 3113,
66
+ 3176,
67
+ 3226,
68
+ 3276,
69
+ 3326,
70
+ 3376,
71
+ 3426,
72
+ 3476,
73
+ 3526,
74
+ 3576,
75
+ 3626,
76
+ 3676,
77
+ 3726,
78
+ 3776,
79
+ 3826,
80
+ 3876,
81
+ 3926,
82
+ 3976,
83
+ 4026,
84
+ 4076,
85
+ 4126,
86
+ 4176,
87
+ 4226,
88
+ 4276,
89
+ 4326,
90
+ 4376,
91
+ 4426,
92
+ 4476,
93
+ 4526,
94
+ 4576,
95
+ 4626,
96
+ 4676,
97
+ 4739,
98
+ 4789,
99
+ 4839,
100
+ 4889,
101
+ 4939,
102
+ 4989,
103
+ 5039,
104
+ 5089,
105
+ 5139,
106
+ 5189,
107
+ 5239,
108
+ 5289,
109
+ 5339,
110
+ 5389,
111
+ 5439,
112
+ 5489,
113
+ 5539,
114
+ 5589,
115
+ 5639,
116
+ 5689,
117
+ 5739,
118
+ 5789,
119
+ 5839,
120
+ 5889,
121
+ 5939,
122
+ 5989,
123
+ 6039,
124
+ 6089,
125
+ 6139,
126
+ 6189,
127
+ 6239,
128
+ 6302,
129
+ 6352,
130
+ 6402,
131
+ 6452,
132
+ 6502,
133
+ 6552,
134
+ 6602,
135
+ 6652,
136
+ 6702,
137
+ 6752,
138
+ 6802,
139
+ 6852,
140
+ 6902,
141
+ 6952,
142
+ 7002,
143
+ 7052,
144
+ 7102,
145
+ 7152,
146
+ 7202,
147
+ 7252,
148
+ 7302,
149
+ 7352,
150
+ 7402,
151
+ 7452,
152
+ 7502,
153
+ 7552,
154
+ 7602,
155
+ 7652,
156
+ 7702,
157
+ 7752,
158
+ 7802,
159
+ 7865,
160
+ 7915,
161
+ 7965,
162
+ 8015,
163
+ 8065,
164
+ 8115,
165
+ 8165,
166
+ 8215,
167
+ 8265,
168
+ 8315,
169
+ 8365,
170
+ 8415,
171
+ 8465,
172
+ 8515,
173
+ 8565,
174
+ 8615,
175
+ 8665,
176
+ 8715,
177
+ 8765,
178
+ 8815,
179
+ 8865,
180
+ 8915,
181
+ 8965,
182
+ 9015,
183
+ 9065,
184
+ 9115,
185
+ 9165,
186
+ 9215,
187
+ 9265,
188
+ 9315,
189
+ 9365,
190
+ 9428,
191
+ 9478,
192
+ 9528,
193
+ 9578,
194
+ 9628,
195
+ 9678,
196
+ 9728,
197
+ 9778,
198
+ 9828,
199
+ 9878,
200
+ 9928,
201
+ 9978,
202
+ 10028,
203
+ 10078,
204
+ 10128,
205
+ 10178,
206
+ 10228,
207
+ 10278,
208
+ 10328,
209
+ 10378,
210
+ 10428,
211
+ 10478,
212
+ 10528,
213
+ 10578,
214
+ 10628,
215
+ 10678,
216
+ 10728,
217
+ 10778,
218
+ 10828,
219
+ 10878,
220
+ 10928,
221
+ 10991,
222
+ 11041,
223
+ 11091,
224
+ 11141,
225
+ 11191,
226
+ 11241,
227
+ 11291,
228
+ 11341,
229
+ 11391,
230
+ 11441,
231
+ 11491,
232
+ 11541,
233
+ 11591,
234
+ 11641,
235
+ 11691,
236
+ 11741,
237
+ 11791,
238
+ 11841,
239
+ 11891,
240
+ 11941,
241
+ 11991,
242
+ 12041,
243
+ 12091,
244
+ 12141,
245
+ 12191,
246
+ 12241,
247
+ 12291,
248
+ 12341,
249
+ 12391,
250
+ 12441,
251
+ 12491,
252
+ 12554,
253
+ 12604,
254
+ 12654,
255
+ 12704,
256
+ 12754,
257
+ 12804,
258
+ 12854,
259
+ 12904,
260
+ 12954,
261
+ 13004,
262
+ 13054,
263
+ 13104,
264
+ 13154,
265
+ 13204,
266
+ 13254,
267
+ 13304,
268
+ 13354,
269
+ 13404,
270
+ 13454,
271
+ 13504,
272
+ 13554,
273
+ 13604,
274
+ 13654,
275
+ 13704,
276
+ 13754,
277
+ 13804,
278
+ 13854,
279
+ 13904,
280
+ 13954,
281
+ 14004,
282
+ 14054,
283
+ 14117,
284
+ 14167,
285
+ 14217,
286
+ 14267,
287
+ 14317,
288
+ 14367,
289
+ 14417,
290
+ 14467,
291
+ 14517,
292
+ 14567,
293
+ 14617,
294
+ 14667,
295
+ 14717,
296
+ 14767,
297
+ 14817,
298
+ 14867,
299
+ 14917,
300
+ 14967,
301
+ 15017,
302
+ 15067,
303
+ 15117,
304
+ 15167,
305
+ 15217,
306
+ 15267,
307
+ 15317,
308
+ 15367,
309
+ 15417,
310
+ 15467,
311
+ 15517,
312
+ 15567,
313
+ 15617
314
+ ],
315
+ "loss": [
316
+ 15.745485305786133,
317
+ 12.111101150512695,
318
+ 8.688098907470703,
319
+ 7.662339210510254,
320
+ 5.153091907501221,
321
+ 3.735525131225586,
322
+ 2.607950448989868,
323
+ 2.3635735511779785,
324
+ 2.269740581512451,
325
+ 1.8536663055419922,
326
+ 2.110579252243042,
327
+ 1.73744535446167,
328
+ 1.4838066101074219,
329
+ 1.1551334857940674,
330
+ 0.8606105446815491,
331
+ -0.5420317053794861,
332
+ -1.9786415100097656,
333
+ -5.19218635559082,
334
+ -6.521421432495117,
335
+ -8.504491806030273,
336
+ -8.68906021118164,
337
+ -9.980416297912598,
338
+ -10.984786987304688,
339
+ -11.12669849395752,
340
+ -12.1531400680542,
341
+ -12.336996078491211,
342
+ -12.98429012298584,
343
+ -12.650969505310059,
344
+ -13.504485130310059,
345
+ -13.880614280700684,
346
+ -13.229496002197266,
347
+ -14.47417163848877,
348
+ -13.695523262023926,
349
+ -13.4900484085083,
350
+ -14.075793266296387,
351
+ -13.270401954650879,
352
+ -14.080594062805176,
353
+ -14.277887344360352,
354
+ -14.198729515075684,
355
+ -13.764762878417969,
356
+ -13.542289733886719,
357
+ -14.601493835449219,
358
+ -14.072729110717773,
359
+ -13.897228240966797,
360
+ -13.582523345947266,
361
+ -14.607087135314941,
362
+ -14.05154037475586,
363
+ -14.359332084655762,
364
+ -14.434036254882812,
365
+ -14.00304889678955,
366
+ -14.451115608215332,
367
+ -14.104546546936035,
368
+ -13.94878101348877,
369
+ -14.221521377563477,
370
+ -13.815980911254883,
371
+ -13.736690521240234,
372
+ -13.158988952636719,
373
+ -13.692000389099121,
374
+ -14.006065368652344,
375
+ -14.327851295471191,
376
+ -14.33360767364502,
377
+ -14.00327205657959,
378
+ -13.431060791015625,
379
+ -14.111815452575684,
380
+ -14.123462677001953,
381
+ -13.069084167480469,
382
+ -12.345903396606445,
383
+ -11.153604507446289,
384
+ -9.801177978515625,
385
+ -9.01672077178955,
386
+ -7.479533672332764,
387
+ -7.182117938995361,
388
+ -6.600742816925049,
389
+ -6.449777603149414,
390
+ -5.038028240203857,
391
+ -5.620625972747803,
392
+ -5.1884050369262695,
393
+ -5.449138164520264,
394
+ -4.972566604614258,
395
+ -5.019037246704102,
396
+ -5.8771257400512695,
397
+ -4.346200466156006,
398
+ -5.829677581787109,
399
+ -3.929460048675537,
400
+ -4.005841255187988,
401
+ -3.954021692276001,
402
+ -3.9247312545776367,
403
+ -3.7874293327331543,
404
+ -4.137342929840088,
405
+ -3.631946086883545,
406
+ -3.795776128768921,
407
+ -3.6702277660369873,
408
+ -3.6395363807678223,
409
+ -2.9685635566711426,
410
+ -3.527247667312622,
411
+ -3.400318145751953,
412
+ -3.0507147312164307,
413
+ -2.8359832763671875,
414
+ -2.8940179347991943,
415
+ -3.1444623470306396,
416
+ -2.8155367374420166,
417
+ -2.8892080783843994,
418
+ -3.103070020675659,
419
+ -2.5470175743103027,
420
+ -2.6847221851348877,
421
+ -2.423678159713745,
422
+ -2.263305425643921,
423
+ -2.0734896659851074,
424
+ -2.357597589492798,
425
+ -2.2026429176330566,
426
+ -2.0292112827301025,
427
+ -2.156585216522217,
428
+ -1.9658671617507935,
429
+ -2.144821882247925,
430
+ -2.7632017135620117,
431
+ -2.0000717639923096,
432
+ -2.1257712841033936,
433
+ -2.0397377014160156,
434
+ -2.131657838821411,
435
+ -2.2364962100982666,
436
+ -1.737606167793274,
437
+ -3.416055202484131,
438
+ -1.4052796363830566,
439
+ -1.6089859008789062,
440
+ -2.2010209560394287,
441
+ -1.9943928718566895,
442
+ -2.0204389095306396,
443
+ -1.4130545854568481,
444
+ -2.4625351428985596,
445
+ -1.4854553937911987,
446
+ -1.8527801036834717,
447
+ -1.5017026662826538,
448
+ -1.5360091924667358,
449
+ -1.3850282430648804,
450
+ -1.5596262216567993,
451
+ -1.8482146263122559,
452
+ -1.4947919845581055,
453
+ -1.800887107849121,
454
+ -1.3769874572753906,
455
+ -1.4963473081588745,
456
+ -1.5607776641845703,
457
+ -1.3631064891815186,
458
+ -1.6475448608398438,
459
+ -1.3457427024841309,
460
+ -1.5554670095443726,
461
+ -1.341086983680725,
462
+ -1.3120797872543335,
463
+ -1.2237696647644043,
464
+ -1.2719624042510986,
465
+ -1.4146528244018555,
466
+ -1.7828205823898315,
467
+ -1.7062568664550781,
468
+ -1.50191330909729,
469
+ -1.1606098413467407,
470
+ -1.4483414888381958,
471
+ -1.3426216840744019,
472
+ -1.3150863647460938,
473
+ -1.595462441444397,
474
+ -2.0584230422973633,
475
+ -1.2525500059127808,
476
+ -1.0609592199325562,
477
+ -1.209620475769043,
478
+ -1.610905408859253,
479
+ -1.3973740339279175,
480
+ -1.1834378242492676,
481
+ -1.2822691202163696,
482
+ -1.4483617544174194,
483
+ -1.851280689239502,
484
+ -1.3067349195480347,
485
+ -0.9041375517845154,
486
+ -1.5270408391952515,
487
+ -1.0312458276748657,
488
+ -1.381829023361206,
489
+ -1.2376768589019775,
490
+ -1.1838841438293457,
491
+ -1.2037440538406372,
492
+ -1.167670488357544,
493
+ -1.975407361984253,
494
+ -1.1881239414215088,
495
+ -1.2769267559051514,
496
+ -1.51146399974823,
497
+ -1.393563985824585,
498
+ -1.1670476198196411,
499
+ -1.1838637590408325,
500
+ -1.2354512214660645,
501
+ -1.330101490020752,
502
+ -1.0780541896820068,
503
+ -0.9247320890426636,
504
+ -1.3360766172409058,
505
+ -0.9906800985336304,
506
+ -1.3341649770736694,
507
+ -0.9367088079452515,
508
+ -1.0170704126358032,
509
+ -1.2342417240142822,
510
+ -0.9409386515617371,
511
+ -1.1774961948394775,
512
+ -1.4847350120544434,
513
+ -0.8936091065406799,
514
+ -0.8424043655395508,
515
+ -0.9152222871780396,
516
+ -1.2678248882293701,
517
+ -1.1446444988250732,
518
+ -1.222661018371582,
519
+ -0.9633662700653076,
520
+ -1.0385525226593018,
521
+ -0.9137232899665833,
522
+ -1.0190773010253906,
523
+ -0.8557896018028259,
524
+ -0.8860712051391602,
525
+ -1.1912087202072144,
526
+ -1.3398643732070923,
527
+ -0.7046958208084106,
528
+ -0.8662760257720947,
529
+ -0.9078179597854614,
530
+ -0.9039081931114197,
531
+ -1.1256135702133179,
532
+ -1.0441449880599976,
533
+ -0.9961947202682495,
534
+ -0.7966858744621277,
535
+ -0.7069897055625916,
536
+ -0.9014972448348999,
537
+ -0.878194272518158,
538
+ -0.694083034992218,
539
+ -1.035062313079834,
540
+ -0.6719993948936462,
541
+ -0.8185563087463379,
542
+ -1.0316808223724365,
543
+ -1.0586570501327515,
544
+ -0.6989405751228333,
545
+ -0.9158240556716919,
546
+ -0.630041241645813,
547
+ -0.9732574224472046,
548
+ -0.7749252915382385,
549
+ -1.0481270551681519,
550
+ -0.7896981239318848,
551
+ -0.8524516820907593,
552
+ -0.8393667936325073,
553
+ -1.1963506937026978,
554
+ -0.8570467233657837,
555
+ -0.7653064131736755,
556
+ -0.8306721448898315,
557
+ -0.8403700590133667,
558
+ -0.8288451433181763,
559
+ -0.6389251351356506,
560
+ -0.9450255632400513,
561
+ -0.9943042397499084,
562
+ -0.8688981533050537,
563
+ -0.8509131073951721,
564
+ -0.7889793515205383,
565
+ -0.6726685762405396,
566
+ -0.6617797017097473,
567
+ -0.5594507455825806,
568
+ -0.9815265536308289,
569
+ -0.8038948178291321,
570
+ -0.6824551820755005,
571
+ -0.6856938004493713,
572
+ -0.5018048286437988,
573
+ -0.6337124109268188,
574
+ -0.5932860374450684,
575
+ -0.8555293083190918,
576
+ -0.9893091320991516,
577
+ -0.8064727187156677,
578
+ -0.5684929490089417,
579
+ -0.7127496004104614,
580
+ -0.7534486055374146,
581
+ -0.6665985584259033,
582
+ -0.56135094165802,
583
+ -0.6397708654403687,
584
+ -0.6071538925170898,
585
+ -0.7273363471031189,
586
+ -0.5128734707832336,
587
+ -0.6393722891807556,
588
+ -0.729474663734436,
589
+ -0.6338003873825073,
590
+ -0.6954477429389954,
591
+ -0.7880577445030212,
592
+ -0.7830257415771484,
593
+ -0.601180911064148,
594
+ -0.6578355431556702,
595
+ -0.6298449635505676,
596
+ -0.5262075662612915,
597
+ -0.593431830406189,
598
+ -0.5402166843414307,
599
+ -0.6533572673797607,
600
+ -0.3860713243484497,
601
+ -0.784864068031311,
602
+ -0.7605255842208862,
603
+ -0.6784576773643494,
604
+ -0.7199658751487732,
605
+ -0.8685442805290222,
606
+ -0.5253223180770874,
607
+ -0.4623960852622986,
608
+ -0.5535212755203247,
609
+ -0.5872893929481506,
610
+ -0.592187225818634,
611
+ -0.7782663106918335,
612
+ -0.6775127053260803,
613
+ -0.5392772555351257,
614
+ -0.5953889489173889,
615
+ -0.47411519289016724,
616
+ -0.5348408818244934,
617
+ -0.5214688777923584,
618
+ -0.381331205368042,
619
+ -0.4691905081272125,
620
+ -0.5091303586959839,
621
+ -0.606124758720398,
622
+ -0.6473522782325745,
623
+ -0.5565692186355591,
624
+ -0.6980366110801697,
625
+ -0.6461753249168396
626
+ ],
627
+ "base_loss": [
628
+ 10.605161666870117,
629
+ 8.040678024291992,
630
+ 7.333432197570801,
631
+ 6.27871561050415,
632
+ 5.253532409667969,
633
+ 3.5272746086120605,
634
+ 2.136018991470337,
635
+ 2.044652223587036,
636
+ 1.9119266271591187,
637
+ 1.8299065828323364,
638
+ 1.836234450340271,
639
+ 1.7979004383087158,
640
+ 1.857666015625,
641
+ 1.8216068744659424,
642
+ 1.7819855213165283,
643
+ 1.85440194606781,
644
+ 1.8007665872573853,
645
+ 2.045675277709961,
646
+ 1.933180809020996,
647
+ 1.9491740465164185,
648
+ 1.8485418558120728,
649
+ 1.8433297872543335,
650
+ 1.8656617403030396,
651
+ 1.7364046573638916,
652
+ 1.763675570487976,
653
+ 1.676373839378357,
654
+ 1.7110265493392944,
655
+ 1.615490198135376,
656
+ 1.6555925607681274,
657
+ 1.6771615743637085,
658
+ 1.5803605318069458,
659
+ 1.698895812034607,
660
+ 1.6376783847808838,
661
+ 1.5982328653335571,
662
+ 1.639822244644165,
663
+ 1.5648831129074097,
664
+ 1.6399648189544678,
665
+ 1.6553243398666382,
666
+ 1.6260439157485962,
667
+ 1.5946561098098755,
668
+ 1.5571329593658447,
669
+ 1.6678483486175537,
670
+ 1.5978716611862183,
671
+ 1.579860806465149,
672
+ 1.547479510307312,
673
+ 1.6490713357925415,
674
+ 1.5853873491287231,
675
+ 1.6186771392822266,
676
+ 1.629547119140625,
677
+ 1.5803824663162231,
678
+ 1.6232846975326538,
679
+ 1.5827962160110474,
680
+ 1.5661370754241943,
681
+ 1.595491647720337,
682
+ 1.5508081912994385,
683
+ 1.5436824560165405,
684
+ 1.4762951135635376,
685
+ 1.534109354019165,
686
+ 1.5676032304763794,
687
+ 1.6045726537704468,
688
+ 1.6091138124465942,
689
+ 1.5710519552230835,
690
+ 1.5058962106704712,
691
+ 1.5800859928131104,
692
+ 1.5821422338485718,
693
+ 1.4647464752197266,
694
+ 1.3848673105239868,
695
+ 1.2519539594650269,
696
+ 1.1015363931655884,
697
+ 1.0217984914779663,
698
+ 0.845373272895813,
699
+ 0.8137518167495728,
700
+ 0.7536793947219849,
701
+ 0.734664261341095,
702
+ 0.6096369624137878,
703
+ 0.6363228559494019,
704
+ 0.5888699889183044,
705
+ 0.6166903376579285,
706
+ 0.5632797479629517,
707
+ 0.5683057904243469,
708
+ 0.6647682189941406,
709
+ 0.49327102303504944,
710
+ 0.6592168807983398,
711
+ 0.4475482404232025,
712
+ 0.45858272910118103,
713
+ 0.4504123330116272,
714
+ 0.4464643597602844,
715
+ 0.434716135263443,
716
+ 0.4710227847099304,
717
+ 0.41418787837028503,
718
+ 0.4333138167858124,
719
+ 0.41829705238342285,
720
+ 0.41405433416366577,
721
+ 0.34256479144096375,
722
+ 0.4015984535217285,
723
+ 0.3865906894207001,
724
+ 0.34953573346138,
725
+ 0.3254949152469635,
726
+ 0.33393600583076477,
727
+ 0.36152055859565735,
728
+ 0.3228608965873718,
729
+ 0.33522674441337585,
730
+ 0.3540439009666443,
731
+ 0.29312536120414734,
732
+ 0.31177449226379395,
733
+ 0.2804255187511444,
734
+ 0.2624456286430359,
735
+ 0.24266862869262695,
736
+ 0.27142927050590515,
737
+ 0.256727010011673,
738
+ 0.23595015704631805,
739
+ 0.24898859858512878,
740
+ 0.22764110565185547,
741
+ 0.25850754976272583,
742
+ 0.31883153319358826,
743
+ 0.23297050595283508,
744
+ 0.24542836844921112,
745
+ 0.2364697903394699,
746
+ 0.24855555593967438,
747
+ 0.2585849165916443,
748
+ 0.2022559493780136,
749
+ 0.3883301913738251,
750
+ 0.1663922220468521,
751
+ 0.18828082084655762,
752
+ 0.25600293278694153,
753
+ 0.23163311183452606,
754
+ 0.23427070677280426,
755
+ 0.1647852659225464,
756
+ 0.2818305194377899,
757
+ 0.17450526356697083,
758
+ 0.21574051678180695,
759
+ 0.17741680145263672,
760
+ 0.18111097812652588,
761
+ 0.16546352207660675,
762
+ 0.18169072270393372,
763
+ 0.21692071855068207,
764
+ 0.17771503329277039,
765
+ 0.20947639644145966,
766
+ 0.16193951666355133,
767
+ 0.1745607554912567,
768
+ 0.1820065975189209,
769
+ 0.15958893299102783,
770
+ 0.1951303482055664,
771
+ 0.15986397862434387,
772
+ 0.1828688383102417,
773
+ 0.15678441524505615,
774
+ 0.15453293919563293,
775
+ 0.14549635350704193,
776
+ 0.15015602111816406,
777
+ 0.16589994728565216,
778
+ 0.2083023488521576,
779
+ 0.19756896793842316,
780
+ 0.1769312620162964,
781
+ 0.13748231530189514,
782
+ 0.16848985850811005,
783
+ 0.15637251734733582,
784
+ 0.1542062908411026,
785
+ 0.18510974943637848,
786
+ 0.23901475965976715,
787
+ 0.14729569852352142,
788
+ 0.13061518967151642,
789
+ 0.1632332056760788,
790
+ 0.18807141482830048,
791
+ 0.16241005063056946,
792
+ 0.13961409032344818,
793
+ 0.15025213360786438,
794
+ 0.16993758082389832,
795
+ 0.2136787623167038,
796
+ 0.15274199843406677,
797
+ 0.11502443999052048,
798
+ 0.17928506433963776,
799
+ 0.12414716929197311,
800
+ 0.16716186702251434,
801
+ 0.14670038223266602,
802
+ 0.1401141881942749,
803
+ 0.1426459550857544,
804
+ 0.1390915811061859,
805
+ 0.22745878994464874,
806
+ 0.14163002371788025,
807
+ 0.15047256648540497,
808
+ 0.1763717383146286,
809
+ 0.16612128913402557,
810
+ 0.13839386403560638,
811
+ 0.14029578864574432,
812
+ 0.14828573167324066,
813
+ 0.15654674172401428,
814
+ 0.12895287573337555,
815
+ 0.10966147482395172,
816
+ 0.1566745936870575,
817
+ 0.11825021356344223,
818
+ 0.15899570286273956,
819
+ 0.11417065560817719,
820
+ 0.12207361310720444,
821
+ 0.1464504897594452,
822
+ 0.11314932256937027,
823
+ 0.14121291041374207,
824
+ 0.1731998473405838,
825
+ 0.10785476118326187,
826
+ 0.10474668443202972,
827
+ 0.11097441613674164,
828
+ 0.14920303225517273,
829
+ 0.1357085406780243,
830
+ 0.14436888694763184,
831
+ 0.11719918251037598,
832
+ 0.12284661829471588,
833
+ 0.11041203886270523,
834
+ 0.12166093289852142,
835
+ 0.10262764990329742,
836
+ 0.10752516239881516,
837
+ 0.14113996922969818,
838
+ 0.15606527030467987,
839
+ 0.08586384356021881,
840
+ 0.10451855510473251,
841
+ 0.10989884287118912,
842
+ 0.10847078263759613,
843
+ 0.1371469348669052,
844
+ 0.12350263446569443,
845
+ 0.11938208341598511,
846
+ 0.09504014253616333,
847
+ 0.0879065990447998,
848
+ 0.10795427858829498,
849
+ 0.10538385808467865,
850
+ 0.08429454267024994,
851
+ 0.12348323315382004,
852
+ 0.08275620639324188,
853
+ 0.09877373278141022,
854
+ 0.12323183566331863,
855
+ 0.12549912929534912,
856
+ 0.08515826612710953,
857
+ 0.1083882674574852,
858
+ 0.07765626907348633,
859
+ 0.1146833747625351,
860
+ 0.09415219724178314,
861
+ 0.12638306617736816,
862
+ 0.09567337483167648,
863
+ 0.10269604623317719,
864
+ 0.10050521790981293,
865
+ 0.13955256342887878,
866
+ 0.10265278071165085,
867
+ 0.09245339781045914,
868
+ 0.1012834683060646,
869
+ 0.10195635259151459,
870
+ 0.0989336296916008,
871
+ 0.07850481569766998,
872
+ 0.11410516500473022,
873
+ 0.11699012666940689,
874
+ 0.10463123768568039,
875
+ 0.10138637572526932,
876
+ 0.09315840154886246,
877
+ 0.08152943849563599,
878
+ 0.08043662458658218,
879
+ 0.0696566104888916,
880
+ 0.11788948625326157,
881
+ 0.09615107625722885,
882
+ 0.084773488342762,
883
+ 0.08405060321092606,
884
+ 0.06331674009561539,
885
+ 0.0781053826212883,
886
+ 0.07224418967962265,
887
+ 0.10328739136457443,
888
+ 0.1186985969543457,
889
+ 0.09797065705060959,
890
+ 0.07149884849786758,
891
+ 0.08715981990098953,
892
+ 0.09124607592821121,
893
+ 0.08693216741085052,
894
+ 0.07098497450351715,
895
+ 0.07794861495494843,
896
+ 0.07411247491836548,
897
+ 0.08904915302991867,
898
+ 0.06491655856370926,
899
+ 0.0776715949177742,
900
+ 0.08977745473384857,
901
+ 0.07693883031606674,
902
+ 0.08406933397054672,
903
+ 0.09536425024271011,
904
+ 0.09354664385318756,
905
+ 0.07439922541379929,
906
+ 0.08047791570425034,
907
+ 0.07951271533966064,
908
+ 0.0660519227385521,
909
+ 0.07324367016553879,
910
+ 0.06856359541416168,
911
+ 0.08066720515489578,
912
+ 0.0501202717423439,
913
+ 0.09389287978410721,
914
+ 0.09163025766611099,
915
+ 0.08235735446214676,
916
+ 0.08668408542871475,
917
+ 0.104389987885952,
918
+ 0.06577304750680923,
919
+ 0.05824172496795654,
920
+ 0.06805268675088882,
921
+ 0.07189692556858063,
922
+ 0.07321818172931671,
923
+ 0.09301216155290604,
924
+ 0.08259880542755127,
925
+ 0.06701328605413437,
926
+ 0.07296095043420792,
927
+ 0.05979323387145996,
928
+ 0.06692303717136383,
929
+ 0.06562996655702591,
930
+ 0.04991487041115761,
931
+ 0.05980746075510979,
932
+ 0.06248386576771736,
933
+ 0.0744619369506836,
934
+ 0.08007364720106125,
935
+ 0.06882565468549728,
936
+ 0.08849557489156723,
937
+ 0.07901816070079803
938
+ ],
939
+ "info_loss": [
940
+ -0.11871623992919922,
941
+ -0.14137744903564453,
942
+ -0.27831506729125977,
943
+ -0.1530928611755371,
944
+ -0.20770788192749023,
945
+ -0.09761548042297363,
946
+ -0.049141645431518555,
947
+ -0.0583651065826416,
948
+ -0.05298948287963867,
949
+ -0.08501315116882324,
950
+ -0.0592193603515625,
951
+ -0.09322202205657959,
952
+ -0.12354552745819092,
953
+ -0.15344345569610596,
954
+ -0.17847394943237305,
955
+ -0.3257317543029785,
956
+ -0.46242451667785645,
957
+ -0.8056128025054932,
958
+ -0.9225881099700928,
959
+ -1.1132266521453857,
960
+ -1.1149460077285767,
961
+ -1.2374181747436523,
962
+ -1.3308024406433105,
963
+ -1.3271249532699585,
964
+ -1.4295438528060913,
965
+ -1.436357855796814,
966
+ -1.501106858253479,
967
+ -1.4593278169631958,
968
+ -1.5458439588546753,
969
+ -1.5861430168151855,
970
+ -1.5073487758636475,
971
+ -1.6434880495071411,
972
+ -1.5584927797317505,
973
+ -1.5328888893127441,
974
+ -1.5932952165603638,
975
+ -1.504364013671875,
976
+ -1.5911858081817627,
977
+ -1.6138381958007812,
978
+ -1.602057933807373,
979
+ -1.5550190210342407,
980
+ -1.5279000997543335,
981
+ -1.6439439058303833,
982
+ -1.5867046117782593,
983
+ -1.5650498867034912,
984
+ -1.5295556783676147,
985
+ -1.6402710676193237,
986
+ -1.5791656970977783,
987
+ -1.6110172271728516,
988
+ -1.6211673021316528,
989
+ -1.5715925693511963,
990
+ -1.620406150817871,
991
+ -1.5801424980163574,
992
+ -1.5641402006149292,
993
+ -1.5935267210006714,
994
+ -1.5490223169326782,
995
+ -1.5424306392669678,
996
+ -1.4748547077178955,
997
+ -1.5328766107559204,
998
+ -1.5664801597595215,
999
+ -1.603726863861084,
1000
+ -1.6080092191696167,
1001
+ -1.5664794445037842,
1002
+ -1.503515601158142,
1003
+ -1.5792337656021118,
1004
+ -1.580399751663208,
1005
+ -1.4628851413726807,
1006
+ -1.3819822072982788,
1007
+ -1.2503565549850464,
1008
+ -1.0993303060531616,
1009
+ -1.0141922235488892,
1010
+ -0.8425378203392029,
1011
+ -0.8103099465370178,
1012
+ -0.7460905909538269,
1013
+ -0.7272024750709534,
1014
+ -0.574376106262207,
1015
+ -0.6344446539878845,
1016
+ -0.5875888466835022,
1017
+ -0.6155530214309692,
1018
+ -0.5619609355926514,
1019
+ -0.5675796270370483,
1020
+ -0.6624935865402222,
1021
+ -0.4922202527523041,
1022
+ -0.6576066017150879,
1023
+ -0.4468822181224823,
1024
+ -0.45621412992477417,
1025
+ -0.44929325580596924,
1026
+ -0.44582489132881165,
1027
+ -0.4315442442893982,
1028
+ -0.47013962268829346,
1029
+ -0.41347256302833557,
1030
+ -0.4320799708366394,
1031
+ -0.41779038310050964,
1032
+ -0.41327568888664246,
1033
+ -0.3419603109359741,
1034
+ -0.40124937891960144,
1035
+ -0.3858768939971924,
1036
+ -0.34896141290664673,
1037
+ -0.32399991154670715,
1038
+ -0.3315870463848114,
1039
+ -0.3593605160713196,
1040
+ -0.3226620852947235,
1041
+ -0.33104127645492554,
1042
+ -0.35347723960876465,
1043
+ -0.2920803427696228,
1044
+ -0.3079918622970581,
1045
+ -0.2797461450099945,
1046
+ -0.26059624552726746,
1047
+ -0.24012351036071777,
1048
+ -0.27054256200790405,
1049
+ -0.2565530240535736,
1050
+ -0.23481540381908417,
1051
+ -0.24855494499206543,
1052
+ -0.22735653817653656,
1053
+ -0.24865524470806122,
1054
+ -0.3175896108150482,
1055
+ -0.2319718897342682,
1056
+ -0.2450624704360962,
1057
+ -0.23596806824207306,
1058
+ -0.24763233959674835,
1059
+ -0.25789570808410645,
1060
+ -0.20208360254764557,
1061
+ -0.3878355324268341,
1062
+ -0.1660861074924469,
1063
+ -0.1880086362361908,
1064
+ -0.2552400529384613,
1065
+ -0.2314588874578476,
1066
+ -0.2339198887348175,
1067
+ -0.16447849571704865,
1068
+ -0.28169310092926025,
1069
+ -0.17403823137283325,
1070
+ -0.21548306941986084,
1071
+ -0.17581123113632202,
1072
+ -0.1803392618894577,
1073
+ -0.1650605946779251,
1074
+ -0.1814371794462204,
1075
+ -0.21547359228134155,
1076
+ -0.17492720484733582,
1077
+ -0.20845045149326324,
1078
+ -0.16139690577983856,
1079
+ -0.17442575097084045,
1080
+ -0.18162329494953156,
1081
+ -0.15935660898685455,
1082
+ -0.1947454810142517,
1083
+ -0.1596723347902298,
1084
+ -0.18266050517559052,
1085
+ -0.15669506788253784,
1086
+ -0.15445366501808167,
1087
+ -0.14542245864868164,
1088
+ -0.1500117927789688,
1089
+ -0.1657772809267044,
1090
+ -0.20730118453502655,
1091
+ -0.1968885213136673,
1092
+ -0.1759709268808365,
1093
+ -0.1373818963766098,
1094
+ -0.16828355193138123,
1095
+ -0.15632285177707672,
1096
+ -0.1541530042886734,
1097
+ -0.18477436900138855,
1098
+ -0.23842284083366394,
1099
+ -0.14703422784805298,
1100
+ -0.12765443325042725,
1101
+ -0.14535963535308838,
1102
+ -0.18799753487110138,
1103
+ -0.1622273027896881,
1104
+ -0.13954323530197144,
1105
+ -0.14984118938446045,
1106
+ -0.16965319216251373,
1107
+ -0.21306651830673218,
1108
+ -0.1525978446006775,
1109
+ -0.1124684140086174,
1110
+ -0.17801117897033691,
1111
+ -0.1240897998213768,
1112
+ -0.1620187759399414,
1113
+ -0.1460704207420349,
1114
+ -0.1397659331560135,
1115
+ -0.14243143796920776,
1116
+ -0.1384785920381546,
1117
+ -0.2272264063358307,
1118
+ -0.14157363772392273,
1119
+ -0.15038394927978516,
1120
+ -0.17587241530418396,
1121
+ -0.16556702554225922,
1122
+ -0.13828729093074799,
1123
+ -0.13996198773384094,
1124
+ -0.14555414021015167,
1125
+ -0.15643732249736786,
1126
+ -0.1286497712135315,
1127
+ -0.10931475460529327,
1128
+ -0.15654276311397552,
1129
+ -0.11817201972007751,
1130
+ -0.15730591118335724,
1131
+ -0.11406108736991882,
1132
+ -0.12194474041461945,
1133
+ -0.14630363881587982,
1134
+ -0.11232269555330276,
1135
+ -0.1398424506187439,
1136
+ -0.1729625016450882,
1137
+ -0.10761153697967529,
1138
+ -0.10124911367893219,
1139
+ -0.11021573841571808,
1140
+ -0.14916908740997314,
1141
+ -0.13568000495433807,
1142
+ -0.1437206268310547,
1143
+ -0.1160874143242836,
1144
+ -0.12278911471366882,
1145
+ -0.11030962318181992,
1146
+ -0.12157618999481201,
1147
+ -0.10260012000799179,
1148
+ -0.10745620727539062,
1149
+ -0.13962514698505402,
1150
+ -0.15587244927883148,
1151
+ -0.08550996333360672,
1152
+ -0.10447712242603302,
1153
+ -0.10986152291297913,
1154
+ -0.10843180865049362,
1155
+ -0.132799431681633,
1156
+ -0.12327650934457779,
1157
+ -0.1192261204123497,
1158
+ -0.09495997428894043,
1159
+ -0.08783882856369019,
1160
+ -0.10792768746614456,
1161
+ -0.10432849824428558,
1162
+ -0.08426912128925323,
1163
+ -0.12343040853738785,
1164
+ -0.08272845298051834,
1165
+ -0.09874361008405685,
1166
+ -0.12303923070430756,
1167
+ -0.12547725439071655,
1168
+ -0.08496551960706711,
1169
+ -0.1083354726433754,
1170
+ -0.07763051986694336,
1171
+ -0.11461926251649857,
1172
+ -0.09409280121326447,
1173
+ -0.12636896967887878,
1174
+ -0.09553775936365128,
1175
+ -0.10268252342939377,
1176
+ -0.10048936307430267,
1177
+ -0.13953720033168793,
1178
+ -0.10260877013206482,
1179
+ -0.09243543446063995,
1180
+ -0.10126668214797974,
1181
+ -0.10184351354837418,
1182
+ -0.09890984743833542,
1183
+ -0.07839582115411758,
1184
+ -0.11393488198518753,
1185
+ -0.1169787347316742,
1186
+ -0.10461471229791641,
1187
+ -0.10137353837490082,
1188
+ -0.09313812106847763,
1189
+ -0.08150708675384521,
1190
+ -0.08026055991649628,
1191
+ -0.0696309357881546,
1192
+ -0.11784257739782333,
1193
+ -0.09613538533449173,
1194
+ -0.08474813401699066,
1195
+ -0.0840376764535904,
1196
+ -0.06305735558271408,
1197
+ -0.07809284329414368,
1198
+ -0.07223228365182877,
1199
+ -0.10327018052339554,
1200
+ -0.11867464333772659,
1201
+ -0.09795786440372467,
1202
+ -0.0714866891503334,
1203
+ -0.08673679083585739,
1204
+ -0.09118502587080002,
1205
+ -0.08327877521514893,
1206
+ -0.07097714394330978,
1207
+ -0.07780350744724274,
1208
+ -0.07409871369600296,
1209
+ -0.08903937041759491,
1210
+ -0.06490036100149155,
1211
+ -0.07765685021877289,
1212
+ -0.08974980562925339,
1213
+ -0.07693041861057281,
1214
+ -0.08406312018632889,
1215
+ -0.09535522013902664,
1216
+ -0.09353701770305634,
1217
+ -0.07436812669038773,
1218
+ -0.08039438724517822,
1219
+ -0.07950684428215027,
1220
+ -0.06602951139211655,
1221
+ -0.07323478162288666,
1222
+ -0.06851720064878464,
1223
+ -0.08064503967761993,
1224
+ -0.050105925649404526,
1225
+ -0.09388339519500732,
1226
+ -0.09162209182977676,
1227
+ -0.0823427215218544,
1228
+ -0.08666205406188965,
1229
+ -0.10436543822288513,
1230
+ -0.06575608253479004,
1231
+ -0.05822037532925606,
1232
+ -0.06804681569337845,
1233
+ -0.07189025729894638,
1234
+ -0.07319743931293488,
1235
+ -0.09294571727514267,
1236
+ -0.08258873224258423,
1237
+ -0.06700537353754044,
1238
+ -0.0729491114616394,
1239
+ -0.059782713651657104,
1240
+ -0.06691405922174454,
1241
+ -0.06561791151762009,
1242
+ -0.04990833252668381,
1243
+ -0.05980100482702255,
1244
+ -0.062476858496665955,
1245
+ -0.07444346696138382,
1246
+ -0.08006814867258072,
1247
+ -0.06881572306156158,
1248
+ -0.08848292380571365,
1249
+ -0.07901027798652649
1250
+ ],
1251
+ "abs_loss": [
1252
+ 4.248014450073242,
1253
+ 4.234400749206543,
1254
+ 4.188644886016846,
1255
+ 4.105509281158447,
1256
+ 3.925417423248291,
1257
+ 3.289015769958496,
1258
+ 3.1008191108703613,
1259
+ 2.9618568420410156,
1260
+ 3.020190954208374,
1261
+ 2.9729349613189697,
1262
+ 2.8805203437805176,
1263
+ 3.0525832176208496,
1264
+ 2.9079132080078125,
1265
+ 2.9795520305633545,
1266
+ 2.9216318130493164,
1267
+ 3.0001397132873535,
1268
+ 2.919717311859131,
1269
+ 2.9154083728790283,
1270
+ 2.957773208618164,
1271
+ 2.91117787361145,
1272
+ 2.740760326385498,
1273
+ 2.5675408840179443,
1274
+ 2.148101329803467,
1275
+ 2.039168357849121,
1276
+ 1.8643121719360352,
1277
+ 1.7577546834945679,
1278
+ 1.5585510730743408,
1279
+ 1.7541223764419556,
1280
+ 1.645475149154663,
1281
+ 1.5547354221343994,
1282
+ 1.5044190883636475,
1283
+ 1.5476247072219849,
1284
+ 1.5362157821655273,
1285
+ 1.439476728439331,
1286
+ 1.419737696647644,
1287
+ 1.427870273590088,
1288
+ 1.2846004962921143,
1289
+ 1.4998186826705933,
1290
+ 1.4611632823944092,
1291
+ 1.4195325374603271,
1292
+ 1.2427997589111328,
1293
+ 1.3025373220443726,
1294
+ 1.525195598602295,
1295
+ 1.1897931098937988,
1296
+ 1.1708741188049316,
1297
+ 1.1220957040786743,
1298
+ 1.1160176992416382,
1299
+ 0.9629797339439392,
1300
+ 1.0605902671813965,
1301
+ 0.876197874546051,
1302
+ 0.9425597190856934,
1303
+ 0.6959391832351685,
1304
+ 0.6551886200904846,
1305
+ 0.6491069793701172,
1306
+ 0.8603583574295044,
1307
+ 0.7898715734481812,
1308
+ 0.796775221824646,
1309
+ 0.6029624342918396,
1310
+ 0.5876208543777466,
1311
+ 0.6276936531066895,
1312
+ 0.6227383613586426,
1313
+ 0.5754898190498352,
1314
+ 0.6257544159889221,
1315
+ 0.6736498475074768,
1316
+ 0.5511360168457031,
1317
+ 0.4754224419593811,
1318
+ 0.5097036361694336,
1319
+ 0.6583508253097534,
1320
+ 0.6496922969818115,
1321
+ 0.6905272603034973,
1322
+ 0.5980067253112793,
1323
+ 0.6397318243980408,
1324
+ 0.42971271276474,
1325
+ 0.5821137428283691,
1326
+ 0.4668859839439392,
1327
+ 0.582308292388916,
1328
+ 0.5925179719924927,
1329
+ 0.48843228816986084,
1330
+ 0.5182346105575562,
1331
+ 0.5913019180297852,
1332
+ 0.5356505513191223,
1333
+ 0.5443198680877686,
1334
+ 0.4625856876373291,
1335
+ 0.5666908025741577,
1336
+ 0.5563081502914429,
1337
+ 0.6170629262924194,
1338
+ 0.6245989203453064,
1339
+ 0.41324830055236816,
1340
+ 0.6230974793434143,
1341
+ 0.49977999925613403,
1342
+ 0.5869432091712952,
1343
+ 0.4126822054386139,
1344
+ 0.4490078389644623,
1345
+ 0.5880581140518188,
1346
+ 0.5484663248062134,
1347
+ 0.4388089179992676,
1348
+ 0.5843925476074219,
1349
+ 0.5470926761627197,
1350
+ 0.4574468433856964,
1351
+ 0.5226950645446777,
1352
+ 0.5557544231414795,
1353
+ 0.4983421266078949,
1354
+ 0.5043578147888184,
1355
+ 0.48045799136161804,
1356
+ 0.5108127593994141,
1357
+ 0.5677489638328552,
1358
+ 0.44493192434310913,
1359
+ 0.4161803126335144,
1360
+ 0.5129793882369995,
1361
+ 0.5522379875183105,
1362
+ 0.5025249123573303,
1363
+ 0.48488345742225647,
1364
+ 0.4656607508659363,
1365
+ 0.3821223974227905,
1366
+ 0.45388126373291016,
1367
+ 0.5386711359024048,
1368
+ 0.5228223204612732,
1369
+ 0.4839162230491638,
1370
+ 0.4646385610103607,
1371
+ 0.44527536630630493,
1372
+ 0.48525339365005493,
1373
+ 0.523290753364563,
1374
+ 0.505596399307251,
1375
+ 0.49558740854263306,
1376
+ 0.5670284032821655,
1377
+ 0.4900159537792206,
1378
+ 0.5530015826225281,
1379
+ 0.4023090600967407,
1380
+ 0.3795967102050781,
1381
+ 0.45430195331573486,
1382
+ 0.4961245656013489,
1383
+ 0.37589558959007263,
1384
+ 0.5071943998336792,
1385
+ 0.39159664511680603,
1386
+ 0.3987557888031006,
1387
+ 0.4503222703933716,
1388
+ 0.40217238664627075,
1389
+ 0.3273792862892151,
1390
+ 0.38206928968429565,
1391
+ 0.45704320073127747,
1392
+ 0.3849458396434784,
1393
+ 0.4018760323524475,
1394
+ 0.4915027618408203,
1395
+ 0.4851424992084503,
1396
+ 0.3422090709209442,
1397
+ 0.3465098440647125,
1398
+ 0.4339431822299957,
1399
+ 0.35385948419570923,
1400
+ 0.500917911529541,
1401
+ 0.3932620882987976,
1402
+ 0.31006529927253723,
1403
+ 0.34924912452697754,
1404
+ 0.33225369453430176,
1405
+ 0.42161425948143005,
1406
+ 0.3447437882423401,
1407
+ 0.28126439452171326,
1408
+ 0.3864516019821167,
1409
+ 0.4131661057472229,
1410
+ 0.34799614548683167,
1411
+ 0.2833597660064697,
1412
+ 0.4262927174568176,
1413
+ 0.38478782773017883,
1414
+ 0.3123430609703064,
1415
+ 0.39662599563598633,
1416
+ 0.3168265223503113,
1417
+ 0.3374044597148895,
1418
+ 0.4509154260158539,
1419
+ 0.4092380702495575,
1420
+ 0.3720371723175049,
1421
+ 0.32245540618896484,
1422
+ 0.3193129897117615,
1423
+ 0.4018149971961975,
1424
+ 0.32657575607299805,
1425
+ 0.3378874659538269,
1426
+ 0.28595322370529175,
1427
+ 0.36344659328460693,
1428
+ 0.35009145736694336,
1429
+ 0.33734726905822754,
1430
+ 0.35329532623291016,
1431
+ 0.35059797763824463,
1432
+ 0.2901272773742676,
1433
+ 0.3283654451370239,
1434
+ 0.3822149932384491,
1435
+ 0.27559030055999756,
1436
+ 0.2803605794906616,
1437
+ 0.2743658423423767,
1438
+ 0.38650450110435486,
1439
+ 0.29735124111175537,
1440
+ 0.2636435627937317,
1441
+ 0.3230719566345215,
1442
+ 0.2562853991985321,
1443
+ 0.2919286787509918,
1444
+ 0.2846037447452545,
1445
+ 0.34604984521865845,
1446
+ 0.333662748336792,
1447
+ 0.3608507215976715,
1448
+ 0.29711613059043884,
1449
+ 0.2485959827899933,
1450
+ 0.27522337436676025,
1451
+ 0.23814435303211212,
1452
+ 0.28669074177742004,
1453
+ 0.3444576859474182,
1454
+ 0.2782653570175171,
1455
+ 0.2843083143234253,
1456
+ 0.2942905128002167,
1457
+ 0.31752514839172363,
1458
+ 0.2586301863193512,
1459
+ 0.2982809245586395,
1460
+ 0.41684481501579285,
1461
+ 0.33103907108306885,
1462
+ 0.2990052103996277,
1463
+ 0.27157121896743774,
1464
+ 0.27298983931541443,
1465
+ 0.32912784814834595,
1466
+ 0.2982273995876312,
1467
+ 0.2846553921699524,
1468
+ 0.24887534976005554,
1469
+ 0.27428680658340454,
1470
+ 0.30408716201782227,
1471
+ 0.3042374551296234,
1472
+ 0.2922416925430298,
1473
+ 0.253709614276886,
1474
+ 0.28282374143600464,
1475
+ 0.23307877779006958,
1476
+ 0.2911456227302551,
1477
+ 0.3480558395385742,
1478
+ 0.30271637439727783,
1479
+ 0.305656373500824,
1480
+ 0.31656521558761597,
1481
+ 0.230843186378479,
1482
+ 0.3473528027534485,
1483
+ 0.2783201038837433,
1484
+ 0.20797383785247803,
1485
+ 0.26997676491737366,
1486
+ 0.24719452857971191,
1487
+ 0.2668984532356262,
1488
+ 0.2427939772605896,
1489
+ 0.2640213966369629,
1490
+ 0.3293270468711853,
1491
+ 0.3124449551105499,
1492
+ 0.2541097402572632,
1493
+ 0.2846413850784302,
1494
+ 0.28788357973098755,
1495
+ 0.2490839958190918,
1496
+ 0.31947681307792664,
1497
+ 0.23902346193790436,
1498
+ 0.19850093126296997,
1499
+ 0.2748686373233795,
1500
+ 0.2085222750902176,
1501
+ 0.21743398904800415,
1502
+ 0.2422069013118744,
1503
+ 0.24782437086105347,
1504
+ 0.28087347745895386,
1505
+ 0.22643589973449707,
1506
+ 0.2488379180431366,
1507
+ 0.36067014932632446,
1508
+ 0.22233793139457703,
1509
+ 0.2832460105419159,
1510
+ 0.24721194803714752,
1511
+ 0.23525303602218628,
1512
+ 0.29794538021087646,
1513
+ 0.30321621894836426,
1514
+ 0.20213299989700317,
1515
+ 0.27157583832740784,
1516
+ 0.259025514125824,
1517
+ 0.21834829449653625,
1518
+ 0.21391159296035767,
1519
+ 0.29406437277793884,
1520
+ 0.22560474276542664,
1521
+ 0.3151233196258545,
1522
+ 0.3564601242542267,
1523
+ 0.21590474247932434,
1524
+ 0.2805882394313812,
1525
+ 0.2424798309803009,
1526
+ 0.24720430374145508,
1527
+ 0.24170127511024475,
1528
+ 0.26862311363220215,
1529
+ 0.2529475688934326,
1530
+ 0.2638781666755676,
1531
+ 0.30753597617149353,
1532
+ 0.3029334843158722,
1533
+ 0.24195852875709534,
1534
+ 0.29423952102661133,
1535
+ 0.26509591937065125,
1536
+ 0.2073935717344284,
1537
+ 0.2789330780506134,
1538
+ 0.27929404377937317,
1539
+ 0.26568663120269775,
1540
+ 0.21595841646194458,
1541
+ 0.24741975963115692,
1542
+ 0.29185062646865845,
1543
+ 0.27799612283706665,
1544
+ 0.23569640517234802,
1545
+ 0.2136664092540741,
1546
+ 0.19363853335380554,
1547
+ 0.2502439022064209,
1548
+ 0.2523377537727356,
1549
+ 0.2553808093070984,
1550
+ 0.2667678892612457,
1551
+ 0.30567339062690735,
1552
+ 0.18897244334220886,
1553
+ 0.2077244222164154,
1554
+ 0.22972536087036133,
1555
+ 0.2555011510848999,
1556
+ 0.1943330019712448,
1557
+ 0.21900857985019684,
1558
+ 0.2112642526626587,
1559
+ 0.21387708187103271,
1560
+ 0.33129119873046875,
1561
+ 0.22131985425949097
1562
+ ],
1563
+ "zipf_loss": [
1564
+ 5.902684688568115,
1565
+ 5.060757637023926,
1566
+ 3.7189528942108154,
1567
+ 2.5040011405944824,
1568
+ 1.5840965509414673,
1569
+ 0.8555037975311279,
1570
+ 0.6532659530639648,
1571
+ 0.6063866019248962,
1572
+ 0.5856895446777344,
1573
+ 0.5765976905822754,
1574
+ 0.5784863233566284,
1575
+ 0.5665068626403809,
1576
+ 0.5708044767379761,
1577
+ 0.5700060129165649,
1578
+ 0.5712013244628906,
1579
+ 0.5608698725700378,
1580
+ 0.5528655052185059,
1581
+ 0.5267254114151001,
1582
+ 0.4755018353462219,
1583
+ 0.3874831199645996,
1584
+ 0.3377814292907715,
1585
+ 0.29368188977241516,
1586
+ 0.24276527762413025,
1587
+ 0.20423030853271484,
1588
+ 0.19219207763671875,
1589
+ 0.17443324625492096,
1590
+ 0.15989655256271362,
1591
+ 0.15140657126903534,
1592
+ 0.1338139772415161,
1593
+ 0.14818087220191956,
1594
+ 0.1131894439458847,
1595
+ 0.10705186426639557,
1596
+ 0.0981040894985199,
1597
+ 0.09666009992361069,
1598
+ 0.07536322623491287,
1599
+ 0.06556831300258636,
1600
+ 0.06283900141716003,
1601
+ 0.05518872290849686,
1602
+ 0.04969022050499916,
1603
+ 0.048817746341228485,
1604
+ 0.05529868230223656,
1605
+ 0.03984316438436508,
1606
+ 0.04392576217651367,
1607
+ 0.05443081259727478,
1608
+ 0.04846706613898277,
1609
+ 0.034341730177402496,
1610
+ 0.04312724992632866,
1611
+ 0.035865068435668945,
1612
+ 0.04203113168478012,
1613
+ 0.04487438499927521,
1614
+ 0.03540477901697159,
1615
+ 0.04448772966861725,
1616
+ 0.060964684933423996,
1617
+ 0.053344178944826126,
1618
+ 0.03739790618419647,
1619
+ 0.0649472177028656,
1620
+ 0.033584870398044586,
1621
+ 0.04236011952161789,
1622
+ 0.032370828092098236,
1623
+ 0.042076606303453445,
1624
+ 0.07509628683328629,
1625
+ 0.032922953367233276,
1626
+ 0.03562316298484802,
1627
+ 0.033071745187044144,
1628
+ 0.04327850043773651,
1629
+ 0.0474778413772583,
1630
+ 0.038080718368291855,
1631
+ 0.03217237442731857,
1632
+ 0.025619802996516228,
1633
+ 0.03434999659657478,
1634
+ 0.04067017138004303,
1635
+ 0.0432572066783905,
1636
+ 0.06351292878389359,
1637
+ 0.029371127486228943,
1638
+ 0.049407556653022766,
1639
+ 0.02926669269800186,
1640
+ 0.03936169296503067,
1641
+ 0.040858425199985504,
1642
+ 0.031939730048179626,
1643
+ 0.029323050752282143,
1644
+ 0.029477233067154884,
1645
+ 0.028299378231167793,
1646
+ 0.04091307148337364,
1647
+ 0.03514455258846283,
1648
+ 0.04208677262067795,
1649
+ 0.026792136952280998,
1650
+ 0.024593273177742958,
1651
+ 0.05197222903370857,
1652
+ 0.030720636248588562,
1653
+ 0.03861355036497116,
1654
+ 0.03301554173231125,
1655
+ 0.04811073839664459,
1656
+ 0.03426514193415642,
1657
+ 0.04966907203197479,
1658
+ 0.028800886124372482,
1659
+ 0.027979116886854172,
1660
+ 0.030924420803785324,
1661
+ 0.023811589926481247,
1662
+ 0.0421719029545784,
1663
+ 0.03535270318388939,
1664
+ 0.03264780342578888,
1665
+ 0.03614368289709091,
1666
+ 0.027222566306591034,
1667
+ 0.032614752650260925,
1668
+ 0.032340727746486664,
1669
+ 0.03658295422792435,
1670
+ 0.035718291997909546,
1671
+ 0.043458759784698486,
1672
+ 0.025101013481616974,
1673
+ 0.050936803221702576,
1674
+ 0.03274014592170715,
1675
+ 0.03148721158504486,
1676
+ 0.03349090367555618,
1677
+ 0.0450107641518116,
1678
+ 0.04847481846809387,
1679
+ 0.03280961140990257,
1680
+ 0.02714274264872074,
1681
+ 0.03508167341351509,
1682
+ 0.049645956605672836,
1683
+ 0.03934843838214874,
1684
+ 0.03244860842823982,
1685
+ 0.02164081111550331,
1686
+ 0.03862951323390007,
1687
+ 0.03326089680194855,
1688
+ 0.03867378830909729,
1689
+ 0.03956107050180435,
1690
+ 0.02918875403702259,
1691
+ 0.026714175939559937,
1692
+ 0.034605640918016434,
1693
+ 0.03499145060777664,
1694
+ 0.036697641015052795,
1695
+ 0.04140329360961914,
1696
+ 0.035553041845560074,
1697
+ 0.060954466462135315,
1698
+ 0.033179301768541336,
1699
+ 0.04456836357712746,
1700
+ 0.03654774650931358,
1701
+ 0.041403159499168396,
1702
+ 0.036835212260484695,
1703
+ 0.027645012363791466,
1704
+ 0.03495408594608307,
1705
+ 0.030682988464832306,
1706
+ 0.055629342794418335,
1707
+ 0.042602382600307465,
1708
+ 0.05404828116297722,
1709
+ 0.034428223967552185,
1710
+ 0.03452951833605766,
1711
+ 0.04957253113389015,
1712
+ 0.02790767326951027,
1713
+ 0.03789380565285683,
1714
+ 0.05088239163160324,
1715
+ 0.03013448975980282,
1716
+ 0.04763920605182648,
1717
+ 0.03356539458036423,
1718
+ 0.03152993321418762,
1719
+ 0.03610782325267792,
1720
+ 0.03359227254986763,
1721
+ 0.025854911655187607,
1722
+ 0.05199098587036133,
1723
+ 0.04216059297323227,
1724
+ 0.04234059154987335,
1725
+ 0.04226396232843399,
1726
+ 0.04976421967148781,
1727
+ 0.02282628044486046,
1728
+ 0.04069782793521881,
1729
+ 0.03215024620294571,
1730
+ 0.03314099460840225,
1731
+ 0.024782083928585052,
1732
+ 0.029297877103090286,
1733
+ 0.073276586830616,
1734
+ 0.0418546199798584,
1735
+ 0.045323487371206284,
1736
+ 0.03853926062583923,
1737
+ 0.04253818094730377,
1738
+ 0.04506561905145645,
1739
+ 0.04157973825931549,
1740
+ 0.04301469773054123,
1741
+ 0.03566312417387962,
1742
+ 0.0506528839468956,
1743
+ 0.04138036444783211,
1744
+ 0.04187582805752754,
1745
+ 0.06314846873283386,
1746
+ 0.039209991693496704,
1747
+ 0.04790130630135536,
1748
+ 0.04376837611198425,
1749
+ 0.05028841271996498,
1750
+ 0.040840305387973785,
1751
+ 0.029018813744187355,
1752
+ 0.04631214216351509,
1753
+ 0.04048272967338562,
1754
+ 0.054269835352897644,
1755
+ 0.06053861230611801,
1756
+ 0.05184292793273926,
1757
+ 0.04773920774459839,
1758
+ 0.03577277809381485,
1759
+ 0.04363023117184639,
1760
+ 0.041978538036346436,
1761
+ 0.04979187995195389,
1762
+ 0.03781772404909134,
1763
+ 0.052146218717098236,
1764
+ 0.0459938645362854,
1765
+ 0.042001236230134964,
1766
+ 0.04234977439045906,
1767
+ 0.05187782645225525,
1768
+ 0.03706303983926773,
1769
+ 0.04720836877822876,
1770
+ 0.04916055500507355,
1771
+ 0.03775591403245926,
1772
+ 0.03928117826581001,
1773
+ 0.030798811465501785,
1774
+ 0.032894425094127655,
1775
+ 0.03738286718726158,
1776
+ 0.04667762666940689,
1777
+ 0.04798555001616478,
1778
+ 0.04211629182100296,
1779
+ 0.03676827251911163,
1780
+ 0.04022987186908722,
1781
+ 0.04925571754574776,
1782
+ 0.027465006336569786,
1783
+ 0.05306820571422577,
1784
+ 0.040601249784231186,
1785
+ 0.03433593362569809,
1786
+ 0.03603116795420647,
1787
+ 0.05245066061615944,
1788
+ 0.043414343148469925,
1789
+ 0.035300515592098236,
1790
+ 0.04520798474550247,
1791
+ 0.04005079343914986,
1792
+ 0.03389983996748924,
1793
+ 0.036058053374290466,
1794
+ 0.03387245535850525,
1795
+ 0.030419837683439255,
1796
+ 0.051053088158369064,
1797
+ 0.06218193098902702,
1798
+ 0.04528661072254181,
1799
+ 0.04498759284615517,
1800
+ 0.040742211043834686,
1801
+ 0.03306664898991585,
1802
+ 0.03345557674765587,
1803
+ 0.035349950194358826,
1804
+ 0.05530022829771042,
1805
+ 0.04764458164572716,
1806
+ 0.03253139555454254,
1807
+ 0.04161981865763664,
1808
+ 0.04827052354812622,
1809
+ 0.03459079563617706,
1810
+ 0.05276760458946228,
1811
+ 0.033949095755815506,
1812
+ 0.028391260653734207,
1813
+ 0.03912941366434097,
1814
+ 0.03616856038570404,
1815
+ 0.04241953045129776,
1816
+ 0.050922323018312454,
1817
+ 0.038664426654577255,
1818
+ 0.05536889657378197,
1819
+ 0.034565310925245285,
1820
+ 0.04321820288896561,
1821
+ 0.040786027908325195,
1822
+ 0.032071419060230255,
1823
+ 0.050359830260276794,
1824
+ 0.048944178968667984,
1825
+ 0.044813625514507294,
1826
+ 0.05466174706816673,
1827
+ 0.040300920605659485,
1828
+ 0.04125305265188217,
1829
+ 0.057422131299972534,
1830
+ 0.056044429540634155,
1831
+ 0.030909128487110138,
1832
+ 0.03716030344367027,
1833
+ 0.04249592870473862,
1834
+ 0.03556758910417557,
1835
+ 0.037934184074401855,
1836
+ 0.05018708482384682,
1837
+ 0.034316956996917725,
1838
+ 0.03639369457960129,
1839
+ 0.045960068702697754,
1840
+ 0.03193551301956177,
1841
+ 0.042806319892406464,
1842
+ 0.039242617785930634,
1843
+ 0.05495717376470566,
1844
+ 0.037742339074611664,
1845
+ 0.04147646576166153,
1846
+ 0.046967800706624985,
1847
+ 0.04591631889343262,
1848
+ 0.04412830248475075,
1849
+ 0.0321836844086647,
1850
+ 0.03613559156656265,
1851
+ 0.03604351356625557,
1852
+ 0.03837473690509796,
1853
+ 0.04597822576761246,
1854
+ 0.037280354648828506,
1855
+ 0.03376632183790207,
1856
+ 0.035324495285749435,
1857
+ 0.03834962472319603,
1858
+ 0.0472051165997982,
1859
+ 0.03315430134534836,
1860
+ 0.04054207354784012,
1861
+ 0.03822512552142143,
1862
+ 0.034464433789253235,
1863
+ 0.03335137665271759,
1864
+ 0.048479434102773666,
1865
+ 0.04830781742930412,
1866
+ 0.04486474022269249,
1867
+ 0.04346194863319397,
1868
+ 0.033721063286066055,
1869
+ 0.04194709658622742,
1870
+ 0.05212908983230591,
1871
+ 0.04137463867664337,
1872
+ 0.06516798585653305,
1873
+ 0.04277731478214264
1874
+ ],
1875
+ "denoise_loss": [],
1876
+ "ortho_loss": [
1877
+ 0.8454185724258423,
1878
+ 0.6524177193641663,
1879
+ 0.3698425590991974,
1880
+ 0.2007085680961609,
1881
+ 0.1236860603094101,
1882
+ 0.08822250366210938,
1883
+ 0.0750516727566719,
1884
+ 0.05863531678915024,
1885
+ 0.04750237613916397,
1886
+ 0.04451904818415642,
1887
+ 0.04229466989636421,
1888
+ 0.040987420827150345,
1889
+ 0.04738488793373108,
1890
+ 0.05249207466840744,
1891
+ 0.05897305905818939,
1892
+ 0.060233548283576965,
1893
+ 0.062270693480968475,
1894
+ 0.07207406312227249,
1895
+ 0.08198414742946625,
1896
+ 0.09681784361600876,
1897
+ 0.1064775362610817,
1898
+ 0.11615313589572906,
1899
+ 0.12525823712348938,
1900
+ 0.13203047215938568,
1901
+ 0.13891912996768951,
1902
+ 0.14662884175777435,
1903
+ 0.15332895517349243,
1904
+ 0.15664303302764893,
1905
+ 0.15949848294258118,
1906
+ 0.1633111983537674,
1907
+ 0.16485799849033356,
1908
+ 0.16638898849487305,
1909
+ 0.16665266454219818,
1910
+ 0.16638712584972382,
1911
+ 0.1657113879919052,
1912
+ 0.1661071628332138,
1913
+ 0.1650349497795105,
1914
+ 0.16582758724689484,
1915
+ 0.16719463467597961,
1916
+ 0.16592173278331757,
1917
+ 0.16679780185222626,
1918
+ 0.17262960970401764,
1919
+ 0.17457710206508636,
1920
+ 0.1743481308221817,
1921
+ 0.1783905178308487,
1922
+ 0.18017259240150452,
1923
+ 0.18341462314128876,
1924
+ 0.18411006033420563,
1925
+ 0.18720033764839172,
1926
+ 0.1891525238752365,
1927
+ 0.18835467100143433,
1928
+ 0.19066214561462402,
1929
+ 0.19213086366653442,
1930
+ 0.19740790128707886,
1931
+ 0.19639301300048828,
1932
+ 0.19970081746578217,
1933
+ 0.20187750458717346,
1934
+ 0.20390638709068298,
1935
+ 0.2044963538646698,
1936
+ 0.20567278563976288,
1937
+ 0.2079830914735794,
1938
+ 0.21193991601467133,
1939
+ 0.21391405165195465,
1940
+ 0.21922127902507782,
1941
+ 0.22368207573890686,
1942
+ 0.22522194683551788,
1943
+ 0.22709041833877563,
1944
+ 0.22769533097743988,
1945
+ 0.23018060624599457,
1946
+ 0.23341462016105652,
1947
+ 0.23343972861766815,
1948
+ 0.23775576055049896,
1949
+ 0.24117596447467804,
1950
+ 0.24501429498195648,
1951
+ 0.24653051793575287,
1952
+ 0.25028756260871887,
1953
+ 0.25320684909820557,
1954
+ 0.2552432417869568,
1955
+ 0.2562824487686157,
1956
+ 0.25940391421318054,
1957
+ 0.26296067237854004,
1958
+ 0.26571977138519287,
1959
+ 0.2707919776439667,
1960
+ 0.27494823932647705,
1961
+ 0.2768678665161133,
1962
+ 0.27713948488235474,
1963
+ 0.279514342546463,
1964
+ 0.2820461094379425,
1965
+ 0.28318119049072266,
1966
+ 0.2849445044994354,
1967
+ 0.2857610285282135,
1968
+ 0.28739556670188904,
1969
+ 0.29032039642333984,
1970
+ 0.2934110164642334,
1971
+ 0.2961346507072449,
1972
+ 0.2951403260231018,
1973
+ 0.2951270043849945,
1974
+ 0.2940308749675751,
1975
+ 0.29594114422798157,
1976
+ 0.2994272708892822,
1977
+ 0.3011847734451294,
1978
+ 0.30261480808258057,
1979
+ 0.30125999450683594,
1980
+ 0.30381637811660767,
1981
+ 0.3056132197380066,
1982
+ 0.30930984020233154,
1983
+ 0.3089517652988434,
1984
+ 0.30901747941970825,
1985
+ 0.316816121339798,
1986
+ 0.3187602460384369,
1987
+ 0.3199279010295868,
1988
+ 0.31832966208457947,
1989
+ 0.32230615615844727,
1990
+ 0.32506951689720154,
1991
+ 0.3242188096046448,
1992
+ 0.32370448112487793,
1993
+ 0.325268417596817,
1994
+ 0.32495614886283875,
1995
+ 0.3243638277053833,
1996
+ 0.3254850506782532,
1997
+ 0.32709378004074097,
1998
+ 0.32725614309310913,
1999
+ 0.32756146788597107,
2000
+ 0.32778775691986084,
2001
+ 0.33066636323928833,
2002
+ 0.32944557070732117,
2003
+ 0.3283247649669647,
2004
+ 0.3301420211791992,
2005
+ 0.3320577144622803,
2006
+ 0.336099773645401,
2007
+ 0.3349405825138092,
2008
+ 0.33438968658447266,
2009
+ 0.3332967758178711,
2010
+ 0.3337518274784088,
2011
+ 0.3349280059337616,
2012
+ 0.33751121163368225,
2013
+ 0.33745864033699036,
2014
+ 0.3390352129936218,
2015
+ 0.3396795392036438,
2016
+ 0.3428172767162323,
2017
+ 0.34306180477142334,
2018
+ 0.3420213460922241,
2019
+ 0.34256380796432495,
2020
+ 0.34335482120513916,
2021
+ 0.3430495858192444,
2022
+ 0.3445117771625519,
2023
+ 0.34731537103652954,
2024
+ 0.3471394181251526,
2025
+ 0.34982484579086304,
2026
+ 0.35192805528640747,
2027
+ 0.3546449840068817,
2028
+ 0.35223621129989624,
2029
+ 0.3524305820465088,
2030
+ 0.3521151542663574,
2031
+ 0.35328346490859985,
2032
+ 0.3530151844024658,
2033
+ 0.3538852632045746,
2034
+ 0.35223114490509033,
2035
+ 0.3535531759262085,
2036
+ 0.35533207654953003,
2037
+ 0.35749757289886475,
2038
+ 0.359323650598526,
2039
+ 0.360779732465744,
2040
+ 0.36273473501205444,
2041
+ 0.364918977022171,
2042
+ 0.3663212060928345,
2043
+ 0.3653111457824707,
2044
+ 0.36530864238739014,
2045
+ 0.36515799164772034,
2046
+ 0.3680950105190277,
2047
+ 0.36992835998535156,
2048
+ 0.37001073360443115,
2049
+ 0.3704085648059845,
2050
+ 0.3728475868701935,
2051
+ 0.3723159730434418,
2052
+ 0.3730833828449249,
2053
+ 0.37724408507347107,
2054
+ 0.378434956073761,
2055
+ 0.3795548677444458,
2056
+ 0.3785182535648346,
2057
+ 0.37985289096832275,
2058
+ 0.38019806146621704,
2059
+ 0.3810216784477234,
2060
+ 0.3825012743473053,
2061
+ 0.38243168592453003,
2062
+ 0.38221603631973267,
2063
+ 0.3820144832134247,
2064
+ 0.3820664882659912,
2065
+ 0.3802727162837982,
2066
+ 0.38027769327163696,
2067
+ 0.38286295533180237,
2068
+ 0.3812105357646942,
2069
+ 0.38233181834220886,
2070
+ 0.38291850686073303,
2071
+ 0.3830583095550537,
2072
+ 0.386683851480484,
2073
+ 0.3840213119983673,
2074
+ 0.38416072726249695,
2075
+ 0.38992780447006226,
2076
+ 0.3902909755706787,
2077
+ 0.3925168514251709,
2078
+ 0.3939124643802643,
2079
+ 0.3944869637489319,
2080
+ 0.3921501040458679,
2081
+ 0.3928128778934479,
2082
+ 0.3936733305454254,
2083
+ 0.39786452054977417,
2084
+ 0.39970171451568604,
2085
+ 0.4004788398742676,
2086
+ 0.4015267789363861,
2087
+ 0.40280917286872864,
2088
+ 0.40395042300224304,
2089
+ 0.4055359363555908,
2090
+ 0.40717577934265137,
2091
+ 0.40721243619918823,
2092
+ 0.409464567899704,
2093
+ 0.40915629267692566,
2094
+ 0.4096061885356903,
2095
+ 0.40949881076812744,
2096
+ 0.41049879789352417,
2097
+ 0.41203904151916504,
2098
+ 0.41238167881965637,
2099
+ 0.41321825981140137,
2100
+ 0.4143255949020386,
2101
+ 0.41407695412635803,
2102
+ 0.4160165786743164,
2103
+ 0.4173142910003662,
2104
+ 0.41775164008140564,
2105
+ 0.41922488808631897,
2106
+ 0.42065107822418213,
2107
+ 0.4218386709690094,
2108
+ 0.42317867279052734,
2109
+ 0.4253239035606384,
2110
+ 0.42656201124191284,
2111
+ 0.42637738585472107,
2112
+ 0.4268428385257721,
2113
+ 0.42705947160720825,
2114
+ 0.4287395477294922,
2115
+ 0.42988792061805725,
2116
+ 0.43054214119911194,
2117
+ 0.431358277797699,
2118
+ 0.434470534324646,
2119
+ 0.43372422456741333,
2120
+ 0.4343772828578949,
2121
+ 0.436478853225708,
2122
+ 0.43682318925857544,
2123
+ 0.4364190101623535,
2124
+ 0.4362836480140686,
2125
+ 0.43758946657180786,
2126
+ 0.43739020824432373,
2127
+ 0.4382403492927551,
2128
+ 0.43866875767707825,
2129
+ 0.43970364332199097,
2130
+ 0.4394722282886505,
2131
+ 0.44059357047080994,
2132
+ 0.44121912121772766,
2133
+ 0.4426378607749939,
2134
+ 0.4445840120315552,
2135
+ 0.4441210627555847,
2136
+ 0.4451994299888611,
2137
+ 0.4466753304004669,
2138
+ 0.4467293322086334,
2139
+ 0.4470214247703552,
2140
+ 0.4473244547843933,
2141
+ 0.4482899010181427,
2142
+ 0.449049711227417,
2143
+ 0.4494488537311554,
2144
+ 0.44887575507164,
2145
+ 0.4482535719871521,
2146
+ 0.44895297288894653,
2147
+ 0.4490957260131836,
2148
+ 0.449077308177948,
2149
+ 0.4497356414794922,
2150
+ 0.44975101947784424,
2151
+ 0.4500557482242584,
2152
+ 0.4509201943874359,
2153
+ 0.4517847001552582,
2154
+ 0.45305636525154114,
2155
+ 0.45346972346305847,
2156
+ 0.4530041813850403,
2157
+ 0.45415493845939636,
2158
+ 0.45489701628685,
2159
+ 0.4551505148410797,
2160
+ 0.4561237394809723,
2161
+ 0.4570634365081787,
2162
+ 0.4576168954372406,
2163
+ 0.45753759145736694,
2164
+ 0.4584166407585144,
2165
+ 0.45879897475242615,
2166
+ 0.45931005477905273,
2167
+ 0.4600575864315033,
2168
+ 0.46008801460266113,
2169
+ 0.46043217182159424,
2170
+ 0.4608006179332733,
2171
+ 0.4609127342700958,
2172
+ 0.46162301301956177,
2173
+ 0.4619598984718323,
2174
+ 0.46156224608421326,
2175
+ 0.4617094397544861,
2176
+ 0.4619976580142975,
2177
+ 0.4621671140193939,
2178
+ 0.46231216192245483,
2179
+ 0.46249955892562866,
2180
+ 0.4629148244857788,
2181
+ 0.4631115794181824,
2182
+ 0.46322980523109436,
2183
+ 0.4634542167186737,
2184
+ 0.46354347467422485,
2185
+ 0.4636399447917938,
2186
+ 0.46376949548721313
2187
+ ],
2188
+ "lr": [
2189
+ 4.188034188034189e-06,
2190
+ 8.461538461538462e-06,
2191
+ 1.2735042735042738e-05,
2192
+ 1.700854700854701e-05,
2193
+ 2.1282051282051282e-05,
2194
+ 2.5555555555555557e-05,
2195
+ 2.9829059829059833e-05,
2196
+ 3.4102564102564105e-05,
2197
+ 3.837606837606838e-05,
2198
+ 4e-05,
2199
+ 4e-05,
2200
+ 4e-05,
2201
+ 4e-05,
2202
+ 4e-05,
2203
+ 4e-05,
2204
+ 4e-05,
2205
+ 4e-05,
2206
+ 4e-05,
2207
+ 4e-05,
2208
+ 4e-05,
2209
+ 4e-05,
2210
+ 4e-05,
2211
+ 4e-05,
2212
+ 4e-05,
2213
+ 4e-05,
2214
+ 4e-05,
2215
+ 4e-05,
2216
+ 4e-05,
2217
+ 4e-05,
2218
+ 4e-05,
2219
+ 4e-05,
2220
+ 4e-05,
2221
+ 4e-05,
2222
+ 4e-05,
2223
+ 4e-05,
2224
+ 4e-05,
2225
+ 4e-05,
2226
+ 4e-05,
2227
+ 4e-05,
2228
+ 4e-05,
2229
+ 4e-05,
2230
+ 4e-05,
2231
+ 4e-05,
2232
+ 4e-05,
2233
+ 4e-05,
2234
+ 4e-05,
2235
+ 4e-05,
2236
+ 4e-05,
2237
+ 4e-05,
2238
+ 4e-05,
2239
+ 4e-05,
2240
+ 4e-05,
2241
+ 4e-05,
2242
+ 4e-05,
2243
+ 4e-05,
2244
+ 4e-05,
2245
+ 4e-05,
2246
+ 4e-05,
2247
+ 4e-05,
2248
+ 4e-05,
2249
+ 4e-05,
2250
+ 4e-05,
2251
+ 4e-05,
2252
+ 4e-05,
2253
+ 4e-05,
2254
+ 4e-05,
2255
+ 4e-05,
2256
+ 4e-05,
2257
+ 4e-05,
2258
+ 4e-05,
2259
+ 4e-05,
2260
+ 4e-05,
2261
+ 4e-05,
2262
+ 4e-05,
2263
+ 4e-05,
2264
+ 4e-05,
2265
+ 4e-05,
2266
+ 4e-05,
2267
+ 4e-05,
2268
+ 4e-05,
2269
+ 4e-05,
2270
+ 4e-05,
2271
+ 4e-05,
2272
+ 4e-05,
2273
+ 4e-05,
2274
+ 4e-05,
2275
+ 4e-05,
2276
+ 4e-05,
2277
+ 4e-05,
2278
+ 4e-05,
2279
+ 4e-05,
2280
+ 4e-05,
2281
+ 4e-05,
2282
+ 4e-05,
2283
+ 4e-05,
2284
+ 4e-05,
2285
+ 4e-05,
2286
+ 4e-05,
2287
+ 4e-05,
2288
+ 4e-05,
2289
+ 4e-05,
2290
+ 4e-05,
2291
+ 4e-05,
2292
+ 4e-05,
2293
+ 4e-05,
2294
+ 4e-05,
2295
+ 4e-05,
2296
+ 4e-05,
2297
+ 4e-05,
2298
+ 4e-05,
2299
+ 4e-05,
2300
+ 4e-05,
2301
+ 4e-05,
2302
+ 4e-05,
2303
+ 4e-05,
2304
+ 4e-05,
2305
+ 4e-05,
2306
+ 4e-05,
2307
+ 4e-05,
2308
+ 4e-05,
2309
+ 4e-05,
2310
+ 4e-05,
2311
+ 4e-05,
2312
+ 4e-05,
2313
+ 4e-05,
2314
+ 4e-05,
2315
+ 4e-05,
2316
+ 4e-05,
2317
+ 4e-05,
2318
+ 4e-05,
2319
+ 4e-05,
2320
+ 4e-05,
2321
+ 4e-05,
2322
+ 4e-05,
2323
+ 4e-05,
2324
+ 4e-05,
2325
+ 4e-05,
2326
+ 4e-05,
2327
+ 4e-05,
2328
+ 4e-05,
2329
+ 4e-05,
2330
+ 4e-05,
2331
+ 4e-05,
2332
+ 4e-05,
2333
+ 4e-05,
2334
+ 4e-05,
2335
+ 4e-05,
2336
+ 4e-05,
2337
+ 4e-05,
2338
+ 4e-05,
2339
+ 4e-05,
2340
+ 4e-05,
2341
+ 4e-05,
2342
+ 4e-05,
2343
+ 4e-05,
2344
+ 4e-05,
2345
+ 4e-05,
2346
+ 4e-05,
2347
+ 4e-05,
2348
+ 4e-05,
2349
+ 4e-05,
2350
+ 4e-05,
2351
+ 4e-05,
2352
+ 4e-05,
2353
+ 4e-05,
2354
+ 4e-05,
2355
+ 4e-05,
2356
+ 4e-05,
2357
+ 4e-05,
2358
+ 4e-05,
2359
+ 4e-05,
2360
+ 4e-05,
2361
+ 4e-05,
2362
+ 4e-05,
2363
+ 4e-05,
2364
+ 4e-05,
2365
+ 4e-05,
2366
+ 4e-05,
2367
+ 4e-05,
2368
+ 4e-05,
2369
+ 4e-05,
2370
+ 4e-05,
2371
+ 4e-05,
2372
+ 4e-05,
2373
+ 4e-05,
2374
+ 4e-05,
2375
+ 4e-05,
2376
+ 4e-05,
2377
+ 4e-05,
2378
+ 3.992995647012267e-05,
2379
+ 3.963316185199842e-05,
2380
+ 3.933636723387416e-05,
2381
+ 3.90395726157499e-05,
2382
+ 3.874277799762565e-05,
2383
+ 3.844598337950139e-05,
2384
+ 3.814918876137713e-05,
2385
+ 3.785239414325287e-05,
2386
+ 3.7555599525128613e-05,
2387
+ 3.725880490700435e-05,
2388
+ 3.696201028888009e-05,
2389
+ 3.666521567075585e-05,
2390
+ 3.6368421052631585e-05,
2391
+ 3.607162643450732e-05,
2392
+ 3.577483181638307e-05,
2393
+ 3.547803719825881e-05,
2394
+ 3.518124258013455e-05,
2395
+ 3.4884447962010287e-05,
2396
+ 3.458765334388604e-05,
2397
+ 3.4290858725761776e-05,
2398
+ 3.399406410763751e-05,
2399
+ 3.3697269489513265e-05,
2400
+ 3.3400474871389e-05,
2401
+ 3.310368025326474e-05,
2402
+ 3.280688563514048e-05,
2403
+ 3.251009101701623e-05,
2404
+ 3.2213296398891967e-05,
2405
+ 3.191650178076771e-05,
2406
+ 3.1542540561931145e-05,
2407
+ 3.124574594380688e-05,
2408
+ 3.094895132568263e-05,
2409
+ 3.065215670755838e-05,
2410
+ 3.0355362089434113e-05,
2411
+ 3.0058567471309854e-05,
2412
+ 2.97617728531856e-05,
2413
+ 2.9464978235061336e-05,
2414
+ 2.9168183616937077e-05,
2415
+ 2.8871388998812818e-05,
2416
+ 2.857459438068857e-05,
2417
+ 2.8277799762564307e-05,
2418
+ 2.798100514444005e-05,
2419
+ 2.7684210526315793e-05,
2420
+ 2.738741590819153e-05,
2421
+ 2.709062129006727e-05,
2422
+ 2.6793826671943013e-05,
2423
+ 2.6497032053818764e-05,
2424
+ 2.62002374356945e-05,
2425
+ 2.5903442817570243e-05,
2426
+ 2.5606648199445987e-05,
2427
+ 2.5309853581321725e-05,
2428
+ 2.5013058963197466e-05,
2429
+ 2.4716264345073214e-05,
2430
+ 2.441946972694896e-05,
2431
+ 2.4122675108824693e-05,
2432
+ 2.3825880490700434e-05,
2433
+ 2.352908587257618e-05,
2434
+ 2.3232291254451916e-05,
2435
+ 2.293549663632766e-05,
2436
+ 2.2638702018203408e-05,
2437
+ 2.226474079936684e-05,
2438
+ 2.196794618124258e-05,
2439
+ 2.1671151563118328e-05,
2440
+ 2.1374356944994066e-05,
2441
+ 2.1077562326869803e-05,
2442
+ 2.0780767708745554e-05,
2443
+ 2.0483973090621296e-05,
2444
+ 2.018717847249703e-05,
2445
+ 1.989038385437277e-05,
2446
+ 1.959358923624852e-05,
2447
+ 1.929679461812426e-05,
2448
+ 1.8999999999999998e-05,
2449
+ 1.8703205381875746e-05,
2450
+ 1.8406410763751487e-05,
2451
+ 1.8109616145627224e-05,
2452
+ 1.7812821527502965e-05,
2453
+ 1.7516026909378713e-05,
2454
+ 1.7219232291254454e-05,
2455
+ 1.6922437673130192e-05,
2456
+ 1.662564305500594e-05,
2457
+ 1.632884843688168e-05,
2458
+ 1.603205381875742e-05,
2459
+ 1.573525920063316e-05,
2460
+ 1.5438464582508908e-05,
2461
+ 1.5141669964384647e-05,
2462
+ 1.4844875346260385e-05,
2463
+ 1.4548080728136134e-05,
2464
+ 1.4251286110011875e-05,
2465
+ 1.3954491491887611e-05,
2466
+ 1.3657696873763363e-05,
2467
+ 1.33609022556391e-05,
2468
+ 1.298694103680253e-05,
2469
+ 1.2690146418678277e-05,
2470
+ 1.2393351800554018e-05,
2471
+ 1.2096557182429756e-05,
2472
+ 1.1799762564305506e-05,
2473
+ 1.1502967946181245e-05,
2474
+ 1.1206173328056984e-05,
2475
+ 1.0909378709932724e-05,
2476
+ 1.0612584091808472e-05,
2477
+ 1.0315789473684213e-05,
2478
+ 1.0018994855559949e-05,
2479
+ 9.7222002374357e-06,
2480
+ 9.425405619311438e-06,
2481
+ 9.128611001187177e-06,
2482
+ 8.831816383062916e-06,
2483
+ 8.535021764938666e-06,
2484
+ 8.238227146814405e-06,
2485
+ 7.941432528690143e-06,
2486
+ 7.644637910565893e-06,
2487
+ 7.347843292441632e-06,
2488
+ 7.0510486743173715e-06,
2489
+ 6.75425405619311e-06,
2490
+ 6.45745943806886e-06,
2491
+ 6.160664819944598e-06,
2492
+ 5.8638702018203375e-06,
2493
+ 5.567075583696086e-06,
2494
+ 5.270280965571826e-06,
2495
+ 4.973486347447565e-06,
2496
+ 4.676691729323314e-06,
2497
+ 4.379897111199053e-06,
2498
+ 4.083102493074792e-06
2499
+ ],
2500
+ "emb_lr": [],
2501
+ "eval_step": [
2502
+ 1550,
2503
+ 3113,
2504
+ 4676,
2505
+ 6239,
2506
+ 7802,
2507
+ 9365,
2508
+ 10928,
2509
+ 12491,
2510
+ 14054,
2511
+ 15617
2512
+ ],
2513
+ "eval_accuracy": [
2514
+ 0.85,
2515
+ 1.0,
2516
+ 1.0,
2517
+ 1.0,
2518
+ 1.0,
2519
+ 1.0,
2520
+ 1.0,
2521
+ 1.0,
2522
+ 1.0,
2523
+ 1.0
2524
+ ]
2525
+ },
2526
+ "final_accuracy": 1.0,
2527
+ "sft_eval": {
2528
+ "config": {
2529
+ "ops": "add_sub",
2530
+ "K": null,
2531
+ "mode": "sft",
2532
+ "n_digits": 6,
2533
+ "n_per_split": 100
2534
+ },
2535
+ "splits": {
2536
+ "add_S0": {
2537
+ "full_accuracy": 0.98,
2538
+ "n_examples": 100,
2539
+ "per_subtask": {
2540
+ "SA": {
2541
+ "accuracy": 0.996694214876033,
2542
+ "count": 605
2543
+ },
2544
+ "SS": {
2545
+ "accuracy": 1.0,
2546
+ "count": 95
2547
+ }
2548
+ }
2549
+ },
2550
+ "add_S1": {
2551
+ "full_accuracy": 0.93,
2552
+ "n_examples": 100,
2553
+ "per_subtask": {
2554
+ "SA": {
2555
+ "accuracy": 1.0,
2556
+ "count": 204
2557
+ },
2558
+ "SC": {
2559
+ "accuracy": 0.9881656804733728,
2560
+ "count": 169
2561
+ },
2562
+ "SS": {
2563
+ "accuracy": 1.0,
2564
+ "count": 31
2565
+ },
2566
+ "UC": {
2567
+ "accuracy": 0.9831081081081081,
2568
+ "count": 296
2569
+ }
2570
+ }
2571
+ },
2572
+ "add_S2": {
2573
+ "full_accuracy": 0.82,
2574
+ "n_examples": 100,
2575
+ "per_subtask": {
2576
+ "SA": {
2577
+ "accuracy": 1.0,
2578
+ "count": 163
2579
+ },
2580
+ "SC": {
2581
+ "accuracy": 0.9692307692307692,
2582
+ "count": 130
2583
+ },
2584
+ "SS": {
2585
+ "accuracy": 1.0,
2586
+ "count": 87
2587
+ },
2588
+ "UC": {
2589
+ "accuracy": 0.9261083743842364,
2590
+ "count": 203
2591
+ },
2592
+ "US": {
2593
+ "accuracy": 0.9914529914529915,
2594
+ "count": 117
2595
+ }
2596
+ }
2597
+ },
2598
+ "add_S3": {
2599
+ "full_accuracy": 0.58,
2600
+ "n_examples": 100,
2601
+ "per_subtask": {
2602
+ "SA": {
2603
+ "accuracy": 1.0,
2604
+ "count": 121
2605
+ },
2606
+ "SC": {
2607
+ "accuracy": 0.9917355371900827,
2608
+ "count": 121
2609
+ },
2610
+ "SS": {
2611
+ "accuracy": 1.0,
2612
+ "count": 49
2613
+ },
2614
+ "UC": {
2615
+ "accuracy": 0.8172043010752689,
2616
+ "count": 186
2617
+ },
2618
+ "US": {
2619
+ "accuracy": 0.9013452914798207,
2620
+ "count": 223
2621
+ }
2622
+ }
2623
+ },
2624
+ "add_S4": {
2625
+ "full_accuracy": 0.39,
2626
+ "n_examples": 100,
2627
+ "per_subtask": {
2628
+ "SA": {
2629
+ "accuracy": 1.0,
2630
+ "count": 104
2631
+ },
2632
+ "SC": {
2633
+ "accuracy": 1.0,
2634
+ "count": 106
2635
+ },
2636
+ "SS": {
2637
+ "accuracy": 1.0,
2638
+ "count": 23
2639
+ },
2640
+ "UC": {
2641
+ "accuracy": 0.64375,
2642
+ "count": 160
2643
+ },
2644
+ "US": {
2645
+ "accuracy": 0.6644951140065146,
2646
+ "count": 307
2647
+ }
2648
+ }
2649
+ },
2650
+ "add_S5": {
2651
+ "full_accuracy": 0.22,
2652
+ "n_examples": 100,
2653
+ "per_subtask": {
2654
+ "SA": {
2655
+ "accuracy": 1.0,
2656
+ "count": 100
2657
+ },
2658
+ "SC": {
2659
+ "accuracy": 1.0,
2660
+ "count": 100
2661
+ },
2662
+ "UC": {
2663
+ "accuracy": 0.32,
2664
+ "count": 100
2665
+ },
2666
+ "US": {
2667
+ "accuracy": 0.4425,
2668
+ "count": 400
2669
+ }
2670
+ }
2671
+ },
2672
+ "add_S6": {
2673
+ "full_accuracy": 0.55,
2674
+ "n_examples": 100,
2675
+ "per_subtask": {
2676
+ "SC": {
2677
+ "accuracy": 1.0,
2678
+ "count": 100
2679
+ },
2680
+ "UC": {
2681
+ "accuracy": 0.6,
2682
+ "count": 100
2683
+ },
2684
+ "US": {
2685
+ "accuracy": 0.676,
2686
+ "count": 500
2687
+ }
2688
+ }
2689
+ },
2690
+ "add_random": {
2691
+ "full_accuracy": 0.935,
2692
+ "n_examples": 200,
2693
+ "per_subtask": {
2694
+ "SA": {
2695
+ "accuracy": 1.0,
2696
+ "count": 447
2697
+ },
2698
+ "SC": {
2699
+ "accuracy": 0.990625,
2700
+ "count": 320
2701
+ },
2702
+ "SS": {
2703
+ "accuracy": 0.9821428571428571,
2704
+ "count": 56
2705
+ },
2706
+ "UC": {
2707
+ "accuracy": 0.9810964083175804,
2708
+ "count": 529
2709
+ },
2710
+ "US": {
2711
+ "accuracy": 0.9583333333333334,
2712
+ "count": 48
2713
+ }
2714
+ }
2715
+ },
2716
+ "add_C3": {
2717
+ "full_accuracy": 0.65,
2718
+ "n_examples": 100,
2719
+ "per_subtask": {
2720
+ "SA": {
2721
+ "accuracy": 1.0,
2722
+ "count": 300
2723
+ },
2724
+ "SC": {
2725
+ "accuracy": 0.97,
2726
+ "count": 100
2727
+ },
2728
+ "UC": {
2729
+ "accuracy": 0.8393782383419689,
2730
+ "count": 193
2731
+ },
2732
+ "US": {
2733
+ "accuracy": 0.794392523364486,
2734
+ "count": 107
2735
+ }
2736
+ }
2737
+ },
2738
+ "add_C4": {
2739
+ "full_accuracy": 0.56,
2740
+ "n_examples": 100,
2741
+ "per_subtask": {
2742
+ "SA": {
2743
+ "accuracy": 1.0,
2744
+ "count": 200
2745
+ },
2746
+ "SC": {
2747
+ "accuracy": 1.0,
2748
+ "count": 100
2749
+ },
2750
+ "UC": {
2751
+ "accuracy": 0.828125,
2752
+ "count": 256
2753
+ },
2754
+ "US": {
2755
+ "accuracy": 0.7986111111111112,
2756
+ "count": 144
2757
+ }
2758
+ }
2759
+ },
2760
+ "add_C5": {
2761
+ "full_accuracy": 0.48,
2762
+ "n_examples": 100,
2763
+ "per_subtask": {
2764
+ "SA": {
2765
+ "accuracy": 1.0,
2766
+ "count": 100
2767
+ },
2768
+ "SC": {
2769
+ "accuracy": 1.0,
2770
+ "count": 100
2771
+ },
2772
+ "UC": {
2773
+ "accuracy": 0.8300653594771242,
2774
+ "count": 306
2775
+ },
2776
+ "US": {
2777
+ "accuracy": 0.7422680412371134,
2778
+ "count": 194
2779
+ }
2780
+ }
2781
+ },
2782
+ "add_C6": {
2783
+ "full_accuracy": 0.72,
2784
+ "n_examples": 100,
2785
+ "per_subtask": {
2786
+ "SC": {
2787
+ "accuracy": 1.0,
2788
+ "count": 100
2789
+ },
2790
+ "UC": {
2791
+ "accuracy": 0.9207650273224044,
2792
+ "count": 366
2793
+ },
2794
+ "US": {
2795
+ "accuracy": 0.9316239316239316,
2796
+ "count": 234
2797
+ }
2798
+ }
2799
+ },
2800
+ "sub_M0": {
2801
+ "full_accuracy": 0.87,
2802
+ "n_examples": 100,
2803
+ "per_subtask": {
2804
+ "MD": {
2805
+ "accuracy": 0.9800332778702163,
2806
+ "count": 601
2807
+ },
2808
+ "ME": {
2809
+ "accuracy": 0.9494949494949495,
2810
+ "count": 99
2811
+ }
2812
+ }
2813
+ },
2814
+ "sub_M1": {
2815
+ "full_accuracy": 0.95,
2816
+ "n_examples": 100,
2817
+ "per_subtask": {
2818
+ "MD": {
2819
+ "accuracy": 0.989247311827957,
2820
+ "count": 279
2821
+ },
2822
+ "MB": {
2823
+ "accuracy": 0.993103448275862,
2824
+ "count": 145
2825
+ },
2826
+ "ME": {
2827
+ "accuracy": 0.9583333333333334,
2828
+ "count": 24
2829
+ },
2830
+ "UB": {
2831
+ "accuracy": 1.0,
2832
+ "count": 252
2833
+ }
2834
+ }
2835
+ },
2836
+ "sub_M2": {
2837
+ "full_accuracy": 0.8,
2838
+ "n_examples": 100,
2839
+ "per_subtask": {
2840
+ "MD": {
2841
+ "accuracy": 1.0,
2842
+ "count": 213
2843
+ },
2844
+ "MB": {
2845
+ "accuracy": 1.0,
2846
+ "count": 113
2847
+ },
2848
+ "ME": {
2849
+ "accuracy": 0.9882352941176471,
2850
+ "count": 85
2851
+ },
2852
+ "UB": {
2853
+ "accuracy": 0.8950276243093923,
2854
+ "count": 181
2855
+ },
2856
+ "UD": {
2857
+ "accuracy": 1.0,
2858
+ "count": 108
2859
+ }
2860
+ }
2861
+ },
2862
+ "sub_M3": {
2863
+ "full_accuracy": 0.5,
2864
+ "n_examples": 100,
2865
+ "per_subtask": {
2866
+ "MD": {
2867
+ "accuracy": 1.0,
2868
+ "count": 179
2869
+ },
2870
+ "MB": {
2871
+ "accuracy": 0.9902912621359223,
2872
+ "count": 103
2873
+ },
2874
+ "ME": {
2875
+ "accuracy": 1.0,
2876
+ "count": 56
2877
+ },
2878
+ "UB": {
2879
+ "accuracy": 0.7114093959731543,
2880
+ "count": 149
2881
+ },
2882
+ "UD": {
2883
+ "accuracy": 0.892018779342723,
2884
+ "count": 213
2885
+ }
2886
+ }
2887
+ },
2888
+ "sub_M4": {
2889
+ "full_accuracy": 0.39,
2890
+ "n_examples": 100,
2891
+ "per_subtask": {
2892
+ "MD": {
2893
+ "accuracy": 1.0,
2894
+ "count": 200
2895
+ },
2896
+ "MB": {
2897
+ "accuracy": 1.0,
2898
+ "count": 100
2899
+ },
2900
+ "UB": {
2901
+ "accuracy": 0.55,
2902
+ "count": 100
2903
+ },
2904
+ "UD": {
2905
+ "accuracy": 0.7333333333333333,
2906
+ "count": 300
2907
+ }
2908
+ }
2909
+ },
2910
+ "sub_M5": {
2911
+ "full_accuracy": 0.54,
2912
+ "n_examples": 100,
2913
+ "per_subtask": {
2914
+ "MD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 100
2917
+ },
2918
+ "MB": {
2919
+ "accuracy": 1.0,
2920
+ "count": 100
2921
+ },
2922
+ "UB": {
2923
+ "accuracy": 0.54,
2924
+ "count": 100
2925
+ },
2926
+ "UD": {
2927
+ "accuracy": 0.695,
2928
+ "count": 400
2929
+ }
2930
+ }
2931
+ },
2932
+ "sub_random": {
2933
+ "full_accuracy": 0.915,
2934
+ "n_examples": 200,
2935
+ "per_subtask": {
2936
+ "MD": {
2937
+ "accuracy": 0.9933333333333333,
2938
+ "count": 600
2939
+ },
2940
+ "MB": {
2941
+ "accuracy": 0.9887640449438202,
2942
+ "count": 267
2943
+ },
2944
+ "ME": {
2945
+ "accuracy": 0.9811320754716981,
2946
+ "count": 53
2947
+ },
2948
+ "UB": {
2949
+ "accuracy": 0.9772209567198178,
2950
+ "count": 439
2951
+ },
2952
+ "UD": {
2953
+ "accuracy": 1.0,
2954
+ "count": 41
2955
+ }
2956
+ }
2957
+ },
2958
+ "sub_B3": {
2959
+ "full_accuracy": 0.77,
2960
+ "n_examples": 100,
2961
+ "per_subtask": {
2962
+ "MD": {
2963
+ "accuracy": 1.0,
2964
+ "count": 300
2965
+ },
2966
+ "MB": {
2967
+ "accuracy": 1.0,
2968
+ "count": 100
2969
+ },
2970
+ "UB": {
2971
+ "accuracy": 0.8934010152284264,
2972
+ "count": 197
2973
+ },
2974
+ "UD": {
2975
+ "accuracy": 0.912621359223301,
2976
+ "count": 103
2977
+ }
2978
+ }
2979
+ },
2980
+ "sub_B4": {
2981
+ "full_accuracy": 0.73,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "MD": {
2985
+ "accuracy": 1.0,
2986
+ "count": 200
2987
+ },
2988
+ "MB": {
2989
+ "accuracy": 1.0,
2990
+ "count": 100
2991
+ },
2992
+ "UB": {
2993
+ "accuracy": 0.902834008097166,
2994
+ "count": 247
2995
+ },
2996
+ "UD": {
2997
+ "accuracy": 0.8888888888888888,
2998
+ "count": 153
2999
+ }
3000
+ }
3001
+ },
3002
+ "sub_B5": {
3003
+ "full_accuracy": 0.6,
3004
+ "n_examples": 100,
3005
+ "per_subtask": {
3006
+ "MD": {
3007
+ "accuracy": 1.0,
3008
+ "count": 100
3009
+ },
3010
+ "MB": {
3011
+ "accuracy": 1.0,
3012
+ "count": 100
3013
+ },
3014
+ "UB": {
3015
+ "accuracy": 0.889261744966443,
3016
+ "count": 298
3017
+ },
3018
+ "UD": {
3019
+ "accuracy": 0.8613861386138614,
3020
+ "count": 202
3021
+ }
3022
+ }
3023
+ }
3024
+ },
3025
+ "summary": {
3026
+ "overall_accuracy": 0.6966666666666667,
3027
+ "total_examples": 2400,
3028
+ "n_splits": 22
3029
+ }
3030
+ },
3031
+ "sorl_eval": {
3032
+ "config": {
3033
+ "ops": "add_sub",
3034
+ "K": 4,
3035
+ "mode": "sorl",
3036
+ "n_digits": 6,
3037
+ "n_per_split": 100
3038
+ },
3039
+ "splits": {
3040
+ "add_S0": {
3041
+ "full_accuracy": 1.0,
3042
+ "n_examples": 100,
3043
+ "per_subtask": {
3044
+ "SA": {
3045
+ "accuracy": 1.0,
3046
+ "count": 605
3047
+ },
3048
+ "SS": {
3049
+ "accuracy": 1.0,
3050
+ "count": 95
3051
+ }
3052
+ }
3053
+ },
3054
+ "add_S1": {
3055
+ "full_accuracy": 1.0,
3056
+ "n_examples": 100,
3057
+ "per_subtask": {
3058
+ "SA": {
3059
+ "accuracy": 1.0,
3060
+ "count": 204
3061
+ },
3062
+ "SC": {
3063
+ "accuracy": 1.0,
3064
+ "count": 169
3065
+ },
3066
+ "SS": {
3067
+ "accuracy": 1.0,
3068
+ "count": 31
3069
+ },
3070
+ "UC": {
3071
+ "accuracy": 1.0,
3072
+ "count": 296
3073
+ }
3074
+ }
3075
+ },
3076
+ "add_S2": {
3077
+ "full_accuracy": 1.0,
3078
+ "n_examples": 100,
3079
+ "per_subtask": {
3080
+ "SA": {
3081
+ "accuracy": 1.0,
3082
+ "count": 163
3083
+ },
3084
+ "SC": {
3085
+ "accuracy": 1.0,
3086
+ "count": 130
3087
+ },
3088
+ "SS": {
3089
+ "accuracy": 1.0,
3090
+ "count": 87
3091
+ },
3092
+ "UC": {
3093
+ "accuracy": 1.0,
3094
+ "count": 203
3095
+ },
3096
+ "US": {
3097
+ "accuracy": 1.0,
3098
+ "count": 117
3099
+ }
3100
+ }
3101
+ },
3102
+ "add_S3": {
3103
+ "full_accuracy": 1.0,
3104
+ "n_examples": 100,
3105
+ "per_subtask": {
3106
+ "SA": {
3107
+ "accuracy": 1.0,
3108
+ "count": 121
3109
+ },
3110
+ "SC": {
3111
+ "accuracy": 1.0,
3112
+ "count": 121
3113
+ },
3114
+ "SS": {
3115
+ "accuracy": 1.0,
3116
+ "count": 49
3117
+ },
3118
+ "UC": {
3119
+ "accuracy": 1.0,
3120
+ "count": 186
3121
+ },
3122
+ "US": {
3123
+ "accuracy": 1.0,
3124
+ "count": 223
3125
+ }
3126
+ }
3127
+ },
3128
+ "add_S4": {
3129
+ "full_accuracy": 1.0,
3130
+ "n_examples": 100,
3131
+ "per_subtask": {
3132
+ "SA": {
3133
+ "accuracy": 1.0,
3134
+ "count": 104
3135
+ },
3136
+ "SC": {
3137
+ "accuracy": 1.0,
3138
+ "count": 106
3139
+ },
3140
+ "SS": {
3141
+ "accuracy": 1.0,
3142
+ "count": 23
3143
+ },
3144
+ "UC": {
3145
+ "accuracy": 1.0,
3146
+ "count": 160
3147
+ },
3148
+ "US": {
3149
+ "accuracy": 1.0,
3150
+ "count": 307
3151
+ }
3152
+ }
3153
+ },
3154
+ "add_S5": {
3155
+ "full_accuracy": 1.0,
3156
+ "n_examples": 100,
3157
+ "per_subtask": {
3158
+ "SA": {
3159
+ "accuracy": 1.0,
3160
+ "count": 100
3161
+ },
3162
+ "SC": {
3163
+ "accuracy": 1.0,
3164
+ "count": 100
3165
+ },
3166
+ "UC": {
3167
+ "accuracy": 1.0,
3168
+ "count": 100
3169
+ },
3170
+ "US": {
3171
+ "accuracy": 1.0,
3172
+ "count": 400
3173
+ }
3174
+ }
3175
+ },
3176
+ "add_S6": {
3177
+ "full_accuracy": 1.0,
3178
+ "n_examples": 100,
3179
+ "per_subtask": {
3180
+ "SC": {
3181
+ "accuracy": 1.0,
3182
+ "count": 100
3183
+ },
3184
+ "UC": {
3185
+ "accuracy": 1.0,
3186
+ "count": 100
3187
+ },
3188
+ "US": {
3189
+ "accuracy": 1.0,
3190
+ "count": 500
3191
+ }
3192
+ }
3193
+ },
3194
+ "add_random": {
3195
+ "full_accuracy": 1.0,
3196
+ "n_examples": 200,
3197
+ "per_subtask": {
3198
+ "SA": {
3199
+ "accuracy": 1.0,
3200
+ "count": 447
3201
+ },
3202
+ "SC": {
3203
+ "accuracy": 1.0,
3204
+ "count": 320
3205
+ },
3206
+ "SS": {
3207
+ "accuracy": 1.0,
3208
+ "count": 56
3209
+ },
3210
+ "UC": {
3211
+ "accuracy": 1.0,
3212
+ "count": 529
3213
+ },
3214
+ "US": {
3215
+ "accuracy": 1.0,
3216
+ "count": 48
3217
+ }
3218
+ }
3219
+ },
3220
+ "add_C3": {
3221
+ "full_accuracy": 1.0,
3222
+ "n_examples": 100,
3223
+ "per_subtask": {
3224
+ "SA": {
3225
+ "accuracy": 1.0,
3226
+ "count": 300
3227
+ },
3228
+ "SC": {
3229
+ "accuracy": 1.0,
3230
+ "count": 100
3231
+ },
3232
+ "UC": {
3233
+ "accuracy": 1.0,
3234
+ "count": 193
3235
+ },
3236
+ "US": {
3237
+ "accuracy": 1.0,
3238
+ "count": 107
3239
+ }
3240
+ }
3241
+ },
3242
+ "add_C4": {
3243
+ "full_accuracy": 1.0,
3244
+ "n_examples": 100,
3245
+ "per_subtask": {
3246
+ "SA": {
3247
+ "accuracy": 1.0,
3248
+ "count": 200
3249
+ },
3250
+ "SC": {
3251
+ "accuracy": 1.0,
3252
+ "count": 100
3253
+ },
3254
+ "UC": {
3255
+ "accuracy": 1.0,
3256
+ "count": 256
3257
+ },
3258
+ "US": {
3259
+ "accuracy": 1.0,
3260
+ "count": 144
3261
+ }
3262
+ }
3263
+ },
3264
+ "add_C5": {
3265
+ "full_accuracy": 1.0,
3266
+ "n_examples": 100,
3267
+ "per_subtask": {
3268
+ "SA": {
3269
+ "accuracy": 1.0,
3270
+ "count": 100
3271
+ },
3272
+ "SC": {
3273
+ "accuracy": 1.0,
3274
+ "count": 100
3275
+ },
3276
+ "UC": {
3277
+ "accuracy": 1.0,
3278
+ "count": 306
3279
+ },
3280
+ "US": {
3281
+ "accuracy": 1.0,
3282
+ "count": 194
3283
+ }
3284
+ }
3285
+ },
3286
+ "add_C6": {
3287
+ "full_accuracy": 1.0,
3288
+ "n_examples": 100,
3289
+ "per_subtask": {
3290
+ "SC": {
3291
+ "accuracy": 1.0,
3292
+ "count": 100
3293
+ },
3294
+ "UC": {
3295
+ "accuracy": 1.0,
3296
+ "count": 366
3297
+ },
3298
+ "US": {
3299
+ "accuracy": 1.0,
3300
+ "count": 234
3301
+ }
3302
+ }
3303
+ },
3304
+ "sub_M0": {
3305
+ "full_accuracy": 1.0,
3306
+ "n_examples": 100,
3307
+ "per_subtask": {
3308
+ "MD": {
3309
+ "accuracy": 1.0,
3310
+ "count": 601
3311
+ },
3312
+ "ME": {
3313
+ "accuracy": 1.0,
3314
+ "count": 99
3315
+ }
3316
+ }
3317
+ },
3318
+ "sub_M1": {
3319
+ "full_accuracy": 1.0,
3320
+ "n_examples": 100,
3321
+ "per_subtask": {
3322
+ "MD": {
3323
+ "accuracy": 1.0,
3324
+ "count": 279
3325
+ },
3326
+ "MB": {
3327
+ "accuracy": 1.0,
3328
+ "count": 145
3329
+ },
3330
+ "ME": {
3331
+ "accuracy": 1.0,
3332
+ "count": 24
3333
+ },
3334
+ "UB": {
3335
+ "accuracy": 1.0,
3336
+ "count": 252
3337
+ }
3338
+ }
3339
+ },
3340
+ "sub_M2": {
3341
+ "full_accuracy": 1.0,
3342
+ "n_examples": 100,
3343
+ "per_subtask": {
3344
+ "MD": {
3345
+ "accuracy": 1.0,
3346
+ "count": 213
3347
+ },
3348
+ "MB": {
3349
+ "accuracy": 1.0,
3350
+ "count": 113
3351
+ },
3352
+ "ME": {
3353
+ "accuracy": 1.0,
3354
+ "count": 85
3355
+ },
3356
+ "UB": {
3357
+ "accuracy": 1.0,
3358
+ "count": 181
3359
+ },
3360
+ "UD": {
3361
+ "accuracy": 1.0,
3362
+ "count": 108
3363
+ }
3364
+ }
3365
+ },
3366
+ "sub_M3": {
3367
+ "full_accuracy": 1.0,
3368
+ "n_examples": 100,
3369
+ "per_subtask": {
3370
+ "MD": {
3371
+ "accuracy": 1.0,
3372
+ "count": 179
3373
+ },
3374
+ "MB": {
3375
+ "accuracy": 1.0,
3376
+ "count": 103
3377
+ },
3378
+ "ME": {
3379
+ "accuracy": 1.0,
3380
+ "count": 56
3381
+ },
3382
+ "UB": {
3383
+ "accuracy": 1.0,
3384
+ "count": 149
3385
+ },
3386
+ "UD": {
3387
+ "accuracy": 1.0,
3388
+ "count": 213
3389
+ }
3390
+ }
3391
+ },
3392
+ "sub_M4": {
3393
+ "full_accuracy": 1.0,
3394
+ "n_examples": 100,
3395
+ "per_subtask": {
3396
+ "MD": {
3397
+ "accuracy": 1.0,
3398
+ "count": 200
3399
+ },
3400
+ "MB": {
3401
+ "accuracy": 1.0,
3402
+ "count": 100
3403
+ },
3404
+ "UB": {
3405
+ "accuracy": 1.0,
3406
+ "count": 100
3407
+ },
3408
+ "UD": {
3409
+ "accuracy": 1.0,
3410
+ "count": 300
3411
+ }
3412
+ }
3413
+ },
3414
+ "sub_M5": {
3415
+ "full_accuracy": 1.0,
3416
+ "n_examples": 100,
3417
+ "per_subtask": {
3418
+ "MD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 100
3421
+ },
3422
+ "MB": {
3423
+ "accuracy": 1.0,
3424
+ "count": 100
3425
+ },
3426
+ "UB": {
3427
+ "accuracy": 1.0,
3428
+ "count": 100
3429
+ },
3430
+ "UD": {
3431
+ "accuracy": 1.0,
3432
+ "count": 400
3433
+ }
3434
+ }
3435
+ },
3436
+ "sub_random": {
3437
+ "full_accuracy": 1.0,
3438
+ "n_examples": 200,
3439
+ "per_subtask": {
3440
+ "MD": {
3441
+ "accuracy": 1.0,
3442
+ "count": 600
3443
+ },
3444
+ "MB": {
3445
+ "accuracy": 1.0,
3446
+ "count": 267
3447
+ },
3448
+ "ME": {
3449
+ "accuracy": 1.0,
3450
+ "count": 53
3451
+ },
3452
+ "UB": {
3453
+ "accuracy": 1.0,
3454
+ "count": 439
3455
+ },
3456
+ "UD": {
3457
+ "accuracy": 1.0,
3458
+ "count": 41
3459
+ }
3460
+ }
3461
+ },
3462
+ "sub_B3": {
3463
+ "full_accuracy": 1.0,
3464
+ "n_examples": 100,
3465
+ "per_subtask": {
3466
+ "MD": {
3467
+ "accuracy": 1.0,
3468
+ "count": 300
3469
+ },
3470
+ "MB": {
3471
+ "accuracy": 1.0,
3472
+ "count": 100
3473
+ },
3474
+ "UB": {
3475
+ "accuracy": 1.0,
3476
+ "count": 197
3477
+ },
3478
+ "UD": {
3479
+ "accuracy": 1.0,
3480
+ "count": 103
3481
+ }
3482
+ }
3483
+ },
3484
+ "sub_B4": {
3485
+ "full_accuracy": 1.0,
3486
+ "n_examples": 100,
3487
+ "per_subtask": {
3488
+ "MD": {
3489
+ "accuracy": 1.0,
3490
+ "count": 200
3491
+ },
3492
+ "MB": {
3493
+ "accuracy": 1.0,
3494
+ "count": 100
3495
+ },
3496
+ "UB": {
3497
+ "accuracy": 1.0,
3498
+ "count": 247
3499
+ },
3500
+ "UD": {
3501
+ "accuracy": 1.0,
3502
+ "count": 153
3503
+ }
3504
+ }
3505
+ },
3506
+ "sub_B5": {
3507
+ "full_accuracy": 1.0,
3508
+ "n_examples": 100,
3509
+ "per_subtask": {
3510
+ "MD": {
3511
+ "accuracy": 1.0,
3512
+ "count": 100
3513
+ },
3514
+ "MB": {
3515
+ "accuracy": 1.0,
3516
+ "count": 100
3517
+ },
3518
+ "UB": {
3519
+ "accuracy": 1.0,
3520
+ "count": 298
3521
+ },
3522
+ "UD": {
3523
+ "accuracy": 1.0,
3524
+ "count": 202
3525
+ }
3526
+ }
3527
+ }
3528
+ },
3529
+ "summary": {
3530
+ "overall_accuracy": 1.0,
3531
+ "total_examples": 2400,
3532
+ "n_splits": 22
3533
+ }
3534
+ },
3535
+ "sorl_overall_accuracy": 1.0,
3536
+ "sft_overall_accuracy": 0.6966666666666667
3537
+ }
add_sub_sorl_v1_abs70_100K/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:a22585d5e73e8ab5432b201cbfb9c017aa84e8d3422df85ec5407c5771999d1b
3
+ size 650548580
add_sub_sorl_v1_abs70_100K/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 4,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 4e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 10,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 1562,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs70_K4_100K",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 2,
61
+ "n_head": 3,
62
+ "n_embd": 510,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 70,
65
+ "dataset_size": 100000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 162560462,
71
+ "run_name": "add_sub_sorl_v1_abs70_100K",
72
+ "git_commit": "f447da529caceac8c7d256cbb2cd185cbc50feac",
73
+ "timestamp": "2026-04-12T18:34:15.781726+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "0azo3lkz",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/0azo3lkz",
81
+ "final_accuracy": 1.0,
82
+ "sft_accuracy": 0.6966666666666667,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }