amirali1985 commited on
Commit
db98d23
·
verified ·
1 Parent(s): af46ec0

Upload add_sub_sorl_v1_abs70_K1_100K

Browse files
add_sub_sorl_v1_abs70_K1_100K/config.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 510,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 2040,
15
+ "layer_types": [
16
+ "full_attention",
17
+ "full_attention"
18
+ ],
19
+ "max_position_embeddings": 128,
20
+ "max_window_layers": 28,
21
+ "model_type": "qwen3",
22
+ "num_attention_heads": 3,
23
+ "num_hidden_layers": 2,
24
+ "num_key_value_heads": 3,
25
+ "pad_token_id": null,
26
+ "rms_norm_eps": 1e-06,
27
+ "rope_parameters": {
28
+ "rope_theta": 10000.0,
29
+ "rope_type": "default"
30
+ },
31
+ "sliding_window": null,
32
+ "tie_word_embeddings": false,
33
+ "transformers_version": "5.5.0",
34
+ "use_cache": true,
35
+ "use_sliding_window": false,
36
+ "vocab_size": 151714
37
+ }
add_sub_sorl_v1_abs70_K1_100K/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs70_K1_100K/metrics.json ADDED
@@ -0,0 +1,3537 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 800,
20
+ 850,
21
+ 900,
22
+ 950,
23
+ 1000,
24
+ 1050,
25
+ 1100,
26
+ 1150,
27
+ 1200,
28
+ 1250,
29
+ 1300,
30
+ 1350,
31
+ 1400,
32
+ 1450,
33
+ 1500,
34
+ 1550,
35
+ 1613,
36
+ 1663,
37
+ 1713,
38
+ 1763,
39
+ 1813,
40
+ 1863,
41
+ 1913,
42
+ 1963,
43
+ 2013,
44
+ 2063,
45
+ 2113,
46
+ 2163,
47
+ 2213,
48
+ 2263,
49
+ 2313,
50
+ 2363,
51
+ 2413,
52
+ 2463,
53
+ 2513,
54
+ 2563,
55
+ 2613,
56
+ 2663,
57
+ 2713,
58
+ 2763,
59
+ 2813,
60
+ 2863,
61
+ 2913,
62
+ 2963,
63
+ 3013,
64
+ 3063,
65
+ 3113,
66
+ 3176,
67
+ 3226,
68
+ 3276,
69
+ 3326,
70
+ 3376,
71
+ 3426,
72
+ 3476,
73
+ 3526,
74
+ 3576,
75
+ 3626,
76
+ 3676,
77
+ 3726,
78
+ 3776,
79
+ 3826,
80
+ 3876,
81
+ 3926,
82
+ 3976,
83
+ 4026,
84
+ 4076,
85
+ 4126,
86
+ 4176,
87
+ 4226,
88
+ 4276,
89
+ 4326,
90
+ 4376,
91
+ 4426,
92
+ 4476,
93
+ 4526,
94
+ 4576,
95
+ 4626,
96
+ 4676,
97
+ 4739,
98
+ 4789,
99
+ 4839,
100
+ 4889,
101
+ 4939,
102
+ 4989,
103
+ 5039,
104
+ 5089,
105
+ 5139,
106
+ 5189,
107
+ 5239,
108
+ 5289,
109
+ 5339,
110
+ 5389,
111
+ 5439,
112
+ 5489,
113
+ 5539,
114
+ 5589,
115
+ 5639,
116
+ 5689,
117
+ 5739,
118
+ 5789,
119
+ 5839,
120
+ 5889,
121
+ 5939,
122
+ 5989,
123
+ 6039,
124
+ 6089,
125
+ 6139,
126
+ 6189,
127
+ 6239,
128
+ 6302,
129
+ 6352,
130
+ 6402,
131
+ 6452,
132
+ 6502,
133
+ 6552,
134
+ 6602,
135
+ 6652,
136
+ 6702,
137
+ 6752,
138
+ 6802,
139
+ 6852,
140
+ 6902,
141
+ 6952,
142
+ 7002,
143
+ 7052,
144
+ 7102,
145
+ 7152,
146
+ 7202,
147
+ 7252,
148
+ 7302,
149
+ 7352,
150
+ 7402,
151
+ 7452,
152
+ 7502,
153
+ 7552,
154
+ 7602,
155
+ 7652,
156
+ 7702,
157
+ 7752,
158
+ 7802,
159
+ 7865,
160
+ 7915,
161
+ 7965,
162
+ 8015,
163
+ 8065,
164
+ 8115,
165
+ 8165,
166
+ 8215,
167
+ 8265,
168
+ 8315,
169
+ 8365,
170
+ 8415,
171
+ 8465,
172
+ 8515,
173
+ 8565,
174
+ 8615,
175
+ 8665,
176
+ 8715,
177
+ 8765,
178
+ 8815,
179
+ 8865,
180
+ 8915,
181
+ 8965,
182
+ 9015,
183
+ 9065,
184
+ 9115,
185
+ 9165,
186
+ 9215,
187
+ 9265,
188
+ 9315,
189
+ 9365,
190
+ 9428,
191
+ 9478,
192
+ 9528,
193
+ 9578,
194
+ 9628,
195
+ 9678,
196
+ 9728,
197
+ 9778,
198
+ 9828,
199
+ 9878,
200
+ 9928,
201
+ 9978,
202
+ 10028,
203
+ 10078,
204
+ 10128,
205
+ 10178,
206
+ 10228,
207
+ 10278,
208
+ 10328,
209
+ 10378,
210
+ 10428,
211
+ 10478,
212
+ 10528,
213
+ 10578,
214
+ 10628,
215
+ 10678,
216
+ 10728,
217
+ 10778,
218
+ 10828,
219
+ 10878,
220
+ 10928,
221
+ 10991,
222
+ 11041,
223
+ 11091,
224
+ 11141,
225
+ 11191,
226
+ 11241,
227
+ 11291,
228
+ 11341,
229
+ 11391,
230
+ 11441,
231
+ 11491,
232
+ 11541,
233
+ 11591,
234
+ 11641,
235
+ 11691,
236
+ 11741,
237
+ 11791,
238
+ 11841,
239
+ 11891,
240
+ 11941,
241
+ 11991,
242
+ 12041,
243
+ 12091,
244
+ 12141,
245
+ 12191,
246
+ 12241,
247
+ 12291,
248
+ 12341,
249
+ 12391,
250
+ 12441,
251
+ 12491,
252
+ 12554,
253
+ 12604,
254
+ 12654,
255
+ 12704,
256
+ 12754,
257
+ 12804,
258
+ 12854,
259
+ 12904,
260
+ 12954,
261
+ 13004,
262
+ 13054,
263
+ 13104,
264
+ 13154,
265
+ 13204,
266
+ 13254,
267
+ 13304,
268
+ 13354,
269
+ 13404,
270
+ 13454,
271
+ 13504,
272
+ 13554,
273
+ 13604,
274
+ 13654,
275
+ 13704,
276
+ 13754,
277
+ 13804,
278
+ 13854,
279
+ 13904,
280
+ 13954,
281
+ 14004,
282
+ 14054,
283
+ 14117,
284
+ 14167,
285
+ 14217,
286
+ 14267,
287
+ 14317,
288
+ 14367,
289
+ 14417,
290
+ 14467,
291
+ 14517,
292
+ 14567,
293
+ 14617,
294
+ 14667,
295
+ 14717,
296
+ 14767,
297
+ 14817,
298
+ 14867,
299
+ 14917,
300
+ 14967,
301
+ 15017,
302
+ 15067,
303
+ 15117,
304
+ 15167,
305
+ 15217,
306
+ 15267,
307
+ 15317,
308
+ 15367,
309
+ 15417,
310
+ 15467,
311
+ 15517,
312
+ 15567,
313
+ 15617
314
+ ],
315
+ "loss": [
316
+ 0.8866982460021973,
317
+ -3.788806915283203,
318
+ 4.6006011962890625,
319
+ 6.147926330566406,
320
+ 5.222723960876465,
321
+ 3.776581048965454,
322
+ 2.457441806793213,
323
+ 2.4024930000305176,
324
+ 2.2147018909454346,
325
+ 2.0642762184143066,
326
+ -1.2444977760314941,
327
+ -5.036869049072266,
328
+ -5.4967427253723145,
329
+ -2.640268564224243,
330
+ -1.4451607465744019,
331
+ -1.0451411008834839,
332
+ -1.7194592952728271,
333
+ -1.4358991384506226,
334
+ -1.6920527219772339,
335
+ -1.0755432844161987,
336
+ -1.4901912212371826,
337
+ -0.7330172061920166,
338
+ -0.5352746844291687,
339
+ -0.27819138765335083,
340
+ -1.2732810974121094,
341
+ -0.7306901812553406,
342
+ -0.572812557220459,
343
+ -0.7788453698158264,
344
+ -0.3419772982597351,
345
+ -0.8455581665039062,
346
+ -0.8026807308197021,
347
+ -0.36284172534942627,
348
+ -0.259625643491745,
349
+ -0.13749879598617554,
350
+ -0.4098086357116699,
351
+ -0.36508411169052124,
352
+ -0.4451039433479309,
353
+ -0.29875731468200684,
354
+ 0.015173077583312988,
355
+ -0.4868472218513489,
356
+ -0.5156322717666626,
357
+ -0.8024143576622009,
358
+ -0.4307299256324768,
359
+ -0.47916728258132935,
360
+ -0.3247167468070984,
361
+ -0.07097569108009338,
362
+ -0.5756721496582031,
363
+ -0.37441447377204895,
364
+ -0.451339453458786,
365
+ -0.8175148963928223,
366
+ -0.43502888083457947,
367
+ -0.4419375956058502,
368
+ -0.27625226974487305,
369
+ -0.4736276865005493,
370
+ -0.541213870048523,
371
+ -0.4443986117839813,
372
+ -0.3302844762802124,
373
+ -0.7712308764457703,
374
+ -0.42658883333206177,
375
+ -0.8083404898643494,
376
+ -0.6433419585227966,
377
+ -0.4524625539779663,
378
+ -0.2413674145936966,
379
+ -0.27073317766189575,
380
+ -0.6301178336143494,
381
+ -0.442097008228302,
382
+ -0.6382318139076233,
383
+ -0.27032169699668884,
384
+ -0.3972350060939789,
385
+ -0.841691792011261,
386
+ -0.32364097237586975,
387
+ -0.7708748579025269,
388
+ -0.8563361763954163,
389
+ -0.26667487621307373,
390
+ -0.6592992544174194,
391
+ -0.5177367329597473,
392
+ -0.5369452238082886,
393
+ -0.20350953936576843,
394
+ -0.6344473361968994,
395
+ -0.2492152750492096,
396
+ -0.39206355810165405,
397
+ -0.26421600580215454,
398
+ -0.4335653483867645,
399
+ -0.8035870790481567,
400
+ -0.22930318117141724,
401
+ -0.2077687680721283,
402
+ -0.37174728512763977,
403
+ 0.004082925617694855,
404
+ -0.3117775321006775,
405
+ -0.38674020767211914,
406
+ -0.7881333231925964,
407
+ -0.2837821841239929,
408
+ -0.38362932205200195,
409
+ -0.08608970046043396,
410
+ -0.2472025752067566,
411
+ -0.3545932471752167,
412
+ -0.652929961681366,
413
+ -0.0645827129483223,
414
+ -0.3655315339565277,
415
+ -0.3237170875072479,
416
+ -0.3274988532066345,
417
+ -0.2829725742340088,
418
+ -0.3568487763404846,
419
+ -0.1458946317434311,
420
+ -0.10398125648498535,
421
+ -0.24189360439777374,
422
+ -0.1451478898525238,
423
+ -1.0633833408355713,
424
+ -0.21429307758808136,
425
+ -0.04533877968788147,
426
+ -0.17476031184196472,
427
+ -0.18522730469703674,
428
+ -0.27521827816963196,
429
+ -0.17089524865150452,
430
+ -0.340803325176239,
431
+ -0.5030611753463745,
432
+ -0.07963436841964722,
433
+ -0.13622424006462097,
434
+ 0.024718627333641052,
435
+ -0.0819568857550621,
436
+ -0.12208741903305054,
437
+ -0.16242460906505585,
438
+ -0.28225821256637573,
439
+ -0.15099027752876282,
440
+ -0.22738218307495117,
441
+ -0.20120716094970703,
442
+ -0.0576200932264328,
443
+ -0.12784433364868164,
444
+ -0.17364099621772766,
445
+ -0.42879945039749146,
446
+ -0.38950347900390625,
447
+ -0.18074668943881989,
448
+ -0.21955963969230652,
449
+ -0.3327450156211853,
450
+ -0.1898571401834488,
451
+ -0.2271229326725006,
452
+ -0.1481928825378418,
453
+ -0.18389306962490082,
454
+ -0.11143359541893005,
455
+ -0.30136844515800476,
456
+ -0.27999985218048096,
457
+ -0.11647064983844757,
458
+ -0.21506455540657043,
459
+ -0.17757993936538696,
460
+ -0.21700815856456757,
461
+ -0.114307701587677,
462
+ -0.31339240074157715,
463
+ -0.04498620331287384,
464
+ -0.34631019830703735,
465
+ -0.09179767966270447,
466
+ -0.15248030424118042,
467
+ -0.031176552176475525,
468
+ -0.06657453626394272,
469
+ -0.2532966434955597,
470
+ -0.43234604597091675,
471
+ -0.16614198684692383,
472
+ -0.24050378799438477,
473
+ -0.2950085401535034,
474
+ -0.28000640869140625,
475
+ -0.3232608139514923,
476
+ -0.3079572021961212,
477
+ -0.016652211546897888,
478
+ -0.1261325627565384,
479
+ -0.4262658357620239,
480
+ -0.03386596217751503,
481
+ -0.05903532728552818,
482
+ -0.15719354152679443,
483
+ -0.22293366491794586,
484
+ -0.1726878434419632,
485
+ -0.13456402719020844,
486
+ -0.38129571080207825,
487
+ -0.05523914098739624,
488
+ -0.03955927863717079,
489
+ -0.0598689429461956,
490
+ -0.1914459466934204,
491
+ -0.03307018429040909,
492
+ -0.23427842557430267,
493
+ -0.10844185203313828,
494
+ -0.1488707810640335,
495
+ -0.08564920723438263,
496
+ -0.3566935956478119,
497
+ -0.29904669523239136,
498
+ -0.20036576688289642,
499
+ -0.05108006298542023,
500
+ -0.02853963151574135,
501
+ -0.04621351882815361,
502
+ -0.09279734641313553,
503
+ -0.04983488470315933,
504
+ -0.050096526741981506,
505
+ -0.19188326597213745,
506
+ -0.1619933545589447,
507
+ -0.18380281329154968,
508
+ -0.12040083110332489,
509
+ -0.21095359325408936,
510
+ -0.0382847897708416,
511
+ -0.018444810062646866,
512
+ -0.04622134566307068,
513
+ -0.02845964953303337,
514
+ -0.2934240400791168,
515
+ -0.01998162642121315,
516
+ -0.1197638213634491,
517
+ -0.039724960923194885,
518
+ -0.057806722819805145,
519
+ -0.18715299665927887,
520
+ -0.07705263048410416,
521
+ -0.0698586255311966,
522
+ -0.047387219965457916,
523
+ -0.23807889223098755,
524
+ -0.11732307076454163,
525
+ -0.14464294910430908,
526
+ -0.12694129347801208,
527
+ -0.0581982247531414,
528
+ -0.023055382072925568,
529
+ -0.03726552799344063,
530
+ -0.05346151441335678,
531
+ -0.0014413408935070038,
532
+ -0.17088867723941803,
533
+ -0.049447543919086456,
534
+ -0.2470145970582962,
535
+ 0.07553483545780182,
536
+ -0.026642469689249992,
537
+ -0.06761228293180466,
538
+ 0.008223917335271835,
539
+ -0.05468817800283432,
540
+ -0.042907387018203735,
541
+ -0.3006502091884613,
542
+ -0.1156216412782669,
543
+ -0.09995187819004059,
544
+ -0.030014846473932266,
545
+ -0.04077576473355293,
546
+ 0.005617255344986916,
547
+ 0.02524901181459427,
548
+ -0.0015042833983898163,
549
+ -0.10043550282716751,
550
+ 0.021284686401486397,
551
+ 0.016086656600236893,
552
+ 0.01281595230102539,
553
+ -0.11459367722272873,
554
+ -0.022535031661391258,
555
+ -0.020949706435203552,
556
+ -0.0026400797069072723,
557
+ -0.214441180229187,
558
+ -0.14377188682556152,
559
+ 0.02788509987294674,
560
+ 0.00993034802377224,
561
+ -0.0016724932938814163,
562
+ -0.17991676926612854,
563
+ 0.028261449187994003,
564
+ -0.019934533163905144,
565
+ -0.02670363336801529,
566
+ 0.001590728759765625,
567
+ 0.026498550549149513,
568
+ -0.011777322739362717,
569
+ 0.008050614967942238,
570
+ 0.018580133095383644,
571
+ -0.009862998500466347,
572
+ -0.05111939460039139,
573
+ 0.02294507622718811,
574
+ 0.02354084700345993,
575
+ 0.014864549040794373,
576
+ 0.015116050839424133,
577
+ -0.0019109994173049927,
578
+ -0.023882966488599777,
579
+ 0.03031952679157257,
580
+ 0.01132000982761383,
581
+ 0.023004408925771713,
582
+ -0.0062728151679039,
583
+ -0.0044120922684669495,
584
+ -0.023699549958109856,
585
+ 0.020205317065119743,
586
+ -0.03993557021021843,
587
+ -0.015972048044204712,
588
+ 0.010975193232297897,
589
+ 0.025547031313180923,
590
+ 0.02101135067641735,
591
+ -0.060543861240148544,
592
+ -0.011877233162522316,
593
+ -0.003494463860988617,
594
+ 0.02812216617166996,
595
+ 0.02014692686498165,
596
+ 0.03645240515470505,
597
+ -0.11368466913700104,
598
+ -0.045479319989681244,
599
+ -0.03400401026010513,
600
+ 0.03612872585654259,
601
+ 0.0029280781745910645,
602
+ 0.022409683093428612,
603
+ -0.024222176522016525,
604
+ 0.012166932225227356,
605
+ 0.008208783343434334,
606
+ 0.011064102873206139,
607
+ 0.016111813485622406,
608
+ 0.023987339809536934,
609
+ -0.00252627395093441,
610
+ 0.02619614638388157,
611
+ 0.01574827916920185,
612
+ 0.024821491912007332,
613
+ 0.020048806443810463,
614
+ 0.028652073815464973,
615
+ 0.018157264217734337,
616
+ 0.04146207869052887,
617
+ 0.02275739423930645,
618
+ 0.011289171874523163,
619
+ 0.015728529542684555,
620
+ 0.001628907397389412,
621
+ 0.027351073920726776,
622
+ 0.03395961597561836,
623
+ 0.02672100067138672,
624
+ 0.03158589079976082,
625
+ 0.04801052808761597
626
+ ],
627
+ "base_loss": [
628
+ 11.357035636901855,
629
+ 9.554627418518066,
630
+ 8.089612007141113,
631
+ 6.8033599853515625,
632
+ 5.436634540557861,
633
+ 3.556497573852539,
634
+ 2.149662733078003,
635
+ 2.006547451019287,
636
+ 1.8919860124588013,
637
+ 1.8072749376296997,
638
+ 1.872997522354126,
639
+ 1.7792257070541382,
640
+ 1.6071090698242188,
641
+ 1.112163782119751,
642
+ 0.8354216814041138,
643
+ 0.7096108794212341,
644
+ 0.7130460143089294,
645
+ 0.5602771043777466,
646
+ 0.5379956960678101,
647
+ 0.46152231097221375,
648
+ 0.4370526671409607,
649
+ 0.3518361747264862,
650
+ 0.3346538543701172,
651
+ 0.2822693884372711,
652
+ 0.33899518847465515,
653
+ 0.29478055238723755,
654
+ 0.28290292620658875,
655
+ 0.28591009974479675,
656
+ 0.22296097874641418,
657
+ 0.2542581260204315,
658
+ 0.26360660791397095,
659
+ 0.19018495082855225,
660
+ 0.17572066187858582,
661
+ 0.16143979132175446,
662
+ 0.17480485141277313,
663
+ 0.17752592265605927,
664
+ 0.18381091952323914,
665
+ 0.13680386543273926,
666
+ 0.13213439285755157,
667
+ 0.22231772541999817,
668
+ 0.18177072703838348,
669
+ 0.18350276350975037,
670
+ 0.13274386525154114,
671
+ 0.14343996345996857,
672
+ 0.12973876297473907,
673
+ 0.160408154129982,
674
+ 0.14224952459335327,
675
+ 0.12320417910814285,
676
+ 0.15530596673488617,
677
+ 0.18369950354099274,
678
+ 0.11644283682107925,
679
+ 0.12331365048885345,
680
+ 0.10830716043710709,
681
+ 0.11568929255008698,
682
+ 0.14311064779758453,
683
+ 0.1095053106546402,
684
+ 0.1004800945520401,
685
+ 0.14485910534858704,
686
+ 0.10436376184225082,
687
+ 0.14245760440826416,
688
+ 0.111247718334198,
689
+ 0.0975479707121849,
690
+ 0.08902324736118317,
691
+ 0.0622674822807312,
692
+ 0.10995616018772125,
693
+ 0.10260314494371414,
694
+ 0.12167467176914215,
695
+ 0.07463216781616211,
696
+ 0.07275792211294174,
697
+ 0.13604073226451874,
698
+ 0.07270374149084091,
699
+ 0.11473303288221359,
700
+ 0.12359883636236191,
701
+ 0.07244597375392914,
702
+ 0.1011611744761467,
703
+ 0.086849145591259,
704
+ 0.08912499994039536,
705
+ 0.0581958070397377,
706
+ 0.09563981741666794,
707
+ 0.0796188935637474,
708
+ 0.07072335481643677,
709
+ 0.05161924287676811,
710
+ 0.08457368612289429,
711
+ 0.11051885038614273,
712
+ 0.06905154138803482,
713
+ 0.05181657522916794,
714
+ 0.06571720540523529,
715
+ 0.04620496556162834,
716
+ 0.05523300543427467,
717
+ 0.07410739362239838,
718
+ 0.11791569739580154,
719
+ 0.056476421654224396,
720
+ 0.06766251474618912,
721
+ 0.02962416037917137,
722
+ 0.05907848849892616,
723
+ 0.06180339306592941,
724
+ 0.09830866754055023,
725
+ 0.040312670171260834,
726
+ 0.06005966663360596,
727
+ 0.058943409472703934,
728
+ 0.06299480050802231,
729
+ 0.046607907861471176,
730
+ 0.06977558881044388,
731
+ 0.03378602862358093,
732
+ 0.04086964577436447,
733
+ 0.05613305792212486,
734
+ 0.034743089228868484,
735
+ 0.1440156251192093,
736
+ 0.0496537946164608,
737
+ 0.03119187243282795,
738
+ 0.032435402274131775,
739
+ 0.039745960384607315,
740
+ 0.05660497024655342,
741
+ 0.041844870895147324,
742
+ 0.060661476105451584,
743
+ 0.06880028545856476,
744
+ 0.028543414548039436,
745
+ 0.03668322041630745,
746
+ 0.03573160618543625,
747
+ 0.02411065809428692,
748
+ 0.05658414214849472,
749
+ 0.02980104088783264,
750
+ 0.044847529381513596,
751
+ 0.03881698101758957,
752
+ 0.039021432399749756,
753
+ 0.03710438683629036,
754
+ 0.026304544880986214,
755
+ 0.024331016466021538,
756
+ 0.03395349904894829,
757
+ 0.06135905534029007,
758
+ 0.06009645015001297,
759
+ 0.03229394182562828,
760
+ 0.037189237773418427,
761
+ 0.051279664039611816,
762
+ 0.04715842008590698,
763
+ 0.037176214158535004,
764
+ 0.02852855995297432,
765
+ 0.036947157233953476,
766
+ 0.024842122569680214,
767
+ 0.04329339787364006,
768
+ 0.04643541947007179,
769
+ 0.02498922310769558,
770
+ 0.041984740644693375,
771
+ 0.029568472877144814,
772
+ 0.044211216270923615,
773
+ 0.03051983192563057,
774
+ 0.04468735679984093,
775
+ 0.01454518549144268,
776
+ 0.04826440289616585,
777
+ 0.02057216875255108,
778
+ 0.02639961615204811,
779
+ 0.01500108651816845,
780
+ 0.030536344274878502,
781
+ 0.03415869548916817,
782
+ 0.05620170384645462,
783
+ 0.025397296994924545,
784
+ 0.03368647024035454,
785
+ 0.03853489086031914,
786
+ 0.04197919741272926,
787
+ 0.04702145606279373,
788
+ 0.04449990764260292,
789
+ 0.02508862502872944,
790
+ 0.020450007170438766,
791
+ 0.05272641032934189,
792
+ 0.01027919165790081,
793
+ 0.011064521968364716,
794
+ 0.021617788821458817,
795
+ 0.03015500120818615,
796
+ 0.024432817474007607,
797
+ 0.019990773871541023,
798
+ 0.047378189861774445,
799
+ 0.01217337790876627,
800
+ 0.010320601984858513,
801
+ 0.01973068155348301,
802
+ 0.02787824347615242,
803
+ 0.018091099336743355,
804
+ 0.03230282664299011,
805
+ 0.01858575828373432,
806
+ 0.02193545177578926,
807
+ 0.014458169229328632,
808
+ 0.04542988911271095,
809
+ 0.03937229514122009,
810
+ 0.028136953711509705,
811
+ 0.010774918831884861,
812
+ 0.007921284064650536,
813
+ 0.010392301715910435,
814
+ 0.016019495204091072,
815
+ 0.01052879262715578,
816
+ 0.010602944530546665,
817
+ 0.026968801394104958,
818
+ 0.022768540307879448,
819
+ 0.026090964674949646,
820
+ 0.0203778687864542,
821
+ 0.028779949992895126,
822
+ 0.008661543019115925,
823
+ 0.008466995321214199,
824
+ 0.011552358977496624,
825
+ 0.008306763134896755,
826
+ 0.03762605041265488,
827
+ 0.006495323497802019,
828
+ 0.018415924161672592,
829
+ 0.008453416638076305,
830
+ 0.010051636956632137,
831
+ 0.024197418242692947,
832
+ 0.014781487174332142,
833
+ 0.012461562640964985,
834
+ 0.010072323493659496,
835
+ 0.030498692765831947,
836
+ 0.01750447042286396,
837
+ 0.02167341485619545,
838
+ 0.018192414194345474,
839
+ 0.011094310320913792,
840
+ 0.0060009523294866085,
841
+ 0.00859794020652771,
842
+ 0.010365411639213562,
843
+ 0.003984435927122831,
844
+ 0.022352710366249084,
845
+ 0.009743548929691315,
846
+ 0.03203964978456497,
847
+ 0.0032499213702976704,
848
+ 0.006424404680728912,
849
+ 0.01169256679713726,
850
+ 0.002607333706691861,
851
+ 0.011441404931247234,
852
+ 0.009466810151934624,
853
+ 0.037185851484537125,
854
+ 0.016193130984902382,
855
+ 0.013928143307566643,
856
+ 0.007090710569173098,
857
+ 0.007945775054395199,
858
+ 0.0074912020936608315,
859
+ 0.0012026570038869977,
860
+ 0.0045003569684922695,
861
+ 0.015430726110935211,
862
+ 0.0030192099511623383,
863
+ 0.002488328842446208,
864
+ 0.0017039731610566378,
865
+ 0.015757182613015175,
866
+ 0.005525390617549419,
867
+ 0.009171837940812111,
868
+ 0.004435508977621794,
869
+ 0.02938077040016651,
870
+ 0.021483419463038445,
871
+ 0.002714992966502905,
872
+ 0.0029602323193103075,
873
+ 0.0032771697733551264,
874
+ 0.023031892254948616,
875
+ 0.002103216014802456,
876
+ 0.005821481347084045,
877
+ 0.007263711653649807,
878
+ 0.00279552536085248,
879
+ 0.0015178256435319781,
880
+ 0.00492085749283433,
881
+ 0.003525763750076294,
882
+ 0.001212378148920834,
883
+ 0.00448849331587553,
884
+ 0.008882804773747921,
885
+ 0.0006022402085363865,
886
+ 0.0009342667763121426,
887
+ 0.001277318922802806,
888
+ 0.0025026306975632906,
889
+ 0.003969788551330566,
890
+ 0.005546010565012693,
891
+ 0.0011536857346072793,
892
+ 0.0034631192684173584,
893
+ 0.0030518402345478535,
894
+ 0.00504712387919426,
895
+ 0.004639749880880117,
896
+ 0.005920636933296919,
897
+ 0.0006521978066302836,
898
+ 0.008032253943383694,
899
+ 0.005480878055095673,
900
+ 0.002230058191344142,
901
+ 0.0005100017297081649,
902
+ 0.0005169127834960818,
903
+ 0.009634162299335003,
904
+ 0.004943725652992725,
905
+ 0.004072216339409351,
906
+ 0.0004343828768469393,
907
+ 0.001295665861107409,
908
+ 0.0010895364684984088,
909
+ 0.015857402235269547,
910
+ 0.008974243886768818,
911
+ 0.006834195461124182,
912
+ 0.00020472412870731205,
913
+ 0.003968365024775267,
914
+ 0.0020844119135290384,
915
+ 0.006278269458562136,
916
+ 0.0021395317744463682,
917
+ 0.0020664019975811243,
918
+ 0.0014232880203053355,
919
+ 0.0014043392147868872,
920
+ 0.0019850539974868298,
921
+ 0.003062907140702009,
922
+ 0.0004039614286739379,
923
+ 0.0034046589862555265,
924
+ 0.0005124689778313041,
925
+ 0.0002822829410433769,
926
+ 0.00022054013970773667,
927
+ 0.0008340326021425426,
928
+ 0.00021134850976523012,
929
+ 0.0002855001075658947,
930
+ 0.002289067953824997,
931
+ 0.0014635034603998065,
932
+ 0.0027968958020210266,
933
+ 0.0004979801014997065,
934
+ 0.00038121987017802894,
935
+ 0.00021753624605480582,
936
+ 0.00011042633559554815,
937
+ 0.00012580155453179032
938
+ ],
939
+ "info_loss": [
940
+ -1.6845178604125977,
941
+ -1.880136489868164,
942
+ -0.7781872749328613,
943
+ -0.3760695457458496,
944
+ -0.21820640563964844,
945
+ -0.0924074649810791,
946
+ -0.06305766105651855,
947
+ -0.05046379566192627,
948
+ -0.05715823173522949,
949
+ -0.0635685920715332,
950
+ -0.4012404680252075,
951
+ -0.7715736627578735,
952
+ -0.8012099862098694,
953
+ -0.46590960025787354,
954
+ -0.31876659393310547,
955
+ -0.2656315267086029,
956
+ -0.33250555396080017,
957
+ -0.288910448551178,
958
+ -0.31206047534942627,
959
+ -0.24132414162158966,
960
+ -0.2794179916381836,
961
+ -0.19330602884292603,
962
+ -0.16804198920726776,
963
+ -0.13261274993419647,
964
+ -0.2333766222000122,
965
+ -0.16826564073562622,
966
+ -0.14876651763916016,
967
+ -0.16636833548545837,
968
+ -0.11462478339672089,
969
+ -0.16541561484336853,
970
+ -0.16008248925209045,
971
+ -0.10620079934597015,
972
+ -0.09394414722919464,
973
+ -0.07939358800649643,
974
+ -0.10468167066574097,
975
+ -0.10187514871358871,
976
+ -0.10856560617685318,
977
+ -0.08912228047847748,
978
+ -0.055771417915821075,
979
+ -0.11165620386600494,
980
+ -0.11121959239244461,
981
+ -0.13785725831985474,
982
+ -0.09762637317180634,
983
+ -0.09939129650592804,
984
+ -0.08255629241466522,
985
+ -0.059800758957862854,
986
+ -0.10212108492851257,
987
+ -0.08443209528923035,
988
+ -0.09134220331907272,
989
+ -0.13016659021377563,
990
+ -0.08804567903280258,
991
+ -0.08519479632377625,
992
+ -0.06612265110015869,
993
+ -0.08621099591255188,
994
+ -0.09518647193908691,
995
+ -0.08401819318532944,
996
+ -0.06951231509447098,
997
+ -0.1174015924334526,
998
+ -0.07796931266784668,
999
+ -0.11636006832122803,
1000
+ -0.09843239188194275,
1001
+ -0.07790429145097733,
1002
+ -0.05519775301218033,
1003
+ -0.05443594604730606,
1004
+ -0.09469553083181381,
1005
+ -0.07840922474861145,
1006
+ -0.09811846166849136,
1007
+ -0.05386374145746231,
1008
+ -0.06620055437088013,
1009
+ -0.11768649518489838,
1010
+ -0.05957645922899246,
1011
+ -0.10932556539773941,
1012
+ -0.11735521256923676,
1013
+ -0.05341051146388054,
1014
+ -0.09429244697093964,
1015
+ -0.07854487001895905,
1016
+ -0.08080926537513733,
1017
+ -0.04216248169541359,
1018
+ -0.08827685564756393,
1019
+ -0.05011850595474243,
1020
+ -0.0621134378015995,
1021
+ -0.04777924716472626,
1022
+ -0.06806638091802597,
1023
+ -0.10591182857751846,
1024
+ -0.04498394578695297,
1025
+ -0.04115511104464531,
1026
+ -0.05788017436861992,
1027
+ -0.01873812824487686,
1028
+ -0.05175603926181793,
1029
+ -0.05906003713607788,
1030
+ -0.10486780852079391,
1031
+ -0.048906195908784866,
1032
+ -0.06077366694808006,
1033
+ -0.026827020570635796,
1034
+ -0.04548431932926178,
1035
+ -0.05630237236618996,
1036
+ -0.089582659304142,
1037
+ -0.023420119658112526,
1038
+ -0.057096149772405624,
1039
+ -0.0524451844394207,
1040
+ -0.05225393548607826,
1041
+ -0.04575489088892937,
1042
+ -0.05530523508787155,
1043
+ -0.03193533420562744,
1044
+ -0.02603903040289879,
1045
+ -0.04271017014980316,
1046
+ -0.030583081766963005,
1047
+ -0.13347090780735016,
1048
+ -0.0386335551738739,
1049
+ -0.01984293758869171,
1050
+ -0.03160049021244049,
1051
+ -0.034085340797901154,
1052
+ -0.04436471313238144,
1053
+ -0.0346246063709259,
1054
+ -0.0524965301156044,
1055
+ -0.06830570846796036,
1056
+ -0.023444417864084244,
1057
+ -0.02834698185324669,
1058
+ -0.012284757569432259,
1059
+ -0.023732420057058334,
1060
+ -0.030248302966356277,
1061
+ -0.029553478583693504,
1062
+ -0.044109079986810684,
1063
+ -0.02958172932267189,
1064
+ -0.037186283618211746,
1065
+ -0.03597940132021904,
1066
+ -0.018449431285262108,
1067
+ -0.02399912290275097,
1068
+ -0.03324350342154503,
1069
+ -0.06095890700817108,
1070
+ -0.05560272932052612,
1071
+ -0.030946670100092888,
1072
+ -0.03672769293189049,
1073
+ -0.04808655381202698,
1074
+ -0.03364656865596771,
1075
+ -0.03607888147234917,
1076
+ -0.028394103050231934,
1077
+ -0.03234918415546417,
1078
+ -0.02368510514497757,
1079
+ -0.04298824816942215,
1080
+ -0.041298091411590576,
1081
+ -0.024565864354372025,
1082
+ -0.03525955229997635,
1083
+ -0.029399290680885315,
1084
+ -0.034070271998643875,
1085
+ -0.024320535361766815,
1086
+ -0.04458359256386757,
1087
+ -0.01374984160065651,
1088
+ -0.04760410636663437,
1089
+ -0.019402969628572464,
1090
+ -0.02622826211154461,
1091
+ -0.011529017239809036,
1092
+ -0.014759037643671036,
1093
+ -0.03358038514852524,
1094
+ -0.05606997758150101,
1095
+ -0.025247935205698013,
1096
+ -0.03308200091123581,
1097
+ -0.038368649780750275,
1098
+ -0.038447171449661255,
1099
+ -0.042612940073013306,
1100
+ -0.03993666544556618,
1101
+ -0.009133784100413322,
1102
+ -0.020344717428088188,
1103
+ -0.05236738175153732,
1104
+ -0.010210730135440826,
1105
+ -0.010691964067518711,
1106
+ -0.021558355540037155,
1107
+ -0.030089830979704857,
1108
+ -0.024361321702599525,
1109
+ -0.01975465752184391,
1110
+ -0.04725152254104614,
1111
+ -0.011625215411186218,
1112
+ -0.010266570374369621,
1113
+ -0.01168998796492815,
1114
+ -0.027794314548373222,
1115
+ -0.009014757350087166,
1116
+ -0.03177862614393234,
1117
+ -0.018015677109360695,
1118
+ -0.021770533174276352,
1119
+ -0.01437960471957922,
1120
+ -0.04520782083272934,
1121
+ -0.03873175382614136,
1122
+ -0.02651386149227619,
1123
+ -0.010653822682797909,
1124
+ -0.007833332754671574,
1125
+ -0.010306413285434246,
1126
+ -0.01583869382739067,
1127
+ -0.010306095704436302,
1128
+ -0.010561185888946056,
1129
+ -0.02689836360514164,
1130
+ -0.022732596844434738,
1131
+ -0.025382084771990776,
1132
+ -0.019542042165994644,
1133
+ -0.028731338679790497,
1134
+ -0.008604641072452068,
1135
+ -0.008370177820324898,
1136
+ -0.011216205544769764,
1137
+ -0.008191474713385105,
1138
+ -0.03756227344274521,
1139
+ -0.006468852050602436,
1140
+ -0.018352346494793892,
1141
+ -0.008431139402091503,
1142
+ -0.010023399256169796,
1143
+ -0.024172106757760048,
1144
+ -0.013515538536012173,
1145
+ -0.012248000130057335,
1146
+ -0.009934654459357262,
1147
+ -0.030460067093372345,
1148
+ -0.01740582473576069,
1149
+ -0.02164219319820404,
1150
+ -0.018158428370952606,
1151
+ -0.011057416908442974,
1152
+ -0.005972997285425663,
1153
+ -0.00854895543307066,
1154
+ -0.01034765224903822,
1155
+ -0.003953146748244762,
1156
+ -0.02231045812368393,
1157
+ -0.009719740599393845,
1158
+ -0.03201047703623772,
1159
+ 0.003523825202137232,
1160
+ -0.006406732369214296,
1161
+ -0.011669349856674671,
1162
+ -0.0025894376449286938,
1163
+ -0.011422396637499332,
1164
+ -0.009076490998268127,
1165
+ -0.03717077895998955,
1166
+ -0.0159912109375,
1167
+ -0.013912070542573929,
1168
+ -0.007071910426020622,
1169
+ -0.007925713434815407,
1170
+ -0.0033026691526174545,
1171
+ -0.001188260386697948,
1172
+ -0.004486327525228262,
1173
+ -0.01518905907869339,
1174
+ -0.0030067639891058207,
1175
+ -0.0024668113328516483,
1176
+ -0.0016857830341905355,
1177
+ -0.015735670924186707,
1178
+ -0.005508421454578638,
1179
+ -0.007407850585877895,
1180
+ -0.004423072561621666,
1181
+ -0.02936144545674324,
1182
+ -0.02085474692285061,
1183
+ -0.0024764200206846,
1184
+ -0.0029446796979755163,
1185
+ -0.0032623799052089453,
1186
+ -0.02300630509853363,
1187
+ -0.0020878033246845007,
1188
+ -0.005808148067444563,
1189
+ -0.006807983852922916,
1190
+ -0.0027793205808848143,
1191
+ -0.0015067060012370348,
1192
+ -0.004907667636871338,
1193
+ -0.0035111214965581894,
1194
+ -0.001197523670271039,
1195
+ -0.0044767484068870544,
1196
+ -0.00887126475572586,
1197
+ -0.0005908673629164696,
1198
+ -0.0009224668028764427,
1199
+ -0.0012650653952732682,
1200
+ -0.0024820826947689056,
1201
+ -0.003952052444219589,
1202
+ -0.005536862649023533,
1203
+ -0.0011337421601638198,
1204
+ -0.0034513177815824747,
1205
+ -0.0030426341108977795,
1206
+ -0.005028268322348595,
1207
+ -0.004629882052540779,
1208
+ -0.005902621429413557,
1209
+ -0.0005749308038502932,
1210
+ -0.008024772629141808,
1211
+ -0.00546319829300046,
1212
+ -0.0022150801960378885,
1213
+ -0.0004978986689820886,
1214
+ -0.0005065497825853527,
1215
+ -0.009624342434108257,
1216
+ -0.00493266386911273,
1217
+ -0.004059970378875732,
1218
+ -0.0004207734309602529,
1219
+ -0.001286535756662488,
1220
+ -0.001078052562661469,
1221
+ -0.015846217051148415,
1222
+ -0.008966895751655102,
1223
+ -0.00681446585804224,
1224
+ -0.00019552344747353345,
1225
+ -0.003959062974900007,
1226
+ -0.0020739028695970774,
1227
+ -0.006268294528126717,
1228
+ -0.002128150314092636,
1229
+ -0.002053208649158478,
1230
+ -0.0014157495461404324,
1231
+ -0.0013918665936216712,
1232
+ -0.001976062310859561,
1233
+ -0.003053432796150446,
1234
+ -0.00039766443660482764,
1235
+ -0.002864947309717536,
1236
+ -0.000505073694512248,
1237
+ -0.0002748346596490592,
1238
+ -0.0002097264805343002,
1239
+ -0.000827192619908601,
1240
+ 0.0006888614152558148,
1241
+ -0.00027715141186490655,
1242
+ -0.0022813098039478064,
1243
+ -0.0014571662759408355,
1244
+ -0.002790178172290325,
1245
+ -0.0004906206740997732,
1246
+ -0.00037376396358013153,
1247
+ -0.00021090454538352787,
1248
+ -0.00010295042011421174,
1249
+ -0.00011825514957308769
1250
+ ],
1251
+ "abs_loss": [
1252
+ 4.248603820800781,
1253
+ 4.222499370574951,
1254
+ 4.2066121101379395,
1255
+ 4.096597194671631,
1256
+ 3.899991035461426,
1257
+ 3.4147987365722656,
1258
+ 3.2582666873931885,
1259
+ 3.2508087158203125,
1260
+ 3.3003556728363037,
1261
+ 3.2925708293914795,
1262
+ 3.3172671794891357,
1263
+ 3.3135271072387695,
1264
+ 3.3402652740478516,
1265
+ 3.262688636779785,
1266
+ 3.3096084594726562,
1267
+ 3.3074944019317627,
1268
+ 3.2074148654937744,
1269
+ 3.2745742797851562,
1270
+ 3.2566540241241455,
1271
+ 3.2353744506835938,
1272
+ 3.1410999298095703,
1273
+ 3.0534000396728516,
1274
+ 2.9215281009674072,
1275
+ 2.7926433086395264,
1276
+ 2.640831232070923,
1277
+ 2.340205430984497,
1278
+ 2.3795106410980225,
1279
+ 2.206646203994751,
1280
+ 2.1312170028686523,
1281
+ 2.097783327102661,
1282
+ 2.1069135665893555,
1283
+ 1.8072643280029297,
1284
+ 1.8129981756210327,
1285
+ 1.8970093727111816,
1286
+ 1.8207839727401733,
1287
+ 1.7212127447128296,
1288
+ 1.8081927299499512,
1289
+ 1.677327275276184,
1290
+ 1.6457009315490723,
1291
+ 1.4924567937850952,
1292
+ 1.5043808221817017,
1293
+ 1.5211153030395508,
1294
+ 1.5759754180908203,
1295
+ 1.3707727193832397,
1296
+ 1.4676443338394165,
1297
+ 1.3407578468322754,
1298
+ 1.2346299886703491,
1299
+ 1.307939887046814,
1300
+ 1.2280187606811523,
1301
+ 1.1226863861083984,
1302
+ 1.2179919481277466,
1303
+ 1.164408564567566,
1304
+ 1.1270548105239868,
1305
+ 1.1211148500442505,
1306
+ 1.0856815576553345,
1307
+ 1.0909754037857056,
1308
+ 1.0146352052688599,
1309
+ 1.0166206359863281,
1310
+ 0.9806444644927979,
1311
+ 0.8790922164916992,
1312
+ 0.9082357287406921,
1313
+ 0.9060630798339844,
1314
+ 0.8941442370414734,
1315
+ 0.8676784038543701,
1316
+ 0.8233774304389954,
1317
+ 0.8751638531684875,
1318
+ 0.889637291431427,
1319
+ 0.7964116930961609,
1320
+ 0.7389230728149414,
1321
+ 0.7619727253913879,
1322
+ 0.7445794939994812,
1323
+ 0.6930427551269531,
1324
+ 0.6903583407402039,
1325
+ 0.6433708071708679,
1326
+ 0.7149796485900879,
1327
+ 0.5814311504364014,
1328
+ 0.6136469841003418,
1329
+ 0.6450690627098083,
1330
+ 0.5256707072257996,
1331
+ 0.5376664996147156,
1332
+ 0.611758291721344,
1333
+ 0.6129154562950134,
1334
+ 0.5786607265472412,
1335
+ 0.47089090943336487,
1336
+ 0.5437725186347961,
1337
+ 0.5135354399681091,
1338
+ 0.5079829692840576,
1339
+ 0.5378919243812561,
1340
+ 0.4295816421508789,
1341
+ 0.48612797260284424,
1342
+ 0.48400402069091797,
1343
+ 0.42618879675865173,
1344
+ 0.3939852714538574,
1345
+ 0.45398449897766113,
1346
+ 0.46709179878234863,
1347
+ 0.47789058089256287,
1348
+ 0.40150097012519836,
1349
+ 0.45169806480407715,
1350
+ 0.4399000406265259,
1351
+ 0.44765469431877136,
1352
+ 0.39555296301841736,
1353
+ 0.4326975345611572,
1354
+ 0.3675288259983063,
1355
+ 0.3894825875759125,
1356
+ 0.4279477596282959,
1357
+ 0.4224933683872223,
1358
+ 0.37837859988212585,
1359
+ 0.4045667350292206,
1360
+ 0.3817945420742035,
1361
+ 0.37835344672203064,
1362
+ 0.36168739199638367,
1363
+ 0.34341344237327576,
1364
+ 0.2887497842311859,
1365
+ 0.28092432022094727,
1366
+ 0.36921870708465576,
1367
+ 0.3015557527542114,
1368
+ 0.3323322832584381,
1369
+ 0.3037363588809967,
1370
+ 0.2836986482143402,
1371
+ 0.3225257694721222,
1372
+ 0.32611605525016785,
1373
+ 0.2727375626564026,
1374
+ 0.3126954138278961,
1375
+ 0.25902584195137024,
1376
+ 0.2615189850330353,
1377
+ 0.26008114218711853,
1378
+ 0.2292197346687317,
1379
+ 0.2876671254634857,
1380
+ 0.3145621716976166,
1381
+ 0.245247483253479,
1382
+ 0.2604895532131195,
1383
+ 0.2461647391319275,
1384
+ 0.279938668012619,
1385
+ 0.22339580953121185,
1386
+ 0.2175353616476059,
1387
+ 0.24148784577846527,
1388
+ 0.17904238402843475,
1389
+ 0.2315792292356491,
1390
+ 0.16414551436901093,
1391
+ 0.17675621807575226,
1392
+ 0.20937566459178925,
1393
+ 0.19905777275562286,
1394
+ 0.1346922665834427,
1395
+ 0.22274178266525269,
1396
+ 0.17896856367588043,
1397
+ 0.1749875545501709,
1398
+ 0.22766560316085815,
1399
+ 0.15335386991500854,
1400
+ 0.19178926944732666,
1401
+ 0.2002636194229126,
1402
+ 0.14461670815944672,
1403
+ 0.17870159447193146,
1404
+ 0.141882061958313,
1405
+ 0.15782774984836578,
1406
+ 0.17191310226917267,
1407
+ 0.1742546409368515,
1408
+ 0.13277490437030792,
1409
+ 0.13913141191005707,
1410
+ 0.11684095859527588,
1411
+ 0.13007859885692596,
1412
+ 0.1105969175696373,
1413
+ 0.12326553463935852,
1414
+ 0.091985784471035,
1415
+ 0.12789636850357056,
1416
+ 0.1234755739569664,
1417
+ 0.11163993924856186,
1418
+ 0.11117803305387497,
1419
+ 0.11482497304677963,
1420
+ 0.10143188387155533,
1421
+ 0.08986350148916245,
1422
+ 0.10149606317281723,
1423
+ 0.11594092845916748,
1424
+ 0.09523133188486099,
1425
+ 0.07875585556030273,
1426
+ 0.11130938678979874,
1427
+ 0.08846712112426758,
1428
+ 0.09477104991674423,
1429
+ 0.10320901870727539,
1430
+ 0.07928754389286041,
1431
+ 0.09902780503034592,
1432
+ 0.09885412454605103,
1433
+ 0.08026526123285294,
1434
+ 0.07697651535272598,
1435
+ 0.08719533681869507,
1436
+ 0.11339626461267471,
1437
+ 0.08443454653024673,
1438
+ 0.06264984607696533,
1439
+ 0.08851418644189835,
1440
+ 0.07155659049749374,
1441
+ 0.07710728049278259,
1442
+ 0.060385361313819885,
1443
+ 0.0805659294128418,
1444
+ 0.07710077613592148,
1445
+ 0.054185882210731506,
1446
+ 0.07479282468557358,
1447
+ 0.09126291424036026,
1448
+ 0.07025463134050369,
1449
+ 0.08372106403112411,
1450
+ 0.07338673621416092,
1451
+ 0.0760725662112236,
1452
+ 0.062137674540281296,
1453
+ 0.04462913051247597,
1454
+ 0.05902169272303581,
1455
+ 0.034700747579336166,
1456
+ 0.07486877590417862,
1457
+ 0.04563656076788902,
1458
+ 0.06162459775805473,
1459
+ 0.05905302241444588,
1460
+ 0.05430176854133606,
1461
+ 0.041387319564819336,
1462
+ 0.05287908390164375,
1463
+ 0.05790318176150322,
1464
+ 0.04943523183465004,
1465
+ 0.04406578466296196,
1466
+ 0.05703475698828697,
1467
+ 0.049475450068712234,
1468
+ 0.03814709186553955,
1469
+ 0.04224250838160515,
1470
+ 0.057524580508470535,
1471
+ 0.056067850440740585,
1472
+ 0.03933670371770859,
1473
+ 0.03223520144820213,
1474
+ 0.02759975753724575,
1475
+ 0.04929530620574951,
1476
+ 0.03986310958862305,
1477
+ 0.03435857221484184,
1478
+ 0.03492335230112076,
1479
+ 0.03402262181043625,
1480
+ 0.037492189556360245,
1481
+ 0.042883265763521194,
1482
+ 0.03823019936680794,
1483
+ 0.04658883810043335,
1484
+ 0.03504708409309387,
1485
+ 0.04226979613304138,
1486
+ 0.03296232968568802,
1487
+ 0.04663039743900299,
1488
+ 0.03310871124267578,
1489
+ 0.031829770654439926,
1490
+ 0.024810364469885826,
1491
+ 0.03402751311659813,
1492
+ 0.03647597134113312,
1493
+ 0.036504268646240234,
1494
+ 0.030856767669320107,
1495
+ 0.035571545362472534,
1496
+ 0.03430952504277229,
1497
+ 0.02071932703256607,
1498
+ 0.02605549991130829,
1499
+ 0.032155487686395645,
1500
+ 0.026978829875588417,
1501
+ 0.02861734665930271,
1502
+ 0.0252494215965271,
1503
+ 0.028905054554343224,
1504
+ 0.029427168890833855,
1505
+ 0.03010430745780468,
1506
+ 0.03131081536412239,
1507
+ 0.019295133650302887,
1508
+ 0.028012961149215698,
1509
+ 0.02889290452003479,
1510
+ 0.02461855299770832,
1511
+ 0.028516843914985657,
1512
+ 0.02453460358083248,
1513
+ 0.031491171568632126,
1514
+ 0.02895490825176239,
1515
+ 0.02520282007753849,
1516
+ 0.029308080673217773,
1517
+ 0.023172391578555107,
1518
+ 0.03162917494773865,
1519
+ 0.02895469032227993,
1520
+ 0.023023640736937523,
1521
+ 0.02652932144701481,
1522
+ 0.03096175007522106,
1523
+ 0.03029632568359375,
1524
+ 0.032353516668081284,
1525
+ 0.01636950485408306,
1526
+ 0.029314080253243446,
1527
+ 0.024606777355074883,
1528
+ 0.025720328092575073,
1529
+ 0.02380760945379734,
1530
+ 0.02623082511126995,
1531
+ 0.02326059155166149,
1532
+ 0.03852645680308342,
1533
+ 0.03225034102797508,
1534
+ 0.0199538953602314,
1535
+ 0.025298824533820152,
1536
+ 0.03150516748428345,
1537
+ 0.019422488287091255,
1538
+ 0.027598517015576363,
1539
+ 0.01777186244726181,
1540
+ 0.03637807443737984,
1541
+ 0.022381693124771118,
1542
+ 0.035868722945451736,
1543
+ 0.02048160880804062,
1544
+ 0.029573267325758934,
1545
+ 0.0240336861461401,
1546
+ 0.019593099132180214,
1547
+ 0.01662611961364746,
1548
+ 0.021164478734135628,
1549
+ 0.02360491268336773,
1550
+ 0.02312520146369934,
1551
+ 0.023661697283387184,
1552
+ 0.022750774398446083,
1553
+ 0.014745545573532581,
1554
+ 0.02786974422633648,
1555
+ 0.019521137699484825,
1556
+ 0.020956695079803467,
1557
+ 0.012933564372360706,
1558
+ 0.020663632079958916,
1559
+ 0.014413859695196152,
1560
+ 0.03426806256175041,
1561
+ 0.023411214351654053
1562
+ ],
1563
+ "zipf_loss": [
1564
+ 5.949980735778809,
1565
+ 5.035680770874023,
1566
+ 3.8722009658813477,
1567
+ 2.6956024169921875,
1568
+ 1.5781545639038086,
1569
+ 0.8026783466339111,
1570
+ 0.6125290393829346,
1571
+ 0.5755027532577515,
1572
+ 0.5642626881599426,
1573
+ 0.5634299516677856,
1574
+ 0.5631824135780334,
1575
+ 0.5682885646820068,
1576
+ 0.5742220878601074,
1577
+ 0.5803945064544678,
1578
+ 0.5761228799819946,
1579
+ 0.570813775062561,
1580
+ 0.5718088746070862,
1581
+ 0.565470814704895,
1582
+ 0.56489098072052,
1583
+ 0.5526382923126221,
1584
+ 0.5528259873390198,
1585
+ 0.5428668260574341,
1586
+ 0.5183385014533997,
1587
+ 0.4864024519920349,
1588
+ 0.4574067294597626,
1589
+ 0.4231650233268738,
1590
+ 0.3939986228942871,
1591
+ 0.37826329469680786,
1592
+ 0.36818790435791016,
1593
+ 0.3445615768432617,
1594
+ 0.3238462209701538,
1595
+ 0.32825493812561035,
1596
+ 0.3227953016757965,
1597
+ 0.3052963614463806,
1598
+ 0.2801247835159302,
1599
+ 0.3040201663970947,
1600
+ 0.27592188119888306,
1601
+ 0.2879289388656616,
1602
+ 0.27618277072906494,
1603
+ 0.25815141201019287,
1604
+ 0.2643548846244812,
1605
+ 0.2405439019203186,
1606
+ 0.25519245862960815,
1607
+ 0.23422841727733612,
1608
+ 0.22434301674365997,
1609
+ 0.23254793882369995,
1610
+ 0.1798262894153595,
1611
+ 0.21590831875801086,
1612
+ 0.1839747130870819,
1613
+ 0.18818283081054688,
1614
+ 0.20718589425086975,
1615
+ 0.1702558696269989,
1616
+ 0.16396158933639526,
1617
+ 0.16068147122859955,
1618
+ 0.1589721143245697,
1619
+ 0.17718049883842468,
1620
+ 0.1628950536251068,
1621
+ 0.15626387298107147,
1622
+ 0.15067613124847412,
1623
+ 0.12489338219165802,
1624
+ 0.13891063630580902,
1625
+ 0.1384260654449463,
1626
+ 0.13217245042324066,
1627
+ 0.12459094077348709,
1628
+ 0.12454358488321304,
1629
+ 0.15187573432922363,
1630
+ 0.13231438398361206,
1631
+ 0.11404237896203995,
1632
+ 0.11812034249305725,
1633
+ 0.12293525040149689,
1634
+ 0.12496193498373032,
1635
+ 0.1383434683084488,
1636
+ 0.12458135187625885,
1637
+ 0.13064716756343842,
1638
+ 0.11096610128879547,
1639
+ 0.1227196604013443,
1640
+ 0.12065771967172623,
1641
+ 0.09541255980730057,
1642
+ 0.1001143679022789,
1643
+ 0.11858425289392471,
1644
+ 0.09717165678739548,
1645
+ 0.10066569596529007,
1646
+ 0.10465868562459946,
1647
+ 0.09792322665452957,
1648
+ 0.09710749983787537,
1649
+ 0.10061222314834595,
1650
+ 0.09053895622491837,
1651
+ 0.09147004038095474,
1652
+ 0.1075916737318039,
1653
+ 0.08113996684551239,
1654
+ 0.09422864019870758,
1655
+ 0.10618449747562408,
1656
+ 0.11704624444246292,
1657
+ 0.1071578860282898,
1658
+ 0.10185295343399048,
1659
+ 0.09883803874254227,
1660
+ 0.10443780571222305,
1661
+ 0.084136001765728,
1662
+ 0.10138025879859924,
1663
+ 0.09702587127685547,
1664
+ 0.09249041974544525,
1665
+ 0.08469867706298828,
1666
+ 0.08967512845993042,
1667
+ 0.10072441399097443,
1668
+ 0.07274462282657623,
1669
+ 0.08682571351528168,
1670
+ 0.08810195326805115,
1671
+ 0.08685342967510223,
1672
+ 0.08420921862125397,
1673
+ 0.08406338095664978,
1674
+ 0.07264045625925064,
1675
+ 0.08153880387544632,
1676
+ 0.08294888585805893,
1677
+ 0.10541349649429321,
1678
+ 0.08657865226268768,
1679
+ 0.08103999495506287,
1680
+ 0.09303316473960876,
1681
+ 0.08018874377012253,
1682
+ 0.08346472680568695,
1683
+ 0.09900408238172531,
1684
+ 0.0911998450756073,
1685
+ 0.07603538036346436,
1686
+ 0.08271551877260208,
1687
+ 0.0801074355840683,
1688
+ 0.07930731028318405,
1689
+ 0.09547435492277145,
1690
+ 0.07764770090579987,
1691
+ 0.05904918164014816,
1692
+ 0.09338434785604477,
1693
+ 0.09490584582090378,
1694
+ 0.08037841320037842,
1695
+ 0.07180957496166229,
1696
+ 0.08253419399261475,
1697
+ 0.07450126111507416,
1698
+ 0.07769657671451569,
1699
+ 0.07234088331460953,
1700
+ 0.08931533247232437,
1701
+ 0.0794936865568161,
1702
+ 0.08416077494621277,
1703
+ 0.06754502654075623,
1704
+ 0.06560808420181274,
1705
+ 0.08429299294948578,
1706
+ 0.08207700401544571,
1707
+ 0.06457032263278961,
1708
+ 0.06158648058772087,
1709
+ 0.08087906241416931,
1710
+ 0.0649896115064621,
1711
+ 0.06263162940740585,
1712
+ 0.06228753551840782,
1713
+ 0.061633482575416565,
1714
+ 0.06894102692604065,
1715
+ 0.05124237388372421,
1716
+ 0.03629127889871597,
1717
+ 0.03256573528051376,
1718
+ 0.0549607127904892,
1719
+ 0.04351460188627243,
1720
+ 0.04335227608680725,
1721
+ 0.03622990846633911,
1722
+ 0.050802022218704224,
1723
+ 0.04283929616212845,
1724
+ 0.03584984317421913,
1725
+ 0.03727045655250549,
1726
+ 0.0476660318672657,
1727
+ 0.03189195692539215,
1728
+ 0.045614589005708694,
1729
+ 0.025655794888734818,
1730
+ 0.025654438883066177,
1731
+ 0.03632713854312897,
1732
+ 0.036349352449178696,
1733
+ 0.03400541841983795,
1734
+ 0.03369174152612686,
1735
+ 0.03724554181098938,
1736
+ 0.04326269403100014,
1737
+ 0.029424671083688736,
1738
+ 0.047487981617450714,
1739
+ 0.03013957478106022,
1740
+ 0.04172791540622711,
1741
+ 0.042808257043361664,
1742
+ 0.038970351219177246,
1743
+ 0.03378588706254959,
1744
+ 0.0400693416595459,
1745
+ 0.0408720001578331,
1746
+ 0.02893824875354767,
1747
+ 0.03596371412277222,
1748
+ 0.030532781034708023,
1749
+ 0.038014862686395645,
1750
+ 0.04330512136220932,
1751
+ 0.03384586423635483,
1752
+ 0.03775673359632492,
1753
+ 0.04242083430290222,
1754
+ 0.03652554377913475,
1755
+ 0.03587046265602112,
1756
+ 0.04693162813782692,
1757
+ 0.0421612486243248,
1758
+ 0.03162079676985741,
1759
+ 0.04766367748379707,
1760
+ 0.04736288636922836,
1761
+ 0.03677622601389885,
1762
+ 0.03723398596048355,
1763
+ 0.03060431405901909,
1764
+ 0.039129938930273056,
1765
+ 0.03167010843753815,
1766
+ 0.02647346258163452,
1767
+ 0.02690056897699833,
1768
+ 0.035834379494190216,
1769
+ 0.03559615835547447,
1770
+ 0.03572455048561096,
1771
+ 0.030117787420749664,
1772
+ 0.03380052372813225,
1773
+ 0.04596683010458946,
1774
+ 0.031162666156888008,
1775
+ 0.03549132123589516,
1776
+ 0.025730114430189133,
1777
+ 0.03521950915455818,
1778
+ 0.033946119248867035,
1779
+ 0.029158147051930428,
1780
+ 0.026048485189676285,
1781
+ 0.03378206491470337,
1782
+ 0.03529809042811394,
1783
+ 0.0314398817718029,
1784
+ 0.027066780254244804,
1785
+ 0.034165121614933014,
1786
+ 0.028750983998179436,
1787
+ 0.04316485673189163,
1788
+ 0.03440439701080322,
1789
+ 0.030435888096690178,
1790
+ 0.02460499107837677,
1791
+ 0.021838407963514328,
1792
+ 0.02986433357000351,
1793
+ 0.026247266680002213,
1794
+ 0.02732972614467144,
1795
+ 0.03127007558941841,
1796
+ 0.03535392880439758,
1797
+ 0.0317973718047142,
1798
+ 0.045036882162094116,
1799
+ 0.033603399991989136,
1800
+ 0.024658938869833946,
1801
+ 0.023822864517569542,
1802
+ 0.024542754516005516,
1803
+ 0.040554214268922806,
1804
+ 0.033507540822029114,
1805
+ 0.04614206403493881,
1806
+ 0.040206484496593475,
1807
+ 0.04637715220451355,
1808
+ 0.03298595920205116,
1809
+ 0.025602202862501144,
1810
+ 0.02450883388519287,
1811
+ 0.04382072016596794,
1812
+ 0.029627585783600807,
1813
+ 0.03125075623393059,
1814
+ 0.024063467979431152,
1815
+ 0.03715727850794792,
1816
+ 0.02943577617406845,
1817
+ 0.036625634878873825,
1818
+ 0.02621190994977951,
1819
+ 0.028486477211117744,
1820
+ 0.025909148156642914,
1821
+ 0.025362219661474228,
1822
+ 0.02936939336359501,
1823
+ 0.02338619902729988,
1824
+ 0.034980785101652145,
1825
+ 0.03049061819911003,
1826
+ 0.023044157773256302,
1827
+ 0.03798298165202141,
1828
+ 0.039439260959625244,
1829
+ 0.04806167259812355,
1830
+ 0.03579982742667198,
1831
+ 0.03435150906443596,
1832
+ 0.027103664353489876,
1833
+ 0.0226494949311018,
1834
+ 0.029183726757764816,
1835
+ 0.030149422585964203,
1836
+ 0.027660585939884186,
1837
+ 0.028379065915942192,
1838
+ 0.022628527134656906,
1839
+ 0.023604724556207657,
1840
+ 0.02993364818394184,
1841
+ 0.030652262270450592,
1842
+ 0.02927243523299694,
1843
+ 0.02939055860042572,
1844
+ 0.04229074716567993,
1845
+ 0.0256950706243515,
1846
+ 0.03322000056505203,
1847
+ 0.02477657049894333,
1848
+ 0.03472872078418732,
1849
+ 0.036608096212148666,
1850
+ 0.03830444812774658,
1851
+ 0.030405309051275253,
1852
+ 0.027671096846461296,
1853
+ 0.02443629875779152,
1854
+ 0.020211437717080116,
1855
+ 0.02657797932624817,
1856
+ 0.038805581629276276,
1857
+ 0.022541776299476624,
1858
+ 0.027809519320726395,
1859
+ 0.039330482482910156,
1860
+ 0.02724331244826317,
1861
+ 0.020154379308223724,
1862
+ 0.028216278180480003,
1863
+ 0.02322898805141449,
1864
+ 0.032087039202451706,
1865
+ 0.023768853396177292,
1866
+ 0.029026228934526443,
1867
+ 0.026884576305747032,
1868
+ 0.02463812381029129,
1869
+ 0.03046594373881817,
1870
+ 0.03524967283010483,
1871
+ 0.027171123772859573,
1872
+ 0.0290781632065773,
1873
+ 0.046726156026124954
1874
+ ],
1875
+ "denoise_loss": [],
1876
+ "ortho_loss": [
1877
+ 0.9405548572540283,
1878
+ 0.7093138098716736,
1879
+ 0.3860025703907013,
1880
+ 0.19621992111206055,
1881
+ 0.13535962998867035,
1882
+ 0.1148088201880455,
1883
+ 0.11312248557806015,
1884
+ 0.09795600175857544,
1885
+ 0.08876202255487442,
1886
+ 0.0874704048037529,
1887
+ 0.09890742599964142,
1888
+ 0.11553092300891876,
1889
+ 0.12836314737796783,
1890
+ 0.13343201577663422,
1891
+ 0.14030228555202484,
1892
+ 0.14855629205703735,
1893
+ 0.15982434153556824,
1894
+ 0.1725960522890091,
1895
+ 0.184641033411026,
1896
+ 0.1934436708688736,
1897
+ 0.1966315060853958,
1898
+ 0.19849085807800293,
1899
+ 0.20530568063259125,
1900
+ 0.21167565882205963,
1901
+ 0.21709808707237244,
1902
+ 0.22186711430549622,
1903
+ 0.21948090195655823,
1904
+ 0.22243015468120575,
1905
+ 0.22239573299884796,
1906
+ 0.2167823761701584,
1907
+ 0.21429572999477386,
1908
+ 0.21535028517246246,
1909
+ 0.21883004903793335,
1910
+ 0.22001442313194275,
1911
+ 0.22154033184051514,
1912
+ 0.21902503073215485,
1913
+ 0.21931540966033936,
1914
+ 0.2198156714439392,
1915
+ 0.22356149554252625,
1916
+ 0.22275663912296295,
1917
+ 0.22312070429325104,
1918
+ 0.22427581250667572,
1919
+ 0.22312688827514648,
1920
+ 0.22535772621631622,
1921
+ 0.2280835509300232,
1922
+ 0.2253153920173645,
1923
+ 0.22507192194461823,
1924
+ 0.22433774173259735,
1925
+ 0.22226719558238983,
1926
+ 0.22155877947807312,
1927
+ 0.21603089570999146,
1928
+ 0.21269027888774872,
1929
+ 0.2130151242017746,
1930
+ 0.2145068645477295,
1931
+ 0.21426592767238617,
1932
+ 0.21334752440452576,
1933
+ 0.2160765528678894,
1934
+ 0.21763953566551208,
1935
+ 0.21531768143177032,
1936
+ 0.21458874642848969,
1937
+ 0.2135649174451828,
1938
+ 0.2130126953125,
1939
+ 0.21408234536647797,
1940
+ 0.21312180161476135,
1941
+ 0.2143585979938507,
1942
+ 0.2140677124261856,
1943
+ 0.2115246206521988,
1944
+ 0.20908908545970917,
1945
+ 0.20263266563415527,
1946
+ 0.2006993442773819,
1947
+ 0.20390087366104126,
1948
+ 0.2051895409822464,
1949
+ 0.20025448501110077,
1950
+ 0.20089052617549896,
1951
+ 0.20348533987998962,
1952
+ 0.2007439285516739,
1953
+ 0.20254401862621307,
1954
+ 0.20526787638664246,
1955
+ 0.20374366641044617,
1956
+ 0.20429043471813202,
1957
+ 0.20324257016181946,
1958
+ 0.20448745787143707,
1959
+ 0.20056699216365814,
1960
+ 0.20315435528755188,
1961
+ 0.2062034010887146,
1962
+ 0.2042759656906128,
1963
+ 0.2033148854970932,
1964
+ 0.2023809850215912,
1965
+ 0.20271526277065277,
1966
+ 0.2015286535024643,
1967
+ 0.19608232378959656,
1968
+ 0.19150017201900482,
1969
+ 0.19114910066127777,
1970
+ 0.18822526931762695,
1971
+ 0.1880023330450058,
1972
+ 0.1859520673751831,
1973
+ 0.18688209354877472,
1974
+ 0.18744012713432312,
1975
+ 0.1860995888710022,
1976
+ 0.18560254573822021,
1977
+ 0.18537767231464386,
1978
+ 0.18222209811210632,
1979
+ 0.18345583975315094,
1980
+ 0.18039152026176453,
1981
+ 0.17752529680728912,
1982
+ 0.17382651567459106,
1983
+ 0.17465266585350037,
1984
+ 0.17181044816970825,
1985
+ 0.1718626320362091,
1986
+ 0.17307467758655548,
1987
+ 0.17302030324935913,
1988
+ 0.17434781789779663,
1989
+ 0.170208141207695,
1990
+ 0.17045558989048004,
1991
+ 0.16666024923324585,
1992
+ 0.1655508428812027,
1993
+ 0.16634568572044373,
1994
+ 0.16501599550247192,
1995
+ 0.1647634655237198,
1996
+ 0.16515761613845825,
1997
+ 0.1673177182674408,
1998
+ 0.1668211817741394,
1999
+ 0.1643962413072586,
2000
+ 0.16440263390541077,
2001
+ 0.16320383548736572,
2002
+ 0.16519109904766083,
2003
+ 0.16581135988235474,
2004
+ 0.16899436712265015,
2005
+ 0.16787180304527283,
2006
+ 0.16846755146980286,
2007
+ 0.169200137257576,
2008
+ 0.1704157143831253,
2009
+ 0.1688281148672104,
2010
+ 0.16834457218647003,
2011
+ 0.1683877557516098,
2012
+ 0.16691097617149353,
2013
+ 0.16812509298324585,
2014
+ 0.1720004379749298,
2015
+ 0.17001497745513916,
2016
+ 0.1680622398853302,
2017
+ 0.1668056845664978,
2018
+ 0.16580279171466827,
2019
+ 0.16654008626937866,
2020
+ 0.1667376160621643,
2021
+ 0.1684609204530716,
2022
+ 0.16904930770397186,
2023
+ 0.1684345006942749,
2024
+ 0.17130695283412933,
2025
+ 0.1708867996931076,
2026
+ 0.16976439952850342,
2027
+ 0.16950948536396027,
2028
+ 0.16786924004554749,
2029
+ 0.16801652312278748,
2030
+ 0.1664217859506607,
2031
+ 0.166994109749794,
2032
+ 0.16556937992572784,
2033
+ 0.16588148474693298,
2034
+ 0.1664929836988449,
2035
+ 0.16508761048316956,
2036
+ 0.16498973965644836,
2037
+ 0.16525451838970184,
2038
+ 0.1644761562347412,
2039
+ 0.16283093392848969,
2040
+ 0.1636974811553955,
2041
+ 0.16270390152931213,
2042
+ 0.1614045351743698,
2043
+ 0.15995368361473083,
2044
+ 0.16171546280384064,
2045
+ 0.16246747970581055,
2046
+ 0.16222842037677765,
2047
+ 0.16317109763622284,
2048
+ 0.16275450587272644,
2049
+ 0.16305118799209595,
2050
+ 0.16364255547523499,
2051
+ 0.16347825527191162,
2052
+ 0.16319555044174194,
2053
+ 0.16205374896526337,
2054
+ 0.16145816445350647,
2055
+ 0.16094684600830078,
2056
+ 0.16152451932430267,
2057
+ 0.16380490362644196,
2058
+ 0.16014240682125092,
2059
+ 0.1606040745973587,
2060
+ 0.16144709289073944,
2061
+ 0.16091932356357574,
2062
+ 0.1610264927148819,
2063
+ 0.16228270530700684,
2064
+ 0.16152489185333252,
2065
+ 0.16388550400733948,
2066
+ 0.1620180606842041,
2067
+ 0.16241736710071564,
2068
+ 0.16493728756904602,
2069
+ 0.16343022882938385,
2070
+ 0.16318334639072418,
2071
+ 0.16300983726978302,
2072
+ 0.1640429049730301,
2073
+ 0.1659395694732666,
2074
+ 0.1655762940645218,
2075
+ 0.16689865291118622,
2076
+ 0.16968603432178497,
2077
+ 0.16971229016780853,
2078
+ 0.17051181197166443,
2079
+ 0.1701134294271469,
2080
+ 0.17001307010650635,
2081
+ 0.1683603674173355,
2082
+ 0.16935929656028748,
2083
+ 0.16916535794734955,
2084
+ 0.17132055759429932,
2085
+ 0.17143388092517853,
2086
+ 0.1725674718618393,
2087
+ 0.17342637479305267,
2088
+ 0.17363013327121735,
2089
+ 0.1737707555294037,
2090
+ 0.1744634509086609,
2091
+ 0.173520028591156,
2092
+ 0.17422915995121002,
2093
+ 0.17481641471385956,
2094
+ 0.1749243140220642,
2095
+ 0.1746535450220108,
2096
+ 0.1757020503282547,
2097
+ 0.17542040348052979,
2098
+ 0.17513450980186462,
2099
+ 0.17563478648662567,
2100
+ 0.17536936700344086,
2101
+ 0.17491325736045837,
2102
+ 0.17465488612651825,
2103
+ 0.17476437985897064,
2104
+ 0.17332050204277039,
2105
+ 0.17335402965545654,
2106
+ 0.17327576875686646,
2107
+ 0.17386563122272491,
2108
+ 0.17391978204250336,
2109
+ 0.17548631131649017,
2110
+ 0.17499889433383942,
2111
+ 0.1756540834903717,
2112
+ 0.17551745474338531,
2113
+ 0.17530758678913116,
2114
+ 0.17596468329429626,
2115
+ 0.1773405373096466,
2116
+ 0.17767225205898285,
2117
+ 0.17660759389400482,
2118
+ 0.1745901107788086,
2119
+ 0.174685537815094,
2120
+ 0.17535215616226196,
2121
+ 0.17600861191749573,
2122
+ 0.1766800433397293,
2123
+ 0.17528308928012848,
2124
+ 0.17538176476955414,
2125
+ 0.1751641035079956,
2126
+ 0.17548340559005737,
2127
+ 0.17561191320419312,
2128
+ 0.1760593056678772,
2129
+ 0.176646426320076,
2130
+ 0.17661888897418976,
2131
+ 0.17801816761493683,
2132
+ 0.17753809690475464,
2133
+ 0.17816874384880066,
2134
+ 0.178848534822464,
2135
+ 0.17995865643024445,
2136
+ 0.17932139337062836,
2137
+ 0.17943701148033142,
2138
+ 0.1796424835920334,
2139
+ 0.17962615191936493,
2140
+ 0.1804531067609787,
2141
+ 0.18065927922725677,
2142
+ 0.18012644350528717,
2143
+ 0.18005526065826416,
2144
+ 0.18012700974941254,
2145
+ 0.18104815483093262,
2146
+ 0.18214936554431915,
2147
+ 0.18276053667068481,
2148
+ 0.18368346989154816,
2149
+ 0.18323443830013275,
2150
+ 0.1839149296283722,
2151
+ 0.18375085294246674,
2152
+ 0.1838325560092926,
2153
+ 0.18402230739593506,
2154
+ 0.18462786078453064,
2155
+ 0.18512184917926788,
2156
+ 0.1852230727672577,
2157
+ 0.1855592429637909,
2158
+ 0.18505460023880005,
2159
+ 0.18493251502513885,
2160
+ 0.18481533229351044,
2161
+ 0.18497717380523682,
2162
+ 0.18502944707870483,
2163
+ 0.18546132743358612,
2164
+ 0.18580476939678192,
2165
+ 0.18591910600662231,
2166
+ 0.18637801706790924,
2167
+ 0.18628641963005066,
2168
+ 0.18635612726211548,
2169
+ 0.18721024692058563,
2170
+ 0.1871924102306366,
2171
+ 0.18791463971138,
2172
+ 0.18831172585487366,
2173
+ 0.18864646553993225,
2174
+ 0.1890813261270523,
2175
+ 0.18935741484165192,
2176
+ 0.18905109167099,
2177
+ 0.189208984375,
2178
+ 0.18929588794708252,
2179
+ 0.18947425484657288,
2180
+ 0.1893615871667862,
2181
+ 0.189352884888649,
2182
+ 0.18928568065166473,
2183
+ 0.1894601285457611,
2184
+ 0.1894100159406662,
2185
+ 0.18972231447696686,
2186
+ 0.1898670196533203
2187
+ ],
2188
+ "lr": [
2189
+ 4.188034188034189e-06,
2190
+ 8.461538461538462e-06,
2191
+ 1.2735042735042738e-05,
2192
+ 1.700854700854701e-05,
2193
+ 2.1282051282051282e-05,
2194
+ 2.5555555555555557e-05,
2195
+ 2.9829059829059833e-05,
2196
+ 3.4102564102564105e-05,
2197
+ 3.837606837606838e-05,
2198
+ 4e-05,
2199
+ 4e-05,
2200
+ 4e-05,
2201
+ 4e-05,
2202
+ 4e-05,
2203
+ 4e-05,
2204
+ 4e-05,
2205
+ 4e-05,
2206
+ 4e-05,
2207
+ 4e-05,
2208
+ 4e-05,
2209
+ 4e-05,
2210
+ 4e-05,
2211
+ 4e-05,
2212
+ 4e-05,
2213
+ 4e-05,
2214
+ 4e-05,
2215
+ 4e-05,
2216
+ 4e-05,
2217
+ 4e-05,
2218
+ 4e-05,
2219
+ 4e-05,
2220
+ 4e-05,
2221
+ 4e-05,
2222
+ 4e-05,
2223
+ 4e-05,
2224
+ 4e-05,
2225
+ 4e-05,
2226
+ 4e-05,
2227
+ 4e-05,
2228
+ 4e-05,
2229
+ 4e-05,
2230
+ 4e-05,
2231
+ 4e-05,
2232
+ 4e-05,
2233
+ 4e-05,
2234
+ 4e-05,
2235
+ 4e-05,
2236
+ 4e-05,
2237
+ 4e-05,
2238
+ 4e-05,
2239
+ 4e-05,
2240
+ 4e-05,
2241
+ 4e-05,
2242
+ 4e-05,
2243
+ 4e-05,
2244
+ 4e-05,
2245
+ 4e-05,
2246
+ 4e-05,
2247
+ 4e-05,
2248
+ 4e-05,
2249
+ 4e-05,
2250
+ 4e-05,
2251
+ 4e-05,
2252
+ 4e-05,
2253
+ 4e-05,
2254
+ 4e-05,
2255
+ 4e-05,
2256
+ 4e-05,
2257
+ 4e-05,
2258
+ 4e-05,
2259
+ 4e-05,
2260
+ 4e-05,
2261
+ 4e-05,
2262
+ 4e-05,
2263
+ 4e-05,
2264
+ 4e-05,
2265
+ 4e-05,
2266
+ 4e-05,
2267
+ 4e-05,
2268
+ 4e-05,
2269
+ 4e-05,
2270
+ 4e-05,
2271
+ 4e-05,
2272
+ 4e-05,
2273
+ 4e-05,
2274
+ 4e-05,
2275
+ 4e-05,
2276
+ 4e-05,
2277
+ 4e-05,
2278
+ 4e-05,
2279
+ 4e-05,
2280
+ 4e-05,
2281
+ 4e-05,
2282
+ 4e-05,
2283
+ 4e-05,
2284
+ 4e-05,
2285
+ 4e-05,
2286
+ 4e-05,
2287
+ 4e-05,
2288
+ 4e-05,
2289
+ 4e-05,
2290
+ 4e-05,
2291
+ 4e-05,
2292
+ 4e-05,
2293
+ 4e-05,
2294
+ 4e-05,
2295
+ 4e-05,
2296
+ 4e-05,
2297
+ 4e-05,
2298
+ 4e-05,
2299
+ 4e-05,
2300
+ 4e-05,
2301
+ 4e-05,
2302
+ 4e-05,
2303
+ 4e-05,
2304
+ 4e-05,
2305
+ 4e-05,
2306
+ 4e-05,
2307
+ 4e-05,
2308
+ 4e-05,
2309
+ 4e-05,
2310
+ 4e-05,
2311
+ 4e-05,
2312
+ 4e-05,
2313
+ 4e-05,
2314
+ 4e-05,
2315
+ 4e-05,
2316
+ 4e-05,
2317
+ 4e-05,
2318
+ 4e-05,
2319
+ 4e-05,
2320
+ 4e-05,
2321
+ 4e-05,
2322
+ 4e-05,
2323
+ 4e-05,
2324
+ 4e-05,
2325
+ 4e-05,
2326
+ 4e-05,
2327
+ 4e-05,
2328
+ 4e-05,
2329
+ 4e-05,
2330
+ 4e-05,
2331
+ 4e-05,
2332
+ 4e-05,
2333
+ 4e-05,
2334
+ 4e-05,
2335
+ 4e-05,
2336
+ 4e-05,
2337
+ 4e-05,
2338
+ 4e-05,
2339
+ 4e-05,
2340
+ 4e-05,
2341
+ 4e-05,
2342
+ 4e-05,
2343
+ 4e-05,
2344
+ 4e-05,
2345
+ 4e-05,
2346
+ 4e-05,
2347
+ 4e-05,
2348
+ 4e-05,
2349
+ 4e-05,
2350
+ 4e-05,
2351
+ 4e-05,
2352
+ 4e-05,
2353
+ 4e-05,
2354
+ 4e-05,
2355
+ 4e-05,
2356
+ 4e-05,
2357
+ 4e-05,
2358
+ 4e-05,
2359
+ 4e-05,
2360
+ 4e-05,
2361
+ 4e-05,
2362
+ 4e-05,
2363
+ 4e-05,
2364
+ 4e-05,
2365
+ 4e-05,
2366
+ 4e-05,
2367
+ 4e-05,
2368
+ 4e-05,
2369
+ 4e-05,
2370
+ 4e-05,
2371
+ 4e-05,
2372
+ 4e-05,
2373
+ 4e-05,
2374
+ 4e-05,
2375
+ 4e-05,
2376
+ 4e-05,
2377
+ 4e-05,
2378
+ 3.992995647012267e-05,
2379
+ 3.963316185199842e-05,
2380
+ 3.933636723387416e-05,
2381
+ 3.90395726157499e-05,
2382
+ 3.874277799762565e-05,
2383
+ 3.844598337950139e-05,
2384
+ 3.814918876137713e-05,
2385
+ 3.785239414325287e-05,
2386
+ 3.7555599525128613e-05,
2387
+ 3.725880490700435e-05,
2388
+ 3.696201028888009e-05,
2389
+ 3.666521567075585e-05,
2390
+ 3.6368421052631585e-05,
2391
+ 3.607162643450732e-05,
2392
+ 3.577483181638307e-05,
2393
+ 3.547803719825881e-05,
2394
+ 3.518124258013455e-05,
2395
+ 3.4884447962010287e-05,
2396
+ 3.458765334388604e-05,
2397
+ 3.4290858725761776e-05,
2398
+ 3.399406410763751e-05,
2399
+ 3.3697269489513265e-05,
2400
+ 3.3400474871389e-05,
2401
+ 3.310368025326474e-05,
2402
+ 3.280688563514048e-05,
2403
+ 3.251009101701623e-05,
2404
+ 3.2213296398891967e-05,
2405
+ 3.191650178076771e-05,
2406
+ 3.1542540561931145e-05,
2407
+ 3.124574594380688e-05,
2408
+ 3.094895132568263e-05,
2409
+ 3.065215670755838e-05,
2410
+ 3.0355362089434113e-05,
2411
+ 3.0058567471309854e-05,
2412
+ 2.97617728531856e-05,
2413
+ 2.9464978235061336e-05,
2414
+ 2.9168183616937077e-05,
2415
+ 2.8871388998812818e-05,
2416
+ 2.857459438068857e-05,
2417
+ 2.8277799762564307e-05,
2418
+ 2.798100514444005e-05,
2419
+ 2.7684210526315793e-05,
2420
+ 2.738741590819153e-05,
2421
+ 2.709062129006727e-05,
2422
+ 2.6793826671943013e-05,
2423
+ 2.6497032053818764e-05,
2424
+ 2.62002374356945e-05,
2425
+ 2.5903442817570243e-05,
2426
+ 2.5606648199445987e-05,
2427
+ 2.5309853581321725e-05,
2428
+ 2.5013058963197466e-05,
2429
+ 2.4716264345073214e-05,
2430
+ 2.441946972694896e-05,
2431
+ 2.4122675108824693e-05,
2432
+ 2.3825880490700434e-05,
2433
+ 2.352908587257618e-05,
2434
+ 2.3232291254451916e-05,
2435
+ 2.293549663632766e-05,
2436
+ 2.2638702018203408e-05,
2437
+ 2.226474079936684e-05,
2438
+ 2.196794618124258e-05,
2439
+ 2.1671151563118328e-05,
2440
+ 2.1374356944994066e-05,
2441
+ 2.1077562326869803e-05,
2442
+ 2.0780767708745554e-05,
2443
+ 2.0483973090621296e-05,
2444
+ 2.018717847249703e-05,
2445
+ 1.989038385437277e-05,
2446
+ 1.959358923624852e-05,
2447
+ 1.929679461812426e-05,
2448
+ 1.8999999999999998e-05,
2449
+ 1.8703205381875746e-05,
2450
+ 1.8406410763751487e-05,
2451
+ 1.8109616145627224e-05,
2452
+ 1.7812821527502965e-05,
2453
+ 1.7516026909378713e-05,
2454
+ 1.7219232291254454e-05,
2455
+ 1.6922437673130192e-05,
2456
+ 1.662564305500594e-05,
2457
+ 1.632884843688168e-05,
2458
+ 1.603205381875742e-05,
2459
+ 1.573525920063316e-05,
2460
+ 1.5438464582508908e-05,
2461
+ 1.5141669964384647e-05,
2462
+ 1.4844875346260385e-05,
2463
+ 1.4548080728136134e-05,
2464
+ 1.4251286110011875e-05,
2465
+ 1.3954491491887611e-05,
2466
+ 1.3657696873763363e-05,
2467
+ 1.33609022556391e-05,
2468
+ 1.298694103680253e-05,
2469
+ 1.2690146418678277e-05,
2470
+ 1.2393351800554018e-05,
2471
+ 1.2096557182429756e-05,
2472
+ 1.1799762564305506e-05,
2473
+ 1.1502967946181245e-05,
2474
+ 1.1206173328056984e-05,
2475
+ 1.0909378709932724e-05,
2476
+ 1.0612584091808472e-05,
2477
+ 1.0315789473684213e-05,
2478
+ 1.0018994855559949e-05,
2479
+ 9.7222002374357e-06,
2480
+ 9.425405619311438e-06,
2481
+ 9.128611001187177e-06,
2482
+ 8.831816383062916e-06,
2483
+ 8.535021764938666e-06,
2484
+ 8.238227146814405e-06,
2485
+ 7.941432528690143e-06,
2486
+ 7.644637910565893e-06,
2487
+ 7.347843292441632e-06,
2488
+ 7.0510486743173715e-06,
2489
+ 6.75425405619311e-06,
2490
+ 6.45745943806886e-06,
2491
+ 6.160664819944598e-06,
2492
+ 5.8638702018203375e-06,
2493
+ 5.567075583696086e-06,
2494
+ 5.270280965571826e-06,
2495
+ 4.973486347447565e-06,
2496
+ 4.676691729323314e-06,
2497
+ 4.379897111199053e-06,
2498
+ 4.083102493074792e-06
2499
+ ],
2500
+ "emb_lr": [],
2501
+ "eval_step": [
2502
+ 1550,
2503
+ 3113,
2504
+ 4676,
2505
+ 6239,
2506
+ 7802,
2507
+ 9365,
2508
+ 10928,
2509
+ 12491,
2510
+ 14054,
2511
+ 15617
2512
+ ],
2513
+ "eval_accuracy": [
2514
+ 0.0,
2515
+ 0.0,
2516
+ 0.0,
2517
+ 0.0,
2518
+ 0.0,
2519
+ 0.0,
2520
+ 0.0,
2521
+ 0.0,
2522
+ 0.0,
2523
+ 0.0
2524
+ ]
2525
+ },
2526
+ "final_accuracy": 0.9991666666666666,
2527
+ "sft_eval": {
2528
+ "config": {
2529
+ "ops": "add_sub",
2530
+ "K": null,
2531
+ "mode": "sft",
2532
+ "n_digits": 6,
2533
+ "n_per_split": 100
2534
+ },
2535
+ "splits": {
2536
+ "add_S0": {
2537
+ "full_accuracy": 1.0,
2538
+ "n_examples": 100,
2539
+ "per_subtask": {
2540
+ "SA": {
2541
+ "accuracy": 1.0,
2542
+ "count": 605
2543
+ },
2544
+ "SS": {
2545
+ "accuracy": 1.0,
2546
+ "count": 95
2547
+ }
2548
+ }
2549
+ },
2550
+ "add_S1": {
2551
+ "full_accuracy": 1.0,
2552
+ "n_examples": 100,
2553
+ "per_subtask": {
2554
+ "SA": {
2555
+ "accuracy": 1.0,
2556
+ "count": 204
2557
+ },
2558
+ "SC": {
2559
+ "accuracy": 1.0,
2560
+ "count": 169
2561
+ },
2562
+ "SS": {
2563
+ "accuracy": 1.0,
2564
+ "count": 31
2565
+ },
2566
+ "UC": {
2567
+ "accuracy": 1.0,
2568
+ "count": 296
2569
+ }
2570
+ }
2571
+ },
2572
+ "add_S2": {
2573
+ "full_accuracy": 1.0,
2574
+ "n_examples": 100,
2575
+ "per_subtask": {
2576
+ "SA": {
2577
+ "accuracy": 1.0,
2578
+ "count": 163
2579
+ },
2580
+ "SC": {
2581
+ "accuracy": 1.0,
2582
+ "count": 130
2583
+ },
2584
+ "SS": {
2585
+ "accuracy": 1.0,
2586
+ "count": 87
2587
+ },
2588
+ "UC": {
2589
+ "accuracy": 1.0,
2590
+ "count": 203
2591
+ },
2592
+ "US": {
2593
+ "accuracy": 1.0,
2594
+ "count": 117
2595
+ }
2596
+ }
2597
+ },
2598
+ "add_S3": {
2599
+ "full_accuracy": 1.0,
2600
+ "n_examples": 100,
2601
+ "per_subtask": {
2602
+ "SA": {
2603
+ "accuracy": 1.0,
2604
+ "count": 121
2605
+ },
2606
+ "SC": {
2607
+ "accuracy": 1.0,
2608
+ "count": 121
2609
+ },
2610
+ "SS": {
2611
+ "accuracy": 1.0,
2612
+ "count": 49
2613
+ },
2614
+ "UC": {
2615
+ "accuracy": 1.0,
2616
+ "count": 186
2617
+ },
2618
+ "US": {
2619
+ "accuracy": 1.0,
2620
+ "count": 223
2621
+ }
2622
+ }
2623
+ },
2624
+ "add_S4": {
2625
+ "full_accuracy": 0.97,
2626
+ "n_examples": 100,
2627
+ "per_subtask": {
2628
+ "SA": {
2629
+ "accuracy": 1.0,
2630
+ "count": 104
2631
+ },
2632
+ "SC": {
2633
+ "accuracy": 1.0,
2634
+ "count": 106
2635
+ },
2636
+ "SS": {
2637
+ "accuracy": 1.0,
2638
+ "count": 23
2639
+ },
2640
+ "UC": {
2641
+ "accuracy": 0.98125,
2642
+ "count": 160
2643
+ },
2644
+ "US": {
2645
+ "accuracy": 1.0,
2646
+ "count": 307
2647
+ }
2648
+ }
2649
+ },
2650
+ "add_S5": {
2651
+ "full_accuracy": 0.96,
2652
+ "n_examples": 100,
2653
+ "per_subtask": {
2654
+ "SA": {
2655
+ "accuracy": 1.0,
2656
+ "count": 100
2657
+ },
2658
+ "SC": {
2659
+ "accuracy": 1.0,
2660
+ "count": 100
2661
+ },
2662
+ "UC": {
2663
+ "accuracy": 0.97,
2664
+ "count": 100
2665
+ },
2666
+ "US": {
2667
+ "accuracy": 0.9975,
2668
+ "count": 400
2669
+ }
2670
+ }
2671
+ },
2672
+ "add_S6": {
2673
+ "full_accuracy": 1.0,
2674
+ "n_examples": 100,
2675
+ "per_subtask": {
2676
+ "SC": {
2677
+ "accuracy": 1.0,
2678
+ "count": 100
2679
+ },
2680
+ "UC": {
2681
+ "accuracy": 1.0,
2682
+ "count": 100
2683
+ },
2684
+ "US": {
2685
+ "accuracy": 1.0,
2686
+ "count": 500
2687
+ }
2688
+ }
2689
+ },
2690
+ "add_random": {
2691
+ "full_accuracy": 1.0,
2692
+ "n_examples": 200,
2693
+ "per_subtask": {
2694
+ "SA": {
2695
+ "accuracy": 1.0,
2696
+ "count": 447
2697
+ },
2698
+ "SC": {
2699
+ "accuracy": 1.0,
2700
+ "count": 320
2701
+ },
2702
+ "SS": {
2703
+ "accuracy": 1.0,
2704
+ "count": 56
2705
+ },
2706
+ "UC": {
2707
+ "accuracy": 1.0,
2708
+ "count": 529
2709
+ },
2710
+ "US": {
2711
+ "accuracy": 1.0,
2712
+ "count": 48
2713
+ }
2714
+ }
2715
+ },
2716
+ "add_C3": {
2717
+ "full_accuracy": 1.0,
2718
+ "n_examples": 100,
2719
+ "per_subtask": {
2720
+ "SA": {
2721
+ "accuracy": 1.0,
2722
+ "count": 300
2723
+ },
2724
+ "SC": {
2725
+ "accuracy": 1.0,
2726
+ "count": 100
2727
+ },
2728
+ "UC": {
2729
+ "accuracy": 1.0,
2730
+ "count": 193
2731
+ },
2732
+ "US": {
2733
+ "accuracy": 1.0,
2734
+ "count": 107
2735
+ }
2736
+ }
2737
+ },
2738
+ "add_C4": {
2739
+ "full_accuracy": 0.98,
2740
+ "n_examples": 100,
2741
+ "per_subtask": {
2742
+ "SA": {
2743
+ "accuracy": 1.0,
2744
+ "count": 200
2745
+ },
2746
+ "SC": {
2747
+ "accuracy": 1.0,
2748
+ "count": 100
2749
+ },
2750
+ "UC": {
2751
+ "accuracy": 0.9921875,
2752
+ "count": 256
2753
+ },
2754
+ "US": {
2755
+ "accuracy": 1.0,
2756
+ "count": 144
2757
+ }
2758
+ }
2759
+ },
2760
+ "add_C5": {
2761
+ "full_accuracy": 0.98,
2762
+ "n_examples": 100,
2763
+ "per_subtask": {
2764
+ "SA": {
2765
+ "accuracy": 1.0,
2766
+ "count": 100
2767
+ },
2768
+ "SC": {
2769
+ "accuracy": 1.0,
2770
+ "count": 100
2771
+ },
2772
+ "UC": {
2773
+ "accuracy": 0.9934640522875817,
2774
+ "count": 306
2775
+ },
2776
+ "US": {
2777
+ "accuracy": 1.0,
2778
+ "count": 194
2779
+ }
2780
+ }
2781
+ },
2782
+ "add_C6": {
2783
+ "full_accuracy": 1.0,
2784
+ "n_examples": 100,
2785
+ "per_subtask": {
2786
+ "SC": {
2787
+ "accuracy": 1.0,
2788
+ "count": 100
2789
+ },
2790
+ "UC": {
2791
+ "accuracy": 1.0,
2792
+ "count": 366
2793
+ },
2794
+ "US": {
2795
+ "accuracy": 1.0,
2796
+ "count": 234
2797
+ }
2798
+ }
2799
+ },
2800
+ "sub_M0": {
2801
+ "full_accuracy": 1.0,
2802
+ "n_examples": 100,
2803
+ "per_subtask": {
2804
+ "MD": {
2805
+ "accuracy": 1.0,
2806
+ "count": 601
2807
+ },
2808
+ "ME": {
2809
+ "accuracy": 1.0,
2810
+ "count": 99
2811
+ }
2812
+ }
2813
+ },
2814
+ "sub_M1": {
2815
+ "full_accuracy": 1.0,
2816
+ "n_examples": 100,
2817
+ "per_subtask": {
2818
+ "MD": {
2819
+ "accuracy": 1.0,
2820
+ "count": 279
2821
+ },
2822
+ "MB": {
2823
+ "accuracy": 1.0,
2824
+ "count": 145
2825
+ },
2826
+ "ME": {
2827
+ "accuracy": 1.0,
2828
+ "count": 24
2829
+ },
2830
+ "UB": {
2831
+ "accuracy": 1.0,
2832
+ "count": 252
2833
+ }
2834
+ }
2835
+ },
2836
+ "sub_M2": {
2837
+ "full_accuracy": 1.0,
2838
+ "n_examples": 100,
2839
+ "per_subtask": {
2840
+ "MD": {
2841
+ "accuracy": 1.0,
2842
+ "count": 213
2843
+ },
2844
+ "MB": {
2845
+ "accuracy": 1.0,
2846
+ "count": 113
2847
+ },
2848
+ "ME": {
2849
+ "accuracy": 1.0,
2850
+ "count": 85
2851
+ },
2852
+ "UB": {
2853
+ "accuracy": 1.0,
2854
+ "count": 181
2855
+ },
2856
+ "UD": {
2857
+ "accuracy": 1.0,
2858
+ "count": 108
2859
+ }
2860
+ }
2861
+ },
2862
+ "sub_M3": {
2863
+ "full_accuracy": 1.0,
2864
+ "n_examples": 100,
2865
+ "per_subtask": {
2866
+ "MD": {
2867
+ "accuracy": 1.0,
2868
+ "count": 179
2869
+ },
2870
+ "MB": {
2871
+ "accuracy": 1.0,
2872
+ "count": 103
2873
+ },
2874
+ "ME": {
2875
+ "accuracy": 1.0,
2876
+ "count": 56
2877
+ },
2878
+ "UB": {
2879
+ "accuracy": 1.0,
2880
+ "count": 149
2881
+ },
2882
+ "UD": {
2883
+ "accuracy": 1.0,
2884
+ "count": 213
2885
+ }
2886
+ }
2887
+ },
2888
+ "sub_M4": {
2889
+ "full_accuracy": 0.83,
2890
+ "n_examples": 100,
2891
+ "per_subtask": {
2892
+ "MD": {
2893
+ "accuracy": 1.0,
2894
+ "count": 200
2895
+ },
2896
+ "MB": {
2897
+ "accuracy": 1.0,
2898
+ "count": 100
2899
+ },
2900
+ "UB": {
2901
+ "accuracy": 0.83,
2902
+ "count": 100
2903
+ },
2904
+ "UD": {
2905
+ "accuracy": 1.0,
2906
+ "count": 300
2907
+ }
2908
+ }
2909
+ },
2910
+ "sub_M5": {
2911
+ "full_accuracy": 0.94,
2912
+ "n_examples": 100,
2913
+ "per_subtask": {
2914
+ "MD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 100
2917
+ },
2918
+ "MB": {
2919
+ "accuracy": 1.0,
2920
+ "count": 100
2921
+ },
2922
+ "UB": {
2923
+ "accuracy": 0.97,
2924
+ "count": 100
2925
+ },
2926
+ "UD": {
2927
+ "accuracy": 0.9925,
2928
+ "count": 400
2929
+ }
2930
+ }
2931
+ },
2932
+ "sub_random": {
2933
+ "full_accuracy": 1.0,
2934
+ "n_examples": 200,
2935
+ "per_subtask": {
2936
+ "MD": {
2937
+ "accuracy": 1.0,
2938
+ "count": 600
2939
+ },
2940
+ "MB": {
2941
+ "accuracy": 1.0,
2942
+ "count": 267
2943
+ },
2944
+ "ME": {
2945
+ "accuracy": 1.0,
2946
+ "count": 53
2947
+ },
2948
+ "UB": {
2949
+ "accuracy": 1.0,
2950
+ "count": 439
2951
+ },
2952
+ "UD": {
2953
+ "accuracy": 1.0,
2954
+ "count": 41
2955
+ }
2956
+ }
2957
+ },
2958
+ "sub_B3": {
2959
+ "full_accuracy": 1.0,
2960
+ "n_examples": 100,
2961
+ "per_subtask": {
2962
+ "MD": {
2963
+ "accuracy": 1.0,
2964
+ "count": 300
2965
+ },
2966
+ "MB": {
2967
+ "accuracy": 1.0,
2968
+ "count": 100
2969
+ },
2970
+ "UB": {
2971
+ "accuracy": 1.0,
2972
+ "count": 197
2973
+ },
2974
+ "UD": {
2975
+ "accuracy": 1.0,
2976
+ "count": 103
2977
+ }
2978
+ }
2979
+ },
2980
+ "sub_B4": {
2981
+ "full_accuracy": 0.97,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "MD": {
2985
+ "accuracy": 1.0,
2986
+ "count": 200
2987
+ },
2988
+ "MB": {
2989
+ "accuracy": 1.0,
2990
+ "count": 100
2991
+ },
2992
+ "UB": {
2993
+ "accuracy": 0.9878542510121457,
2994
+ "count": 247
2995
+ },
2996
+ "UD": {
2997
+ "accuracy": 1.0,
2998
+ "count": 153
2999
+ }
3000
+ }
3001
+ },
3002
+ "sub_B5": {
3003
+ "full_accuracy": 1.0,
3004
+ "n_examples": 100,
3005
+ "per_subtask": {
3006
+ "MD": {
3007
+ "accuracy": 1.0,
3008
+ "count": 100
3009
+ },
3010
+ "MB": {
3011
+ "accuracy": 1.0,
3012
+ "count": 100
3013
+ },
3014
+ "UB": {
3015
+ "accuracy": 1.0,
3016
+ "count": 298
3017
+ },
3018
+ "UD": {
3019
+ "accuracy": 1.0,
3020
+ "count": 202
3021
+ }
3022
+ }
3023
+ }
3024
+ },
3025
+ "summary": {
3026
+ "overall_accuracy": 0.9845833333333334,
3027
+ "total_examples": 2400,
3028
+ "n_splits": 22
3029
+ }
3030
+ },
3031
+ "sorl_eval": {
3032
+ "config": {
3033
+ "ops": "add_sub",
3034
+ "K": 1,
3035
+ "mode": "sorl",
3036
+ "n_digits": 6,
3037
+ "n_per_split": 100
3038
+ },
3039
+ "splits": {
3040
+ "add_S0": {
3041
+ "full_accuracy": 1.0,
3042
+ "n_examples": 100,
3043
+ "per_subtask": {
3044
+ "SA": {
3045
+ "accuracy": 1.0,
3046
+ "count": 605
3047
+ },
3048
+ "SS": {
3049
+ "accuracy": 1.0,
3050
+ "count": 95
3051
+ }
3052
+ }
3053
+ },
3054
+ "add_S1": {
3055
+ "full_accuracy": 1.0,
3056
+ "n_examples": 100,
3057
+ "per_subtask": {
3058
+ "SA": {
3059
+ "accuracy": 1.0,
3060
+ "count": 204
3061
+ },
3062
+ "SC": {
3063
+ "accuracy": 1.0,
3064
+ "count": 169
3065
+ },
3066
+ "SS": {
3067
+ "accuracy": 1.0,
3068
+ "count": 31
3069
+ },
3070
+ "UC": {
3071
+ "accuracy": 1.0,
3072
+ "count": 296
3073
+ }
3074
+ }
3075
+ },
3076
+ "add_S2": {
3077
+ "full_accuracy": 1.0,
3078
+ "n_examples": 100,
3079
+ "per_subtask": {
3080
+ "SA": {
3081
+ "accuracy": 1.0,
3082
+ "count": 163
3083
+ },
3084
+ "SC": {
3085
+ "accuracy": 1.0,
3086
+ "count": 130
3087
+ },
3088
+ "SS": {
3089
+ "accuracy": 1.0,
3090
+ "count": 87
3091
+ },
3092
+ "UC": {
3093
+ "accuracy": 1.0,
3094
+ "count": 203
3095
+ },
3096
+ "US": {
3097
+ "accuracy": 1.0,
3098
+ "count": 117
3099
+ }
3100
+ }
3101
+ },
3102
+ "add_S3": {
3103
+ "full_accuracy": 1.0,
3104
+ "n_examples": 100,
3105
+ "per_subtask": {
3106
+ "SA": {
3107
+ "accuracy": 1.0,
3108
+ "count": 121
3109
+ },
3110
+ "SC": {
3111
+ "accuracy": 1.0,
3112
+ "count": 121
3113
+ },
3114
+ "SS": {
3115
+ "accuracy": 1.0,
3116
+ "count": 49
3117
+ },
3118
+ "UC": {
3119
+ "accuracy": 1.0,
3120
+ "count": 186
3121
+ },
3122
+ "US": {
3123
+ "accuracy": 1.0,
3124
+ "count": 223
3125
+ }
3126
+ }
3127
+ },
3128
+ "add_S4": {
3129
+ "full_accuracy": 1.0,
3130
+ "n_examples": 100,
3131
+ "per_subtask": {
3132
+ "SA": {
3133
+ "accuracy": 1.0,
3134
+ "count": 104
3135
+ },
3136
+ "SC": {
3137
+ "accuracy": 1.0,
3138
+ "count": 106
3139
+ },
3140
+ "SS": {
3141
+ "accuracy": 1.0,
3142
+ "count": 23
3143
+ },
3144
+ "UC": {
3145
+ "accuracy": 1.0,
3146
+ "count": 160
3147
+ },
3148
+ "US": {
3149
+ "accuracy": 1.0,
3150
+ "count": 307
3151
+ }
3152
+ }
3153
+ },
3154
+ "add_S5": {
3155
+ "full_accuracy": 1.0,
3156
+ "n_examples": 100,
3157
+ "per_subtask": {
3158
+ "SA": {
3159
+ "accuracy": 1.0,
3160
+ "count": 100
3161
+ },
3162
+ "SC": {
3163
+ "accuracy": 1.0,
3164
+ "count": 100
3165
+ },
3166
+ "UC": {
3167
+ "accuracy": 1.0,
3168
+ "count": 100
3169
+ },
3170
+ "US": {
3171
+ "accuracy": 1.0,
3172
+ "count": 400
3173
+ }
3174
+ }
3175
+ },
3176
+ "add_S6": {
3177
+ "full_accuracy": 1.0,
3178
+ "n_examples": 100,
3179
+ "per_subtask": {
3180
+ "SC": {
3181
+ "accuracy": 1.0,
3182
+ "count": 100
3183
+ },
3184
+ "UC": {
3185
+ "accuracy": 1.0,
3186
+ "count": 100
3187
+ },
3188
+ "US": {
3189
+ "accuracy": 1.0,
3190
+ "count": 500
3191
+ }
3192
+ }
3193
+ },
3194
+ "add_random": {
3195
+ "full_accuracy": 1.0,
3196
+ "n_examples": 200,
3197
+ "per_subtask": {
3198
+ "SA": {
3199
+ "accuracy": 1.0,
3200
+ "count": 447
3201
+ },
3202
+ "SC": {
3203
+ "accuracy": 1.0,
3204
+ "count": 320
3205
+ },
3206
+ "SS": {
3207
+ "accuracy": 1.0,
3208
+ "count": 56
3209
+ },
3210
+ "UC": {
3211
+ "accuracy": 1.0,
3212
+ "count": 529
3213
+ },
3214
+ "US": {
3215
+ "accuracy": 1.0,
3216
+ "count": 48
3217
+ }
3218
+ }
3219
+ },
3220
+ "add_C3": {
3221
+ "full_accuracy": 1.0,
3222
+ "n_examples": 100,
3223
+ "per_subtask": {
3224
+ "SA": {
3225
+ "accuracy": 1.0,
3226
+ "count": 300
3227
+ },
3228
+ "SC": {
3229
+ "accuracy": 1.0,
3230
+ "count": 100
3231
+ },
3232
+ "UC": {
3233
+ "accuracy": 1.0,
3234
+ "count": 193
3235
+ },
3236
+ "US": {
3237
+ "accuracy": 1.0,
3238
+ "count": 107
3239
+ }
3240
+ }
3241
+ },
3242
+ "add_C4": {
3243
+ "full_accuracy": 1.0,
3244
+ "n_examples": 100,
3245
+ "per_subtask": {
3246
+ "SA": {
3247
+ "accuracy": 1.0,
3248
+ "count": 200
3249
+ },
3250
+ "SC": {
3251
+ "accuracy": 1.0,
3252
+ "count": 100
3253
+ },
3254
+ "UC": {
3255
+ "accuracy": 1.0,
3256
+ "count": 256
3257
+ },
3258
+ "US": {
3259
+ "accuracy": 1.0,
3260
+ "count": 144
3261
+ }
3262
+ }
3263
+ },
3264
+ "add_C5": {
3265
+ "full_accuracy": 1.0,
3266
+ "n_examples": 100,
3267
+ "per_subtask": {
3268
+ "SA": {
3269
+ "accuracy": 1.0,
3270
+ "count": 100
3271
+ },
3272
+ "SC": {
3273
+ "accuracy": 1.0,
3274
+ "count": 100
3275
+ },
3276
+ "UC": {
3277
+ "accuracy": 1.0,
3278
+ "count": 306
3279
+ },
3280
+ "US": {
3281
+ "accuracy": 1.0,
3282
+ "count": 194
3283
+ }
3284
+ }
3285
+ },
3286
+ "add_C6": {
3287
+ "full_accuracy": 1.0,
3288
+ "n_examples": 100,
3289
+ "per_subtask": {
3290
+ "SC": {
3291
+ "accuracy": 1.0,
3292
+ "count": 100
3293
+ },
3294
+ "UC": {
3295
+ "accuracy": 1.0,
3296
+ "count": 366
3297
+ },
3298
+ "US": {
3299
+ "accuracy": 1.0,
3300
+ "count": 234
3301
+ }
3302
+ }
3303
+ },
3304
+ "sub_M0": {
3305
+ "full_accuracy": 1.0,
3306
+ "n_examples": 100,
3307
+ "per_subtask": {
3308
+ "MD": {
3309
+ "accuracy": 1.0,
3310
+ "count": 601
3311
+ },
3312
+ "ME": {
3313
+ "accuracy": 1.0,
3314
+ "count": 99
3315
+ }
3316
+ }
3317
+ },
3318
+ "sub_M1": {
3319
+ "full_accuracy": 1.0,
3320
+ "n_examples": 100,
3321
+ "per_subtask": {
3322
+ "MD": {
3323
+ "accuracy": 1.0,
3324
+ "count": 279
3325
+ },
3326
+ "MB": {
3327
+ "accuracy": 1.0,
3328
+ "count": 145
3329
+ },
3330
+ "ME": {
3331
+ "accuracy": 1.0,
3332
+ "count": 24
3333
+ },
3334
+ "UB": {
3335
+ "accuracy": 1.0,
3336
+ "count": 252
3337
+ }
3338
+ }
3339
+ },
3340
+ "sub_M2": {
3341
+ "full_accuracy": 1.0,
3342
+ "n_examples": 100,
3343
+ "per_subtask": {
3344
+ "MD": {
3345
+ "accuracy": 1.0,
3346
+ "count": 213
3347
+ },
3348
+ "MB": {
3349
+ "accuracy": 1.0,
3350
+ "count": 113
3351
+ },
3352
+ "ME": {
3353
+ "accuracy": 1.0,
3354
+ "count": 85
3355
+ },
3356
+ "UB": {
3357
+ "accuracy": 1.0,
3358
+ "count": 181
3359
+ },
3360
+ "UD": {
3361
+ "accuracy": 1.0,
3362
+ "count": 108
3363
+ }
3364
+ }
3365
+ },
3366
+ "sub_M3": {
3367
+ "full_accuracy": 1.0,
3368
+ "n_examples": 100,
3369
+ "per_subtask": {
3370
+ "MD": {
3371
+ "accuracy": 1.0,
3372
+ "count": 179
3373
+ },
3374
+ "MB": {
3375
+ "accuracy": 1.0,
3376
+ "count": 103
3377
+ },
3378
+ "ME": {
3379
+ "accuracy": 1.0,
3380
+ "count": 56
3381
+ },
3382
+ "UB": {
3383
+ "accuracy": 1.0,
3384
+ "count": 149
3385
+ },
3386
+ "UD": {
3387
+ "accuracy": 1.0,
3388
+ "count": 213
3389
+ }
3390
+ }
3391
+ },
3392
+ "sub_M4": {
3393
+ "full_accuracy": 1.0,
3394
+ "n_examples": 100,
3395
+ "per_subtask": {
3396
+ "MD": {
3397
+ "accuracy": 1.0,
3398
+ "count": 200
3399
+ },
3400
+ "MB": {
3401
+ "accuracy": 1.0,
3402
+ "count": 100
3403
+ },
3404
+ "UB": {
3405
+ "accuracy": 1.0,
3406
+ "count": 100
3407
+ },
3408
+ "UD": {
3409
+ "accuracy": 1.0,
3410
+ "count": 300
3411
+ }
3412
+ }
3413
+ },
3414
+ "sub_M5": {
3415
+ "full_accuracy": 1.0,
3416
+ "n_examples": 100,
3417
+ "per_subtask": {
3418
+ "MD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 100
3421
+ },
3422
+ "MB": {
3423
+ "accuracy": 1.0,
3424
+ "count": 100
3425
+ },
3426
+ "UB": {
3427
+ "accuracy": 1.0,
3428
+ "count": 100
3429
+ },
3430
+ "UD": {
3431
+ "accuracy": 1.0,
3432
+ "count": 400
3433
+ }
3434
+ }
3435
+ },
3436
+ "sub_random": {
3437
+ "full_accuracy": 0.99,
3438
+ "n_examples": 200,
3439
+ "per_subtask": {
3440
+ "MD": {
3441
+ "accuracy": 0.9966666666666667,
3442
+ "count": 600
3443
+ },
3444
+ "MB": {
3445
+ "accuracy": 1.0,
3446
+ "count": 267
3447
+ },
3448
+ "ME": {
3449
+ "accuracy": 1.0,
3450
+ "count": 53
3451
+ },
3452
+ "UB": {
3453
+ "accuracy": 1.0,
3454
+ "count": 439
3455
+ },
3456
+ "UD": {
3457
+ "accuracy": 1.0,
3458
+ "count": 41
3459
+ }
3460
+ }
3461
+ },
3462
+ "sub_B3": {
3463
+ "full_accuracy": 1.0,
3464
+ "n_examples": 100,
3465
+ "per_subtask": {
3466
+ "MD": {
3467
+ "accuracy": 1.0,
3468
+ "count": 300
3469
+ },
3470
+ "MB": {
3471
+ "accuracy": 1.0,
3472
+ "count": 100
3473
+ },
3474
+ "UB": {
3475
+ "accuracy": 1.0,
3476
+ "count": 197
3477
+ },
3478
+ "UD": {
3479
+ "accuracy": 1.0,
3480
+ "count": 103
3481
+ }
3482
+ }
3483
+ },
3484
+ "sub_B4": {
3485
+ "full_accuracy": 1.0,
3486
+ "n_examples": 100,
3487
+ "per_subtask": {
3488
+ "MD": {
3489
+ "accuracy": 1.0,
3490
+ "count": 200
3491
+ },
3492
+ "MB": {
3493
+ "accuracy": 1.0,
3494
+ "count": 100
3495
+ },
3496
+ "UB": {
3497
+ "accuracy": 1.0,
3498
+ "count": 247
3499
+ },
3500
+ "UD": {
3501
+ "accuracy": 1.0,
3502
+ "count": 153
3503
+ }
3504
+ }
3505
+ },
3506
+ "sub_B5": {
3507
+ "full_accuracy": 1.0,
3508
+ "n_examples": 100,
3509
+ "per_subtask": {
3510
+ "MD": {
3511
+ "accuracy": 1.0,
3512
+ "count": 100
3513
+ },
3514
+ "MB": {
3515
+ "accuracy": 1.0,
3516
+ "count": 100
3517
+ },
3518
+ "UB": {
3519
+ "accuracy": 1.0,
3520
+ "count": 298
3521
+ },
3522
+ "UD": {
3523
+ "accuracy": 1.0,
3524
+ "count": 202
3525
+ }
3526
+ }
3527
+ }
3528
+ },
3529
+ "summary": {
3530
+ "overall_accuracy": 0.9991666666666666,
3531
+ "total_examples": 2400,
3532
+ "n_splits": 22
3533
+ }
3534
+ },
3535
+ "sorl_overall_accuracy": 0.9991666666666666,
3536
+ "sft_overall_accuracy": 0.9845833333333334
3537
+ }
add_sub_sorl_v1_abs70_K1_100K/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:721fadbb1dc6523b75520b324969d00869ab8bf5cc59ab07edc0cb19413b3104
3
+ size 650548580
add_sub_sorl_v1_abs70_K1_100K/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 1,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 4e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 10,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 1562,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs70_K1_100K",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 2,
61
+ "n_head": 3,
62
+ "n_embd": 510,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 70,
65
+ "dataset_size": 100000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 162560462,
71
+ "run_name": "add_sub_sorl_v1_abs70_K1_100K",
72
+ "git_commit": "f447da529caceac8c7d256cbb2cd185cbc50feac",
73
+ "timestamp": "2026-04-12T11:53:19.353546+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "724acrhz",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/724acrhz",
81
+ "final_accuracy": 0.9991666666666666,
82
+ "sft_accuracy": 0.9845833333333334,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }