amirali1985 commited on
Commit
d847453
·
verified ·
1 Parent(s): b7f8434

Upload add_sub_sorl_v1_abs10_K1_100K_1L2H256d

Browse files
add_sub_sorl_v1_abs10_K1_100K_1L2H256d/config.json ADDED
@@ -0,0 +1,36 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 256,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 1024,
15
+ "layer_types": [
16
+ "full_attention"
17
+ ],
18
+ "max_position_embeddings": 128,
19
+ "max_window_layers": 28,
20
+ "model_type": "qwen3",
21
+ "num_attention_heads": 2,
22
+ "num_hidden_layers": 1,
23
+ "num_key_value_heads": 2,
24
+ "pad_token_id": null,
25
+ "rms_norm_eps": 1e-06,
26
+ "rope_parameters": {
27
+ "rope_theta": 10000.0,
28
+ "rope_type": "default"
29
+ },
30
+ "sliding_window": null,
31
+ "tie_word_embeddings": false,
32
+ "transformers_version": "5.5.0",
33
+ "use_cache": true,
34
+ "use_sliding_window": false,
35
+ "vocab_size": 151654
36
+ }
add_sub_sorl_v1_abs10_K1_100K_1L2H256d/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs10_K1_100K_1L2H256d/metrics.json ADDED
@@ -0,0 +1,3537 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 800,
20
+ 850,
21
+ 900,
22
+ 950,
23
+ 1000,
24
+ 1050,
25
+ 1100,
26
+ 1150,
27
+ 1200,
28
+ 1250,
29
+ 1300,
30
+ 1350,
31
+ 1400,
32
+ 1450,
33
+ 1500,
34
+ 1550,
35
+ 1613,
36
+ 1663,
37
+ 1713,
38
+ 1763,
39
+ 1813,
40
+ 1863,
41
+ 1913,
42
+ 1963,
43
+ 2013,
44
+ 2063,
45
+ 2113,
46
+ 2163,
47
+ 2213,
48
+ 2263,
49
+ 2313,
50
+ 2363,
51
+ 2413,
52
+ 2463,
53
+ 2513,
54
+ 2563,
55
+ 2613,
56
+ 2663,
57
+ 2713,
58
+ 2763,
59
+ 2813,
60
+ 2863,
61
+ 2913,
62
+ 2963,
63
+ 3013,
64
+ 3063,
65
+ 3113,
66
+ 3176,
67
+ 3226,
68
+ 3276,
69
+ 3326,
70
+ 3376,
71
+ 3426,
72
+ 3476,
73
+ 3526,
74
+ 3576,
75
+ 3626,
76
+ 3676,
77
+ 3726,
78
+ 3776,
79
+ 3826,
80
+ 3876,
81
+ 3926,
82
+ 3976,
83
+ 4026,
84
+ 4076,
85
+ 4126,
86
+ 4176,
87
+ 4226,
88
+ 4276,
89
+ 4326,
90
+ 4376,
91
+ 4426,
92
+ 4476,
93
+ 4526,
94
+ 4576,
95
+ 4626,
96
+ 4676,
97
+ 4739,
98
+ 4789,
99
+ 4839,
100
+ 4889,
101
+ 4939,
102
+ 4989,
103
+ 5039,
104
+ 5089,
105
+ 5139,
106
+ 5189,
107
+ 5239,
108
+ 5289,
109
+ 5339,
110
+ 5389,
111
+ 5439,
112
+ 5489,
113
+ 5539,
114
+ 5589,
115
+ 5639,
116
+ 5689,
117
+ 5739,
118
+ 5789,
119
+ 5839,
120
+ 5889,
121
+ 5939,
122
+ 5989,
123
+ 6039,
124
+ 6089,
125
+ 6139,
126
+ 6189,
127
+ 6239,
128
+ 6302,
129
+ 6352,
130
+ 6402,
131
+ 6452,
132
+ 6502,
133
+ 6552,
134
+ 6602,
135
+ 6652,
136
+ 6702,
137
+ 6752,
138
+ 6802,
139
+ 6852,
140
+ 6902,
141
+ 6952,
142
+ 7002,
143
+ 7052,
144
+ 7102,
145
+ 7152,
146
+ 7202,
147
+ 7252,
148
+ 7302,
149
+ 7352,
150
+ 7402,
151
+ 7452,
152
+ 7502,
153
+ 7552,
154
+ 7602,
155
+ 7652,
156
+ 7702,
157
+ 7752,
158
+ 7802,
159
+ 7865,
160
+ 7915,
161
+ 7965,
162
+ 8015,
163
+ 8065,
164
+ 8115,
165
+ 8165,
166
+ 8215,
167
+ 8265,
168
+ 8315,
169
+ 8365,
170
+ 8415,
171
+ 8465,
172
+ 8515,
173
+ 8565,
174
+ 8615,
175
+ 8665,
176
+ 8715,
177
+ 8765,
178
+ 8815,
179
+ 8865,
180
+ 8915,
181
+ 8965,
182
+ 9015,
183
+ 9065,
184
+ 9115,
185
+ 9165,
186
+ 9215,
187
+ 9265,
188
+ 9315,
189
+ 9365,
190
+ 9428,
191
+ 9478,
192
+ 9528,
193
+ 9578,
194
+ 9628,
195
+ 9678,
196
+ 9728,
197
+ 9778,
198
+ 9828,
199
+ 9878,
200
+ 9928,
201
+ 9978,
202
+ 10028,
203
+ 10078,
204
+ 10128,
205
+ 10178,
206
+ 10228,
207
+ 10278,
208
+ 10328,
209
+ 10378,
210
+ 10428,
211
+ 10478,
212
+ 10528,
213
+ 10578,
214
+ 10628,
215
+ 10678,
216
+ 10728,
217
+ 10778,
218
+ 10828,
219
+ 10878,
220
+ 10928,
221
+ 10991,
222
+ 11041,
223
+ 11091,
224
+ 11141,
225
+ 11191,
226
+ 11241,
227
+ 11291,
228
+ 11341,
229
+ 11391,
230
+ 11441,
231
+ 11491,
232
+ 11541,
233
+ 11591,
234
+ 11641,
235
+ 11691,
236
+ 11741,
237
+ 11791,
238
+ 11841,
239
+ 11891,
240
+ 11941,
241
+ 11991,
242
+ 12041,
243
+ 12091,
244
+ 12141,
245
+ 12191,
246
+ 12241,
247
+ 12291,
248
+ 12341,
249
+ 12391,
250
+ 12441,
251
+ 12491,
252
+ 12554,
253
+ 12604,
254
+ 12654,
255
+ 12704,
256
+ 12754,
257
+ 12804,
258
+ 12854,
259
+ 12904,
260
+ 12954,
261
+ 13004,
262
+ 13054,
263
+ 13104,
264
+ 13154,
265
+ 13204,
266
+ 13254,
267
+ 13304,
268
+ 13354,
269
+ 13404,
270
+ 13454,
271
+ 13504,
272
+ 13554,
273
+ 13604,
274
+ 13654,
275
+ 13704,
276
+ 13754,
277
+ 13804,
278
+ 13854,
279
+ 13904,
280
+ 13954,
281
+ 14004,
282
+ 14054,
283
+ 14117,
284
+ 14167,
285
+ 14217,
286
+ 14267,
287
+ 14317,
288
+ 14367,
289
+ 14417,
290
+ 14467,
291
+ 14517,
292
+ 14567,
293
+ 14617,
294
+ 14667,
295
+ 14717,
296
+ 14767,
297
+ 14817,
298
+ 14867,
299
+ 14917,
300
+ 14967,
301
+ 15017,
302
+ 15067,
303
+ 15117,
304
+ 15167,
305
+ 15217,
306
+ 15267,
307
+ 15317,
308
+ 15367,
309
+ 15417,
310
+ 15467,
311
+ 15517,
312
+ 15567,
313
+ 15617
314
+ ],
315
+ "loss": [
316
+ 16.28274154663086,
317
+ 5.540170669555664,
318
+ 6.775415420532227,
319
+ 7.807186603546143,
320
+ 9.381738662719727,
321
+ 10.969490051269531,
322
+ 10.444869995117188,
323
+ 10.054375648498535,
324
+ 8.876975059509277,
325
+ 7.385862350463867,
326
+ 6.720154762268066,
327
+ 5.888507843017578,
328
+ 5.069924831390381,
329
+ 4.413970470428467,
330
+ 4.091370582580566,
331
+ 3.9275927543640137,
332
+ 3.597487449645996,
333
+ 3.644043445587158,
334
+ 3.5632052421569824,
335
+ 3.4460277557373047,
336
+ 3.1855978965759277,
337
+ 3.4230589866638184,
338
+ 3.1606740951538086,
339
+ 3.182441234588623,
340
+ 3.3141112327575684,
341
+ 2.986382484436035,
342
+ 3.221864700317383,
343
+ 2.7190232276916504,
344
+ 2.959211587905884,
345
+ 3.123387098312378,
346
+ 2.808103084564209,
347
+ 3.1065189838409424,
348
+ 2.8977174758911133,
349
+ 3.1317670345306396,
350
+ 2.892608165740967,
351
+ 2.915052890777588,
352
+ 2.815518379211426,
353
+ 2.557642936706543,
354
+ 2.8139472007751465,
355
+ 2.9387216567993164,
356
+ 2.443659543991089,
357
+ 2.685591220855713,
358
+ 2.305596113204956,
359
+ 2.809103012084961,
360
+ 2.673182964324951,
361
+ 2.780465602874756,
362
+ 2.5513243675231934,
363
+ 2.5324931144714355,
364
+ 2.0034539699554443,
365
+ 2.344390869140625,
366
+ 2.150602102279663,
367
+ 2.395678997039795,
368
+ 2.310455322265625,
369
+ 2.3398852348327637,
370
+ 1.8025025129318237,
371
+ 2.0364208221435547,
372
+ 2.1480724811553955,
373
+ 1.9397914409637451,
374
+ 2.0974535942077637,
375
+ 2.267531156539917,
376
+ 2.0740933418273926,
377
+ 2.1916496753692627,
378
+ 0.9210824966430664,
379
+ 0.5328047275543213,
380
+ -0.03742372989654541,
381
+ -1.2958544492721558,
382
+ -1.9911248683929443,
383
+ -3.7487802505493164,
384
+ -4.078698635101318,
385
+ -4.745406150817871,
386
+ -5.1121978759765625,
387
+ -5.62625789642334,
388
+ -6.281767845153809,
389
+ -5.8938517570495605,
390
+ -5.597670555114746,
391
+ -5.640196323394775,
392
+ -5.883167743682861,
393
+ -5.6108574867248535,
394
+ -4.988748550415039,
395
+ -5.896568775177002,
396
+ -5.29911994934082,
397
+ -5.248095989227295,
398
+ -4.921140193939209,
399
+ -4.775120258331299,
400
+ -5.096627235412598,
401
+ -4.684965133666992,
402
+ -4.368593215942383,
403
+ -3.99047589302063,
404
+ -4.204165458679199,
405
+ -3.5383524894714355,
406
+ -3.862689733505249,
407
+ -3.3033714294433594,
408
+ -2.654770851135254,
409
+ -4.525285720825195,
410
+ -3.0260891914367676,
411
+ -2.738969326019287,
412
+ -2.811995267868042,
413
+ -3.2562503814697266,
414
+ -2.3418192863464355,
415
+ -3.116446018218994,
416
+ -2.609781265258789,
417
+ -3.0971579551696777,
418
+ -0.9029642343521118,
419
+ -2.7395613193511963,
420
+ -2.838641405105591,
421
+ -2.255490303039551,
422
+ -3.0321860313415527,
423
+ -1.458106517791748,
424
+ -1.9517803192138672,
425
+ -1.5932023525238037,
426
+ -1.8326020240783691,
427
+ -2.6090221405029297,
428
+ -2.3446717262268066,
429
+ -1.0041512250900269,
430
+ -1.532463788986206,
431
+ -1.2158831357955933,
432
+ -2.256141185760498,
433
+ -2.2466983795166016,
434
+ -1.8169989585876465,
435
+ -2.3416221141815186,
436
+ -1.766740083694458,
437
+ -1.8386216163635254,
438
+ -1.825034737586975,
439
+ -1.8314135074615479,
440
+ -1.1143181324005127,
441
+ -2.257542371749878,
442
+ -1.9196970462799072,
443
+ -1.6531178951263428,
444
+ -1.3443089723587036,
445
+ -1.216113805770874,
446
+ -1.194965124130249,
447
+ -1.7019418478012085,
448
+ -1.354518175125122,
449
+ -1.4456787109375,
450
+ -0.8984273076057434,
451
+ -1.4400514364242554,
452
+ -1.3528547286987305,
453
+ -0.9314453601837158,
454
+ -1.4572619199752808,
455
+ -1.126159906387329,
456
+ -1.3588547706604004,
457
+ -1.5057815313339233,
458
+ -1.2514081001281738,
459
+ -0.48061734437942505,
460
+ -1.2874188423156738,
461
+ -1.2596217393875122,
462
+ -1.026874303817749,
463
+ -1.3001481294631958,
464
+ -0.7930020093917847,
465
+ -1.502524733543396,
466
+ -1.2518855333328247,
467
+ -0.963351845741272,
468
+ -1.2755764722824097,
469
+ -0.9888055920600891,
470
+ -0.8977932929992676,
471
+ -1.0401407480239868,
472
+ -1.0860685110092163,
473
+ -0.9494705200195312,
474
+ -1.436676263809204,
475
+ -0.980256199836731,
476
+ -0.9127078056335449,
477
+ -0.9295126795768738,
478
+ -1.1240662336349487,
479
+ -1.308225393295288,
480
+ -1.0526622533798218,
481
+ -0.9832852482795715,
482
+ -0.6777130961418152,
483
+ -0.5491603016853333,
484
+ -1.2792612314224243,
485
+ -0.7567460536956787,
486
+ -0.7345216274261475,
487
+ -0.931378960609436,
488
+ -1.0858885049819946,
489
+ -0.9426130056381226,
490
+ -1.132487177848816,
491
+ -1.269047737121582,
492
+ -0.9801985025405884,
493
+ -0.9577396512031555,
494
+ -0.9174380302429199,
495
+ -0.9476673603057861,
496
+ -0.9074362516403198,
497
+ -1.01382577419281,
498
+ -0.6530601382255554,
499
+ -1.0053731203079224,
500
+ -0.85746169090271,
501
+ -0.9764938950538635,
502
+ -0.8527376055717468,
503
+ -1.1913673877716064,
504
+ -1.0628403425216675,
505
+ -1.010689616203308,
506
+ -1.0420571565628052,
507
+ -1.2670626640319824,
508
+ -1.0489301681518555,
509
+ -1.476209044456482,
510
+ -0.7085262537002563,
511
+ -1.0096030235290527,
512
+ -0.9678630828857422,
513
+ -0.8825294375419617,
514
+ -0.8680270910263062,
515
+ -1.4723944664001465,
516
+ -0.5348420739173889,
517
+ -0.5407968163490295,
518
+ -1.1955978870391846,
519
+ -0.8696709275245667,
520
+ -0.998271644115448,
521
+ -0.8704187870025635,
522
+ -1.025557279586792,
523
+ -0.5137739181518555,
524
+ -1.0028613805770874,
525
+ -0.7887760400772095,
526
+ -0.8884354829788208,
527
+ -1.544988751411438,
528
+ -1.0478770732879639,
529
+ -1.0589046478271484,
530
+ -1.423649787902832,
531
+ -1.346470594406128,
532
+ -0.7388043403625488,
533
+ -0.950998842716217,
534
+ -1.0140622854232788,
535
+ -0.913789689540863,
536
+ -1.0420395135879517,
537
+ -1.023274540901184,
538
+ -1.045817255973816,
539
+ -1.155444860458374,
540
+ -1.1306260824203491,
541
+ -0.6776385307312012,
542
+ -0.7011786699295044,
543
+ -1.334304690361023,
544
+ -1.3645905256271362,
545
+ -1.1866199970245361,
546
+ -1.0871729850769043,
547
+ -0.9968757033348083,
548
+ -1.0070263147354126,
549
+ -1.3208439350128174,
550
+ -1.0825363397598267,
551
+ -1.2156729698181152,
552
+ -1.5994991064071655,
553
+ -1.1699426174163818,
554
+ -1.2325425148010254,
555
+ -1.551932692527771,
556
+ -0.8055230975151062,
557
+ -0.9251660704612732,
558
+ -1.285549283027649,
559
+ -1.6701040267944336,
560
+ -1.0110410451889038,
561
+ -1.5398916006088257,
562
+ -0.8088244199752808,
563
+ -1.0506784915924072,
564
+ -1.3399046659469604,
565
+ -1.2484153509140015,
566
+ -1.1578189134597778,
567
+ -1.1194970607757568,
568
+ -1.094886302947998,
569
+ -1.690836787223816,
570
+ -0.8785786628723145,
571
+ -1.3069560527801514,
572
+ -1.1893820762634277,
573
+ -1.1490076780319214,
574
+ -1.384873628616333,
575
+ -0.9505579471588135,
576
+ -1.1507246494293213,
577
+ -1.1267321109771729,
578
+ -1.1957576274871826,
579
+ -1.3316500186920166,
580
+ -1.088510274887085,
581
+ -1.4421019554138184,
582
+ -1.0149816274642944,
583
+ -1.0990639925003052,
584
+ -1.0213133096694946,
585
+ -1.3298611640930176,
586
+ -1.2966575622558594,
587
+ -1.4341070652008057,
588
+ -1.242478847503662,
589
+ -1.3080660104751587,
590
+ -1.0835931301116943,
591
+ -0.9934505820274353,
592
+ -1.5340348482131958,
593
+ -1.549197793006897,
594
+ -1.4818686246871948,
595
+ -1.4660003185272217,
596
+ -1.0767110586166382,
597
+ -1.234635591506958,
598
+ -1.1799765825271606,
599
+ -1.2203795909881592,
600
+ -1.4335767030715942,
601
+ -1.0706619024276733,
602
+ -1.1721309423446655,
603
+ -1.5047404766082764,
604
+ -1.1540157794952393,
605
+ -1.3545101881027222,
606
+ -0.8991901874542236,
607
+ -1.2084336280822754,
608
+ -0.9482430219650269,
609
+ -1.0421302318572998,
610
+ -1.5079543590545654,
611
+ -1.1981526613235474,
612
+ -1.2378123998641968,
613
+ -1.5786161422729492,
614
+ -1.2765175104141235,
615
+ -1.5619491338729858,
616
+ -1.1734968423843384,
617
+ -1.5895291566848755,
618
+ -1.4394630193710327,
619
+ -1.1113046407699585,
620
+ -1.4897830486297607,
621
+ -1.5032153129577637,
622
+ -1.0263656377792358,
623
+ -0.968646764755249,
624
+ -1.7087695598602295,
625
+ -0.9967091083526611
626
+ ],
627
+ "base_loss": [
628
+ 11.919148445129395,
629
+ 11.712471008300781,
630
+ 11.401796340942383,
631
+ 10.933218955993652,
632
+ 10.320596694946289,
633
+ 9.511163711547852,
634
+ 8.804636001586914,
635
+ 8.224196434020996,
636
+ 7.224529266357422,
637
+ 6.05776834487915,
638
+ 5.158497333526611,
639
+ 4.23229455947876,
640
+ 3.593045473098755,
641
+ 2.9647161960601807,
642
+ 2.6388473510742188,
643
+ 2.4015965461730957,
644
+ 2.2090916633605957,
645
+ 2.208362102508545,
646
+ 2.0944769382476807,
647
+ 2.0746800899505615,
648
+ 2.00931715965271,
649
+ 2.021466016769409,
650
+ 2.0564398765563965,
651
+ 1.939684510231018,
652
+ 1.9386273622512817,
653
+ 1.888741135597229,
654
+ 1.9201011657714844,
655
+ 1.8141651153564453,
656
+ 1.8398933410644531,
657
+ 1.8827736377716064,
658
+ 1.8586024045944214,
659
+ 1.9333986043930054,
660
+ 1.897300124168396,
661
+ 1.8588038682937622,
662
+ 1.9004508256912231,
663
+ 1.8095324039459229,
664
+ 1.893649935722351,
665
+ 1.9098756313323975,
666
+ 1.9035409688949585,
667
+ 1.823283076286316,
668
+ 1.8070026636123657,
669
+ 1.9187535047531128,
670
+ 1.8444538116455078,
671
+ 1.8281522989273071,
672
+ 1.7837480306625366,
673
+ 1.899887204170227,
674
+ 1.8322093486785889,
675
+ 1.8817052841186523,
676
+ 1.846428632736206,
677
+ 1.8482989072799683,
678
+ 1.920029640197754,
679
+ 1.8435605764389038,
680
+ 1.8243188858032227,
681
+ 1.832368016242981,
682
+ 1.851176381111145,
683
+ 1.802765965461731,
684
+ 1.7245272397994995,
685
+ 1.7926665544509888,
686
+ 1.8278177976608276,
687
+ 1.8894437551498413,
688
+ 1.8149478435516357,
689
+ 1.8408777713775635,
690
+ 1.7879098653793335,
691
+ 1.8937746286392212,
692
+ 1.8526757955551147,
693
+ 1.82782781124115,
694
+ 1.8439241647720337,
695
+ 1.8362096548080444,
696
+ 1.844258427619934,
697
+ 1.7638307809829712,
698
+ 1.7990596294403076,
699
+ 1.7790606021881104,
700
+ 1.7944040298461914,
701
+ 1.7255467176437378,
702
+ 1.6491506099700928,
703
+ 1.6426500082015991,
704
+ 1.6298809051513672,
705
+ 1.5767576694488525,
706
+ 1.5220197439193726,
707
+ 1.6187695264816284,
708
+ 1.5979760885238647,
709
+ 1.4917420148849487,
710
+ 1.485482931137085,
711
+ 1.4504286050796509,
712
+ 1.4805594682693481,
713
+ 1.4392255544662476,
714
+ 1.3809515237808228,
715
+ 1.367879867553711,
716
+ 1.3364511728286743,
717
+ 1.2636011838912964,
718
+ 1.30233633518219,
719
+ 1.2523545026779175,
720
+ 1.158416509628296,
721
+ 1.3363336324691772,
722
+ 1.1729052066802979,
723
+ 1.1867791414260864,
724
+ 1.1456400156021118,
725
+ 1.1837338209152222,
726
+ 1.0774470567703247,
727
+ 1.177153468132019,
728
+ 1.0712212324142456,
729
+ 1.1321731805801392,
730
+ 0.8989397883415222,
731
+ 1.0842927694320679,
732
+ 1.1380772590637207,
733
+ 1.0632250308990479,
734
+ 1.1286226511001587,
735
+ 0.9986239671707153,
736
+ 0.9940967559814453,
737
+ 0.9673513770103455,
738
+ 0.9583966135978699,
739
+ 1.0217516422271729,
740
+ 1.043201208114624,
741
+ 0.856368899345398,
742
+ 0.920617938041687,
743
+ 0.872459352016449,
744
+ 0.9523282051086426,
745
+ 0.9214135408401489,
746
+ 0.8750053644180298,
747
+ 0.894688069820404,
748
+ 0.8571006059646606,
749
+ 0.8104948401451111,
750
+ 0.8283589482307434,
751
+ 0.8048704266548157,
752
+ 0.6931681632995605,
753
+ 0.8597663044929504,
754
+ 0.8563704490661621,
755
+ 0.7519769668579102,
756
+ 0.7527551054954529,
757
+ 0.7053692936897278,
758
+ 0.7427781820297241,
759
+ 0.7440962791442871,
760
+ 0.7218002676963806,
761
+ 0.7397311329841614,
762
+ 0.6547626256942749,
763
+ 0.7235930562019348,
764
+ 0.7188329696655273,
765
+ 0.6374866366386414,
766
+ 0.695144534111023,
767
+ 0.6721176505088806,
768
+ 0.6877056360244751,
769
+ 0.7002540230751038,
770
+ 0.6525031924247742,
771
+ 0.5708634257316589,
772
+ 0.6753590703010559,
773
+ 0.6607192158699036,
774
+ 0.6464635729789734,
775
+ 0.653294026851654,
776
+ 0.6221825480461121,
777
+ 0.6701773405075073,
778
+ 0.6161959767341614,
779
+ 0.6116393208503723,
780
+ 0.6640933752059937,
781
+ 0.6056033372879028,
782
+ 0.5704834461212158,
783
+ 0.6159607768058777,
784
+ 0.6038890480995178,
785
+ 0.6191163063049316,
786
+ 0.6200740933418274,
787
+ 0.5866245627403259,
788
+ 0.6012955904006958,
789
+ 0.5644311308860779,
790
+ 0.6018303632736206,
791
+ 0.6254978775978088,
792
+ 0.6019884943962097,
793
+ 0.6134956479072571,
794
+ 0.5368608832359314,
795
+ 0.5497142672538757,
796
+ 0.6003592610359192,
797
+ 0.5710440874099731,
798
+ 0.5597032308578491,
799
+ 0.5748957395553589,
800
+ 0.5628146529197693,
801
+ 0.5685555338859558,
802
+ 0.5940120816230774,
803
+ 0.574928343296051,
804
+ 0.5729753375053406,
805
+ 0.5881057977676392,
806
+ 0.5648398995399475,
807
+ 0.5493632555007935,
808
+ 0.5613466501235962,
809
+ 0.5757318735122681,
810
+ 0.5404321551322937,
811
+ 0.5661589503288269,
812
+ 0.5393258929252625,
813
+ 0.5560475587844849,
814
+ 0.5709224939346313,
815
+ 0.5478270649909973,
816
+ 0.5310960412025452,
817
+ 0.510890007019043,
818
+ 0.5301312804222107,
819
+ 0.5633818507194519,
820
+ 0.5569104552268982,
821
+ 0.5721749067306519,
822
+ 0.5167989730834961,
823
+ 0.5295454859733582,
824
+ 0.5481741428375244,
825
+ 0.4657522737979889,
826
+ 0.513382077217102,
827
+ 0.5558506846427917,
828
+ 0.4801826775074005,
829
+ 0.4515341818332672,
830
+ 0.5078088641166687,
831
+ 0.5079418420791626,
832
+ 0.4744904041290283,
833
+ 0.5114633440971375,
834
+ 0.48083963990211487,
835
+ 0.4864089787006378,
836
+ 0.5075017213821411,
837
+ 0.4670749008655548,
838
+ 0.5124925971031189,
839
+ 0.5444943308830261,
840
+ 0.48026639223098755,
841
+ 0.5228786468505859,
842
+ 0.5363203883171082,
843
+ 0.49465709924697876,
844
+ 0.5207586288452148,
845
+ 0.4996943175792694,
846
+ 0.5098710656166077,
847
+ 0.5180677771568298,
848
+ 0.44347116351127625,
849
+ 0.5016202330589294,
850
+ 0.46924081444740295,
851
+ 0.4860851466655731,
852
+ 0.49279502034187317,
853
+ 0.44735997915267944,
854
+ 0.4221813380718231,
855
+ 0.4918827712535858,
856
+ 0.49178367853164673,
857
+ 0.48495641350746155,
858
+ 0.48869290947914124,
859
+ 0.4592805504798889,
860
+ 0.46563562750816345,
861
+ 0.5303858518600464,
862
+ 0.47391048073768616,
863
+ 0.4904748499393463,
864
+ 0.5385576486587524,
865
+ 0.49158334732055664,
866
+ 0.4710582196712494,
867
+ 0.5327602028846741,
868
+ 0.458906888961792,
869
+ 0.4368543028831482,
870
+ 0.4965294301509857,
871
+ 0.5137410759925842,
872
+ 0.46738097071647644,
873
+ 0.4764968752861023,
874
+ 0.4679408669471741,
875
+ 0.4773694574832916,
876
+ 0.4808627665042877,
877
+ 0.5116496682167053,
878
+ 0.49025028944015503,
879
+ 0.4609079957008362,
880
+ 0.46923965215682983,
881
+ 0.4925435185432434,
882
+ 0.4423721730709076,
883
+ 0.4723752439022064,
884
+ 0.4821006953716278,
885
+ 0.4392525851726532,
886
+ 0.4597508907318115,
887
+ 0.4585941433906555,
888
+ 0.453828364610672,
889
+ 0.43628570437431335,
890
+ 0.4857936501502991,
891
+ 0.4496951699256897,
892
+ 0.47560811042785645,
893
+ 0.5053812861442566,
894
+ 0.41853663325309753,
895
+ 0.45380905270576477,
896
+ 0.4250417649745941,
897
+ 0.4768609404563904,
898
+ 0.4845709502696991,
899
+ 0.5037023425102234,
900
+ 0.4682858884334564,
901
+ 0.44493526220321655,
902
+ 0.4778483211994171,
903
+ 0.4533351957798004,
904
+ 0.47540754079818726,
905
+ 0.5056682825088501,
906
+ 0.5049258470535278,
907
+ 0.4170120656490326,
908
+ 0.4253399968147278,
909
+ 0.4467671811580658,
910
+ 0.435434490442276,
911
+ 0.47085121273994446,
912
+ 0.4235445559024811,
913
+ 0.4327235817909241,
914
+ 0.4594845771789551,
915
+ 0.48848652839660645,
916
+ 0.4533780515193939,
917
+ 0.46535059809684753,
918
+ 0.3864735960960388,
919
+ 0.47652027010917664,
920
+ 0.43212202191352844,
921
+ 0.46275147795677185,
922
+ 0.4903310239315033,
923
+ 0.48137861490249634,
924
+ 0.47230079770088196,
925
+ 0.4315291941165924,
926
+ 0.4502604603767395,
927
+ 0.47259607911109924,
928
+ 0.43375158309936523,
929
+ 0.47321611642837524,
930
+ 0.4843279719352722,
931
+ 0.40902772545814514,
932
+ 0.43668094277381897,
933
+ 0.48824581503868103,
934
+ 0.4492872655391693,
935
+ 0.4369087815284729,
936
+ 0.48378390073776245,
937
+ 0.4564586281776428
938
+ ],
939
+ "info_loss": [
940
+ -0.5122928619384766,
941
+ -1.5516386032104492,
942
+ -1.3631782531738281,
943
+ -1.153665542602539,
944
+ -0.8245782852172852,
945
+ -0.4422922134399414,
946
+ -0.2909421920776367,
947
+ -0.16642475128173828,
948
+ -0.1158132553100586,
949
+ -0.10533332824707031,
950
+ -0.061872005462646484,
951
+ -0.042049407958984375,
952
+ -0.05414772033691406,
953
+ -0.05299186706542969,
954
+ -0.05021357536315918,
955
+ -0.040880441665649414,
956
+ -0.053603410720825195,
957
+ -0.04790902137756348,
958
+ -0.0438995361328125,
959
+ -0.053289175033569336,
960
+ -0.07236289978027344,
961
+ -0.04931437969207764,
962
+ -0.07886946201324463,
963
+ -0.06484067440032959,
964
+ -0.05133175849914551,
965
+ -0.07906532287597656,
966
+ -0.05845069885253906,
967
+ -0.09797036647796631,
968
+ -0.07637512683868408,
969
+ -0.0641258955001831,
970
+ -0.09331917762756348,
971
+ -0.07079529762268066,
972
+ -0.0879737138748169,
973
+ -0.06091618537902832,
974
+ -0.08890426158905029,
975
+ -0.07740592956542969,
976
+ -0.09558463096618652,
977
+ -0.12296092510223389,
978
+ -0.09653604030609131,
979
+ -0.07610416412353516,
980
+ -0.12391853332519531,
981
+ -0.11074912548065186,
982
+ -0.14138221740722656,
983
+ -0.08941447734832764,
984
+ -0.09848332405090332,
985
+ -0.09921717643737793,
986
+ -0.11567354202270508,
987
+ -0.12235105037689209,
988
+ -0.17184650897979736,
989
+ -0.1377655267715454,
990
+ -0.16433262825012207,
991
+ -0.13210749626159668,
992
+ -0.13878023624420166,
993
+ -0.13659119606018066,
994
+ -0.192283034324646,
995
+ -0.16389799118041992,
996
+ -0.1449146270751953,
997
+ -0.1726670265197754,
998
+ -0.16052234172821045,
999
+ -0.1495753526687622,
1000
+ -0.1610504388809204,
1001
+ -0.15235579013824463,
1002
+ -0.27394044399261475,
1003
+ -0.32341551780700684,
1004
+ -0.3764849901199341,
1005
+ -0.4997999668121338,
1006
+ -0.5710752010345459,
1007
+ -0.7459827661514282,
1008
+ -0.7797424793243408,
1009
+ -0.8384594321250916,
1010
+ -0.8787723183631897,
1011
+ -0.9284245371818542,
1012
+ -0.9954951405525208,
1013
+ -0.9495471119880676,
1014
+ -0.9122193455696106,
1015
+ -0.9159963726997375,
1016
+ -0.9387544989585876,
1017
+ -0.9063917398452759,
1018
+ -0.8386374115943909,
1019
+ -0.9387176036834717,
1020
+ -0.877072811126709,
1021
+ -0.861398458480835,
1022
+ -0.8278194665908813,
1023
+ -0.8095294833183289,
1024
+ -0.8443809151649475,
1025
+ -0.7982234954833984,
1026
+ -0.7608359456062317,
1027
+ -0.7209914922714233,
1028
+ -0.73811274766922,
1029
+ -0.6635478138923645,
1030
+ -0.7001921534538269,
1031
+ -0.6366941928863525,
1032
+ -0.5615365505218506,
1033
+ -0.7640740871429443,
1034
+ -0.5945991277694702,
1035
+ -0.5647491812705994,
1036
+ -0.5606909394264221,
1037
+ -0.60567706823349,
1038
+ -0.5021160244941711,
1039
+ -0.5846680402755737,
1040
+ -0.5185971260070801,
1041
+ -0.5730209946632385,
1042
+ -0.32896584272384644,
1043
+ -0.5262376666069031,
1044
+ -0.5439128279685974,
1045
+ -0.4771316647529602,
1046
+ -0.5557167530059814,
1047
+ -0.38420867919921875,
1048
+ -0.43295836448669434,
1049
+ -0.38912397623062134,
1050
+ -0.4045712351799011,
1051
+ -0.48948174715042114,
1052
+ -0.46194642782211304,
1053
+ -0.3053744435310364,
1054
+ -0.3629930019378662,
1055
+ -0.32027655839920044,
1056
+ -0.4272693395614624,
1057
+ -0.41490650177001953,
1058
+ -0.3576827049255371,
1059
+ -0.3799964189529419,
1060
+ -0.3033410310745239,
1061
+ -0.29865723848342896,
1062
+ -0.2957419753074646,
1063
+ -0.28839749097824097,
1064
+ -0.20266690850257874,
1065
+ -0.33067524433135986,
1066
+ -0.2956508994102478,
1067
+ -0.2551272213459015,
1068
+ -0.22240173816680908,
1069
+ -0.2055770456790924,
1070
+ -0.20341724157333374,
1071
+ -0.2561242878437042,
1072
+ -0.21663248538970947,
1073
+ -0.2259421944618225,
1074
+ -0.1624666452407837,
1075
+ -0.22259438037872314,
1076
+ -0.21354800462722778,
1077
+ -0.16300204396247864,
1078
+ -0.22107869386672974,
1079
+ -0.1860055923461914,
1080
+ -0.20955437421798706,
1081
+ -0.22589048743247986,
1082
+ -0.1959669291973114,
1083
+ -0.10984751582145691,
1084
+ -0.20102742314338684,
1085
+ -0.19643616676330566,
1086
+ -0.17150172591209412,
1087
+ -0.19943103194236755,
1088
+ -0.14573311805725098,
1089
+ -0.22132399678230286,
1090
+ -0.1903863251209259,
1091
+ -0.16109827160835266,
1092
+ -0.19741639494895935,
1093
+ -0.1631738245487213,
1094
+ -0.15011829137802124,
1095
+ -0.16891643404960632,
1096
+ -0.17245212197303772,
1097
+ -0.16002443432807922,
1098
+ -0.2092139720916748,
1099
+ -0.1599329710006714,
1100
+ -0.15464594960212708,
1101
+ -0.15251758694648743,
1102
+ -0.17557546496391296,
1103
+ -0.19633162021636963,
1104
+ -0.1685791313648224,
1105
+ -0.16263535618782043,
1106
+ -0.12430834770202637,
1107
+ -0.11275553703308105,
1108
+ -0.19035077095031738,
1109
+ -0.13514643907546997,
1110
+ -0.13221633434295654,
1111
+ -0.15303298830986023,
1112
+ -0.16763857007026672,
1113
+ -0.153389573097229,
1114
+ -0.17510443925857544,
1115
+ -0.18734610080718994,
1116
+ -0.1579020917415619,
1117
+ -0.15737786889076233,
1118
+ -0.15064692497253418,
1119
+ -0.1520923376083374,
1120
+ -0.14940080046653748,
1121
+ -0.16139566898345947,
1122
+ -0.12160366773605347,
1123
+ -0.15956392884254456,
1124
+ -0.14217829704284668,
1125
+ -0.15582504868507385,
1126
+ -0.14486056566238403,
1127
+ -0.17638611793518066,
1128
+ -0.16162094473838806,
1129
+ -0.1543361246585846,
1130
+ -0.16008815169334412,
1131
+ -0.1853637397289276,
1132
+ -0.16270965337753296,
1133
+ -0.20722848176956177,
1134
+ -0.12509414553642273,
1135
+ -0.15633845329284668,
1136
+ -0.1540389358997345,
1137
+ -0.13750392198562622,
1138
+ -0.14044985175132751,
1139
+ -0.20483553409576416,
1140
+ -0.10373833775520325,
1141
+ -0.10184478759765625,
1142
+ -0.172575443983078,
1143
+ -0.14007321000099182,
1144
+ -0.14945897459983826,
1145
+ -0.1404052972793579,
1146
+ -0.152730792760849,
1147
+ -0.10212671756744385,
1148
+ -0.1529337763786316,
1149
+ -0.127879798412323,
1150
+ -0.1424349546432495,
1151
+ -0.21103012561798096,
1152
+ -0.15508770942687988,
1153
+ -0.15998724102973938,
1154
+ -0.1981440782546997,
1155
+ -0.1862243115901947,
1156
+ -0.1281237006187439,
1157
+ -0.14692631363868713,
1158
+ -0.15421628952026367,
1159
+ -0.14520686864852905,
1160
+ -0.15066051483154297,
1161
+ -0.15450742840766907,
1162
+ -0.15343132615089417,
1163
+ -0.16613245010375977,
1164
+ -0.16409596800804138,
1165
+ -0.11432722210884094,
1166
+ -0.11421123147010803,
1167
+ -0.18463900685310364,
1168
+ -0.18734890222549438,
1169
+ -0.16918796300888062,
1170
+ -0.15925583243370056,
1171
+ -0.1474195420742035,
1172
+ -0.1491110920906067,
1173
+ -0.18679744005203247,
1174
+ -0.15791112184524536,
1175
+ -0.17218095064163208,
1176
+ -0.21555030345916748,
1177
+ -0.16788247227668762,
1178
+ -0.1722114384174347,
1179
+ -0.21009600162506104,
1180
+ -0.12838611006736755,
1181
+ -0.13789871335029602,
1182
+ -0.17999035120010376,
1183
+ -0.22030878067016602,
1184
+ -0.14931786060333252,
1185
+ -0.2031676471233368,
1186
+ -0.12927794456481934,
1187
+ -0.1543930172920227,
1188
+ -0.1843828558921814,
1189
+ -0.17761895060539246,
1190
+ -0.16687500476837158,
1191
+ -0.15976238250732422,
1192
+ -0.15819570422172546,
1193
+ -0.21991482377052307,
1194
+ -0.1340363323688507,
1195
+ -0.17997759580612183,
1196
+ -0.16866591572761536,
1197
+ -0.1605042815208435,
1198
+ -0.18598440289497375,
1199
+ -0.14341828227043152,
1200
+ -0.16240501403808594,
1201
+ -0.15829381346702576,
1202
+ -0.170151948928833,
1203
+ -0.18039092421531677,
1204
+ -0.1584518551826477,
1205
+ -0.19656941294670105,
1206
+ -0.1448628008365631,
1207
+ -0.15722376108169556,
1208
+ -0.14663025736808777,
1209
+ -0.18290838599205017,
1210
+ -0.18007683753967285,
1211
+ -0.19539517164230347,
1212
+ -0.17280912399291992,
1213
+ -0.1770569384098053,
1214
+ -0.15808513760566711,
1215
+ -0.14639171957969666,
1216
+ -0.20306676626205444,
1217
+ -0.20717424154281616,
1218
+ -0.20062395930290222,
1219
+ -0.19005045294761658,
1220
+ -0.15200906991958618,
1221
+ -0.16988474130630493,
1222
+ -0.16308468580245972,
1223
+ -0.17086553573608398,
1224
+ -0.18767157196998596,
1225
+ -0.15205052495002747,
1226
+ -0.16452553868293762,
1227
+ -0.20128098130226135,
1228
+ -0.16243231296539307,
1229
+ -0.18381425738334656,
1230
+ -0.13005176186561584,
1231
+ -0.1700531542301178,
1232
+ -0.13999903202056885,
1233
+ -0.15237721800804138,
1234
+ -0.20155087113380432,
1235
+ -0.1697521209716797,
1236
+ -0.17272937297821045,
1237
+ -0.20261144638061523,
1238
+ -0.17432692646980286,
1239
+ -0.20601502060890198,
1240
+ -0.16243943572044373,
1241
+ -0.20787155628204346,
1242
+ -0.19462677836418152,
1243
+ -0.15376442670822144,
1244
+ -0.19422279298305511,
1245
+ -0.20074373483657837,
1246
+ -0.14949074387550354,
1247
+ -0.14244553446769714,
1248
+ -0.22162041068077087,
1249
+ -0.14706194400787354
1250
+ ],
1251
+ "abs_loss": [
1252
+ 2.30220627784729,
1253
+ 2.3020200729370117,
1254
+ 2.297327995300293,
1255
+ 2.2975962162017822,
1256
+ 2.2630834579467773,
1257
+ 2.1765191555023193,
1258
+ 2.123943328857422,
1259
+ 2.0272209644317627,
1260
+ 1.9570759534835815,
1261
+ 1.8993927240371704,
1262
+ 1.8774352073669434,
1263
+ 1.8407106399536133,
1264
+ 1.8518379926681519,
1265
+ 1.8436359167099,
1266
+ 1.845046877861023,
1267
+ 1.8325690031051636,
1268
+ 1.8535631895065308,
1269
+ 1.8499723672866821,
1270
+ 1.835213303565979,
1271
+ 1.8594293594360352,
1272
+ 1.8574610948562622,
1273
+ 1.8389066457748413,
1274
+ 1.8507661819458008,
1275
+ 1.8515948057174683,
1276
+ 1.8454355001449585,
1277
+ 1.8561534881591797,
1278
+ 1.845703125,
1279
+ 1.8434991836547852,
1280
+ 1.8420748710632324,
1281
+ 1.8435863256454468,
1282
+ 1.8560940027236938,
1283
+ 1.8485981225967407,
1284
+ 1.8486992120742798,
1285
+ 1.8742297887802124,
1286
+ 1.8725115060806274,
1287
+ 1.8573325872421265,
1288
+ 1.8474016189575195,
1289
+ 1.8484903573989868,
1290
+ 1.8386249542236328,
1291
+ 1.84671151638031,
1292
+ 1.84579598903656,
1293
+ 1.8375964164733887,
1294
+ 1.8452197313308716,
1295
+ 1.8531140089035034,
1296
+ 1.8446292877197266,
1297
+ 1.8264933824539185,
1298
+ 1.8640602827072144,
1299
+ 1.8490185737609863,
1300
+ 1.868327260017395,
1301
+ 1.8535445928573608,
1302
+ 1.856315016746521,
1303
+ 1.8500362634658813,
1304
+ 1.8605047464370728,
1305
+ 1.8563438653945923,
1306
+ 1.863081932067871,
1307
+ 1.8476206064224243,
1308
+ 1.8537397384643555,
1309
+ 1.8645648956298828,
1310
+ 1.8775514364242554,
1311
+ 1.872701644897461,
1312
+ 1.826413631439209,
1313
+ 1.87376070022583,
1314
+ 1.8578802347183228,
1315
+ 1.8532167673110962,
1316
+ 1.8531559705734253,
1317
+ 1.8359180688858032,
1318
+ 1.8477325439453125,
1319
+ 1.8424381017684937,
1320
+ 1.8202654123306274,
1321
+ 1.8252969980239868,
1322
+ 1.8118122816085815,
1323
+ 1.8221300840377808,
1324
+ 1.8383985757827759,
1325
+ 1.814188003540039,
1326
+ 1.8050581216812134,
1327
+ 1.8271727561950684,
1328
+ 1.8115495443344116,
1329
+ 1.8208309412002563,
1330
+ 1.8224992752075195,
1331
+ 1.7885686159133911,
1332
+ 1.8172053098678589,
1333
+ 1.8242207765579224,
1334
+ 1.781652808189392,
1335
+ 1.7958316802978516,
1336
+ 1.7497321367263794,
1337
+ 1.6994233131408691,
1338
+ 1.7205805778503418,
1339
+ 1.6366468667984009,
1340
+ 1.6002146005630493,
1341
+ 1.5582994222640991,
1342
+ 1.5827299356460571,
1343
+ 1.509191870689392,
1344
+ 1.4383163452148438,
1345
+ 1.4367347955703735,
1346
+ 1.406564712524414,
1347
+ 1.3681570291519165,
1348
+ 1.294526219367981,
1349
+ 1.298731803894043,
1350
+ 1.2309962511062622,
1351
+ 1.2631953954696655,
1352
+ 1.1647754907608032,
1353
+ 1.1826599836349487,
1354
+ 1.0763381719589233,
1355
+ 1.0743846893310547,
1356
+ 1.0138899087905884,
1357
+ 1.0309642553329468,
1358
+ 0.9761902689933777,
1359
+ 0.9385819435119629,
1360
+ 0.9262393116950989,
1361
+ 0.8900609612464905,
1362
+ 0.8606628775596619,
1363
+ 0.8834860920906067,
1364
+ 0.8591017723083496,
1365
+ 0.8360124230384827,
1366
+ 0.8466210961341858,
1367
+ 0.8035519123077393,
1368
+ 0.7717851996421814,
1369
+ 0.7324153780937195,
1370
+ 0.7430999875068665,
1371
+ 0.663157045841217,
1372
+ 0.579663097858429,
1373
+ 0.590882420539856,
1374
+ 0.4899749457836151,
1375
+ 0.42981043457984924,
1376
+ 0.3855685889720917,
1377
+ 0.3650515377521515,
1378
+ 0.37482357025146484,
1379
+ 0.3443257808685303,
1380
+ 0.30352234840393066,
1381
+ 0.28127261996269226,
1382
+ 0.2570037543773651,
1383
+ 0.3061806261539459,
1384
+ 0.2609253227710724,
1385
+ 0.2383844405412674,
1386
+ 0.23392409086227417,
1387
+ 0.21278218924999237,
1388
+ 0.192348912358284,
1389
+ 0.23301690816879272,
1390
+ 0.22875840961933136,
1391
+ 0.24034100770950317,
1392
+ 0.20219844579696655,
1393
+ 0.2178707867860794,
1394
+ 0.25147247314453125,
1395
+ 0.2048385888338089,
1396
+ 0.2242809385061264,
1397
+ 0.20598942041397095,
1398
+ 0.18407393991947174,
1399
+ 0.18724918365478516,
1400
+ 0.18019075691699982,
1401
+ 0.2085704356431961,
1402
+ 0.16213588416576385,
1403
+ 0.17696678638458252,
1404
+ 0.14809666574001312,
1405
+ 0.20376606285572052,
1406
+ 0.16643618047237396,
1407
+ 0.1456851363182068,
1408
+ 0.18702729046344757,
1409
+ 0.16643057763576508,
1410
+ 0.17797093093395233,
1411
+ 0.15991371870040894,
1412
+ 0.1893058568239212,
1413
+ 0.17376239597797394,
1414
+ 0.15261325240135193,
1415
+ 0.1522006094455719,
1416
+ 0.15499384701251984,
1417
+ 0.15997610986232758,
1418
+ 0.14652855694293976,
1419
+ 0.16963058710098267,
1420
+ 0.13568313419818878,
1421
+ 0.13720117509365082,
1422
+ 0.14347034692764282,
1423
+ 0.14355270564556122,
1424
+ 0.12020000070333481,
1425
+ 0.12870250642299652,
1426
+ 0.14079205691814423,
1427
+ 0.14627568423748016,
1428
+ 0.14523349702358246,
1429
+ 0.16484005749225616,
1430
+ 0.148054301738739,
1431
+ 0.12204431742429733,
1432
+ 0.15206502377986908,
1433
+ 0.15463918447494507,
1434
+ 0.1306764781475067,
1435
+ 0.1207970678806305,
1436
+ 0.12553805112838745,
1437
+ 0.14228498935699463,
1438
+ 0.147186279296875,
1439
+ 0.1415950208902359,
1440
+ 0.1278122514486313,
1441
+ 0.129094198346138,
1442
+ 0.15491041541099548,
1443
+ 0.12417280673980713,
1444
+ 0.1242339238524437,
1445
+ 0.13601131737232208,
1446
+ 0.15513616800308228,
1447
+ 0.14911571145057678,
1448
+ 0.14021626114845276,
1449
+ 0.17228679358959198,
1450
+ 0.13032789528369904,
1451
+ 0.11838573217391968,
1452
+ 0.137715145945549,
1453
+ 0.1384749859571457,
1454
+ 0.13859133422374725,
1455
+ 0.14485764503479004,
1456
+ 0.11818784475326538,
1457
+ 0.13123421370983124,
1458
+ 0.12958703935146332,
1459
+ 0.1267758011817932,
1460
+ 0.10699955374002457,
1461
+ 0.1424816995859146,
1462
+ 0.14492733776569366,
1463
+ 0.10705948621034622,
1464
+ 0.12976239621639252,
1465
+ 0.10851290076971054,
1466
+ 0.12955591082572937,
1467
+ 0.13322141766548157,
1468
+ 0.1473109871149063,
1469
+ 0.11619482189416885,
1470
+ 0.11685353517532349,
1471
+ 0.12639732658863068,
1472
+ 0.1312195062637329,
1473
+ 0.13004010915756226,
1474
+ 0.11790201812982559,
1475
+ 0.12968654930591583,
1476
+ 0.11069496721029282,
1477
+ 0.12438997626304626,
1478
+ 0.11898013204336166,
1479
+ 0.11301834136247635,
1480
+ 0.10852862149477005,
1481
+ 0.11908483505249023,
1482
+ 0.10862568765878677,
1483
+ 0.11315381526947021,
1484
+ 0.11340445280075073,
1485
+ 0.0969037413597107,
1486
+ 0.12072455883026123,
1487
+ 0.08743100613355637,
1488
+ 0.11405970901250839,
1489
+ 0.10019014030694962,
1490
+ 0.11408897489309311,
1491
+ 0.09264203161001205,
1492
+ 0.11636162549257278,
1493
+ 0.09496424347162247,
1494
+ 0.10413985699415207,
1495
+ 0.09757804870605469,
1496
+ 0.09539119154214859,
1497
+ 0.09494751691818237,
1498
+ 0.0990312322974205,
1499
+ 0.08711335808038712,
1500
+ 0.12296789884567261,
1501
+ 0.09684770554304123,
1502
+ 0.13839595019817352,
1503
+ 0.09724470227956772,
1504
+ 0.10947561264038086,
1505
+ 0.09647106379270554,
1506
+ 0.11810692399740219,
1507
+ 0.11985272169113159,
1508
+ 0.1006196141242981,
1509
+ 0.10797067731618881,
1510
+ 0.09806424379348755,
1511
+ 0.15405064821243286,
1512
+ 0.11215709894895554,
1513
+ 0.11806517839431763,
1514
+ 0.12899713218212128,
1515
+ 0.12938092648983002,
1516
+ 0.12541724741458893,
1517
+ 0.11123824119567871,
1518
+ 0.09091644734144211,
1519
+ 0.11897752434015274,
1520
+ 0.12166506797075272,
1521
+ 0.13964661955833435,
1522
+ 0.11252722144126892,
1523
+ 0.07851729542016983,
1524
+ 0.11848396062850952,
1525
+ 0.11142794042825699,
1526
+ 0.12281394749879837,
1527
+ 0.11238782852888107,
1528
+ 0.10896693915128708,
1529
+ 0.0830840915441513,
1530
+ 0.14158326387405396,
1531
+ 0.11600643396377563,
1532
+ 0.10813343524932861,
1533
+ 0.1154547929763794,
1534
+ 0.10305937379598618,
1535
+ 0.11556471139192581,
1536
+ 0.11196726560592651,
1537
+ 0.10859853029251099,
1538
+ 0.08421885967254639,
1539
+ 0.12609051167964935,
1540
+ 0.12067227810621262,
1541
+ 0.1107231080532074,
1542
+ 0.09186488389968872,
1543
+ 0.1024598702788353,
1544
+ 0.1175227239727974,
1545
+ 0.11402594298124313,
1546
+ 0.10557401180267334,
1547
+ 0.11264423280954361,
1548
+ 0.10926514863967896,
1549
+ 0.09633132070302963,
1550
+ 0.09248441457748413,
1551
+ 0.12294084578752518,
1552
+ 0.11626702547073364,
1553
+ 0.10222375392913818,
1554
+ 0.14843891561031342,
1555
+ 0.10241835564374924,
1556
+ 0.10109380632638931,
1557
+ 0.10363570600748062,
1558
+ 0.11592870950698853,
1559
+ 0.1175919771194458,
1560
+ 0.13479028642177582,
1561
+ 0.11085989326238632
1562
+ ],
1563
+ "zipf_loss": [
1564
+ 9.25629997253418,
1565
+ 9.113883972167969,
1566
+ 8.77566909790039,
1567
+ 8.180863380432129,
1568
+ 7.0806169509887695,
1569
+ 5.663597106933594,
1570
+ 4.337262153625488,
1571
+ 3.2917046546936035,
1572
+ 2.61487078666687,
1573
+ 2.1914877891540527,
1574
+ 1.9926340579986572,
1575
+ 1.8926360607147217,
1576
+ 1.8331726789474487,
1577
+ 1.794809341430664,
1578
+ 1.7701541185379028,
1579
+ 1.7515437602996826,
1580
+ 1.739073634147644,
1581
+ 1.7297742366790771,
1582
+ 1.7242025136947632,
1583
+ 1.7182966470718384,
1584
+ 1.7141635417938232,
1585
+ 1.710845947265625,
1586
+ 1.7078521251678467,
1587
+ 1.7060041427612305,
1588
+ 1.704257845878601,
1589
+ 1.7026792764663696,
1590
+ 1.701700210571289,
1591
+ 1.700212001800537,
1592
+ 1.698862075805664,
1593
+ 1.6975138187408447,
1594
+ 1.6970831155776978,
1595
+ 1.6962134838104248,
1596
+ 1.6952847242355347,
1597
+ 1.6947020292282104,
1598
+ 1.6939486265182495,
1599
+ 1.693846344947815,
1600
+ 1.69297456741333,
1601
+ 1.692527413368225,
1602
+ 1.691904067993164,
1603
+ 1.691809058189392,
1604
+ 1.6912626028060913,
1605
+ 1.690569281578064,
1606
+ 1.6904425621032715,
1607
+ 1.689784049987793,
1608
+ 1.6898051500320435,
1609
+ 1.6901007890701294,
1610
+ 1.6894444227218628,
1611
+ 1.6893965005874634,
1612
+ 1.6886576414108276,
1613
+ 1.6883928775787354,
1614
+ 1.6882672309875488,
1615
+ 1.6881897449493408,
1616
+ 1.687888264656067,
1617
+ 1.687794804573059,
1618
+ 1.6878483295440674,
1619
+ 1.6878726482391357,
1620
+ 1.6873174905776978,
1621
+ 1.6873385906219482,
1622
+ 1.6871039867401123,
1623
+ 1.6865707635879517,
1624
+ 1.6870085000991821,
1625
+ 1.6869537830352783,
1626
+ 1.6867890357971191,
1627
+ 1.6878635883331299,
1628
+ 1.6894347667694092,
1629
+ 1.6907254457473755,
1630
+ 1.690929889678955,
1631
+ 1.6905936002731323,
1632
+ 1.6924415826797485,
1633
+ 1.6928272247314453,
1634
+ 1.695284128189087,
1635
+ 1.6967144012451172,
1636
+ 1.694939374923706,
1637
+ 1.6946533918380737,
1638
+ 1.6948661804199219,
1639
+ 1.6943997144699097,
1640
+ 1.6933411359786987,
1641
+ 1.6942189931869507,
1642
+ 1.6933562755584717,
1643
+ 1.692981243133545,
1644
+ 1.691911220550537,
1645
+ 1.6917247772216797,
1646
+ 1.6934055089950562,
1647
+ 1.690163016319275,
1648
+ 1.6916500329971313,
1649
+ 1.6881015300750732,
1650
+ 1.6867563724517822,
1651
+ 1.687894582748413,
1652
+ 1.6804893016815186,
1653
+ 1.677694320678711,
1654
+ 1.6786224842071533,
1655
+ 1.66029691696167,
1656
+ 1.6583465337753296,
1657
+ 1.6354482173919678,
1658
+ 1.6063408851623535,
1659
+ 1.5849279165267944,
1660
+ 1.5198214054107666,
1661
+ 1.4869130849838257,
1662
+ 1.4787943363189697,
1663
+ 1.4267616271972656,
1664
+ 1.388491153717041,
1665
+ 1.382612705230713,
1666
+ 1.3801206350326538,
1667
+ 1.3310840129852295,
1668
+ 1.361020803451538,
1669
+ 1.3495047092437744,
1670
+ 1.2987399101257324,
1671
+ 1.2914981842041016,
1672
+ 1.2910826206207275,
1673
+ 1.2416796684265137,
1674
+ 1.1686475276947021,
1675
+ 1.1756948232650757,
1676
+ 1.145681381225586,
1677
+ 1.109622836112976,
1678
+ 1.0921859741210938,
1679
+ 1.0340677499771118,
1680
+ 0.9870457053184509,
1681
+ 0.9077117443084717,
1682
+ 0.8105127215385437,
1683
+ 0.49733835458755493,
1684
+ 0.35160329937934875,
1685
+ 0.2783675789833069,
1686
+ 0.2550288736820221,
1687
+ 0.204709991812706,
1688
+ 0.18062588572502136,
1689
+ 0.15293851494789124,
1690
+ 0.14295929670333862,
1691
+ 0.111744724214077,
1692
+ 0.09660103917121887,
1693
+ 0.10616008937358856,
1694
+ 0.07072888314723969,
1695
+ 0.08458662033081055,
1696
+ 0.06391380727291107,
1697
+ 0.05017360299825668,
1698
+ 0.04808410629630089,
1699
+ 0.04102107137441635,
1700
+ 0.04455728828907013,
1701
+ 0.03778674453496933,
1702
+ 0.035504624247550964,
1703
+ 0.03774411976337433,
1704
+ 0.028763601556420326,
1705
+ 0.031082438305020332,
1706
+ 0.030610807240009308,
1707
+ 0.026510609313845634,
1708
+ 0.02506830170750618,
1709
+ 0.02342185378074646,
1710
+ 0.023272011429071426,
1711
+ 0.022143229842185974,
1712
+ 0.02412751503288746,
1713
+ 0.01968076452612877,
1714
+ 0.019568171352148056,
1715
+ 0.018294809386134148,
1716
+ 0.01968454197049141,
1717
+ 0.016952721402049065,
1718
+ 0.01626252755522728,
1719
+ 0.018494293093681335,
1720
+ 0.015860913321375847,
1721
+ 0.015014398843050003,
1722
+ 0.017592284828424454,
1723
+ 0.016457468271255493,
1724
+ 0.013525411486625671,
1725
+ 0.01385575719177723,
1726
+ 0.01459679938852787,
1727
+ 0.01437290757894516,
1728
+ 0.015641123056411743,
1729
+ 0.013575077056884766,
1730
+ 0.013856668025255203,
1731
+ 0.011717746034264565,
1732
+ 0.010318949818611145,
1733
+ 0.009954124689102173,
1734
+ 0.013591472059488297,
1735
+ 0.009699998423457146,
1736
+ 0.01566248945891857,
1737
+ 0.009856930933892727,
1738
+ 0.010465888306498528,
1739
+ 0.014857380650937557,
1740
+ 0.011323727667331696,
1741
+ 0.011449144221842289,
1742
+ 0.009385891258716583,
1743
+ 0.011688325554132462,
1744
+ 0.010018651373684406,
1745
+ 0.008935090154409409,
1746
+ 0.009476731531322002,
1747
+ 0.012027375400066376,
1748
+ 0.012441577389836311,
1749
+ 0.01148046925663948,
1750
+ 0.010226914659142494,
1751
+ 0.010507284663617611,
1752
+ 0.009491976350545883,
1753
+ 0.00887216255068779,
1754
+ 0.013202084228396416,
1755
+ 0.010775596834719181,
1756
+ 0.008832613006234169,
1757
+ 0.01029958575963974,
1758
+ 0.010102668777108192,
1759
+ 0.009324377402663231,
1760
+ 0.0103304423391819,
1761
+ 0.00952884741127491,
1762
+ 0.010056620463728905,
1763
+ 0.008271623402833939,
1764
+ 0.008587063290178776,
1765
+ 0.012269444763660431,
1766
+ 0.008488515391945839,
1767
+ 0.00863351859152317,
1768
+ 0.010008974932134151,
1769
+ 0.009047441184520721,
1770
+ 0.00795239768922329,
1771
+ 0.008406748995184898,
1772
+ 0.008274702355265617,
1773
+ 0.0086989039555192,
1774
+ 0.00892874039709568,
1775
+ 0.01011211983859539,
1776
+ 0.00975743681192398,
1777
+ 0.00723780132830143,
1778
+ 0.008514976128935814,
1779
+ 0.007793372496962547,
1780
+ 0.006942924112081528,
1781
+ 0.006950372830033302,
1782
+ 0.006544264033436775,
1783
+ 0.007571442984044552,
1784
+ 0.007972478866577148,
1785
+ 0.007175290957093239,
1786
+ 0.007465004920959473,
1787
+ 0.006825858727097511,
1788
+ 0.006469130516052246,
1789
+ 0.00583464652299881,
1790
+ 0.006854185834527016,
1791
+ 0.00890059769153595,
1792
+ 0.00626189261674881,
1793
+ 0.008394716307520866,
1794
+ 0.0058298781514167786,
1795
+ 0.006723964586853981,
1796
+ 0.007108468562364578,
1797
+ 0.007054171059280634,
1798
+ 0.010591959580779076,
1799
+ 0.006918659433722496,
1800
+ 0.006040392443537712,
1801
+ 0.007279671728610992,
1802
+ 0.007104609161615372,
1803
+ 0.0070029450580477715,
1804
+ 0.0077950600534677505,
1805
+ 0.00747024267911911,
1806
+ 0.007410754449665546,
1807
+ 0.009484970942139626,
1808
+ 0.0052174897864460945,
1809
+ 0.005793213844299316,
1810
+ 0.006111042574048042,
1811
+ 0.007170870900154114,
1812
+ 0.010764367878437042,
1813
+ 0.006439785473048687,
1814
+ 0.00684114545583725,
1815
+ 0.007494371384382248,
1816
+ 0.006883546710014343,
1817
+ 0.0061207786202430725,
1818
+ 0.007601674646139145,
1819
+ 0.008459338918328285,
1820
+ 0.005114257335662842,
1821
+ 0.005985446274280548,
1822
+ 0.005413053557276726,
1823
+ 0.00962575152516365,
1824
+ 0.008281432092189789,
1825
+ 0.008113802410662174,
1826
+ 0.007068503648042679,
1827
+ 0.009625975042581558,
1828
+ 0.00785838533192873,
1829
+ 0.007087072357535362,
1830
+ 0.006018038839101791,
1831
+ 0.007466768845915794,
1832
+ 0.00778102595359087,
1833
+ 0.008397052995860577,
1834
+ 0.0082870963960886,
1835
+ 0.008290646597743034,
1836
+ 0.00547797791659832,
1837
+ 0.006425101310014725,
1838
+ 0.007128441706299782,
1839
+ 0.005892768502235413,
1840
+ 0.01032860204577446,
1841
+ 0.008568023331463337,
1842
+ 0.005286820232868195,
1843
+ 0.005891531705856323,
1844
+ 0.007226178422570229,
1845
+ 0.005899136886000633,
1846
+ 0.005129905417561531,
1847
+ 0.005868119187653065,
1848
+ 0.008397690951824188,
1849
+ 0.006259960122406483,
1850
+ 0.0052178893238306046,
1851
+ 0.006973759271204472,
1852
+ 0.004862101748585701,
1853
+ 0.007209576666355133,
1854
+ 0.005667243152856827,
1855
+ 0.0053315721452236176,
1856
+ 0.007873043417930603,
1857
+ 0.007487917318940163,
1858
+ 0.006665840744972229,
1859
+ 0.0067255739122629166,
1860
+ 0.006254076957702637,
1861
+ 0.006335965357720852,
1862
+ 0.00724283792078495,
1863
+ 0.013310916721820831,
1864
+ 0.005519290454685688,
1865
+ 0.005747945047914982,
1866
+ 0.00763280875980854,
1867
+ 0.0070700617507100105,
1868
+ 0.005654546432197094,
1869
+ 0.005612436681985855,
1870
+ 0.007661543786525726,
1871
+ 0.007140662521123886,
1872
+ 0.01017164345830679,
1873
+ 0.006365802139043808
1874
+ ],
1875
+ "denoise_loss": [],
1876
+ "ortho_loss": [
1877
+ 0.8612614274024963,
1878
+ 0.8016671538352966,
1879
+ 0.6376562118530273,
1880
+ 0.5529548525810242,
1881
+ 0.487213134765625,
1882
+ 0.4188559353351593,
1883
+ 0.3968985676765442,
1884
+ 0.36472076177597046,
1885
+ 0.3819717466831207,
1886
+ 0.3449137508869171,
1887
+ 0.3558287024497986,
1888
+ 0.3638819456100464,
1889
+ 0.3564022481441498,
1890
+ 0.35707730054855347,
1891
+ 0.35364609956741333,
1892
+ 0.35979828238487244,
1893
+ 0.37180295586586,
1894
+ 0.34970489144325256,
1895
+ 0.36201927065849304,
1896
+ 0.35735681653022766,
1897
+ 0.3490956425666809,
1898
+ 0.3370121717453003,
1899
+ 0.3661976456642151,
1900
+ 0.35761991143226624,
1901
+ 0.35063067078590393,
1902
+ 0.37178748846054077,
1903
+ 0.3578042984008789,
1904
+ 0.36101120710372925,
1905
+ 0.35397353768348694,
1906
+ 0.355873703956604,
1907
+ 0.36221230030059814,
1908
+ 0.34353312849998474,
1909
+ 0.3402397632598877,
1910
+ 0.36903098225593567,
1911
+ 0.36701905727386475,
1912
+ 0.37839940190315247,
1913
+ 0.3693663775920868,
1914
+ 0.37097227573394775,
1915
+ 0.3770667612552643,
1916
+ 0.3849909007549286,
1917
+ 0.3801876902580261,
1918
+ 0.37918296456336975,
1919
+ 0.3857121765613556,
1920
+ 0.3716696798801422,
1921
+ 0.3718411326408386,
1922
+ 0.38376492261886597,
1923
+ 0.39209532737731934,
1924
+ 0.38883596658706665,
1925
+ 0.38426607847213745,
1926
+ 0.395708292722702,
1927
+ 0.40130382776260376,
1928
+ 0.4030826985836029,
1929
+ 0.40030035376548767,
1930
+ 0.4057621657848358,
1931
+ 0.4034087359905243,
1932
+ 0.3974243402481079,
1933
+ 0.3926997482776642,
1934
+ 0.379551500082016,
1935
+ 0.3717574179172516,
1936
+ 0.35956549644470215,
1937
+ 0.360320121049881,
1938
+ 0.35186290740966797,
1939
+ 0.33709487318992615,
1940
+ 0.3470607101917267,
1941
+ 0.3481311798095703,
1942
+ 0.3570297360420227,
1943
+ 0.36510586738586426,
1944
+ 0.3691912293434143,
1945
+ 0.3768906593322754,
1946
+ 0.3805363178253174,
1947
+ 0.38554590940475464,
1948
+ 0.3948875963687897,
1949
+ 0.39736804366111755,
1950
+ 0.40309232473373413,
1951
+ 0.40349623560905457,
1952
+ 0.40225210785865784,
1953
+ 0.40144655108451843,
1954
+ 0.4063461422920227,
1955
+ 0.4068640172481537,
1956
+ 0.40520644187927246,
1957
+ 0.404690682888031,
1958
+ 0.4063727557659149,
1959
+ 0.4051498472690582,
1960
+ 0.40500056743621826,
1961
+ 0.40960177779197693,
1962
+ 0.4152390956878662,
1963
+ 0.42116326093673706,
1964
+ 0.42314326763153076,
1965
+ 0.4235926866531372,
1966
+ 0.42154932022094727,
1967
+ 0.42305120825767517,
1968
+ 0.4258868098258972,
1969
+ 0.4293067753314972,
1970
+ 0.43354400992393494,
1971
+ 0.43590062856674194,
1972
+ 0.43892383575439453,
1973
+ 0.44140514731407166,
1974
+ 0.4361226558685303,
1975
+ 0.43728816509246826,
1976
+ 0.43766650557518005,
1977
+ 0.4426195025444031,
1978
+ 0.4439590871334076,
1979
+ 0.44415393471717834,
1980
+ 0.4427838623523712,
1981
+ 0.4461572468280792,
1982
+ 0.4409407079219818,
1983
+ 0.4392300248146057,
1984
+ 0.4358401894569397,
1985
+ 0.4353138506412506,
1986
+ 0.43288812041282654,
1987
+ 0.4336419999599457,
1988
+ 0.4324011206626892,
1989
+ 0.4309177100658417,
1990
+ 0.4308708608150482,
1991
+ 0.4289792478084564,
1992
+ 0.42820799350738525,
1993
+ 0.4287213683128357,
1994
+ 0.42741137742996216,
1995
+ 0.42075255513191223,
1996
+ 0.41462472081184387,
1997
+ 0.413504421710968,
1998
+ 0.4214182198047638,
1999
+ 0.42003247141838074,
2000
+ 0.42020121216773987,
2001
+ 0.4176969826221466,
2002
+ 0.41551828384399414,
2003
+ 0.40811267495155334,
2004
+ 0.4051038920879364,
2005
+ 0.4008391499519348,
2006
+ 0.3953404128551483,
2007
+ 0.39215317368507385,
2008
+ 0.3891485631465912,
2009
+ 0.38752493262290955,
2010
+ 0.3828921914100647,
2011
+ 0.3794485926628113,
2012
+ 0.37573060393333435,
2013
+ 0.375820130109787,
2014
+ 0.3753224015235901,
2015
+ 0.3725639581680298,
2016
+ 0.3697616755962372,
2017
+ 0.3674364686012268,
2018
+ 0.3632788062095642,
2019
+ 0.3605678081512451,
2020
+ 0.35727590322494507,
2021
+ 0.35582369565963745,
2022
+ 0.35303837060928345,
2023
+ 0.3514127731323242,
2024
+ 0.35009339451789856,
2025
+ 0.34657740592956543,
2026
+ 0.34629932045936584,
2027
+ 0.3432376980781555,
2028
+ 0.34238681197166443,
2029
+ 0.3385182023048401,
2030
+ 0.3360331356525421,
2031
+ 0.3332003355026245,
2032
+ 0.33170008659362793,
2033
+ 0.32806873321533203,
2034
+ 0.3252578675746918,
2035
+ 0.319923996925354,
2036
+ 0.3184064030647278,
2037
+ 0.3158026933670044,
2038
+ 0.313507080078125,
2039
+ 0.3140915334224701,
2040
+ 0.310560941696167,
2041
+ 0.3052983582019806,
2042
+ 0.3057887554168701,
2043
+ 0.30279409885406494,
2044
+ 0.3015226423740387,
2045
+ 0.29875221848487854,
2046
+ 0.29937052726745605,
2047
+ 0.2992631494998932,
2048
+ 0.2975480556488037,
2049
+ 0.30423617362976074,
2050
+ 0.2999492287635803,
2051
+ 0.29561981558799744,
2052
+ 0.2912825345993042,
2053
+ 0.291506290435791,
2054
+ 0.2906370759010315,
2055
+ 0.28881019353866577,
2056
+ 0.287432998418808,
2057
+ 0.28537631034851074,
2058
+ 0.2833746373653412,
2059
+ 0.28295084834098816,
2060
+ 0.2816351354122162,
2061
+ 0.27952811121940613,
2062
+ 0.27837491035461426,
2063
+ 0.27690204977989197,
2064
+ 0.2759683430194855,
2065
+ 0.2742611765861511,
2066
+ 0.27653852105140686,
2067
+ 0.27665194869041443,
2068
+ 0.27422529458999634,
2069
+ 0.27421310544013977,
2070
+ 0.27777519822120667,
2071
+ 0.2767961919307709,
2072
+ 0.27734461426734924,
2073
+ 0.2787007987499237,
2074
+ 0.27804240584373474,
2075
+ 0.27716201543807983,
2076
+ 0.2739870250225067,
2077
+ 0.27515217661857605,
2078
+ 0.2748262286186218,
2079
+ 0.27342671155929565,
2080
+ 0.2726982533931732,
2081
+ 0.27094531059265137,
2082
+ 0.2709236741065979,
2083
+ 0.27097347378730774,
2084
+ 0.2701936662197113,
2085
+ 0.2681817412376404,
2086
+ 0.2733210325241089,
2087
+ 0.273675799369812,
2088
+ 0.27300065755844116,
2089
+ 0.2739092707633972,
2090
+ 0.2736546993255615,
2091
+ 0.2735222280025482,
2092
+ 0.27190786600112915,
2093
+ 0.2713083326816559,
2094
+ 0.27074316143989563,
2095
+ 0.2763568162918091,
2096
+ 0.27521294355392456,
2097
+ 0.2762555480003357,
2098
+ 0.274553507566452,
2099
+ 0.2755734920501709,
2100
+ 0.27438685297966003,
2101
+ 0.2749340236186981,
2102
+ 0.2759014666080475,
2103
+ 0.2753879129886627,
2104
+ 0.27383914589881897,
2105
+ 0.27310097217559814,
2106
+ 0.2731490731239319,
2107
+ 0.27343255281448364,
2108
+ 0.2724662125110626,
2109
+ 0.27148714661598206,
2110
+ 0.27072814106941223,
2111
+ 0.2711607813835144,
2112
+ 0.27134573459625244,
2113
+ 0.27197426557540894,
2114
+ 0.27125847339630127,
2115
+ 0.2720467448234558,
2116
+ 0.2709692418575287,
2117
+ 0.2728133201599121,
2118
+ 0.2733900547027588,
2119
+ 0.2739672064781189,
2120
+ 0.27517881989479065,
2121
+ 0.27605023980140686,
2122
+ 0.27582859992980957,
2123
+ 0.27701157331466675,
2124
+ 0.27726224064826965,
2125
+ 0.2775222957134247,
2126
+ 0.27851271629333496,
2127
+ 0.27983158826828003,
2128
+ 0.27902233600616455,
2129
+ 0.2787399888038635,
2130
+ 0.2786222994327545,
2131
+ 0.2784559428691864,
2132
+ 0.2796696722507477,
2133
+ 0.28023970127105713,
2134
+ 0.28060993552207947,
2135
+ 0.2802201807498932,
2136
+ 0.2800673544406891,
2137
+ 0.2804716229438782,
2138
+ 0.2805470824241638,
2139
+ 0.2807961106300354,
2140
+ 0.28189617395401,
2141
+ 0.2826630175113678,
2142
+ 0.2827717959880829,
2143
+ 0.28256848454475403,
2144
+ 0.2831490933895111,
2145
+ 0.2828967571258545,
2146
+ 0.2823440134525299,
2147
+ 0.28238457441329956,
2148
+ 0.2812761068344116,
2149
+ 0.28100937604904175,
2150
+ 0.28174257278442383,
2151
+ 0.28244441747665405,
2152
+ 0.282766193151474,
2153
+ 0.2822505235671997,
2154
+ 0.28302276134490967,
2155
+ 0.2834620177745819,
2156
+ 0.2831602096557617,
2157
+ 0.2831542491912842,
2158
+ 0.28293392062187195,
2159
+ 0.2828397750854492,
2160
+ 0.2833317220211029,
2161
+ 0.28331828117370605,
2162
+ 0.2841479778289795,
2163
+ 0.2836388051509857,
2164
+ 0.28366315364837646,
2165
+ 0.28394338488578796,
2166
+ 0.284136027097702,
2167
+ 0.28456246852874756,
2168
+ 0.28469717502593994,
2169
+ 0.28498443961143494,
2170
+ 0.2851629853248596,
2171
+ 0.2855220437049866,
2172
+ 0.28587767481803894,
2173
+ 0.28608614206314087,
2174
+ 0.28616443276405334,
2175
+ 0.28624650835990906,
2176
+ 0.28685617446899414,
2177
+ 0.28658923506736755,
2178
+ 0.28667718172073364,
2179
+ 0.2866398096084595,
2180
+ 0.2867295742034912,
2181
+ 0.28634944558143616,
2182
+ 0.28670117259025574,
2183
+ 0.28687241673469543,
2184
+ 0.2867128252983093,
2185
+ 0.2871307134628296,
2186
+ 0.2871498167514801
2187
+ ],
2188
+ "lr": [
2189
+ 2.0940170940170946e-06,
2190
+ 4.230769230769231e-06,
2191
+ 6.367521367521369e-06,
2192
+ 8.504273504273505e-06,
2193
+ 1.0641025641025641e-05,
2194
+ 1.2777777777777779e-05,
2195
+ 1.4914529914529916e-05,
2196
+ 1.7051282051282053e-05,
2197
+ 1.918803418803419e-05,
2198
+ 2e-05,
2199
+ 2e-05,
2200
+ 2e-05,
2201
+ 2e-05,
2202
+ 2e-05,
2203
+ 2e-05,
2204
+ 2e-05,
2205
+ 2e-05,
2206
+ 2e-05,
2207
+ 2e-05,
2208
+ 2e-05,
2209
+ 2e-05,
2210
+ 2e-05,
2211
+ 2e-05,
2212
+ 2e-05,
2213
+ 2e-05,
2214
+ 2e-05,
2215
+ 2e-05,
2216
+ 2e-05,
2217
+ 2e-05,
2218
+ 2e-05,
2219
+ 2e-05,
2220
+ 2e-05,
2221
+ 2e-05,
2222
+ 2e-05,
2223
+ 2e-05,
2224
+ 2e-05,
2225
+ 2e-05,
2226
+ 2e-05,
2227
+ 2e-05,
2228
+ 2e-05,
2229
+ 2e-05,
2230
+ 2e-05,
2231
+ 2e-05,
2232
+ 2e-05,
2233
+ 2e-05,
2234
+ 2e-05,
2235
+ 2e-05,
2236
+ 2e-05,
2237
+ 2e-05,
2238
+ 2e-05,
2239
+ 2e-05,
2240
+ 2e-05,
2241
+ 2e-05,
2242
+ 2e-05,
2243
+ 2e-05,
2244
+ 2e-05,
2245
+ 2e-05,
2246
+ 2e-05,
2247
+ 2e-05,
2248
+ 2e-05,
2249
+ 2e-05,
2250
+ 2e-05,
2251
+ 2e-05,
2252
+ 2e-05,
2253
+ 2e-05,
2254
+ 2e-05,
2255
+ 2e-05,
2256
+ 2e-05,
2257
+ 2e-05,
2258
+ 2e-05,
2259
+ 2e-05,
2260
+ 2e-05,
2261
+ 2e-05,
2262
+ 2e-05,
2263
+ 2e-05,
2264
+ 2e-05,
2265
+ 2e-05,
2266
+ 2e-05,
2267
+ 2e-05,
2268
+ 2e-05,
2269
+ 2e-05,
2270
+ 2e-05,
2271
+ 2e-05,
2272
+ 2e-05,
2273
+ 2e-05,
2274
+ 2e-05,
2275
+ 2e-05,
2276
+ 2e-05,
2277
+ 2e-05,
2278
+ 2e-05,
2279
+ 2e-05,
2280
+ 2e-05,
2281
+ 2e-05,
2282
+ 2e-05,
2283
+ 2e-05,
2284
+ 2e-05,
2285
+ 2e-05,
2286
+ 2e-05,
2287
+ 2e-05,
2288
+ 2e-05,
2289
+ 2e-05,
2290
+ 2e-05,
2291
+ 2e-05,
2292
+ 2e-05,
2293
+ 2e-05,
2294
+ 2e-05,
2295
+ 2e-05,
2296
+ 2e-05,
2297
+ 2e-05,
2298
+ 2e-05,
2299
+ 2e-05,
2300
+ 2e-05,
2301
+ 2e-05,
2302
+ 2e-05,
2303
+ 2e-05,
2304
+ 2e-05,
2305
+ 2e-05,
2306
+ 2e-05,
2307
+ 2e-05,
2308
+ 2e-05,
2309
+ 2e-05,
2310
+ 2e-05,
2311
+ 2e-05,
2312
+ 2e-05,
2313
+ 2e-05,
2314
+ 2e-05,
2315
+ 2e-05,
2316
+ 2e-05,
2317
+ 2e-05,
2318
+ 2e-05,
2319
+ 2e-05,
2320
+ 2e-05,
2321
+ 2e-05,
2322
+ 2e-05,
2323
+ 2e-05,
2324
+ 2e-05,
2325
+ 2e-05,
2326
+ 2e-05,
2327
+ 2e-05,
2328
+ 2e-05,
2329
+ 2e-05,
2330
+ 2e-05,
2331
+ 2e-05,
2332
+ 2e-05,
2333
+ 2e-05,
2334
+ 2e-05,
2335
+ 2e-05,
2336
+ 2e-05,
2337
+ 2e-05,
2338
+ 2e-05,
2339
+ 2e-05,
2340
+ 2e-05,
2341
+ 2e-05,
2342
+ 2e-05,
2343
+ 2e-05,
2344
+ 2e-05,
2345
+ 2e-05,
2346
+ 2e-05,
2347
+ 2e-05,
2348
+ 2e-05,
2349
+ 2e-05,
2350
+ 2e-05,
2351
+ 2e-05,
2352
+ 2e-05,
2353
+ 2e-05,
2354
+ 2e-05,
2355
+ 2e-05,
2356
+ 2e-05,
2357
+ 2e-05,
2358
+ 2e-05,
2359
+ 2e-05,
2360
+ 2e-05,
2361
+ 2e-05,
2362
+ 2e-05,
2363
+ 2e-05,
2364
+ 2e-05,
2365
+ 2e-05,
2366
+ 2e-05,
2367
+ 2e-05,
2368
+ 2e-05,
2369
+ 2e-05,
2370
+ 2e-05,
2371
+ 2e-05,
2372
+ 2e-05,
2373
+ 2e-05,
2374
+ 2e-05,
2375
+ 2e-05,
2376
+ 2e-05,
2377
+ 2e-05,
2378
+ 1.9964978235061336e-05,
2379
+ 1.981658092599921e-05,
2380
+ 1.966818361693708e-05,
2381
+ 1.951978630787495e-05,
2382
+ 1.9371388998812825e-05,
2383
+ 1.9222991689750693e-05,
2384
+ 1.9074594380688566e-05,
2385
+ 1.8926197071626434e-05,
2386
+ 1.8777799762564307e-05,
2387
+ 1.8629402453502176e-05,
2388
+ 1.8481005144440044e-05,
2389
+ 1.8332607835377923e-05,
2390
+ 1.8184210526315792e-05,
2391
+ 1.803581321725366e-05,
2392
+ 1.7887415908191533e-05,
2393
+ 1.7739018599129406e-05,
2394
+ 1.7590621290067274e-05,
2395
+ 1.7442223981005143e-05,
2396
+ 1.729382667194302e-05,
2397
+ 1.7145429362880888e-05,
2398
+ 1.6997032053818757e-05,
2399
+ 1.6848634744756632e-05,
2400
+ 1.67002374356945e-05,
2401
+ 1.655184012663237e-05,
2402
+ 1.640344281757024e-05,
2403
+ 1.6255045508508114e-05,
2404
+ 1.6106648199445983e-05,
2405
+ 1.5958250890383856e-05,
2406
+ 1.5771270280965573e-05,
2407
+ 1.562287297190344e-05,
2408
+ 1.5474475662841314e-05,
2409
+ 1.532607835377919e-05,
2410
+ 1.5177681044717056e-05,
2411
+ 1.5029283735654927e-05,
2412
+ 1.48808864265928e-05,
2413
+ 1.4732489117530668e-05,
2414
+ 1.4584091808468539e-05,
2415
+ 1.4435694499406409e-05,
2416
+ 1.4287297190344285e-05,
2417
+ 1.4138899881282154e-05,
2418
+ 1.3990502572220024e-05,
2419
+ 1.3842105263157896e-05,
2420
+ 1.3693707954095765e-05,
2421
+ 1.3545310645033636e-05,
2422
+ 1.3396913335971506e-05,
2423
+ 1.3248516026909382e-05,
2424
+ 1.310011871784725e-05,
2425
+ 1.2951721408785121e-05,
2426
+ 1.2803324099722994e-05,
2427
+ 1.2654926790660862e-05,
2428
+ 1.2506529481598733e-05,
2429
+ 1.2358132172536607e-05,
2430
+ 1.220973486347448e-05,
2431
+ 1.2061337554412346e-05,
2432
+ 1.1912940245350217e-05,
2433
+ 1.176454293628809e-05,
2434
+ 1.1616145627225958e-05,
2435
+ 1.146774831816383e-05,
2436
+ 1.1319351009101704e-05,
2437
+ 1.113237039968342e-05,
2438
+ 1.098397309062129e-05,
2439
+ 1.0835575781559164e-05,
2440
+ 1.0687178472497033e-05,
2441
+ 1.0538781163434902e-05,
2442
+ 1.0390383854372777e-05,
2443
+ 1.0241986545310648e-05,
2444
+ 1.0093589236248515e-05,
2445
+ 9.945191927186385e-06,
2446
+ 9.79679461812426e-06,
2447
+ 9.64839730906213e-06,
2448
+ 9.499999999999999e-06,
2449
+ 9.351602690937873e-06,
2450
+ 9.203205381875743e-06,
2451
+ 9.054808072813612e-06,
2452
+ 8.906410763751483e-06,
2453
+ 8.758013454689357e-06,
2454
+ 8.609616145627227e-06,
2455
+ 8.461218836565096e-06,
2456
+ 8.31282152750297e-06,
2457
+ 8.16442421844084e-06,
2458
+ 8.01602690937871e-06,
2459
+ 7.86762960031658e-06,
2460
+ 7.719232291254454e-06,
2461
+ 7.5708349821923235e-06,
2462
+ 7.422437673130192e-06,
2463
+ 7.274040364068067e-06,
2464
+ 7.125643055005938e-06,
2465
+ 6.977245745943806e-06,
2466
+ 6.828848436881681e-06,
2467
+ 6.68045112781955e-06,
2468
+ 6.493470518401265e-06,
2469
+ 6.345073209339139e-06,
2470
+ 6.196675900277009e-06,
2471
+ 6.048278591214878e-06,
2472
+ 5.899881282152753e-06,
2473
+ 5.7514839730906225e-06,
2474
+ 5.603086664028492e-06,
2475
+ 5.454689354966362e-06,
2476
+ 5.306292045904236e-06,
2477
+ 5.157894736842106e-06,
2478
+ 5.009497427779974e-06,
2479
+ 4.86110011871785e-06,
2480
+ 4.712702809655719e-06,
2481
+ 4.5643055005935885e-06,
2482
+ 4.415908191531458e-06,
2483
+ 4.267510882469333e-06,
2484
+ 4.119113573407203e-06,
2485
+ 3.9707162643450716e-06,
2486
+ 3.822318955282946e-06,
2487
+ 3.673921646220816e-06,
2488
+ 3.5255243371586857e-06,
2489
+ 3.377127028096555e-06,
2490
+ 3.22872971903443e-06,
2491
+ 3.080332409972299e-06,
2492
+ 2.9319351009101688e-06,
2493
+ 2.783537791848043e-06,
2494
+ 2.635140482785913e-06,
2495
+ 2.4867431737237825e-06,
2496
+ 2.338345864661657e-06,
2497
+ 2.1899485555995266e-06,
2498
+ 2.041551246537396e-06
2499
+ ],
2500
+ "emb_lr": [],
2501
+ "eval_step": [
2502
+ 1550,
2503
+ 3113,
2504
+ 4676,
2505
+ 6239,
2506
+ 7802,
2507
+ 9365,
2508
+ 10928,
2509
+ 12491,
2510
+ 14054,
2511
+ 15617
2512
+ ],
2513
+ "eval_accuracy": [
2514
+ 0.0,
2515
+ 0.01,
2516
+ 0.0,
2517
+ 0.0,
2518
+ 0.0,
2519
+ 0.0,
2520
+ 0.0,
2521
+ 0.0,
2522
+ 0.0,
2523
+ 0.0
2524
+ ]
2525
+ },
2526
+ "final_accuracy": 0.25666666666666665,
2527
+ "sft_eval": {
2528
+ "config": {
2529
+ "ops": "add_sub",
2530
+ "K": null,
2531
+ "mode": "sft",
2532
+ "n_digits": 6,
2533
+ "n_per_split": 100
2534
+ },
2535
+ "splits": {
2536
+ "add_S0": {
2537
+ "full_accuracy": 0.61,
2538
+ "n_examples": 100,
2539
+ "per_subtask": {
2540
+ "SA": {
2541
+ "accuracy": 0.9338842975206612,
2542
+ "count": 605
2543
+ },
2544
+ "SS": {
2545
+ "accuracy": 0.9473684210526315,
2546
+ "count": 95
2547
+ }
2548
+ }
2549
+ },
2550
+ "add_S1": {
2551
+ "full_accuracy": 0.33,
2552
+ "n_examples": 100,
2553
+ "per_subtask": {
2554
+ "SA": {
2555
+ "accuracy": 0.9411764705882353,
2556
+ "count": 204
2557
+ },
2558
+ "SC": {
2559
+ "accuracy": 0.8757396449704142,
2560
+ "count": 169
2561
+ },
2562
+ "SS": {
2563
+ "accuracy": 0.9354838709677419,
2564
+ "count": 31
2565
+ },
2566
+ "UC": {
2567
+ "accuracy": 0.7804054054054054,
2568
+ "count": 296
2569
+ }
2570
+ }
2571
+ },
2572
+ "add_S2": {
2573
+ "full_accuracy": 0.18,
2574
+ "n_examples": 100,
2575
+ "per_subtask": {
2576
+ "SA": {
2577
+ "accuracy": 0.9141104294478528,
2578
+ "count": 163
2579
+ },
2580
+ "SC": {
2581
+ "accuracy": 0.8769230769230769,
2582
+ "count": 130
2583
+ },
2584
+ "SS": {
2585
+ "accuracy": 0.7931034482758621,
2586
+ "count": 87
2587
+ },
2588
+ "UC": {
2589
+ "accuracy": 0.6551724137931034,
2590
+ "count": 203
2591
+ },
2592
+ "US": {
2593
+ "accuracy": 0.8205128205128205,
2594
+ "count": 117
2595
+ }
2596
+ }
2597
+ },
2598
+ "add_S3": {
2599
+ "full_accuracy": 0.08,
2600
+ "n_examples": 100,
2601
+ "per_subtask": {
2602
+ "SA": {
2603
+ "accuracy": 0.9669421487603306,
2604
+ "count": 121
2605
+ },
2606
+ "SC": {
2607
+ "accuracy": 0.8677685950413223,
2608
+ "count": 121
2609
+ },
2610
+ "SS": {
2611
+ "accuracy": 0.6938775510204082,
2612
+ "count": 49
2613
+ },
2614
+ "UC": {
2615
+ "accuracy": 0.5483870967741935,
2616
+ "count": 186
2617
+ },
2618
+ "US": {
2619
+ "accuracy": 0.57847533632287,
2620
+ "count": 223
2621
+ }
2622
+ }
2623
+ },
2624
+ "add_S4": {
2625
+ "full_accuracy": 0.16,
2626
+ "n_examples": 100,
2627
+ "per_subtask": {
2628
+ "SA": {
2629
+ "accuracy": 0.9423076923076923,
2630
+ "count": 104
2631
+ },
2632
+ "SC": {
2633
+ "accuracy": 0.8679245283018868,
2634
+ "count": 106
2635
+ },
2636
+ "SS": {
2637
+ "accuracy": 0.7391304347826086,
2638
+ "count": 23
2639
+ },
2640
+ "UC": {
2641
+ "accuracy": 0.5875,
2642
+ "count": 160
2643
+ },
2644
+ "US": {
2645
+ "accuracy": 0.4755700325732899,
2646
+ "count": 307
2647
+ }
2648
+ }
2649
+ },
2650
+ "add_S5": {
2651
+ "full_accuracy": 0.04,
2652
+ "n_examples": 100,
2653
+ "per_subtask": {
2654
+ "SA": {
2655
+ "accuracy": 1.0,
2656
+ "count": 100
2657
+ },
2658
+ "SC": {
2659
+ "accuracy": 0.96,
2660
+ "count": 100
2661
+ },
2662
+ "UC": {
2663
+ "accuracy": 0.11,
2664
+ "count": 100
2665
+ },
2666
+ "US": {
2667
+ "accuracy": 0.205,
2668
+ "count": 400
2669
+ }
2670
+ }
2671
+ },
2672
+ "add_S6": {
2673
+ "full_accuracy": 0.39,
2674
+ "n_examples": 100,
2675
+ "per_subtask": {
2676
+ "SC": {
2677
+ "accuracy": 1.0,
2678
+ "count": 100
2679
+ },
2680
+ "UC": {
2681
+ "accuracy": 0.55,
2682
+ "count": 100
2683
+ },
2684
+ "US": {
2685
+ "accuracy": 0.512,
2686
+ "count": 500
2687
+ }
2688
+ }
2689
+ },
2690
+ "add_random": {
2691
+ "full_accuracy": 0.315,
2692
+ "n_examples": 200,
2693
+ "per_subtask": {
2694
+ "SA": {
2695
+ "accuracy": 0.941834451901566,
2696
+ "count": 447
2697
+ },
2698
+ "SC": {
2699
+ "accuracy": 0.871875,
2700
+ "count": 320
2701
+ },
2702
+ "SS": {
2703
+ "accuracy": 0.9107142857142857,
2704
+ "count": 56
2705
+ },
2706
+ "UC": {
2707
+ "accuracy": 0.7674858223062382,
2708
+ "count": 529
2709
+ },
2710
+ "US": {
2711
+ "accuracy": 0.7291666666666666,
2712
+ "count": 48
2713
+ }
2714
+ }
2715
+ },
2716
+ "add_C3": {
2717
+ "full_accuracy": 0.18,
2718
+ "n_examples": 100,
2719
+ "per_subtask": {
2720
+ "SA": {
2721
+ "accuracy": 0.99,
2722
+ "count": 300
2723
+ },
2724
+ "SC": {
2725
+ "accuracy": 0.95,
2726
+ "count": 100
2727
+ },
2728
+ "UC": {
2729
+ "accuracy": 0.48186528497409326,
2730
+ "count": 193
2731
+ },
2732
+ "US": {
2733
+ "accuracy": 0.6355140186915887,
2734
+ "count": 107
2735
+ }
2736
+ }
2737
+ },
2738
+ "add_C4": {
2739
+ "full_accuracy": 0.15,
2740
+ "n_examples": 100,
2741
+ "per_subtask": {
2742
+ "SA": {
2743
+ "accuracy": 0.985,
2744
+ "count": 200
2745
+ },
2746
+ "SC": {
2747
+ "accuracy": 0.97,
2748
+ "count": 100
2749
+ },
2750
+ "UC": {
2751
+ "accuracy": 0.53515625,
2752
+ "count": 256
2753
+ },
2754
+ "US": {
2755
+ "accuracy": 0.7222222222222222,
2756
+ "count": 144
2757
+ }
2758
+ }
2759
+ },
2760
+ "add_C5": {
2761
+ "full_accuracy": 0.13,
2762
+ "n_examples": 100,
2763
+ "per_subtask": {
2764
+ "SA": {
2765
+ "accuracy": 1.0,
2766
+ "count": 100
2767
+ },
2768
+ "SC": {
2769
+ "accuracy": 0.98,
2770
+ "count": 100
2771
+ },
2772
+ "UC": {
2773
+ "accuracy": 0.5522875816993464,
2774
+ "count": 306
2775
+ },
2776
+ "US": {
2777
+ "accuracy": 0.6907216494845361,
2778
+ "count": 194
2779
+ }
2780
+ }
2781
+ },
2782
+ "add_C6": {
2783
+ "full_accuracy": 0.12,
2784
+ "n_examples": 100,
2785
+ "per_subtask": {
2786
+ "SC": {
2787
+ "accuracy": 1.0,
2788
+ "count": 100
2789
+ },
2790
+ "UC": {
2791
+ "accuracy": 0.6475409836065574,
2792
+ "count": 366
2793
+ },
2794
+ "US": {
2795
+ "accuracy": 0.8717948717948718,
2796
+ "count": 234
2797
+ }
2798
+ }
2799
+ },
2800
+ "sub_M0": {
2801
+ "full_accuracy": 0.13,
2802
+ "n_examples": 100,
2803
+ "per_subtask": {
2804
+ "MD": {
2805
+ "accuracy": 0.7537437603993344,
2806
+ "count": 601
2807
+ },
2808
+ "ME": {
2809
+ "accuracy": 0.8787878787878788,
2810
+ "count": 99
2811
+ }
2812
+ }
2813
+ },
2814
+ "sub_M1": {
2815
+ "full_accuracy": 0.03,
2816
+ "n_examples": 100,
2817
+ "per_subtask": {
2818
+ "MD": {
2819
+ "accuracy": 0.8172043010752689,
2820
+ "count": 279
2821
+ },
2822
+ "MB": {
2823
+ "accuracy": 0.9379310344827586,
2824
+ "count": 145
2825
+ },
2826
+ "ME": {
2827
+ "accuracy": 0.6666666666666666,
2828
+ "count": 24
2829
+ },
2830
+ "UB": {
2831
+ "accuracy": 0.3134920634920635,
2832
+ "count": 252
2833
+ }
2834
+ }
2835
+ },
2836
+ "sub_M2": {
2837
+ "full_accuracy": 0.05,
2838
+ "n_examples": 100,
2839
+ "per_subtask": {
2840
+ "MD": {
2841
+ "accuracy": 0.8544600938967136,
2842
+ "count": 213
2843
+ },
2844
+ "MB": {
2845
+ "accuracy": 0.8849557522123894,
2846
+ "count": 113
2847
+ },
2848
+ "ME": {
2849
+ "accuracy": 0.9176470588235294,
2850
+ "count": 85
2851
+ },
2852
+ "UB": {
2853
+ "accuracy": 0.32044198895027626,
2854
+ "count": 181
2855
+ },
2856
+ "UD": {
2857
+ "accuracy": 0.3333333333333333,
2858
+ "count": 108
2859
+ }
2860
+ }
2861
+ },
2862
+ "sub_M3": {
2863
+ "full_accuracy": 0.02,
2864
+ "n_examples": 100,
2865
+ "per_subtask": {
2866
+ "MD": {
2867
+ "accuracy": 0.9441340782122905,
2868
+ "count": 179
2869
+ },
2870
+ "MB": {
2871
+ "accuracy": 0.9223300970873787,
2872
+ "count": 103
2873
+ },
2874
+ "ME": {
2875
+ "accuracy": 0.9821428571428571,
2876
+ "count": 56
2877
+ },
2878
+ "UB": {
2879
+ "accuracy": 0.3087248322147651,
2880
+ "count": 149
2881
+ },
2882
+ "UD": {
2883
+ "accuracy": 0.18779342723004694,
2884
+ "count": 213
2885
+ }
2886
+ }
2887
+ },
2888
+ "sub_M4": {
2889
+ "full_accuracy": 0.03,
2890
+ "n_examples": 100,
2891
+ "per_subtask": {
2892
+ "MD": {
2893
+ "accuracy": 0.865,
2894
+ "count": 200
2895
+ },
2896
+ "MB": {
2897
+ "accuracy": 0.88,
2898
+ "count": 100
2899
+ },
2900
+ "UB": {
2901
+ "accuracy": 0.37,
2902
+ "count": 100
2903
+ },
2904
+ "UD": {
2905
+ "accuracy": 0.23666666666666666,
2906
+ "count": 300
2907
+ }
2908
+ }
2909
+ },
2910
+ "sub_M5": {
2911
+ "full_accuracy": 0.04,
2912
+ "n_examples": 100,
2913
+ "per_subtask": {
2914
+ "MD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 100
2917
+ },
2918
+ "MB": {
2919
+ "accuracy": 0.85,
2920
+ "count": 100
2921
+ },
2922
+ "UB": {
2923
+ "accuracy": 0.41,
2924
+ "count": 100
2925
+ },
2926
+ "UD": {
2927
+ "accuracy": 0.2575,
2928
+ "count": 400
2929
+ }
2930
+ }
2931
+ },
2932
+ "sub_random": {
2933
+ "full_accuracy": 0.06,
2934
+ "n_examples": 200,
2935
+ "per_subtask": {
2936
+ "MD": {
2937
+ "accuracy": 0.8116666666666666,
2938
+ "count": 600
2939
+ },
2940
+ "MB": {
2941
+ "accuracy": 0.9138576779026217,
2942
+ "count": 267
2943
+ },
2944
+ "ME": {
2945
+ "accuracy": 0.8301886792452831,
2946
+ "count": 53
2947
+ },
2948
+ "UB": {
2949
+ "accuracy": 0.31890660592255127,
2950
+ "count": 439
2951
+ },
2952
+ "UD": {
2953
+ "accuracy": 0.2682926829268293,
2954
+ "count": 41
2955
+ }
2956
+ }
2957
+ },
2958
+ "sub_B3": {
2959
+ "full_accuracy": 0.02,
2960
+ "n_examples": 100,
2961
+ "per_subtask": {
2962
+ "MD": {
2963
+ "accuracy": 0.8166666666666667,
2964
+ "count": 300
2965
+ },
2966
+ "MB": {
2967
+ "accuracy": 0.91,
2968
+ "count": 100
2969
+ },
2970
+ "UB": {
2971
+ "accuracy": 0.27918781725888325,
2972
+ "count": 197
2973
+ },
2974
+ "UD": {
2975
+ "accuracy": 0.2912621359223301,
2976
+ "count": 103
2977
+ }
2978
+ }
2979
+ },
2980
+ "sub_B4": {
2981
+ "full_accuracy": 0.0,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "MD": {
2985
+ "accuracy": 0.845,
2986
+ "count": 200
2987
+ },
2988
+ "MB": {
2989
+ "accuracy": 0.94,
2990
+ "count": 100
2991
+ },
2992
+ "UB": {
2993
+ "accuracy": 0.24696356275303644,
2994
+ "count": 247
2995
+ },
2996
+ "UD": {
2997
+ "accuracy": 0.29411764705882354,
2998
+ "count": 153
2999
+ }
3000
+ }
3001
+ },
3002
+ "sub_B5": {
3003
+ "full_accuracy": 0.01,
3004
+ "n_examples": 100,
3005
+ "per_subtask": {
3006
+ "MD": {
3007
+ "accuracy": 1.0,
3008
+ "count": 100
3009
+ },
3010
+ "MB": {
3011
+ "accuracy": 0.9,
3012
+ "count": 100
3013
+ },
3014
+ "UB": {
3015
+ "accuracy": 0.2651006711409396,
3016
+ "count": 298
3017
+ },
3018
+ "UD": {
3019
+ "accuracy": 0.297029702970297,
3020
+ "count": 202
3021
+ }
3022
+ }
3023
+ }
3024
+ },
3025
+ "summary": {
3026
+ "overall_accuracy": 0.14375,
3027
+ "total_examples": 2400,
3028
+ "n_splits": 22
3029
+ }
3030
+ },
3031
+ "sorl_eval": {
3032
+ "config": {
3033
+ "ops": "add_sub",
3034
+ "K": 1,
3035
+ "mode": "sorl",
3036
+ "n_digits": 6,
3037
+ "n_per_split": 100
3038
+ },
3039
+ "splits": {
3040
+ "add_S0": {
3041
+ "full_accuracy": 0.68,
3042
+ "n_examples": 100,
3043
+ "per_subtask": {
3044
+ "SA": {
3045
+ "accuracy": 0.947107438016529,
3046
+ "count": 605
3047
+ },
3048
+ "SS": {
3049
+ "accuracy": 0.968421052631579,
3050
+ "count": 95
3051
+ }
3052
+ }
3053
+ },
3054
+ "add_S1": {
3055
+ "full_accuracy": 0.45,
3056
+ "n_examples": 100,
3057
+ "per_subtask": {
3058
+ "SA": {
3059
+ "accuracy": 0.946078431372549,
3060
+ "count": 204
3061
+ },
3062
+ "SC": {
3063
+ "accuracy": 0.9230769230769231,
3064
+ "count": 169
3065
+ },
3066
+ "SS": {
3067
+ "accuracy": 1.0,
3068
+ "count": 31
3069
+ },
3070
+ "UC": {
3071
+ "accuracy": 0.847972972972973,
3072
+ "count": 296
3073
+ }
3074
+ }
3075
+ },
3076
+ "add_S2": {
3077
+ "full_accuracy": 0.28,
3078
+ "n_examples": 100,
3079
+ "per_subtask": {
3080
+ "SA": {
3081
+ "accuracy": 0.9325153374233128,
3082
+ "count": 163
3083
+ },
3084
+ "SC": {
3085
+ "accuracy": 0.823076923076923,
3086
+ "count": 130
3087
+ },
3088
+ "SS": {
3089
+ "accuracy": 0.9080459770114943,
3090
+ "count": 87
3091
+ },
3092
+ "UC": {
3093
+ "accuracy": 0.7241379310344828,
3094
+ "count": 203
3095
+ },
3096
+ "US": {
3097
+ "accuracy": 0.9316239316239316,
3098
+ "count": 117
3099
+ }
3100
+ }
3101
+ },
3102
+ "add_S3": {
3103
+ "full_accuracy": 0.28,
3104
+ "n_examples": 100,
3105
+ "per_subtask": {
3106
+ "SA": {
3107
+ "accuracy": 0.9586776859504132,
3108
+ "count": 121
3109
+ },
3110
+ "SC": {
3111
+ "accuracy": 0.9256198347107438,
3112
+ "count": 121
3113
+ },
3114
+ "SS": {
3115
+ "accuracy": 0.9387755102040817,
3116
+ "count": 49
3117
+ },
3118
+ "UC": {
3119
+ "accuracy": 0.7580645161290323,
3120
+ "count": 186
3121
+ },
3122
+ "US": {
3123
+ "accuracy": 0.7488789237668162,
3124
+ "count": 223
3125
+ }
3126
+ }
3127
+ },
3128
+ "add_S4": {
3129
+ "full_accuracy": 0.16,
3130
+ "n_examples": 100,
3131
+ "per_subtask": {
3132
+ "SA": {
3133
+ "accuracy": 0.9519230769230769,
3134
+ "count": 104
3135
+ },
3136
+ "SC": {
3137
+ "accuracy": 0.8867924528301887,
3138
+ "count": 106
3139
+ },
3140
+ "SS": {
3141
+ "accuracy": 0.9565217391304348,
3142
+ "count": 23
3143
+ },
3144
+ "UC": {
3145
+ "accuracy": 0.7,
3146
+ "count": 160
3147
+ },
3148
+ "US": {
3149
+ "accuracy": 0.5928338762214984,
3150
+ "count": 307
3151
+ }
3152
+ }
3153
+ },
3154
+ "add_S5": {
3155
+ "full_accuracy": 0.1,
3156
+ "n_examples": 100,
3157
+ "per_subtask": {
3158
+ "SA": {
3159
+ "accuracy": 1.0,
3160
+ "count": 100
3161
+ },
3162
+ "SC": {
3163
+ "accuracy": 0.97,
3164
+ "count": 100
3165
+ },
3166
+ "UC": {
3167
+ "accuracy": 0.45,
3168
+ "count": 100
3169
+ },
3170
+ "US": {
3171
+ "accuracy": 0.3675,
3172
+ "count": 400
3173
+ }
3174
+ }
3175
+ },
3176
+ "add_S6": {
3177
+ "full_accuracy": 0.03,
3178
+ "n_examples": 100,
3179
+ "per_subtask": {
3180
+ "SC": {
3181
+ "accuracy": 1.0,
3182
+ "count": 100
3183
+ },
3184
+ "UC": {
3185
+ "accuracy": 0.64,
3186
+ "count": 100
3187
+ },
3188
+ "US": {
3189
+ "accuracy": 0.4,
3190
+ "count": 500
3191
+ }
3192
+ }
3193
+ },
3194
+ "add_random": {
3195
+ "full_accuracy": 0.52,
3196
+ "n_examples": 200,
3197
+ "per_subtask": {
3198
+ "SA": {
3199
+ "accuracy": 0.9530201342281879,
3200
+ "count": 447
3201
+ },
3202
+ "SC": {
3203
+ "accuracy": 0.928125,
3204
+ "count": 320
3205
+ },
3206
+ "SS": {
3207
+ "accuracy": 0.9107142857142857,
3208
+ "count": 56
3209
+ },
3210
+ "UC": {
3211
+ "accuracy": 0.8563327032136105,
3212
+ "count": 529
3213
+ },
3214
+ "US": {
3215
+ "accuracy": 0.8541666666666666,
3216
+ "count": 48
3217
+ }
3218
+ }
3219
+ },
3220
+ "add_C3": {
3221
+ "full_accuracy": 0.31,
3222
+ "n_examples": 100,
3223
+ "per_subtask": {
3224
+ "SA": {
3225
+ "accuracy": 0.9833333333333333,
3226
+ "count": 300
3227
+ },
3228
+ "SC": {
3229
+ "accuracy": 0.97,
3230
+ "count": 100
3231
+ },
3232
+ "UC": {
3233
+ "accuracy": 0.6528497409326425,
3234
+ "count": 193
3235
+ },
3236
+ "US": {
3237
+ "accuracy": 0.6728971962616822,
3238
+ "count": 107
3239
+ }
3240
+ }
3241
+ },
3242
+ "add_C4": {
3243
+ "full_accuracy": 0.26,
3244
+ "n_examples": 100,
3245
+ "per_subtask": {
3246
+ "SA": {
3247
+ "accuracy": 0.985,
3248
+ "count": 200
3249
+ },
3250
+ "SC": {
3251
+ "accuracy": 0.99,
3252
+ "count": 100
3253
+ },
3254
+ "UC": {
3255
+ "accuracy": 0.6875,
3256
+ "count": 256
3257
+ },
3258
+ "US": {
3259
+ "accuracy": 0.7013888888888888,
3260
+ "count": 144
3261
+ }
3262
+ }
3263
+ },
3264
+ "add_C5": {
3265
+ "full_accuracy": 0.19,
3266
+ "n_examples": 100,
3267
+ "per_subtask": {
3268
+ "SA": {
3269
+ "accuracy": 1.0,
3270
+ "count": 100
3271
+ },
3272
+ "SC": {
3273
+ "accuracy": 0.98,
3274
+ "count": 100
3275
+ },
3276
+ "UC": {
3277
+ "accuracy": 0.696078431372549,
3278
+ "count": 306
3279
+ },
3280
+ "US": {
3281
+ "accuracy": 0.6752577319587629,
3282
+ "count": 194
3283
+ }
3284
+ }
3285
+ },
3286
+ "add_C6": {
3287
+ "full_accuracy": 0.19,
3288
+ "n_examples": 100,
3289
+ "per_subtask": {
3290
+ "SC": {
3291
+ "accuracy": 1.0,
3292
+ "count": 100
3293
+ },
3294
+ "UC": {
3295
+ "accuracy": 0.726775956284153,
3296
+ "count": 366
3297
+ },
3298
+ "US": {
3299
+ "accuracy": 0.717948717948718,
3300
+ "count": 234
3301
+ }
3302
+ }
3303
+ },
3304
+ "sub_M0": {
3305
+ "full_accuracy": 0.26,
3306
+ "n_examples": 100,
3307
+ "per_subtask": {
3308
+ "MD": {
3309
+ "accuracy": 0.8386023294509152,
3310
+ "count": 601
3311
+ },
3312
+ "ME": {
3313
+ "accuracy": 0.8080808080808081,
3314
+ "count": 99
3315
+ }
3316
+ }
3317
+ },
3318
+ "sub_M1": {
3319
+ "full_accuracy": 0.26,
3320
+ "n_examples": 100,
3321
+ "per_subtask": {
3322
+ "MD": {
3323
+ "accuracy": 0.8924731182795699,
3324
+ "count": 279
3325
+ },
3326
+ "MB": {
3327
+ "accuracy": 0.896551724137931,
3328
+ "count": 145
3329
+ },
3330
+ "ME": {
3331
+ "accuracy": 0.875,
3332
+ "count": 24
3333
+ },
3334
+ "UB": {
3335
+ "accuracy": 0.75,
3336
+ "count": 252
3337
+ }
3338
+ }
3339
+ },
3340
+ "sub_M2": {
3341
+ "full_accuracy": 0.22,
3342
+ "n_examples": 100,
3343
+ "per_subtask": {
3344
+ "MD": {
3345
+ "accuracy": 0.892018779342723,
3346
+ "count": 213
3347
+ },
3348
+ "MB": {
3349
+ "accuracy": 0.8584070796460177,
3350
+ "count": 113
3351
+ },
3352
+ "ME": {
3353
+ "accuracy": 0.9411764705882353,
3354
+ "count": 85
3355
+ },
3356
+ "UB": {
3357
+ "accuracy": 0.6906077348066298,
3358
+ "count": 181
3359
+ },
3360
+ "UD": {
3361
+ "accuracy": 0.7685185185185185,
3362
+ "count": 108
3363
+ }
3364
+ }
3365
+ },
3366
+ "sub_M3": {
3367
+ "full_accuracy": 0.17,
3368
+ "n_examples": 100,
3369
+ "per_subtask": {
3370
+ "MD": {
3371
+ "accuracy": 0.9608938547486033,
3372
+ "count": 179
3373
+ },
3374
+ "MB": {
3375
+ "accuracy": 0.8737864077669902,
3376
+ "count": 103
3377
+ },
3378
+ "ME": {
3379
+ "accuracy": 0.9642857142857143,
3380
+ "count": 56
3381
+ },
3382
+ "UB": {
3383
+ "accuracy": 0.5838926174496645,
3384
+ "count": 149
3385
+ },
3386
+ "UD": {
3387
+ "accuracy": 0.6807511737089202,
3388
+ "count": 213
3389
+ }
3390
+ }
3391
+ },
3392
+ "sub_M4": {
3393
+ "full_accuracy": 0.16,
3394
+ "n_examples": 100,
3395
+ "per_subtask": {
3396
+ "MD": {
3397
+ "accuracy": 0.91,
3398
+ "count": 200
3399
+ },
3400
+ "MB": {
3401
+ "accuracy": 0.94,
3402
+ "count": 100
3403
+ },
3404
+ "UB": {
3405
+ "accuracy": 0.59,
3406
+ "count": 100
3407
+ },
3408
+ "UD": {
3409
+ "accuracy": 0.63,
3410
+ "count": 300
3411
+ }
3412
+ }
3413
+ },
3414
+ "sub_M5": {
3415
+ "full_accuracy": 0.08,
3416
+ "n_examples": 100,
3417
+ "per_subtask": {
3418
+ "MD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 100
3421
+ },
3422
+ "MB": {
3423
+ "accuracy": 1.0,
3424
+ "count": 100
3425
+ },
3426
+ "UB": {
3427
+ "accuracy": 0.47,
3428
+ "count": 100
3429
+ },
3430
+ "UD": {
3431
+ "accuracy": 0.515,
3432
+ "count": 400
3433
+ }
3434
+ }
3435
+ },
3436
+ "sub_random": {
3437
+ "full_accuracy": 0.25,
3438
+ "n_examples": 200,
3439
+ "per_subtask": {
3440
+ "MD": {
3441
+ "accuracy": 0.875,
3442
+ "count": 600
3443
+ },
3444
+ "MB": {
3445
+ "accuracy": 0.8689138576779026,
3446
+ "count": 267
3447
+ },
3448
+ "ME": {
3449
+ "accuracy": 0.8679245283018868,
3450
+ "count": 53
3451
+ },
3452
+ "UB": {
3453
+ "accuracy": 0.7403189066059226,
3454
+ "count": 439
3455
+ },
3456
+ "UD": {
3457
+ "accuracy": 0.7560975609756098,
3458
+ "count": 41
3459
+ }
3460
+ }
3461
+ },
3462
+ "sub_B3": {
3463
+ "full_accuracy": 0.21,
3464
+ "n_examples": 100,
3465
+ "per_subtask": {
3466
+ "MD": {
3467
+ "accuracy": 0.8433333333333334,
3468
+ "count": 300
3469
+ },
3470
+ "MB": {
3471
+ "accuracy": 0.88,
3472
+ "count": 100
3473
+ },
3474
+ "UB": {
3475
+ "accuracy": 0.6446700507614214,
3476
+ "count": 197
3477
+ },
3478
+ "UD": {
3479
+ "accuracy": 0.6796116504854369,
3480
+ "count": 103
3481
+ }
3482
+ }
3483
+ },
3484
+ "sub_B4": {
3485
+ "full_accuracy": 0.21,
3486
+ "n_examples": 100,
3487
+ "per_subtask": {
3488
+ "MD": {
3489
+ "accuracy": 0.93,
3490
+ "count": 200
3491
+ },
3492
+ "MB": {
3493
+ "accuracy": 0.91,
3494
+ "count": 100
3495
+ },
3496
+ "UB": {
3497
+ "accuracy": 0.6356275303643725,
3498
+ "count": 247
3499
+ },
3500
+ "UD": {
3501
+ "accuracy": 0.7124183006535948,
3502
+ "count": 153
3503
+ }
3504
+ }
3505
+ },
3506
+ "sub_B5": {
3507
+ "full_accuracy": 0.12,
3508
+ "n_examples": 100,
3509
+ "per_subtask": {
3510
+ "MD": {
3511
+ "accuracy": 1.0,
3512
+ "count": 100
3513
+ },
3514
+ "MB": {
3515
+ "accuracy": 1.0,
3516
+ "count": 100
3517
+ },
3518
+ "UB": {
3519
+ "accuracy": 0.6073825503355704,
3520
+ "count": 298
3521
+ },
3522
+ "UD": {
3523
+ "accuracy": 0.6534653465346535,
3524
+ "count": 202
3525
+ }
3526
+ }
3527
+ }
3528
+ },
3529
+ "summary": {
3530
+ "overall_accuracy": 0.25666666666666665,
3531
+ "total_examples": 2400,
3532
+ "n_splits": 22
3533
+ }
3534
+ },
3535
+ "sorl_overall_accuracy": 0.25666666666666665,
3536
+ "sft_overall_accuracy": 0.14375
3537
+ }
add_sub_sorl_v1_abs10_K1_100K_1L2H256d/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:145861f898da6af4691710f6bb58842b889edff7df9fafa7dd22498806818c68
3
+ size 315091124
add_sub_sorl_v1_abs10_K1_100K_1L2H256d/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 1,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 2e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 10,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 1562,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs10_K1_100K_1L2H256d",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 1,
61
+ "n_head": 2,
62
+ "n_embd": 256,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 10,
65
+ "dataset_size": 100000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 78696448,
71
+ "run_name": "add_sub_sorl_v1_abs10_K1_100K_1L2H256d",
72
+ "git_commit": "f447da529caceac8c7d256cbb2cd185cbc50feac",
73
+ "timestamp": "2026-04-12T19:15:59.955928+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "51hfiren",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/51hfiren",
81
+ "final_accuracy": 0.25666666666666665,
82
+ "sft_accuracy": 0.14375,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }