amirali1985 commited on
Commit
f74d8a4
·
verified ·
1 Parent(s): 37d7571

Upload add_sub_sorl_v1_abs30_100K

Browse files
add_sub_sorl_v1_abs30_100K/config.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 510,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 2040,
15
+ "layer_types": [
16
+ "full_attention",
17
+ "full_attention"
18
+ ],
19
+ "max_position_embeddings": 128,
20
+ "max_window_layers": 28,
21
+ "model_type": "qwen3",
22
+ "num_attention_heads": 3,
23
+ "num_hidden_layers": 2,
24
+ "num_key_value_heads": 3,
25
+ "pad_token_id": null,
26
+ "rms_norm_eps": 1e-06,
27
+ "rope_parameters": {
28
+ "rope_theta": 10000.0,
29
+ "rope_type": "default"
30
+ },
31
+ "sliding_window": null,
32
+ "tie_word_embeddings": false,
33
+ "transformers_version": "5.5.0",
34
+ "use_cache": true,
35
+ "use_sliding_window": false,
36
+ "vocab_size": 151674
37
+ }
add_sub_sorl_v1_abs30_100K/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs30_100K/metrics.json ADDED
@@ -0,0 +1,3537 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 800,
20
+ 850,
21
+ 900,
22
+ 950,
23
+ 1000,
24
+ 1050,
25
+ 1100,
26
+ 1150,
27
+ 1200,
28
+ 1250,
29
+ 1300,
30
+ 1350,
31
+ 1400,
32
+ 1450,
33
+ 1500,
34
+ 1550,
35
+ 1613,
36
+ 1663,
37
+ 1713,
38
+ 1763,
39
+ 1813,
40
+ 1863,
41
+ 1913,
42
+ 1963,
43
+ 2013,
44
+ 2063,
45
+ 2113,
46
+ 2163,
47
+ 2213,
48
+ 2263,
49
+ 2313,
50
+ 2363,
51
+ 2413,
52
+ 2463,
53
+ 2513,
54
+ 2563,
55
+ 2613,
56
+ 2663,
57
+ 2713,
58
+ 2763,
59
+ 2813,
60
+ 2863,
61
+ 2913,
62
+ 2963,
63
+ 3013,
64
+ 3063,
65
+ 3113,
66
+ 3176,
67
+ 3226,
68
+ 3276,
69
+ 3326,
70
+ 3376,
71
+ 3426,
72
+ 3476,
73
+ 3526,
74
+ 3576,
75
+ 3626,
76
+ 3676,
77
+ 3726,
78
+ 3776,
79
+ 3826,
80
+ 3876,
81
+ 3926,
82
+ 3976,
83
+ 4026,
84
+ 4076,
85
+ 4126,
86
+ 4176,
87
+ 4226,
88
+ 4276,
89
+ 4326,
90
+ 4376,
91
+ 4426,
92
+ 4476,
93
+ 4526,
94
+ 4576,
95
+ 4626,
96
+ 4676,
97
+ 4739,
98
+ 4789,
99
+ 4839,
100
+ 4889,
101
+ 4939,
102
+ 4989,
103
+ 5039,
104
+ 5089,
105
+ 5139,
106
+ 5189,
107
+ 5239,
108
+ 5289,
109
+ 5339,
110
+ 5389,
111
+ 5439,
112
+ 5489,
113
+ 5539,
114
+ 5589,
115
+ 5639,
116
+ 5689,
117
+ 5739,
118
+ 5789,
119
+ 5839,
120
+ 5889,
121
+ 5939,
122
+ 5989,
123
+ 6039,
124
+ 6089,
125
+ 6139,
126
+ 6189,
127
+ 6239,
128
+ 6302,
129
+ 6352,
130
+ 6402,
131
+ 6452,
132
+ 6502,
133
+ 6552,
134
+ 6602,
135
+ 6652,
136
+ 6702,
137
+ 6752,
138
+ 6802,
139
+ 6852,
140
+ 6902,
141
+ 6952,
142
+ 7002,
143
+ 7052,
144
+ 7102,
145
+ 7152,
146
+ 7202,
147
+ 7252,
148
+ 7302,
149
+ 7352,
150
+ 7402,
151
+ 7452,
152
+ 7502,
153
+ 7552,
154
+ 7602,
155
+ 7652,
156
+ 7702,
157
+ 7752,
158
+ 7802,
159
+ 7865,
160
+ 7915,
161
+ 7965,
162
+ 8015,
163
+ 8065,
164
+ 8115,
165
+ 8165,
166
+ 8215,
167
+ 8265,
168
+ 8315,
169
+ 8365,
170
+ 8415,
171
+ 8465,
172
+ 8515,
173
+ 8565,
174
+ 8615,
175
+ 8665,
176
+ 8715,
177
+ 8765,
178
+ 8815,
179
+ 8865,
180
+ 8915,
181
+ 8965,
182
+ 9015,
183
+ 9065,
184
+ 9115,
185
+ 9165,
186
+ 9215,
187
+ 9265,
188
+ 9315,
189
+ 9365,
190
+ 9428,
191
+ 9478,
192
+ 9528,
193
+ 9578,
194
+ 9628,
195
+ 9678,
196
+ 9728,
197
+ 9778,
198
+ 9828,
199
+ 9878,
200
+ 9928,
201
+ 9978,
202
+ 10028,
203
+ 10078,
204
+ 10128,
205
+ 10178,
206
+ 10228,
207
+ 10278,
208
+ 10328,
209
+ 10378,
210
+ 10428,
211
+ 10478,
212
+ 10528,
213
+ 10578,
214
+ 10628,
215
+ 10678,
216
+ 10728,
217
+ 10778,
218
+ 10828,
219
+ 10878,
220
+ 10928,
221
+ 10991,
222
+ 11041,
223
+ 11091,
224
+ 11141,
225
+ 11191,
226
+ 11241,
227
+ 11291,
228
+ 11341,
229
+ 11391,
230
+ 11441,
231
+ 11491,
232
+ 11541,
233
+ 11591,
234
+ 11641,
235
+ 11691,
236
+ 11741,
237
+ 11791,
238
+ 11841,
239
+ 11891,
240
+ 11941,
241
+ 11991,
242
+ 12041,
243
+ 12091,
244
+ 12141,
245
+ 12191,
246
+ 12241,
247
+ 12291,
248
+ 12341,
249
+ 12391,
250
+ 12441,
251
+ 12491,
252
+ 12554,
253
+ 12604,
254
+ 12654,
255
+ 12704,
256
+ 12754,
257
+ 12804,
258
+ 12854,
259
+ 12904,
260
+ 12954,
261
+ 13004,
262
+ 13054,
263
+ 13104,
264
+ 13154,
265
+ 13204,
266
+ 13254,
267
+ 13304,
268
+ 13354,
269
+ 13404,
270
+ 13454,
271
+ 13504,
272
+ 13554,
273
+ 13604,
274
+ 13654,
275
+ 13704,
276
+ 13754,
277
+ 13804,
278
+ 13854,
279
+ 13904,
280
+ 13954,
281
+ 14004,
282
+ 14054,
283
+ 14117,
284
+ 14167,
285
+ 14217,
286
+ 14267,
287
+ 14317,
288
+ 14367,
289
+ 14417,
290
+ 14467,
291
+ 14517,
292
+ 14567,
293
+ 14617,
294
+ 14667,
295
+ 14717,
296
+ 14767,
297
+ 14817,
298
+ 14867,
299
+ 14917,
300
+ 14967,
301
+ 15017,
302
+ 15067,
303
+ 15117,
304
+ 15167,
305
+ 15217,
306
+ 15267,
307
+ 15317,
308
+ 15367,
309
+ 15417,
310
+ 15467,
311
+ 15517,
312
+ 15567,
313
+ 15617
314
+ ],
315
+ "loss": [
316
+ 16.353931427001953,
317
+ 11.875846862792969,
318
+ 9.565509796142578,
319
+ 7.342390060424805,
320
+ 4.512979507446289,
321
+ 4.0690813064575195,
322
+ 2.862144947052002,
323
+ 2.254006862640381,
324
+ 2.57066011428833,
325
+ 1.998836874961853,
326
+ 2.1581692695617676,
327
+ 2.091899871826172,
328
+ 2.1439857482910156,
329
+ 1.2456738948822021,
330
+ 1.5288512706756592,
331
+ 1.3524699211120605,
332
+ 1.3221745491027832,
333
+ 1.198272943496704,
334
+ 0.07600802183151245,
335
+ 0.367651104927063,
336
+ -0.7961059808731079,
337
+ -3.9763927459716797,
338
+ -7.191513538360596,
339
+ -7.797391891479492,
340
+ -8.402938842773438,
341
+ -8.945942878723145,
342
+ -9.609200477600098,
343
+ -9.026281356811523,
344
+ -9.448883056640625,
345
+ -9.915501594543457,
346
+ -10.245144844055176,
347
+ -11.20373249053955,
348
+ -11.372387886047363,
349
+ -11.372745513916016,
350
+ -12.334482192993164,
351
+ -12.151872634887695,
352
+ -12.037510871887207,
353
+ -12.56748104095459,
354
+ -13.159852027893066,
355
+ -12.560744285583496,
356
+ -12.327042579650879,
357
+ -13.098484992980957,
358
+ -13.265353202819824,
359
+ -13.08821964263916,
360
+ -12.599993705749512,
361
+ -13.491194725036621,
362
+ -13.431854248046875,
363
+ -13.41433334350586,
364
+ -13.12167739868164,
365
+ -13.244621276855469,
366
+ -14.1083345413208,
367
+ -13.758782386779785,
368
+ -13.726495742797852,
369
+ -13.88464641571045,
370
+ -13.157135963439941,
371
+ -13.105184555053711,
372
+ -12.805330276489258,
373
+ -13.57339096069336,
374
+ -14.142427444458008,
375
+ -14.489392280578613,
376
+ -14.23194694519043,
377
+ -14.446044921875,
378
+ -13.665212631225586,
379
+ -14.616517066955566,
380
+ -14.436517715454102,
381
+ -13.845361709594727,
382
+ -13.804733276367188,
383
+ -13.730453491210938,
384
+ -14.256049156188965,
385
+ -13.56989574432373,
386
+ -13.875513076782227,
387
+ -13.14440631866455,
388
+ -14.191486358642578,
389
+ -14.01298999786377,
390
+ -14.247776985168457,
391
+ -13.457542419433594,
392
+ -14.019203186035156,
393
+ -13.876285552978516,
394
+ -13.785099983215332,
395
+ -14.36813735961914,
396
+ -14.329707145690918,
397
+ -13.76140308380127,
398
+ -13.874360084533691,
399
+ -13.979138374328613,
400
+ -14.142152786254883,
401
+ -13.983951568603516,
402
+ -14.2293119430542,
403
+ -14.110427856445312,
404
+ -13.481212615966797,
405
+ -13.352953910827637,
406
+ -13.77885627746582,
407
+ -13.672810554504395,
408
+ -14.271621704101562,
409
+ -14.000099182128906,
410
+ -13.626543998718262,
411
+ -13.962502479553223,
412
+ -13.572952270507812,
413
+ -13.996663093566895,
414
+ -14.078392028808594,
415
+ -13.966607093811035,
416
+ -13.693870544433594,
417
+ -14.399123191833496,
418
+ -14.0098876953125,
419
+ -13.81348991394043,
420
+ -14.445164680480957,
421
+ -13.953023910522461,
422
+ -13.390979766845703,
423
+ -14.02158260345459,
424
+ -13.58531665802002,
425
+ -14.071144104003906,
426
+ -14.009268760681152,
427
+ -14.096712112426758,
428
+ -14.132247924804688,
429
+ -13.767648696899414,
430
+ -13.715518951416016,
431
+ -13.647896766662598,
432
+ -14.147568702697754,
433
+ -13.230199813842773,
434
+ -13.99448013305664,
435
+ -13.923420906066895,
436
+ -13.942337989807129,
437
+ -13.804627418518066,
438
+ -13.392175674438477,
439
+ -12.837953567504883,
440
+ -13.070643424987793,
441
+ -13.120101928710938,
442
+ -13.86976432800293,
443
+ -13.643270492553711,
444
+ -13.369363784790039,
445
+ -12.956626892089844,
446
+ -13.1434965133667,
447
+ -13.507857322692871,
448
+ -13.006118774414062,
449
+ -12.692553520202637,
450
+ -12.813122749328613,
451
+ -12.225473403930664,
452
+ -11.903809547424316,
453
+ -10.268694877624512,
454
+ -8.495654106140137,
455
+ -7.033803462982178,
456
+ -6.582006454467773,
457
+ -5.818358898162842,
458
+ -5.196183681488037,
459
+ -4.915243148803711,
460
+ -4.249300956726074,
461
+ -4.208031177520752,
462
+ -4.276210784912109,
463
+ -4.114187240600586,
464
+ -4.079606056213379,
465
+ -3.9176602363586426,
466
+ -3.651959180831909,
467
+ -3.572800636291504,
468
+ -3.899899959564209,
469
+ -3.253357172012329,
470
+ -3.1612918376922607,
471
+ -3.3208858966827393,
472
+ -3.3848090171813965,
473
+ -3.2022788524627686,
474
+ -3.420503616333008,
475
+ -3.2170166969299316,
476
+ -3.079822301864624,
477
+ -2.739346504211426,
478
+ -2.9486916065216064,
479
+ -3.182239532470703,
480
+ -2.7178120613098145,
481
+ -3.3026247024536133,
482
+ -3.1974449157714844,
483
+ -2.9400928020477295,
484
+ -3.053345203399658,
485
+ -2.314910888671875,
486
+ -2.9756245613098145,
487
+ -2.937688112258911,
488
+ -2.677002429962158,
489
+ -2.8224380016326904,
490
+ -2.768467426300049,
491
+ -2.4176738262176514,
492
+ -2.5374021530151367,
493
+ -3.2440459728240967,
494
+ -2.8884079456329346,
495
+ -2.809415578842163,
496
+ -2.4866552352905273,
497
+ -2.7317116260528564,
498
+ -1.8125377893447876,
499
+ -2.617854595184326,
500
+ -1.9995617866516113,
501
+ -2.7783727645874023,
502
+ -3.1240453720092773,
503
+ -2.210836887359619,
504
+ -2.5533175468444824,
505
+ -2.9647233486175537,
506
+ -2.007883071899414,
507
+ -2.233142137527466,
508
+ -2.3278913497924805,
509
+ -2.538228750228882,
510
+ -2.2664778232574463,
511
+ -1.813431739807129,
512
+ -2.4405009746551514,
513
+ -2.3692400455474854,
514
+ -2.074908494949341,
515
+ -2.0504086017608643,
516
+ -2.2472660541534424,
517
+ -2.0656344890594482,
518
+ -2.357393503189087,
519
+ -1.9783142805099487,
520
+ -2.097346305847168,
521
+ -2.335299491882324,
522
+ -1.8233290910720825,
523
+ -2.2929933071136475,
524
+ -1.7413837909698486,
525
+ -2.384492874145508,
526
+ -2.1335105895996094,
527
+ -1.5464704036712646,
528
+ -1.9119561910629272,
529
+ -1.6973811388015747,
530
+ -2.2817766666412354,
531
+ -2.3222947120666504,
532
+ -2.296046018600464,
533
+ -1.7667940855026245,
534
+ -1.6567730903625488,
535
+ -1.6351410150527954,
536
+ -1.4980250597000122,
537
+ -2.189903497695923,
538
+ -1.7353428602218628,
539
+ -1.9462618827819824,
540
+ -1.4697139263153076,
541
+ -1.7280217409133911,
542
+ -2.411081075668335,
543
+ -2.1487488746643066,
544
+ -1.7597498893737793,
545
+ -1.771265983581543,
546
+ -1.8300777673721313,
547
+ -1.9071307182312012,
548
+ -1.5723772048950195,
549
+ -2.0543878078460693,
550
+ -1.7049565315246582,
551
+ -1.7995303869247437,
552
+ -1.7827564477920532,
553
+ -2.0536272525787354,
554
+ -1.9578628540039062,
555
+ -1.6535711288452148,
556
+ -1.9253246784210205,
557
+ -1.9923954010009766,
558
+ -1.931577444076538,
559
+ -1.4669015407562256,
560
+ -1.898777961730957,
561
+ -1.882079005241394,
562
+ -1.8351067304611206,
563
+ -1.8482004404067993,
564
+ -1.4887627363204956,
565
+ -1.5922356843948364,
566
+ -1.6491912603378296,
567
+ -1.5675148963928223,
568
+ -1.720570683479309,
569
+ -1.4480400085449219,
570
+ -1.584964632987976,
571
+ -1.2510169744491577,
572
+ -1.4396697282791138,
573
+ -1.7025628089904785,
574
+ -1.57511305809021,
575
+ -1.8179688453674316,
576
+ -1.8571149110794067,
577
+ -1.4414499998092651,
578
+ -1.3842190504074097,
579
+ -1.6883375644683838,
580
+ -1.601452350616455,
581
+ -1.8336045742034912,
582
+ -1.284399151802063,
583
+ -1.288986325263977,
584
+ -1.5190696716308594,
585
+ -1.4586634635925293,
586
+ -1.4343172311782837,
587
+ -1.4818658828735352,
588
+ -1.3453775644302368,
589
+ -1.5217355489730835,
590
+ -1.6131032705307007,
591
+ -1.614372968673706,
592
+ -1.6065467596054077,
593
+ -1.6470931768417358,
594
+ -1.7630650997161865,
595
+ -1.1220555305480957,
596
+ -1.5090004205703735,
597
+ -1.3956247568130493,
598
+ -1.3273143768310547,
599
+ -1.465193510055542,
600
+ -1.2085615396499634,
601
+ -1.5898776054382324,
602
+ -1.4977500438690186,
603
+ -1.2314560413360596,
604
+ -1.574336051940918,
605
+ -1.5404393672943115,
606
+ -1.5331313610076904,
607
+ -1.3918012380599976,
608
+ -1.1956740617752075,
609
+ -1.262143850326538,
610
+ -1.4153560400009155,
611
+ -1.6031506061553955,
612
+ -1.4635738134384155,
613
+ -1.4370183944702148,
614
+ -1.3306372165679932,
615
+ -1.4228017330169678,
616
+ -1.3455251455307007,
617
+ -1.3399231433868408,
618
+ -1.178405523300171,
619
+ -1.2652480602264404,
620
+ -1.3037034273147583,
621
+ -1.2954355478286743,
622
+ -1.4495939016342163,
623
+ -1.5041433572769165,
624
+ -1.499807596206665,
625
+ -1.6011711359024048
626
+ ],
627
+ "base_loss": [
628
+ 10.583792686462402,
629
+ 8.066454887390137,
630
+ 7.359574317932129,
631
+ 6.420194149017334,
632
+ 5.490340232849121,
633
+ 3.802809238433838,
634
+ 2.3162405490875244,
635
+ 2.084392547607422,
636
+ 1.9193041324615479,
637
+ 1.8505445718765259,
638
+ 1.8642131090164185,
639
+ 1.8125228881835938,
640
+ 1.856522560119629,
641
+ 1.8430544137954712,
642
+ 1.8256675004959106,
643
+ 1.8333860635757446,
644
+ 1.7693449258804321,
645
+ 1.8187506198883057,
646
+ 1.8742154836654663,
647
+ 1.797965407371521,
648
+ 1.7965906858444214,
649
+ 1.8261682987213135,
650
+ 1.917641520500183,
651
+ 1.7743865251541138,
652
+ 1.7797601222991943,
653
+ 1.7174644470214844,
654
+ 1.7597808837890625,
655
+ 1.641912579536438,
656
+ 1.6515651941299438,
657
+ 1.7023732662200928,
658
+ 1.6172168254852295,
659
+ 1.7306687831878662,
660
+ 1.701155424118042,
661
+ 1.6607495546340942,
662
+ 1.6990290880203247,
663
+ 1.6403274536132812,
664
+ 1.6816343069076538,
665
+ 1.679869532585144,
666
+ 1.6743011474609375,
667
+ 1.6315648555755615,
668
+ 1.5742610692977905,
669
+ 1.6771800518035889,
670
+ 1.6129316091537476,
671
+ 1.6053324937820435,
672
+ 1.569964051246643,
673
+ 1.6778780221939087,
674
+ 1.6199839115142822,
675
+ 1.6674938201904297,
676
+ 1.6263078451156616,
677
+ 1.623223066329956,
678
+ 1.6771548986434937,
679
+ 1.6433137655258179,
680
+ 1.6295852661132812,
681
+ 1.637642741203308,
682
+ 1.606334924697876,
683
+ 1.5829112529754639,
684
+ 1.5223848819732666,
685
+ 1.59457266330719,
686
+ 1.630057454109192,
687
+ 1.6733797788619995,
688
+ 1.6320444345474243,
689
+ 1.6473969221115112,
690
+ 1.5808079242706299,
691
+ 1.670488953590393,
692
+ 1.6722688674926758,
693
+ 1.591480016708374,
694
+ 1.616097331047058,
695
+ 1.585060715675354,
696
+ 1.6227563619613647,
697
+ 1.5591118335723877,
698
+ 1.5854694843292236,
699
+ 1.5751146078109741,
700
+ 1.6217409372329712,
701
+ 1.6154325008392334,
702
+ 1.6229082345962524,
703
+ 1.5588018894195557,
704
+ 1.5817945003509521,
705
+ 1.565144658088684,
706
+ 1.5754756927490234,
707
+ 1.6284313201904297,
708
+ 1.6797740459442139,
709
+ 1.5707577466964722,
710
+ 1.572632908821106,
711
+ 1.577247977256775,
712
+ 1.5987508296966553,
713
+ 1.6152507066726685,
714
+ 1.6013938188552856,
715
+ 1.6258388757705688,
716
+ 1.5390816926956177,
717
+ 1.5352532863616943,
718
+ 1.605579137802124,
719
+ 1.5561282634735107,
720
+ 1.6051266193389893,
721
+ 1.58786940574646,
722
+ 1.5443556308746338,
723
+ 1.6032781600952148,
724
+ 1.5615407228469849,
725
+ 1.5798014402389526,
726
+ 1.5793745517730713,
727
+ 1.5702213048934937,
728
+ 1.5427759885787964,
729
+ 1.62362802028656,
730
+ 1.5772150754928589,
731
+ 1.557128667831421,
732
+ 1.6311465501785278,
733
+ 1.579343557357788,
734
+ 1.5237773656845093,
735
+ 1.5838626623153687,
736
+ 1.5710700750350952,
737
+ 1.5849696397781372,
738
+ 1.5868189334869385,
739
+ 1.580222487449646,
740
+ 1.5938657522201538,
741
+ 1.557015061378479,
742
+ 1.5417041778564453,
743
+ 1.5307978391647339,
744
+ 1.6002476215362549,
745
+ 1.4829028844833374,
746
+ 1.5972959995269775,
747
+ 1.5759131908416748,
748
+ 1.5614700317382812,
749
+ 1.548891305923462,
750
+ 1.507192611694336,
751
+ 1.4467004537582397,
752
+ 1.467873454093933,
753
+ 1.4952201843261719,
754
+ 1.5538300275802612,
755
+ 1.5384445190429688,
756
+ 1.5040147304534912,
757
+ 1.4669249057769775,
758
+ 1.4912463426589966,
759
+ 1.523524522781372,
760
+ 1.4744774103164673,
761
+ 1.4265775680541992,
762
+ 1.4518784284591675,
763
+ 1.3725693225860596,
764
+ 1.3456714153289795,
765
+ 1.1582497358322144,
766
+ 0.9556323289871216,
767
+ 0.8228430151939392,
768
+ 0.7601378560066223,
769
+ 0.6596508026123047,
770
+ 0.5946040153503418,
771
+ 0.5619922280311584,
772
+ 0.5001639723777771,
773
+ 0.49094894528388977,
774
+ 0.5127306580543518,
775
+ 0.5127319097518921,
776
+ 0.46609529852867126,
777
+ 0.4519447684288025,
778
+ 0.42315152287483215,
779
+ 0.4051882326602936,
780
+ 0.4525225758552551,
781
+ 0.39757633209228516,
782
+ 0.3720526099205017,
783
+ 0.41721227765083313,
784
+ 0.4012520909309387,
785
+ 0.377694696187973,
786
+ 0.42150411009788513,
787
+ 0.372927188873291,
788
+ 0.35469961166381836,
789
+ 0.318009614944458,
790
+ 0.3455231189727783,
791
+ 0.3857307434082031,
792
+ 0.3480704724788666,
793
+ 0.37514179944992065,
794
+ 0.3784138560295105,
795
+ 0.34017255902290344,
796
+ 0.34929636120796204,
797
+ 0.28583255410194397,
798
+ 0.3519895076751709,
799
+ 0.33482006192207336,
800
+ 0.31295791268348694,
801
+ 0.3224482834339142,
802
+ 0.3196558654308319,
803
+ 0.2840682864189148,
804
+ 0.29912450909614563,
805
+ 0.36929866671562195,
806
+ 0.34565314650535583,
807
+ 0.3267846703529358,
808
+ 0.3192231059074402,
809
+ 0.31563252210617065,
810
+ 0.2777107059955597,
811
+ 0.29768094420433044,
812
+ 0.24216410517692566,
813
+ 0.32542404532432556,
814
+ 0.36056867241859436,
815
+ 0.25145214796066284,
816
+ 0.29183194041252136,
817
+ 0.33972468972206116,
818
+ 0.2686130702495575,
819
+ 0.258231520652771,
820
+ 0.2671636641025543,
821
+ 0.2917363941669464,
822
+ 0.25982794165611267,
823
+ 0.23204629123210907,
824
+ 0.28231772780418396,
825
+ 0.27783599495887756,
826
+ 0.2604861855506897,
827
+ 0.2384457290172577,
828
+ 0.255441814661026,
829
+ 0.23715876042842865,
830
+ 0.28448793292045593,
831
+ 0.24126291275024414,
832
+ 0.24047763645648956,
833
+ 0.2671874761581421,
834
+ 0.21945752203464508,
835
+ 0.271971195936203,
836
+ 0.23857174813747406,
837
+ 0.2868176996707916,
838
+ 0.2462073415517807,
839
+ 0.20088985562324524,
840
+ 0.23240797221660614,
841
+ 0.1949901431798935,
842
+ 0.2621559202671051,
843
+ 0.26746684312820435,
844
+ 0.2596105635166168,
845
+ 0.2330942153930664,
846
+ 0.19325841963291168,
847
+ 0.19163039326667786,
848
+ 0.17575077712535858,
849
+ 0.2536766827106476,
850
+ 0.2009972780942917,
851
+ 0.23216930031776428,
852
+ 0.18310262262821198,
853
+ 0.19874657690525055,
854
+ 0.27389222383499146,
855
+ 0.2504861354827881,
856
+ 0.2032155990600586,
857
+ 0.21124167740345,
858
+ 0.22088196873664856,
859
+ 0.22071300446987152,
860
+ 0.19026194512844086,
861
+ 0.23354355990886688,
862
+ 0.1986234188079834,
863
+ 0.20554324984550476,
864
+ 0.20325851440429688,
865
+ 0.23881973326206207,
866
+ 0.2363194078207016,
867
+ 0.19851446151733398,
868
+ 0.22320447862148285,
869
+ 0.22992189228534698,
870
+ 0.23931196331977844,
871
+ 0.16839899122714996,
872
+ 0.21563445031642914,
873
+ 0.21595732867717743,
874
+ 0.22108875215053558,
875
+ 0.21586854755878448,
876
+ 0.171113982796669,
877
+ 0.18106362223625183,
878
+ 0.19026419520378113,
879
+ 0.17992354929447174,
880
+ 0.19903604686260223,
881
+ 0.17338071763515472,
882
+ 0.18208308517932892,
883
+ 0.15474160015583038,
884
+ 0.16776002943515778,
885
+ 0.19435231387615204,
886
+ 0.180166557431221,
887
+ 0.20833714306354523,
888
+ 0.2148302048444748,
889
+ 0.16802255809307098,
890
+ 0.165029838681221,
891
+ 0.19663789868354797,
892
+ 0.19127193093299866,
893
+ 0.21039649844169617,
894
+ 0.1488167941570282,
895
+ 0.1682043820619583,
896
+ 0.17758512496948242,
897
+ 0.16937068104743958,
898
+ 0.175533264875412,
899
+ 0.17081210017204285,
900
+ 0.15519201755523682,
901
+ 0.17511597275733948,
902
+ 0.18463636934757233,
903
+ 0.1841987818479538,
904
+ 0.18462054431438446,
905
+ 0.18654513359069824,
906
+ 0.20274583995342255,
907
+ 0.1301838606595993,
908
+ 0.17495934665203094,
909
+ 0.17271673679351807,
910
+ 0.15609420835971832,
911
+ 0.1670539379119873,
912
+ 0.13983602821826935,
913
+ 0.1888965219259262,
914
+ 0.17140711843967438,
915
+ 0.14202818274497986,
916
+ 0.17892365157604218,
917
+ 0.17807415127754211,
918
+ 0.1745242327451706,
919
+ 0.1601133644580841,
920
+ 0.1374666690826416,
921
+ 0.14927272498607635,
922
+ 0.16191641986370087,
923
+ 0.18267491459846497,
924
+ 0.167189359664917,
925
+ 0.16302575170993805,
926
+ 0.1522405445575714,
927
+ 0.16383804380893707,
928
+ 0.1544777899980545,
929
+ 0.15203754603862762,
930
+ 0.1365201622247696,
931
+ 0.1471976339817047,
932
+ 0.14924056828022003,
933
+ 0.1483282744884491,
934
+ 0.16570642590522766,
935
+ 0.17113836109638214,
936
+ 0.17227718234062195,
937
+ 0.1809764951467514
938
+ ],
939
+ "info_loss": [
940
+ -0.13822269439697266,
941
+ -0.23614931106567383,
942
+ -0.23624515533447266,
943
+ -0.23105287551879883,
944
+ -0.3242683410644531,
945
+ -0.12394833564758301,
946
+ -0.07029557228088379,
947
+ -0.09893393516540527,
948
+ -0.046825528144836426,
949
+ -0.09740293025970459,
950
+ -0.08192431926727295,
951
+ -0.08307325839996338,
952
+ -0.08164334297180176,
953
+ -0.16988539695739746,
954
+ -0.1397857666015625,
955
+ -0.15783727169036865,
956
+ -0.15407419204711914,
957
+ -0.17148029804229736,
958
+ -0.28766489028930664,
959
+ -0.24382555484771729,
960
+ -0.3434123992919922,
961
+ -0.6404982805252075,
962
+ -0.9535881876945496,
963
+ -0.9920961856842041,
964
+ -1.048412561416626,
965
+ -1.0944911241531372,
966
+ -1.1628456115722656,
967
+ -1.0930302143096924,
968
+ -1.135810136795044,
969
+ -1.1862694025039673,
970
+ -1.2093408107757568,
971
+ -1.3165074586868286,
972
+ -1.328871250152588,
973
+ -1.3243379592895508,
974
+ -1.4235337972640991,
975
+ -1.4003045558929443,
976
+ -1.391230583190918,
977
+ -1.4437508583068848,
978
+ -1.5035120248794556,
979
+ -1.4391214847564697,
980
+ -1.4072514772415161,
981
+ -1.494908332824707,
982
+ -1.504333734512329,
983
+ -1.4851349592208862,
984
+ -1.4329886436462402,
985
+ -1.5316672325134277,
986
+ -1.5204179286956787,
987
+ -1.5225586891174316,
988
+ -1.4892361164093018,
989
+ -1.5005210638046265,
990
+ -1.5909022092819214,
991
+ -1.5518944263458252,
992
+ -1.547243356704712,
993
+ -1.5632907152175903,
994
+ -1.4881101846694946,
995
+ -1.4804902076721191,
996
+ -1.4432587623596191,
997
+ -1.528035283088684,
998
+ -1.5881996154785156,
999
+ -1.6270760297775269,
1000
+ -1.5966256856918335,
1001
+ -1.6196050643920898,
1002
+ -1.53391432762146,
1003
+ -1.637223482131958,
1004
+ -1.619842529296875,
1005
+ -1.554161548614502,
1006
+ -1.551828145980835,
1007
+ -1.5415235757827759,
1008
+ -1.59657883644104,
1009
+ -1.5226147174835205,
1010
+ -1.5548325777053833,
1011
+ -1.4818652868270874,
1012
+ -1.5915569067001343,
1013
+ -1.5711668729782104,
1014
+ -1.5963202714920044,
1015
+ -1.510689377784729,
1016
+ -1.5685454607009888,
1017
+ -1.552243709564209,
1018
+ -1.5444592237472534,
1019
+ -1.6080268621444702,
1020
+ -1.609379768371582,
1021
+ -1.5412710905075073,
1022
+ -1.5527178049087524,
1023
+ -1.5639114379882812,
1024
+ -1.5819191932678223,
1025
+ -1.5679680109024048,
1026
+ -1.5901685953140259,
1027
+ -1.582194209098816,
1028
+ -1.5112979412078857,
1029
+ -1.4969711303710938,
1030
+ -1.5462664365768433,
1031
+ -1.5296250581741333,
1032
+ -1.5964444875717163,
1033
+ -1.56596040725708,
1034
+ -1.5249685049057007,
1035
+ -1.5649727582931519,
1036
+ -1.5231212377548218,
1037
+ -1.5654813051223755,
1038
+ -1.5728145837783813,
1039
+ -1.560842752456665,
1040
+ -1.5312010049819946,
1041
+ -1.6095906496047974,
1042
+ -1.566528081893921,
1043
+ -1.5446128845214844,
1044
+ -1.6148988008499146,
1045
+ -1.559473991394043,
1046
+ -1.4984121322631836,
1047
+ -1.5663994550704956,
1048
+ -1.5228196382522583,
1049
+ -1.5721852779388428,
1050
+ -1.5657051801681519,
1051
+ -1.573951244354248,
1052
+ -1.5795037746429443,
1053
+ -1.5383645296096802,
1054
+ -1.532282829284668,
1055
+ -1.5252710580825806,
1056
+ -1.58170485496521,
1057
+ -1.4770863056182861,
1058
+ -1.5646504163742065,
1059
+ -1.5573749542236328,
1060
+ -1.5571423768997192,
1061
+ -1.5411075353622437,
1062
+ -1.4958924055099487,
1063
+ -1.4339350461959839,
1064
+ -1.4592657089233398,
1065
+ -1.4667996168136597,
1066
+ -1.5483533143997192,
1067
+ -1.525352954864502,
1068
+ -1.494500756263733,
1069
+ -1.4485323429107666,
1070
+ -1.470154881477356,
1071
+ -1.5094600915908813,
1072
+ -1.4534693956375122,
1073
+ -1.4192062616348267,
1074
+ -1.430849313735962,
1075
+ -1.365715742111206,
1076
+ -1.3308629989624023,
1077
+ -1.148105502128601,
1078
+ -0.9496700763702393,
1079
+ -0.7906749844551086,
1080
+ -0.7397457957267761,
1081
+ -0.6535822749137878,
1082
+ -0.5858854055404663,
1083
+ -0.5533480048179626,
1084
+ -0.48072874546051025,
1085
+ -0.47489917278289795,
1086
+ -0.48632532358169556,
1087
+ -0.4680827856063843,
1088
+ -0.4620489180088043,
1089
+ -0.44253870844841003,
1090
+ -0.41357550024986267,
1091
+ -0.4023188352584839,
1092
+ -0.44056105613708496,
1093
+ -0.3704988360404968,
1094
+ -0.3581610918045044,
1095
+ -0.37899795174598694,
1096
+ -0.38355591893196106,
1097
+ -0.36309462785720825,
1098
+ -0.3893692195415497,
1099
+ -0.3648320138454437,
1100
+ -0.34819015860557556,
1101
+ -0.3114086389541626,
1102
+ -0.3350915312767029,
1103
+ -0.36147013306617737,
1104
+ -0.31299611926078796,
1105
+ -0.3713478147983551,
1106
+ -0.36294907331466675,
1107
+ -0.33462783694267273,
1108
+ -0.34611016511917114,
1109
+ -0.265610009431839,
1110
+ -0.33830228447914124,
1111
+ -0.3326902389526367,
1112
+ -0.30470603704452515,
1113
+ -0.31881779432296753,
1114
+ -0.31391364336013794,
1115
+ -0.2746647894382477,
1116
+ -0.2890484035015106,
1117
+ -0.3678426444530487,
1118
+ -0.3283480405807495,
1119
+ -0.31812164187431335,
1120
+ -0.2873300015926361,
1121
+ -0.3102010190486908,
1122
+ -0.21345168352127075,
1123
+ -0.2961680591106415,
1124
+ -0.22915704548358917,
1125
+ -0.3161178231239319,
1126
+ -0.3535863757133484,
1127
+ -0.2500080168247223,
1128
+ -0.2886582016944885,
1129
+ -0.3350525498390198,
1130
+ -0.2321719527244568,
1131
+ -0.2558571994304657,
1132
+ -0.2626509368419647,
1133
+ -0.2886291742324829,
1134
+ -0.2582710087299347,
1135
+ -0.2085762321949005,
1136
+ -0.27760010957717896,
1137
+ -0.2701760232448578,
1138
+ -0.23737221956253052,
1139
+ -0.23413917422294617,
1140
+ -0.2549126148223877,
1141
+ -0.23485703766345978,
1142
+ -0.26845604181289673,
1143
+ -0.22846893966197968,
1144
+ -0.23943379521369934,
1145
+ -0.2659887969493866,
1146
+ -0.21204429864883423,
1147
+ -0.2613718509674072,
1148
+ -0.2017609179019928,
1149
+ -0.27505597472190857,
1150
+ -0.2423495203256607,
1151
+ -0.17928309738636017,
1152
+ -0.21955689787864685,
1153
+ -0.1935025304555893,
1154
+ -0.2584647536277771,
1155
+ -0.2643345594406128,
1156
+ -0.258984237909317,
1157
+ -0.20908518135547638,
1158
+ -0.1892842948436737,
1159
+ -0.1874309927225113,
1160
+ -0.17449191212654114,
1161
+ -0.2502930760383606,
1162
+ -0.19810694456100464,
1163
+ -0.22311300039291382,
1164
+ -0.16915571689605713,
1165
+ -0.19783471524715424,
1166
+ -0.27191588282585144,
1167
+ -0.24508187174797058,
1168
+ -0.20009776949882507,
1169
+ -0.2026689201593399,
1170
+ -0.20957694947719574,
1171
+ -0.21848787367343903,
1172
+ -0.18062527477741241,
1173
+ -0.23321673274040222,
1174
+ -0.19512329995632172,
1175
+ -0.20489242672920227,
1176
+ -0.20287422835826874,
1177
+ -0.23402367532253265,
1178
+ -0.22366005182266235,
1179
+ -0.18954592943191528,
1180
+ -0.22067011892795563,
1181
+ -0.22672241926193237,
1182
+ -0.2208995372056961,
1183
+ -0.16791054606437683,
1184
+ -0.21536563336849213,
1185
+ -0.21331483125686646,
1186
+ -0.20978602766990662,
1187
+ -0.21061265468597412,
1188
+ -0.17026440799236298,
1189
+ -0.18054203689098358,
1190
+ -0.18857072293758392,
1191
+ -0.17967435717582703,
1192
+ -0.1986488252878189,
1193
+ -0.16699808835983276,
1194
+ -0.18172207474708557,
1195
+ -0.144958034157753,
1196
+ -0.16621123254299164,
1197
+ -0.19422952830791473,
1198
+ -0.17906028032302856,
1199
+ -0.20765265822410583,
1200
+ -0.2117072194814682,
1201
+ -0.1666542887687683,
1202
+ -0.15931595861911774,
1203
+ -0.19259610772132874,
1204
+ -0.18366043269634247,
1205
+ -0.20917025208473206,
1206
+ -0.14747346937656403,
1207
+ -0.14920273423194885,
1208
+ -0.17642758786678314,
1209
+ -0.16678817570209503,
1210
+ -0.16640248894691467,
1211
+ -0.16970722377300262,
1212
+ -0.15453000366687775,
1213
+ -0.17318691313266754,
1214
+ -0.1839085817337036,
1215
+ -0.1837536096572876,
1216
+ -0.18391980230808258,
1217
+ -0.18582303822040558,
1218
+ -0.20264846086502075,
1219
+ -0.12983135879039764,
1220
+ -0.17368283867835999,
1221
+ -0.16087041795253754,
1222
+ -0.1521586775779724,
1223
+ -0.16673751175403595,
1224
+ -0.13974842429161072,
1225
+ -0.1817723512649536,
1226
+ -0.17127837240695953,
1227
+ -0.14169864356517792,
1228
+ -0.17845776677131653,
1229
+ -0.1764056533575058,
1230
+ -0.17412659525871277,
1231
+ -0.15906667709350586,
1232
+ -0.1370437890291214,
1233
+ -0.14619038999080658,
1234
+ -0.16133344173431396,
1235
+ -0.18260161578655243,
1236
+ -0.16709370911121368,
1237
+ -0.16267499327659607,
1238
+ -0.15166842937469482,
1239
+ -0.16323627531528473,
1240
+ -0.15427052974700928,
1241
+ -0.1518806517124176,
1242
+ -0.1349768340587616,
1243
+ -0.1471162736415863,
1244
+ -0.14908696711063385,
1245
+ -0.14791764318943024,
1246
+ -0.16540926694869995,
1247
+ -0.17110100388526917,
1248
+ -0.17208409309387207,
1249
+ -0.1809041053056717
1250
+ ],
1251
+ "abs_loss": [
1252
+ 3.3980460166931152,
1253
+ 3.369978427886963,
1254
+ 3.3164987564086914,
1255
+ 3.2645981311798096,
1256
+ 3.1180689334869385,
1257
+ 2.889650344848633,
1258
+ 2.6817269325256348,
1259
+ 2.603313684463501,
1260
+ 2.5406126976013184,
1261
+ 2.628107786178589,
1262
+ 2.6164369583129883,
1263
+ 2.6000633239746094,
1264
+ 2.565046787261963,
1265
+ 2.538106918334961,
1266
+ 2.541606903076172,
1267
+ 2.4957196712493896,
1268
+ 2.472607135772705,
1269
+ 2.5442190170288086,
1270
+ 2.616762638092041,
1271
+ 2.3649964332580566,
1272
+ 2.2169899940490723,
1273
+ 1.9707590341567993,
1274
+ 1.5024638175964355,
1275
+ 1.4040004014968872,
1276
+ 1.2410645484924316,
1277
+ 1.2074388265609741,
1278
+ 1.1320998668670654,
1279
+ 1.1608312129974365,
1280
+ 1.1682783365249634,
1281
+ 1.1260359287261963,
1282
+ 1.0213239192962646,
1283
+ 1.0781991481781006,
1284
+ 0.9062473773956299,
1285
+ 0.8747034072875977,
1286
+ 0.8599637150764465,
1287
+ 1.0045547485351562,
1288
+ 0.8823606967926025,
1289
+ 0.812971293926239,
1290
+ 0.9398530721664429,
1291
+ 0.9983369708061218,
1292
+ 0.7522658109664917,
1293
+ 0.8004196286201477,
1294
+ 0.8944302797317505,
1295
+ 0.7996703386306763,
1296
+ 0.7197930812835693,
1297
+ 0.6556458473205566,
1298
+ 0.83084636926651,
1299
+ 0.6907240152359009,
1300
+ 0.6829873919487,
1301
+ 0.7527651786804199,
1302
+ 0.6708750128746033,
1303
+ 0.6388502717018127,
1304
+ 0.6370804905891418,
1305
+ 0.5711989402770996,
1306
+ 0.7286821007728577,
1307
+ 0.7343599200248718,
1308
+ 0.6067296862602234,
1309
+ 0.6763518452644348,
1310
+ 0.6892373561859131,
1311
+ 0.5217660665512085,
1312
+ 0.5720303058624268,
1313
+ 0.5303889513015747,
1314
+ 0.611503541469574,
1315
+ 0.521020233631134,
1316
+ 0.5607292652130127,
1317
+ 0.5533806085586548,
1318
+ 0.6655105352401733,
1319
+ 0.68523108959198,
1320
+ 0.5999661684036255,
1321
+ 0.5807480216026306,
1322
+ 0.5076874494552612,
1323
+ 0.5856181383132935,
1324
+ 0.5579119920730591,
1325
+ 0.5611492991447449,
1326
+ 0.39863288402557373,
1327
+ 0.5875321626663208,
1328
+ 0.5806396007537842,
1329
+ 0.5388836860656738,
1330
+ 0.5461868047714233,
1331
+ 0.5468869209289551,
1332
+ 0.5718828439712524,
1333
+ 0.5671204328536987,
1334
+ 0.5166946649551392,
1335
+ 0.5039520263671875,
1336
+ 0.512236475944519,
1337
+ 0.5827852487564087,
1338
+ 0.5096437335014343,
1339
+ 0.5190230011940002,
1340
+ 0.46621373295783997,
1341
+ 0.46831005811691284,
1342
+ 0.48136916756629944,
1343
+ 0.41866859793663025,
1344
+ 0.5789468288421631,
1345
+ 0.4082232713699341,
1346
+ 0.4730951488018036,
1347
+ 0.5560440421104431,
1348
+ 0.4662611484527588,
1349
+ 0.458769291639328,
1350
+ 0.4554605484008789,
1351
+ 0.35419344902038574,
1352
+ 0.4953368902206421,
1353
+ 0.2719497084617615,
1354
+ 0.39754337072372437,
1355
+ 0.3945605754852295,
1356
+ 0.36380279064178467,
1357
+ 0.4214194118976593,
1358
+ 0.33122456073760986,
1359
+ 0.2835928797721863,
1360
+ 0.4400366246700287,
1361
+ 0.3865411579608917,
1362
+ 0.39365729689598083,
1363
+ 0.3258381485939026,
1364
+ 0.4171220064163208,
1365
+ 0.3371686041355133,
1366
+ 0.34410810470581055,
1367
+ 0.38451898097991943,
1368
+ 0.3573110103607178,
1369
+ 0.39712274074554443,
1370
+ 0.3234259784221649,
1371
+ 0.37105095386505127,
1372
+ 0.3326011896133423,
1373
+ 0.34246066212654114,
1374
+ 0.3365008533000946,
1375
+ 0.3779088258743286,
1376
+ 0.34640663862228394,
1377
+ 0.24549447000026703,
1378
+ 0.27276891469955444,
1379
+ 0.3374707102775574,
1380
+ 0.2775835394859314,
1381
+ 0.20905432105064392,
1382
+ 0.30128228664398193,
1383
+ 0.24552085995674133,
1384
+ 0.3086501359939575,
1385
+ 0.2579006850719452,
1386
+ 0.26246193051338196,
1387
+ 0.23232240974903107,
1388
+ 0.2504483461380005,
1389
+ 0.2467145323753357,
1390
+ 0.2499353289604187,
1391
+ 0.3089613914489746,
1392
+ 0.32342568039894104,
1393
+ 0.29481178522109985,
1394
+ 0.34668678045272827,
1395
+ 0.2800863981246948,
1396
+ 0.21005690097808838,
1397
+ 0.29504430294036865,
1398
+ 0.3435496389865875,
1399
+ 0.2598270773887634,
1400
+ 0.3413766622543335,
1401
+ 0.27513062953948975,
1402
+ 0.2487499713897705,
1403
+ 0.28617170453071594,
1404
+ 0.33789175748825073,
1405
+ 0.3484917879104614,
1406
+ 0.294048547744751,
1407
+ 0.19054007530212402,
1408
+ 0.20470793545246124,
1409
+ 0.2774689495563507,
1410
+ 0.19391252100467682,
1411
+ 0.23970991373062134,
1412
+ 0.22812458872795105,
1413
+ 0.3208765387535095,
1414
+ 0.22734379768371582,
1415
+ 0.21200791001319885,
1416
+ 0.17434161901474,
1417
+ 0.2524522542953491,
1418
+ 0.2736799716949463,
1419
+ 0.3468610942363739,
1420
+ 0.2304113209247589,
1421
+ 0.2211047112941742,
1422
+ 0.2680600881576538,
1423
+ 0.2494480311870575,
1424
+ 0.1454586684703827,
1425
+ 0.16198983788490295,
1426
+ 0.23723238706588745,
1427
+ 0.22418081760406494,
1428
+ 0.19769242405891418,
1429
+ 0.2208307981491089,
1430
+ 0.20500163733959198,
1431
+ 0.22917988896369934,
1432
+ 0.1742870807647705,
1433
+ 0.17347998917102814,
1434
+ 0.15921762585639954,
1435
+ 0.18850788474082947,
1436
+ 0.21649175882339478,
1437
+ 0.1518469750881195,
1438
+ 0.18442171812057495,
1439
+ 0.18402068316936493,
1440
+ 0.15331679582595825,
1441
+ 0.1962621510028839,
1442
+ 0.1557868868112564,
1443
+ 0.21655847132205963,
1444
+ 0.14196164906024933,
1445
+ 0.16651952266693115,
1446
+ 0.16552630066871643,
1447
+ 0.1699790358543396,
1448
+ 0.17379239201545715,
1449
+ 0.20463721454143524,
1450
+ 0.16547945141792297,
1451
+ 0.17575129866600037,
1452
+ 0.1955820918083191,
1453
+ 0.15568506717681885,
1454
+ 0.1336551457643509,
1455
+ 0.15189820528030396,
1456
+ 0.20265045762062073,
1457
+ 0.12927722930908203,
1458
+ 0.17286217212677002,
1459
+ 0.2051667869091034,
1460
+ 0.14176535606384277,
1461
+ 0.19065766036510468,
1462
+ 0.1639125645160675,
1463
+ 0.20288512110710144,
1464
+ 0.14706236124038696,
1465
+ 0.12397182732820511,
1466
+ 0.13666926324367523,
1467
+ 0.1708441972732544,
1468
+ 0.09048313647508621,
1469
+ 0.16668900847434998,
1470
+ 0.13475078344345093,
1471
+ 0.17308390140533447,
1472
+ 0.1450437605381012,
1473
+ 0.17835193872451782,
1474
+ 0.1770174503326416,
1475
+ 0.12992995977401733,
1476
+ 0.16309191286563873,
1477
+ 0.2013746201992035,
1478
+ 0.1292719841003418,
1479
+ 0.1814294308423996,
1480
+ 0.15766873955726624,
1481
+ 0.15577255189418793,
1482
+ 0.14916115999221802,
1483
+ 0.1704961508512497,
1484
+ 0.11911983788013458,
1485
+ 0.10947217047214508,
1486
+ 0.11832094192504883,
1487
+ 0.16997061669826508,
1488
+ 0.12023496627807617,
1489
+ 0.12366921454668045,
1490
+ 0.14696502685546875,
1491
+ 0.21081238985061646,
1492
+ 0.11183337867259979,
1493
+ 0.13474304974079132,
1494
+ 0.12028975784778595,
1495
+ 0.13747942447662354,
1496
+ 0.11091765016317368,
1497
+ 0.13583603501319885,
1498
+ 0.06030312180519104,
1499
+ 0.09970827400684357,
1500
+ 0.12357888370752335,
1501
+ 0.0896293967962265,
1502
+ 0.1271551549434662,
1503
+ 0.12046898901462555,
1504
+ 0.15673765540122986,
1505
+ 0.12015324831008911,
1506
+ 0.12207504361867905,
1507
+ 0.16421657800674438,
1508
+ 0.09508495032787323,
1509
+ 0.1441260576248169,
1510
+ 0.13152356445789337,
1511
+ 0.13145820796489716,
1512
+ 0.14598149061203003,
1513
+ 0.12673842906951904,
1514
+ 0.10492148250341415,
1515
+ 0.10826437175273895,
1516
+ 0.12614858150482178,
1517
+ 0.10947737097740173,
1518
+ 0.10662246495485306,
1519
+ 0.09764628112316132,
1520
+ 0.11726167798042297,
1521
+ 0.11433490365743637,
1522
+ 0.10214796662330627,
1523
+ 0.08775028586387634,
1524
+ 0.06946165859699249,
1525
+ 0.09933647513389587,
1526
+ 0.13902157545089722,
1527
+ 0.09748313575983047,
1528
+ 0.1180696189403534,
1529
+ 0.09541209787130356,
1530
+ 0.12408377975225449,
1531
+ 0.11557712405920029,
1532
+ 0.1257520616054535,
1533
+ 0.08340153098106384,
1534
+ 0.09140900522470474,
1535
+ 0.09548808634281158,
1536
+ 0.10011038929224014,
1537
+ 0.10398255288600922,
1538
+ 0.09144933521747589,
1539
+ 0.10531884431838989,
1540
+ 0.08981457352638245,
1541
+ 0.09359326958656311,
1542
+ 0.12292107194662094,
1543
+ 0.09324193745851517,
1544
+ 0.13378912210464478,
1545
+ 0.11922477185726166,
1546
+ 0.10930902510881424,
1547
+ 0.08063478767871857,
1548
+ 0.08351168036460876,
1549
+ 0.08308646082878113,
1550
+ 0.0905536562204361,
1551
+ 0.09639933705329895,
1552
+ 0.09178976714611053,
1553
+ 0.08503931760787964,
1554
+ 0.09252388030290604,
1555
+ 0.11107531189918518,
1556
+ 0.0956282764673233,
1557
+ 0.11496362835168839,
1558
+ 0.1259007602930069,
1559
+ 0.08518417924642563,
1560
+ 0.13414232432842255,
1561
+ 0.10084954649209976
1562
+ ],
1563
+ "zipf_loss": [
1564
+ 6.812561988830566,
1565
+ 5.833886623382568,
1566
+ 4.236737251281738,
1567
+ 2.906264543533325,
1568
+ 1.9535157680511475,
1569
+ 1.2167904376983643,
1570
+ 0.9806873202323914,
1571
+ 0.8986221551895142,
1572
+ 0.8655501008033752,
1573
+ 0.8595107793807983,
1574
+ 0.8515556454658508,
1575
+ 0.8501031994819641,
1576
+ 0.8473920226097107,
1577
+ 0.8476628065109253,
1578
+ 0.8468807935714722,
1579
+ 0.8478845357894897,
1580
+ 0.8463108539581299,
1581
+ 0.8399034142494202,
1582
+ 0.8167651295661926,
1583
+ 0.7714415788650513,
1584
+ 0.6197283267974854,
1585
+ 0.40534600615501404,
1586
+ 0.2764799892902374,
1587
+ 0.20878319442272186,
1588
+ 0.17731904983520508,
1589
+ 0.16075995564460754,
1590
+ 0.14626535773277283,
1591
+ 0.1460246592760086,
1592
+ 0.14082393050193787,
1593
+ 0.13221590220928192,
1594
+ 0.12891355156898499,
1595
+ 0.12285328656435013,
1596
+ 0.12454423308372498,
1597
+ 0.12241454422473907,
1598
+ 0.11583086848258972,
1599
+ 0.11039087176322937,
1600
+ 0.10492554306983948,
1601
+ 0.10886098444461823,
1602
+ 0.10698096454143524,
1603
+ 0.09907151758670807,
1604
+ 0.09598459303379059,
1605
+ 0.09337620437145233,
1606
+ 0.07560954988002777,
1607
+ 0.07782987505197525,
1608
+ 0.08794909715652466,
1609
+ 0.08203543722629547,
1610
+ 0.06925708055496216,
1611
+ 0.0746869444847107,
1612
+ 0.07607772946357727,
1613
+ 0.06208964064717293,
1614
+ 0.056445829570293427,
1615
+ 0.052963413298130035,
1616
+ 0.052643515169620514,
1617
+ 0.05349712073802948,
1618
+ 0.04476241022348404,
1619
+ 0.04337061941623688,
1620
+ 0.04420023784041405,
1621
+ 0.04475340619683266,
1622
+ 0.040587861090898514,
1623
+ 0.05581096559762955,
1624
+ 0.045061901211738586,
1625
+ 0.04957014322280884,
1626
+ 0.03197324648499489,
1627
+ 0.0331258550286293,
1628
+ 0.03356559947133064,
1629
+ 0.049435731023550034,
1630
+ 0.03089987300336361,
1631
+ 0.031197452917695045,
1632
+ 0.02698611281812191,
1633
+ 0.03906417265534401,
1634
+ 0.03657431900501251,
1635
+ 0.040570054203271866,
1636
+ 0.04655037075281143,
1637
+ 0.027130626142024994,
1638
+ 0.052653223276138306,
1639
+ 0.031796298921108246,
1640
+ 0.02639320306479931,
1641
+ 0.027119144797325134,
1642
+ 0.02939813770353794,
1643
+ 0.02901133894920349,
1644
+ 0.02712780050933361,
1645
+ 0.02383788675069809,
1646
+ 0.02851581573486328,
1647
+ 0.032333821058273315,
1648
+ 0.027064111083745956,
1649
+ 0.022199369966983795,
1650
+ 0.020015262067317963,
1651
+ 0.033772777765989304,
1652
+ 0.0460648313164711,
1653
+ 0.03467245027422905,
1654
+ 0.030091946944594383,
1655
+ 0.025444069877266884,
1656
+ 0.02980213798582554,
1657
+ 0.030813321471214294,
1658
+ 0.03147619962692261,
1659
+ 0.02834276854991913,
1660
+ 0.05009395256638527,
1661
+ 0.03247137740254402,
1662
+ 0.024833565577864647,
1663
+ 0.0361790731549263,
1664
+ 0.025828974321484566,
1665
+ 0.04596130922436714,
1666
+ 0.038424380123615265,
1667
+ 0.03605397790670395,
1668
+ 0.036298178136348724,
1669
+ 0.020230259746313095,
1670
+ 0.03624265640974045,
1671
+ 0.030190177261829376,
1672
+ 0.027806095778942108,
1673
+ 0.02708495408296585,
1674
+ 0.021598979830741882,
1675
+ 0.029994435608386993,
1676
+ 0.027213560417294502,
1677
+ 0.025263624265789986,
1678
+ 0.03119480237364769,
1679
+ 0.03556299954652786,
1680
+ 0.03350179269909859,
1681
+ 0.018048599362373352,
1682
+ 0.02238570898771286,
1683
+ 0.03730948641896248,
1684
+ 0.03435484319925308,
1685
+ 0.023310724645853043,
1686
+ 0.02590544894337654,
1687
+ 0.016905849799513817,
1688
+ 0.01949998363852501,
1689
+ 0.02812476083636284,
1690
+ 0.03266098350286484,
1691
+ 0.03806779906153679,
1692
+ 0.04386970400810242,
1693
+ 0.04086627811193466,
1694
+ 0.0366770401597023,
1695
+ 0.03866710513830185,
1696
+ 0.02323247492313385,
1697
+ 0.04714139550924301,
1698
+ 0.01724546030163765,
1699
+ 0.035882800817489624,
1700
+ 0.03410448879003525,
1701
+ 0.029439300298690796,
1702
+ 0.02041974849998951,
1703
+ 0.01920677162706852,
1704
+ 0.022971099242568016,
1705
+ 0.028331564739346504,
1706
+ 0.03339792788028717,
1707
+ 0.028236214071512222,
1708
+ 0.03681683540344238,
1709
+ 0.02050747722387314,
1710
+ 0.03995659202337265,
1711
+ 0.027925927191972733,
1712
+ 0.04064967483282089,
1713
+ 0.028268780559301376,
1714
+ 0.035769566893577576,
1715
+ 0.01658254861831665,
1716
+ 0.019398927688598633,
1717
+ 0.01920575648546219,
1718
+ 0.0188615582883358,
1719
+ 0.03282739967107773,
1720
+ 0.029027318581938744,
1721
+ 0.023225843906402588,
1722
+ 0.03229328617453575,
1723
+ 0.034405145794153214,
1724
+ 0.02456742897629738,
1725
+ 0.0246428232640028,
1726
+ 0.033966295421123505,
1727
+ 0.025529980659484863,
1728
+ 0.046644628047943115,
1729
+ 0.010466357693076134,
1730
+ 0.02626398205757141,
1731
+ 0.031327031552791595,
1732
+ 0.03541884943842888,
1733
+ 0.0332460030913353,
1734
+ 0.028602520003914833,
1735
+ 0.029449403285980225,
1736
+ 0.04255424439907074,
1737
+ 0.027092909440398216,
1738
+ 0.027289755642414093,
1739
+ 0.022487711161375046,
1740
+ 0.03418818116188049,
1741
+ 0.0429987795650959,
1742
+ 0.028919201344251633,
1743
+ 0.022098271176218987,
1744
+ 0.04999305680394173,
1745
+ 0.037317924201488495,
1746
+ 0.028346505016088486,
1747
+ 0.0272943377494812,
1748
+ 0.028195345774292946,
1749
+ 0.042196765542030334,
1750
+ 0.03280748426914215,
1751
+ 0.019388850778341293,
1752
+ 0.02610059455037117,
1753
+ 0.02645121142268181,
1754
+ 0.029644761234521866,
1755
+ 0.04554266110062599,
1756
+ 0.017258264124393463,
1757
+ 0.03967483341693878,
1758
+ 0.039851561188697815,
1759
+ 0.023286346346139908,
1760
+ 0.03580312803387642,
1761
+ 0.034220561385154724,
1762
+ 0.021779578179121017,
1763
+ 0.03496241196990013,
1764
+ 0.026859907433390617,
1765
+ 0.030208542943000793,
1766
+ 0.02931339666247368,
1767
+ 0.0499223992228508,
1768
+ 0.03624880686402321,
1769
+ 0.044473424553871155,
1770
+ 0.06037009879946709,
1771
+ 0.028237389400601387,
1772
+ 0.02347707562148571,
1773
+ 0.06018330156803131,
1774
+ 0.02738623507320881,
1775
+ 0.025182217359542847,
1776
+ 0.03649861738085747,
1777
+ 0.030256854370236397,
1778
+ 0.027048002928495407,
1779
+ 0.03649982810020447,
1780
+ 0.025137431919574738,
1781
+ 0.0742945745587349,
1782
+ 0.029336459934711456,
1783
+ 0.0302302036434412,
1784
+ 0.05663887783885002,
1785
+ 0.041515450924634933,
1786
+ 0.02702762745320797,
1787
+ 0.039706043899059296,
1788
+ 0.022431524470448494,
1789
+ 0.031441450119018555,
1790
+ 0.021258242428302765,
1791
+ 0.0334407240152359,
1792
+ 0.022245360538363457,
1793
+ 0.028604380786418915,
1794
+ 0.029893646016716957,
1795
+ 0.03998545557260513,
1796
+ 0.03170153498649597,
1797
+ 0.033288709819316864,
1798
+ 0.03582096844911575,
1799
+ 0.026853401213884354,
1800
+ 0.030703924596309662,
1801
+ 0.03542246297001839,
1802
+ 0.027721714228391647,
1803
+ 0.022292520850896835,
1804
+ 0.04698874428868294,
1805
+ 0.03143282234668732,
1806
+ 0.02607708051800728,
1807
+ 0.03005710244178772,
1808
+ 0.02815207839012146,
1809
+ 0.021528279408812523,
1810
+ 0.035634540021419525,
1811
+ 0.03208673745393753,
1812
+ 0.030409611761569977,
1813
+ 0.023158103227615356,
1814
+ 0.03353625908493996,
1815
+ 0.03725823760032654,
1816
+ 0.0512077771127224,
1817
+ 0.036544814705848694,
1818
+ 0.037965454161167145,
1819
+ 0.027400074526667595,
1820
+ 0.04517415910959244,
1821
+ 0.030967533588409424,
1822
+ 0.022170791402459145,
1823
+ 0.03707485273480415,
1824
+ 0.0305289588868618,
1825
+ 0.04439655691385269,
1826
+ 0.033418457955121994,
1827
+ 0.030159130692481995,
1828
+ 0.03126520290970802,
1829
+ 0.036753639578819275,
1830
+ 0.030856451019644737,
1831
+ 0.025071844458580017,
1832
+ 0.05589497834444046,
1833
+ 0.02841416746377945,
1834
+ 0.04395944997668266,
1835
+ 0.03561931848526001,
1836
+ 0.03778424113988876,
1837
+ 0.025084055960178375,
1838
+ 0.027444057166576385,
1839
+ 0.029216008260846138,
1840
+ 0.03622381016612053,
1841
+ 0.015050912275910378,
1842
+ 0.0482652485370636,
1843
+ 0.034516554325819016,
1844
+ 0.04029349237680435,
1845
+ 0.03202264383435249,
1846
+ 0.029037408530712128,
1847
+ 0.025578860193490982,
1848
+ 0.03907560929656029,
1849
+ 0.028551045805215836,
1850
+ 0.03448163717985153,
1851
+ 0.03297030180692673,
1852
+ 0.02233646810054779,
1853
+ 0.036183737218379974,
1854
+ 0.02131832018494606,
1855
+ 0.029427960515022278,
1856
+ 0.02391825243830681,
1857
+ 0.038564980030059814,
1858
+ 0.025131095200777054,
1859
+ 0.032127249985933304,
1860
+ 0.031822703778743744,
1861
+ 0.018397251144051552,
1862
+ 0.02475113421678543,
1863
+ 0.03608299791812897,
1864
+ 0.0335233137011528,
1865
+ 0.01834193244576454,
1866
+ 0.02559027075767517,
1867
+ 0.047609567642211914,
1868
+ 0.028362805023789406,
1869
+ 0.023916248232126236,
1870
+ 0.02620236761868,
1871
+ 0.02720978669822216,
1872
+ 0.035341836512088776,
1873
+ 0.016808412969112396
1874
+ ],
1875
+ "denoise_loss": [],
1876
+ "ortho_loss": [
1877
+ 0.827428936958313,
1878
+ 0.671424925327301,
1879
+ 0.4355371594429016,
1880
+ 0.2761383056640625,
1881
+ 0.19764411449432373,
1882
+ 0.1639745831489563,
1883
+ 0.13044804334640503,
1884
+ 0.09763513505458832,
1885
+ 0.08025705814361572,
1886
+ 0.06304512917995453,
1887
+ 0.052203983068466187,
1888
+ 0.04871360585093498,
1889
+ 0.047047827392816544,
1890
+ 0.045929357409477234,
1891
+ 0.046626560389995575,
1892
+ 0.051150523126125336,
1893
+ 0.04976411908864975,
1894
+ 0.04797111451625824,
1895
+ 0.04966820031404495,
1896
+ 0.0512523427605629,
1897
+ 0.05399706959724426,
1898
+ 0.06475960463285446,
1899
+ 0.0754888579249382,
1900
+ 0.08560491353273392,
1901
+ 0.0921943187713623,
1902
+ 0.09945797175168991,
1903
+ 0.10485729575157166,
1904
+ 0.1072235181927681,
1905
+ 0.11412574350833893,
1906
+ 0.11918080598115921,
1907
+ 0.12542453408241272,
1908
+ 0.13089101016521454,
1909
+ 0.13531622290611267,
1910
+ 0.13845030963420868,
1911
+ 0.142812579870224,
1912
+ 0.1476566642522812,
1913
+ 0.15259936451911926,
1914
+ 0.1554049253463745,
1915
+ 0.16178391873836517,
1916
+ 0.16461075842380524,
1917
+ 0.1640101671218872,
1918
+ 0.16973431408405304,
1919
+ 0.17018891870975494,
1920
+ 0.1709456443786621,
1921
+ 0.1720433235168457,
1922
+ 0.17485295236110687,
1923
+ 0.179266557097435,
1924
+ 0.18221420049667358,
1925
+ 0.18234266340732574,
1926
+ 0.18083101511001587,
1927
+ 0.18191446363925934,
1928
+ 0.1810181885957718,
1929
+ 0.18036189675331116,
1930
+ 0.1824311763048172,
1931
+ 0.1812783032655716,
1932
+ 0.1808960884809494,
1933
+ 0.18026043474674225,
1934
+ 0.17999278008937836,
1935
+ 0.18125073611736298,
1936
+ 0.1799735575914383,
1937
+ 0.18007639050483704,
1938
+ 0.1817018836736679,
1939
+ 0.17534105479717255,
1940
+ 0.17151685059070587,
1941
+ 0.17263628542423248,
1942
+ 0.17425446212291718,
1943
+ 0.17311222851276398,
1944
+ 0.17309057712554932,
1945
+ 0.17657621204853058,
1946
+ 0.18002821505069733,
1947
+ 0.1744808852672577,
1948
+ 0.17262759804725647,
1949
+ 0.17171679437160492,
1950
+ 0.17160746455192566,
1951
+ 0.1765274852514267,
1952
+ 0.1734113246202469,
1953
+ 0.17856542766094208,
1954
+ 0.17718186974525452,
1955
+ 0.18131829798221588,
1956
+ 0.1788182407617569,
1957
+ 0.17792543768882751,
1958
+ 0.1823016107082367,
1959
+ 0.18500618636608124,
1960
+ 0.18381965160369873,
1961
+ 0.19101843237876892,
1962
+ 0.18853366374969482,
1963
+ 0.18821357190608978,
1964
+ 0.1886235922574997,
1965
+ 0.18627484142780304,
1966
+ 0.17950628697872162,
1967
+ 0.18204718828201294,
1968
+ 0.1802850067615509,
1969
+ 0.1805403083562851,
1970
+ 0.18575280904769897,
1971
+ 0.18664105236530304,
1972
+ 0.19113248586654663,
1973
+ 0.19141356647014618,
1974
+ 0.19219623506069183,
1975
+ 0.19271692633628845,
1976
+ 0.19056299328804016,
1977
+ 0.19620807468891144,
1978
+ 0.19899681210517883,
1979
+ 0.20227837562561035,
1980
+ 0.2044687271118164,
1981
+ 0.2060144543647766,
1982
+ 0.20563283562660217,
1983
+ 0.20243804156780243,
1984
+ 0.19240102171897888,
1985
+ 0.19863666594028473,
1986
+ 0.2030983716249466,
1987
+ 0.2072049379348755,
1988
+ 0.20826730132102966,
1989
+ 0.2071978747844696,
1990
+ 0.20865215361118317,
1991
+ 0.20026527345180511,
1992
+ 0.20367886126041412,
1993
+ 0.20545694231987,
1994
+ 0.20512835681438446,
1995
+ 0.20140065252780914,
1996
+ 0.20723676681518555,
1997
+ 0.20945851504802704,
1998
+ 0.21112161874771118,
1999
+ 0.21480081975460052,
2000
+ 0.21333807706832886,
2001
+ 0.2173749953508377,
2002
+ 0.21565650403499603,
2003
+ 0.21041904389858246,
2004
+ 0.21454955637454987,
2005
+ 0.21502478420734406,
2006
+ 0.2122405767440796,
2007
+ 0.21353724598884583,
2008
+ 0.2195930927991867,
2009
+ 0.22009789943695068,
2010
+ 0.2219575196504593,
2011
+ 0.2279929369688034,
2012
+ 0.22722227871418,
2013
+ 0.23112311959266663,
2014
+ 0.23142953217029572,
2015
+ 0.2327469438314438,
2016
+ 0.2316807061433792,
2017
+ 0.2384343296289444,
2018
+ 0.2477462887763977,
2019
+ 0.2541239857673645,
2020
+ 0.2609383165836334,
2021
+ 0.26400136947631836,
2022
+ 0.27505865693092346,
2023
+ 0.2738339900970459,
2024
+ 0.2789699137210846,
2025
+ 0.2832750678062439,
2026
+ 0.28833818435668945,
2027
+ 0.29126831889152527,
2028
+ 0.29266005754470825,
2029
+ 0.29452967643737793,
2030
+ 0.2978121042251587,
2031
+ 0.2987567186355591,
2032
+ 0.30246785283088684,
2033
+ 0.307929664850235,
2034
+ 0.3047032952308655,
2035
+ 0.30671849846839905,
2036
+ 0.30758509039878845,
2037
+ 0.30814602971076965,
2038
+ 0.31224527955055237,
2039
+ 0.3103698790073395,
2040
+ 0.31271615624427795,
2041
+ 0.31407102942466736,
2042
+ 0.3142327666282654,
2043
+ 0.31299009919166565,
2044
+ 0.3166446387767792,
2045
+ 0.3147873878479004,
2046
+ 0.31458809971809387,
2047
+ 0.31245267391204834,
2048
+ 0.31644007563591003,
2049
+ 0.3156980276107788,
2050
+ 0.3200494050979614,
2051
+ 0.32049500942230225,
2052
+ 0.3200150430202484,
2053
+ 0.3233881890773773,
2054
+ 0.3243626356124878,
2055
+ 0.32112860679626465,
2056
+ 0.3201987147331238,
2057
+ 0.3216695487499237,
2058
+ 0.32685965299606323,
2059
+ 0.32346639037132263,
2060
+ 0.32615596055984497,
2061
+ 0.32929402589797974,
2062
+ 0.330515056848526,
2063
+ 0.3298525810241699,
2064
+ 0.3309860825538635,
2065
+ 0.33082884550094604,
2066
+ 0.3283136785030365,
2067
+ 0.32374125719070435,
2068
+ 0.3230162262916565,
2069
+ 0.32241517305374146,
2070
+ 0.3309914767742157,
2071
+ 0.32828187942504883,
2072
+ 0.3306802809238434,
2073
+ 0.3282453417778015,
2074
+ 0.330154150724411,
2075
+ 0.33348920941352844,
2076
+ 0.33330708742141724,
2077
+ 0.3393866717815399,
2078
+ 0.3331195116043091,
2079
+ 0.3384978175163269,
2080
+ 0.33747807145118713,
2081
+ 0.33147355914115906,
2082
+ 0.33095183968544006,
2083
+ 0.33170023560523987,
2084
+ 0.33314263820648193,
2085
+ 0.33552658557891846,
2086
+ 0.335514098405838,
2087
+ 0.3355313241481781,
2088
+ 0.3361027240753174,
2089
+ 0.33816108107566833,
2090
+ 0.33751001954078674,
2091
+ 0.333874374628067,
2092
+ 0.3335190415382385,
2093
+ 0.3304026126861572,
2094
+ 0.33213523030281067,
2095
+ 0.33157700300216675,
2096
+ 0.33280616998672485,
2097
+ 0.33208560943603516,
2098
+ 0.32953083515167236,
2099
+ 0.3310057520866394,
2100
+ 0.33369043469429016,
2101
+ 0.33322376012802124,
2102
+ 0.33351776003837585,
2103
+ 0.33360275626182556,
2104
+ 0.3334753215312958,
2105
+ 0.33686330914497375,
2106
+ 0.3349614143371582,
2107
+ 0.3361343443393707,
2108
+ 0.3360339403152466,
2109
+ 0.33757269382476807,
2110
+ 0.33795565366744995,
2111
+ 0.33851340413093567,
2112
+ 0.3372805416584015,
2113
+ 0.34057605266571045,
2114
+ 0.3405458629131317,
2115
+ 0.34144896268844604,
2116
+ 0.34201014041900635,
2117
+ 0.3403547704219818,
2118
+ 0.3434809744358063,
2119
+ 0.3442747890949249,
2120
+ 0.3466796576976776,
2121
+ 0.3471396565437317,
2122
+ 0.3460945785045624,
2123
+ 0.34654906392097473,
2124
+ 0.34674072265625,
2125
+ 0.3492203652858734,
2126
+ 0.348775714635849,
2127
+ 0.3491442799568176,
2128
+ 0.3496403396129608,
2129
+ 0.3488059639930725,
2130
+ 0.3496220111846924,
2131
+ 0.3533368408679962,
2132
+ 0.3526526987552643,
2133
+ 0.3511108458042145,
2134
+ 0.35070398449897766,
2135
+ 0.35075801610946655,
2136
+ 0.3511902689933777,
2137
+ 0.35225415229797363,
2138
+ 0.3524736166000366,
2139
+ 0.3527209162712097,
2140
+ 0.3549518585205078,
2141
+ 0.35588890314102173,
2142
+ 0.35622313618659973,
2143
+ 0.3560788929462433,
2144
+ 0.35539689660072327,
2145
+ 0.35661858320236206,
2146
+ 0.3575516939163208,
2147
+ 0.3581475019454956,
2148
+ 0.3578368127346039,
2149
+ 0.35904768109321594,
2150
+ 0.3596513867378235,
2151
+ 0.36070311069488525,
2152
+ 0.36103060841560364,
2153
+ 0.36321330070495605,
2154
+ 0.363923579454422,
2155
+ 0.3643174171447754,
2156
+ 0.36385178565979004,
2157
+ 0.3644620478153229,
2158
+ 0.3653315305709839,
2159
+ 0.3654240369796753,
2160
+ 0.3666748106479645,
2161
+ 0.36774975061416626,
2162
+ 0.3677917420864105,
2163
+ 0.367666631937027,
2164
+ 0.36842453479766846,
2165
+ 0.3692092001438141,
2166
+ 0.3693569004535675,
2167
+ 0.36985817551612854,
2168
+ 0.3703119158744812,
2169
+ 0.3706112205982208,
2170
+ 0.370940238237381,
2171
+ 0.37099459767341614,
2172
+ 0.3713039457798004,
2173
+ 0.3717826008796692,
2174
+ 0.37260204553604126,
2175
+ 0.3729584813117981,
2176
+ 0.37327811121940613,
2177
+ 0.37369832396507263,
2178
+ 0.37419503927230835,
2179
+ 0.3748515248298645,
2180
+ 0.37514984607696533,
2181
+ 0.37567055225372314,
2182
+ 0.3761422038078308,
2183
+ 0.3766128718852997,
2184
+ 0.37726834416389465,
2185
+ 0.37740060687065125,
2186
+ 0.37733811140060425
2187
+ ],
2188
+ "lr": [
2189
+ 4.188034188034189e-06,
2190
+ 8.461538461538462e-06,
2191
+ 1.2735042735042738e-05,
2192
+ 1.700854700854701e-05,
2193
+ 2.1282051282051282e-05,
2194
+ 2.5555555555555557e-05,
2195
+ 2.9829059829059833e-05,
2196
+ 3.4102564102564105e-05,
2197
+ 3.837606837606838e-05,
2198
+ 4e-05,
2199
+ 4e-05,
2200
+ 4e-05,
2201
+ 4e-05,
2202
+ 4e-05,
2203
+ 4e-05,
2204
+ 4e-05,
2205
+ 4e-05,
2206
+ 4e-05,
2207
+ 4e-05,
2208
+ 4e-05,
2209
+ 4e-05,
2210
+ 4e-05,
2211
+ 4e-05,
2212
+ 4e-05,
2213
+ 4e-05,
2214
+ 4e-05,
2215
+ 4e-05,
2216
+ 4e-05,
2217
+ 4e-05,
2218
+ 4e-05,
2219
+ 4e-05,
2220
+ 4e-05,
2221
+ 4e-05,
2222
+ 4e-05,
2223
+ 4e-05,
2224
+ 4e-05,
2225
+ 4e-05,
2226
+ 4e-05,
2227
+ 4e-05,
2228
+ 4e-05,
2229
+ 4e-05,
2230
+ 4e-05,
2231
+ 4e-05,
2232
+ 4e-05,
2233
+ 4e-05,
2234
+ 4e-05,
2235
+ 4e-05,
2236
+ 4e-05,
2237
+ 4e-05,
2238
+ 4e-05,
2239
+ 4e-05,
2240
+ 4e-05,
2241
+ 4e-05,
2242
+ 4e-05,
2243
+ 4e-05,
2244
+ 4e-05,
2245
+ 4e-05,
2246
+ 4e-05,
2247
+ 4e-05,
2248
+ 4e-05,
2249
+ 4e-05,
2250
+ 4e-05,
2251
+ 4e-05,
2252
+ 4e-05,
2253
+ 4e-05,
2254
+ 4e-05,
2255
+ 4e-05,
2256
+ 4e-05,
2257
+ 4e-05,
2258
+ 4e-05,
2259
+ 4e-05,
2260
+ 4e-05,
2261
+ 4e-05,
2262
+ 4e-05,
2263
+ 4e-05,
2264
+ 4e-05,
2265
+ 4e-05,
2266
+ 4e-05,
2267
+ 4e-05,
2268
+ 4e-05,
2269
+ 4e-05,
2270
+ 4e-05,
2271
+ 4e-05,
2272
+ 4e-05,
2273
+ 4e-05,
2274
+ 4e-05,
2275
+ 4e-05,
2276
+ 4e-05,
2277
+ 4e-05,
2278
+ 4e-05,
2279
+ 4e-05,
2280
+ 4e-05,
2281
+ 4e-05,
2282
+ 4e-05,
2283
+ 4e-05,
2284
+ 4e-05,
2285
+ 4e-05,
2286
+ 4e-05,
2287
+ 4e-05,
2288
+ 4e-05,
2289
+ 4e-05,
2290
+ 4e-05,
2291
+ 4e-05,
2292
+ 4e-05,
2293
+ 4e-05,
2294
+ 4e-05,
2295
+ 4e-05,
2296
+ 4e-05,
2297
+ 4e-05,
2298
+ 4e-05,
2299
+ 4e-05,
2300
+ 4e-05,
2301
+ 4e-05,
2302
+ 4e-05,
2303
+ 4e-05,
2304
+ 4e-05,
2305
+ 4e-05,
2306
+ 4e-05,
2307
+ 4e-05,
2308
+ 4e-05,
2309
+ 4e-05,
2310
+ 4e-05,
2311
+ 4e-05,
2312
+ 4e-05,
2313
+ 4e-05,
2314
+ 4e-05,
2315
+ 4e-05,
2316
+ 4e-05,
2317
+ 4e-05,
2318
+ 4e-05,
2319
+ 4e-05,
2320
+ 4e-05,
2321
+ 4e-05,
2322
+ 4e-05,
2323
+ 4e-05,
2324
+ 4e-05,
2325
+ 4e-05,
2326
+ 4e-05,
2327
+ 4e-05,
2328
+ 4e-05,
2329
+ 4e-05,
2330
+ 4e-05,
2331
+ 4e-05,
2332
+ 4e-05,
2333
+ 4e-05,
2334
+ 4e-05,
2335
+ 4e-05,
2336
+ 4e-05,
2337
+ 4e-05,
2338
+ 4e-05,
2339
+ 4e-05,
2340
+ 4e-05,
2341
+ 4e-05,
2342
+ 4e-05,
2343
+ 4e-05,
2344
+ 4e-05,
2345
+ 4e-05,
2346
+ 4e-05,
2347
+ 4e-05,
2348
+ 4e-05,
2349
+ 4e-05,
2350
+ 4e-05,
2351
+ 4e-05,
2352
+ 4e-05,
2353
+ 4e-05,
2354
+ 4e-05,
2355
+ 4e-05,
2356
+ 4e-05,
2357
+ 4e-05,
2358
+ 4e-05,
2359
+ 4e-05,
2360
+ 4e-05,
2361
+ 4e-05,
2362
+ 4e-05,
2363
+ 4e-05,
2364
+ 4e-05,
2365
+ 4e-05,
2366
+ 4e-05,
2367
+ 4e-05,
2368
+ 4e-05,
2369
+ 4e-05,
2370
+ 4e-05,
2371
+ 4e-05,
2372
+ 4e-05,
2373
+ 4e-05,
2374
+ 4e-05,
2375
+ 4e-05,
2376
+ 4e-05,
2377
+ 4e-05,
2378
+ 3.992995647012267e-05,
2379
+ 3.963316185199842e-05,
2380
+ 3.933636723387416e-05,
2381
+ 3.90395726157499e-05,
2382
+ 3.874277799762565e-05,
2383
+ 3.844598337950139e-05,
2384
+ 3.814918876137713e-05,
2385
+ 3.785239414325287e-05,
2386
+ 3.7555599525128613e-05,
2387
+ 3.725880490700435e-05,
2388
+ 3.696201028888009e-05,
2389
+ 3.666521567075585e-05,
2390
+ 3.6368421052631585e-05,
2391
+ 3.607162643450732e-05,
2392
+ 3.577483181638307e-05,
2393
+ 3.547803719825881e-05,
2394
+ 3.518124258013455e-05,
2395
+ 3.4884447962010287e-05,
2396
+ 3.458765334388604e-05,
2397
+ 3.4290858725761776e-05,
2398
+ 3.399406410763751e-05,
2399
+ 3.3697269489513265e-05,
2400
+ 3.3400474871389e-05,
2401
+ 3.310368025326474e-05,
2402
+ 3.280688563514048e-05,
2403
+ 3.251009101701623e-05,
2404
+ 3.2213296398891967e-05,
2405
+ 3.191650178076771e-05,
2406
+ 3.1542540561931145e-05,
2407
+ 3.124574594380688e-05,
2408
+ 3.094895132568263e-05,
2409
+ 3.065215670755838e-05,
2410
+ 3.0355362089434113e-05,
2411
+ 3.0058567471309854e-05,
2412
+ 2.97617728531856e-05,
2413
+ 2.9464978235061336e-05,
2414
+ 2.9168183616937077e-05,
2415
+ 2.8871388998812818e-05,
2416
+ 2.857459438068857e-05,
2417
+ 2.8277799762564307e-05,
2418
+ 2.798100514444005e-05,
2419
+ 2.7684210526315793e-05,
2420
+ 2.738741590819153e-05,
2421
+ 2.709062129006727e-05,
2422
+ 2.6793826671943013e-05,
2423
+ 2.6497032053818764e-05,
2424
+ 2.62002374356945e-05,
2425
+ 2.5903442817570243e-05,
2426
+ 2.5606648199445987e-05,
2427
+ 2.5309853581321725e-05,
2428
+ 2.5013058963197466e-05,
2429
+ 2.4716264345073214e-05,
2430
+ 2.441946972694896e-05,
2431
+ 2.4122675108824693e-05,
2432
+ 2.3825880490700434e-05,
2433
+ 2.352908587257618e-05,
2434
+ 2.3232291254451916e-05,
2435
+ 2.293549663632766e-05,
2436
+ 2.2638702018203408e-05,
2437
+ 2.226474079936684e-05,
2438
+ 2.196794618124258e-05,
2439
+ 2.1671151563118328e-05,
2440
+ 2.1374356944994066e-05,
2441
+ 2.1077562326869803e-05,
2442
+ 2.0780767708745554e-05,
2443
+ 2.0483973090621296e-05,
2444
+ 2.018717847249703e-05,
2445
+ 1.989038385437277e-05,
2446
+ 1.959358923624852e-05,
2447
+ 1.929679461812426e-05,
2448
+ 1.8999999999999998e-05,
2449
+ 1.8703205381875746e-05,
2450
+ 1.8406410763751487e-05,
2451
+ 1.8109616145627224e-05,
2452
+ 1.7812821527502965e-05,
2453
+ 1.7516026909378713e-05,
2454
+ 1.7219232291254454e-05,
2455
+ 1.6922437673130192e-05,
2456
+ 1.662564305500594e-05,
2457
+ 1.632884843688168e-05,
2458
+ 1.603205381875742e-05,
2459
+ 1.573525920063316e-05,
2460
+ 1.5438464582508908e-05,
2461
+ 1.5141669964384647e-05,
2462
+ 1.4844875346260385e-05,
2463
+ 1.4548080728136134e-05,
2464
+ 1.4251286110011875e-05,
2465
+ 1.3954491491887611e-05,
2466
+ 1.3657696873763363e-05,
2467
+ 1.33609022556391e-05,
2468
+ 1.298694103680253e-05,
2469
+ 1.2690146418678277e-05,
2470
+ 1.2393351800554018e-05,
2471
+ 1.2096557182429756e-05,
2472
+ 1.1799762564305506e-05,
2473
+ 1.1502967946181245e-05,
2474
+ 1.1206173328056984e-05,
2475
+ 1.0909378709932724e-05,
2476
+ 1.0612584091808472e-05,
2477
+ 1.0315789473684213e-05,
2478
+ 1.0018994855559949e-05,
2479
+ 9.7222002374357e-06,
2480
+ 9.425405619311438e-06,
2481
+ 9.128611001187177e-06,
2482
+ 8.831816383062916e-06,
2483
+ 8.535021764938666e-06,
2484
+ 8.238227146814405e-06,
2485
+ 7.941432528690143e-06,
2486
+ 7.644637910565893e-06,
2487
+ 7.347843292441632e-06,
2488
+ 7.0510486743173715e-06,
2489
+ 6.75425405619311e-06,
2490
+ 6.45745943806886e-06,
2491
+ 6.160664819944598e-06,
2492
+ 5.8638702018203375e-06,
2493
+ 5.567075583696086e-06,
2494
+ 5.270280965571826e-06,
2495
+ 4.973486347447565e-06,
2496
+ 4.676691729323314e-06,
2497
+ 4.379897111199053e-06,
2498
+ 4.083102493074792e-06
2499
+ ],
2500
+ "emb_lr": [],
2501
+ "eval_step": [
2502
+ 1550,
2503
+ 3113,
2504
+ 4676,
2505
+ 6239,
2506
+ 7802,
2507
+ 9365,
2508
+ 10928,
2509
+ 12491,
2510
+ 14054,
2511
+ 15617
2512
+ ],
2513
+ "eval_accuracy": [
2514
+ 0.26,
2515
+ 0.83,
2516
+ 0.94,
2517
+ 0.95,
2518
+ 0.95,
2519
+ 0.95,
2520
+ 0.92,
2521
+ 0.98,
2522
+ 1.0,
2523
+ 1.0
2524
+ ]
2525
+ },
2526
+ "final_accuracy": 0.96125,
2527
+ "sft_eval": {
2528
+ "config": {
2529
+ "ops": "add_sub",
2530
+ "K": null,
2531
+ "mode": "sft",
2532
+ "n_digits": 6,
2533
+ "n_per_split": 100
2534
+ },
2535
+ "splits": {
2536
+ "add_S0": {
2537
+ "full_accuracy": 0.73,
2538
+ "n_examples": 100,
2539
+ "per_subtask": {
2540
+ "SA": {
2541
+ "accuracy": 0.9570247933884297,
2542
+ "count": 605
2543
+ },
2544
+ "SS": {
2545
+ "accuracy": 0.9789473684210527,
2546
+ "count": 95
2547
+ }
2548
+ }
2549
+ },
2550
+ "add_S1": {
2551
+ "full_accuracy": 0.77,
2552
+ "n_examples": 100,
2553
+ "per_subtask": {
2554
+ "SA": {
2555
+ "accuracy": 0.946078431372549,
2556
+ "count": 204
2557
+ },
2558
+ "SC": {
2559
+ "accuracy": 0.9822485207100592,
2560
+ "count": 169
2561
+ },
2562
+ "SS": {
2563
+ "accuracy": 0.967741935483871,
2564
+ "count": 31
2565
+ },
2566
+ "UC": {
2567
+ "accuracy": 0.9662162162162162,
2568
+ "count": 296
2569
+ }
2570
+ }
2571
+ },
2572
+ "add_S2": {
2573
+ "full_accuracy": 0.49,
2574
+ "n_examples": 100,
2575
+ "per_subtask": {
2576
+ "SA": {
2577
+ "accuracy": 0.9631901840490797,
2578
+ "count": 163
2579
+ },
2580
+ "SC": {
2581
+ "accuracy": 0.9384615384615385,
2582
+ "count": 130
2583
+ },
2584
+ "SS": {
2585
+ "accuracy": 0.9080459770114943,
2586
+ "count": 87
2587
+ },
2588
+ "UC": {
2589
+ "accuracy": 0.8078817733990148,
2590
+ "count": 203
2591
+ },
2592
+ "US": {
2593
+ "accuracy": 0.9829059829059829,
2594
+ "count": 117
2595
+ }
2596
+ }
2597
+ },
2598
+ "add_S3": {
2599
+ "full_accuracy": 0.41,
2600
+ "n_examples": 100,
2601
+ "per_subtask": {
2602
+ "SA": {
2603
+ "accuracy": 0.9834710743801653,
2604
+ "count": 121
2605
+ },
2606
+ "SC": {
2607
+ "accuracy": 0.9834710743801653,
2608
+ "count": 121
2609
+ },
2610
+ "SS": {
2611
+ "accuracy": 0.9591836734693877,
2612
+ "count": 49
2613
+ },
2614
+ "UC": {
2615
+ "accuracy": 0.7473118279569892,
2616
+ "count": 186
2617
+ },
2618
+ "US": {
2619
+ "accuracy": 0.8026905829596412,
2620
+ "count": 223
2621
+ }
2622
+ }
2623
+ },
2624
+ "add_S4": {
2625
+ "full_accuracy": 0.37,
2626
+ "n_examples": 100,
2627
+ "per_subtask": {
2628
+ "SA": {
2629
+ "accuracy": 0.9903846153846154,
2630
+ "count": 104
2631
+ },
2632
+ "SC": {
2633
+ "accuracy": 0.9622641509433962,
2634
+ "count": 106
2635
+ },
2636
+ "SS": {
2637
+ "accuracy": 1.0,
2638
+ "count": 23
2639
+ },
2640
+ "UC": {
2641
+ "accuracy": 0.7,
2642
+ "count": 160
2643
+ },
2644
+ "US": {
2645
+ "accuracy": 0.6579804560260586,
2646
+ "count": 307
2647
+ }
2648
+ }
2649
+ },
2650
+ "add_S5": {
2651
+ "full_accuracy": 0.36,
2652
+ "n_examples": 100,
2653
+ "per_subtask": {
2654
+ "SA": {
2655
+ "accuracy": 1.0,
2656
+ "count": 100
2657
+ },
2658
+ "SC": {
2659
+ "accuracy": 0.99,
2660
+ "count": 100
2661
+ },
2662
+ "UC": {
2663
+ "accuracy": 0.6,
2664
+ "count": 100
2665
+ },
2666
+ "US": {
2667
+ "accuracy": 0.545,
2668
+ "count": 400
2669
+ }
2670
+ }
2671
+ },
2672
+ "add_S6": {
2673
+ "full_accuracy": 0.54,
2674
+ "n_examples": 100,
2675
+ "per_subtask": {
2676
+ "SC": {
2677
+ "accuracy": 1.0,
2678
+ "count": 100
2679
+ },
2680
+ "UC": {
2681
+ "accuracy": 0.65,
2682
+ "count": 100
2683
+ },
2684
+ "US": {
2685
+ "accuracy": 0.67,
2686
+ "count": 500
2687
+ }
2688
+ }
2689
+ },
2690
+ "add_random": {
2691
+ "full_accuracy": 0.79,
2692
+ "n_examples": 200,
2693
+ "per_subtask": {
2694
+ "SA": {
2695
+ "accuracy": 0.9821029082774049,
2696
+ "count": 447
2697
+ },
2698
+ "SC": {
2699
+ "accuracy": 0.975,
2700
+ "count": 320
2701
+ },
2702
+ "SS": {
2703
+ "accuracy": 0.9821428571428571,
2704
+ "count": 56
2705
+ },
2706
+ "UC": {
2707
+ "accuracy": 0.9527410207939508,
2708
+ "count": 529
2709
+ },
2710
+ "US": {
2711
+ "accuracy": 0.8958333333333334,
2712
+ "count": 48
2713
+ }
2714
+ }
2715
+ },
2716
+ "add_C3": {
2717
+ "full_accuracy": 0.59,
2718
+ "n_examples": 100,
2719
+ "per_subtask": {
2720
+ "SA": {
2721
+ "accuracy": 0.9866666666666667,
2722
+ "count": 300
2723
+ },
2724
+ "SC": {
2725
+ "accuracy": 1.0,
2726
+ "count": 100
2727
+ },
2728
+ "UC": {
2729
+ "accuracy": 0.8134715025906736,
2730
+ "count": 193
2731
+ },
2732
+ "US": {
2733
+ "accuracy": 0.7757009345794392,
2734
+ "count": 107
2735
+ }
2736
+ }
2737
+ },
2738
+ "add_C4": {
2739
+ "full_accuracy": 0.45,
2740
+ "n_examples": 100,
2741
+ "per_subtask": {
2742
+ "SA": {
2743
+ "accuracy": 1.0,
2744
+ "count": 200
2745
+ },
2746
+ "SC": {
2747
+ "accuracy": 1.0,
2748
+ "count": 100
2749
+ },
2750
+ "UC": {
2751
+ "accuracy": 0.83203125,
2752
+ "count": 256
2753
+ },
2754
+ "US": {
2755
+ "accuracy": 0.7708333333333334,
2756
+ "count": 144
2757
+ }
2758
+ }
2759
+ },
2760
+ "add_C5": {
2761
+ "full_accuracy": 0.48,
2762
+ "n_examples": 100,
2763
+ "per_subtask": {
2764
+ "SA": {
2765
+ "accuracy": 1.0,
2766
+ "count": 100
2767
+ },
2768
+ "SC": {
2769
+ "accuracy": 1.0,
2770
+ "count": 100
2771
+ },
2772
+ "UC": {
2773
+ "accuracy": 0.8464052287581699,
2774
+ "count": 306
2775
+ },
2776
+ "US": {
2777
+ "accuracy": 0.8144329896907216,
2778
+ "count": 194
2779
+ }
2780
+ }
2781
+ },
2782
+ "add_C6": {
2783
+ "full_accuracy": 0.41,
2784
+ "n_examples": 100,
2785
+ "per_subtask": {
2786
+ "SC": {
2787
+ "accuracy": 1.0,
2788
+ "count": 100
2789
+ },
2790
+ "UC": {
2791
+ "accuracy": 0.8415300546448088,
2792
+ "count": 366
2793
+ },
2794
+ "US": {
2795
+ "accuracy": 0.8632478632478633,
2796
+ "count": 234
2797
+ }
2798
+ }
2799
+ },
2800
+ "sub_M0": {
2801
+ "full_accuracy": 0.83,
2802
+ "n_examples": 100,
2803
+ "per_subtask": {
2804
+ "MD": {
2805
+ "accuracy": 0.9733777038269551,
2806
+ "count": 601
2807
+ },
2808
+ "ME": {
2809
+ "accuracy": 0.9595959595959596,
2810
+ "count": 99
2811
+ }
2812
+ }
2813
+ },
2814
+ "sub_M1": {
2815
+ "full_accuracy": 0.86,
2816
+ "n_examples": 100,
2817
+ "per_subtask": {
2818
+ "MD": {
2819
+ "accuracy": 0.982078853046595,
2820
+ "count": 279
2821
+ },
2822
+ "MB": {
2823
+ "accuracy": 0.9862068965517241,
2824
+ "count": 145
2825
+ },
2826
+ "ME": {
2827
+ "accuracy": 1.0,
2828
+ "count": 24
2829
+ },
2830
+ "UB": {
2831
+ "accuracy": 0.9682539682539683,
2832
+ "count": 252
2833
+ }
2834
+ }
2835
+ },
2836
+ "sub_M2": {
2837
+ "full_accuracy": 0.44,
2838
+ "n_examples": 100,
2839
+ "per_subtask": {
2840
+ "MD": {
2841
+ "accuracy": 0.9812206572769953,
2842
+ "count": 213
2843
+ },
2844
+ "MB": {
2845
+ "accuracy": 0.9734513274336283,
2846
+ "count": 113
2847
+ },
2848
+ "ME": {
2849
+ "accuracy": 0.9882352941176471,
2850
+ "count": 85
2851
+ },
2852
+ "UB": {
2853
+ "accuracy": 0.6906077348066298,
2854
+ "count": 181
2855
+ },
2856
+ "UD": {
2857
+ "accuracy": 0.9814814814814815,
2858
+ "count": 108
2859
+ }
2860
+ }
2861
+ },
2862
+ "sub_M3": {
2863
+ "full_accuracy": 0.15,
2864
+ "n_examples": 100,
2865
+ "per_subtask": {
2866
+ "MD": {
2867
+ "accuracy": 0.9888268156424581,
2868
+ "count": 179
2869
+ },
2870
+ "MB": {
2871
+ "accuracy": 0.970873786407767,
2872
+ "count": 103
2873
+ },
2874
+ "ME": {
2875
+ "accuracy": 0.9821428571428571,
2876
+ "count": 56
2877
+ },
2878
+ "UB": {
2879
+ "accuracy": 0.5906040268456376,
2880
+ "count": 149
2881
+ },
2882
+ "UD": {
2883
+ "accuracy": 0.6572769953051644,
2884
+ "count": 213
2885
+ }
2886
+ }
2887
+ },
2888
+ "sub_M4": {
2889
+ "full_accuracy": 0.15,
2890
+ "n_examples": 100,
2891
+ "per_subtask": {
2892
+ "MD": {
2893
+ "accuracy": 1.0,
2894
+ "count": 200
2895
+ },
2896
+ "MB": {
2897
+ "accuracy": 0.99,
2898
+ "count": 100
2899
+ },
2900
+ "UB": {
2901
+ "accuracy": 0.54,
2902
+ "count": 100
2903
+ },
2904
+ "UD": {
2905
+ "accuracy": 0.45666666666666667,
2906
+ "count": 300
2907
+ }
2908
+ }
2909
+ },
2910
+ "sub_M5": {
2911
+ "full_accuracy": 0.11,
2912
+ "n_examples": 100,
2913
+ "per_subtask": {
2914
+ "MD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 100
2917
+ },
2918
+ "MB": {
2919
+ "accuracy": 1.0,
2920
+ "count": 100
2921
+ },
2922
+ "UB": {
2923
+ "accuracy": 0.44,
2924
+ "count": 100
2925
+ },
2926
+ "UD": {
2927
+ "accuracy": 0.39,
2928
+ "count": 400
2929
+ }
2930
+ }
2931
+ },
2932
+ "sub_random": {
2933
+ "full_accuracy": 0.74,
2934
+ "n_examples": 200,
2935
+ "per_subtask": {
2936
+ "MD": {
2937
+ "accuracy": 0.9866666666666667,
2938
+ "count": 600
2939
+ },
2940
+ "MB": {
2941
+ "accuracy": 0.9700374531835206,
2942
+ "count": 267
2943
+ },
2944
+ "ME": {
2945
+ "accuracy": 1.0,
2946
+ "count": 53
2947
+ },
2948
+ "UB": {
2949
+ "accuracy": 0.9179954441913439,
2950
+ "count": 439
2951
+ },
2952
+ "UD": {
2953
+ "accuracy": 0.926829268292683,
2954
+ "count": 41
2955
+ }
2956
+ }
2957
+ },
2958
+ "sub_B3": {
2959
+ "full_accuracy": 0.51,
2960
+ "n_examples": 100,
2961
+ "per_subtask": {
2962
+ "MD": {
2963
+ "accuracy": 0.9866666666666667,
2964
+ "count": 300
2965
+ },
2966
+ "MB": {
2967
+ "accuracy": 1.0,
2968
+ "count": 100
2969
+ },
2970
+ "UB": {
2971
+ "accuracy": 0.7715736040609137,
2972
+ "count": 197
2973
+ },
2974
+ "UD": {
2975
+ "accuracy": 0.8155339805825242,
2976
+ "count": 103
2977
+ }
2978
+ }
2979
+ },
2980
+ "sub_B4": {
2981
+ "full_accuracy": 0.34,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "MD": {
2985
+ "accuracy": 1.0,
2986
+ "count": 200
2987
+ },
2988
+ "MB": {
2989
+ "accuracy": 1.0,
2990
+ "count": 100
2991
+ },
2992
+ "UB": {
2993
+ "accuracy": 0.7854251012145749,
2994
+ "count": 247
2995
+ },
2996
+ "UD": {
2997
+ "accuracy": 0.7450980392156863,
2998
+ "count": 153
2999
+ }
3000
+ }
3001
+ },
3002
+ "sub_B5": {
3003
+ "full_accuracy": 0.31,
3004
+ "n_examples": 100,
3005
+ "per_subtask": {
3006
+ "MD": {
3007
+ "accuracy": 1.0,
3008
+ "count": 100
3009
+ },
3010
+ "MB": {
3011
+ "accuracy": 1.0,
3012
+ "count": 100
3013
+ },
3014
+ "UB": {
3015
+ "accuracy": 0.7684563758389261,
3016
+ "count": 298
3017
+ },
3018
+ "UD": {
3019
+ "accuracy": 0.7772277227722773,
3020
+ "count": 202
3021
+ }
3022
+ }
3023
+ }
3024
+ },
3025
+ "summary": {
3026
+ "overall_accuracy": 0.515,
3027
+ "total_examples": 2400,
3028
+ "n_splits": 22
3029
+ }
3030
+ },
3031
+ "sorl_eval": {
3032
+ "config": {
3033
+ "ops": "add_sub",
3034
+ "K": 4,
3035
+ "mode": "sorl",
3036
+ "n_digits": 6,
3037
+ "n_per_split": 100
3038
+ },
3039
+ "splits": {
3040
+ "add_S0": {
3041
+ "full_accuracy": 1.0,
3042
+ "n_examples": 100,
3043
+ "per_subtask": {
3044
+ "SA": {
3045
+ "accuracy": 1.0,
3046
+ "count": 605
3047
+ },
3048
+ "SS": {
3049
+ "accuracy": 1.0,
3050
+ "count": 95
3051
+ }
3052
+ }
3053
+ },
3054
+ "add_S1": {
3055
+ "full_accuracy": 1.0,
3056
+ "n_examples": 100,
3057
+ "per_subtask": {
3058
+ "SA": {
3059
+ "accuracy": 1.0,
3060
+ "count": 204
3061
+ },
3062
+ "SC": {
3063
+ "accuracy": 1.0,
3064
+ "count": 169
3065
+ },
3066
+ "SS": {
3067
+ "accuracy": 1.0,
3068
+ "count": 31
3069
+ },
3070
+ "UC": {
3071
+ "accuracy": 1.0,
3072
+ "count": 296
3073
+ }
3074
+ }
3075
+ },
3076
+ "add_S2": {
3077
+ "full_accuracy": 1.0,
3078
+ "n_examples": 100,
3079
+ "per_subtask": {
3080
+ "SA": {
3081
+ "accuracy": 1.0,
3082
+ "count": 163
3083
+ },
3084
+ "SC": {
3085
+ "accuracy": 1.0,
3086
+ "count": 130
3087
+ },
3088
+ "SS": {
3089
+ "accuracy": 1.0,
3090
+ "count": 87
3091
+ },
3092
+ "UC": {
3093
+ "accuracy": 1.0,
3094
+ "count": 203
3095
+ },
3096
+ "US": {
3097
+ "accuracy": 1.0,
3098
+ "count": 117
3099
+ }
3100
+ }
3101
+ },
3102
+ "add_S3": {
3103
+ "full_accuracy": 1.0,
3104
+ "n_examples": 100,
3105
+ "per_subtask": {
3106
+ "SA": {
3107
+ "accuracy": 1.0,
3108
+ "count": 121
3109
+ },
3110
+ "SC": {
3111
+ "accuracy": 1.0,
3112
+ "count": 121
3113
+ },
3114
+ "SS": {
3115
+ "accuracy": 1.0,
3116
+ "count": 49
3117
+ },
3118
+ "UC": {
3119
+ "accuracy": 1.0,
3120
+ "count": 186
3121
+ },
3122
+ "US": {
3123
+ "accuracy": 1.0,
3124
+ "count": 223
3125
+ }
3126
+ }
3127
+ },
3128
+ "add_S4": {
3129
+ "full_accuracy": 0.92,
3130
+ "n_examples": 100,
3131
+ "per_subtask": {
3132
+ "SA": {
3133
+ "accuracy": 1.0,
3134
+ "count": 104
3135
+ },
3136
+ "SC": {
3137
+ "accuracy": 1.0,
3138
+ "count": 106
3139
+ },
3140
+ "SS": {
3141
+ "accuracy": 1.0,
3142
+ "count": 23
3143
+ },
3144
+ "UC": {
3145
+ "accuracy": 0.95625,
3146
+ "count": 160
3147
+ },
3148
+ "US": {
3149
+ "accuracy": 0.9869706840390879,
3150
+ "count": 307
3151
+ }
3152
+ }
3153
+ },
3154
+ "add_S5": {
3155
+ "full_accuracy": 0.7,
3156
+ "n_examples": 100,
3157
+ "per_subtask": {
3158
+ "SA": {
3159
+ "accuracy": 1.0,
3160
+ "count": 100
3161
+ },
3162
+ "SC": {
3163
+ "accuracy": 1.0,
3164
+ "count": 100
3165
+ },
3166
+ "UC": {
3167
+ "accuracy": 0.72,
3168
+ "count": 100
3169
+ },
3170
+ "US": {
3171
+ "accuracy": 0.9625,
3172
+ "count": 400
3173
+ }
3174
+ }
3175
+ },
3176
+ "add_S6": {
3177
+ "full_accuracy": 1.0,
3178
+ "n_examples": 100,
3179
+ "per_subtask": {
3180
+ "SC": {
3181
+ "accuracy": 1.0,
3182
+ "count": 100
3183
+ },
3184
+ "UC": {
3185
+ "accuracy": 1.0,
3186
+ "count": 100
3187
+ },
3188
+ "US": {
3189
+ "accuracy": 1.0,
3190
+ "count": 500
3191
+ }
3192
+ }
3193
+ },
3194
+ "add_random": {
3195
+ "full_accuracy": 1.0,
3196
+ "n_examples": 200,
3197
+ "per_subtask": {
3198
+ "SA": {
3199
+ "accuracy": 1.0,
3200
+ "count": 447
3201
+ },
3202
+ "SC": {
3203
+ "accuracy": 1.0,
3204
+ "count": 320
3205
+ },
3206
+ "SS": {
3207
+ "accuracy": 1.0,
3208
+ "count": 56
3209
+ },
3210
+ "UC": {
3211
+ "accuracy": 1.0,
3212
+ "count": 529
3213
+ },
3214
+ "US": {
3215
+ "accuracy": 1.0,
3216
+ "count": 48
3217
+ }
3218
+ }
3219
+ },
3220
+ "add_C3": {
3221
+ "full_accuracy": 0.99,
3222
+ "n_examples": 100,
3223
+ "per_subtask": {
3224
+ "SA": {
3225
+ "accuracy": 1.0,
3226
+ "count": 300
3227
+ },
3228
+ "SC": {
3229
+ "accuracy": 1.0,
3230
+ "count": 100
3231
+ },
3232
+ "UC": {
3233
+ "accuracy": 0.9948186528497409,
3234
+ "count": 193
3235
+ },
3236
+ "US": {
3237
+ "accuracy": 1.0,
3238
+ "count": 107
3239
+ }
3240
+ }
3241
+ },
3242
+ "add_C4": {
3243
+ "full_accuracy": 0.99,
3244
+ "n_examples": 100,
3245
+ "per_subtask": {
3246
+ "SA": {
3247
+ "accuracy": 1.0,
3248
+ "count": 200
3249
+ },
3250
+ "SC": {
3251
+ "accuracy": 1.0,
3252
+ "count": 100
3253
+ },
3254
+ "UC": {
3255
+ "accuracy": 0.99609375,
3256
+ "count": 256
3257
+ },
3258
+ "US": {
3259
+ "accuracy": 1.0,
3260
+ "count": 144
3261
+ }
3262
+ }
3263
+ },
3264
+ "add_C5": {
3265
+ "full_accuracy": 0.97,
3266
+ "n_examples": 100,
3267
+ "per_subtask": {
3268
+ "SA": {
3269
+ "accuracy": 1.0,
3270
+ "count": 100
3271
+ },
3272
+ "SC": {
3273
+ "accuracy": 1.0,
3274
+ "count": 100
3275
+ },
3276
+ "UC": {
3277
+ "accuracy": 0.9901960784313726,
3278
+ "count": 306
3279
+ },
3280
+ "US": {
3281
+ "accuracy": 0.9948453608247423,
3282
+ "count": 194
3283
+ }
3284
+ }
3285
+ },
3286
+ "add_C6": {
3287
+ "full_accuracy": 0.99,
3288
+ "n_examples": 100,
3289
+ "per_subtask": {
3290
+ "SC": {
3291
+ "accuracy": 1.0,
3292
+ "count": 100
3293
+ },
3294
+ "UC": {
3295
+ "accuracy": 0.9972677595628415,
3296
+ "count": 366
3297
+ },
3298
+ "US": {
3299
+ "accuracy": 1.0,
3300
+ "count": 234
3301
+ }
3302
+ }
3303
+ },
3304
+ "sub_M0": {
3305
+ "full_accuracy": 1.0,
3306
+ "n_examples": 100,
3307
+ "per_subtask": {
3308
+ "MD": {
3309
+ "accuracy": 1.0,
3310
+ "count": 601
3311
+ },
3312
+ "ME": {
3313
+ "accuracy": 1.0,
3314
+ "count": 99
3315
+ }
3316
+ }
3317
+ },
3318
+ "sub_M1": {
3319
+ "full_accuracy": 1.0,
3320
+ "n_examples": 100,
3321
+ "per_subtask": {
3322
+ "MD": {
3323
+ "accuracy": 1.0,
3324
+ "count": 279
3325
+ },
3326
+ "MB": {
3327
+ "accuracy": 1.0,
3328
+ "count": 145
3329
+ },
3330
+ "ME": {
3331
+ "accuracy": 1.0,
3332
+ "count": 24
3333
+ },
3334
+ "UB": {
3335
+ "accuracy": 1.0,
3336
+ "count": 252
3337
+ }
3338
+ }
3339
+ },
3340
+ "sub_M2": {
3341
+ "full_accuracy": 1.0,
3342
+ "n_examples": 100,
3343
+ "per_subtask": {
3344
+ "MD": {
3345
+ "accuracy": 1.0,
3346
+ "count": 213
3347
+ },
3348
+ "MB": {
3349
+ "accuracy": 1.0,
3350
+ "count": 113
3351
+ },
3352
+ "ME": {
3353
+ "accuracy": 1.0,
3354
+ "count": 85
3355
+ },
3356
+ "UB": {
3357
+ "accuracy": 1.0,
3358
+ "count": 181
3359
+ },
3360
+ "UD": {
3361
+ "accuracy": 1.0,
3362
+ "count": 108
3363
+ }
3364
+ }
3365
+ },
3366
+ "sub_M3": {
3367
+ "full_accuracy": 0.99,
3368
+ "n_examples": 100,
3369
+ "per_subtask": {
3370
+ "MD": {
3371
+ "accuracy": 1.0,
3372
+ "count": 179
3373
+ },
3374
+ "MB": {
3375
+ "accuracy": 1.0,
3376
+ "count": 103
3377
+ },
3378
+ "ME": {
3379
+ "accuracy": 1.0,
3380
+ "count": 56
3381
+ },
3382
+ "UB": {
3383
+ "accuracy": 0.9932885906040269,
3384
+ "count": 149
3385
+ },
3386
+ "UD": {
3387
+ "accuracy": 1.0,
3388
+ "count": 213
3389
+ }
3390
+ }
3391
+ },
3392
+ "sub_M4": {
3393
+ "full_accuracy": 0.92,
3394
+ "n_examples": 100,
3395
+ "per_subtask": {
3396
+ "MD": {
3397
+ "accuracy": 1.0,
3398
+ "count": 200
3399
+ },
3400
+ "MB": {
3401
+ "accuracy": 1.0,
3402
+ "count": 100
3403
+ },
3404
+ "UB": {
3405
+ "accuracy": 0.92,
3406
+ "count": 100
3407
+ },
3408
+ "UD": {
3409
+ "accuracy": 0.9933333333333333,
3410
+ "count": 300
3411
+ }
3412
+ }
3413
+ },
3414
+ "sub_M5": {
3415
+ "full_accuracy": 0.67,
3416
+ "n_examples": 100,
3417
+ "per_subtask": {
3418
+ "MD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 100
3421
+ },
3422
+ "MB": {
3423
+ "accuracy": 1.0,
3424
+ "count": 100
3425
+ },
3426
+ "UB": {
3427
+ "accuracy": 0.67,
3428
+ "count": 100
3429
+ },
3430
+ "UD": {
3431
+ "accuracy": 0.9775,
3432
+ "count": 400
3433
+ }
3434
+ }
3435
+ },
3436
+ "sub_random": {
3437
+ "full_accuracy": 0.995,
3438
+ "n_examples": 200,
3439
+ "per_subtask": {
3440
+ "MD": {
3441
+ "accuracy": 0.9983333333333333,
3442
+ "count": 600
3443
+ },
3444
+ "MB": {
3445
+ "accuracy": 1.0,
3446
+ "count": 267
3447
+ },
3448
+ "ME": {
3449
+ "accuracy": 1.0,
3450
+ "count": 53
3451
+ },
3452
+ "UB": {
3453
+ "accuracy": 1.0,
3454
+ "count": 439
3455
+ },
3456
+ "UD": {
3457
+ "accuracy": 1.0,
3458
+ "count": 41
3459
+ }
3460
+ }
3461
+ },
3462
+ "sub_B3": {
3463
+ "full_accuracy": 0.95,
3464
+ "n_examples": 100,
3465
+ "per_subtask": {
3466
+ "MD": {
3467
+ "accuracy": 1.0,
3468
+ "count": 300
3469
+ },
3470
+ "MB": {
3471
+ "accuracy": 1.0,
3472
+ "count": 100
3473
+ },
3474
+ "UB": {
3475
+ "accuracy": 0.9746192893401016,
3476
+ "count": 197
3477
+ },
3478
+ "UD": {
3479
+ "accuracy": 1.0,
3480
+ "count": 103
3481
+ }
3482
+ }
3483
+ },
3484
+ "sub_B4": {
3485
+ "full_accuracy": 0.99,
3486
+ "n_examples": 100,
3487
+ "per_subtask": {
3488
+ "MD": {
3489
+ "accuracy": 1.0,
3490
+ "count": 200
3491
+ },
3492
+ "MB": {
3493
+ "accuracy": 1.0,
3494
+ "count": 100
3495
+ },
3496
+ "UB": {
3497
+ "accuracy": 0.9959514170040485,
3498
+ "count": 247
3499
+ },
3500
+ "UD": {
3501
+ "accuracy": 1.0,
3502
+ "count": 153
3503
+ }
3504
+ }
3505
+ },
3506
+ "sub_B5": {
3507
+ "full_accuracy": 1.0,
3508
+ "n_examples": 100,
3509
+ "per_subtask": {
3510
+ "MD": {
3511
+ "accuracy": 1.0,
3512
+ "count": 100
3513
+ },
3514
+ "MB": {
3515
+ "accuracy": 1.0,
3516
+ "count": 100
3517
+ },
3518
+ "UB": {
3519
+ "accuracy": 1.0,
3520
+ "count": 298
3521
+ },
3522
+ "UD": {
3523
+ "accuracy": 1.0,
3524
+ "count": 202
3525
+ }
3526
+ }
3527
+ }
3528
+ },
3529
+ "summary": {
3530
+ "overall_accuracy": 0.96125,
3531
+ "total_examples": 2400,
3532
+ "n_splits": 22
3533
+ }
3534
+ },
3535
+ "sorl_overall_accuracy": 0.96125,
3536
+ "sft_overall_accuracy": 0.515
3537
+ }
add_sub_sorl_v1_abs30_100K/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:7332e8a91d9f010ea6aaaa8db3a4f5b2d0da3000748bf222741ae40b08e20106
3
+ size 650385300
add_sub_sorl_v1_abs30_100K/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 4,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 4e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 10,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 1562,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs30_K4_100K",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 2,
61
+ "n_head": 3,
62
+ "n_embd": 510,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 30,
65
+ "dataset_size": 100000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 162519662,
71
+ "run_name": "add_sub_sorl_v1_abs30_100K",
72
+ "git_commit": "f447da529caceac8c7d256cbb2cd185cbc50feac",
73
+ "timestamp": "2026-04-12T12:09:53.734351+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "iffr93ko",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/iffr93ko",
81
+ "final_accuracy": 0.96125,
82
+ "sft_accuracy": 0.515,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }