amirali1985 commited on
Commit
6a3a078
·
verified ·
1 Parent(s): f9d6435

Upload add_sub_sorl_v1_abs100_100K

Browse files
add_sub_sorl_v1_abs100_100K/config.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 510,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 2040,
15
+ "layer_types": [
16
+ "full_attention",
17
+ "full_attention"
18
+ ],
19
+ "max_position_embeddings": 128,
20
+ "max_window_layers": 28,
21
+ "model_type": "qwen3",
22
+ "num_attention_heads": 3,
23
+ "num_hidden_layers": 2,
24
+ "num_key_value_heads": 3,
25
+ "pad_token_id": null,
26
+ "rms_norm_eps": 1e-06,
27
+ "rope_parameters": {
28
+ "rope_theta": 10000.0,
29
+ "rope_type": "default"
30
+ },
31
+ "sliding_window": null,
32
+ "tie_word_embeddings": false,
33
+ "transformers_version": "5.5.0",
34
+ "use_cache": true,
35
+ "use_sliding_window": false,
36
+ "vocab_size": 151744
37
+ }
add_sub_sorl_v1_abs100_100K/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs100_100K/metrics.json ADDED
@@ -0,0 +1,3537 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 800,
20
+ 850,
21
+ 900,
22
+ 950,
23
+ 1000,
24
+ 1050,
25
+ 1100,
26
+ 1150,
27
+ 1200,
28
+ 1250,
29
+ 1300,
30
+ 1350,
31
+ 1400,
32
+ 1450,
33
+ 1500,
34
+ 1550,
35
+ 1613,
36
+ 1663,
37
+ 1713,
38
+ 1763,
39
+ 1813,
40
+ 1863,
41
+ 1913,
42
+ 1963,
43
+ 2013,
44
+ 2063,
45
+ 2113,
46
+ 2163,
47
+ 2213,
48
+ 2263,
49
+ 2313,
50
+ 2363,
51
+ 2413,
52
+ 2463,
53
+ 2513,
54
+ 2563,
55
+ 2613,
56
+ 2663,
57
+ 2713,
58
+ 2763,
59
+ 2813,
60
+ 2863,
61
+ 2913,
62
+ 2963,
63
+ 3013,
64
+ 3063,
65
+ 3113,
66
+ 3176,
67
+ 3226,
68
+ 3276,
69
+ 3326,
70
+ 3376,
71
+ 3426,
72
+ 3476,
73
+ 3526,
74
+ 3576,
75
+ 3626,
76
+ 3676,
77
+ 3726,
78
+ 3776,
79
+ 3826,
80
+ 3876,
81
+ 3926,
82
+ 3976,
83
+ 4026,
84
+ 4076,
85
+ 4126,
86
+ 4176,
87
+ 4226,
88
+ 4276,
89
+ 4326,
90
+ 4376,
91
+ 4426,
92
+ 4476,
93
+ 4526,
94
+ 4576,
95
+ 4626,
96
+ 4676,
97
+ 4739,
98
+ 4789,
99
+ 4839,
100
+ 4889,
101
+ 4939,
102
+ 4989,
103
+ 5039,
104
+ 5089,
105
+ 5139,
106
+ 5189,
107
+ 5239,
108
+ 5289,
109
+ 5339,
110
+ 5389,
111
+ 5439,
112
+ 5489,
113
+ 5539,
114
+ 5589,
115
+ 5639,
116
+ 5689,
117
+ 5739,
118
+ 5789,
119
+ 5839,
120
+ 5889,
121
+ 5939,
122
+ 5989,
123
+ 6039,
124
+ 6089,
125
+ 6139,
126
+ 6189,
127
+ 6239,
128
+ 6302,
129
+ 6352,
130
+ 6402,
131
+ 6452,
132
+ 6502,
133
+ 6552,
134
+ 6602,
135
+ 6652,
136
+ 6702,
137
+ 6752,
138
+ 6802,
139
+ 6852,
140
+ 6902,
141
+ 6952,
142
+ 7002,
143
+ 7052,
144
+ 7102,
145
+ 7152,
146
+ 7202,
147
+ 7252,
148
+ 7302,
149
+ 7352,
150
+ 7402,
151
+ 7452,
152
+ 7502,
153
+ 7552,
154
+ 7602,
155
+ 7652,
156
+ 7702,
157
+ 7752,
158
+ 7802,
159
+ 7865,
160
+ 7915,
161
+ 7965,
162
+ 8015,
163
+ 8065,
164
+ 8115,
165
+ 8165,
166
+ 8215,
167
+ 8265,
168
+ 8315,
169
+ 8365,
170
+ 8415,
171
+ 8465,
172
+ 8515,
173
+ 8565,
174
+ 8615,
175
+ 8665,
176
+ 8715,
177
+ 8765,
178
+ 8815,
179
+ 8865,
180
+ 8915,
181
+ 8965,
182
+ 9015,
183
+ 9065,
184
+ 9115,
185
+ 9165,
186
+ 9215,
187
+ 9265,
188
+ 9315,
189
+ 9365,
190
+ 9428,
191
+ 9478,
192
+ 9528,
193
+ 9578,
194
+ 9628,
195
+ 9678,
196
+ 9728,
197
+ 9778,
198
+ 9828,
199
+ 9878,
200
+ 9928,
201
+ 9978,
202
+ 10028,
203
+ 10078,
204
+ 10128,
205
+ 10178,
206
+ 10228,
207
+ 10278,
208
+ 10328,
209
+ 10378,
210
+ 10428,
211
+ 10478,
212
+ 10528,
213
+ 10578,
214
+ 10628,
215
+ 10678,
216
+ 10728,
217
+ 10778,
218
+ 10828,
219
+ 10878,
220
+ 10928,
221
+ 10991,
222
+ 11041,
223
+ 11091,
224
+ 11141,
225
+ 11191,
226
+ 11241,
227
+ 11291,
228
+ 11341,
229
+ 11391,
230
+ 11441,
231
+ 11491,
232
+ 11541,
233
+ 11591,
234
+ 11641,
235
+ 11691,
236
+ 11741,
237
+ 11791,
238
+ 11841,
239
+ 11891,
240
+ 11941,
241
+ 11991,
242
+ 12041,
243
+ 12091,
244
+ 12141,
245
+ 12191,
246
+ 12241,
247
+ 12291,
248
+ 12341,
249
+ 12391,
250
+ 12441,
251
+ 12491,
252
+ 12554,
253
+ 12604,
254
+ 12654,
255
+ 12704,
256
+ 12754,
257
+ 12804,
258
+ 12854,
259
+ 12904,
260
+ 12954,
261
+ 13004,
262
+ 13054,
263
+ 13104,
264
+ 13154,
265
+ 13204,
266
+ 13254,
267
+ 13304,
268
+ 13354,
269
+ 13404,
270
+ 13454,
271
+ 13504,
272
+ 13554,
273
+ 13604,
274
+ 13654,
275
+ 13704,
276
+ 13754,
277
+ 13804,
278
+ 13854,
279
+ 13904,
280
+ 13954,
281
+ 14004,
282
+ 14054,
283
+ 14117,
284
+ 14167,
285
+ 14217,
286
+ 14267,
287
+ 14317,
288
+ 14367,
289
+ 14417,
290
+ 14467,
291
+ 14517,
292
+ 14567,
293
+ 14617,
294
+ 14667,
295
+ 14717,
296
+ 14767,
297
+ 14817,
298
+ 14867,
299
+ 14917,
300
+ 14967,
301
+ 15017,
302
+ 15067,
303
+ 15117,
304
+ 15167,
305
+ 15217,
306
+ 15267,
307
+ 15317,
308
+ 15367,
309
+ 15417,
310
+ 15467,
311
+ 15517,
312
+ 15567,
313
+ 15617
314
+ ],
315
+ "loss": [
316
+ 15.550888061523438,
317
+ 11.867366790771484,
318
+ 9.26658821105957,
319
+ 7.580068588256836,
320
+ 4.967007637023926,
321
+ 4.137729644775391,
322
+ 2.9006338119506836,
323
+ 2.4626848697662354,
324
+ 2.5665512084960938,
325
+ 2.158423900604248,
326
+ 1.952378749847412,
327
+ 1.7124090194702148,
328
+ 1.3621506690979004,
329
+ 1.1513828039169312,
330
+ 0.8973356485366821,
331
+ 0.23597657680511475,
332
+ -0.5959402322769165,
333
+ -2.1503584384918213,
334
+ -3.0244522094726562,
335
+ -4.247900009155273,
336
+ -6.408154487609863,
337
+ -7.557421684265137,
338
+ -9.527976036071777,
339
+ -9.702749252319336,
340
+ -10.156671524047852,
341
+ -10.3717041015625,
342
+ -11.726086616516113,
343
+ -10.757834434509277,
344
+ -12.286270141601562,
345
+ -12.50685977935791,
346
+ -12.508800506591797,
347
+ -13.805336952209473,
348
+ -13.685751914978027,
349
+ -13.519683837890625,
350
+ -14.172358512878418,
351
+ -13.008854866027832,
352
+ -14.175028800964355,
353
+ -14.324581146240234,
354
+ -14.473095893859863,
355
+ -13.220258712768555,
356
+ -13.878575325012207,
357
+ -14.405760765075684,
358
+ -14.200833320617676,
359
+ -13.725854873657227,
360
+ -13.388266563415527,
361
+ -14.710071563720703,
362
+ -14.153650283813477,
363
+ -14.6085844039917,
364
+ -13.753926277160645,
365
+ -14.155021667480469,
366
+ -14.645832061767578,
367
+ -14.0811128616333,
368
+ -14.055008888244629,
369
+ -13.960396766662598,
370
+ -14.022454261779785,
371
+ -13.710693359375,
372
+ -13.309112548828125,
373
+ -13.811192512512207,
374
+ -14.07404899597168,
375
+ -14.23593521118164,
376
+ -14.03106689453125,
377
+ -14.144307136535645,
378
+ -13.670321464538574,
379
+ -14.122215270996094,
380
+ -14.305556297302246,
381
+ -13.679603576660156,
382
+ -13.83180046081543,
383
+ -13.438374519348145,
384
+ -14.211256980895996,
385
+ -13.453189849853516,
386
+ -13.635964393615723,
387
+ -13.473335266113281,
388
+ -13.789403915405273,
389
+ -14.136305809020996,
390
+ -13.588306427001953,
391
+ -13.945990562438965,
392
+ -13.677070617675781,
393
+ -13.584909439086914,
394
+ -13.552124977111816,
395
+ -13.686911582946777,
396
+ -14.19415283203125,
397
+ -13.130370140075684,
398
+ -13.576313018798828,
399
+ -13.867148399353027,
400
+ -14.135629653930664,
401
+ -13.967987060546875,
402
+ -13.738463401794434,
403
+ -13.794072151184082,
404
+ -13.240439414978027,
405
+ -13.05858039855957,
406
+ -13.739139556884766,
407
+ -13.341608047485352,
408
+ -13.674799919128418,
409
+ -13.919906616210938,
410
+ -13.248772621154785,
411
+ -13.675357818603516,
412
+ -13.085427284240723,
413
+ -13.586677551269531,
414
+ -13.351914405822754,
415
+ -13.54724407196045,
416
+ -13.314041137695312,
417
+ -13.698709487915039,
418
+ -13.4844970703125,
419
+ -13.105769157409668,
420
+ -14.150449752807617,
421
+ -13.3515625,
422
+ -13.585944175720215,
423
+ -13.67232894897461,
424
+ -13.279473304748535,
425
+ -12.88558292388916,
426
+ -12.672972679138184,
427
+ -12.307419776916504,
428
+ -11.918647766113281,
429
+ -11.899198532104492,
430
+ -10.78943920135498,
431
+ -9.057609558105469,
432
+ -9.074422836303711,
433
+ -7.046210765838623,
434
+ -6.717620849609375,
435
+ -5.936412334442139,
436
+ -5.499674320220947,
437
+ -5.294518947601318,
438
+ -4.942630767822266,
439
+ -4.592720985412598,
440
+ -4.245693206787109,
441
+ -4.3543901443481445,
442
+ -4.608675956726074,
443
+ -4.525597095489502,
444
+ -4.042947769165039,
445
+ -3.8350584506988525,
446
+ -3.795506715774536,
447
+ -3.8952653408050537,
448
+ -3.7787787914276123,
449
+ -3.690739154815674,
450
+ -3.6305153369903564,
451
+ -3.6295809745788574,
452
+ -4.06860876083374,
453
+ -3.522972345352173,
454
+ -3.2608494758605957,
455
+ -3.4570372104644775,
456
+ -3.7303266525268555,
457
+ -3.073056221008301,
458
+ -3.164405345916748,
459
+ -2.8519835472106934,
460
+ -3.254319190979004,
461
+ -3.214355707168579,
462
+ -3.1682052612304688,
463
+ -3.134302854537964,
464
+ -3.013920307159424,
465
+ -3.0451102256774902,
466
+ -3.121530055999756,
467
+ -2.7288155555725098,
468
+ -2.995760679244995,
469
+ -2.8066184520721436,
470
+ -2.7938923835754395,
471
+ -2.7591190338134766,
472
+ -3.200686454772949,
473
+ -2.7287776470184326,
474
+ -2.82346773147583,
475
+ -2.8249335289001465,
476
+ -2.705054759979248,
477
+ -2.622191905975342,
478
+ -2.8604440689086914,
479
+ -2.8222217559814453,
480
+ -2.4740147590637207,
481
+ -2.638058662414551,
482
+ -2.60479736328125,
483
+ -2.3116393089294434,
484
+ -2.6722817420959473,
485
+ -2.2449727058410645,
486
+ -2.4268925189971924,
487
+ -2.9192469120025635,
488
+ -2.528902530670166,
489
+ -2.5458292961120605,
490
+ -2.349612236022949,
491
+ -2.2004177570343018,
492
+ -2.4359543323516846,
493
+ -2.461465835571289,
494
+ -2.23230242729187,
495
+ -2.2559080123901367,
496
+ -2.3587558269500732,
497
+ -2.391399621963501,
498
+ -2.832726240158081,
499
+ -2.714812994003296,
500
+ -2.3990671634674072,
501
+ -2.195844888687134,
502
+ -2.1532039642333984,
503
+ -2.097494602203369,
504
+ -2.3985636234283447,
505
+ -2.570045232772827,
506
+ -2.2937211990356445,
507
+ -2.1569249629974365,
508
+ -2.2520053386688232,
509
+ -2.0688021183013916,
510
+ -1.8645415306091309,
511
+ -1.867919683456421,
512
+ -2.38214111328125,
513
+ -1.9624675512313843,
514
+ -2.0682549476623535,
515
+ -1.9874458312988281,
516
+ -2.201204776763916,
517
+ -1.9760252237319946,
518
+ -1.85667884349823,
519
+ -1.843688726425171,
520
+ -1.9453718662261963,
521
+ -2.0517611503601074,
522
+ -1.6996922492980957,
523
+ -2.085865020751953,
524
+ -1.709080457687378,
525
+ -1.7818503379821777,
526
+ -1.9570668935775757,
527
+ -1.7454025745391846,
528
+ -1.6972360610961914,
529
+ -1.8396483659744263,
530
+ -1.5027493238449097,
531
+ -1.907371163368225,
532
+ -1.7743029594421387,
533
+ -1.9746217727661133,
534
+ -1.338217854499817,
535
+ -1.6359403133392334,
536
+ -1.3770235776901245,
537
+ -1.7120670080184937,
538
+ -1.3594249486923218,
539
+ -1.662591576576233,
540
+ -1.4001332521438599,
541
+ -1.5567529201507568,
542
+ -1.8013702630996704,
543
+ -1.7820297479629517,
544
+ -1.6045730113983154,
545
+ -1.5203410387039185,
546
+ -1.5714890956878662,
547
+ -1.5866961479187012,
548
+ -1.4439531564712524,
549
+ -1.8579603433609009,
550
+ -1.571858525276184,
551
+ -1.3905956745147705,
552
+ -1.4180278778076172,
553
+ -1.6811977624893188,
554
+ -1.6187727451324463,
555
+ -1.5407252311706543,
556
+ -1.5873008966445923,
557
+ -1.6828949451446533,
558
+ -1.692954421043396,
559
+ -1.3257203102111816,
560
+ -1.4703478813171387,
561
+ -1.4493123292922974,
562
+ -1.4972003698349,
563
+ -1.4250011444091797,
564
+ -1.5240806341171265,
565
+ -1.230216145515442,
566
+ -1.4708086252212524,
567
+ -1.2354530096054077,
568
+ -1.7644381523132324,
569
+ -1.31303071975708,
570
+ -1.1198210716247559,
571
+ -1.3806722164154053,
572
+ -1.040693998336792,
573
+ -1.407912254333496,
574
+ -1.1439356803894043,
575
+ -1.4109939336776733,
576
+ -1.2327980995178223,
577
+ -1.1438546180725098,
578
+ -1.2574481964111328,
579
+ -1.3094208240509033,
580
+ -1.2854642868041992,
581
+ -1.417351484298706,
582
+ -1.161266565322876,
583
+ -1.1692018508911133,
584
+ -1.1951680183410645,
585
+ -1.4501426219940186,
586
+ -1.0620129108428955,
587
+ -1.0999974012374878,
588
+ -1.2486470937728882,
589
+ -0.8803353905677795,
590
+ -1.3792674541473389,
591
+ -1.3971298933029175,
592
+ -1.175848364830017,
593
+ -1.2047163248062134,
594
+ -1.1166435480117798,
595
+ -1.0748188495635986,
596
+ -1.260925531387329,
597
+ -1.0387357473373413,
598
+ -1.1274218559265137,
599
+ -1.011070966720581,
600
+ -0.9395217895507812,
601
+ -1.3620796203613281,
602
+ -1.258716106414795,
603
+ -1.041094183921814,
604
+ -1.2385952472686768,
605
+ -1.3618378639221191,
606
+ -1.2178571224212646,
607
+ -1.1151763200759888,
608
+ -0.8671252727508545,
609
+ -1.1393119096755981,
610
+ -1.0050714015960693,
611
+ -1.2483044862747192,
612
+ -1.0898106098175049,
613
+ -1.0313324928283691,
614
+ -0.8652176856994629,
615
+ -1.0769447088241577,
616
+ -0.8985112905502319,
617
+ -0.9062784314155579,
618
+ -0.9375243186950684,
619
+ -0.9505935907363892,
620
+ -1.046338438987732,
621
+ -1.0050792694091797,
622
+ -0.9650892615318298,
623
+ -0.9858003258705139,
624
+ -1.1620886325836182,
625
+ -1.1846257448196411
626
+ ],
627
+ "base_loss": [
628
+ 10.609814643859863,
629
+ 8.015226364135742,
630
+ 7.298034191131592,
631
+ 6.2845025062561035,
632
+ 5.197947978973389,
633
+ 3.4349818229675293,
634
+ 2.1448423862457275,
635
+ 2.040243148803711,
636
+ 1.8989087343215942,
637
+ 1.8234024047851562,
638
+ 1.8464136123657227,
639
+ 1.8160383701324463,
640
+ 1.8420960903167725,
641
+ 1.8088819980621338,
642
+ 1.8110955953598022,
643
+ 1.821955919265747,
644
+ 1.8283952474594116,
645
+ 1.920448899269104,
646
+ 1.8867542743682861,
647
+ 1.8831616640090942,
648
+ 1.9312572479248047,
649
+ 1.9106019735336304,
650
+ 1.9592641592025757,
651
+ 1.8384157419204712,
652
+ 1.8146497011184692,
653
+ 1.7597582340240479,
654
+ 1.8155019283294678,
655
+ 1.6613296270370483,
656
+ 1.707415223121643,
657
+ 1.7329599857330322,
658
+ 1.637532114982605,
659
+ 1.7226206064224243,
660
+ 1.699408769607544,
661
+ 1.6609095335006714,
662
+ 1.7118498086929321,
663
+ 1.5943775177001953,
664
+ 1.6790682077407837,
665
+ 1.6773242950439453,
666
+ 1.6923757791519165,
667
+ 1.6028581857681274,
668
+ 1.60297429561615,
669
+ 1.6737611293792725,
670
+ 1.62065589427948,
671
+ 1.607097864151001,
672
+ 1.580548644065857,
673
+ 1.6909033060073853,
674
+ 1.60847008228302,
675
+ 1.6662300825119019,
676
+ 1.6017462015151978,
677
+ 1.6096265316009521,
678
+ 1.6725680828094482,
679
+ 1.5998142957687378,
680
+ 1.5998982191085815,
681
+ 1.600284218788147,
682
+ 1.5952374935150146,
683
+ 1.578301191329956,
684
+ 1.5071732997894287,
685
+ 1.5789823532104492,
686
+ 1.5953046083450317,
687
+ 1.6094692945480347,
688
+ 1.5920847654342651,
689
+ 1.5985146760940552,
690
+ 1.5503194332122803,
691
+ 1.6095918416976929,
692
+ 1.6245962381362915,
693
+ 1.5575997829437256,
694
+ 1.5648068189620972,
695
+ 1.5228277444839478,
696
+ 1.603353500366211,
697
+ 1.5222351551055908,
698
+ 1.544053077697754,
699
+ 1.5283054113388062,
700
+ 1.5700281858444214,
701
+ 1.5998828411102295,
702
+ 1.5484613180160522,
703
+ 1.569875717163086,
704
+ 1.5532366037368774,
705
+ 1.5442272424697876,
706
+ 1.5343350172042847,
707
+ 1.5506829023361206,
708
+ 1.5976637601852417,
709
+ 1.4877575635910034,
710
+ 1.52931809425354,
711
+ 1.5564076900482178,
712
+ 1.6029837131500244,
713
+ 1.5728864669799805,
714
+ 1.5477153062820435,
715
+ 1.5558513402938843,
716
+ 1.4923717975616455,
717
+ 1.471130609512329,
718
+ 1.5454028844833374,
719
+ 1.5082389116287231,
720
+ 1.5537184476852417,
721
+ 1.561993956565857,
722
+ 1.5067471265792847,
723
+ 1.5380361080169678,
724
+ 1.481860876083374,
725
+ 1.5293447971343994,
726
+ 1.5173250436782837,
727
+ 1.5268032550811768,
728
+ 1.4966020584106445,
729
+ 1.5563942193984985,
730
+ 1.5178576707839966,
731
+ 1.4765022993087769,
732
+ 1.58711838722229,
733
+ 1.5146647691726685,
734
+ 1.5267279148101807,
735
+ 1.5433595180511475,
736
+ 1.4922010898590088,
737
+ 1.4545576572418213,
738
+ 1.4353135824203491,
739
+ 1.3946800231933594,
740
+ 1.3413666486740112,
741
+ 1.3423233032226562,
742
+ 1.2201385498046875,
743
+ 1.0377111434936523,
744
+ 1.0341635942459106,
745
+ 0.8037133812904358,
746
+ 0.767292857170105,
747
+ 0.6757163405418396,
748
+ 0.6260315775871277,
749
+ 0.6115191578865051,
750
+ 0.5719292759895325,
751
+ 0.525610625743866,
752
+ 0.48804253339767456,
753
+ 0.513914942741394,
754
+ 0.5368272066116333,
755
+ 0.5152927041053772,
756
+ 0.463877409696579,
757
+ 0.4421793818473816,
758
+ 0.44104495644569397,
759
+ 0.4481094181537628,
760
+ 0.4658953845500946,
761
+ 0.4311184287071228,
762
+ 0.4164181649684906,
763
+ 0.4223596155643463,
764
+ 0.46746915578842163,
765
+ 0.4056954085826874,
766
+ 0.38447755575180054,
767
+ 0.39704015851020813,
768
+ 0.4316771626472473,
769
+ 0.3543528616428375,
770
+ 0.36644411087036133,
771
+ 0.3291913568973541,
772
+ 0.3855384290218353,
773
+ 0.3765328824520111,
774
+ 0.36499664187431335,
775
+ 0.3587031960487366,
776
+ 0.3511146903038025,
777
+ 0.3541579246520996,
778
+ 0.358995258808136,
779
+ 0.3450600206851959,
780
+ 0.3578762412071228,
781
+ 0.3288351893424988,
782
+ 0.34160321950912476,
783
+ 0.3207271099090576,
784
+ 0.36676672101020813,
785
+ 0.3151433765888214,
786
+ 0.3299563229084015,
787
+ 0.32532089948654175,
788
+ 0.31451278924942017,
789
+ 0.3047652542591095,
790
+ 0.3315297067165375,
791
+ 0.3248681426048279,
792
+ 0.28615516424179077,
793
+ 0.30520114302635193,
794
+ 0.2996344566345215,
795
+ 0.2685880959033966,
796
+ 0.30989527702331543,
797
+ 0.2701651453971863,
798
+ 0.2988984286785126,
799
+ 0.3356240689754486,
800
+ 0.2926725745201111,
801
+ 0.29605191946029663,
802
+ 0.27395758032798767,
803
+ 0.25648754835128784,
804
+ 0.2848379909992218,
805
+ 0.28560489416122437,
806
+ 0.2649328112602234,
807
+ 0.26132088899612427,
808
+ 0.2755523920059204,
809
+ 0.27864283323287964,
810
+ 0.32541802525520325,
811
+ 0.3135841488838196,
812
+ 0.2774091362953186,
813
+ 0.2753048837184906,
814
+ 0.25229766964912415,
815
+ 0.24528728425502777,
816
+ 0.290712833404541,
817
+ 0.30390962958335876,
818
+ 0.26389721035957336,
819
+ 0.2526156008243561,
820
+ 0.26138073205947876,
821
+ 0.2451794445514679,
822
+ 0.21623989939689636,
823
+ 0.221551313996315,
824
+ 0.27538686990737915,
825
+ 0.22850997745990753,
826
+ 0.23916366696357727,
827
+ 0.2323302924633026,
828
+ 0.255971223115921,
829
+ 0.23261485993862152,
830
+ 0.21784284710884094,
831
+ 0.2177778035402298,
832
+ 0.2266148030757904,
833
+ 0.23994575440883636,
834
+ 0.1994098275899887,
835
+ 0.24346749484539032,
836
+ 0.20232857763767242,
837
+ 0.20922228693962097,
838
+ 0.23100629448890686,
839
+ 0.20590011775493622,
840
+ 0.2000357061624527,
841
+ 0.22720889747142792,
842
+ 0.18639278411865234,
843
+ 0.22194363176822662,
844
+ 0.2069634348154068,
845
+ 0.2373548299074173,
846
+ 0.15888510644435883,
847
+ 0.1979457139968872,
848
+ 0.16390980780124664,
849
+ 0.19959606230258942,
850
+ 0.16598200798034668,
851
+ 0.19541189074516296,
852
+ 0.16625605523586273,
853
+ 0.18630900979042053,
854
+ 0.21210575103759766,
855
+ 0.20869462192058563,
856
+ 0.18824730813503265,
857
+ 0.18152736127376556,
858
+ 0.18498942255973816,
859
+ 0.18627949059009552,
860
+ 0.17134495079517365,
861
+ 0.2168290913105011,
862
+ 0.18592286109924316,
863
+ 0.16444489359855652,
864
+ 0.16715046763420105,
865
+ 0.1964850276708603,
866
+ 0.18959102034568787,
867
+ 0.18093536794185638,
868
+ 0.18605473637580872,
869
+ 0.19904981553554535,
870
+ 0.1973380595445633,
871
+ 0.15778742730617523,
872
+ 0.1747376173734665,
873
+ 0.17108812928199768,
874
+ 0.17510893940925598,
875
+ 0.16731013357639313,
876
+ 0.17871102690696716,
877
+ 0.14609429240226746,
878
+ 0.17256930470466614,
879
+ 0.14573118090629578,
880
+ 0.20665530860424042,
881
+ 0.15655572712421417,
882
+ 0.13402849435806274,
883
+ 0.16387078166007996,
884
+ 0.1248510554432869,
885
+ 0.16516248881816864,
886
+ 0.13674581050872803,
887
+ 0.16651712357997894,
888
+ 0.14748935401439667,
889
+ 0.1382364183664322,
890
+ 0.15008823573589325,
891
+ 0.15552841126918793,
892
+ 0.15129385888576508,
893
+ 0.16749367117881775,
894
+ 0.13866452872753143,
895
+ 0.1381988376379013,
896
+ 0.14164534211158752,
897
+ 0.17011216282844543,
898
+ 0.12627139687538147,
899
+ 0.13087666034698486,
900
+ 0.14732487499713898,
901
+ 0.10798748582601547,
902
+ 0.16139589250087738,
903
+ 0.16517122089862823,
904
+ 0.1411411613225937,
905
+ 0.1421668827533722,
906
+ 0.1339568793773651,
907
+ 0.12969021499156952,
908
+ 0.1501157432794571,
909
+ 0.12624980509281158,
910
+ 0.13378222286701202,
911
+ 0.12192026525735855,
912
+ 0.11317621916532516,
913
+ 0.16144336760044098,
914
+ 0.1496235579252243,
915
+ 0.12298120558261871,
916
+ 0.14827506244182587,
917
+ 0.16108521819114685,
918
+ 0.1463118940591812,
919
+ 0.13234232366085052,
920
+ 0.10579963773488998,
921
+ 0.13623115420341492,
922
+ 0.12044007331132889,
923
+ 0.14652453362941742,
924
+ 0.13023699820041656,
925
+ 0.12433119863271713,
926
+ 0.10616353899240494,
927
+ 0.1289213001728058,
928
+ 0.10968109220266342,
929
+ 0.11077271401882172,
930
+ 0.11283662170171738,
931
+ 0.11493217945098877,
932
+ 0.12461324781179428,
933
+ 0.12140349298715591,
934
+ 0.11627321690320969,
935
+ 0.11910700052976608,
936
+ 0.13995158672332764,
937
+ 0.1414678394794464
938
+ ],
939
+ "info_loss": [
940
+ -0.11385345458984375,
941
+ -0.14343023300170898,
942
+ -0.20502328872680664,
943
+ -0.15923309326171875,
944
+ -0.2174081802368164,
945
+ -0.0420684814453125,
946
+ -0.014981746673583984,
947
+ -0.04172956943511963,
948
+ -0.015005826950073242,
949
+ -0.04786980152130127,
950
+ -0.07152450084686279,
951
+ -0.09154641628265381,
952
+ -0.12877655029296875,
953
+ -0.1466604471206665,
954
+ -0.17095613479614258,
955
+ -0.2396688461303711,
956
+ -0.3221203088760376,
957
+ -0.4862041473388672,
958
+ -0.5681549310684204,
959
+ -0.684140682220459,
960
+ -0.8983767032623291,
961
+ -1.0017673969268799,
962
+ -1.2004902362823486,
963
+ -1.1987392902374268,
964
+ -1.2378183603286743,
965
+ -1.2491450309753418,
966
+ -1.3905093669891357,
967
+ -1.2777379751205444,
968
+ -1.4317843914031982,
969
+ -1.4551732540130615,
970
+ -1.4445528984069824,
971
+ -1.5836052894592285,
972
+ -1.567819595336914,
973
+ -1.546617031097412,
974
+ -1.6144828796386719,
975
+ -1.4889076948165894,
976
+ -1.6100263595581055,
977
+ -1.625740647315979,
978
+ -1.6420310735702515,
979
+ -1.507124900817871,
980
+ -1.5704201459884644,
981
+ -1.6301132440567017,
982
+ -1.6036299467086792,
983
+ -1.5542329549789429,
984
+ -1.5175899267196655,
985
+ -1.6583689451217651,
986
+ -1.5958442687988281,
987
+ -1.6468164920806885,
988
+ -1.5525816679000854,
989
+ -1.5934239625930786,
990
+ -1.647326946258545,
991
+ -1.5843557119369507,
992
+ -1.5815900564193726,
993
+ -1.571997880935669,
994
+ -1.576888918876648,
995
+ -1.5461136102676392,
996
+ -1.497298240661621,
997
+ -1.5533920526504517,
998
+ -1.5812208652496338,
999
+ -1.5985703468322754,
1000
+ -1.5774600505828857,
1001
+ -1.5853532552719116,
1002
+ -1.5370008945465088,
1003
+ -1.5863351821899414,
1004
+ -1.606804609298706,
1005
+ -1.537649393081665,
1006
+ -1.5525469779968262,
1007
+ -1.5101174116134644,
1008
+ -1.5952324867248535,
1009
+ -1.5109450817108154,
1010
+ -1.5317682027816772,
1011
+ -1.5129121541976929,
1012
+ -1.549247145652771,
1013
+ -1.586357593536377,
1014
+ -1.527389407157898,
1015
+ -1.5647804737091064,
1016
+ -1.5350285768508911,
1017
+ -1.525258183479309,
1018
+ -1.5214704275131226,
1019
+ -1.5375951528549194,
1020
+ -1.5907458066940308,
1021
+ -1.4744808673858643,
1022
+ -1.5221446752548218,
1023
+ -1.5537238121032715,
1024
+ -1.585281252861023,
1025
+ -1.5659524202346802,
1026
+ -1.5400159358978271,
1027
+ -1.5463478565216064,
1028
+ -1.484694004058838,
1029
+ -1.46498441696167,
1030
+ -1.5409584045410156,
1031
+ -1.4950144290924072,
1032
+ -1.5345021486282349,
1033
+ -1.5598196983337402,
1034
+ -1.4889129400253296,
1035
+ -1.5336635112762451,
1036
+ -1.4689878225326538,
1037
+ -1.5244895219802856,
1038
+ -1.4982454776763916,
1039
+ -1.5184264183044434,
1040
+ -1.4915274381637573,
1041
+ -1.5377562046051025,
1042
+ -1.5106768608093262,
1043
+ -1.4720402956008911,
1044
+ -1.5842334032058716,
1045
+ -1.5001106262207031,
1046
+ -1.5235495567321777,
1047
+ -1.5334497690200806,
1048
+ -1.4875925779342651,
1049
+ -1.4477195739746094,
1050
+ -1.4215354919433594,
1051
+ -1.3809431791305542,
1052
+ -1.3361492156982422,
1053
+ -1.3366215229034424,
1054
+ -1.2126234769821167,
1055
+ -1.0218498706817627,
1056
+ -1.0225090980529785,
1057
+ -0.796761155128479,
1058
+ -0.7610917091369629,
1059
+ -0.6727439761161804,
1060
+ -0.6226391792297363,
1061
+ -0.6016292572021484,
1062
+ -0.5633807182312012,
1063
+ -0.5234792232513428,
1064
+ -0.4851091206073761,
1065
+ -0.497601717710495,
1066
+ -0.5263352394104004,
1067
+ -0.5140460133552551,
1068
+ -0.4624413251876831,
1069
+ -0.4394057095050812,
1070
+ -0.43588510155677795,
1071
+ -0.44685807824134827,
1072
+ -0.43609413504600525,
1073
+ -0.4237522780895233,
1074
+ -0.41476190090179443,
1075
+ -0.41749295592308044,
1076
+ -0.4634345769882202,
1077
+ -0.40468814969062805,
1078
+ -0.3737349510192871,
1079
+ -0.396659791469574,
1080
+ -0.4255046546459198,
1081
+ -0.3532746434211731,
1082
+ -0.36393654346466064,
1083
+ -0.3283543288707733,
1084
+ -0.3739100396633148,
1085
+ -0.368809312582016,
1086
+ -0.36335042119026184,
1087
+ -0.3583308458328247,
1088
+ -0.34817737340927124,
1089
+ -0.35022154450416565,
1090
+ -0.3576264977455139,
1091
+ -0.31730690598487854,
1092
+ -0.3450942039489746,
1093
+ -0.3241146504878998,
1094
+ -0.3240019679069519,
1095
+ -0.318650484085083,
1096
+ -0.3664001524448395,
1097
+ -0.31477200984954834,
1098
+ -0.3253546953201294,
1099
+ -0.32520633935928345,
1100
+ -0.3138948380947113,
1101
+ -0.30230018496513367,
1102
+ -0.32947179675102234,
1103
+ -0.32324084639549255,
1104
+ -0.2853688895702362,
1105
+ -0.3047855496406555,
1106
+ -0.29905828833580017,
1107
+ -0.26823070645332336,
1108
+ -0.30898529291152954,
1109
+ -0.26060950756073,
1110
+ -0.2832368314266205,
1111
+ -0.3351980745792389,
1112
+ -0.29253584146499634,
1113
+ -0.2955663502216339,
1114
+ -0.2738269865512848,
1115
+ -0.2561382055282593,
1116
+ -0.28282296657562256,
1117
+ -0.28397995233535767,
1118
+ -0.26278093457221985,
1119
+ -0.2610403001308441,
1120
+ -0.2754134237766266,
1121
+ -0.27838048338890076,
1122
+ -0.32534337043762207,
1123
+ -0.31341785192489624,
1124
+ -0.2773230969905853,
1125
+ -0.2570829391479492,
1126
+ -0.24993328750133514,
1127
+ -0.24398627877235413,
1128
+ -0.279629111289978,
1129
+ -0.2965335547924042,
1130
+ -0.2636924684047699,
1131
+ -0.25213974714279175,
1132
+ -0.2612018883228302,
1133
+ -0.24196603894233704,
1134
+ -0.2161180078983307,
1135
+ -0.22004133462905884,
1136
+ -0.27529701590538025,
1137
+ -0.22714611887931824,
1138
+ -0.23910602927207947,
1139
+ -0.23192031681537628,
1140
+ -0.2548813223838806,
1141
+ -0.23050589859485626,
1142
+ -0.21774822473526,
1143
+ -0.21656401455402374,
1144
+ -0.2265331894159317,
1145
+ -0.2396659255027771,
1146
+ -0.19935452938079834,
1147
+ -0.24267248809337616,
1148
+ -0.19900815188884735,
1149
+ -0.20903536677360535,
1150
+ -0.2290165275335312,
1151
+ -0.20365144312381744,
1152
+ -0.1999422162771225,
1153
+ -0.21606677770614624,
1154
+ -0.17974726855754852,
1155
+ -0.2214144915342331,
1156
+ -0.20677374303340912,
1157
+ -0.23102223873138428,
1158
+ -0.15881958603858948,
1159
+ -0.19410057365894318,
1160
+ -0.16373766958713531,
1161
+ -0.1994384080171585,
1162
+ -0.16169355809688568,
1163
+ -0.19534216821193695,
1164
+ -0.16603849828243256,
1165
+ -0.1837719827890396,
1166
+ -0.21206045150756836,
1167
+ -0.20862361788749695,
1168
+ -0.188018798828125,
1169
+ -0.18006832897663116,
1170
+ -0.18477082252502441,
1171
+ -0.1862453669309616,
1172
+ -0.1709631085395813,
1173
+ -0.21677134931087494,
1174
+ -0.18473117053508759,
1175
+ -0.1642923802137375,
1176
+ -0.16710221767425537,
1177
+ -0.19642113149166107,
1178
+ -0.18956467509269714,
1179
+ -0.18083183467388153,
1180
+ -0.18593645095825195,
1181
+ -0.19899502396583557,
1182
+ -0.1973118633031845,
1183
+ -0.15775373578071594,
1184
+ -0.17471984028816223,
1185
+ -0.1710720956325531,
1186
+ -0.1750890463590622,
1187
+ -0.16668885946273804,
1188
+ -0.17866910994052887,
1189
+ -0.14603638648986816,
1190
+ -0.17250952124595642,
1191
+ -0.14571359753608704,
1192
+ -0.2065526694059372,
1193
+ -0.15653041005134583,
1194
+ -0.1340152472257614,
1195
+ -0.16376584768295288,
1196
+ -0.12481392920017242,
1197
+ -0.16514933109283447,
1198
+ -0.13672783970832825,
1199
+ -0.16649629175662994,
1200
+ -0.146728515625,
1201
+ -0.1372392326593399,
1202
+ -0.15005478262901306,
1203
+ -0.15551863610744476,
1204
+ -0.1512700915336609,
1205
+ -0.16742905974388123,
1206
+ -0.1386333853006363,
1207
+ -0.13817352056503296,
1208
+ -0.14161676168441772,
1209
+ -0.17008331418037415,
1210
+ -0.12625375390052795,
1211
+ -0.13071495294570923,
1212
+ -0.1473049819469452,
1213
+ -0.10797560960054398,
1214
+ -0.16138042509555817,
1215
+ -0.16511429846286774,
1216
+ -0.1411227285861969,
1217
+ -0.14215360581874847,
1218
+ -0.1339317113161087,
1219
+ -0.1294330358505249,
1220
+ -0.1500917226076126,
1221
+ -0.12619058787822723,
1222
+ -0.133761465549469,
1223
+ -0.12187721580266953,
1224
+ -0.11312084645032883,
1225
+ -0.16143116354942322,
1226
+ -0.14961135387420654,
1227
+ -0.12295876443386078,
1228
+ -0.1482592076063156,
1229
+ -0.1610305905342102,
1230
+ -0.1462990939617157,
1231
+ -0.1323220580816269,
1232
+ -0.1057858020067215,
1233
+ -0.13618363440036774,
1234
+ -0.12043294310569763,
1235
+ -0.14648698270320892,
1236
+ -0.13023099303245544,
1237
+ -0.12432308495044708,
1238
+ -0.10615240782499313,
1239
+ -0.12891289591789246,
1240
+ -0.10966979712247849,
1241
+ -0.11076144129037857,
1242
+ -0.11282671242952347,
1243
+ -0.11491944640874863,
1244
+ -0.12460529059171677,
1245
+ -0.12138896435499191,
1246
+ -0.11626255512237549,
1247
+ -0.1190897598862648,
1248
+ -0.13994117081165314,
1249
+ -0.1414576917886734
1250
+ ],
1251
+ "abs_loss": [
1252
+ 4.600222110748291,
1253
+ 4.585060119628906,
1254
+ 4.535017967224121,
1255
+ 4.411112308502197,
1256
+ 4.214651107788086,
1257
+ 3.500492572784424,
1258
+ 3.2125346660614014,
1259
+ 3.110368251800537,
1260
+ 3.050847053527832,
1261
+ 3.1303863525390625,
1262
+ 3.1481270790100098,
1263
+ 3.1907219886779785,
1264
+ 3.121077299118042,
1265
+ 3.122469902038574,
1266
+ 2.9989373683929443,
1267
+ 3.169970989227295,
1268
+ 3.1337380409240723,
1269
+ 3.1850204467773438,
1270
+ 3.1595168113708496,
1271
+ 2.9852089881896973,
1272
+ 3.003159761428833,
1273
+ 2.801137685775757,
1274
+ 2.5646042823791504,
1275
+ 2.432736396789551,
1276
+ 1.999617338180542,
1277
+ 1.8525265455245972,
1278
+ 1.9091401100158691,
1279
+ 1.9688462018966675,
1280
+ 1.8593182563781738,
1281
+ 1.6353579759597778,
1282
+ 1.7597875595092773,
1283
+ 1.9715489149093628,
1284
+ 1.6212482452392578,
1285
+ 1.7391170263290405,
1286
+ 1.5134029388427734,
1287
+ 1.6808552742004395,
1288
+ 1.5621697902679443,
1289
+ 1.6727452278137207,
1290
+ 1.6910449266433716,
1291
+ 1.6261968612670898,
1292
+ 1.3995141983032227,
1293
+ 1.3336455821990967,
1294
+ 1.5245065689086914,
1295
+ 1.3680379390716553,
1296
+ 1.4579674005508423,
1297
+ 1.1433132886886597,
1298
+ 1.4170444011688232,
1299
+ 1.4678308963775635,
1300
+ 1.2090680599212646,
1301
+ 1.0885725021362305,
1302
+ 1.0543391704559326,
1303
+ 1.1062440872192383,
1304
+ 1.0231534242630005,
1305
+ 1.0875221490859985,
1306
+ 1.1583337783813477,
1307
+ 1.048989176750183,
1308
+ 1.275425672531128,
1309
+ 0.8260887265205383,
1310
+ 1.1685587167739868,
1311
+ 0.8801293969154358,
1312
+ 0.8248441219329834,
1313
+ 0.8601986765861511,
1314
+ 0.965746283531189,
1315
+ 0.8020682334899902,
1316
+ 0.8892130255699158,
1317
+ 0.8327577114105225,
1318
+ 0.8905668258666992,
1319
+ 0.9484708905220032,
1320
+ 0.9553885459899902,
1321
+ 0.8176908493041992,
1322
+ 0.8552860617637634,
1323
+ 0.830318808555603,
1324
+ 0.7996451258659363,
1325
+ 0.666130781173706,
1326
+ 1.0367419719696045,
1327
+ 0.8224754929542542,
1328
+ 0.9066834449768066,
1329
+ 0.7016845345497131,
1330
+ 0.814628541469574,
1331
+ 0.6553899049758911,
1332
+ 0.7444800138473511,
1333
+ 0.7174248695373535,
1334
+ 0.749908447265625,
1335
+ 0.7693836688995361,
1336
+ 0.7470314502716064,
1337
+ 0.8517244458198547,
1338
+ 0.6488890051841736,
1339
+ 0.7687116861343384,
1340
+ 0.75773024559021,
1341
+ 0.7646090984344482,
1342
+ 0.7204738855361938,
1343
+ 0.5489466190338135,
1344
+ 0.8591753244400024,
1345
+ 0.8850686550140381,
1346
+ 0.7457890510559082,
1347
+ 0.8056696653366089,
1348
+ 0.8558416366577148,
1349
+ 0.866152286529541,
1350
+ 0.6059410572052002,
1351
+ 0.6956859230995178,
1352
+ 0.6744041442871094,
1353
+ 0.7838091254234314,
1354
+ 0.690622091293335,
1355
+ 0.9125334024429321,
1356
+ 0.5624383687973022,
1357
+ 0.7412213087081909,
1358
+ 0.7233027219772339,
1359
+ 0.4596283733844757,
1360
+ 0.6814550161361694,
1361
+ 0.8564143180847168,
1362
+ 0.6888761520385742,
1363
+ 0.835689127445221,
1364
+ 0.6428424715995789,
1365
+ 0.6466372013092041,
1366
+ 0.7571539878845215,
1367
+ 0.7585248947143555,
1368
+ 0.6671715974807739,
1369
+ 0.8459024429321289,
1370
+ 0.7264590263366699,
1371
+ 0.8340179920196533,
1372
+ 0.7317735552787781,
1373
+ 0.6521148681640625,
1374
+ 0.7353276014328003,
1375
+ 0.8445788621902466,
1376
+ 0.8306164741516113,
1377
+ 0.5943429470062256,
1378
+ 0.6313499808311462,
1379
+ 0.6874839067459106,
1380
+ 0.6386463046073914,
1381
+ 0.6640372276306152,
1382
+ 0.6259667277336121,
1383
+ 0.5979993343353271,
1384
+ 0.6901720762252808,
1385
+ 0.573563814163208,
1386
+ 0.6068687438964844,
1387
+ 0.6457435488700867,
1388
+ 0.5819556713104248,
1389
+ 0.5604647994041443,
1390
+ 0.5882904529571533,
1391
+ 0.6295926570892334,
1392
+ 0.6285600662231445,
1393
+ 0.5659893751144409,
1394
+ 0.4942191243171692,
1395
+ 0.591978907585144,
1396
+ 0.5950663685798645,
1397
+ 0.49396175146102905,
1398
+ 0.6858351230621338,
1399
+ 0.4591514766216278,
1400
+ 0.8484950661659241,
1401
+ 0.6848112940788269,
1402
+ 0.6612932085990906,
1403
+ 0.5308752059936523,
1404
+ 0.5206629037857056,
1405
+ 0.7018767595291138,
1406
+ 0.5639657974243164,
1407
+ 0.5794847011566162,
1408
+ 0.3803393542766571,
1409
+ 0.5580293536186218,
1410
+ 0.5711216926574707,
1411
+ 0.5046465396881104,
1412
+ 0.44330233335494995,
1413
+ 0.5817766189575195,
1414
+ 0.5793009400367737,
1415
+ 0.5169496536254883,
1416
+ 0.5030026435852051,
1417
+ 0.6168398261070251,
1418
+ 0.5473909974098206,
1419
+ 0.5264185667037964,
1420
+ 0.6585381031036377,
1421
+ 0.40417736768722534,
1422
+ 0.6081347465515137,
1423
+ 0.6516579389572144,
1424
+ 0.4337080121040344,
1425
+ 0.42822009325027466,
1426
+ 0.608845591545105,
1427
+ 0.4710497260093689,
1428
+ 0.5425891876220703,
1429
+ 0.7154373526573181,
1430
+ 0.5240054130554199,
1431
+ 0.6915121078491211,
1432
+ 0.438113808631897,
1433
+ 0.6105717420578003,
1434
+ 0.4793950021266937,
1435
+ 0.5409137010574341,
1436
+ 0.41575175523757935,
1437
+ 0.6154731512069702,
1438
+ 0.6129148006439209,
1439
+ 0.5004086494445801,
1440
+ 0.577346920967102,
1441
+ 0.511862576007843,
1442
+ 0.4338465631008148,
1443
+ 0.5168926119804382,
1444
+ 0.562402606010437,
1445
+ 0.49650275707244873,
1446
+ 0.431353360414505,
1447
+ 0.5206334590911865,
1448
+ 0.5558791160583496,
1449
+ 0.4398925006389618,
1450
+ 0.4828936755657196,
1451
+ 0.6310799717903137,
1452
+ 0.39086517691612244,
1453
+ 0.5998769998550415,
1454
+ 0.5554673671722412,
1455
+ 0.5007154941558838,
1456
+ 0.5605072975158691,
1457
+ 0.5763310194015503,
1458
+ 0.44387757778167725,
1459
+ 0.5221637487411499,
1460
+ 0.4436303973197937,
1461
+ 0.6459587812423706,
1462
+ 0.47150060534477234,
1463
+ 0.458065927028656,
1464
+ 0.4076268672943115,
1465
+ 0.6684603691101074,
1466
+ 0.46604329347610474,
1467
+ 0.4915527105331421,
1468
+ 0.4971369206905365,
1469
+ 0.4907045364379883,
1470
+ 0.618830144405365,
1471
+ 0.4259473383426666,
1472
+ 0.49789100885391235,
1473
+ 0.49302276968955994,
1474
+ 0.5082845687866211,
1475
+ 0.48034894466400146,
1476
+ 0.39231348037719727,
1477
+ 0.5948460698127747,
1478
+ 0.6186717748641968,
1479
+ 0.5783128142356873,
1480
+ 0.4655434489250183,
1481
+ 0.48685896396636963,
1482
+ 0.5358094573020935,
1483
+ 0.4071079194545746,
1484
+ 0.5148466229438782,
1485
+ 0.4136655628681183,
1486
+ 0.41432803869247437,
1487
+ 0.4495674967765808,
1488
+ 0.5279877185821533,
1489
+ 0.5033449530601501,
1490
+ 0.5748267769813538,
1491
+ 0.5323889255523682,
1492
+ 0.49586522579193115,
1493
+ 0.46038562059402466,
1494
+ 0.5176984667778015,
1495
+ 0.4125681519508362,
1496
+ 0.6684879064559937,
1497
+ 0.4497949182987213,
1498
+ 0.396254301071167,
1499
+ 0.4728800058364868,
1500
+ 0.4475850462913513,
1501
+ 0.3921929597854614,
1502
+ 0.4662751257419586,
1503
+ 0.4294249415397644,
1504
+ 0.4877370595932007,
1505
+ 0.5649451017379761,
1506
+ 0.4627125859260559,
1507
+ 0.6273665428161621,
1508
+ 0.4333481788635254,
1509
+ 0.39706796407699585,
1510
+ 0.45926716923713684,
1511
+ 0.5503664612770081,
1512
+ 0.4088195562362671,
1513
+ 0.49588871002197266,
1514
+ 0.449713796377182,
1515
+ 0.4749121069908142,
1516
+ 0.5020171403884888,
1517
+ 0.3331933617591858,
1518
+ 0.3349999785423279,
1519
+ 0.4275625944137573,
1520
+ 0.38952159881591797,
1521
+ 0.3819730281829834,
1522
+ 0.42513060569763184,
1523
+ 0.3870682120323181,
1524
+ 0.5191415548324585,
1525
+ 0.4761240780353546,
1526
+ 0.41521960496902466,
1527
+ 0.5030770301818848,
1528
+ 0.5881625413894653,
1529
+ 0.37058791518211365,
1530
+ 0.4363459348678589,
1531
+ 0.4512035846710205,
1532
+ 0.5564160346984863,
1533
+ 0.4164927005767822,
1534
+ 0.4175732731819153,
1535
+ 0.5126424431800842,
1536
+ 0.36320215463638306,
1537
+ 0.4501055181026459,
1538
+ 0.4496520161628723,
1539
+ 0.3972645401954651,
1540
+ 0.3614107072353363,
1541
+ 0.3568313717842102,
1542
+ 0.43815040588378906,
1543
+ 0.4537099599838257,
1544
+ 0.433208703994751,
1545
+ 0.4528942406177521,
1546
+ 0.3446529507637024,
1547
+ 0.4783862829208374,
1548
+ 0.37083593010902405,
1549
+ 0.4587956666946411,
1550
+ 0.5160912275314331,
1551
+ 0.42571330070495605,
1552
+ 0.4347543716430664,
1553
+ 0.29358673095703125,
1554
+ 0.398557186126709,
1555
+ 0.3981517553329468,
1556
+ 0.43517670035362244,
1557
+ 0.3059583902359009,
1558
+ 0.45012903213500977,
1559
+ 0.4453981816768646,
1560
+ 0.46157723665237427,
1561
+ 0.4827229380607605
1562
+ ],
1563
+ "zipf_loss": [
1564
+ 5.619585990905762,
1565
+ 4.827937126159668,
1566
+ 3.5652852058410645,
1567
+ 2.4467859268188477,
1568
+ 1.5216761827468872,
1569
+ 0.773383617401123,
1570
+ 0.5843554735183716,
1571
+ 0.5287005305290222,
1572
+ 0.5126160383224487,
1573
+ 0.5006808638572693,
1574
+ 0.5063974857330322,
1575
+ 0.49276259541511536,
1576
+ 0.4957123398780823,
1577
+ 0.49685826897621155,
1578
+ 0.49590766429901123,
1579
+ 0.49371200799942017,
1580
+ 0.483493834733963,
1581
+ 0.4727323055267334,
1582
+ 0.4543910026550293,
1583
+ 0.411824107170105,
1584
+ 0.34403884410858154,
1585
+ 0.2695366144180298,
1586
+ 0.26120150089263916,
1587
+ 0.20295308530330658,
1588
+ 0.20690077543258667,
1589
+ 0.17473576962947845,
1590
+ 0.17259135842323303,
1591
+ 0.16133253276348114,
1592
+ 0.13822603225708008,
1593
+ 0.14837780594825745,
1594
+ 0.1232171356678009,
1595
+ 0.1109403520822525,
1596
+ 0.13091117143630981,
1597
+ 0.11166486144065857,
1598
+ 0.10927983373403549,
1599
+ 0.11775951087474823,
1600
+ 0.08994985371828079,
1601
+ 0.08822619915008545,
1602
+ 0.08573438227176666,
1603
+ 0.08551208674907684,
1604
+ 0.08270096033811569,
1605
+ 0.0882456973195076,
1606
+ 0.0623585470020771,
1607
+ 0.07257397472858429,
1608
+ 0.061287589371204376,
1609
+ 0.06838192045688629,
1610
+ 0.05461812764406204,
1611
+ 0.04656702280044556,
1612
+ 0.04923718422651291,
1613
+ 0.06073414906859398,
1614
+ 0.049436502158641815,
1615
+ 0.052005868405103683,
1616
+ 0.058678172528743744,
1617
+ 0.0505443811416626,
1618
+ 0.035363972187042236,
1619
+ 0.06724280118942261,
1620
+ 0.02915341965854168,
1621
+ 0.061135806143283844,
1622
+ 0.025998758152127266,
1623
+ 0.0522865429520607,
1624
+ 0.06896450370550156,
1625
+ 0.02469157986342907,
1626
+ 0.052792251110076904,
1627
+ 0.05133802443742752,
1628
+ 0.048972226679325104,
1629
+ 0.056013695895671844,
1630
+ 0.039805732667446136,
1631
+ 0.045125462114810944,
1632
+ 0.042175572365522385,
1633
+ 0.05225789174437523,
1634
+ 0.05213606730103493,
1635
+ 0.044449709355831146,
1636
+ 0.053074367344379425,
1637
+ 0.06077408045530319,
1638
+ 0.03345252200961113,
1639
+ 0.049690522253513336,
1640
+ 0.02930966019630432,
1641
+ 0.05327582359313965,
1642
+ 0.04678161069750786,
1643
+ 0.07281782478094101,
1644
+ 0.04119352996349335,
1645
+ 0.054937973618507385,
1646
+ 0.040824998170137405,
1647
+ 0.03674336150288582,
1648
+ 0.03949633240699768,
1649
+ 0.03347763046622276,
1650
+ 0.04909197986125946,
1651
+ 0.036684438586235046,
1652
+ 0.038356099277734756,
1653
+ 0.04367246478796005,
1654
+ 0.05299493670463562,
1655
+ 0.04540283977985382,
1656
+ 0.030584828928112984,
1657
+ 0.027790088206529617,
1658
+ 0.05903084576129913,
1659
+ 0.042674530297517776,
1660
+ 0.037005726248025894,
1661
+ 0.042257245630025864,
1662
+ 0.052620261907577515,
1663
+ 0.04064880684018135,
1664
+ 0.03719138354063034,
1665
+ 0.044077176600694656,
1666
+ 0.035351477563381195,
1667
+ 0.04687754064798355,
1668
+ 0.04852171614766121,
1669
+ 0.06075644493103027,
1670
+ 0.05049310624599457,
1671
+ 0.07284531742334366,
1672
+ 0.03610651195049286,
1673
+ 0.05141353979706764,
1674
+ 0.03818117827177048,
1675
+ 0.02376411110162735,
1676
+ 0.03719331696629524,
1677
+ 0.06002876162528992,
1678
+ 0.04094189777970314,
1679
+ 0.04732527583837509,
1680
+ 0.04978743568062782,
1681
+ 0.03309670835733414,
1682
+ 0.05335727706551552,
1683
+ 0.03190968185663223,
1684
+ 0.027508515864610672,
1685
+ 0.0450429767370224,
1686
+ 0.04571438953280449,
1687
+ 0.03200307860970497,
1688
+ 0.034294165670871735,
1689
+ 0.04827748239040375,
1690
+ 0.0547143816947937,
1691
+ 0.03082178719341755,
1692
+ 0.05372374877333641,
1693
+ 0.05041574686765671,
1694
+ 0.059702519327402115,
1695
+ 0.06540592759847641,
1696
+ 0.047250136733055115,
1697
+ 0.05830858647823334,
1698
+ 0.03999902307987213,
1699
+ 0.058414652943611145,
1700
+ 0.04007250815629959,
1701
+ 0.06216740608215332,
1702
+ 0.033193439245224,
1703
+ 0.0495615154504776,
1704
+ 0.030186738818883896,
1705
+ 0.048738185316324234,
1706
+ 0.05909387767314911,
1707
+ 0.04317042976617813,
1708
+ 0.0397363118827343,
1709
+ 0.04780852422118187,
1710
+ 0.03171863406896591,
1711
+ 0.04438743367791176,
1712
+ 0.03188920393586159,
1713
+ 0.03446602076292038,
1714
+ 0.029610421508550644,
1715
+ 0.046105869114398956,
1716
+ 0.0452386848628521,
1717
+ 0.03550521284341812,
1718
+ 0.04812770336866379,
1719
+ 0.04871044307947159,
1720
+ 0.058514468371868134,
1721
+ 0.04799622297286987,
1722
+ 0.04301080107688904,
1723
+ 0.051344092935323715,
1724
+ 0.07505089789628983,
1725
+ 0.037866994738578796,
1726
+ 0.044814467430114746,
1727
+ 0.03362371772527695,
1728
+ 0.04321867227554321,
1729
+ 0.0429118350148201,
1730
+ 0.031412024050951004,
1731
+ 0.0494377501308918,
1732
+ 0.041822005063295364,
1733
+ 0.050539448857307434,
1734
+ 0.04576407000422478,
1735
+ 0.03194405138492584,
1736
+ 0.0604124441742897,
1737
+ 0.0709601491689682,
1738
+ 0.05381552129983902,
1739
+ 0.05737155303359032,
1740
+ 0.053178612142801285,
1741
+ 0.021184831857681274,
1742
+ 0.07817338407039642,
1743
+ 0.02402309700846672,
1744
+ 0.07601477205753326,
1745
+ 0.052705395966768265,
1746
+ 0.04735003411769867,
1747
+ 0.05169006064534187,
1748
+ 0.05517950281500816,
1749
+ 0.03813251107931137,
1750
+ 0.03253985941410065,
1751
+ 0.04704003781080246,
1752
+ 0.04927995428442955,
1753
+ 0.040194395929574966,
1754
+ 0.03592187911272049,
1755
+ 0.0601678229868412,
1756
+ 0.04239239543676376,
1757
+ 0.05602855607867241,
1758
+ 0.03726328909397125,
1759
+ 0.05887894704937935,
1760
+ 0.039854299277067184,
1761
+ 0.036494482308626175,
1762
+ 0.03535246104001999,
1763
+ 0.03631899505853653,
1764
+ 0.052550867199897766,
1765
+ 0.03643118590116501,
1766
+ 0.04741375148296356,
1767
+ 0.05410199239850044,
1768
+ 0.03729458898305893,
1769
+ 0.047319523990154266,
1770
+ 0.05005549639463425,
1771
+ 0.045176032930612564,
1772
+ 0.0343095101416111,
1773
+ 0.034685175865888596,
1774
+ 0.0549418181180954,
1775
+ 0.03940516710281372,
1776
+ 0.06138772889971733,
1777
+ 0.026964673772454262,
1778
+ 0.061726365238428116,
1779
+ 0.035674963146448135,
1780
+ 0.03675725311040878,
1781
+ 0.04917548596858978,
1782
+ 0.02920985221862793,
1783
+ 0.06452488899230957,
1784
+ 0.04665427654981613,
1785
+ 0.033418770879507065,
1786
+ 0.04070022702217102,
1787
+ 0.047383278608322144,
1788
+ 0.05476439371705055,
1789
+ 0.03517329692840576,
1790
+ 0.04526129364967346,
1791
+ 0.03768059238791466,
1792
+ 0.04081333428621292,
1793
+ 0.05012888461351395,
1794
+ 0.03764863312244415,
1795
+ 0.04876726120710373,
1796
+ 0.042848192155361176,
1797
+ 0.05155747011303902,
1798
+ 0.048097509890794754,
1799
+ 0.04292648285627365,
1800
+ 0.03304499387741089,
1801
+ 0.03619405999779701,
1802
+ 0.029800329357385635,
1803
+ 0.0334189310669899,
1804
+ 0.03642233833670616,
1805
+ 0.061966873705387115,
1806
+ 0.03105630725622177,
1807
+ 0.052772752940654755,
1808
+ 0.035264141857624054,
1809
+ 0.045341137796640396,
1810
+ 0.038955844938755035,
1811
+ 0.0272893775254488,
1812
+ 0.03914085775613785,
1813
+ 0.044834159314632416,
1814
+ 0.03508982062339783,
1815
+ 0.03300919011235237,
1816
+ 0.045659542083740234,
1817
+ 0.03922303766012192,
1818
+ 0.04003182426095009,
1819
+ 0.030378874391317368,
1820
+ 0.03925931081175804,
1821
+ 0.03871184587478638,
1822
+ 0.04067009687423706,
1823
+ 0.03241518884897232,
1824
+ 0.04611578211188316,
1825
+ 0.040712304413318634,
1826
+ 0.04804009944200516,
1827
+ 0.04274597764015198,
1828
+ 0.02574107050895691,
1829
+ 0.05612611025571823,
1830
+ 0.05290276184678078,
1831
+ 0.031578272581100464,
1832
+ 0.040402136743068695,
1833
+ 0.04238107055425644,
1834
+ 0.03174016997218132,
1835
+ 0.037568703293800354,
1836
+ 0.025163792073726654,
1837
+ 0.043820884078741074,
1838
+ 0.031618956476449966,
1839
+ 0.03853407874703407,
1840
+ 0.03542154282331467,
1841
+ 0.03759405016899109,
1842
+ 0.04508199915289879,
1843
+ 0.044700928032398224,
1844
+ 0.03423428535461426,
1845
+ 0.05527113378047943,
1846
+ 0.034653205424547195,
1847
+ 0.03451674059033394,
1848
+ 0.04219019412994385,
1849
+ 0.04577811062335968,
1850
+ 0.042808786034584045,
1851
+ 0.025785747915506363,
1852
+ 0.05958080291748047,
1853
+ 0.05169958621263504,
1854
+ 0.05500699207186699,
1855
+ 0.03033105656504631,
1856
+ 0.04161223769187927,
1857
+ 0.041003815829753876,
1858
+ 0.044352687895298004,
1859
+ 0.022202085703611374,
1860
+ 0.04517877846956253,
1861
+ 0.04168744385242462,
1862
+ 0.03853369504213333,
1863
+ 0.04069175571203232,
1864
+ 0.04503012076020241,
1865
+ 0.06120455637574196,
1866
+ 0.03805052489042282,
1867
+ 0.04385353624820709,
1868
+ 0.03158339485526085,
1869
+ 0.056811150163412094,
1870
+ 0.03625018894672394,
1871
+ 0.041450440883636475,
1872
+ 0.05121373385190964,
1873
+ 0.040211036801338196
1874
+ ],
1875
+ "denoise_loss": [],
1876
+ "ortho_loss": [
1877
+ 0.8477625250816345,
1878
+ 0.6270668506622314,
1879
+ 0.35375306010246277,
1880
+ 0.18513090908527374,
1881
+ 0.11314814537763596,
1882
+ 0.08155959099531174,
1883
+ 0.06973419338464737,
1884
+ 0.05319012328982353,
1885
+ 0.0419590063393116,
1886
+ 0.03797777369618416,
1887
+ 0.03470993414521217,
1888
+ 0.03375212103128433,
1889
+ 0.03749161586165428,
1890
+ 0.04121977835893631,
1891
+ 0.04217546805739403,
1892
+ 0.046706654131412506,
1893
+ 0.04616285860538483,
1894
+ 0.045632317662239075,
1895
+ 0.04785409942269325,
1896
+ 0.050589628517627716,
1897
+ 0.05486857146024704,
1898
+ 0.05801132321357727,
1899
+ 0.06313689053058624,
1900
+ 0.06832898408174515,
1901
+ 0.07220464199781418,
1902
+ 0.07595375180244446,
1903
+ 0.07965358346700668,
1904
+ 0.0843292623758316,
1905
+ 0.08921559900045395,
1906
+ 0.09208281338214874,
1907
+ 0.0972515195608139,
1908
+ 0.10153611749410629,
1909
+ 0.10566537082195282,
1910
+ 0.10940378159284592,
1911
+ 0.11085320264101028,
1912
+ 0.11395293474197388,
1913
+ 0.11536199599504471,
1914
+ 0.11507408320903778,
1915
+ 0.11330236494541168,
1916
+ 0.11313570290803909,
1917
+ 0.11312603950500488,
1918
+ 0.11352822929620743,
1919
+ 0.11217745393514633,
1920
+ 0.11345779895782471,
1921
+ 0.11377058178186417,
1922
+ 0.11214352399110794,
1923
+ 0.11296330392360687,
1924
+ 0.11283531785011292,
1925
+ 0.11142794042825699,
1926
+ 0.10957454890012741,
1927
+ 0.10951845347881317,
1928
+ 0.10844650119543076,
1929
+ 0.10524056851863861,
1930
+ 0.10556697845458984,
1931
+ 0.10653087496757507,
1932
+ 0.10563769191503525,
1933
+ 0.10426626354455948,
1934
+ 0.10393765568733215,
1935
+ 0.10254596173763275,
1936
+ 0.10268296301364899,
1937
+ 0.10323475301265717,
1938
+ 0.10351748019456863,
1939
+ 0.10375725477933884,
1940
+ 0.10098842531442642,
1941
+ 0.10027060657739639,
1942
+ 0.09939239919185638,
1943
+ 0.0979134738445282,
1944
+ 0.09800726175308228,
1945
+ 0.09840735793113708,
1946
+ 0.09692982584238052,
1947
+ 0.09581397473812103,
1948
+ 0.09529635310173035,
1949
+ 0.09658239781856537,
1950
+ 0.09718240797519684,
1951
+ 0.09706336259841919,
1952
+ 0.09599632769823074,
1953
+ 0.09735315293073654,
1954
+ 0.09656201303005219,
1955
+ 0.09889460355043411,
1956
+ 0.10040658712387085,
1957
+ 0.10073850303888321,
1958
+ 0.10102172195911407,
1959
+ 0.1009986400604248,
1960
+ 0.10244335234165192,
1961
+ 0.1031949371099472,
1962
+ 0.10399853438138962,
1963
+ 0.10671082139015198,
1964
+ 0.1071852445602417,
1965
+ 0.10714156180620193,
1966
+ 0.1065908893942833,
1967
+ 0.1059853732585907,
1968
+ 0.1068815365433693,
1969
+ 0.10740302503108978,
1970
+ 0.10792513191699982,
1971
+ 0.10870114713907242,
1972
+ 0.108823761343956,
1973
+ 0.10967440903186798,
1974
+ 0.11261012405157089,
1975
+ 0.11379697918891907,
1976
+ 0.11422721296548843,
1977
+ 0.11453976482152939,
1978
+ 0.11541109532117844,
1979
+ 0.11571750789880753,
1980
+ 0.11609385162591934,
1981
+ 0.11757729947566986,
1982
+ 0.11700119078159332,
1983
+ 0.11970614641904831,
1984
+ 0.11980172991752625,
1985
+ 0.12358936667442322,
1986
+ 0.12539692223072052,
1987
+ 0.12486863881349564,
1988
+ 0.1271524429321289,
1989
+ 0.12923555076122284,
1990
+ 0.1315857619047165,
1991
+ 0.13292205333709717,
1992
+ 0.13546587526798248,
1993
+ 0.13885003328323364,
1994
+ 0.14402534067630768,
1995
+ 0.147845059633255,
1996
+ 0.15124990046024323,
1997
+ 0.15468817949295044,
1998
+ 0.1559913456439972,
1999
+ 0.1601400226354599,
2000
+ 0.16294769942760468,
2001
+ 0.16298216581344604,
2002
+ 0.16452212631702423,
2003
+ 0.1683468520641327,
2004
+ 0.16868238151073456,
2005
+ 0.17160287499427795,
2006
+ 0.17252276837825775,
2007
+ 0.17348770797252655,
2008
+ 0.17566640675067902,
2009
+ 0.17623268067836761,
2010
+ 0.17837531864643097,
2011
+ 0.17908938229084015,
2012
+ 0.18104304373264313,
2013
+ 0.18217481672763824,
2014
+ 0.18356861174106598,
2015
+ 0.18465754389762878,
2016
+ 0.18620507419109344,
2017
+ 0.18759240210056305,
2018
+ 0.18777203559875488,
2019
+ 0.19006824493408203,
2020
+ 0.19228748977184296,
2021
+ 0.19235096871852875,
2022
+ 0.1922677904367447,
2023
+ 0.19406947493553162,
2024
+ 0.19693200290203094,
2025
+ 0.19788794219493866,
2026
+ 0.19815294444561005,
2027
+ 0.1983489841222763,
2028
+ 0.20040495693683624,
2029
+ 0.20181000232696533,
2030
+ 0.2037876695394516,
2031
+ 0.20417653024196625,
2032
+ 0.20466746389865875,
2033
+ 0.20467495918273926,
2034
+ 0.20559166371822357,
2035
+ 0.20517095923423767,
2036
+ 0.2047836035490036,
2037
+ 0.20574744045734406,
2038
+ 0.2071981132030487,
2039
+ 0.2092108130455017,
2040
+ 0.20778527855873108,
2041
+ 0.20843109488487244,
2042
+ 0.21042220294475555,
2043
+ 0.21265923976898193,
2044
+ 0.2137930691242218,
2045
+ 0.21534432470798492,
2046
+ 0.21459147334098816,
2047
+ 0.21428824961185455,
2048
+ 0.21586327254772186,
2049
+ 0.21655382215976715,
2050
+ 0.21775919198989868,
2051
+ 0.21906070411205292,
2052
+ 0.2186809629201889,
2053
+ 0.2202470302581787,
2054
+ 0.22138795256614685,
2055
+ 0.22406847774982452,
2056
+ 0.22421269118785858,
2057
+ 0.22502855956554413,
2058
+ 0.22724615037441254,
2059
+ 0.22776556015014648,
2060
+ 0.22870388627052307,
2061
+ 0.2294059842824936,
2062
+ 0.23032227158546448,
2063
+ 0.23069751262664795,
2064
+ 0.23065929114818573,
2065
+ 0.23228758573532104,
2066
+ 0.23362798988819122,
2067
+ 0.2354430854320526,
2068
+ 0.2359708994626999,
2069
+ 0.2362011820077896,
2070
+ 0.23547999560832977,
2071
+ 0.236810564994812,
2072
+ 0.2378942370414734,
2073
+ 0.2370852380990982,
2074
+ 0.23747660219669342,
2075
+ 0.2379510998725891,
2076
+ 0.23851118981838226,
2077
+ 0.23896045982837677,
2078
+ 0.23781299591064453,
2079
+ 0.23904746770858765,
2080
+ 0.2397538423538208,
2081
+ 0.2394849956035614,
2082
+ 0.24049346148967743,
2083
+ 0.2408442348241806,
2084
+ 0.24402427673339844,
2085
+ 0.24560561776161194,
2086
+ 0.24606594443321228,
2087
+ 0.24576707184314728,
2088
+ 0.24569669365882874,
2089
+ 0.24569936096668243,
2090
+ 0.2463708519935608,
2091
+ 0.2471439093351364,
2092
+ 0.2489568144083023,
2093
+ 0.2494373470544815,
2094
+ 0.24941569566726685,
2095
+ 0.25020310282707214,
2096
+ 0.25147417187690735,
2097
+ 0.25302577018737793,
2098
+ 0.25658562779426575,
2099
+ 0.25757506489753723,
2100
+ 0.25599151849746704,
2101
+ 0.2575584948062897,
2102
+ 0.2580026090145111,
2103
+ 0.25835859775543213,
2104
+ 0.2620808482170105,
2105
+ 0.2628181278705597,
2106
+ 0.26342225074768066,
2107
+ 0.2643716633319855,
2108
+ 0.2652975916862488,
2109
+ 0.26612958312034607,
2110
+ 0.26860105991363525,
2111
+ 0.2692892253398895,
2112
+ 0.27039727568626404,
2113
+ 0.26999226212501526,
2114
+ 0.2700327932834625,
2115
+ 0.27080225944519043,
2116
+ 0.2718280851840973,
2117
+ 0.2721576988697052,
2118
+ 0.27287086844444275,
2119
+ 0.27328673005104065,
2120
+ 0.2742519974708557,
2121
+ 0.2743457555770874,
2122
+ 0.27543798089027405,
2123
+ 0.27694734930992126,
2124
+ 0.2783535122871399,
2125
+ 0.2793116271495819,
2126
+ 0.2808689475059509,
2127
+ 0.2817002236843109,
2128
+ 0.2811025381088257,
2129
+ 0.2815658748149872,
2130
+ 0.2821238934993744,
2131
+ 0.2833704948425293,
2132
+ 0.2831267714500427,
2133
+ 0.2842507064342499,
2134
+ 0.2866370379924774,
2135
+ 0.28746598958969116,
2136
+ 0.28841838240623474,
2137
+ 0.2894956171512604,
2138
+ 0.2908859848976135,
2139
+ 0.2916127145290375,
2140
+ 0.2926768660545349,
2141
+ 0.2931440770626068,
2142
+ 0.293007493019104,
2143
+ 0.2934287190437317,
2144
+ 0.29440173506736755,
2145
+ 0.29519739747047424,
2146
+ 0.2955481708049774,
2147
+ 0.29591187834739685,
2148
+ 0.29667699337005615,
2149
+ 0.29854315519332886,
2150
+ 0.2990916967391968,
2151
+ 0.2992062568664551,
2152
+ 0.3002597391605377,
2153
+ 0.29994961619377136,
2154
+ 0.300370454788208,
2155
+ 0.3015492856502533,
2156
+ 0.30222153663635254,
2157
+ 0.3022262156009674,
2158
+ 0.30287307500839233,
2159
+ 0.3034624457359314,
2160
+ 0.30395182967185974,
2161
+ 0.3042353689670563,
2162
+ 0.3045642673969269,
2163
+ 0.3047126531600952,
2164
+ 0.30494335293769836,
2165
+ 0.30510443449020386,
2166
+ 0.3058646023273468,
2167
+ 0.3064851760864258,
2168
+ 0.3073820173740387,
2169
+ 0.307350218296051,
2170
+ 0.3077446520328522,
2171
+ 0.30821216106414795,
2172
+ 0.30836403369903564,
2173
+ 0.30856674909591675,
2174
+ 0.30873575806617737,
2175
+ 0.30962589383125305,
2176
+ 0.3099839389324188,
2177
+ 0.3102879524230957,
2178
+ 0.31076711416244507,
2179
+ 0.31080421805381775,
2180
+ 0.31103259325027466,
2181
+ 0.3113178312778473,
2182
+ 0.31175798177719116,
2183
+ 0.31192323565483093,
2184
+ 0.31196096539497375,
2185
+ 0.3120540380477905,
2186
+ 0.3122491240501404
2187
+ ],
2188
+ "lr": [
2189
+ 4.188034188034189e-06,
2190
+ 8.461538461538462e-06,
2191
+ 1.2735042735042738e-05,
2192
+ 1.700854700854701e-05,
2193
+ 2.1282051282051282e-05,
2194
+ 2.5555555555555557e-05,
2195
+ 2.9829059829059833e-05,
2196
+ 3.4102564102564105e-05,
2197
+ 3.837606837606838e-05,
2198
+ 4e-05,
2199
+ 4e-05,
2200
+ 4e-05,
2201
+ 4e-05,
2202
+ 4e-05,
2203
+ 4e-05,
2204
+ 4e-05,
2205
+ 4e-05,
2206
+ 4e-05,
2207
+ 4e-05,
2208
+ 4e-05,
2209
+ 4e-05,
2210
+ 4e-05,
2211
+ 4e-05,
2212
+ 4e-05,
2213
+ 4e-05,
2214
+ 4e-05,
2215
+ 4e-05,
2216
+ 4e-05,
2217
+ 4e-05,
2218
+ 4e-05,
2219
+ 4e-05,
2220
+ 4e-05,
2221
+ 4e-05,
2222
+ 4e-05,
2223
+ 4e-05,
2224
+ 4e-05,
2225
+ 4e-05,
2226
+ 4e-05,
2227
+ 4e-05,
2228
+ 4e-05,
2229
+ 4e-05,
2230
+ 4e-05,
2231
+ 4e-05,
2232
+ 4e-05,
2233
+ 4e-05,
2234
+ 4e-05,
2235
+ 4e-05,
2236
+ 4e-05,
2237
+ 4e-05,
2238
+ 4e-05,
2239
+ 4e-05,
2240
+ 4e-05,
2241
+ 4e-05,
2242
+ 4e-05,
2243
+ 4e-05,
2244
+ 4e-05,
2245
+ 4e-05,
2246
+ 4e-05,
2247
+ 4e-05,
2248
+ 4e-05,
2249
+ 4e-05,
2250
+ 4e-05,
2251
+ 4e-05,
2252
+ 4e-05,
2253
+ 4e-05,
2254
+ 4e-05,
2255
+ 4e-05,
2256
+ 4e-05,
2257
+ 4e-05,
2258
+ 4e-05,
2259
+ 4e-05,
2260
+ 4e-05,
2261
+ 4e-05,
2262
+ 4e-05,
2263
+ 4e-05,
2264
+ 4e-05,
2265
+ 4e-05,
2266
+ 4e-05,
2267
+ 4e-05,
2268
+ 4e-05,
2269
+ 4e-05,
2270
+ 4e-05,
2271
+ 4e-05,
2272
+ 4e-05,
2273
+ 4e-05,
2274
+ 4e-05,
2275
+ 4e-05,
2276
+ 4e-05,
2277
+ 4e-05,
2278
+ 4e-05,
2279
+ 4e-05,
2280
+ 4e-05,
2281
+ 4e-05,
2282
+ 4e-05,
2283
+ 4e-05,
2284
+ 4e-05,
2285
+ 4e-05,
2286
+ 4e-05,
2287
+ 4e-05,
2288
+ 4e-05,
2289
+ 4e-05,
2290
+ 4e-05,
2291
+ 4e-05,
2292
+ 4e-05,
2293
+ 4e-05,
2294
+ 4e-05,
2295
+ 4e-05,
2296
+ 4e-05,
2297
+ 4e-05,
2298
+ 4e-05,
2299
+ 4e-05,
2300
+ 4e-05,
2301
+ 4e-05,
2302
+ 4e-05,
2303
+ 4e-05,
2304
+ 4e-05,
2305
+ 4e-05,
2306
+ 4e-05,
2307
+ 4e-05,
2308
+ 4e-05,
2309
+ 4e-05,
2310
+ 4e-05,
2311
+ 4e-05,
2312
+ 4e-05,
2313
+ 4e-05,
2314
+ 4e-05,
2315
+ 4e-05,
2316
+ 4e-05,
2317
+ 4e-05,
2318
+ 4e-05,
2319
+ 4e-05,
2320
+ 4e-05,
2321
+ 4e-05,
2322
+ 4e-05,
2323
+ 4e-05,
2324
+ 4e-05,
2325
+ 4e-05,
2326
+ 4e-05,
2327
+ 4e-05,
2328
+ 4e-05,
2329
+ 4e-05,
2330
+ 4e-05,
2331
+ 4e-05,
2332
+ 4e-05,
2333
+ 4e-05,
2334
+ 4e-05,
2335
+ 4e-05,
2336
+ 4e-05,
2337
+ 4e-05,
2338
+ 4e-05,
2339
+ 4e-05,
2340
+ 4e-05,
2341
+ 4e-05,
2342
+ 4e-05,
2343
+ 4e-05,
2344
+ 4e-05,
2345
+ 4e-05,
2346
+ 4e-05,
2347
+ 4e-05,
2348
+ 4e-05,
2349
+ 4e-05,
2350
+ 4e-05,
2351
+ 4e-05,
2352
+ 4e-05,
2353
+ 4e-05,
2354
+ 4e-05,
2355
+ 4e-05,
2356
+ 4e-05,
2357
+ 4e-05,
2358
+ 4e-05,
2359
+ 4e-05,
2360
+ 4e-05,
2361
+ 4e-05,
2362
+ 4e-05,
2363
+ 4e-05,
2364
+ 4e-05,
2365
+ 4e-05,
2366
+ 4e-05,
2367
+ 4e-05,
2368
+ 4e-05,
2369
+ 4e-05,
2370
+ 4e-05,
2371
+ 4e-05,
2372
+ 4e-05,
2373
+ 4e-05,
2374
+ 4e-05,
2375
+ 4e-05,
2376
+ 4e-05,
2377
+ 4e-05,
2378
+ 3.992995647012267e-05,
2379
+ 3.963316185199842e-05,
2380
+ 3.933636723387416e-05,
2381
+ 3.90395726157499e-05,
2382
+ 3.874277799762565e-05,
2383
+ 3.844598337950139e-05,
2384
+ 3.814918876137713e-05,
2385
+ 3.785239414325287e-05,
2386
+ 3.7555599525128613e-05,
2387
+ 3.725880490700435e-05,
2388
+ 3.696201028888009e-05,
2389
+ 3.666521567075585e-05,
2390
+ 3.6368421052631585e-05,
2391
+ 3.607162643450732e-05,
2392
+ 3.577483181638307e-05,
2393
+ 3.547803719825881e-05,
2394
+ 3.518124258013455e-05,
2395
+ 3.4884447962010287e-05,
2396
+ 3.458765334388604e-05,
2397
+ 3.4290858725761776e-05,
2398
+ 3.399406410763751e-05,
2399
+ 3.3697269489513265e-05,
2400
+ 3.3400474871389e-05,
2401
+ 3.310368025326474e-05,
2402
+ 3.280688563514048e-05,
2403
+ 3.251009101701623e-05,
2404
+ 3.2213296398891967e-05,
2405
+ 3.191650178076771e-05,
2406
+ 3.1542540561931145e-05,
2407
+ 3.124574594380688e-05,
2408
+ 3.094895132568263e-05,
2409
+ 3.065215670755838e-05,
2410
+ 3.0355362089434113e-05,
2411
+ 3.0058567471309854e-05,
2412
+ 2.97617728531856e-05,
2413
+ 2.9464978235061336e-05,
2414
+ 2.9168183616937077e-05,
2415
+ 2.8871388998812818e-05,
2416
+ 2.857459438068857e-05,
2417
+ 2.8277799762564307e-05,
2418
+ 2.798100514444005e-05,
2419
+ 2.7684210526315793e-05,
2420
+ 2.738741590819153e-05,
2421
+ 2.709062129006727e-05,
2422
+ 2.6793826671943013e-05,
2423
+ 2.6497032053818764e-05,
2424
+ 2.62002374356945e-05,
2425
+ 2.5903442817570243e-05,
2426
+ 2.5606648199445987e-05,
2427
+ 2.5309853581321725e-05,
2428
+ 2.5013058963197466e-05,
2429
+ 2.4716264345073214e-05,
2430
+ 2.441946972694896e-05,
2431
+ 2.4122675108824693e-05,
2432
+ 2.3825880490700434e-05,
2433
+ 2.352908587257618e-05,
2434
+ 2.3232291254451916e-05,
2435
+ 2.293549663632766e-05,
2436
+ 2.2638702018203408e-05,
2437
+ 2.226474079936684e-05,
2438
+ 2.196794618124258e-05,
2439
+ 2.1671151563118328e-05,
2440
+ 2.1374356944994066e-05,
2441
+ 2.1077562326869803e-05,
2442
+ 2.0780767708745554e-05,
2443
+ 2.0483973090621296e-05,
2444
+ 2.018717847249703e-05,
2445
+ 1.989038385437277e-05,
2446
+ 1.959358923624852e-05,
2447
+ 1.929679461812426e-05,
2448
+ 1.8999999999999998e-05,
2449
+ 1.8703205381875746e-05,
2450
+ 1.8406410763751487e-05,
2451
+ 1.8109616145627224e-05,
2452
+ 1.7812821527502965e-05,
2453
+ 1.7516026909378713e-05,
2454
+ 1.7219232291254454e-05,
2455
+ 1.6922437673130192e-05,
2456
+ 1.662564305500594e-05,
2457
+ 1.632884843688168e-05,
2458
+ 1.603205381875742e-05,
2459
+ 1.573525920063316e-05,
2460
+ 1.5438464582508908e-05,
2461
+ 1.5141669964384647e-05,
2462
+ 1.4844875346260385e-05,
2463
+ 1.4548080728136134e-05,
2464
+ 1.4251286110011875e-05,
2465
+ 1.3954491491887611e-05,
2466
+ 1.3657696873763363e-05,
2467
+ 1.33609022556391e-05,
2468
+ 1.298694103680253e-05,
2469
+ 1.2690146418678277e-05,
2470
+ 1.2393351800554018e-05,
2471
+ 1.2096557182429756e-05,
2472
+ 1.1799762564305506e-05,
2473
+ 1.1502967946181245e-05,
2474
+ 1.1206173328056984e-05,
2475
+ 1.0909378709932724e-05,
2476
+ 1.0612584091808472e-05,
2477
+ 1.0315789473684213e-05,
2478
+ 1.0018994855559949e-05,
2479
+ 9.7222002374357e-06,
2480
+ 9.425405619311438e-06,
2481
+ 9.128611001187177e-06,
2482
+ 8.831816383062916e-06,
2483
+ 8.535021764938666e-06,
2484
+ 8.238227146814405e-06,
2485
+ 7.941432528690143e-06,
2486
+ 7.644637910565893e-06,
2487
+ 7.347843292441632e-06,
2488
+ 7.0510486743173715e-06,
2489
+ 6.75425405619311e-06,
2490
+ 6.45745943806886e-06,
2491
+ 6.160664819944598e-06,
2492
+ 5.8638702018203375e-06,
2493
+ 5.567075583696086e-06,
2494
+ 5.270280965571826e-06,
2495
+ 4.973486347447565e-06,
2496
+ 4.676691729323314e-06,
2497
+ 4.379897111199053e-06,
2498
+ 4.083102493074792e-06
2499
+ ],
2500
+ "emb_lr": [],
2501
+ "eval_step": [
2502
+ 1550,
2503
+ 3113,
2504
+ 4676,
2505
+ 6239,
2506
+ 7802,
2507
+ 9365,
2508
+ 10928,
2509
+ 12491,
2510
+ 14054,
2511
+ 15617
2512
+ ],
2513
+ "eval_accuracy": [
2514
+ 0.61,
2515
+ 0.91,
2516
+ 0.97,
2517
+ 1.0,
2518
+ 0.97,
2519
+ 1.0,
2520
+ 0.99,
2521
+ 1.0,
2522
+ 0.99,
2523
+ 1.0
2524
+ ]
2525
+ },
2526
+ "final_accuracy": 0.9995833333333334,
2527
+ "sft_eval": {
2528
+ "config": {
2529
+ "ops": "add_sub",
2530
+ "K": null,
2531
+ "mode": "sft",
2532
+ "n_digits": 6,
2533
+ "n_per_split": 100
2534
+ },
2535
+ "splits": {
2536
+ "add_S0": {
2537
+ "full_accuracy": 0.93,
2538
+ "n_examples": 100,
2539
+ "per_subtask": {
2540
+ "SA": {
2541
+ "accuracy": 0.9884297520661157,
2542
+ "count": 605
2543
+ },
2544
+ "SS": {
2545
+ "accuracy": 0.9894736842105263,
2546
+ "count": 95
2547
+ }
2548
+ }
2549
+ },
2550
+ "add_S1": {
2551
+ "full_accuracy": 0.84,
2552
+ "n_examples": 100,
2553
+ "per_subtask": {
2554
+ "SA": {
2555
+ "accuracy": 0.9803921568627451,
2556
+ "count": 204
2557
+ },
2558
+ "SC": {
2559
+ "accuracy": 0.9881656804733728,
2560
+ "count": 169
2561
+ },
2562
+ "SS": {
2563
+ "accuracy": 1.0,
2564
+ "count": 31
2565
+ },
2566
+ "UC": {
2567
+ "accuracy": 0.9628378378378378,
2568
+ "count": 296
2569
+ }
2570
+ }
2571
+ },
2572
+ "add_S2": {
2573
+ "full_accuracy": 0.63,
2574
+ "n_examples": 100,
2575
+ "per_subtask": {
2576
+ "SA": {
2577
+ "accuracy": 0.9754601226993865,
2578
+ "count": 163
2579
+ },
2580
+ "SC": {
2581
+ "accuracy": 0.9538461538461539,
2582
+ "count": 130
2583
+ },
2584
+ "SS": {
2585
+ "accuracy": 0.896551724137931,
2586
+ "count": 87
2587
+ },
2588
+ "UC": {
2589
+ "accuracy": 0.8719211822660099,
2590
+ "count": 203
2591
+ },
2592
+ "US": {
2593
+ "accuracy": 0.9487179487179487,
2594
+ "count": 117
2595
+ }
2596
+ }
2597
+ },
2598
+ "add_S3": {
2599
+ "full_accuracy": 0.46,
2600
+ "n_examples": 100,
2601
+ "per_subtask": {
2602
+ "SA": {
2603
+ "accuracy": 0.9834710743801653,
2604
+ "count": 121
2605
+ },
2606
+ "SC": {
2607
+ "accuracy": 0.9834710743801653,
2608
+ "count": 121
2609
+ },
2610
+ "SS": {
2611
+ "accuracy": 0.9795918367346939,
2612
+ "count": 49
2613
+ },
2614
+ "UC": {
2615
+ "accuracy": 0.7311827956989247,
2616
+ "count": 186
2617
+ },
2618
+ "US": {
2619
+ "accuracy": 0.8475336322869955,
2620
+ "count": 223
2621
+ }
2622
+ }
2623
+ },
2624
+ "add_S4": {
2625
+ "full_accuracy": 0.34,
2626
+ "n_examples": 100,
2627
+ "per_subtask": {
2628
+ "SA": {
2629
+ "accuracy": 0.9903846153846154,
2630
+ "count": 104
2631
+ },
2632
+ "SC": {
2633
+ "accuracy": 0.9716981132075472,
2634
+ "count": 106
2635
+ },
2636
+ "SS": {
2637
+ "accuracy": 1.0,
2638
+ "count": 23
2639
+ },
2640
+ "UC": {
2641
+ "accuracy": 0.65625,
2642
+ "count": 160
2643
+ },
2644
+ "US": {
2645
+ "accuracy": 0.5830618892508144,
2646
+ "count": 307
2647
+ }
2648
+ }
2649
+ },
2650
+ "add_S5": {
2651
+ "full_accuracy": 0.4,
2652
+ "n_examples": 100,
2653
+ "per_subtask": {
2654
+ "SA": {
2655
+ "accuracy": 1.0,
2656
+ "count": 100
2657
+ },
2658
+ "SC": {
2659
+ "accuracy": 0.96,
2660
+ "count": 100
2661
+ },
2662
+ "UC": {
2663
+ "accuracy": 0.56,
2664
+ "count": 100
2665
+ },
2666
+ "US": {
2667
+ "accuracy": 0.575,
2668
+ "count": 400
2669
+ }
2670
+ }
2671
+ },
2672
+ "add_S6": {
2673
+ "full_accuracy": 0.58,
2674
+ "n_examples": 100,
2675
+ "per_subtask": {
2676
+ "SC": {
2677
+ "accuracy": 1.0,
2678
+ "count": 100
2679
+ },
2680
+ "UC": {
2681
+ "accuracy": 0.64,
2682
+ "count": 100
2683
+ },
2684
+ "US": {
2685
+ "accuracy": 0.674,
2686
+ "count": 500
2687
+ }
2688
+ }
2689
+ },
2690
+ "add_random": {
2691
+ "full_accuracy": 0.825,
2692
+ "n_examples": 200,
2693
+ "per_subtask": {
2694
+ "SA": {
2695
+ "accuracy": 0.9798657718120806,
2696
+ "count": 447
2697
+ },
2698
+ "SC": {
2699
+ "accuracy": 0.984375,
2700
+ "count": 320
2701
+ },
2702
+ "SS": {
2703
+ "accuracy": 0.9642857142857143,
2704
+ "count": 56
2705
+ },
2706
+ "UC": {
2707
+ "accuracy": 0.9565217391304348,
2708
+ "count": 529
2709
+ },
2710
+ "US": {
2711
+ "accuracy": 0.9166666666666666,
2712
+ "count": 48
2713
+ }
2714
+ }
2715
+ },
2716
+ "add_C3": {
2717
+ "full_accuracy": 0.54,
2718
+ "n_examples": 100,
2719
+ "per_subtask": {
2720
+ "SA": {
2721
+ "accuracy": 0.96,
2722
+ "count": 300
2723
+ },
2724
+ "SC": {
2725
+ "accuracy": 0.98,
2726
+ "count": 100
2727
+ },
2728
+ "UC": {
2729
+ "accuracy": 0.7979274611398963,
2730
+ "count": 193
2731
+ },
2732
+ "US": {
2733
+ "accuracy": 0.794392523364486,
2734
+ "count": 107
2735
+ }
2736
+ }
2737
+ },
2738
+ "add_C4": {
2739
+ "full_accuracy": 0.5,
2740
+ "n_examples": 100,
2741
+ "per_subtask": {
2742
+ "SA": {
2743
+ "accuracy": 0.99,
2744
+ "count": 200
2745
+ },
2746
+ "SC": {
2747
+ "accuracy": 0.95,
2748
+ "count": 100
2749
+ },
2750
+ "UC": {
2751
+ "accuracy": 0.83203125,
2752
+ "count": 256
2753
+ },
2754
+ "US": {
2755
+ "accuracy": 0.75,
2756
+ "count": 144
2757
+ }
2758
+ }
2759
+ },
2760
+ "add_C5": {
2761
+ "full_accuracy": 0.45,
2762
+ "n_examples": 100,
2763
+ "per_subtask": {
2764
+ "SA": {
2765
+ "accuracy": 1.0,
2766
+ "count": 100
2767
+ },
2768
+ "SC": {
2769
+ "accuracy": 0.93,
2770
+ "count": 100
2771
+ },
2772
+ "UC": {
2773
+ "accuracy": 0.8202614379084967,
2774
+ "count": 306
2775
+ },
2776
+ "US": {
2777
+ "accuracy": 0.7835051546391752,
2778
+ "count": 194
2779
+ }
2780
+ }
2781
+ },
2782
+ "add_C6": {
2783
+ "full_accuracy": 0.48,
2784
+ "n_examples": 100,
2785
+ "per_subtask": {
2786
+ "SC": {
2787
+ "accuracy": 1.0,
2788
+ "count": 100
2789
+ },
2790
+ "UC": {
2791
+ "accuracy": 0.8524590163934426,
2792
+ "count": 366
2793
+ },
2794
+ "US": {
2795
+ "accuracy": 0.8632478632478633,
2796
+ "count": 234
2797
+ }
2798
+ }
2799
+ },
2800
+ "sub_M0": {
2801
+ "full_accuracy": 0.82,
2802
+ "n_examples": 100,
2803
+ "per_subtask": {
2804
+ "MD": {
2805
+ "accuracy": 0.9700499168053245,
2806
+ "count": 601
2807
+ },
2808
+ "ME": {
2809
+ "accuracy": 0.9292929292929293,
2810
+ "count": 99
2811
+ }
2812
+ }
2813
+ },
2814
+ "sub_M1": {
2815
+ "full_accuracy": 0.86,
2816
+ "n_examples": 100,
2817
+ "per_subtask": {
2818
+ "MD": {
2819
+ "accuracy": 0.982078853046595,
2820
+ "count": 279
2821
+ },
2822
+ "MB": {
2823
+ "accuracy": 0.9724137931034482,
2824
+ "count": 145
2825
+ },
2826
+ "ME": {
2827
+ "accuracy": 0.9166666666666666,
2828
+ "count": 24
2829
+ },
2830
+ "UB": {
2831
+ "accuracy": 0.9841269841269841,
2832
+ "count": 252
2833
+ }
2834
+ }
2835
+ },
2836
+ "sub_M2": {
2837
+ "full_accuracy": 0.7,
2838
+ "n_examples": 100,
2839
+ "per_subtask": {
2840
+ "MD": {
2841
+ "accuracy": 0.9906103286384976,
2842
+ "count": 213
2843
+ },
2844
+ "MB": {
2845
+ "accuracy": 0.9823008849557522,
2846
+ "count": 113
2847
+ },
2848
+ "ME": {
2849
+ "accuracy": 1.0,
2850
+ "count": 85
2851
+ },
2852
+ "UB": {
2853
+ "accuracy": 0.850828729281768,
2854
+ "count": 181
2855
+ },
2856
+ "UD": {
2857
+ "accuracy": 0.9814814814814815,
2858
+ "count": 108
2859
+ }
2860
+ }
2861
+ },
2862
+ "sub_M3": {
2863
+ "full_accuracy": 0.4,
2864
+ "n_examples": 100,
2865
+ "per_subtask": {
2866
+ "MD": {
2867
+ "accuracy": 1.0,
2868
+ "count": 179
2869
+ },
2870
+ "MB": {
2871
+ "accuracy": 0.970873786407767,
2872
+ "count": 103
2873
+ },
2874
+ "ME": {
2875
+ "accuracy": 0.9821428571428571,
2876
+ "count": 56
2877
+ },
2878
+ "UB": {
2879
+ "accuracy": 0.697986577181208,
2880
+ "count": 149
2881
+ },
2882
+ "UD": {
2883
+ "accuracy": 0.7981220657276995,
2884
+ "count": 213
2885
+ }
2886
+ }
2887
+ },
2888
+ "sub_M4": {
2889
+ "full_accuracy": 0.37,
2890
+ "n_examples": 100,
2891
+ "per_subtask": {
2892
+ "MD": {
2893
+ "accuracy": 1.0,
2894
+ "count": 200
2895
+ },
2896
+ "MB": {
2897
+ "accuracy": 0.98,
2898
+ "count": 100
2899
+ },
2900
+ "UB": {
2901
+ "accuracy": 0.59,
2902
+ "count": 100
2903
+ },
2904
+ "UD": {
2905
+ "accuracy": 0.6866666666666666,
2906
+ "count": 300
2907
+ }
2908
+ }
2909
+ },
2910
+ "sub_M5": {
2911
+ "full_accuracy": 0.55,
2912
+ "n_examples": 100,
2913
+ "per_subtask": {
2914
+ "MD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 100
2917
+ },
2918
+ "MB": {
2919
+ "accuracy": 1.0,
2920
+ "count": 100
2921
+ },
2922
+ "UB": {
2923
+ "accuracy": 0.63,
2924
+ "count": 100
2925
+ },
2926
+ "UD": {
2927
+ "accuracy": 0.67,
2928
+ "count": 400
2929
+ }
2930
+ }
2931
+ },
2932
+ "sub_random": {
2933
+ "full_accuracy": 0.81,
2934
+ "n_examples": 200,
2935
+ "per_subtask": {
2936
+ "MD": {
2937
+ "accuracy": 0.9833333333333333,
2938
+ "count": 600
2939
+ },
2940
+ "MB": {
2941
+ "accuracy": 0.9700374531835206,
2942
+ "count": 267
2943
+ },
2944
+ "ME": {
2945
+ "accuracy": 0.9622641509433962,
2946
+ "count": 53
2947
+ },
2948
+ "UB": {
2949
+ "accuracy": 0.9567198177676538,
2950
+ "count": 439
2951
+ },
2952
+ "UD": {
2953
+ "accuracy": 0.9512195121951219,
2954
+ "count": 41
2955
+ }
2956
+ }
2957
+ },
2958
+ "sub_B3": {
2959
+ "full_accuracy": 0.71,
2960
+ "n_examples": 100,
2961
+ "per_subtask": {
2962
+ "MD": {
2963
+ "accuracy": 0.99,
2964
+ "count": 300
2965
+ },
2966
+ "MB": {
2967
+ "accuracy": 1.0,
2968
+ "count": 100
2969
+ },
2970
+ "UB": {
2971
+ "accuracy": 0.8934010152284264,
2972
+ "count": 197
2973
+ },
2974
+ "UD": {
2975
+ "accuracy": 0.7864077669902912,
2976
+ "count": 103
2977
+ }
2978
+ }
2979
+ },
2980
+ "sub_B4": {
2981
+ "full_accuracy": 0.58,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "MD": {
2985
+ "accuracy": 1.0,
2986
+ "count": 200
2987
+ },
2988
+ "MB": {
2989
+ "accuracy": 0.97,
2990
+ "count": 100
2991
+ },
2992
+ "UB": {
2993
+ "accuracy": 0.8825910931174089,
2994
+ "count": 247
2995
+ },
2996
+ "UD": {
2997
+ "accuracy": 0.7450980392156863,
2998
+ "count": 153
2999
+ }
3000
+ }
3001
+ },
3002
+ "sub_B5": {
3003
+ "full_accuracy": 0.57,
3004
+ "n_examples": 100,
3005
+ "per_subtask": {
3006
+ "MD": {
3007
+ "accuracy": 1.0,
3008
+ "count": 100
3009
+ },
3010
+ "MB": {
3011
+ "accuracy": 1.0,
3012
+ "count": 100
3013
+ },
3014
+ "UB": {
3015
+ "accuracy": 0.8590604026845637,
3016
+ "count": 298
3017
+ },
3018
+ "UD": {
3019
+ "accuracy": 0.8415841584158416,
3020
+ "count": 202
3021
+ }
3022
+ }
3023
+ }
3024
+ },
3025
+ "summary": {
3026
+ "overall_accuracy": 0.6229166666666667,
3027
+ "total_examples": 2400,
3028
+ "n_splits": 22
3029
+ }
3030
+ },
3031
+ "sorl_eval": {
3032
+ "config": {
3033
+ "ops": "add_sub",
3034
+ "K": 4,
3035
+ "mode": "sorl",
3036
+ "n_digits": 6,
3037
+ "n_per_split": 100
3038
+ },
3039
+ "splits": {
3040
+ "add_S0": {
3041
+ "full_accuracy": 1.0,
3042
+ "n_examples": 100,
3043
+ "per_subtask": {
3044
+ "SA": {
3045
+ "accuracy": 1.0,
3046
+ "count": 605
3047
+ },
3048
+ "SS": {
3049
+ "accuracy": 1.0,
3050
+ "count": 95
3051
+ }
3052
+ }
3053
+ },
3054
+ "add_S1": {
3055
+ "full_accuracy": 1.0,
3056
+ "n_examples": 100,
3057
+ "per_subtask": {
3058
+ "SA": {
3059
+ "accuracy": 1.0,
3060
+ "count": 204
3061
+ },
3062
+ "SC": {
3063
+ "accuracy": 1.0,
3064
+ "count": 169
3065
+ },
3066
+ "SS": {
3067
+ "accuracy": 1.0,
3068
+ "count": 31
3069
+ },
3070
+ "UC": {
3071
+ "accuracy": 1.0,
3072
+ "count": 296
3073
+ }
3074
+ }
3075
+ },
3076
+ "add_S2": {
3077
+ "full_accuracy": 1.0,
3078
+ "n_examples": 100,
3079
+ "per_subtask": {
3080
+ "SA": {
3081
+ "accuracy": 1.0,
3082
+ "count": 163
3083
+ },
3084
+ "SC": {
3085
+ "accuracy": 1.0,
3086
+ "count": 130
3087
+ },
3088
+ "SS": {
3089
+ "accuracy": 1.0,
3090
+ "count": 87
3091
+ },
3092
+ "UC": {
3093
+ "accuracy": 1.0,
3094
+ "count": 203
3095
+ },
3096
+ "US": {
3097
+ "accuracy": 1.0,
3098
+ "count": 117
3099
+ }
3100
+ }
3101
+ },
3102
+ "add_S3": {
3103
+ "full_accuracy": 1.0,
3104
+ "n_examples": 100,
3105
+ "per_subtask": {
3106
+ "SA": {
3107
+ "accuracy": 1.0,
3108
+ "count": 121
3109
+ },
3110
+ "SC": {
3111
+ "accuracy": 1.0,
3112
+ "count": 121
3113
+ },
3114
+ "SS": {
3115
+ "accuracy": 1.0,
3116
+ "count": 49
3117
+ },
3118
+ "UC": {
3119
+ "accuracy": 1.0,
3120
+ "count": 186
3121
+ },
3122
+ "US": {
3123
+ "accuracy": 1.0,
3124
+ "count": 223
3125
+ }
3126
+ }
3127
+ },
3128
+ "add_S4": {
3129
+ "full_accuracy": 1.0,
3130
+ "n_examples": 100,
3131
+ "per_subtask": {
3132
+ "SA": {
3133
+ "accuracy": 1.0,
3134
+ "count": 104
3135
+ },
3136
+ "SC": {
3137
+ "accuracy": 1.0,
3138
+ "count": 106
3139
+ },
3140
+ "SS": {
3141
+ "accuracy": 1.0,
3142
+ "count": 23
3143
+ },
3144
+ "UC": {
3145
+ "accuracy": 1.0,
3146
+ "count": 160
3147
+ },
3148
+ "US": {
3149
+ "accuracy": 1.0,
3150
+ "count": 307
3151
+ }
3152
+ }
3153
+ },
3154
+ "add_S5": {
3155
+ "full_accuracy": 1.0,
3156
+ "n_examples": 100,
3157
+ "per_subtask": {
3158
+ "SA": {
3159
+ "accuracy": 1.0,
3160
+ "count": 100
3161
+ },
3162
+ "SC": {
3163
+ "accuracy": 1.0,
3164
+ "count": 100
3165
+ },
3166
+ "UC": {
3167
+ "accuracy": 1.0,
3168
+ "count": 100
3169
+ },
3170
+ "US": {
3171
+ "accuracy": 1.0,
3172
+ "count": 400
3173
+ }
3174
+ }
3175
+ },
3176
+ "add_S6": {
3177
+ "full_accuracy": 1.0,
3178
+ "n_examples": 100,
3179
+ "per_subtask": {
3180
+ "SC": {
3181
+ "accuracy": 1.0,
3182
+ "count": 100
3183
+ },
3184
+ "UC": {
3185
+ "accuracy": 1.0,
3186
+ "count": 100
3187
+ },
3188
+ "US": {
3189
+ "accuracy": 1.0,
3190
+ "count": 500
3191
+ }
3192
+ }
3193
+ },
3194
+ "add_random": {
3195
+ "full_accuracy": 1.0,
3196
+ "n_examples": 200,
3197
+ "per_subtask": {
3198
+ "SA": {
3199
+ "accuracy": 1.0,
3200
+ "count": 447
3201
+ },
3202
+ "SC": {
3203
+ "accuracy": 1.0,
3204
+ "count": 320
3205
+ },
3206
+ "SS": {
3207
+ "accuracy": 1.0,
3208
+ "count": 56
3209
+ },
3210
+ "UC": {
3211
+ "accuracy": 1.0,
3212
+ "count": 529
3213
+ },
3214
+ "US": {
3215
+ "accuracy": 1.0,
3216
+ "count": 48
3217
+ }
3218
+ }
3219
+ },
3220
+ "add_C3": {
3221
+ "full_accuracy": 1.0,
3222
+ "n_examples": 100,
3223
+ "per_subtask": {
3224
+ "SA": {
3225
+ "accuracy": 1.0,
3226
+ "count": 300
3227
+ },
3228
+ "SC": {
3229
+ "accuracy": 1.0,
3230
+ "count": 100
3231
+ },
3232
+ "UC": {
3233
+ "accuracy": 1.0,
3234
+ "count": 193
3235
+ },
3236
+ "US": {
3237
+ "accuracy": 1.0,
3238
+ "count": 107
3239
+ }
3240
+ }
3241
+ },
3242
+ "add_C4": {
3243
+ "full_accuracy": 1.0,
3244
+ "n_examples": 100,
3245
+ "per_subtask": {
3246
+ "SA": {
3247
+ "accuracy": 1.0,
3248
+ "count": 200
3249
+ },
3250
+ "SC": {
3251
+ "accuracy": 1.0,
3252
+ "count": 100
3253
+ },
3254
+ "UC": {
3255
+ "accuracy": 1.0,
3256
+ "count": 256
3257
+ },
3258
+ "US": {
3259
+ "accuracy": 1.0,
3260
+ "count": 144
3261
+ }
3262
+ }
3263
+ },
3264
+ "add_C5": {
3265
+ "full_accuracy": 1.0,
3266
+ "n_examples": 100,
3267
+ "per_subtask": {
3268
+ "SA": {
3269
+ "accuracy": 1.0,
3270
+ "count": 100
3271
+ },
3272
+ "SC": {
3273
+ "accuracy": 1.0,
3274
+ "count": 100
3275
+ },
3276
+ "UC": {
3277
+ "accuracy": 1.0,
3278
+ "count": 306
3279
+ },
3280
+ "US": {
3281
+ "accuracy": 1.0,
3282
+ "count": 194
3283
+ }
3284
+ }
3285
+ },
3286
+ "add_C6": {
3287
+ "full_accuracy": 1.0,
3288
+ "n_examples": 100,
3289
+ "per_subtask": {
3290
+ "SC": {
3291
+ "accuracy": 1.0,
3292
+ "count": 100
3293
+ },
3294
+ "UC": {
3295
+ "accuracy": 1.0,
3296
+ "count": 366
3297
+ },
3298
+ "US": {
3299
+ "accuracy": 1.0,
3300
+ "count": 234
3301
+ }
3302
+ }
3303
+ },
3304
+ "sub_M0": {
3305
+ "full_accuracy": 1.0,
3306
+ "n_examples": 100,
3307
+ "per_subtask": {
3308
+ "MD": {
3309
+ "accuracy": 1.0,
3310
+ "count": 601
3311
+ },
3312
+ "ME": {
3313
+ "accuracy": 1.0,
3314
+ "count": 99
3315
+ }
3316
+ }
3317
+ },
3318
+ "sub_M1": {
3319
+ "full_accuracy": 1.0,
3320
+ "n_examples": 100,
3321
+ "per_subtask": {
3322
+ "MD": {
3323
+ "accuracy": 1.0,
3324
+ "count": 279
3325
+ },
3326
+ "MB": {
3327
+ "accuracy": 1.0,
3328
+ "count": 145
3329
+ },
3330
+ "ME": {
3331
+ "accuracy": 1.0,
3332
+ "count": 24
3333
+ },
3334
+ "UB": {
3335
+ "accuracy": 1.0,
3336
+ "count": 252
3337
+ }
3338
+ }
3339
+ },
3340
+ "sub_M2": {
3341
+ "full_accuracy": 1.0,
3342
+ "n_examples": 100,
3343
+ "per_subtask": {
3344
+ "MD": {
3345
+ "accuracy": 1.0,
3346
+ "count": 213
3347
+ },
3348
+ "MB": {
3349
+ "accuracy": 1.0,
3350
+ "count": 113
3351
+ },
3352
+ "ME": {
3353
+ "accuracy": 1.0,
3354
+ "count": 85
3355
+ },
3356
+ "UB": {
3357
+ "accuracy": 1.0,
3358
+ "count": 181
3359
+ },
3360
+ "UD": {
3361
+ "accuracy": 1.0,
3362
+ "count": 108
3363
+ }
3364
+ }
3365
+ },
3366
+ "sub_M3": {
3367
+ "full_accuracy": 0.99,
3368
+ "n_examples": 100,
3369
+ "per_subtask": {
3370
+ "MD": {
3371
+ "accuracy": 1.0,
3372
+ "count": 179
3373
+ },
3374
+ "MB": {
3375
+ "accuracy": 1.0,
3376
+ "count": 103
3377
+ },
3378
+ "ME": {
3379
+ "accuracy": 1.0,
3380
+ "count": 56
3381
+ },
3382
+ "UB": {
3383
+ "accuracy": 0.9932885906040269,
3384
+ "count": 149
3385
+ },
3386
+ "UD": {
3387
+ "accuracy": 1.0,
3388
+ "count": 213
3389
+ }
3390
+ }
3391
+ },
3392
+ "sub_M4": {
3393
+ "full_accuracy": 1.0,
3394
+ "n_examples": 100,
3395
+ "per_subtask": {
3396
+ "MD": {
3397
+ "accuracy": 1.0,
3398
+ "count": 200
3399
+ },
3400
+ "MB": {
3401
+ "accuracy": 1.0,
3402
+ "count": 100
3403
+ },
3404
+ "UB": {
3405
+ "accuracy": 1.0,
3406
+ "count": 100
3407
+ },
3408
+ "UD": {
3409
+ "accuracy": 1.0,
3410
+ "count": 300
3411
+ }
3412
+ }
3413
+ },
3414
+ "sub_M5": {
3415
+ "full_accuracy": 1.0,
3416
+ "n_examples": 100,
3417
+ "per_subtask": {
3418
+ "MD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 100
3421
+ },
3422
+ "MB": {
3423
+ "accuracy": 1.0,
3424
+ "count": 100
3425
+ },
3426
+ "UB": {
3427
+ "accuracy": 1.0,
3428
+ "count": 100
3429
+ },
3430
+ "UD": {
3431
+ "accuracy": 1.0,
3432
+ "count": 400
3433
+ }
3434
+ }
3435
+ },
3436
+ "sub_random": {
3437
+ "full_accuracy": 1.0,
3438
+ "n_examples": 200,
3439
+ "per_subtask": {
3440
+ "MD": {
3441
+ "accuracy": 1.0,
3442
+ "count": 600
3443
+ },
3444
+ "MB": {
3445
+ "accuracy": 1.0,
3446
+ "count": 267
3447
+ },
3448
+ "ME": {
3449
+ "accuracy": 1.0,
3450
+ "count": 53
3451
+ },
3452
+ "UB": {
3453
+ "accuracy": 1.0,
3454
+ "count": 439
3455
+ },
3456
+ "UD": {
3457
+ "accuracy": 1.0,
3458
+ "count": 41
3459
+ }
3460
+ }
3461
+ },
3462
+ "sub_B3": {
3463
+ "full_accuracy": 1.0,
3464
+ "n_examples": 100,
3465
+ "per_subtask": {
3466
+ "MD": {
3467
+ "accuracy": 1.0,
3468
+ "count": 300
3469
+ },
3470
+ "MB": {
3471
+ "accuracy": 1.0,
3472
+ "count": 100
3473
+ },
3474
+ "UB": {
3475
+ "accuracy": 1.0,
3476
+ "count": 197
3477
+ },
3478
+ "UD": {
3479
+ "accuracy": 1.0,
3480
+ "count": 103
3481
+ }
3482
+ }
3483
+ },
3484
+ "sub_B4": {
3485
+ "full_accuracy": 1.0,
3486
+ "n_examples": 100,
3487
+ "per_subtask": {
3488
+ "MD": {
3489
+ "accuracy": 1.0,
3490
+ "count": 200
3491
+ },
3492
+ "MB": {
3493
+ "accuracy": 1.0,
3494
+ "count": 100
3495
+ },
3496
+ "UB": {
3497
+ "accuracy": 1.0,
3498
+ "count": 247
3499
+ },
3500
+ "UD": {
3501
+ "accuracy": 1.0,
3502
+ "count": 153
3503
+ }
3504
+ }
3505
+ },
3506
+ "sub_B5": {
3507
+ "full_accuracy": 1.0,
3508
+ "n_examples": 100,
3509
+ "per_subtask": {
3510
+ "MD": {
3511
+ "accuracy": 1.0,
3512
+ "count": 100
3513
+ },
3514
+ "MB": {
3515
+ "accuracy": 1.0,
3516
+ "count": 100
3517
+ },
3518
+ "UB": {
3519
+ "accuracy": 1.0,
3520
+ "count": 298
3521
+ },
3522
+ "UD": {
3523
+ "accuracy": 1.0,
3524
+ "count": 202
3525
+ }
3526
+ }
3527
+ }
3528
+ },
3529
+ "summary": {
3530
+ "overall_accuracy": 0.9995833333333334,
3531
+ "total_examples": 2400,
3532
+ "n_splits": 22
3533
+ }
3534
+ },
3535
+ "sorl_overall_accuracy": 0.9995833333333334,
3536
+ "sft_overall_accuracy": 0.6229166666666667
3537
+ }
add_sub_sorl_v1_abs100_100K/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:0e4b24a426ca15853e23168908b5f1d34be3e3a3625865c28031bb24ca1a1faf
3
+ size 650671040
add_sub_sorl_v1_abs100_100K/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 4,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 4e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 10,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 1562,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs100_K4_100K",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 2,
61
+ "n_head": 3,
62
+ "n_embd": 510,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 100,
65
+ "dataset_size": 100000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 162591062,
71
+ "run_name": "add_sub_sorl_v1_abs100_100K",
72
+ "git_commit": "f447da529caceac8c7d256cbb2cd185cbc50feac",
73
+ "timestamp": "2026-04-12T15:51:04.267579+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "e484ym4g",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/e484ym4g",
81
+ "final_accuracy": 0.9995833333333334,
82
+ "sft_accuracy": 0.6229166666666667,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }