amirali1985 commited on
Commit
220719c
·
verified ·
1 Parent(s): 3f3cf84

Upload add_sub_sorl_v1_abs10_K1_100K_1L3H510d

Browse files
add_sub_sorl_v1_abs10_K1_100K_1L3H510d/config.json ADDED
@@ -0,0 +1,36 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 510,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 2040,
15
+ "layer_types": [
16
+ "full_attention"
17
+ ],
18
+ "max_position_embeddings": 128,
19
+ "max_window_layers": 28,
20
+ "model_type": "qwen3",
21
+ "num_attention_heads": 3,
22
+ "num_hidden_layers": 1,
23
+ "num_key_value_heads": 3,
24
+ "pad_token_id": null,
25
+ "rms_norm_eps": 1e-06,
26
+ "rope_parameters": {
27
+ "rope_theta": 10000.0,
28
+ "rope_type": "default"
29
+ },
30
+ "sliding_window": null,
31
+ "tie_word_embeddings": false,
32
+ "transformers_version": "5.5.0",
33
+ "use_cache": true,
34
+ "use_sliding_window": false,
35
+ "vocab_size": 151654
36
+ }
add_sub_sorl_v1_abs10_K1_100K_1L3H510d/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs10_K1_100K_1L3H510d/metrics.json ADDED
@@ -0,0 +1,3537 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 800,
20
+ 850,
21
+ 900,
22
+ 950,
23
+ 1000,
24
+ 1050,
25
+ 1100,
26
+ 1150,
27
+ 1200,
28
+ 1250,
29
+ 1300,
30
+ 1350,
31
+ 1400,
32
+ 1450,
33
+ 1500,
34
+ 1550,
35
+ 1613,
36
+ 1663,
37
+ 1713,
38
+ 1763,
39
+ 1813,
40
+ 1863,
41
+ 1913,
42
+ 1963,
43
+ 2013,
44
+ 2063,
45
+ 2113,
46
+ 2163,
47
+ 2213,
48
+ 2263,
49
+ 2313,
50
+ 2363,
51
+ 2413,
52
+ 2463,
53
+ 2513,
54
+ 2563,
55
+ 2613,
56
+ 2663,
57
+ 2713,
58
+ 2763,
59
+ 2813,
60
+ 2863,
61
+ 2913,
62
+ 2963,
63
+ 3013,
64
+ 3063,
65
+ 3113,
66
+ 3176,
67
+ 3226,
68
+ 3276,
69
+ 3326,
70
+ 3376,
71
+ 3426,
72
+ 3476,
73
+ 3526,
74
+ 3576,
75
+ 3626,
76
+ 3676,
77
+ 3726,
78
+ 3776,
79
+ 3826,
80
+ 3876,
81
+ 3926,
82
+ 3976,
83
+ 4026,
84
+ 4076,
85
+ 4126,
86
+ 4176,
87
+ 4226,
88
+ 4276,
89
+ 4326,
90
+ 4376,
91
+ 4426,
92
+ 4476,
93
+ 4526,
94
+ 4576,
95
+ 4626,
96
+ 4676,
97
+ 4739,
98
+ 4789,
99
+ 4839,
100
+ 4889,
101
+ 4939,
102
+ 4989,
103
+ 5039,
104
+ 5089,
105
+ 5139,
106
+ 5189,
107
+ 5239,
108
+ 5289,
109
+ 5339,
110
+ 5389,
111
+ 5439,
112
+ 5489,
113
+ 5539,
114
+ 5589,
115
+ 5639,
116
+ 5689,
117
+ 5739,
118
+ 5789,
119
+ 5839,
120
+ 5889,
121
+ 5939,
122
+ 5989,
123
+ 6039,
124
+ 6089,
125
+ 6139,
126
+ 6189,
127
+ 6239,
128
+ 6302,
129
+ 6352,
130
+ 6402,
131
+ 6452,
132
+ 6502,
133
+ 6552,
134
+ 6602,
135
+ 6652,
136
+ 6702,
137
+ 6752,
138
+ 6802,
139
+ 6852,
140
+ 6902,
141
+ 6952,
142
+ 7002,
143
+ 7052,
144
+ 7102,
145
+ 7152,
146
+ 7202,
147
+ 7252,
148
+ 7302,
149
+ 7352,
150
+ 7402,
151
+ 7452,
152
+ 7502,
153
+ 7552,
154
+ 7602,
155
+ 7652,
156
+ 7702,
157
+ 7752,
158
+ 7802,
159
+ 7865,
160
+ 7915,
161
+ 7965,
162
+ 8015,
163
+ 8065,
164
+ 8115,
165
+ 8165,
166
+ 8215,
167
+ 8265,
168
+ 8315,
169
+ 8365,
170
+ 8415,
171
+ 8465,
172
+ 8515,
173
+ 8565,
174
+ 8615,
175
+ 8665,
176
+ 8715,
177
+ 8765,
178
+ 8815,
179
+ 8865,
180
+ 8915,
181
+ 8965,
182
+ 9015,
183
+ 9065,
184
+ 9115,
185
+ 9165,
186
+ 9215,
187
+ 9265,
188
+ 9315,
189
+ 9365,
190
+ 9428,
191
+ 9478,
192
+ 9528,
193
+ 9578,
194
+ 9628,
195
+ 9678,
196
+ 9728,
197
+ 9778,
198
+ 9828,
199
+ 9878,
200
+ 9928,
201
+ 9978,
202
+ 10028,
203
+ 10078,
204
+ 10128,
205
+ 10178,
206
+ 10228,
207
+ 10278,
208
+ 10328,
209
+ 10378,
210
+ 10428,
211
+ 10478,
212
+ 10528,
213
+ 10578,
214
+ 10628,
215
+ 10678,
216
+ 10728,
217
+ 10778,
218
+ 10828,
219
+ 10878,
220
+ 10928,
221
+ 10991,
222
+ 11041,
223
+ 11091,
224
+ 11141,
225
+ 11191,
226
+ 11241,
227
+ 11291,
228
+ 11341,
229
+ 11391,
230
+ 11441,
231
+ 11491,
232
+ 11541,
233
+ 11591,
234
+ 11641,
235
+ 11691,
236
+ 11741,
237
+ 11791,
238
+ 11841,
239
+ 11891,
240
+ 11941,
241
+ 11991,
242
+ 12041,
243
+ 12091,
244
+ 12141,
245
+ 12191,
246
+ 12241,
247
+ 12291,
248
+ 12341,
249
+ 12391,
250
+ 12441,
251
+ 12491,
252
+ 12554,
253
+ 12604,
254
+ 12654,
255
+ 12704,
256
+ 12754,
257
+ 12804,
258
+ 12854,
259
+ 12904,
260
+ 12954,
261
+ 13004,
262
+ 13054,
263
+ 13104,
264
+ 13154,
265
+ 13204,
266
+ 13254,
267
+ 13304,
268
+ 13354,
269
+ 13404,
270
+ 13454,
271
+ 13504,
272
+ 13554,
273
+ 13604,
274
+ 13654,
275
+ 13704,
276
+ 13754,
277
+ 13804,
278
+ 13854,
279
+ 13904,
280
+ 13954,
281
+ 14004,
282
+ 14054,
283
+ 14117,
284
+ 14167,
285
+ 14217,
286
+ 14267,
287
+ 14317,
288
+ 14367,
289
+ 14417,
290
+ 14467,
291
+ 14517,
292
+ 14567,
293
+ 14617,
294
+ 14667,
295
+ 14717,
296
+ 14767,
297
+ 14817,
298
+ 14867,
299
+ 14917,
300
+ 14967,
301
+ 15017,
302
+ 15067,
303
+ 15117,
304
+ 15167,
305
+ 15217,
306
+ 15267,
307
+ 15317,
308
+ 15367,
309
+ 15417,
310
+ 15467,
311
+ 15517,
312
+ 15567,
313
+ 15617
314
+ ],
315
+ "loss": [
316
+ 0.20298480987548828,
317
+ -3.8611974716186523,
318
+ 5.484951496124268,
319
+ 7.62824010848999,
320
+ 6.486814022064209,
321
+ 5.183938980102539,
322
+ 3.481173515319824,
323
+ 3.4660756587982178,
324
+ 3.1551809310913086,
325
+ 2.974534749984741,
326
+ 3.0607967376708984,
327
+ 3.137465476989746,
328
+ 3.213205099105835,
329
+ 2.8172616958618164,
330
+ 3.159719467163086,
331
+ 3.036630630493164,
332
+ 3.136214256286621,
333
+ 3.10473370552063,
334
+ 1.0449540615081787,
335
+ -1.9889345169067383,
336
+ -3.1156959533691406,
337
+ -5.027166366577148,
338
+ -7.135016918182373,
339
+ -7.524842739105225,
340
+ -8.15284252166748,
341
+ -7.756969451904297,
342
+ -8.397037506103516,
343
+ -7.77532958984375,
344
+ -8.280281066894531,
345
+ -8.359915733337402,
346
+ -8.630762100219727,
347
+ -8.702438354492188,
348
+ -8.910720825195312,
349
+ -8.099109649658203,
350
+ -7.9632792472839355,
351
+ -6.994848728179932,
352
+ -7.3840508460998535,
353
+ -7.226053714752197,
354
+ -7.466033935546875,
355
+ -6.1763529777526855,
356
+ -5.937272071838379,
357
+ -6.131126880645752,
358
+ -6.807259559631348,
359
+ -5.925022602081299,
360
+ -4.991553783416748,
361
+ -6.03489875793457,
362
+ -4.036592483520508,
363
+ -3.5000007152557373,
364
+ -2.7816596031188965,
365
+ -2.0584523677825928,
366
+ -1.9878346920013428,
367
+ -1.1864898204803467,
368
+ -1.0069959163665771,
369
+ -0.5924010276794434,
370
+ -0.9307534694671631,
371
+ -0.7978959679603577,
372
+ -0.4037044048309326,
373
+ -0.7424840331077576,
374
+ -1.0898077487945557,
375
+ -0.8627956509590149,
376
+ -0.9351441860198975,
377
+ -0.9845731258392334,
378
+ -0.7456449270248413,
379
+ -0.8034361004829407,
380
+ -0.9816672205924988,
381
+ -1.1051112413406372,
382
+ -0.6999305486679077,
383
+ -0.44957953691482544,
384
+ -0.9589239358901978,
385
+ -0.888559877872467,
386
+ -0.8973594903945923,
387
+ -0.3362390995025635,
388
+ -0.5095456838607788,
389
+ -0.738105833530426,
390
+ -0.7219609618186951,
391
+ -0.9851813912391663,
392
+ -0.9534288644790649,
393
+ -0.5282067060470581,
394
+ -0.9321163892745972,
395
+ -0.3476067781448364,
396
+ -1.0879435539245605,
397
+ -0.8613939881324768,
398
+ -0.5899012088775635,
399
+ -0.48227307200431824,
400
+ -0.8573293089866638,
401
+ -0.7841486930847168,
402
+ -0.853835940361023,
403
+ -0.9318222403526306,
404
+ -0.9501145482063293,
405
+ -0.6094979643821716,
406
+ -0.7221546769142151,
407
+ -0.4836696982383728,
408
+ -0.7551224231719971,
409
+ -0.8387091755867004,
410
+ -0.9226763248443604,
411
+ -0.6931058764457703,
412
+ -0.8534595370292664,
413
+ -0.6345930695533752,
414
+ -0.599308967590332,
415
+ -0.6138797402381897,
416
+ -0.8734613656997681,
417
+ -0.5013921856880188,
418
+ -1.023414134979248,
419
+ -0.4975615441799164,
420
+ -0.9184777140617371,
421
+ -0.6177459359169006,
422
+ -0.6793912649154663,
423
+ -0.9103295207023621,
424
+ -0.9629290699958801,
425
+ -0.8296101093292236,
426
+ -0.7456335425376892,
427
+ -0.9889292120933533,
428
+ -0.932847797870636,
429
+ -0.719605028629303,
430
+ -0.8195403814315796,
431
+ -0.6204489469528198,
432
+ -0.9444902539253235,
433
+ -0.6702038645744324,
434
+ -0.6769301891326904,
435
+ -0.7704527974128723,
436
+ -0.3604033589363098,
437
+ -0.7685727477073669,
438
+ -0.592564046382904,
439
+ -0.6542524695396423,
440
+ -0.7130612134933472,
441
+ -0.5456188917160034,
442
+ -0.5080212950706482,
443
+ -0.49610766768455505,
444
+ -0.8628892302513123,
445
+ -0.6637751460075378,
446
+ -0.08357095718383789,
447
+ -0.6479129195213318,
448
+ -0.6967795491218567,
449
+ -0.4980502426624298,
450
+ -0.453680157661438,
451
+ -0.48563891649246216,
452
+ -0.6851292252540588,
453
+ -0.407563716173172,
454
+ -0.32402294874191284,
455
+ -0.5405899882316589,
456
+ -1.0473370552062988,
457
+ -0.4864315986633301,
458
+ -0.4536849856376648,
459
+ -0.639918863773346,
460
+ -0.3336927890777588,
461
+ -0.44088730216026306,
462
+ -0.4688369035720825,
463
+ -0.5984885692596436,
464
+ -0.40976715087890625,
465
+ -0.4776838719844818,
466
+ -0.6040022969245911,
467
+ -0.32387280464172363,
468
+ -0.6155667901039124,
469
+ -0.2283317893743515,
470
+ -0.796503484249115,
471
+ -0.37979862093925476,
472
+ -0.10048076510429382,
473
+ -0.4180724024772644,
474
+ -0.5275349020957947,
475
+ -0.4936784505844116,
476
+ 0.1532474011182785,
477
+ -0.3471519649028778,
478
+ -0.6398682594299316,
479
+ -0.3455611765384674,
480
+ -0.6288833618164062,
481
+ -0.6393107175827026,
482
+ -0.16909603774547577,
483
+ -0.16404710710048676,
484
+ -0.49092090129852295,
485
+ -0.4603574573993683,
486
+ -0.6255804300308228,
487
+ -0.3665814697742462,
488
+ -0.3863292932510376,
489
+ -0.5968372225761414,
490
+ -0.38025856018066406,
491
+ -0.3913044333457947,
492
+ -0.7347709536552429,
493
+ -0.6311700344085693,
494
+ -0.18604643642902374,
495
+ -0.07646475732326508,
496
+ -0.459421843290329,
497
+ -0.22097186744213104,
498
+ -0.252154678106308,
499
+ -0.37326860427856445,
500
+ -0.3863140940666199,
501
+ -0.43039947748184204,
502
+ -0.2790504992008209,
503
+ -0.23125287890434265,
504
+ -0.33697766065597534,
505
+ -0.3612242639064789,
506
+ -0.3748737871646881,
507
+ -0.2123483568429947,
508
+ -0.20051726698875427,
509
+ -0.19146300852298737,
510
+ -0.2342536449432373,
511
+ -0.3006262183189392,
512
+ -0.3093010485172272,
513
+ -0.43850764632225037,
514
+ -0.356301873922348,
515
+ -0.29953649640083313,
516
+ -0.41408610343933105,
517
+ -0.239955335855484,
518
+ -0.06662970781326294,
519
+ -0.13520391285419464,
520
+ -0.10285133868455887,
521
+ -0.41884657740592957,
522
+ -0.3867041766643524,
523
+ -0.287188321352005,
524
+ -0.21670591831207275,
525
+ -0.2855888903141022,
526
+ -0.3601643443107605,
527
+ -0.40222305059432983,
528
+ -0.16422344744205475,
529
+ -0.35010814666748047,
530
+ -0.6421605944633484,
531
+ -0.4620475172996521,
532
+ -0.2331358790397644,
533
+ -0.36789363622665405,
534
+ -0.5173572301864624,
535
+ -0.2295636385679245,
536
+ -0.6438044309616089,
537
+ -0.3908720314502716,
538
+ -0.4907151460647583,
539
+ -0.436318576335907,
540
+ -0.002603362314403057,
541
+ -0.1944722980260849,
542
+ -0.3558172881603241,
543
+ -0.0964510440826416,
544
+ -0.2997216284275055,
545
+ -0.4600769579410553,
546
+ -0.010438470169901848,
547
+ 0.11934158951044083,
548
+ -0.07519880682229996,
549
+ -0.39747369289398193,
550
+ -0.413342148065567,
551
+ -0.22194483876228333,
552
+ -0.4211430251598358,
553
+ -0.4722813367843628,
554
+ -0.44611743092536926,
555
+ -0.35652509331703186,
556
+ -0.2100401520729065,
557
+ -0.10723454505205154,
558
+ -0.6351080536842346,
559
+ -0.29903534054756165,
560
+ -0.2445092797279358,
561
+ -0.3422980010509491,
562
+ -0.3851262629032135,
563
+ -0.23470661044120789,
564
+ -0.41291457414627075,
565
+ -0.4065450429916382,
566
+ -0.23977336287498474,
567
+ -0.36426475644111633,
568
+ -0.3351646959781647,
569
+ -0.2730990946292877,
570
+ -0.0017077499069273472,
571
+ -0.30413487553596497,
572
+ -0.3375767767429352,
573
+ -0.2887400686740875,
574
+ -0.21333244442939758,
575
+ -0.21224288642406464,
576
+ -0.4361175298690796,
577
+ -0.24830438196659088,
578
+ -0.11157026886940002,
579
+ -0.31685569882392883,
580
+ -0.23533672094345093,
581
+ -0.1681990623474121,
582
+ -0.17895106971263885,
583
+ -0.392513245344162,
584
+ -0.11236104369163513,
585
+ -0.12460662424564362,
586
+ -0.48302754759788513,
587
+ -0.4136165678501129,
588
+ -0.3431640863418579,
589
+ -0.3221750855445862,
590
+ -0.45218420028686523,
591
+ -0.4912467896938324,
592
+ -0.11444079875946045,
593
+ -0.2064221352338791,
594
+ -0.3404044210910797,
595
+ -0.12942379713058472,
596
+ -0.21288804709911346,
597
+ -0.08454813063144684,
598
+ -0.29792511463165283,
599
+ -0.21220028400421143,
600
+ -0.3438176214694977,
601
+ -0.298564612865448,
602
+ -0.45913955569267273,
603
+ -0.272434264421463,
604
+ -0.25763818621635437,
605
+ -0.6365602016448975,
606
+ -0.18968147039413452,
607
+ -0.09780420362949371,
608
+ -0.21418723464012146,
609
+ -0.30045750737190247,
610
+ -0.2784423530101776,
611
+ -0.47075575590133667,
612
+ -0.370872437953949,
613
+ -0.3222501575946808,
614
+ -0.29639896750450134,
615
+ -0.34328600764274597,
616
+ -0.29898783564567566,
617
+ -0.3879045844078064,
618
+ -0.4125598967075348,
619
+ -0.3305641710758209,
620
+ -0.3634641468524933,
621
+ -0.27459052205085754,
622
+ -0.19963577389717102,
623
+ -0.346588671207428,
624
+ -0.08173392713069916,
625
+ -0.27201682329177856
626
+ ],
627
+ "base_loss": [
628
+ 11.639817237854004,
629
+ 10.156075477600098,
630
+ 8.401082038879395,
631
+ 6.93255090713501,
632
+ 5.63682222366333,
633
+ 3.969693422317505,
634
+ 2.455012083053589,
635
+ 2.118212938308716,
636
+ 1.9375640153884888,
637
+ 1.8131191730499268,
638
+ 1.855855941772461,
639
+ 1.7918169498443604,
640
+ 1.862809419631958,
641
+ 1.8385099172592163,
642
+ 1.83856201171875,
643
+ 1.853894591331482,
644
+ 1.7929117679595947,
645
+ 1.8418570756912231,
646
+ 1.8591469526290894,
647
+ 1.942344069480896,
648
+ 1.9011590480804443,
649
+ 1.937254548072815,
650
+ 1.9145668745040894,
651
+ 1.7746026515960693,
652
+ 1.801316261291504,
653
+ 1.713595986366272,
654
+ 1.7272411584854126,
655
+ 1.623053789138794,
656
+ 1.6498748064041138,
657
+ 1.6869145631790161,
658
+ 1.6087714433670044,
659
+ 1.676931619644165,
660
+ 1.6311386823654175,
661
+ 1.5374481678009033,
662
+ 1.5154589414596558,
663
+ 1.42965829372406,
664
+ 1.4408766031265259,
665
+ 1.4083964824676514,
666
+ 1.3894157409667969,
667
+ 1.280190348625183,
668
+ 1.1854569911956787,
669
+ 1.2155663967132568,
670
+ 1.2250372171401978,
671
+ 1.1413753032684326,
672
+ 1.013464093208313,
673
+ 1.122923493385315,
674
+ 0.9275978803634644,
675
+ 0.8905201554298401,
676
+ 0.7307879328727722,
677
+ 0.6575273871421814,
678
+ 0.6883205771446228,
679
+ 0.5470252633094788,
680
+ 0.5368255376815796,
681
+ 0.4907560348510742,
682
+ 0.5686838030815125,
683
+ 0.49868133664131165,
684
+ 0.40930303931236267,
685
+ 0.4845651090145111,
686
+ 0.516866147518158,
687
+ 0.5188473463058472,
688
+ 0.5161632895469666,
689
+ 0.44488078355789185,
690
+ 0.4687444865703583,
691
+ 0.4589233994483948,
692
+ 0.44741424918174744,
693
+ 0.43580299615859985,
694
+ 0.4233454167842865,
695
+ 0.37469175457954407,
696
+ 0.47289425134658813,
697
+ 0.40674108266830444,
698
+ 0.41115209460258484,
699
+ 0.3688190281391144,
700
+ 0.3843062222003937,
701
+ 0.4137001037597656,
702
+ 0.36033517122268677,
703
+ 0.4118814170360565,
704
+ 0.38739117980003357,
705
+ 0.36839795112609863,
706
+ 0.40124839544296265,
707
+ 0.38704535365104675,
708
+ 0.3625943064689636,
709
+ 0.32125577330589294,
710
+ 0.39685899019241333,
711
+ 0.35355910658836365,
712
+ 0.3310209810733795,
713
+ 0.3529447019100189,
714
+ 0.3366256356239319,
715
+ 0.351986825466156,
716
+ 0.32832881808280945,
717
+ 0.30364635586738586,
718
+ 0.36219069361686707,
719
+ 0.3217023015022278,
720
+ 0.34354692697525024,
721
+ 0.2791806757450104,
722
+ 0.3173404037952423,
723
+ 0.29693150520324707,
724
+ 0.32531896233558655,
725
+ 0.30371326208114624,
726
+ 0.26866501569747925,
727
+ 0.3006351590156555,
728
+ 0.2808394730091095,
729
+ 0.29236188530921936,
730
+ 0.27687662839889526,
731
+ 0.25318771600723267,
732
+ 0.2781922221183777,
733
+ 0.30388492345809937,
734
+ 0.3194657862186432,
735
+ 0.2906999886035919,
736
+ 0.30635467171669006,
737
+ 0.2871093451976776,
738
+ 0.27299273014068604,
739
+ 0.27276164293289185,
740
+ 0.31095531582832336,
741
+ 0.2815423309803009,
742
+ 0.27550241351127625,
743
+ 0.24704574048519135,
744
+ 0.27616414427757263,
745
+ 0.287104994058609,
746
+ 0.26561808586120605,
747
+ 0.26954320073127747,
748
+ 0.23006193339824677,
749
+ 0.25967758893966675,
750
+ 0.21751165390014648,
751
+ 0.22478653490543365,
752
+ 0.23876747488975525,
753
+ 0.2527664005756378,
754
+ 0.24814987182617188,
755
+ 0.23216032981872559,
756
+ 0.24969851970672607,
757
+ 0.21826933324337006,
758
+ 0.24777519702911377,
759
+ 0.21866890788078308,
760
+ 0.24302545189857483,
761
+ 0.23206384479999542,
762
+ 0.1930166333913803,
763
+ 0.2083585262298584,
764
+ 0.21388663351535797,
765
+ 0.2077399343252182,
766
+ 0.202982559800148,
767
+ 0.19327537715435028,
768
+ 0.28431329131126404,
769
+ 0.19369187951087952,
770
+ 0.2327968329191208,
771
+ 0.1640963852405548,
772
+ 0.2110501080751419,
773
+ 0.18979254364967346,
774
+ 0.17834016680717468,
775
+ 0.19346167147159576,
776
+ 0.1911771297454834,
777
+ 0.15178219974040985,
778
+ 0.19927184283733368,
779
+ 0.17405223846435547,
780
+ 0.24049408733844757,
781
+ 0.1855386644601822,
782
+ 0.24259953200817108,
783
+ 0.19974806904792786,
784
+ 0.16892997920513153,
785
+ 0.21057972311973572,
786
+ 0.21029826998710632,
787
+ 0.17126639187335968,
788
+ 0.1980292946100235,
789
+ 0.15987589955329895,
790
+ 0.19345174729824066,
791
+ 0.19131742417812347,
792
+ 0.19851002097129822,
793
+ 0.1876509189605713,
794
+ 0.16012631356716156,
795
+ 0.09607796370983124,
796
+ 0.1484193354845047,
797
+ 0.18884345889091492,
798
+ 0.16871722042560577,
799
+ 0.16881194710731506,
800
+ 0.1550588309764862,
801
+ 0.16616418957710266,
802
+ 0.17493103444576263,
803
+ 0.1629718840122223,
804
+ 0.19975315034389496,
805
+ 0.16586120426654816,
806
+ 0.15977083146572113,
807
+ 0.15066365897655487,
808
+ 0.18965628743171692,
809
+ 0.185601606965065,
810
+ 0.15749408304691315,
811
+ 0.19439183175563812,
812
+ 0.14395713806152344,
813
+ 0.1731584519147873,
814
+ 0.17609839141368866,
815
+ 0.10343510657548904,
816
+ 0.2179812639951706,
817
+ 0.1640244722366333,
818
+ 0.17557813227176666,
819
+ 0.14700005948543549,
820
+ 0.12347990274429321,
821
+ 0.16161899268627167,
822
+ 0.16377146542072296,
823
+ 0.1840793341398239,
824
+ 0.16619475185871124,
825
+ 0.12906678020954132,
826
+ 0.1411665976047516,
827
+ 0.12866570055484772,
828
+ 0.1545630246400833,
829
+ 0.12623055279254913,
830
+ 0.1273307204246521,
831
+ 0.17082515358924866,
832
+ 0.12737132608890533,
833
+ 0.1601167768239975,
834
+ 0.12357539683580399,
835
+ 0.1447925567626953,
836
+ 0.1613645851612091,
837
+ 0.1653471291065216,
838
+ 0.14804492890834808,
839
+ 0.1280674785375595,
840
+ 0.120961032807827,
841
+ 0.11894188821315765,
842
+ 0.17771609127521515,
843
+ 0.16308431327342987,
844
+ 0.1615145057439804,
845
+ 0.16900038719177246,
846
+ 0.13064035773277283,
847
+ 0.12192203849554062,
848
+ 0.1703270524740219,
849
+ 0.13478057086467743,
850
+ 0.11193303018808365,
851
+ 0.1735823005437851,
852
+ 0.11142634600400925,
853
+ 0.12079431116580963,
854
+ 0.13884304463863373,
855
+ 0.13051298260688782,
856
+ 0.1113380566239357,
857
+ 0.13207702338695526,
858
+ 0.11978454142808914,
859
+ 0.11676950007677078,
860
+ 0.11669310182332993,
861
+ 0.1455826461315155,
862
+ 0.14255119860172272,
863
+ 0.09344311058521271,
864
+ 0.13233305513858795,
865
+ 0.14260323345661163,
866
+ 0.14308317005634308,
867
+ 0.12413915246725082,
868
+ 0.13392850756645203,
869
+ 0.10997339338064194,
870
+ 0.16214631497859955,
871
+ 0.10885850340127945,
872
+ 0.11581401526927948,
873
+ 0.13958588242530823,
874
+ 0.12495311349630356,
875
+ 0.12036968767642975,
876
+ 0.1327098160982132,
877
+ 0.16099299490451813,
878
+ 0.12836897373199463,
879
+ 0.09642153978347778,
880
+ 0.1325569599866867,
881
+ 0.09756525605916977,
882
+ 0.07441246509552002,
883
+ 0.15825296938419342,
884
+ 0.11627190560102463,
885
+ 0.11572710424661636,
886
+ 0.12323235720396042,
887
+ 0.09537728130817413,
888
+ 0.1255684643983841,
889
+ 0.10272663086652756,
890
+ 0.10061192512512207,
891
+ 0.1096343845129013,
892
+ 0.13086198270320892,
893
+ 0.13289330899715424,
894
+ 0.0884971171617508,
895
+ 0.13670191168785095,
896
+ 0.10128708928823471,
897
+ 0.09838897734880447,
898
+ 0.11107941716909409,
899
+ 0.11279519647359848,
900
+ 0.13107289373874664,
901
+ 0.08550458401441574,
902
+ 0.13277259469032288,
903
+ 0.1271776407957077,
904
+ 0.09930078685283661,
905
+ 0.12097972631454468,
906
+ 0.11515770852565765,
907
+ 0.09048484265804291,
908
+ 0.11554217338562012,
909
+ 0.11730344593524933,
910
+ 0.10536686331033707,
911
+ 0.10421247035264969,
912
+ 0.0897669643163681,
913
+ 0.14295995235443115,
914
+ 0.14636261761188507,
915
+ 0.0999404788017273,
916
+ 0.09715478122234344,
917
+ 0.14027845859527588,
918
+ 0.09507667273283005,
919
+ 0.09038203209638596,
920
+ 0.09006116539239883,
921
+ 0.10859178006649017,
922
+ 0.08985663950443268,
923
+ 0.1452604979276657,
924
+ 0.09389884769916534,
925
+ 0.09381306916475296,
926
+ 0.09161395579576492,
927
+ 0.10640876740217209,
928
+ 0.09798900038003922,
929
+ 0.08652211725711823,
930
+ 0.09993406385183334,
931
+ 0.09884941577911377,
932
+ 0.11107803136110306,
933
+ 0.09744322299957275,
934
+ 0.08755477517843246,
935
+ 0.10821057856082916,
936
+ 0.10122448951005936,
937
+ 0.10775398463010788
938
+ ],
939
+ "info_loss": [
940
+ -2.0815982818603516,
941
+ -2.243824005126953,
942
+ -0.9210786819458008,
943
+ -0.34617090225219727,
944
+ -0.19792890548706055,
945
+ -0.09876537322998047,
946
+ -0.09591412544250488,
947
+ -0.05676698684692383,
948
+ -0.06754577159881592,
949
+ -0.07223129272460938,
950
+ -0.06728148460388184,
951
+ -0.05278456211090088,
952
+ -0.05221426486968994,
953
+ -0.08916306495666504,
954
+ -0.055210232734680176,
955
+ -0.06883823871612549,
956
+ -0.05282747745513916,
957
+ -0.06078696250915527,
958
+ -0.26839470863342285,
959
+ -0.5799283981323242,
960
+ -0.6877650022506714,
961
+ -0.8812437057495117,
962
+ -1.0872838497161865,
963
+ -1.1079578399658203,
964
+ -1.168687343597412,
965
+ -1.114762783050537,
966
+ -1.174454927444458,
967
+ -1.0983941555023193,
968
+ -1.1433277130126953,
969
+ -1.1475012302398682,
970
+ -1.1599960327148438,
971
+ -1.1651790142059326,
972
+ -1.1718239784240723,
973
+ -1.0791484117507935,
974
+ -1.0615819692611694,
975
+ -0.9530861973762512,
976
+ -0.988301157951355,
977
+ -0.9596990942955017,
978
+ -0.9770992994308472,
979
+ -0.8317760229110718,
980
+ -0.7829140424728394,
981
+ -0.7892236709594727,
982
+ -0.8490042090415955,
983
+ -0.7429447174072266,
984
+ -0.6338351964950562,
985
+ -0.7489489316940308,
986
+ -0.5262289047241211,
987
+ -0.4670906364917755,
988
+ -0.3774372935295105,
989
+ -0.29696008563041687,
990
+ -0.29091131687164307,
991
+ -0.1927202045917511,
992
+ -0.17022168636322021,
993
+ -0.12140163779258728,
994
+ -0.1601722538471222,
995
+ -0.1399734914302826,
996
+ -0.0905258059501648,
997
+ -0.13134565949440002,
998
+ -0.16920897364616394,
999
+ -0.14705651998519897,
1000
+ -0.1521684229373932,
1001
+ -0.1504981517791748,
1002
+ -0.1293189823627472,
1003
+ -0.13350403308868408,
1004
+ -0.15035784244537354,
1005
+ -0.16198059916496277,
1006
+ -0.11993435025215149,
1007
+ -0.08966812491416931,
1008
+ -0.15014863014221191,
1009
+ -0.1358177661895752,
1010
+ -0.13599982857704163,
1011
+ -0.07511934638023376,
1012
+ -0.0941607654094696,
1013
+ -0.11929652094841003,
1014
+ -0.1127258688211441,
1015
+ -0.14379215240478516,
1016
+ -0.1386413723230362,
1017
+ -0.09477558732032776,
1018
+ -0.1377323567867279,
1019
+ -0.0781242847442627,
1020
+ -0.14930512011051178,
1021
+ -0.12259714305400848,
1022
+ -0.10278162360191345,
1023
+ -0.08865389227867126,
1024
+ -0.12277501821517944,
1025
+ -0.11761446297168732,
1026
+ -0.12304633855819702,
1027
+ -0.13126574456691742,
1028
+ -0.13275323808193207,
1029
+ -0.09568502008914948,
1030
+ -0.11185088753700256,
1031
+ -0.0839833915233612,
1032
+ -0.11324603855609894,
1033
+ -0.11538231372833252,
1034
+ -0.12823568284511566,
1035
+ -0.10232169926166534,
1036
+ -0.12100198864936829,
1037
+ -0.09690612554550171,
1038
+ -0.08991304039955139,
1039
+ -0.09477418661117554,
1040
+ -0.11962383985519409,
1041
+ -0.08371704816818237,
1042
+ -0.13328717648983002,
1043
+ -0.077918142080307,
1044
+ -0.12280711531639099,
1045
+ -0.09519733488559723,
1046
+ -0.10253576934337616,
1047
+ -0.12251155078411102,
1048
+ -0.12948094308376312,
1049
+ -0.1147230863571167,
1050
+ -0.10420532524585724,
1051
+ -0.1289534866809845,
1052
+ -0.12759214639663696,
1053
+ -0.1027921587228775,
1054
+ -0.11141075193881989,
1055
+ -0.09078088402748108,
1056
+ -0.1241578608751297,
1057
+ -0.09824222326278687,
1058
+ -0.09674803912639618,
1059
+ -0.10662780702114105,
1060
+ -0.061787575483322144,
1061
+ -0.10516685247421265,
1062
+ -0.08466640114784241,
1063
+ -0.08995772898197174,
1064
+ -0.09759549796581268,
1065
+ -0.08332888782024384,
1066
+ -0.07753999531269073,
1067
+ -0.0749911367893219,
1068
+ -0.11360335350036621,
1069
+ -0.09048980474472046,
1070
+ -0.03536655008792877,
1071
+ -0.08909980952739716,
1072
+ -0.09623746573925018,
1073
+ -0.07525226473808289,
1074
+ -0.06714370846748352,
1075
+ -0.0715549886226654,
1076
+ -0.09189903736114502,
1077
+ -0.06325015425682068,
1078
+ -0.05585753917694092,
1079
+ -0.07554758340120316,
1080
+ -0.1361466348171234,
1081
+ -0.06977575272321701,
1082
+ -0.07141049206256866,
1083
+ -0.08251591771841049,
1084
+ -0.056324779987335205,
1085
+ -0.06530772894620895,
1086
+ -0.06673833727836609,
1087
+ -0.0813555121421814,
1088
+ -0.062400490045547485,
1089
+ -0.06523990631103516,
1090
+ -0.08259081840515137,
1091
+ -0.05174391716718674,
1092
+ -0.08779358863830566,
1093
+ -0.04333066940307617,
1094
+ -0.10577897727489471,
1095
+ -0.0604940801858902,
1096
+ -0.02981606125831604,
1097
+ -0.06534035503864288,
1098
+ -0.07527513802051544,
1099
+ -0.06854487955570221,
1100
+ -0.006333336234092712,
1101
+ -0.05264779180288315,
1102
+ -0.0847029909491539,
1103
+ -0.056125909090042114,
1104
+ -0.08433207124471664,
1105
+ -0.08440694957971573,
1106
+ -0.03478521108627319,
1107
+ -0.02798573672771454,
1108
+ -0.06543087959289551,
1109
+ -0.06605537980794907,
1110
+ -0.08063378185033798,
1111
+ -0.05501732975244522,
1112
+ -0.05552982538938522,
1113
+ -0.07784626632928848,
1114
+ -0.0568971261382103,
1115
+ -0.056768909096717834,
1116
+ -0.09499359130859375,
1117
+ -0.08094023913145065,
1118
+ -0.0358768105506897,
1119
+ -0.02388089895248413,
1120
+ -0.0657883808016777,
1121
+ -0.04160216450691223,
1122
+ -0.041917286813259125,
1123
+ -0.057980477809906006,
1124
+ -0.05439015477895737,
1125
+ -0.06195651739835739,
1126
+ -0.046708136796951294,
1127
+ -0.03449763357639313,
1128
+ -0.05678156018257141,
1129
+ -0.05389215052127838,
1130
+ -0.05589033663272858,
1131
+ -0.03746853023767471,
1132
+ -0.0339425653219223,
1133
+ -0.03663020581007004,
1134
+ -0.04093632847070694,
1135
+ -0.05015619099140167,
1136
+ -0.048770755529403687,
1137
+ -0.05778995901346207,
1138
+ -0.0505993515253067,
1139
+ -0.04343957453966141,
1140
+ -0.057661525905132294,
1141
+ -0.037449926137924194,
1142
+ -0.0205063596367836,
1143
+ -0.031216025352478027,
1144
+ -0.02424817532300949,
1145
+ -0.05868971347808838,
1146
+ -0.05216154456138611,
1147
+ -0.04424349218606949,
1148
+ -0.03854592144489288,
1149
+ -0.04582716524600983,
1150
+ -0.05157455801963806,
1151
+ -0.053762584924697876,
1152
+ -0.029237374663352966,
1153
+ -0.04789608716964722,
1154
+ -0.0828666165471077,
1155
+ -0.06326963752508163,
1156
+ -0.040518492460250854,
1157
+ -0.0552607923746109,
1158
+ -0.0655718743801117,
1159
+ -0.036567673087120056,
1160
+ -0.0821944922208786,
1161
+ -0.05331090837717056,
1162
+ -0.06115570664405823,
1163
+ -0.06203245371580124,
1164
+ -0.012450620532035828,
1165
+ -0.03228802978992462,
1166
+ -0.050903528928756714,
1167
+ -0.02402219921350479,
1168
+ -0.041777729988098145,
1169
+ -0.059955090284347534,
1170
+ -0.01389988511800766,
1171
+ -0.0007209256291389465,
1172
+ -0.020330257713794708,
1173
+ -0.05560953915119171,
1174
+ -0.05655915290117264,
1175
+ -0.03257487341761589,
1176
+ -0.0562567338347435,
1177
+ -0.06271617859601974,
1178
+ -0.0597454234957695,
1179
+ -0.04924790561199188,
1180
+ -0.035283736884593964,
1181
+ -0.02310994267463684,
1182
+ -0.0805332139134407,
1183
+ -0.04172522574663162,
1184
+ -0.03687093406915665,
1185
+ -0.04889316111803055,
1186
+ -0.051736071705818176,
1187
+ -0.03652358800172806,
1188
+ -0.05550236254930496,
1189
+ -0.05738862603902817,
1190
+ -0.03773617744445801,
1191
+ -0.04731643199920654,
1192
+ -0.04769770801067352,
1193
+ -0.038139909505844116,
1194
+ -0.008212149143218994,
1195
+ -0.04735717922449112,
1196
+ -0.04601004719734192,
1197
+ -0.041242122650146484,
1198
+ -0.03444558382034302,
1199
+ -0.03151874989271164,
1200
+ -0.05710924416780472,
1201
+ -0.0362548902630806,
1202
+ -0.022099576890468597,
1203
+ -0.04331859201192856,
1204
+ -0.03729948401451111,
1205
+ -0.03066999465227127,
1206
+ -0.027804844081401825,
1207
+ -0.053693242371082306,
1208
+ -0.02257673442363739,
1209
+ -0.02293287217617035,
1210
+ -0.06020914018154144,
1211
+ -0.053687889128923416,
1212
+ -0.048328571021556854,
1213
+ -0.041346874088048935,
1214
+ -0.05953928828239441,
1215
+ -0.06348404288291931,
1216
+ -0.021980077028274536,
1217
+ -0.033464111387729645,
1218
+ -0.04626680165529251,
1219
+ -0.02295789122581482,
1220
+ -0.03362368792295456,
1221
+ -0.020935319364070892,
1222
+ -0.04133973270654678,
1223
+ -0.03256850689649582,
1224
+ -0.04415736347436905,
1225
+ -0.04528270661830902,
1226
+ -0.06118548661470413,
1227
+ -0.03850490599870682,
1228
+ -0.03625042364001274,
1229
+ -0.07827885448932648,
1230
+ -0.029301680624485016,
1231
+ -0.019341766834259033,
1232
+ -0.03149646893143654,
1233
+ -0.04163607209920883,
1234
+ -0.038239289075136185,
1235
+ -0.062306568026542664,
1236
+ -0.04730871692299843,
1237
+ -0.04222497716546059,
1238
+ -0.03953922539949417,
1239
+ -0.045936308801174164,
1240
+ -0.04106493666768074,
1241
+ -0.04822247847914696,
1242
+ -0.05199488252401352,
1243
+ -0.044000688940286636,
1244
+ -0.04840981960296631,
1245
+ -0.03808194771409035,
1246
+ -0.02965845912694931,
1247
+ -0.04685147851705551,
1248
+ -0.0203888937830925,
1249
+ -0.03871728479862213
1250
+ ],
1251
+ "abs_loss": [
1252
+ 2.30385422706604,
1253
+ 2.2780826091766357,
1254
+ 2.221466541290283,
1255
+ 2.089055061340332,
1256
+ 1.9984480142593384,
1257
+ 1.9005656242370605,
1258
+ 1.87179434299469,
1259
+ 1.8566112518310547,
1260
+ 1.8687645196914673,
1261
+ 1.8529582023620605,
1262
+ 1.8454004526138306,
1263
+ 1.8316807746887207,
1264
+ 1.8391278982162476,
1265
+ 1.8252058029174805,
1266
+ 1.8663090467453003,
1267
+ 1.8276523351669312,
1268
+ 1.8539466857910156,
1269
+ 1.8391097784042358,
1270
+ 1.8551603555679321,
1271
+ 1.8367284536361694,
1272
+ 1.7923775911331177,
1273
+ 1.7368284463882446,
1274
+ 1.6195597648620605,
1275
+ 1.49187433719635,
1276
+ 1.4642229080200195,
1277
+ 1.3621273040771484,
1278
+ 1.3119254112243652,
1279
+ 1.3029338121414185,
1280
+ 1.2246941328048706,
1281
+ 1.1458531618118286,
1282
+ 1.1349433660507202,
1283
+ 1.0280259847640991,
1284
+ 0.9581847786903381,
1285
+ 0.9767263531684875,
1286
+ 0.9638102650642395,
1287
+ 0.8906691670417786,
1288
+ 0.8996453285217285,
1289
+ 0.8511548042297363,
1290
+ 0.9369351267814636,
1291
+ 0.8706004619598389,
1292
+ 0.8490410447120667,
1293
+ 0.7745605111122131,
1294
+ 0.7039835453033447,
1295
+ 0.5803566575050354,
1296
+ 0.530763566493988,
1297
+ 0.5496122241020203,
1298
+ 0.5036328434944153,
1299
+ 0.5069024562835693,
1300
+ 0.5179614424705505,
1301
+ 0.49070897698402405,
1302
+ 0.5103476643562317,
1303
+ 0.43010661005973816,
1304
+ 0.43826374411582947,
1305
+ 0.35059139132499695,
1306
+ 0.35389336943626404,
1307
+ 0.3348320722579956,
1308
+ 0.3144708573818207,
1309
+ 0.25914695858955383,
1310
+ 0.2997690439224243,
1311
+ 0.2784518897533417,
1312
+ 0.2622879445552826,
1313
+ 0.26106083393096924,
1314
+ 0.24241697788238525,
1315
+ 0.2352316528558731,
1316
+ 0.2446093112230301,
1317
+ 0.2542091906070709,
1318
+ 0.2651433050632477,
1319
+ 0.21855776011943817,
1320
+ 0.24479158222675323,
1321
+ 0.24396425485610962,
1322
+ 0.22532515227794647,
1323
+ 0.20379044115543365,
1324
+ 0.18716053664684296,
1325
+ 0.19765444099903107,
1326
+ 0.21834973990917206,
1327
+ 0.22507119178771973,
1328
+ 0.209799125790596,
1329
+ 0.241669163107872,
1330
+ 0.20123811066150665,
1331
+ 0.21422863006591797,
1332
+ 0.2206764668226242,
1333
+ 0.24827057123184204,
1334
+ 0.25371381640434265,
1335
+ 0.17112255096435547,
1336
+ 0.21741031110286713,
1337
+ 0.23502689599990845,
1338
+ 0.2338194102048874,
1339
+ 0.18143780529499054,
1340
+ 0.20621494948863983,
1341
+ 0.18330572545528412,
1342
+ 0.17663991451263428,
1343
+ 0.21785050630569458,
1344
+ 0.1840270310640335,
1345
+ 0.24093495309352875,
1346
+ 0.19969721138477325,
1347
+ 0.1844915896654129,
1348
+ 0.1969558745622635,
1349
+ 0.15707360208034515,
1350
+ 0.16628654301166534,
1351
+ 0.21024517714977264,
1352
+ 0.18380267918109894,
1353
+ 0.21588551998138428,
1354
+ 0.15520580112934113,
1355
+ 0.1718127578496933,
1356
+ 0.15742404758930206,
1357
+ 0.14652536809444427,
1358
+ 0.17036563158035278,
1359
+ 0.16253049671649933,
1360
+ 0.12149914354085922,
1361
+ 0.14606857299804688,
1362
+ 0.1554645150899887,
1363
+ 0.1270408183336258,
1364
+ 0.12375888973474503,
1365
+ 0.16692711412906647,
1366
+ 0.12466469407081604,
1367
+ 0.13749970495700836,
1368
+ 0.1462293118238449,
1369
+ 0.13946682214736938,
1370
+ 0.13414506614208221,
1371
+ 0.14158709347248077,
1372
+ 0.11992070078849792,
1373
+ 0.13205362856388092,
1374
+ 0.10871059447526932,
1375
+ 0.14603517949581146,
1376
+ 0.12842875719070435,
1377
+ 0.10888461023569107,
1378
+ 0.13081012666225433,
1379
+ 0.1278458833694458,
1380
+ 0.1344360113143921,
1381
+ 0.1167023554444313,
1382
+ 0.1376543492078781,
1383
+ 0.11900731176137924,
1384
+ 0.1396193951368332,
1385
+ 0.1632918417453766,
1386
+ 0.10951266437768936,
1387
+ 0.1426679641008377,
1388
+ 0.12421008199453354,
1389
+ 0.09802278876304626,
1390
+ 0.12145048379898071,
1391
+ 0.13719113171100616,
1392
+ 0.1666850596666336,
1393
+ 0.1143966093659401,
1394
+ 0.13817617297172546,
1395
+ 0.12770074605941772,
1396
+ 0.1320442110300064,
1397
+ 0.156675323843956,
1398
+ 0.12263376265764236,
1399
+ 0.11993134021759033,
1400
+ 0.11233779788017273,
1401
+ 0.10352327674627304,
1402
+ 0.10694246739149094,
1403
+ 0.0978497639298439,
1404
+ 0.1038326844573021,
1405
+ 0.1087891086935997,
1406
+ 0.12045059353113174,
1407
+ 0.10178189724683762,
1408
+ 0.10108641535043716,
1409
+ 0.10563056915998459,
1410
+ 0.09969466924667358,
1411
+ 0.08930913358926773,
1412
+ 0.09622367471456528,
1413
+ 0.08112730830907822,
1414
+ 0.09679283946752548,
1415
+ 0.09852912276983261,
1416
+ 0.10154712945222855,
1417
+ 0.08536344021558762,
1418
+ 0.10110368579626083,
1419
+ 0.0877099558711052,
1420
+ 0.0935603603720665,
1421
+ 0.07935286313295364,
1422
+ 0.07173427194356918,
1423
+ 0.06842287629842758,
1424
+ 0.07871238887310028,
1425
+ 0.09305604547262192,
1426
+ 0.061133552342653275,
1427
+ 0.06750581413507462,
1428
+ 0.04733775556087494,
1429
+ 0.041590336710214615,
1430
+ 0.03440967574715614,
1431
+ 0.0448673851788044,
1432
+ 0.048636067658662796,
1433
+ 0.058997560292482376,
1434
+ 0.05349382758140564,
1435
+ 0.06911490857601166,
1436
+ 0.057384829968214035,
1437
+ 0.06524454802274704,
1438
+ 0.03691668435931206,
1439
+ 0.04632076621055603,
1440
+ 0.044899653643369675,
1441
+ 0.04991862550377846,
1442
+ 0.03430148586630821,
1443
+ 0.06102760508656502,
1444
+ 0.059088896960020065,
1445
+ 0.05033651366829872,
1446
+ 0.03766924515366554,
1447
+ 0.04401188716292381,
1448
+ 0.0495685450732708,
1449
+ 0.04394489526748657,
1450
+ 0.032825104892253876,
1451
+ 0.03533637151122093,
1452
+ 0.036821670830249786,
1453
+ 0.03871423378586769,
1454
+ 0.050813909620046616,
1455
+ 0.0320887565612793,
1456
+ 0.0323503203690052,
1457
+ 0.04162690415978432,
1458
+ 0.04652707651257515,
1459
+ 0.03234953060746193,
1460
+ 0.02907419763505459,
1461
+ 0.04330940172076225,
1462
+ 0.03034401126205921,
1463
+ 0.03533114865422249,
1464
+ 0.044240038841962814,
1465
+ 0.03451972082257271,
1466
+ 0.03138953447341919,
1467
+ 0.02100559137761593,
1468
+ 0.03484845533967018,
1469
+ 0.027008062228560448,
1470
+ 0.03034891188144684,
1471
+ 0.031032299622893333,
1472
+ 0.031608667224645615,
1473
+ 0.027965238317847252,
1474
+ 0.027770444750785828,
1475
+ 0.04124467447400093,
1476
+ 0.046497613191604614,
1477
+ 0.023359201848506927,
1478
+ 0.032218821346759796,
1479
+ 0.023809067904949188,
1480
+ 0.03547733649611473,
1481
+ 0.017117025330662727,
1482
+ 0.02833031676709652,
1483
+ 0.028712743893265724,
1484
+ 0.03794991597533226,
1485
+ 0.029193580150604248,
1486
+ 0.017572076991200447,
1487
+ 0.02578355371952057,
1488
+ 0.03570059686899185,
1489
+ 0.0297600906342268,
1490
+ 0.024734100326895714,
1491
+ 0.022516677156090736,
1492
+ 0.03747735917568207,
1493
+ 0.0201548021286726,
1494
+ 0.03178713098168373,
1495
+ 0.024044664576649666,
1496
+ 0.030839068815112114,
1497
+ 0.02763315476477146,
1498
+ 0.02342303656041622,
1499
+ 0.02100348472595215,
1500
+ 0.032144565135240555,
1501
+ 0.020648693665862083,
1502
+ 0.011358563788235188,
1503
+ 0.02996905706822872,
1504
+ 0.023514235392212868,
1505
+ 0.02822832763195038,
1506
+ 0.02316158078610897,
1507
+ 0.02231030911207199,
1508
+ 0.019833313301205635,
1509
+ 0.021736932918429375,
1510
+ 0.04444855824112892,
1511
+ 0.015920737758278847,
1512
+ 0.01798548549413681,
1513
+ 0.024343930184841156,
1514
+ 0.023111948743462563,
1515
+ 0.02028748020529747,
1516
+ 0.013007582165300846,
1517
+ 0.018035665154457092,
1518
+ 0.008614753372967243,
1519
+ 0.02372141182422638,
1520
+ 0.036382295191287994,
1521
+ 0.012034427374601364,
1522
+ 0.024076899513602257,
1523
+ 0.026708101853728294,
1524
+ 0.039029981940984726,
1525
+ 0.012135415337979794,
1526
+ 0.021434441208839417,
1527
+ 0.03262598067522049,
1528
+ 0.02024141512811184,
1529
+ 0.020032141357660294,
1530
+ 0.026833519339561462,
1531
+ 0.025756537914276123,
1532
+ 0.02003246732056141,
1533
+ 0.007906577549874783,
1534
+ 0.011433945037424564,
1535
+ 0.028460770845413208,
1536
+ 0.012638579122722149,
1537
+ 0.027600837871432304,
1538
+ 0.022938931360840797,
1539
+ 0.027256881818175316,
1540
+ 0.03210896998643875,
1541
+ 0.028382470831274986,
1542
+ 0.027644798159599304,
1543
+ 0.014684910885989666,
1544
+ 0.0210502240806818,
1545
+ 0.022317929193377495,
1546
+ 0.019239502027630806,
1547
+ 0.018058478832244873,
1548
+ 0.031683724373579025,
1549
+ 0.01892039179801941,
1550
+ 0.016745159402489662,
1551
+ 0.019800638779997826,
1552
+ 0.018956510350108147,
1553
+ 0.0198680330067873,
1554
+ 0.023575974628329277,
1555
+ 0.022173406556248665,
1556
+ 0.015582915395498276,
1557
+ 0.024224141612648964,
1558
+ 0.018571188673377037,
1559
+ 0.01707600988447666,
1560
+ 0.02319365181028843,
1561
+ 0.016697650775313377
1562
+ ],
1563
+ "zipf_loss": [
1564
+ 9.148764610290527,
1565
+ 8.193159103393555,
1566
+ 6.072509765625,
1567
+ 3.9484927654266357,
1568
+ 2.6294360160827637,
1569
+ 2.011842966079712,
1570
+ 1.7981233596801758,
1571
+ 1.7298715114593506,
1572
+ 1.7061980962753296,
1573
+ 1.6984326839447021,
1574
+ 1.6932156085968018,
1575
+ 1.6903259754180908,
1576
+ 1.6886255741119385,
1577
+ 1.6878618001937866,
1578
+ 1.686628818511963,
1579
+ 1.6883533000946045,
1580
+ 1.6861824989318848,
1581
+ 1.6868352890014648,
1582
+ 1.684238076210022,
1583
+ 1.6843323707580566,
1584
+ 1.681557297706604,
1585
+ 1.6743335723876953,
1586
+ 1.6612993478775024,
1587
+ 1.6309456825256348,
1588
+ 1.5862919092178345,
1589
+ 1.5408496856689453,
1590
+ 1.4890775680541992,
1591
+ 1.4552651643753052,
1592
+ 1.3806521892547607,
1593
+ 1.3135970830917358,
1594
+ 1.2469334602355957,
1595
+ 1.1696181297302246,
1596
+ 1.0805621147155762,
1597
+ 1.0572535991668701,
1598
+ 1.0407004356384277,
1599
+ 1.0172886848449707,
1600
+ 0.9681190848350525,
1601
+ 0.8774245977401733,
1602
+ 0.8218495845794678,
1603
+ 0.7741572260856628,
1604
+ 0.6215071082115173,
1605
+ 0.4680870771408081,
1606
+ 0.38734686374664307,
1607
+ 0.30501338839530945,
1608
+ 0.2802583575248718,
1609
+ 0.276706337928772,
1610
+ 0.24773532152175903,
1611
+ 0.22969545423984528,
1612
+ 0.21012923121452332,
1613
+ 0.20455025136470795,
1614
+ 0.18192313611507416,
1615
+ 0.15067628026008606,
1616
+ 0.11456912010908127,
1617
+ 0.09580022096633911,
1618
+ 0.0668957531452179,
1619
+ 0.06967450678348541,
1620
+ 0.060803525149822235,
1621
+ 0.06049271300435066,
1622
+ 0.055438973009586334,
1623
+ 0.06107698380947113,
1624
+ 0.044147878885269165,
1625
+ 0.04942154884338379,
1626
+ 0.054558660835027695,
1627
+ 0.04915769770741463,
1628
+ 0.0500359907746315,
1629
+ 0.05347098037600517,
1630
+ 0.049553126096725464,
1631
+ 0.05055416002869606,
1632
+ 0.04518905282020569,
1633
+ 0.038480307906866074,
1634
+ 0.028954092413187027,
1635
+ 0.025756293907761574,
1636
+ 0.029039651155471802,
1637
+ 0.021393898874521255,
1638
+ 0.023127539083361626,
1639
+ 0.018351595848798752,
1640
+ 0.02461368776857853,
1641
+ 0.026984255760908127,
1642
+ 0.02383498102426529,
1643
+ 0.02516784705221653,
1644
+ 0.020445672795176506,
1645
+ 0.0184946171939373,
1646
+ 0.01568470150232315,
1647
+ 0.0335945263504982,
1648
+ 0.017658868804574013,
1649
+ 0.015548460185527802,
1650
+ 0.016619864851236343,
1651
+ 0.010704641230404377,
1652
+ 0.028467528522014618,
1653
+ 0.025375287979841232,
1654
+ 0.01649937778711319,
1655
+ 0.012676859274506569,
1656
+ 0.01538829691708088,
1657
+ 0.011839807033538818,
1658
+ 0.02237042970955372,
1659
+ 0.014730386435985565,
1660
+ 0.011545787565410137,
1661
+ 0.015047524124383926,
1662
+ 0.014527767896652222,
1663
+ 0.012202445417642593,
1664
+ 0.02355729602277279,
1665
+ 0.02182786725461483,
1666
+ 0.017060475423932076,
1667
+ 0.011250884272158146,
1668
+ 0.015658840537071228,
1669
+ 0.015689896419644356,
1670
+ 0.009464162401854992,
1671
+ 0.007833020761609077,
1672
+ 0.013375839218497276,
1673
+ 0.015904515981674194,
1674
+ 0.00788052100688219,
1675
+ 0.015139850787818432,
1676
+ 0.019742511212825775,
1677
+ 0.010081540793180466,
1678
+ 0.006598178297281265,
1679
+ 0.02656419202685356,
1680
+ 0.006301208399236202,
1681
+ 0.01116674579679966,
1682
+ 0.011517665348947048,
1683
+ 0.012123423628509045,
1684
+ 0.015418392606079578,
1685
+ 0.010212818160653114,
1686
+ 0.02571723610162735,
1687
+ 0.005934752523899078,
1688
+ 0.011283399537205696,
1689
+ 0.024015210568904877,
1690
+ 0.006147728767246008,
1691
+ 0.008858778513967991,
1692
+ 0.010002169758081436,
1693
+ 0.0111832981929183,
1694
+ 0.008553914725780487,
1695
+ 0.012515537440776825,
1696
+ 0.008607814088463783,
1697
+ 0.0060794176533818245,
1698
+ 0.013789001852273941,
1699
+ 0.007285661995410919,
1700
+ 0.007553542964160442,
1701
+ 0.007395597640424967,
1702
+ 0.019424868747591972,
1703
+ 0.007891308516263962,
1704
+ 0.013147450983524323,
1705
+ 0.006194372661411762,
1706
+ 0.013805458322167397,
1707
+ 0.008373916149139404,
1708
+ 0.005300499498844147,
1709
+ 0.006729935761541128,
1710
+ 0.007942927069962025,
1711
+ 0.00961179006844759,
1712
+ 0.011826831847429276,
1713
+ 0.012580672279000282,
1714
+ 0.011939752846956253,
1715
+ 0.009729165583848953,
1716
+ 0.011491796933114529,
1717
+ 0.008557336404919624,
1718
+ 0.006641690619289875,
1719
+ 0.01521589420735836,
1720
+ 0.018641222268342972,
1721
+ 0.014188352972269058,
1722
+ 0.004948650486767292,
1723
+ 0.011573015712201595,
1724
+ 0.00892910361289978,
1725
+ 0.011337338015437126,
1726
+ 0.004030641634017229,
1727
+ 0.014527570456266403,
1728
+ 0.0057725682854652405,
1729
+ 0.008571498095989227,
1730
+ 0.008519389666616917,
1731
+ 0.010961297899484634,
1732
+ 0.005612564273178577,
1733
+ 0.003417621599510312,
1734
+ 0.004866757430136204,
1735
+ 0.007937588728964329,
1736
+ 0.006038891151547432,
1737
+ 0.006155673414468765,
1738
+ 0.007668308913707733,
1739
+ 0.006662166677415371,
1740
+ 0.010678012855350971,
1741
+ 0.008212166838347912,
1742
+ 0.009509880095720291,
1743
+ 0.007193836383521557,
1744
+ 0.003942061215639114,
1745
+ 0.003548411652445793,
1746
+ 0.004174727946519852,
1747
+ 0.005232849158346653,
1748
+ 0.00789184682071209,
1749
+ 0.009482812136411667,
1750
+ 0.008240800350904465,
1751
+ 0.005656293593347073,
1752
+ 0.008366700261831284,
1753
+ 0.008680871687829494,
1754
+ 0.005021273624151945,
1755
+ 0.009234117344021797,
1756
+ 0.009519586339592934,
1757
+ 0.00818641111254692,
1758
+ 0.0075712306424975395,
1759
+ 0.012455126270651817,
1760
+ 0.007254922296851873,
1761
+ 0.005930674262344837,
1762
+ 0.0052425069734454155,
1763
+ 0.0026599280536174774,
1764
+ 0.0042840042151510715,
1765
+ 0.004441949538886547,
1766
+ 0.006021777167916298,
1767
+ 0.002922310493886471,
1768
+ 0.009024055674672127,
1769
+ 0.0037710736505687237,
1770
+ 0.006683184765279293,
1771
+ 0.0072190845385193825,
1772
+ 0.004481279291212559,
1773
+ 0.003004686674103141,
1774
+ 0.004501868039369583,
1775
+ 0.0038021784275770187,
1776
+ 0.0027652522549033165,
1777
+ 0.006458859890699387,
1778
+ 0.005650538019835949,
1779
+ 0.0054639726877212524,
1780
+ 0.007049696519970894,
1781
+ 0.013013076037168503,
1782
+ 0.004686283878982067,
1783
+ 0.011087823659181595,
1784
+ 0.004652542062103748,
1785
+ 0.004659920930862427,
1786
+ 0.00613184692338109,
1787
+ 0.006299192551523447,
1788
+ 0.005826734937727451,
1789
+ 0.005277771968394518,
1790
+ 0.0111530851572752,
1791
+ 0.010877054184675217,
1792
+ 0.003169892355799675,
1793
+ 0.005685212090611458,
1794
+ 0.005942808464169502,
1795
+ 0.006910073570907116,
1796
+ 0.007615677081048489,
1797
+ 0.010119684040546417,
1798
+ 0.007940967567265034,
1799
+ 0.007782436441630125,
1800
+ 0.005521237850189209,
1801
+ 0.009301232174038887,
1802
+ 0.005780254025012255,
1803
+ 0.009563151746988297,
1804
+ 0.005120998248457909,
1805
+ 0.011876009404659271,
1806
+ 0.004899022169411182,
1807
+ 0.00695391558110714,
1808
+ 0.005302120000123978,
1809
+ 0.0042844172567129135,
1810
+ 0.004938999190926552,
1811
+ 0.008059222251176834,
1812
+ 0.006184779107570648,
1813
+ 0.0042833685874938965,
1814
+ 0.008083581924438477,
1815
+ 0.009481126442551613,
1816
+ 0.0069039976224303246,
1817
+ 0.007911891676485538,
1818
+ 0.0036851181648671627,
1819
+ 0.008952926844358444,
1820
+ 0.00426842924207449,
1821
+ 0.00578036205843091,
1822
+ 0.0034461834002286196,
1823
+ 0.005975274369120598,
1824
+ 0.007607896812260151,
1825
+ 0.0090834591537714,
1826
+ 0.006502381060272455,
1827
+ 0.004667104221880436,
1828
+ 0.005495388060808182,
1829
+ 0.0038040021900087595,
1830
+ 0.009738792665302753,
1831
+ 0.005345105193555355,
1832
+ 0.008480982854962349,
1833
+ 0.005129683762788773,
1834
+ 0.00557674840092659,
1835
+ 0.007796278223395348,
1836
+ 0.00514574721455574,
1837
+ 0.0045755114406347275,
1838
+ 0.00829264335334301,
1839
+ 0.013153402134776115,
1840
+ 0.0040350379422307014,
1841
+ 0.005236027296632528,
1842
+ 0.004422519356012344,
1843
+ 0.007094629108905792,
1844
+ 0.0058034141547977924,
1845
+ 0.006710957735776901,
1846
+ 0.008961949497461319,
1847
+ 0.006426266394555569,
1848
+ 0.006725172512233257,
1849
+ 0.008542411029338837,
1850
+ 0.0040588038973510265,
1851
+ 0.009948624297976494,
1852
+ 0.004500346723943949,
1853
+ 0.003111586906015873,
1854
+ 0.005494164768606424,
1855
+ 0.0037629390135407448,
1856
+ 0.008611260913312435,
1857
+ 0.0050796265713870525,
1858
+ 0.012169968336820602,
1859
+ 0.0052435919642448425,
1860
+ 0.005147482268512249,
1861
+ 0.00429452583193779,
1862
+ 0.005704828538000584,
1863
+ 0.007688248064368963,
1864
+ 0.011776888743042946,
1865
+ 0.005811269395053387,
1866
+ 0.005097261629998684,
1867
+ 0.008375940844416618,
1868
+ 0.007997730746865273,
1869
+ 0.0063632940873503685,
1870
+ 0.007536925375461578,
1871
+ 0.012007943354547024,
1872
+ 0.018611159175634384,
1873
+ 0.005732273682951927
1874
+ ],
1875
+ "denoise_loss": [],
1876
+ "ortho_loss": [
1877
+ 0.8885435461997986,
1878
+ 0.7170970439910889,
1879
+ 0.5767908692359924,
1880
+ 0.4600399434566498,
1881
+ 0.43550196290016174,
1882
+ 0.41573062539100647,
1883
+ 0.34819266200065613,
1884
+ 0.2961730659008026,
1885
+ 0.2692863643169403,
1886
+ 0.28603875637054443,
1887
+ 0.25260230898857117,
1888
+ 0.2519712746143341,
1889
+ 0.25865286588668823,
1890
+ 0.25377777218818665,
1891
+ 0.2461307942867279,
1892
+ 0.22820307314395905,
1893
+ 0.21362219750881195,
1894
+ 0.22701697051525116,
1895
+ 0.2701369524002075,
1896
+ 0.3389910161495209,
1897
+ 0.34586986899375916,
1898
+ 0.36707010865211487,
1899
+ 0.3889461159706116,
1900
+ 0.3966933488845825,
1901
+ 0.39621293544769287,
1902
+ 0.3982795476913452,
1903
+ 0.3988940119743347,
1904
+ 0.40131956338882446,
1905
+ 0.40211835503578186,
1906
+ 0.40279901027679443,
1907
+ 0.40056779980659485,
1908
+ 0.4035308063030243,
1909
+ 0.40373891592025757,
1910
+ 0.40222078561782837,
1911
+ 0.39735692739486694,
1912
+ 0.39471435546875,
1913
+ 0.3861656188964844,
1914
+ 0.3764215409755707,
1915
+ 0.37386637926101685,
1916
+ 0.37017256021499634,
1917
+ 0.3712293803691864,
1918
+ 0.371606707572937,
1919
+ 0.35931164026260376,
1920
+ 0.3534904718399048,
1921
+ 0.3533676266670227,
1922
+ 0.35187551379203796,
1923
+ 0.35193905234336853,
1924
+ 0.34886762499809265,
1925
+ 0.34502607583999634,
1926
+ 0.3453461825847626,
1927
+ 0.3458319306373596,
1928
+ 0.33560043573379517,
1929
+ 0.3396965563297272,
1930
+ 0.33749768137931824,
1931
+ 0.3369745910167694,
1932
+ 0.3322361409664154,
1933
+ 0.3279988467693329,
1934
+ 0.32231560349464417,
1935
+ 0.3140047788619995,
1936
+ 0.3148951828479767,
1937
+ 0.30706074833869934,
1938
+ 0.3004221022129059,
1939
+ 0.2957034409046173,
1940
+ 0.291050523519516,
1941
+ 0.28938552737236023,
1942
+ 0.28469592332839966,
1943
+ 0.2833675444126129,
1944
+ 0.27923813462257385,
1945
+ 0.2769160866737366,
1946
+ 0.27769383788108826,
1947
+ 0.27265939116477966,
1948
+ 0.27549681067466736,
1949
+ 0.26848623156547546,
1950
+ 0.27251937985420227,
1951
+ 0.2696530520915985,
1952
+ 0.2705014646053314,
1953
+ 0.26794448494911194,
1954
+ 0.26621025800704956,
1955
+ 0.26695698499679565,
1956
+ 0.2677346467971802,
1957
+ 0.2682175934314728,
1958
+ 0.26711276173591614,
1959
+ 0.2629030644893646,
1960
+ 0.26805412769317627,
1961
+ 0.26911965012550354,
1962
+ 0.27012115716934204,
1963
+ 0.27012962102890015,
1964
+ 0.26948150992393494,
1965
+ 0.2718905210494995,
1966
+ 0.2693946361541748,
1967
+ 0.2690868377685547,
1968
+ 0.26841506361961365,
1969
+ 0.2688615322113037,
1970
+ 0.26440539956092834,
1971
+ 0.2661382257938385,
1972
+ 0.26457643508911133,
1973
+ 0.2629278898239136,
1974
+ 0.2636287212371826,
1975
+ 0.26622527837753296,
1976
+ 0.26416337490081787,
1977
+ 0.2650313973426819,
1978
+ 0.2698652446269989,
1979
+ 0.26900938153266907,
1980
+ 0.2571031451225281,
1981
+ 0.2569356858730316,
1982
+ 0.2564140260219574,
1983
+ 0.2546826899051666,
1984
+ 0.2549506425857544,
1985
+ 0.2541828751564026,
1986
+ 0.25547727942466736,
1987
+ 0.2605178952217102,
1988
+ 0.26146799325942993,
1989
+ 0.25865280628204346,
1990
+ 0.2535390853881836,
1991
+ 0.24878275394439697,
1992
+ 0.2532852292060852,
1993
+ 0.25691404938697815,
1994
+ 0.25607773661613464,
1995
+ 0.2578878700733185,
1996
+ 0.2600436508655548,
1997
+ 0.2597696781158447,
1998
+ 0.25679489970207214,
1999
+ 0.25775811076164246,
2000
+ 0.2537018656730652,
2001
+ 0.25513455271720886,
2002
+ 0.25609615445137024,
2003
+ 0.2565081715583801,
2004
+ 0.2563503384590149,
2005
+ 0.25798508524894714,
2006
+ 0.25841814279556274,
2007
+ 0.2571648061275482,
2008
+ 0.2571255564689636,
2009
+ 0.2550588846206665,
2010
+ 0.25339433550834656,
2011
+ 0.2531038522720337,
2012
+ 0.2531052231788635,
2013
+ 0.2499697357416153,
2014
+ 0.2552987337112427,
2015
+ 0.2573709487915039,
2016
+ 0.25619930028915405,
2017
+ 0.24927644431591034,
2018
+ 0.2494434416294098,
2019
+ 0.2452142983675003,
2020
+ 0.24594520032405853,
2021
+ 0.24564315378665924,
2022
+ 0.24543415009975433,
2023
+ 0.2530146837234497,
2024
+ 0.255063533782959,
2025
+ 0.2588399350643158,
2026
+ 0.25854992866516113,
2027
+ 0.25709789991378784,
2028
+ 0.2601565420627594,
2029
+ 0.2589494585990906,
2030
+ 0.2594975531101227,
2031
+ 0.2603684663772583,
2032
+ 0.25523388385772705,
2033
+ 0.2566591501235962,
2034
+ 0.2613082528114319,
2035
+ 0.26063770055770874,
2036
+ 0.2606363296508789,
2037
+ 0.25953832268714905,
2038
+ 0.2609032988548279,
2039
+ 0.26214295625686646,
2040
+ 0.2610551118850708,
2041
+ 0.25964516401290894,
2042
+ 0.25923821330070496,
2043
+ 0.25974103808403015,
2044
+ 0.2597079873085022,
2045
+ 0.2560349404811859,
2046
+ 0.25539258122444153,
2047
+ 0.2563842535018921,
2048
+ 0.25771430134773254,
2049
+ 0.25725558400154114,
2050
+ 0.25808581709861755,
2051
+ 0.2630041241645813,
2052
+ 0.268037885427475,
2053
+ 0.26821357011795044,
2054
+ 0.26748761534690857,
2055
+ 0.2678012549877167,
2056
+ 0.2589096128940582,
2057
+ 0.26054227352142334,
2058
+ 0.2608339488506317,
2059
+ 0.2611874043941498,
2060
+ 0.2599111497402191,
2061
+ 0.25688591599464417,
2062
+ 0.26534929871559143,
2063
+ 0.2643160820007324,
2064
+ 0.2675628364086151,
2065
+ 0.2699528932571411,
2066
+ 0.2705341577529907,
2067
+ 0.2709191143512726,
2068
+ 0.2723911702632904,
2069
+ 0.2701484262943268,
2070
+ 0.2669573128223419,
2071
+ 0.266337513923645,
2072
+ 0.26788681745529175,
2073
+ 0.26726365089416504,
2074
+ 0.26725485920906067,
2075
+ 0.26754555106163025,
2076
+ 0.2686413824558258,
2077
+ 0.2755902111530304,
2078
+ 0.27544665336608887,
2079
+ 0.27594098448753357,
2080
+ 0.2768699824810028,
2081
+ 0.2770766019821167,
2082
+ 0.275217741727829,
2083
+ 0.27790069580078125,
2084
+ 0.2772781550884247,
2085
+ 0.27898573875427246,
2086
+ 0.27966248989105225,
2087
+ 0.2800298035144806,
2088
+ 0.278813898563385,
2089
+ 0.2794055640697479,
2090
+ 0.2796669900417328,
2091
+ 0.2775470018386841,
2092
+ 0.27806222438812256,
2093
+ 0.2780100703239441,
2094
+ 0.27965667843818665,
2095
+ 0.2785974442958832,
2096
+ 0.27775922417640686,
2097
+ 0.2781241238117218,
2098
+ 0.27801811695098877,
2099
+ 0.27891024947166443,
2100
+ 0.2812408208847046,
2101
+ 0.28048190474510193,
2102
+ 0.28028103709220886,
2103
+ 0.2798750698566437,
2104
+ 0.2788301408290863,
2105
+ 0.27951404452323914,
2106
+ 0.2783767879009247,
2107
+ 0.27976107597351074,
2108
+ 0.2796590328216553,
2109
+ 0.28010427951812744,
2110
+ 0.27874061465263367,
2111
+ 0.27861717343330383,
2112
+ 0.27829408645629883,
2113
+ 0.2787402272224426,
2114
+ 0.27952054142951965,
2115
+ 0.2806849777698517,
2116
+ 0.2853986918926239,
2117
+ 0.28703945875167847,
2118
+ 0.28547102212905884,
2119
+ 0.28476831316947937,
2120
+ 0.28264766931533813,
2121
+ 0.28226372599601746,
2122
+ 0.2809774577617645,
2123
+ 0.2800523638725281,
2124
+ 0.280084490776062,
2125
+ 0.28102418780326843,
2126
+ 0.2757742702960968,
2127
+ 0.2758842408657074,
2128
+ 0.2775470018386841,
2129
+ 0.2777790427207947,
2130
+ 0.27810153365135193,
2131
+ 0.2768770158290863,
2132
+ 0.2779047191143036,
2133
+ 0.27850082516670227,
2134
+ 0.27749329805374146,
2135
+ 0.2764735519886017,
2136
+ 0.27712079882621765,
2137
+ 0.2759023606777191,
2138
+ 0.27512118220329285,
2139
+ 0.27608150243759155,
2140
+ 0.2755919098854065,
2141
+ 0.2751915156841278,
2142
+ 0.27574747800827026,
2143
+ 0.27595052123069763,
2144
+ 0.275706022977829,
2145
+ 0.27671322226524353,
2146
+ 0.2758370041847229,
2147
+ 0.2761959433555603,
2148
+ 0.27639609575271606,
2149
+ 0.2769555151462555,
2150
+ 0.27667707204818726,
2151
+ 0.2767086923122406,
2152
+ 0.27628183364868164,
2153
+ 0.2764381170272827,
2154
+ 0.27710217237472534,
2155
+ 0.2773119807243347,
2156
+ 0.2782318890094757,
2157
+ 0.2790510952472687,
2158
+ 0.2790542244911194,
2159
+ 0.2792282998561859,
2160
+ 0.27902498841285706,
2161
+ 0.27822360396385193,
2162
+ 0.27823856472969055,
2163
+ 0.2783638834953308,
2164
+ 0.27829623222351074,
2165
+ 0.2803868353366852,
2166
+ 0.2808542549610138,
2167
+ 0.28132185339927673,
2168
+ 0.28175821900367737,
2169
+ 0.2818266749382019,
2170
+ 0.2817915380001068,
2171
+ 0.2818235754966736,
2172
+ 0.2817734181880951,
2173
+ 0.2814966142177582,
2174
+ 0.2815135717391968,
2175
+ 0.28160402178764343,
2176
+ 0.2822325825691223,
2177
+ 0.28264033794403076,
2178
+ 0.28252533078193665,
2179
+ 0.2823033034801483,
2180
+ 0.2821318507194519,
2181
+ 0.28197363018989563,
2182
+ 0.28218743205070496,
2183
+ 0.2823140621185303,
2184
+ 0.2824079394340515,
2185
+ 0.2824495732784271,
2186
+ 0.28276515007019043
2187
+ ],
2188
+ "lr": [
2189
+ 4.188034188034189e-06,
2190
+ 8.461538461538462e-06,
2191
+ 1.2735042735042738e-05,
2192
+ 1.700854700854701e-05,
2193
+ 2.1282051282051282e-05,
2194
+ 2.5555555555555557e-05,
2195
+ 2.9829059829059833e-05,
2196
+ 3.4102564102564105e-05,
2197
+ 3.837606837606838e-05,
2198
+ 4e-05,
2199
+ 4e-05,
2200
+ 4e-05,
2201
+ 4e-05,
2202
+ 4e-05,
2203
+ 4e-05,
2204
+ 4e-05,
2205
+ 4e-05,
2206
+ 4e-05,
2207
+ 4e-05,
2208
+ 4e-05,
2209
+ 4e-05,
2210
+ 4e-05,
2211
+ 4e-05,
2212
+ 4e-05,
2213
+ 4e-05,
2214
+ 4e-05,
2215
+ 4e-05,
2216
+ 4e-05,
2217
+ 4e-05,
2218
+ 4e-05,
2219
+ 4e-05,
2220
+ 4e-05,
2221
+ 4e-05,
2222
+ 4e-05,
2223
+ 4e-05,
2224
+ 4e-05,
2225
+ 4e-05,
2226
+ 4e-05,
2227
+ 4e-05,
2228
+ 4e-05,
2229
+ 4e-05,
2230
+ 4e-05,
2231
+ 4e-05,
2232
+ 4e-05,
2233
+ 4e-05,
2234
+ 4e-05,
2235
+ 4e-05,
2236
+ 4e-05,
2237
+ 4e-05,
2238
+ 4e-05,
2239
+ 4e-05,
2240
+ 4e-05,
2241
+ 4e-05,
2242
+ 4e-05,
2243
+ 4e-05,
2244
+ 4e-05,
2245
+ 4e-05,
2246
+ 4e-05,
2247
+ 4e-05,
2248
+ 4e-05,
2249
+ 4e-05,
2250
+ 4e-05,
2251
+ 4e-05,
2252
+ 4e-05,
2253
+ 4e-05,
2254
+ 4e-05,
2255
+ 4e-05,
2256
+ 4e-05,
2257
+ 4e-05,
2258
+ 4e-05,
2259
+ 4e-05,
2260
+ 4e-05,
2261
+ 4e-05,
2262
+ 4e-05,
2263
+ 4e-05,
2264
+ 4e-05,
2265
+ 4e-05,
2266
+ 4e-05,
2267
+ 4e-05,
2268
+ 4e-05,
2269
+ 4e-05,
2270
+ 4e-05,
2271
+ 4e-05,
2272
+ 4e-05,
2273
+ 4e-05,
2274
+ 4e-05,
2275
+ 4e-05,
2276
+ 4e-05,
2277
+ 4e-05,
2278
+ 4e-05,
2279
+ 4e-05,
2280
+ 4e-05,
2281
+ 4e-05,
2282
+ 4e-05,
2283
+ 4e-05,
2284
+ 4e-05,
2285
+ 4e-05,
2286
+ 4e-05,
2287
+ 4e-05,
2288
+ 4e-05,
2289
+ 4e-05,
2290
+ 4e-05,
2291
+ 4e-05,
2292
+ 4e-05,
2293
+ 4e-05,
2294
+ 4e-05,
2295
+ 4e-05,
2296
+ 4e-05,
2297
+ 4e-05,
2298
+ 4e-05,
2299
+ 4e-05,
2300
+ 4e-05,
2301
+ 4e-05,
2302
+ 4e-05,
2303
+ 4e-05,
2304
+ 4e-05,
2305
+ 4e-05,
2306
+ 4e-05,
2307
+ 4e-05,
2308
+ 4e-05,
2309
+ 4e-05,
2310
+ 4e-05,
2311
+ 4e-05,
2312
+ 4e-05,
2313
+ 4e-05,
2314
+ 4e-05,
2315
+ 4e-05,
2316
+ 4e-05,
2317
+ 4e-05,
2318
+ 4e-05,
2319
+ 4e-05,
2320
+ 4e-05,
2321
+ 4e-05,
2322
+ 4e-05,
2323
+ 4e-05,
2324
+ 4e-05,
2325
+ 4e-05,
2326
+ 4e-05,
2327
+ 4e-05,
2328
+ 4e-05,
2329
+ 4e-05,
2330
+ 4e-05,
2331
+ 4e-05,
2332
+ 4e-05,
2333
+ 4e-05,
2334
+ 4e-05,
2335
+ 4e-05,
2336
+ 4e-05,
2337
+ 4e-05,
2338
+ 4e-05,
2339
+ 4e-05,
2340
+ 4e-05,
2341
+ 4e-05,
2342
+ 4e-05,
2343
+ 4e-05,
2344
+ 4e-05,
2345
+ 4e-05,
2346
+ 4e-05,
2347
+ 4e-05,
2348
+ 4e-05,
2349
+ 4e-05,
2350
+ 4e-05,
2351
+ 4e-05,
2352
+ 4e-05,
2353
+ 4e-05,
2354
+ 4e-05,
2355
+ 4e-05,
2356
+ 4e-05,
2357
+ 4e-05,
2358
+ 4e-05,
2359
+ 4e-05,
2360
+ 4e-05,
2361
+ 4e-05,
2362
+ 4e-05,
2363
+ 4e-05,
2364
+ 4e-05,
2365
+ 4e-05,
2366
+ 4e-05,
2367
+ 4e-05,
2368
+ 4e-05,
2369
+ 4e-05,
2370
+ 4e-05,
2371
+ 4e-05,
2372
+ 4e-05,
2373
+ 4e-05,
2374
+ 4e-05,
2375
+ 4e-05,
2376
+ 4e-05,
2377
+ 4e-05,
2378
+ 3.992995647012267e-05,
2379
+ 3.963316185199842e-05,
2380
+ 3.933636723387416e-05,
2381
+ 3.90395726157499e-05,
2382
+ 3.874277799762565e-05,
2383
+ 3.844598337950139e-05,
2384
+ 3.814918876137713e-05,
2385
+ 3.785239414325287e-05,
2386
+ 3.7555599525128613e-05,
2387
+ 3.725880490700435e-05,
2388
+ 3.696201028888009e-05,
2389
+ 3.666521567075585e-05,
2390
+ 3.6368421052631585e-05,
2391
+ 3.607162643450732e-05,
2392
+ 3.577483181638307e-05,
2393
+ 3.547803719825881e-05,
2394
+ 3.518124258013455e-05,
2395
+ 3.4884447962010287e-05,
2396
+ 3.458765334388604e-05,
2397
+ 3.4290858725761776e-05,
2398
+ 3.399406410763751e-05,
2399
+ 3.3697269489513265e-05,
2400
+ 3.3400474871389e-05,
2401
+ 3.310368025326474e-05,
2402
+ 3.280688563514048e-05,
2403
+ 3.251009101701623e-05,
2404
+ 3.2213296398891967e-05,
2405
+ 3.191650178076771e-05,
2406
+ 3.1542540561931145e-05,
2407
+ 3.124574594380688e-05,
2408
+ 3.094895132568263e-05,
2409
+ 3.065215670755838e-05,
2410
+ 3.0355362089434113e-05,
2411
+ 3.0058567471309854e-05,
2412
+ 2.97617728531856e-05,
2413
+ 2.9464978235061336e-05,
2414
+ 2.9168183616937077e-05,
2415
+ 2.8871388998812818e-05,
2416
+ 2.857459438068857e-05,
2417
+ 2.8277799762564307e-05,
2418
+ 2.798100514444005e-05,
2419
+ 2.7684210526315793e-05,
2420
+ 2.738741590819153e-05,
2421
+ 2.709062129006727e-05,
2422
+ 2.6793826671943013e-05,
2423
+ 2.6497032053818764e-05,
2424
+ 2.62002374356945e-05,
2425
+ 2.5903442817570243e-05,
2426
+ 2.5606648199445987e-05,
2427
+ 2.5309853581321725e-05,
2428
+ 2.5013058963197466e-05,
2429
+ 2.4716264345073214e-05,
2430
+ 2.441946972694896e-05,
2431
+ 2.4122675108824693e-05,
2432
+ 2.3825880490700434e-05,
2433
+ 2.352908587257618e-05,
2434
+ 2.3232291254451916e-05,
2435
+ 2.293549663632766e-05,
2436
+ 2.2638702018203408e-05,
2437
+ 2.226474079936684e-05,
2438
+ 2.196794618124258e-05,
2439
+ 2.1671151563118328e-05,
2440
+ 2.1374356944994066e-05,
2441
+ 2.1077562326869803e-05,
2442
+ 2.0780767708745554e-05,
2443
+ 2.0483973090621296e-05,
2444
+ 2.018717847249703e-05,
2445
+ 1.989038385437277e-05,
2446
+ 1.959358923624852e-05,
2447
+ 1.929679461812426e-05,
2448
+ 1.8999999999999998e-05,
2449
+ 1.8703205381875746e-05,
2450
+ 1.8406410763751487e-05,
2451
+ 1.8109616145627224e-05,
2452
+ 1.7812821527502965e-05,
2453
+ 1.7516026909378713e-05,
2454
+ 1.7219232291254454e-05,
2455
+ 1.6922437673130192e-05,
2456
+ 1.662564305500594e-05,
2457
+ 1.632884843688168e-05,
2458
+ 1.603205381875742e-05,
2459
+ 1.573525920063316e-05,
2460
+ 1.5438464582508908e-05,
2461
+ 1.5141669964384647e-05,
2462
+ 1.4844875346260385e-05,
2463
+ 1.4548080728136134e-05,
2464
+ 1.4251286110011875e-05,
2465
+ 1.3954491491887611e-05,
2466
+ 1.3657696873763363e-05,
2467
+ 1.33609022556391e-05,
2468
+ 1.298694103680253e-05,
2469
+ 1.2690146418678277e-05,
2470
+ 1.2393351800554018e-05,
2471
+ 1.2096557182429756e-05,
2472
+ 1.1799762564305506e-05,
2473
+ 1.1502967946181245e-05,
2474
+ 1.1206173328056984e-05,
2475
+ 1.0909378709932724e-05,
2476
+ 1.0612584091808472e-05,
2477
+ 1.0315789473684213e-05,
2478
+ 1.0018994855559949e-05,
2479
+ 9.7222002374357e-06,
2480
+ 9.425405619311438e-06,
2481
+ 9.128611001187177e-06,
2482
+ 8.831816383062916e-06,
2483
+ 8.535021764938666e-06,
2484
+ 8.238227146814405e-06,
2485
+ 7.941432528690143e-06,
2486
+ 7.644637910565893e-06,
2487
+ 7.347843292441632e-06,
2488
+ 7.0510486743173715e-06,
2489
+ 6.75425405619311e-06,
2490
+ 6.45745943806886e-06,
2491
+ 6.160664819944598e-06,
2492
+ 5.8638702018203375e-06,
2493
+ 5.567075583696086e-06,
2494
+ 5.270280965571826e-06,
2495
+ 4.973486347447565e-06,
2496
+ 4.676691729323314e-06,
2497
+ 4.379897111199053e-06,
2498
+ 4.083102493074792e-06
2499
+ ],
2500
+ "emb_lr": [],
2501
+ "eval_step": [
2502
+ 1550,
2503
+ 3113,
2504
+ 4676,
2505
+ 6239,
2506
+ 7802,
2507
+ 9365,
2508
+ 10928,
2509
+ 12491,
2510
+ 14054,
2511
+ 15617
2512
+ ],
2513
+ "eval_accuracy": [
2514
+ 0.0,
2515
+ 0.0,
2516
+ 0.0,
2517
+ 0.0,
2518
+ 0.0,
2519
+ 0.0,
2520
+ 0.0,
2521
+ 0.0,
2522
+ 0.0,
2523
+ 0.0
2524
+ ]
2525
+ },
2526
+ "final_accuracy": 0.70625,
2527
+ "sft_eval": {
2528
+ "config": {
2529
+ "ops": "add_sub",
2530
+ "K": null,
2531
+ "mode": "sft",
2532
+ "n_digits": 6,
2533
+ "n_per_split": 100
2534
+ },
2535
+ "splits": {
2536
+ "add_S0": {
2537
+ "full_accuracy": 0.94,
2538
+ "n_examples": 100,
2539
+ "per_subtask": {
2540
+ "SA": {
2541
+ "accuracy": 0.9917355371900827,
2542
+ "count": 605
2543
+ },
2544
+ "SS": {
2545
+ "accuracy": 0.9894736842105263,
2546
+ "count": 95
2547
+ }
2548
+ }
2549
+ },
2550
+ "add_S1": {
2551
+ "full_accuracy": 0.86,
2552
+ "n_examples": 100,
2553
+ "per_subtask": {
2554
+ "SA": {
2555
+ "accuracy": 0.9901960784313726,
2556
+ "count": 204
2557
+ },
2558
+ "SC": {
2559
+ "accuracy": 0.9822485207100592,
2560
+ "count": 169
2561
+ },
2562
+ "SS": {
2563
+ "accuracy": 1.0,
2564
+ "count": 31
2565
+ },
2566
+ "UC": {
2567
+ "accuracy": 0.9695945945945946,
2568
+ "count": 296
2569
+ }
2570
+ }
2571
+ },
2572
+ "add_S2": {
2573
+ "full_accuracy": 0.83,
2574
+ "n_examples": 100,
2575
+ "per_subtask": {
2576
+ "SA": {
2577
+ "accuracy": 0.9938650306748467,
2578
+ "count": 163
2579
+ },
2580
+ "SC": {
2581
+ "accuracy": 0.9615384615384616,
2582
+ "count": 130
2583
+ },
2584
+ "SS": {
2585
+ "accuracy": 0.9540229885057471,
2586
+ "count": 87
2587
+ },
2588
+ "UC": {
2589
+ "accuracy": 0.9655172413793104,
2590
+ "count": 203
2591
+ },
2592
+ "US": {
2593
+ "accuracy": 0.9914529914529915,
2594
+ "count": 117
2595
+ }
2596
+ }
2597
+ },
2598
+ "add_S3": {
2599
+ "full_accuracy": 0.53,
2600
+ "n_examples": 100,
2601
+ "per_subtask": {
2602
+ "SA": {
2603
+ "accuracy": 0.9752066115702479,
2604
+ "count": 121
2605
+ },
2606
+ "SC": {
2607
+ "accuracy": 0.9917355371900827,
2608
+ "count": 121
2609
+ },
2610
+ "SS": {
2611
+ "accuracy": 0.9795918367346939,
2612
+ "count": 49
2613
+ },
2614
+ "UC": {
2615
+ "accuracy": 0.7849462365591398,
2616
+ "count": 186
2617
+ },
2618
+ "US": {
2619
+ "accuracy": 0.9551569506726457,
2620
+ "count": 223
2621
+ }
2622
+ }
2623
+ },
2624
+ "add_S4": {
2625
+ "full_accuracy": 0.32,
2626
+ "n_examples": 100,
2627
+ "per_subtask": {
2628
+ "SA": {
2629
+ "accuracy": 0.9903846153846154,
2630
+ "count": 104
2631
+ },
2632
+ "SC": {
2633
+ "accuracy": 0.9811320754716981,
2634
+ "count": 106
2635
+ },
2636
+ "SS": {
2637
+ "accuracy": 1.0,
2638
+ "count": 23
2639
+ },
2640
+ "UC": {
2641
+ "accuracy": 0.7,
2642
+ "count": 160
2643
+ },
2644
+ "US": {
2645
+ "accuracy": 0.755700325732899,
2646
+ "count": 307
2647
+ }
2648
+ }
2649
+ },
2650
+ "add_S5": {
2651
+ "full_accuracy": 0.13,
2652
+ "n_examples": 100,
2653
+ "per_subtask": {
2654
+ "SA": {
2655
+ "accuracy": 1.0,
2656
+ "count": 100
2657
+ },
2658
+ "SC": {
2659
+ "accuracy": 1.0,
2660
+ "count": 100
2661
+ },
2662
+ "UC": {
2663
+ "accuracy": 0.33,
2664
+ "count": 100
2665
+ },
2666
+ "US": {
2667
+ "accuracy": 0.4825,
2668
+ "count": 400
2669
+ }
2670
+ }
2671
+ },
2672
+ "add_S6": {
2673
+ "full_accuracy": 0.48,
2674
+ "n_examples": 100,
2675
+ "per_subtask": {
2676
+ "SC": {
2677
+ "accuracy": 1.0,
2678
+ "count": 100
2679
+ },
2680
+ "UC": {
2681
+ "accuracy": 0.65,
2682
+ "count": 100
2683
+ },
2684
+ "US": {
2685
+ "accuracy": 0.7,
2686
+ "count": 500
2687
+ }
2688
+ }
2689
+ },
2690
+ "add_random": {
2691
+ "full_accuracy": 0.86,
2692
+ "n_examples": 200,
2693
+ "per_subtask": {
2694
+ "SA": {
2695
+ "accuracy": 0.9798657718120806,
2696
+ "count": 447
2697
+ },
2698
+ "SC": {
2699
+ "accuracy": 0.9875,
2700
+ "count": 320
2701
+ },
2702
+ "SS": {
2703
+ "accuracy": 1.0,
2704
+ "count": 56
2705
+ },
2706
+ "UC": {
2707
+ "accuracy": 0.9697542533081286,
2708
+ "count": 529
2709
+ },
2710
+ "US": {
2711
+ "accuracy": 1.0,
2712
+ "count": 48
2713
+ }
2714
+ }
2715
+ },
2716
+ "add_C3": {
2717
+ "full_accuracy": 0.57,
2718
+ "n_examples": 100,
2719
+ "per_subtask": {
2720
+ "SA": {
2721
+ "accuracy": 1.0,
2722
+ "count": 300
2723
+ },
2724
+ "SC": {
2725
+ "accuracy": 1.0,
2726
+ "count": 100
2727
+ },
2728
+ "UC": {
2729
+ "accuracy": 0.7927461139896373,
2730
+ "count": 193
2731
+ },
2732
+ "US": {
2733
+ "accuracy": 0.9065420560747663,
2734
+ "count": 107
2735
+ }
2736
+ }
2737
+ },
2738
+ "add_C4": {
2739
+ "full_accuracy": 0.66,
2740
+ "n_examples": 100,
2741
+ "per_subtask": {
2742
+ "SA": {
2743
+ "accuracy": 1.0,
2744
+ "count": 200
2745
+ },
2746
+ "SC": {
2747
+ "accuracy": 1.0,
2748
+ "count": 100
2749
+ },
2750
+ "UC": {
2751
+ "accuracy": 0.890625,
2752
+ "count": 256
2753
+ },
2754
+ "US": {
2755
+ "accuracy": 0.8819444444444444,
2756
+ "count": 144
2757
+ }
2758
+ }
2759
+ },
2760
+ "add_C5": {
2761
+ "full_accuracy": 0.47,
2762
+ "n_examples": 100,
2763
+ "per_subtask": {
2764
+ "SA": {
2765
+ "accuracy": 1.0,
2766
+ "count": 100
2767
+ },
2768
+ "SC": {
2769
+ "accuracy": 1.0,
2770
+ "count": 100
2771
+ },
2772
+ "UC": {
2773
+ "accuracy": 0.8169934640522876,
2774
+ "count": 306
2775
+ },
2776
+ "US": {
2777
+ "accuracy": 0.845360824742268,
2778
+ "count": 194
2779
+ }
2780
+ }
2781
+ },
2782
+ "add_C6": {
2783
+ "full_accuracy": 0.61,
2784
+ "n_examples": 100,
2785
+ "per_subtask": {
2786
+ "SC": {
2787
+ "accuracy": 1.0,
2788
+ "count": 100
2789
+ },
2790
+ "UC": {
2791
+ "accuracy": 0.8934426229508197,
2792
+ "count": 366
2793
+ },
2794
+ "US": {
2795
+ "accuracy": 0.9401709401709402,
2796
+ "count": 234
2797
+ }
2798
+ }
2799
+ },
2800
+ "sub_M0": {
2801
+ "full_accuracy": 0.89,
2802
+ "n_examples": 100,
2803
+ "per_subtask": {
2804
+ "MD": {
2805
+ "accuracy": 0.9816971713810316,
2806
+ "count": 601
2807
+ },
2808
+ "ME": {
2809
+ "accuracy": 0.98989898989899,
2810
+ "count": 99
2811
+ }
2812
+ }
2813
+ },
2814
+ "sub_M1": {
2815
+ "full_accuracy": 0.85,
2816
+ "n_examples": 100,
2817
+ "per_subtask": {
2818
+ "MD": {
2819
+ "accuracy": 0.985663082437276,
2820
+ "count": 279
2821
+ },
2822
+ "MB": {
2823
+ "accuracy": 0.9724137931034482,
2824
+ "count": 145
2825
+ },
2826
+ "ME": {
2827
+ "accuracy": 0.9583333333333334,
2828
+ "count": 24
2829
+ },
2830
+ "UB": {
2831
+ "accuracy": 0.9722222222222222,
2832
+ "count": 252
2833
+ }
2834
+ }
2835
+ },
2836
+ "sub_M2": {
2837
+ "full_accuracy": 0.67,
2838
+ "n_examples": 100,
2839
+ "per_subtask": {
2840
+ "MD": {
2841
+ "accuracy": 0.9812206572769953,
2842
+ "count": 213
2843
+ },
2844
+ "MB": {
2845
+ "accuracy": 0.9557522123893806,
2846
+ "count": 113
2847
+ },
2848
+ "ME": {
2849
+ "accuracy": 0.9647058823529412,
2850
+ "count": 85
2851
+ },
2852
+ "UB": {
2853
+ "accuracy": 0.8895027624309392,
2854
+ "count": 181
2855
+ },
2856
+ "UD": {
2857
+ "accuracy": 0.9629629629629629,
2858
+ "count": 108
2859
+ }
2860
+ }
2861
+ },
2862
+ "sub_M3": {
2863
+ "full_accuracy": 0.3,
2864
+ "n_examples": 100,
2865
+ "per_subtask": {
2866
+ "MD": {
2867
+ "accuracy": 0.9888268156424581,
2868
+ "count": 179
2869
+ },
2870
+ "MB": {
2871
+ "accuracy": 0.970873786407767,
2872
+ "count": 103
2873
+ },
2874
+ "ME": {
2875
+ "accuracy": 1.0,
2876
+ "count": 56
2877
+ },
2878
+ "UB": {
2879
+ "accuracy": 0.6174496644295302,
2880
+ "count": 149
2881
+ },
2882
+ "UD": {
2883
+ "accuracy": 0.8826291079812206,
2884
+ "count": 213
2885
+ }
2886
+ }
2887
+ },
2888
+ "sub_M4": {
2889
+ "full_accuracy": 0.1,
2890
+ "n_examples": 100,
2891
+ "per_subtask": {
2892
+ "MD": {
2893
+ "accuracy": 1.0,
2894
+ "count": 200
2895
+ },
2896
+ "MB": {
2897
+ "accuracy": 1.0,
2898
+ "count": 100
2899
+ },
2900
+ "UB": {
2901
+ "accuracy": 0.57,
2902
+ "count": 100
2903
+ },
2904
+ "UD": {
2905
+ "accuracy": 0.5366666666666666,
2906
+ "count": 300
2907
+ }
2908
+ }
2909
+ },
2910
+ "sub_M5": {
2911
+ "full_accuracy": 0.09,
2912
+ "n_examples": 100,
2913
+ "per_subtask": {
2914
+ "MD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 100
2917
+ },
2918
+ "MB": {
2919
+ "accuracy": 1.0,
2920
+ "count": 100
2921
+ },
2922
+ "UB": {
2923
+ "accuracy": 0.58,
2924
+ "count": 100
2925
+ },
2926
+ "UD": {
2927
+ "accuracy": 0.4375,
2928
+ "count": 400
2929
+ }
2930
+ }
2931
+ },
2932
+ "sub_random": {
2933
+ "full_accuracy": 0.84,
2934
+ "n_examples": 200,
2935
+ "per_subtask": {
2936
+ "MD": {
2937
+ "accuracy": 0.9833333333333333,
2938
+ "count": 600
2939
+ },
2940
+ "MB": {
2941
+ "accuracy": 0.9887640449438202,
2942
+ "count": 267
2943
+ },
2944
+ "ME": {
2945
+ "accuracy": 1.0,
2946
+ "count": 53
2947
+ },
2948
+ "UB": {
2949
+ "accuracy": 0.9567198177676538,
2950
+ "count": 439
2951
+ },
2952
+ "UD": {
2953
+ "accuracy": 0.975609756097561,
2954
+ "count": 41
2955
+ }
2956
+ }
2957
+ },
2958
+ "sub_B3": {
2959
+ "full_accuracy": 0.62,
2960
+ "n_examples": 100,
2961
+ "per_subtask": {
2962
+ "MD": {
2963
+ "accuracy": 0.9933333333333333,
2964
+ "count": 300
2965
+ },
2966
+ "MB": {
2967
+ "accuracy": 1.0,
2968
+ "count": 100
2969
+ },
2970
+ "UB": {
2971
+ "accuracy": 0.8477157360406091,
2972
+ "count": 197
2973
+ },
2974
+ "UD": {
2975
+ "accuracy": 0.7961165048543689,
2976
+ "count": 103
2977
+ }
2978
+ }
2979
+ },
2980
+ "sub_B4": {
2981
+ "full_accuracy": 0.55,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "MD": {
2985
+ "accuracy": 1.0,
2986
+ "count": 200
2987
+ },
2988
+ "MB": {
2989
+ "accuracy": 1.0,
2990
+ "count": 100
2991
+ },
2992
+ "UB": {
2993
+ "accuracy": 0.8502024291497976,
2994
+ "count": 247
2995
+ },
2996
+ "UD": {
2997
+ "accuracy": 0.7908496732026143,
2998
+ "count": 153
2999
+ }
3000
+ }
3001
+ },
3002
+ "sub_B5": {
3003
+ "full_accuracy": 0.49,
3004
+ "n_examples": 100,
3005
+ "per_subtask": {
3006
+ "MD": {
3007
+ "accuracy": 1.0,
3008
+ "count": 100
3009
+ },
3010
+ "MB": {
3011
+ "accuracy": 1.0,
3012
+ "count": 100
3013
+ },
3014
+ "UB": {
3015
+ "accuracy": 0.8489932885906041,
3016
+ "count": 298
3017
+ },
3018
+ "UD": {
3019
+ "accuracy": 0.8465346534653465,
3020
+ "count": 202
3021
+ }
3022
+ }
3023
+ }
3024
+ },
3025
+ "summary": {
3026
+ "overall_accuracy": 0.5979166666666667,
3027
+ "total_examples": 2400,
3028
+ "n_splits": 22
3029
+ }
3030
+ },
3031
+ "sorl_eval": {
3032
+ "config": {
3033
+ "ops": "add_sub",
3034
+ "K": 1,
3035
+ "mode": "sorl",
3036
+ "n_digits": 6,
3037
+ "n_per_split": 100
3038
+ },
3039
+ "splits": {
3040
+ "add_S0": {
3041
+ "full_accuracy": 0.99,
3042
+ "n_examples": 100,
3043
+ "per_subtask": {
3044
+ "SA": {
3045
+ "accuracy": 0.9983471074380166,
3046
+ "count": 605
3047
+ },
3048
+ "SS": {
3049
+ "accuracy": 1.0,
3050
+ "count": 95
3051
+ }
3052
+ }
3053
+ },
3054
+ "add_S1": {
3055
+ "full_accuracy": 0.95,
3056
+ "n_examples": 100,
3057
+ "per_subtask": {
3058
+ "SA": {
3059
+ "accuracy": 1.0,
3060
+ "count": 204
3061
+ },
3062
+ "SC": {
3063
+ "accuracy": 0.9940828402366864,
3064
+ "count": 169
3065
+ },
3066
+ "SS": {
3067
+ "accuracy": 1.0,
3068
+ "count": 31
3069
+ },
3070
+ "UC": {
3071
+ "accuracy": 0.9864864864864865,
3072
+ "count": 296
3073
+ }
3074
+ }
3075
+ },
3076
+ "add_S2": {
3077
+ "full_accuracy": 0.87,
3078
+ "n_examples": 100,
3079
+ "per_subtask": {
3080
+ "SA": {
3081
+ "accuracy": 0.9938650306748467,
3082
+ "count": 163
3083
+ },
3084
+ "SC": {
3085
+ "accuracy": 0.9769230769230769,
3086
+ "count": 130
3087
+ },
3088
+ "SS": {
3089
+ "accuracy": 1.0,
3090
+ "count": 87
3091
+ },
3092
+ "UC": {
3093
+ "accuracy": 0.9556650246305419,
3094
+ "count": 203
3095
+ },
3096
+ "US": {
3097
+ "accuracy": 1.0,
3098
+ "count": 117
3099
+ }
3100
+ }
3101
+ },
3102
+ "add_S3": {
3103
+ "full_accuracy": 0.66,
3104
+ "n_examples": 100,
3105
+ "per_subtask": {
3106
+ "SA": {
3107
+ "accuracy": 0.9917355371900827,
3108
+ "count": 121
3109
+ },
3110
+ "SC": {
3111
+ "accuracy": 0.9917355371900827,
3112
+ "count": 121
3113
+ },
3114
+ "SS": {
3115
+ "accuracy": 0.9795918367346939,
3116
+ "count": 49
3117
+ },
3118
+ "UC": {
3119
+ "accuracy": 0.8387096774193549,
3120
+ "count": 186
3121
+ },
3122
+ "US": {
3123
+ "accuracy": 0.9506726457399103,
3124
+ "count": 223
3125
+ }
3126
+ }
3127
+ },
3128
+ "add_S4": {
3129
+ "full_accuracy": 0.56,
3130
+ "n_examples": 100,
3131
+ "per_subtask": {
3132
+ "SA": {
3133
+ "accuracy": 1.0,
3134
+ "count": 104
3135
+ },
3136
+ "SC": {
3137
+ "accuracy": 1.0,
3138
+ "count": 106
3139
+ },
3140
+ "SS": {
3141
+ "accuracy": 1.0,
3142
+ "count": 23
3143
+ },
3144
+ "UC": {
3145
+ "accuracy": 0.7625,
3146
+ "count": 160
3147
+ },
3148
+ "US": {
3149
+ "accuracy": 0.8697068403908795,
3150
+ "count": 307
3151
+ }
3152
+ }
3153
+ },
3154
+ "add_S5": {
3155
+ "full_accuracy": 0.18,
3156
+ "n_examples": 100,
3157
+ "per_subtask": {
3158
+ "SA": {
3159
+ "accuracy": 1.0,
3160
+ "count": 100
3161
+ },
3162
+ "SC": {
3163
+ "accuracy": 1.0,
3164
+ "count": 100
3165
+ },
3166
+ "UC": {
3167
+ "accuracy": 0.43,
3168
+ "count": 100
3169
+ },
3170
+ "US": {
3171
+ "accuracy": 0.5775,
3172
+ "count": 400
3173
+ }
3174
+ }
3175
+ },
3176
+ "add_S6": {
3177
+ "full_accuracy": 0.32,
3178
+ "n_examples": 100,
3179
+ "per_subtask": {
3180
+ "SC": {
3181
+ "accuracy": 1.0,
3182
+ "count": 100
3183
+ },
3184
+ "UC": {
3185
+ "accuracy": 0.53,
3186
+ "count": 100
3187
+ },
3188
+ "US": {
3189
+ "accuracy": 0.632,
3190
+ "count": 500
3191
+ }
3192
+ }
3193
+ },
3194
+ "add_random": {
3195
+ "full_accuracy": 0.92,
3196
+ "n_examples": 200,
3197
+ "per_subtask": {
3198
+ "SA": {
3199
+ "accuracy": 0.9865771812080537,
3200
+ "count": 447
3201
+ },
3202
+ "SC": {
3203
+ "accuracy": 0.996875,
3204
+ "count": 320
3205
+ },
3206
+ "SS": {
3207
+ "accuracy": 1.0,
3208
+ "count": 56
3209
+ },
3210
+ "UC": {
3211
+ "accuracy": 0.9829867674858223,
3212
+ "count": 529
3213
+ },
3214
+ "US": {
3215
+ "accuracy": 0.9791666666666666,
3216
+ "count": 48
3217
+ }
3218
+ }
3219
+ },
3220
+ "add_C3": {
3221
+ "full_accuracy": 0.65,
3222
+ "n_examples": 100,
3223
+ "per_subtask": {
3224
+ "SA": {
3225
+ "accuracy": 1.0,
3226
+ "count": 300
3227
+ },
3228
+ "SC": {
3229
+ "accuracy": 1.0,
3230
+ "count": 100
3231
+ },
3232
+ "UC": {
3233
+ "accuracy": 0.8290155440414507,
3234
+ "count": 193
3235
+ },
3236
+ "US": {
3237
+ "accuracy": 0.9065420560747663,
3238
+ "count": 107
3239
+ }
3240
+ }
3241
+ },
3242
+ "add_C4": {
3243
+ "full_accuracy": 0.72,
3244
+ "n_examples": 100,
3245
+ "per_subtask": {
3246
+ "SA": {
3247
+ "accuracy": 1.0,
3248
+ "count": 200
3249
+ },
3250
+ "SC": {
3251
+ "accuracy": 1.0,
3252
+ "count": 100
3253
+ },
3254
+ "UC": {
3255
+ "accuracy": 0.91015625,
3256
+ "count": 256
3257
+ },
3258
+ "US": {
3259
+ "accuracy": 0.8888888888888888,
3260
+ "count": 144
3261
+ }
3262
+ }
3263
+ },
3264
+ "add_C5": {
3265
+ "full_accuracy": 0.69,
3266
+ "n_examples": 100,
3267
+ "per_subtask": {
3268
+ "SA": {
3269
+ "accuracy": 1.0,
3270
+ "count": 100
3271
+ },
3272
+ "SC": {
3273
+ "accuracy": 1.0,
3274
+ "count": 100
3275
+ },
3276
+ "UC": {
3277
+ "accuracy": 0.9052287581699346,
3278
+ "count": 306
3279
+ },
3280
+ "US": {
3281
+ "accuracy": 0.8969072164948454,
3282
+ "count": 194
3283
+ }
3284
+ }
3285
+ },
3286
+ "add_C6": {
3287
+ "full_accuracy": 0.72,
3288
+ "n_examples": 100,
3289
+ "per_subtask": {
3290
+ "SC": {
3291
+ "accuracy": 1.0,
3292
+ "count": 100
3293
+ },
3294
+ "UC": {
3295
+ "accuracy": 0.9234972677595629,
3296
+ "count": 366
3297
+ },
3298
+ "US": {
3299
+ "accuracy": 0.9572649572649573,
3300
+ "count": 234
3301
+ }
3302
+ }
3303
+ },
3304
+ "sub_M0": {
3305
+ "full_accuracy": 0.86,
3306
+ "n_examples": 100,
3307
+ "per_subtask": {
3308
+ "MD": {
3309
+ "accuracy": 0.9767054908485857,
3310
+ "count": 601
3311
+ },
3312
+ "ME": {
3313
+ "accuracy": 0.9797979797979798,
3314
+ "count": 99
3315
+ }
3316
+ }
3317
+ },
3318
+ "sub_M1": {
3319
+ "full_accuracy": 0.91,
3320
+ "n_examples": 100,
3321
+ "per_subtask": {
3322
+ "MD": {
3323
+ "accuracy": 0.985663082437276,
3324
+ "count": 279
3325
+ },
3326
+ "MB": {
3327
+ "accuracy": 0.9793103448275862,
3328
+ "count": 145
3329
+ },
3330
+ "ME": {
3331
+ "accuracy": 0.9583333333333334,
3332
+ "count": 24
3333
+ },
3334
+ "UB": {
3335
+ "accuracy": 0.9920634920634921,
3336
+ "count": 252
3337
+ }
3338
+ }
3339
+ },
3340
+ "sub_M2": {
3341
+ "full_accuracy": 0.77,
3342
+ "n_examples": 100,
3343
+ "per_subtask": {
3344
+ "MD": {
3345
+ "accuracy": 0.9812206572769953,
3346
+ "count": 213
3347
+ },
3348
+ "MB": {
3349
+ "accuracy": 0.9823008849557522,
3350
+ "count": 113
3351
+ },
3352
+ "ME": {
3353
+ "accuracy": 1.0,
3354
+ "count": 85
3355
+ },
3356
+ "UB": {
3357
+ "accuracy": 0.9116022099447514,
3358
+ "count": 181
3359
+ },
3360
+ "UD": {
3361
+ "accuracy": 0.9907407407407407,
3362
+ "count": 108
3363
+ }
3364
+ }
3365
+ },
3366
+ "sub_M3": {
3367
+ "full_accuracy": 0.65,
3368
+ "n_examples": 100,
3369
+ "per_subtask": {
3370
+ "MD": {
3371
+ "accuracy": 1.0,
3372
+ "count": 179
3373
+ },
3374
+ "MB": {
3375
+ "accuracy": 0.970873786407767,
3376
+ "count": 103
3377
+ },
3378
+ "ME": {
3379
+ "accuracy": 0.9821428571428571,
3380
+ "count": 56
3381
+ },
3382
+ "UB": {
3383
+ "accuracy": 0.8322147651006712,
3384
+ "count": 149
3385
+ },
3386
+ "UD": {
3387
+ "accuracy": 0.9061032863849765,
3388
+ "count": 213
3389
+ }
3390
+ }
3391
+ },
3392
+ "sub_M4": {
3393
+ "full_accuracy": 0.42,
3394
+ "n_examples": 100,
3395
+ "per_subtask": {
3396
+ "MD": {
3397
+ "accuracy": 1.0,
3398
+ "count": 200
3399
+ },
3400
+ "MB": {
3401
+ "accuracy": 1.0,
3402
+ "count": 100
3403
+ },
3404
+ "UB": {
3405
+ "accuracy": 0.72,
3406
+ "count": 100
3407
+ },
3408
+ "UD": {
3409
+ "accuracy": 0.73,
3410
+ "count": 300
3411
+ }
3412
+ }
3413
+ },
3414
+ "sub_M5": {
3415
+ "full_accuracy": 0.38,
3416
+ "n_examples": 100,
3417
+ "per_subtask": {
3418
+ "MD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 100
3421
+ },
3422
+ "MB": {
3423
+ "accuracy": 1.0,
3424
+ "count": 100
3425
+ },
3426
+ "UB": {
3427
+ "accuracy": 0.67,
3428
+ "count": 100
3429
+ },
3430
+ "UD": {
3431
+ "accuracy": 0.685,
3432
+ "count": 400
3433
+ }
3434
+ }
3435
+ },
3436
+ "sub_random": {
3437
+ "full_accuracy": 0.885,
3438
+ "n_examples": 200,
3439
+ "per_subtask": {
3440
+ "MD": {
3441
+ "accuracy": 0.98,
3442
+ "count": 600
3443
+ },
3444
+ "MB": {
3445
+ "accuracy": 0.9850187265917603,
3446
+ "count": 267
3447
+ },
3448
+ "ME": {
3449
+ "accuracy": 1.0,
3450
+ "count": 53
3451
+ },
3452
+ "UB": {
3453
+ "accuracy": 0.9840546697038725,
3454
+ "count": 439
3455
+ },
3456
+ "UD": {
3457
+ "accuracy": 1.0,
3458
+ "count": 41
3459
+ }
3460
+ }
3461
+ },
3462
+ "sub_B3": {
3463
+ "full_accuracy": 0.76,
3464
+ "n_examples": 100,
3465
+ "per_subtask": {
3466
+ "MD": {
3467
+ "accuracy": 0.99,
3468
+ "count": 300
3469
+ },
3470
+ "MB": {
3471
+ "accuracy": 1.0,
3472
+ "count": 100
3473
+ },
3474
+ "UB": {
3475
+ "accuracy": 0.9137055837563451,
3476
+ "count": 197
3477
+ },
3478
+ "UD": {
3479
+ "accuracy": 0.883495145631068,
3480
+ "count": 103
3481
+ }
3482
+ }
3483
+ },
3484
+ "sub_B4": {
3485
+ "full_accuracy": 0.69,
3486
+ "n_examples": 100,
3487
+ "per_subtask": {
3488
+ "MD": {
3489
+ "accuracy": 1.0,
3490
+ "count": 200
3491
+ },
3492
+ "MB": {
3493
+ "accuracy": 1.0,
3494
+ "count": 100
3495
+ },
3496
+ "UB": {
3497
+ "accuracy": 0.9149797570850202,
3498
+ "count": 247
3499
+ },
3500
+ "UD": {
3501
+ "accuracy": 0.9019607843137255,
3502
+ "count": 153
3503
+ }
3504
+ }
3505
+ },
3506
+ "sub_B5": {
3507
+ "full_accuracy": 0.59,
3508
+ "n_examples": 100,
3509
+ "per_subtask": {
3510
+ "MD": {
3511
+ "accuracy": 1.0,
3512
+ "count": 100
3513
+ },
3514
+ "MB": {
3515
+ "accuracy": 1.0,
3516
+ "count": 100
3517
+ },
3518
+ "UB": {
3519
+ "accuracy": 0.8590604026845637,
3520
+ "count": 298
3521
+ },
3522
+ "UD": {
3523
+ "accuracy": 0.8811881188118812,
3524
+ "count": 202
3525
+ }
3526
+ }
3527
+ }
3528
+ },
3529
+ "summary": {
3530
+ "overall_accuracy": 0.70625,
3531
+ "total_examples": 2400,
3532
+ "n_splits": 22
3533
+ }
3534
+ },
3535
+ "sorl_overall_accuracy": 0.70625,
3536
+ "sft_overall_accuracy": 0.5979166666666667
3537
+ }
add_sub_sorl_v1_abs10_K1_100K_1L3H510d/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:05915d1d3abf503303872b835b197cd7e1c25afe84a5656f0a395715ce75f417
3
+ size 634679036
add_sub_sorl_v1_abs10_K1_100K_1L3H510d/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 1,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 4e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 10,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 1562,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs10_K1_100K_1L3H510d",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 1,
61
+ "n_head": 3,
62
+ "n_embd": 510,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 10,
65
+ "dataset_size": 100000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 158593426,
71
+ "run_name": "add_sub_sorl_v1_abs10_K1_100K_1L3H510d",
72
+ "git_commit": "f447da529caceac8c7d256cbb2cd185cbc50feac",
73
+ "timestamp": "2026-04-12T09:52:22.660543+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "u4e5s4m7",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/u4e5s4m7",
81
+ "final_accuracy": 0.70625,
82
+ "sft_accuracy": 0.5979166666666667,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }