amirali1985 commited on
Commit
e66cf5f
·
verified ·
1 Parent(s): 220719c

Upload add_sub_sorl_v1_abs100_K1_100K

Browse files
add_sub_sorl_v1_abs100_K1_100K/config.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 510,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 2040,
15
+ "layer_types": [
16
+ "full_attention",
17
+ "full_attention"
18
+ ],
19
+ "max_position_embeddings": 128,
20
+ "max_window_layers": 28,
21
+ "model_type": "qwen3",
22
+ "num_attention_heads": 3,
23
+ "num_hidden_layers": 2,
24
+ "num_key_value_heads": 3,
25
+ "pad_token_id": null,
26
+ "rms_norm_eps": 1e-06,
27
+ "rope_parameters": {
28
+ "rope_theta": 10000.0,
29
+ "rope_type": "default"
30
+ },
31
+ "sliding_window": null,
32
+ "tie_word_embeddings": false,
33
+ "transformers_version": "5.5.0",
34
+ "use_cache": true,
35
+ "use_sliding_window": false,
36
+ "vocab_size": 151744
37
+ }
add_sub_sorl_v1_abs100_K1_100K/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs100_K1_100K/metrics.json ADDED
@@ -0,0 +1,3537 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 800,
20
+ 850,
21
+ 900,
22
+ 950,
23
+ 1000,
24
+ 1050,
25
+ 1100,
26
+ 1150,
27
+ 1200,
28
+ 1250,
29
+ 1300,
30
+ 1350,
31
+ 1400,
32
+ 1450,
33
+ 1500,
34
+ 1550,
35
+ 1613,
36
+ 1663,
37
+ 1713,
38
+ 1763,
39
+ 1813,
40
+ 1863,
41
+ 1913,
42
+ 1963,
43
+ 2013,
44
+ 2063,
45
+ 2113,
46
+ 2163,
47
+ 2213,
48
+ 2263,
49
+ 2313,
50
+ 2363,
51
+ 2413,
52
+ 2463,
53
+ 2513,
54
+ 2563,
55
+ 2613,
56
+ 2663,
57
+ 2713,
58
+ 2763,
59
+ 2813,
60
+ 2863,
61
+ 2913,
62
+ 2963,
63
+ 3013,
64
+ 3063,
65
+ 3113,
66
+ 3176,
67
+ 3226,
68
+ 3276,
69
+ 3326,
70
+ 3376,
71
+ 3426,
72
+ 3476,
73
+ 3526,
74
+ 3576,
75
+ 3626,
76
+ 3676,
77
+ 3726,
78
+ 3776,
79
+ 3826,
80
+ 3876,
81
+ 3926,
82
+ 3976,
83
+ 4026,
84
+ 4076,
85
+ 4126,
86
+ 4176,
87
+ 4226,
88
+ 4276,
89
+ 4326,
90
+ 4376,
91
+ 4426,
92
+ 4476,
93
+ 4526,
94
+ 4576,
95
+ 4626,
96
+ 4676,
97
+ 4739,
98
+ 4789,
99
+ 4839,
100
+ 4889,
101
+ 4939,
102
+ 4989,
103
+ 5039,
104
+ 5089,
105
+ 5139,
106
+ 5189,
107
+ 5239,
108
+ 5289,
109
+ 5339,
110
+ 5389,
111
+ 5439,
112
+ 5489,
113
+ 5539,
114
+ 5589,
115
+ 5639,
116
+ 5689,
117
+ 5739,
118
+ 5789,
119
+ 5839,
120
+ 5889,
121
+ 5939,
122
+ 5989,
123
+ 6039,
124
+ 6089,
125
+ 6139,
126
+ 6189,
127
+ 6239,
128
+ 6302,
129
+ 6352,
130
+ 6402,
131
+ 6452,
132
+ 6502,
133
+ 6552,
134
+ 6602,
135
+ 6652,
136
+ 6702,
137
+ 6752,
138
+ 6802,
139
+ 6852,
140
+ 6902,
141
+ 6952,
142
+ 7002,
143
+ 7052,
144
+ 7102,
145
+ 7152,
146
+ 7202,
147
+ 7252,
148
+ 7302,
149
+ 7352,
150
+ 7402,
151
+ 7452,
152
+ 7502,
153
+ 7552,
154
+ 7602,
155
+ 7652,
156
+ 7702,
157
+ 7752,
158
+ 7802,
159
+ 7865,
160
+ 7915,
161
+ 7965,
162
+ 8015,
163
+ 8065,
164
+ 8115,
165
+ 8165,
166
+ 8215,
167
+ 8265,
168
+ 8315,
169
+ 8365,
170
+ 8415,
171
+ 8465,
172
+ 8515,
173
+ 8565,
174
+ 8615,
175
+ 8665,
176
+ 8715,
177
+ 8765,
178
+ 8815,
179
+ 8865,
180
+ 8915,
181
+ 8965,
182
+ 9015,
183
+ 9065,
184
+ 9115,
185
+ 9165,
186
+ 9215,
187
+ 9265,
188
+ 9315,
189
+ 9365,
190
+ 9428,
191
+ 9478,
192
+ 9528,
193
+ 9578,
194
+ 9628,
195
+ 9678,
196
+ 9728,
197
+ 9778,
198
+ 9828,
199
+ 9878,
200
+ 9928,
201
+ 9978,
202
+ 10028,
203
+ 10078,
204
+ 10128,
205
+ 10178,
206
+ 10228,
207
+ 10278,
208
+ 10328,
209
+ 10378,
210
+ 10428,
211
+ 10478,
212
+ 10528,
213
+ 10578,
214
+ 10628,
215
+ 10678,
216
+ 10728,
217
+ 10778,
218
+ 10828,
219
+ 10878,
220
+ 10928,
221
+ 10991,
222
+ 11041,
223
+ 11091,
224
+ 11141,
225
+ 11191,
226
+ 11241,
227
+ 11291,
228
+ 11341,
229
+ 11391,
230
+ 11441,
231
+ 11491,
232
+ 11541,
233
+ 11591,
234
+ 11641,
235
+ 11691,
236
+ 11741,
237
+ 11791,
238
+ 11841,
239
+ 11891,
240
+ 11941,
241
+ 11991,
242
+ 12041,
243
+ 12091,
244
+ 12141,
245
+ 12191,
246
+ 12241,
247
+ 12291,
248
+ 12341,
249
+ 12391,
250
+ 12441,
251
+ 12491,
252
+ 12554,
253
+ 12604,
254
+ 12654,
255
+ 12704,
256
+ 12754,
257
+ 12804,
258
+ 12854,
259
+ 12904,
260
+ 12954,
261
+ 13004,
262
+ 13054,
263
+ 13104,
264
+ 13154,
265
+ 13204,
266
+ 13254,
267
+ 13304,
268
+ 13354,
269
+ 13404,
270
+ 13454,
271
+ 13504,
272
+ 13554,
273
+ 13604,
274
+ 13654,
275
+ 13704,
276
+ 13754,
277
+ 13804,
278
+ 13854,
279
+ 13904,
280
+ 13954,
281
+ 14004,
282
+ 14054,
283
+ 14117,
284
+ 14167,
285
+ 14217,
286
+ 14267,
287
+ 14317,
288
+ 14367,
289
+ 14417,
290
+ 14467,
291
+ 14517,
292
+ 14567,
293
+ 14617,
294
+ 14667,
295
+ 14717,
296
+ 14767,
297
+ 14817,
298
+ 14867,
299
+ 14917,
300
+ 14967,
301
+ 15017,
302
+ 15067,
303
+ 15117,
304
+ 15167,
305
+ 15217,
306
+ 15267,
307
+ 15317,
308
+ 15367,
309
+ 15417,
310
+ 15467,
311
+ 15517,
312
+ 15567,
313
+ 15617
314
+ ],
315
+ "loss": [
316
+ 1.0664606094360352,
317
+ -3.3413729667663574,
318
+ 4.319561004638672,
319
+ 6.777217388153076,
320
+ 5.0598273277282715,
321
+ 3.600525140762329,
322
+ 2.567056179046631,
323
+ 2.4118309020996094,
324
+ 2.431142807006836,
325
+ 1.9818832874298096,
326
+ 1.558206558227539,
327
+ 0.3146878778934479,
328
+ -3.7737298011779785,
329
+ -6.181707859039307,
330
+ -5.083313465118408,
331
+ -3.7771084308624268,
332
+ -2.6182398796081543,
333
+ -2.6247217655181885,
334
+ -2.087367534637451,
335
+ -2.1312968730926514,
336
+ -2.6685807704925537,
337
+ -2.092385768890381,
338
+ -1.7533386945724487,
339
+ -1.2619707584381104,
340
+ -1.3593165874481201,
341
+ -0.9183420538902283,
342
+ -1.6090948581695557,
343
+ -1.1344794034957886,
344
+ -0.8129481077194214,
345
+ -0.939844012260437,
346
+ -1.0884939432144165,
347
+ -0.6228066682815552,
348
+ -0.5494827628135681,
349
+ -0.5973113775253296,
350
+ -0.9492865204811096,
351
+ -0.8527410626411438,
352
+ -0.6668461561203003,
353
+ -0.6200451850891113,
354
+ -0.5056888461112976,
355
+ -1.417230248451233,
356
+ -1.0165972709655762,
357
+ -0.5822110772132874,
358
+ -0.6840647459030151,
359
+ -0.3080425262451172,
360
+ -0.1592114418745041,
361
+ -0.6937429904937744,
362
+ -0.43715211749076843,
363
+ -0.5924221873283386,
364
+ -0.3682578206062317,
365
+ -0.6857794523239136,
366
+ -0.7115035057067871,
367
+ -0.558780312538147,
368
+ -0.6552019715309143,
369
+ -0.26699402928352356,
370
+ -0.37855905294418335,
371
+ -0.8669564127922058,
372
+ -0.2425278127193451,
373
+ -0.5538155436515808,
374
+ -0.20611761510372162,
375
+ -0.29826247692108154,
376
+ -0.2503764033317566,
377
+ -0.22872035205364227,
378
+ -0.292000949382782,
379
+ -0.021833084523677826,
380
+ -0.2050989866256714,
381
+ -0.4219905138015747,
382
+ -0.27638745307922363,
383
+ -0.12598362565040588,
384
+ -0.17885074019432068,
385
+ -0.06159238517284393,
386
+ -0.518576443195343,
387
+ -0.36545059084892273,
388
+ -0.19623753428459167,
389
+ -0.2212906926870346,
390
+ -0.21547932922840118,
391
+ -0.1364957094192505,
392
+ -0.10791955143213272,
393
+ -0.17245277762413025,
394
+ -0.10920217633247375,
395
+ -0.23217836022377014,
396
+ -0.1445857137441635,
397
+ -0.3076881766319275,
398
+ -0.02939470112323761,
399
+ -0.40284401178359985,
400
+ -0.261845201253891,
401
+ -0.3696023225784302,
402
+ -0.09583646804094315,
403
+ -0.13663510978221893,
404
+ -0.1477874517440796,
405
+ -0.2419748157262802,
406
+ -0.20038042962551117,
407
+ -0.12283073365688324,
408
+ -0.4142155647277832,
409
+ -0.05653613805770874,
410
+ -0.12112052738666534,
411
+ -0.4081878364086151,
412
+ -0.22010070085525513,
413
+ -0.02316729724407196,
414
+ -0.2263665497303009,
415
+ -0.05877941474318504,
416
+ -0.06364306807518005,
417
+ -0.11318793147802353,
418
+ -0.028023626655340195,
419
+ -0.09794174879789352,
420
+ -0.10376553982496262,
421
+ 0.007053602486848831,
422
+ -0.1245996430516243,
423
+ -0.04036162048578262,
424
+ -0.0693342387676239,
425
+ -0.06778055429458618,
426
+ -0.09522704780101776,
427
+ -0.0580228790640831,
428
+ -0.15885789692401886,
429
+ -0.11855684965848923,
430
+ -0.0499919131398201,
431
+ 0.03315545618534088,
432
+ 0.0216967910528183,
433
+ -0.05868081748485565,
434
+ 0.013110561296343803,
435
+ 0.006761729717254639,
436
+ -0.10776176303625107,
437
+ 0.03221374377608299,
438
+ -0.04764406755566597,
439
+ 0.038330335170030594,
440
+ -0.11673370003700256,
441
+ 0.025804700329899788,
442
+ -0.0011606067419052124,
443
+ -0.002581719309091568,
444
+ -0.03550297021865845,
445
+ -0.004945486783981323,
446
+ -0.09307838976383209,
447
+ 0.052502214908599854,
448
+ 0.016737405210733414,
449
+ 0.030999882146716118,
450
+ -0.01538512110710144,
451
+ 0.0056137219071388245,
452
+ -0.04343424737453461,
453
+ -0.10714598745107651,
454
+ -0.04261987656354904,
455
+ -0.09053416550159454,
456
+ 0.015999920666217804,
457
+ 0.022900313138961792,
458
+ 0.04075893387198448,
459
+ 0.01324760913848877,
460
+ 0.024834543466567993,
461
+ 0.04116029292345047,
462
+ 0.003218460828065872,
463
+ -0.00864899531006813,
464
+ 0.03551499545574188,
465
+ 0.2832469940185547,
466
+ -0.007751725614070892,
467
+ -0.014847606420516968,
468
+ -0.012988641858100891,
469
+ 0.03155326098203659,
470
+ -0.14025439321994781,
471
+ -0.003313004970550537,
472
+ 0.022897524759173393,
473
+ 0.009539254009723663,
474
+ 0.03127961605787277,
475
+ 0.02400984987616539,
476
+ 0.0077528320252895355,
477
+ 0.03798247128725052,
478
+ 0.04397474601864815,
479
+ 0.001193128526210785,
480
+ 0.0268325787037611,
481
+ 0.02343951165676117,
482
+ 0.03717686980962753,
483
+ 0.007043089717626572,
484
+ -0.08001168072223663,
485
+ -0.03850996494293213,
486
+ 0.03854174539446831,
487
+ 0.06003142148256302,
488
+ 0.029181834310293198,
489
+ 0.002971721813082695,
490
+ 0.03721901774406433,
491
+ 0.028488952666521072,
492
+ 0.03777478262782097,
493
+ 0.04199827089905739,
494
+ -0.07353831827640533,
495
+ -0.017165061086416245,
496
+ -0.014051564037799835,
497
+ 0.047176528722047806,
498
+ -0.031735531985759735,
499
+ 0.03330183029174805,
500
+ 0.025763196870684624,
501
+ -0.12449732422828674,
502
+ 0.011544864624738693,
503
+ 0.0368003286421299,
504
+ 0.027070004492998123,
505
+ 0.007165323942899704,
506
+ 0.01169200986623764,
507
+ -0.11844679713249207,
508
+ 0.0252859964966774,
509
+ 0.03458349034190178,
510
+ 0.04513313248753548,
511
+ 0.03842907026410103,
512
+ 0.012784086167812347,
513
+ 0.03757982328534126,
514
+ 0.02625146508216858,
515
+ 0.04219738394021988,
516
+ 0.02966756373643875,
517
+ 0.03692697361111641,
518
+ 0.030924798920750618,
519
+ 0.04406774789094925,
520
+ 0.03825094550848007,
521
+ 0.03882833942770958,
522
+ 0.03487744182348251,
523
+ -0.01552712731063366,
524
+ 0.030084939673542976,
525
+ -0.014330405741930008,
526
+ 0.027621082961559296,
527
+ 0.028032027184963226,
528
+ -0.0054822154343128204,
529
+ 0.034422580152750015,
530
+ 0.04463361203670502,
531
+ 0.03759485110640526,
532
+ -0.029422812163829803,
533
+ 0.0034063048660755157,
534
+ -0.033259034156799316,
535
+ 0.03872751444578171,
536
+ -0.07967151701450348,
537
+ 0.03483220934867859,
538
+ 0.0353083498775959,
539
+ 0.03346346318721771,
540
+ 0.03018520399928093,
541
+ 0.041694581508636475,
542
+ 0.03257603943347931,
543
+ 0.016950154677033424,
544
+ 0.04556126147508621,
545
+ 0.033820562064647675,
546
+ 0.032700445502996445,
547
+ 0.04396568983793259,
548
+ 0.040629323571920395,
549
+ 0.04463769495487213,
550
+ 0.04389692097902298,
551
+ 0.036039356142282486,
552
+ 0.03656092286109924,
553
+ 0.024959925562143326,
554
+ 0.03547786548733711,
555
+ 0.04309987276792526,
556
+ -0.2355595976114273,
557
+ 0.04199466109275818,
558
+ -0.010916169732809067,
559
+ 0.0388471893966198,
560
+ 0.03349750488996506,
561
+ -0.05913688987493515,
562
+ 0.03664737567305565,
563
+ 0.04117068648338318,
564
+ 0.0402890183031559,
565
+ 0.04501673951745033,
566
+ 0.008626190945506096,
567
+ 0.042667217552661896,
568
+ 0.04110349342226982,
569
+ 0.03789304569363594,
570
+ 0.03443964943289757,
571
+ 0.035775139927864075,
572
+ 0.03979143127799034,
573
+ 0.03474107012152672,
574
+ 0.04315731301903725,
575
+ 0.04772436246275902,
576
+ 0.037727151066064835,
577
+ 0.04630950465798378,
578
+ 0.037069983780384064,
579
+ 0.04996776580810547,
580
+ 0.030258260667324066,
581
+ 0.033165331929922104,
582
+ 0.04709594324231148,
583
+ 0.03257731720805168,
584
+ 0.04514104500412941,
585
+ -0.001954497769474983,
586
+ 0.03856378048658371,
587
+ 0.027972698211669922,
588
+ 0.04287264496088028,
589
+ 0.027901941910386086,
590
+ 0.04109715297818184,
591
+ 0.04156051203608513,
592
+ 0.042257409542798996,
593
+ 0.036409005522727966,
594
+ 0.027354024350643158,
595
+ 0.03842397406697273,
596
+ 0.04734078422188759,
597
+ 0.029766805469989777,
598
+ 0.025336407124996185,
599
+ 0.035672932863235474,
600
+ 0.03978734463453293,
601
+ 0.03317052125930786,
602
+ 0.048309605568647385,
603
+ 0.030048005282878876,
604
+ 0.0386713370680809,
605
+ 0.03928830102086067,
606
+ 0.03497984632849693,
607
+ 0.037059687077999115,
608
+ 0.04475829377770424,
609
+ 0.03695715591311455,
610
+ 0.03803648799657822,
611
+ 0.052076347172260284,
612
+ 0.03751390427350998,
613
+ 0.045421451330184937,
614
+ 0.05091147869825363,
615
+ 0.04010364040732384,
616
+ 0.042153116315603256,
617
+ 0.04285721108317375,
618
+ 0.04198171943426132,
619
+ 0.03703484684228897,
620
+ 0.03774353116750717,
621
+ 0.04692570120096207,
622
+ 0.04007577896118164,
623
+ 0.03525951877236366,
624
+ 0.04413042962551117,
625
+ 0.03911620378494263
626
+ ],
627
+ "base_loss": [
628
+ 11.356718063354492,
629
+ 9.548453330993652,
630
+ 8.050538063049316,
631
+ 6.734401702880859,
632
+ 5.352938175201416,
633
+ 3.368302583694458,
634
+ 2.106759548187256,
635
+ 2.0061068534851074,
636
+ 1.884503960609436,
637
+ 1.8061273097991943,
638
+ 1.8300752639770508,
639
+ 1.7916336059570312,
640
+ 1.9053407907485962,
641
+ 1.7099350690841675,
642
+ 1.4077036380767822,
643
+ 1.1062419414520264,
644
+ 0.8901417851448059,
645
+ 0.7566534876823425,
646
+ 0.6391062140464783,
647
+ 0.587936282157898,
648
+ 0.6264175772666931,
649
+ 0.5220407247543335,
650
+ 0.47252628207206726,
651
+ 0.3897264897823334,
652
+ 0.36327823996543884,
653
+ 0.3192365765571594,
654
+ 0.3505609333515167,
655
+ 0.31324610114097595,
656
+ 0.262179434299469,
657
+ 0.2316390722990036,
658
+ 0.2588884234428406,
659
+ 0.172030970454216,
660
+ 0.16002419590950012,
661
+ 0.15175344049930573,
662
+ 0.1915096938610077,
663
+ 0.19242684543132782,
664
+ 0.15074658393859863,
665
+ 0.1319277584552765,
666
+ 0.11718714982271194,
667
+ 0.22299747169017792,
668
+ 0.17098429799079895,
669
+ 0.13521729409694672,
670
+ 0.13196469843387604,
671
+ 0.12192820012569427,
672
+ 0.10068628937005997,
673
+ 0.13441267609596252,
674
+ 0.08767639100551605,
675
+ 0.11452396959066391,
676
+ 0.12260130792856216,
677
+ 0.1273505985736847,
678
+ 0.1173861026763916,
679
+ 0.10244120657444,
680
+ 0.1153917983174324,
681
+ 0.06762773543596268,
682
+ 0.07422107458114624,
683
+ 0.14140784740447998,
684
+ 0.05382787436246872,
685
+ 0.09128846228122711,
686
+ 0.0552077516913414,
687
+ 0.06387655436992645,
688
+ 0.04824099317193031,
689
+ 0.05535067990422249,
690
+ 0.052386920899152756,
691
+ 0.023149486631155014,
692
+ 0.042323999106884,
693
+ 0.07102709263563156,
694
+ 0.049370042979717255,
695
+ 0.0338006392121315,
696
+ 0.03761451691389084,
697
+ 0.0324096605181694,
698
+ 0.07703180611133575,
699
+ 0.057282786816358566,
700
+ 0.03682002052664757,
701
+ 0.04252305254340172,
702
+ 0.03904692456126213,
703
+ 0.031195538118481636,
704
+ 0.027146385982632637,
705
+ 0.038859087973833084,
706
+ 0.027347158640623093,
707
+ 0.04037249833345413,
708
+ 0.03015303425490856,
709
+ 0.04862061142921448,
710
+ 0.0304709579795599,
711
+ 0.057618219405412674,
712
+ 0.045000575482845306,
713
+ 0.05856044963002205,
714
+ 0.03451954200863838,
715
+ 0.028822746127843857,
716
+ 0.028996935114264488,
717
+ 0.04589473828673363,
718
+ 0.0342138335108757,
719
+ 0.02665300853550434,
720
+ 0.05774456262588501,
721
+ 0.01859527826309204,
722
+ 0.02468334697186947,
723
+ 0.054861124604940414,
724
+ 0.03519606962800026,
725
+ 0.013943672180175781,
726
+ 0.03530536964535713,
727
+ 0.015494288876652718,
728
+ 0.015569107607007027,
729
+ 0.020680949091911316,
730
+ 0.012148085050284863,
731
+ 0.0199408121407032,
732
+ 0.02069663442671299,
733
+ 0.007321435492485762,
734
+ 0.02165074273943901,
735
+ 0.0130686666816473,
736
+ 0.016087787225842476,
737
+ 0.015184404328465462,
738
+ 0.018497738987207413,
739
+ 0.013703889213502407,
740
+ 0.02493109367787838,
741
+ 0.02087731473147869,
742
+ 0.012139363214373589,
743
+ 0.012444247491657734,
744
+ 0.004634774290025234,
745
+ 0.014108766801655293,
746
+ 0.005642027594149113,
747
+ 0.006029900629073381,
748
+ 0.01849067583680153,
749
+ 0.0023466539569199085,
750
+ 0.011180520989000797,
751
+ 0.0020730586256831884,
752
+ 0.01948000304400921,
753
+ 0.00354547007009387,
754
+ 0.006063684821128845,
755
+ 0.006294974125921726,
756
+ 0.010042752139270306,
757
+ 0.006284511182457209,
758
+ 0.016984393820166588,
759
+ 0.0005151968216523528,
760
+ 0.005874189548194408,
761
+ 0.002556562889367342,
762
+ 0.007727435324341059,
763
+ 0.004789342638105154,
764
+ 0.009922766126692295,
765
+ 0.01741747185587883,
766
+ 0.010859185829758644,
767
+ 0.014621319249272346,
768
+ 0.0053294082172214985,
769
+ 0.003602638142183423,
770
+ 0.001870386186055839,
771
+ 0.003925827797502279,
772
+ 0.00225110468454659,
773
+ 0.0007947799167595804,
774
+ 0.005947140511125326,
775
+ 0.005848655942827463,
776
+ 0.000934421201236546,
777
+ 0.004510719329118729,
778
+ 0.0054958276450634,
779
+ 0.0063496241346001625,
780
+ 0.006627290975302458,
781
+ 0.0013636410003528,
782
+ 0.020111961290240288,
783
+ 0.005918459035456181,
784
+ 0.0018504727631807327,
785
+ 0.004286831710487604,
786
+ 0.0014447551220655441,
787
+ 0.00251778750680387,
788
+ 0.005922266747802496,
789
+ 0.001949518104083836,
790
+ 0.00017086350999306887,
791
+ 0.004415383096784353,
792
+ 0.0023110867477953434,
793
+ 0.0024018683470785618,
794
+ 0.0007134453626349568,
795
+ 0.003895906265825033,
796
+ 0.01359934639185667,
797
+ 0.009816022589802742,
798
+ 0.0012424623128026724,
799
+ 0.00011585997708607465,
800
+ 0.002145789796486497,
801
+ 0.003909310791641474,
802
+ 0.0012203685473650694,
803
+ 0.0012569633545354009,
804
+ 0.0003893454559147358,
805
+ 0.0010422799969092011,
806
+ 0.012871927581727505,
807
+ 0.005944870412349701,
808
+ 0.006965217646211386,
809
+ 0.0003388803161215037,
810
+ 0.007897102274000645,
811
+ 0.00036106299376115203,
812
+ 0.002639312297105789,
813
+ 0.0184232909232378,
814
+ 0.0029910888988524675,
815
+ 0.001064358395524323,
816
+ 0.0013742492301389575,
817
+ 0.00443993927910924,
818
+ 0.004003556910902262,
819
+ 0.01853915862739086,
820
+ 0.0015371607150882483,
821
+ 0.0007549685542471707,
822
+ 0.00019772537052631378,
823
+ 0.0005279059987515211,
824
+ 0.003952490631490946,
825
+ 0.0001886456593638286,
826
+ 0.0013548994902521372,
827
+ 0.0002484374272171408,
828
+ 0.001224033534526825,
829
+ 0.000899218488484621,
830
+ 0.0011443572584539652,
831
+ 0.0004370952083263546,
832
+ 0.0003863008168991655,
833
+ 0.0004016864695586264,
834
+ 0.0007308078929781914,
835
+ 0.005567010026425123,
836
+ 0.0004824791685678065,
837
+ 0.005473974160850048,
838
+ 0.0019608349539339542,
839
+ 0.0005263011553324759,
840
+ 0.0048079644329845905,
841
+ 0.0006183158257044852,
842
+ 0.00026801222702488303,
843
+ 0.00034555824822746217,
844
+ 0.008479134179651737,
845
+ 0.0048667266964912415,
846
+ 0.007753435522317886,
847
+ 0.0003176348109263927,
848
+ 0.014168992638587952,
849
+ 0.0001468626142013818,
850
+ 7.616518996655941e-05,
851
+ 0.00032010304857976735,
852
+ 0.0005761987413279712,
853
+ 9.959381713997573e-05,
854
+ 9.804391447687522e-05,
855
+ 0.0020625346805900335,
856
+ 0.00025049876421689987,
857
+ 0.00021074242249596864,
858
+ 9.36376818572171e-05,
859
+ 0.0003631088475231081,
860
+ 3.97357543988619e-05,
861
+ 0.000123509656987153,
862
+ 0.0001848286483436823,
863
+ 0.0001930765138240531,
864
+ 0.0003585308731999248,
865
+ 0.0008728955290280282,
866
+ 0.00021700674551539123,
867
+ 0.00012918005813844502,
868
+ 0.02983257733285427,
869
+ 8.506327867507935e-05,
870
+ 0.004950170870870352,
871
+ 2.7652580683934502e-05,
872
+ 0.0001985271373996511,
873
+ 0.01116181630641222,
874
+ 0.0003188523987773806,
875
+ 2.707611747609917e-05,
876
+ 0.00014825700782239437,
877
+ 5.672861516359262e-05,
878
+ 0.003525350010022521,
879
+ 5.510632036020979e-05,
880
+ 8.169674401869997e-05,
881
+ 4.743336103274487e-05,
882
+ 9.559605678077787e-05,
883
+ 5.7907349400920793e-05,
884
+ 0.0001101468806155026,
885
+ 1.2482322745199781e-05,
886
+ 2.726751336012967e-05,
887
+ 0.0003054686530958861,
888
+ 5.505143053596839e-05,
889
+ 7.231323979794979e-05,
890
+ 3.982451744377613e-05,
891
+ 1.134302237915108e-05,
892
+ 0.00015206226089503616,
893
+ 9.228569979313761e-05,
894
+ 2.819934525177814e-05,
895
+ 0.00035051675513386726,
896
+ 2.4978022338473238e-05,
897
+ 0.0033743774984031916,
898
+ 0.0009495074627920985,
899
+ 0.0014125375309959054,
900
+ 4.378549783723429e-05,
901
+ 0.0001345476193819195,
902
+ 0.00030832309857942164,
903
+ 9.463964488531929e-06,
904
+ 1.627849997021258e-05,
905
+ 4.235278538544662e-05,
906
+ 1.0411609764560126e-05,
907
+ 1.7130547348642722e-05,
908
+ 0.00014150490460451692,
909
+ 5.2003684686496854e-05,
910
+ 0.0006301828543655574,
911
+ 2.61843506450532e-05,
912
+ 0.00011875682685058564,
913
+ 2.3932296244311146e-05,
914
+ 9.978181878977921e-06,
915
+ 9.8342261480866e-06,
916
+ 1.397290270688245e-05,
917
+ 9.339009920950048e-06,
918
+ 1.2037357009830885e-05,
919
+ 1.1952404747717083e-05,
920
+ 1.847141538746655e-05,
921
+ 1.0864380783459637e-05,
922
+ 1.1463607734185643e-05,
923
+ 9.38671928452095e-06,
924
+ 8.356297257705592e-06,
925
+ 1.0832836778718047e-05,
926
+ 1.1720329894160386e-05,
927
+ 7.603311132697854e-06,
928
+ 8.084125511231832e-06,
929
+ 6.3722632148710545e-06,
930
+ 3.142891364404932e-05,
931
+ 3.092598490184173e-05,
932
+ 1.2181319107185118e-05,
933
+ 8.359259481949266e-06,
934
+ 8.379879545827862e-06,
935
+ 8.524321856384631e-06,
936
+ 6.200567895575659e-06,
937
+ 8.25512961455388e-06
938
+ ],
939
+ "info_loss": [
940
+ -1.6414213180541992,
941
+ -1.816573143005371,
942
+ -0.7889370918273926,
943
+ -0.2980337142944336,
944
+ -0.21735620498657227,
945
+ -0.08219265937805176,
946
+ -0.042023420333862305,
947
+ -0.044944167137145996,
948
+ -0.029181957244873047,
949
+ -0.06557989120483398,
950
+ -0.11028933525085449,
951
+ -0.23153579235076904,
952
+ -0.6512768268585205,
953
+ -0.8737664818763733,
954
+ -0.7344223856925964,
955
+ -0.5723384618759155,
956
+ -0.43505167961120605,
957
+ -0.4228346347808838,
958
+ -0.35660985112190247,
959
+ -0.35535603761672974,
960
+ -0.412447452545166,
961
+ -0.3439449667930603,
962
+ -0.30313801765441895,
963
+ -0.24534408748149872,
964
+ -0.24880200624465942,
965
+ -0.1962471902370453,
966
+ -0.26602083444595337,
967
+ -0.2126409113407135,
968
+ -0.17115969955921173,
969
+ -0.17923790216445923,
970
+ -0.19013988971710205,
971
+ -0.1312088966369629,
972
+ -0.120570108294487,
973
+ -0.12261860817670822,
974
+ -0.15998166799545288,
975
+ -0.14819633960723877,
976
+ -0.1236516684293747,
977
+ -0.1143304854631424,
978
+ -0.09946946799755096,
979
+ -0.20064859092235565,
980
+ -0.15405519306659698,
981
+ -0.10555221140384674,
982
+ -0.11712271720170975,
983
+ -0.07605809718370438,
984
+ -0.05881492793560028,
985
+ -0.11524166166782379,
986
+ -0.08056307584047318,
987
+ -0.10071855783462524,
988
+ -0.0774831622838974,
989
+ -0.10770256817340851,
990
+ -0.11050382256507874,
991
+ -0.09081194549798965,
992
+ -0.10249423235654831,
993
+ -0.05746406689286232,
994
+ -0.06627097725868225,
995
+ -0.12268416583538055,
996
+ -0.051491059362888336,
997
+ -0.08570364117622375,
998
+ -0.0470566563308239,
999
+ -0.05305585265159607,
1000
+ -0.04705703631043434,
1001
+ -0.04633725434541702,
1002
+ -0.051419906318187714,
1003
+ -0.02182532660663128,
1004
+ -0.03974014148116112,
1005
+ -0.06615376472473145,
1006
+ -0.048380088061094284,
1007
+ -0.031568992882966995,
1008
+ -0.036478251218795776,
1009
+ -0.024104811251163483,
1010
+ -0.07487587630748749,
1011
+ -0.05639788880944252,
1012
+ -0.03652379661798477,
1013
+ -0.03925654664635658,
1014
+ -0.03846259415149689,
1015
+ -0.030123775824904442,
1016
+ -0.026287047192454338,
1017
+ -0.03424815461039543,
1018
+ -0.026972325518727303,
1019
+ -0.039360810071229935,
1020
+ -0.029717199504375458,
1021
+ -0.04742119833827019,
1022
+ -0.017811279743909836,
1023
+ -0.05732689052820206,
1024
+ -0.04290097951889038,
1025
+ -0.0537954680621624,
1026
+ -0.024144519120454788,
1027
+ -0.028509942814707756,
1028
+ -0.02772676944732666,
1029
+ -0.03953155130147934,
1030
+ -0.03390685096383095,
1031
+ -0.0245954766869545,
1032
+ -0.05754601210355759,
1033
+ -0.018413051962852478,
1034
+ -0.02457304298877716,
1035
+ -0.05468747764825821,
1036
+ -0.03461487963795662,
1037
+ -0.01196512021124363,
1038
+ -0.03521433100104332,
1039
+ -0.015416179783642292,
1040
+ -0.015413844957947731,
1041
+ -0.02060128003358841,
1042
+ -0.012071454897522926,
1043
+ -0.019818812608718872,
1044
+ -0.020626476034522057,
1045
+ -0.007235595025122166,
1046
+ -0.02147303707897663,
1047
+ -0.012981204316020012,
1048
+ -0.015981091186404228,
1049
+ -0.014910366386175156,
1050
+ -0.018423691391944885,
1051
+ -0.013645061291754246,
1052
+ -0.02487649954855442,
1053
+ -0.020798780024051666,
1054
+ -0.012094789184629917,
1055
+ -0.003507678396999836,
1056
+ -0.0045806835405528545,
1057
+ -0.014048563316464424,
1058
+ -0.0055995783768594265,
1059
+ -0.005990410223603249,
1060
+ -0.018072795122861862,
1061
+ -0.0023128343746066093,
1062
+ -0.011131302453577518,
1063
+ -0.0019647148437798023,
1064
+ -0.019436391070485115,
1065
+ -0.003467048518359661,
1066
+ -0.006032169330865145,
1067
+ -0.0062392582185566425,
1068
+ -0.010002661496400833,
1069
+ -0.006256108172237873,
1070
+ -0.01696380227804184,
1071
+ -0.0004878409090451896,
1072
+ -0.005849887616932392,
1073
+ -0.0025370235089212656,
1074
+ -0.007707635406404734,
1075
+ -0.004721880424767733,
1076
+ -0.009883266873657703,
1077
+ -0.01739588752388954,
1078
+ -0.010649303905665874,
1079
+ -0.014589671045541763,
1080
+ -0.005279276054352522,
1081
+ -0.0035842156503349543,
1082
+ -0.0018002031138166785,
1083
+ -0.003911444451659918,
1084
+ -0.0022144124377518892,
1085
+ -0.0007748243515379727,
1086
+ -0.0057691484689712524,
1087
+ -0.005829197354614735,
1088
+ -0.0009182158391922712,
1089
+ 0.023302190005779266,
1090
+ -0.005476834252476692,
1091
+ -0.006333555094897747,
1092
+ -0.006310049910098314,
1093
+ -0.0011707788798958063,
1094
+ -0.020092159509658813,
1095
+ -0.005901510827243328,
1096
+ -0.001840499578975141,
1097
+ -0.004256018437445164,
1098
+ -0.0014213278191164136,
1099
+ -0.0024612818378955126,
1100
+ -0.005892420187592506,
1101
+ -0.0019356019329279661,
1102
+ -0.0001624987635295838,
1103
+ -0.004399558063596487,
1104
+ -0.0022923338692635298,
1105
+ -0.0023859506472945213,
1106
+ -0.0007032789872027934,
1107
+ -0.0038349481765180826,
1108
+ -0.013573608361184597,
1109
+ -0.009795728139579296,
1110
+ -0.0012280066730454564,
1111
+ 0.0009955366840586066,
1112
+ -0.002111360663548112,
1113
+ -0.0038775380235165358,
1114
+ -0.001163705252110958,
1115
+ -0.0012498532887548208,
1116
+ -0.00038247433258220553,
1117
+ -0.001030683983117342,
1118
+ -0.012797330506145954,
1119
+ -0.0059367697685956955,
1120
+ -0.006959662772715092,
1121
+ -0.00032423302764073014,
1122
+ -0.007883579470217228,
1123
+ -0.0003543166385497898,
1124
+ -0.0025655466597527266,
1125
+ -0.01841193065047264,
1126
+ -0.00298623857088387,
1127
+ -0.001057106419466436,
1128
+ -0.0012849696213379502,
1129
+ -0.004397203214466572,
1130
+ -0.003917945083230734,
1131
+ -0.01851789467036724,
1132
+ -0.0015115346759557724,
1133
+ -0.0007443876238539815,
1134
+ -0.00018988554074894637,
1135
+ -0.0004794025735463947,
1136
+ -0.003946919459849596,
1137
+ -0.0001825359504437074,
1138
+ -0.0013486716197803617,
1139
+ -0.0002386654814472422,
1140
+ -0.0011928165331482887,
1141
+ -0.0008850054000504315,
1142
+ -0.0011358740739524364,
1143
+ -0.0004307025810703635,
1144
+ -0.0003831822541542351,
1145
+ -0.00039789601578377187,
1146
+ -0.000724102312233299,
1147
+ -0.005562977399677038,
1148
+ -0.00047869753325358033,
1149
+ -0.005468929186463356,
1150
+ -0.0019564181566238403,
1151
+ -0.0005200754385441542,
1152
+ -0.00479763513430953,
1153
+ -0.0006115435971878469,
1154
+ -0.0002655511489138007,
1155
+ -0.0003414367383811623,
1156
+ -0.00847649946808815,
1157
+ -0.0048600295558571815,
1158
+ -0.007748408243060112,
1159
+ -0.0003116226871497929,
1160
+ -0.014162570238113403,
1161
+ -0.00014125888992566615,
1162
+ -7.286114851012826e-05,
1163
+ -0.00031119445338845253,
1164
+ -0.0005726786912418902,
1165
+ -9.636219328967854e-05,
1166
+ -9.473485260969028e-05,
1167
+ -0.0020531516056507826,
1168
+ -0.00024614756694063544,
1169
+ -0.00020701561879832298,
1170
+ -9.163987124338746e-05,
1171
+ -0.00033374191843904555,
1172
+ -3.453910903772339e-05,
1173
+ -0.00011739716865122318,
1174
+ -0.00018190940318163484,
1175
+ -0.00018823514983523637,
1176
+ -0.00035355138243176043,
1177
+ -0.0008565147873014212,
1178
+ -0.00021456937247421592,
1179
+ -0.00012541584146674722,
1180
+ -0.02982868254184723,
1181
+ -8.055209764279425e-05,
1182
+ -0.004946199245750904,
1183
+ -2.396915078861639e-05,
1184
+ -0.00019351710216142237,
1185
+ -0.011158378794789314,
1186
+ -0.0003155699814669788,
1187
+ -2.4082641175482422e-05,
1188
+ -0.00014629751967731863,
1189
+ -5.4705527873011306e-05,
1190
+ -0.0035232400987297297,
1191
+ -5.216634235694073e-05,
1192
+ -7.84561998443678e-05,
1193
+ -4.5017790398560464e-05,
1194
+ -8.93589312909171e-05,
1195
+ -5.619212970486842e-05,
1196
+ -0.00010777371790027246,
1197
+ -1.0952573575195856e-05,
1198
+ -2.487457823008299e-05,
1199
+ -0.00030178361339494586,
1200
+ -5.3604162530973554e-05,
1201
+ -7.070658466545865e-05,
1202
+ -3.775249933823943e-05,
1203
+ -9.92901641438948e-06,
1204
+ -0.00015062962484080344,
1205
+ -8.858405635692179e-05,
1206
+ -2.677975317055825e-05,
1207
+ -0.00034922329359687865,
1208
+ -2.3543003408121876e-05,
1209
+ -0.003372954437509179,
1210
+ -0.0009480405133217573,
1211
+ -0.0014110596384853125,
1212
+ -4.192819687887095e-05,
1213
+ -0.00013309369387570769,
1214
+ -0.00030725289252586663,
1215
+ -8.247398000094108e-06,
1216
+ -1.5205354429781437e-05,
1217
+ -4.1262610466219485e-05,
1218
+ -9.282851351599675e-06,
1219
+ -1.609013088454958e-05,
1220
+ -0.0001403966307407245,
1221
+ -5.080681148683652e-05,
1222
+ -0.000629170099273324,
1223
+ -2.4902325094444677e-05,
1224
+ -0.00011699106107698753,
1225
+ -2.2841057216282934e-05,
1226
+ -8.752570465730969e-06,
1227
+ -8.695622454979457e-06,
1228
+ -1.3258978469821159e-05,
1229
+ -8.092115422186907e-06,
1230
+ -1.1183735296071973e-05,
1231
+ -1.085585154214641e-05,
1232
+ -1.749858529365156e-05,
1233
+ -9.808529284782708e-06,
1234
+ -1.0461242709425278e-05,
1235
+ -8.579398127039894e-06,
1236
+ -7.443603408319177e-06,
1237
+ -1.0038021173386369e-05,
1238
+ -1.042820713337278e-05,
1239
+ -6.524046511913184e-06,
1240
+ -7.095067758200457e-06,
1241
+ -5.101167062093737e-06,
1242
+ -3.06676265608985e-05,
1243
+ -2.979565761052072e-05,
1244
+ -1.1313065442664083e-05,
1245
+ -7.60914690545178e-06,
1246
+ -7.719173481746111e-06,
1247
+ -7.5882139753957745e-06,
1248
+ -5.529218469746411e-06,
1249
+ -7.526571152993711e-06
1250
+ ],
1251
+ "abs_loss": [
1252
+ 4.603041648864746,
1253
+ 4.5841755867004395,
1254
+ 4.53274393081665,
1255
+ 4.460714340209961,
1256
+ 4.217731475830078,
1257
+ 3.563347578048706,
1258
+ 3.490215539932251,
1259
+ 3.555037498474121,
1260
+ 3.4676544666290283,
1261
+ 3.4505527019500732,
1262
+ 3.476942300796509,
1263
+ 3.538877248764038,
1264
+ 3.5043728351593018,
1265
+ 3.551368474960327,
1266
+ 3.580101728439331,
1267
+ 3.447862386703491,
1268
+ 3.4857311248779297,
1269
+ 3.5770199298858643,
1270
+ 3.4992458820343018,
1271
+ 3.4904441833496094,
1272
+ 3.4738893508911133,
1273
+ 3.4653518199920654,
1274
+ 3.3250033855438232,
1275
+ 3.3614861965179443,
1276
+ 3.195547342300415,
1277
+ 3.0932915210723877,
1278
+ 2.9397449493408203,
1279
+ 2.843135118484497,
1280
+ 2.8380239009857178,
1281
+ 2.8438808917999268,
1282
+ 2.492919683456421,
1283
+ 2.520671844482422,
1284
+ 2.471489191055298,
1285
+ 2.3850584030151367,
1286
+ 2.3514461517333984,
1287
+ 2.2681071758270264,
1288
+ 2.0714380741119385,
1289
+ 1.9762543439865112,
1290
+ 1.8742655515670776,
1291
+ 1.8870280981063843,
1292
+ 1.8385252952575684,
1293
+ 1.6683934926986694,
1294
+ 1.793905258178711,
1295
+ 1.674667477607727,
1296
+ 1.6918026208877563,
1297
+ 1.537947654724121,
1298
+ 1.435508370399475,
1299
+ 1.5701359510421753,
1300
+ 1.3663746118545532,
1301
+ 1.3788094520568848,
1302
+ 1.4458147287368774,
1303
+ 1.2867871522903442,
1304
+ 1.3385576009750366,
1305
+ 1.1818543672561646,
1306
+ 1.0866996049880981,
1307
+ 1.193161129951477,
1308
+ 1.0689277648925781,
1309
+ 1.0907918214797974,
1310
+ 1.0410022735595703,
1311
+ 0.9009587168693542,
1312
+ 0.9473994374275208,
1313
+ 0.9445759654045105,
1314
+ 0.8296585083007812,
1315
+ 0.9158961772918701,
1316
+ 0.699213981628418,
1317
+ 0.814408540725708,
1318
+ 0.7943611741065979,
1319
+ 0.7281647324562073,
1320
+ 0.7427763938903809,
1321
+ 0.7406776547431946,
1322
+ 0.7442176938056946,
1323
+ 0.7054641246795654,
1324
+ 0.6902454495429993,
1325
+ 0.5436487793922424,
1326
+ 0.6410473585128784,
1327
+ 0.5979702472686768,
1328
+ 0.5593562722206116,
1329
+ 0.624752938747406,
1330
+ 0.5044851899147034,
1331
+ 0.5767760872840881,
1332
+ 0.6247518062591553,
1333
+ 0.5620524287223816,
1334
+ 0.5795817375183105,
1335
+ 0.5059494376182556,
1336
+ 0.4822920560836792,
1337
+ 0.5331989526748657,
1338
+ 0.5090872645378113,
1339
+ 0.4961584508419037,
1340
+ 0.49813321232795715,
1341
+ 0.472335547208786,
1342
+ 0.46345794200897217,
1343
+ 0.4337069094181061,
1344
+ 0.4234611988067627,
1345
+ 0.47659751772880554,
1346
+ 0.3887687623500824,
1347
+ 0.3862188756465912,
1348
+ 0.3821044862270355,
1349
+ 0.39485105872154236,
1350
+ 0.3898662030696869,
1351
+ 0.3730045557022095,
1352
+ 0.36670246720314026,
1353
+ 0.36509397625923157,
1354
+ 0.3244834840297699,
1355
+ 0.27992698550224304,
1356
+ 0.35280367732048035,
1357
+ 0.3234531879425049,
1358
+ 0.2795107066631317,
1359
+ 0.30822595953941345,
1360
+ 0.3191474676132202,
1361
+ 0.2637419104576111,
1362
+ 0.2360672503709793,
1363
+ 0.28962427377700806,
1364
+ 0.23743826150894165,
1365
+ 0.24665343761444092,
1366
+ 0.26962411403656006,
1367
+ 0.23034636676311493,
1368
+ 0.22610719501972198,
1369
+ 0.23116528987884521,
1370
+ 0.25347766280174255,
1371
+ 0.21410854160785675,
1372
+ 0.19492192566394806,
1373
+ 0.18323493003845215,
1374
+ 0.18930715322494507,
1375
+ 0.20562772452831268,
1376
+ 0.16831408441066742,
1377
+ 0.17243289947509766,
1378
+ 0.1741904467344284,
1379
+ 0.17991065979003906,
1380
+ 0.17096646130084991,
1381
+ 0.17316819727420807,
1382
+ 0.1817537099123001,
1383
+ 0.173362135887146,
1384
+ 0.16520343720912933,
1385
+ 0.14296814799308777,
1386
+ 0.172354593873024,
1387
+ 0.1721935272216797,
1388
+ 0.11427051573991776,
1389
+ 0.1509944349527359,
1390
+ 0.143010213971138,
1391
+ 0.11524579674005508,
1392
+ 0.1162722110748291,
1393
+ 0.1432504504919052,
1394
+ 0.1431410312652588,
1395
+ 0.15201514959335327,
1396
+ 0.13215528428554535,
1397
+ 0.11335012316703796,
1398
+ 0.11833048611879349,
1399
+ 0.13832975924015045,
1400
+ 0.08608877658843994,
1401
+ 0.11008838564157486,
1402
+ 0.10113388299942017,
1403
+ 0.10196736454963684,
1404
+ 0.09909848123788834,
1405
+ 0.1218162253499031,
1406
+ 0.1243174597620964,
1407
+ 0.08232169598340988,
1408
+ 0.09428908675909042,
1409
+ 0.13485608994960785,
1410
+ 0.08557337522506714,
1411
+ 0.0895991101861,
1412
+ 0.09934133291244507,
1413
+ 0.14667707681655884,
1414
+ 0.08835374563932419,
1415
+ 0.07963862270116806,
1416
+ 0.07490351051092148,
1417
+ 0.07977992296218872,
1418
+ 0.0895429477095604,
1419
+ 0.08950457721948624,
1420
+ 0.08969501405954361,
1421
+ 0.07227172702550888,
1422
+ 0.08207719773054123,
1423
+ 0.10901232808828354,
1424
+ 0.07238639146089554,
1425
+ 0.0652027279138565,
1426
+ 0.08443044871091843,
1427
+ 0.08576809614896774,
1428
+ 0.08091983199119568,
1429
+ 0.0742729976773262,
1430
+ 0.0786265954375267,
1431
+ 0.06966403126716614,
1432
+ 0.07922590523958206,
1433
+ 0.08238772302865982,
1434
+ 0.05430297181010246,
1435
+ 0.0660567358136177,
1436
+ 0.058504436165094376,
1437
+ 0.08552845567464828,
1438
+ 0.0697905644774437,
1439
+ 0.049891188740730286,
1440
+ 0.07148411124944687,
1441
+ 0.0644802674651146,
1442
+ 0.07760775089263916,
1443
+ 0.06404165178537369,
1444
+ 0.062223393470048904,
1445
+ 0.05556373670697212,
1446
+ 0.05657640099525452,
1447
+ 0.06102887913584709,
1448
+ 0.06736531853675842,
1449
+ 0.06771568208932877,
1450
+ 0.05608828738331795,
1451
+ 0.05777057632803917,
1452
+ 0.05531086400151253,
1453
+ 0.06451470404863358,
1454
+ 0.049541670829057693,
1455
+ 0.05765654519200325,
1456
+ 0.04217498376965523,
1457
+ 0.047461628913879395,
1458
+ 0.04364612326025963,
1459
+ 0.04544100537896156,
1460
+ 0.04761265590786934,
1461
+ 0.048201579600572586,
1462
+ 0.03596240654587746,
1463
+ 0.043829262256622314,
1464
+ 0.056982528418302536,
1465
+ 0.038768455386161804,
1466
+ 0.047616492956876755,
1467
+ 0.043035198003053665,
1468
+ 0.04991820454597473,
1469
+ 0.033055663108825684,
1470
+ 0.05667095258831978,
1471
+ 0.03975292667746544,
1472
+ 0.05935639142990112,
1473
+ 0.043755244463682175,
1474
+ 0.04013407602906227,
1475
+ 0.05057823657989502,
1476
+ 0.04614407941699028,
1477
+ 0.03472425043582916,
1478
+ 0.04538685083389282,
1479
+ 0.037106648087501526,
1480
+ 0.0376768633723259,
1481
+ 0.037843529134988785,
1482
+ 0.037003424018621445,
1483
+ 0.03772269934415817,
1484
+ 0.03886259347200394,
1485
+ 0.03979538381099701,
1486
+ 0.035227809101343155,
1487
+ 0.04654185473918915,
1488
+ 0.04154503718018532,
1489
+ 0.038492366671562195,
1490
+ 0.0369468592107296,
1491
+ 0.03757183253765106,
1492
+ 0.045592788606882095,
1493
+ 0.04095832630991936,
1494
+ 0.034500520676374435,
1495
+ 0.04237512871623039,
1496
+ 0.03417122736573219,
1497
+ 0.04159379377961159,
1498
+ 0.04262787103652954,
1499
+ 0.03383564576506615,
1500
+ 0.05068780109286308,
1501
+ 0.04203616455197334,
1502
+ 0.032313790172338486,
1503
+ 0.04111837223172188,
1504
+ 0.03396201506257057,
1505
+ 0.03214220702648163,
1506
+ 0.04141819849610329,
1507
+ 0.03637465089559555,
1508
+ 0.03442591801285744,
1509
+ 0.03087209165096283,
1510
+ 0.0317850187420845,
1511
+ 0.03445545211434364,
1512
+ 0.04282728210091591,
1513
+ 0.035558078438043594,
1514
+ 0.04060632735490799,
1515
+ 0.027773447334766388,
1516
+ 0.03157457709312439,
1517
+ 0.037785883992910385,
1518
+ 0.02797539345920086,
1519
+ 0.035231754183769226,
1520
+ 0.031233632937073708,
1521
+ 0.033776842057704926,
1522
+ 0.03175435960292816,
1523
+ 0.03569674864411354,
1524
+ 0.02642284333705902,
1525
+ 0.036271944642066956,
1526
+ 0.023505395278334618,
1527
+ 0.0320374071598053,
1528
+ 0.026109585538506508,
1529
+ 0.03013613633811474,
1530
+ 0.030888063833117485,
1531
+ 0.036726213991642,
1532
+ 0.03140904754400253,
1533
+ 0.030737057328224182,
1534
+ 0.028026685118675232,
1535
+ 0.030188364908099174,
1536
+ 0.03312038630247116,
1537
+ 0.032729942351579666,
1538
+ 0.03299831598997116,
1539
+ 0.03521570935845375,
1540
+ 0.02604033052921295,
1541
+ 0.030986415222287178,
1542
+ 0.03034178912639618,
1543
+ 0.024759912863373756,
1544
+ 0.02873222343623638,
1545
+ 0.024176398292183876,
1546
+ 0.027595123276114464,
1547
+ 0.041874248534440994,
1548
+ 0.03185281530022621,
1549
+ 0.031231991946697235,
1550
+ 0.031455159187316895,
1551
+ 0.029650427401065826,
1552
+ 0.031163498759269714,
1553
+ 0.02589062787592411,
1554
+ 0.02857351303100586,
1555
+ 0.02707638405263424,
1556
+ 0.043108388781547546,
1557
+ 0.023442847654223442,
1558
+ 0.02926076389849186,
1559
+ 0.02585754729807377,
1560
+ 0.02577146328985691,
1561
+ 0.02764846384525299
1562
+ ],
1563
+ "zipf_loss": [
1564
+ 5.663651466369629,
1565
+ 4.8174872398376465,
1566
+ 3.7051196098327637,
1567
+ 2.5770812034606934,
1568
+ 1.4586780071258545,
1569
+ 0.6978144645690918,
1570
+ 0.5315093994140625,
1571
+ 0.49966198205947876,
1572
+ 0.4916931390762329,
1573
+ 0.4864996075630188,
1574
+ 0.4833303391933441,
1575
+ 0.4845244586467743,
1576
+ 0.4832606315612793,
1577
+ 0.49088525772094727,
1578
+ 0.49519699811935425,
1579
+ 0.4952481687068939,
1580
+ 0.49356189370155334,
1581
+ 0.48926907777786255,
1582
+ 0.489700049161911,
1583
+ 0.4852827191352844,
1584
+ 0.48208707571029663,
1585
+ 0.47848790884017944,
1586
+ 0.4730149507522583,
1587
+ 0.46559518575668335,
1588
+ 0.44587045907974243,
1589
+ 0.41556423902511597,
1590
+ 0.40657806396484375,
1591
+ 0.3943699598312378,
1592
+ 0.35266709327697754,
1593
+ 0.3365079164505005,
1594
+ 0.30472445487976074,
1595
+ 0.2651841640472412,
1596
+ 0.2490452378988266,
1597
+ 0.23861542344093323,
1598
+ 0.22387580573558807,
1599
+ 0.20998485386371613,
1600
+ 0.21178016066551208,
1601
+ 0.1937064379453659,
1602
+ 0.18439215421676636,
1603
+ 0.17755547165870667,
1604
+ 0.1691177487373352,
1605
+ 0.17125433683395386,
1606
+ 0.17580723762512207,
1607
+ 0.16314344108104706,
1608
+ 0.15907134115695953,
1609
+ 0.17046615481376648,
1610
+ 0.13725140690803528,
1611
+ 0.14322584867477417,
1612
+ 0.14733506739139557,
1613
+ 0.12601473927497864,
1614
+ 0.1315670907497406,
1615
+ 0.11821918189525604,
1616
+ 0.12049274146556854,
1617
+ 0.12183350324630737,
1618
+ 0.10125967115163803,
1619
+ 0.09916132688522339,
1620
+ 0.1116621270775795,
1621
+ 0.10285325348377228,
1622
+ 0.10514096915721893,
1623
+ 0.07832358777523041,
1624
+ 0.07721303403377533,
1625
+ 0.08484388887882233,
1626
+ 0.08684535324573517,
1627
+ 0.08168107271194458,
1628
+ 0.08005701750516891,
1629
+ 0.08707915246486664,
1630
+ 0.07860724627971649,
1631
+ 0.0830891877412796,
1632
+ 0.07403960824012756,
1633
+ 0.07297830283641815,
1634
+ 0.07872877269983292,
1635
+ 0.07069910317659378,
1636
+ 0.06315585970878601,
1637
+ 0.07438682019710541,
1638
+ 0.06599496304988861,
1639
+ 0.07374947518110275,
1640
+ 0.0718688890337944,
1641
+ 0.06869439035654068,
1642
+ 0.0827254056930542,
1643
+ 0.06337965279817581,
1644
+ 0.0599580816924572,
1645
+ 0.061697959899902344,
1646
+ 0.06028898060321808,
1647
+ 0.06221170723438263,
1648
+ 0.07393478602170944,
1649
+ 0.056472014635801315,
1650
+ 0.06018044799566269,
1651
+ 0.07002571225166321,
1652
+ 0.05067000538110733,
1653
+ 0.06021241471171379,
1654
+ 0.05812843143939972,
1655
+ 0.05310033634305,
1656
+ 0.061153873801231384,
1657
+ 0.061339348554611206,
1658
+ 0.061049684882164,
1659
+ 0.045203905552625656,
1660
+ 0.05264156684279442,
1661
+ 0.04305511713027954,
1662
+ 0.051484763622283936,
1663
+ 0.04258764162659645,
1664
+ 0.03825601935386658,
1665
+ 0.03563452512025833,
1666
+ 0.0480944849550724,
1667
+ 0.05231287330389023,
1668
+ 0.04652220755815506,
1669
+ 0.03974279761314392,
1670
+ 0.04052890092134476,
1671
+ 0.04555916041135788,
1672
+ 0.04247414693236351,
1673
+ 0.03976451978087425,
1674
+ 0.04690541326999664,
1675
+ 0.03576142340898514,
1676
+ 0.04123218357563019,
1677
+ 0.04388829320669174,
1678
+ 0.03185419738292694,
1679
+ 0.0327533520758152,
1680
+ 0.04025813192129135,
1681
+ 0.04457952082157135,
1682
+ 0.03811655193567276,
1683
+ 0.039225079119205475,
1684
+ 0.034983329474925995,
1685
+ 0.03467193990945816,
1686
+ 0.0335577167570591,
1687
+ 0.03534165024757385,
1688
+ 0.04131878539919853,
1689
+ 0.039686426520347595,
1690
+ 0.035678356885910034,
1691
+ 0.035524822771549225,
1692
+ 0.03738424926996231,
1693
+ 0.0340142622590065,
1694
+ 0.04139988124370575,
1695
+ 0.039529215544462204,
1696
+ 0.05284174531698227,
1697
+ 0.039516739547252655,
1698
+ 0.03672833740711212,
1699
+ 0.030823830515146255,
1700
+ 0.03404860198497772,
1701
+ 0.034295953810214996,
1702
+ 0.03871295601129532,
1703
+ 0.029216643422842026,
1704
+ 0.0518360510468483,
1705
+ 0.04081478714942932,
1706
+ 0.04257647693157196,
1707
+ 0.03323471173644066,
1708
+ 0.03151203319430351,
1709
+ 0.03677874431014061,
1710
+ 0.043129757046699524,
1711
+ 0.029961343854665756,
1712
+ 0.03515385463833809,
1713
+ 0.03470553457736969,
1714
+ 0.03140740096569061,
1715
+ 0.03194158524274826,
1716
+ 0.03357471898198128,
1717
+ 0.02971578575670719,
1718
+ 0.02812349796295166,
1719
+ 0.04155147820711136,
1720
+ 0.030023138970136642,
1721
+ 0.03432699292898178,
1722
+ 0.03549080342054367,
1723
+ 0.037144970148801804,
1724
+ 0.05082063376903534,
1725
+ 0.040721263736486435,
1726
+ 0.036593496799468994,
1727
+ 0.03280946612358093,
1728
+ 0.03995447978377342,
1729
+ 0.036919157952070236,
1730
+ 0.03454191982746124,
1731
+ 0.032546211034059525,
1732
+ 0.03315555304288864,
1733
+ 0.04240412265062332,
1734
+ 0.041371628642082214,
1735
+ 0.03905896097421646,
1736
+ 0.04091101139783859,
1737
+ 0.031317517161369324,
1738
+ 0.03919265791773796,
1739
+ 0.031153714284300804,
1740
+ 0.033118195831775665,
1741
+ 0.043835531920194626,
1742
+ 0.03370039537549019,
1743
+ 0.029291361570358276,
1744
+ 0.040657252073287964,
1745
+ 0.04184120520949364,
1746
+ 0.03377286344766617,
1747
+ 0.02987826056778431,
1748
+ 0.04292890802025795,
1749
+ 0.032645855098962784,
1750
+ 0.03143710270524025,
1751
+ 0.04131791740655899,
1752
+ 0.03139704093337059,
1753
+ 0.04024938866496086,
1754
+ 0.039107128977775574,
1755
+ 0.04178883135318756,
1756
+ 0.03264184296131134,
1757
+ 0.03571602329611778,
1758
+ 0.04117662087082863,
1759
+ 0.03659230098128319,
1760
+ 0.04156425595283508,
1761
+ 0.032444968819618225,
1762
+ 0.03277445212006569,
1763
+ 0.03855854272842407,
1764
+ 0.03484060987830162,
1765
+ 0.038426339626312256,
1766
+ 0.03618501499295235,
1767
+ 0.04217202216386795,
1768
+ 0.037478968501091,
1769
+ 0.037659451365470886,
1770
+ 0.037023045122623444,
1771
+ 0.02999153546988964,
1772
+ 0.029628170654177666,
1773
+ 0.03006475418806076,
1774
+ 0.041628189384937286,
1775
+ 0.028323553502559662,
1776
+ 0.03198792040348053,
1777
+ 0.03604285418987274,
1778
+ 0.04225946217775345,
1779
+ 0.03636014088988304,
1780
+ 0.04187122732400894,
1781
+ 0.04383430629968643,
1782
+ 0.030804522335529327,
1783
+ 0.03755081444978714,
1784
+ 0.04184955358505249,
1785
+ 0.03172241151332855,
1786
+ 0.031947389245033264,
1787
+ 0.031197478994727135,
1788
+ 0.030721383169293404,
1789
+ 0.03908618539571762,
1790
+ 0.02888665720820427,
1791
+ 0.03170847147703171,
1792
+ 0.04400455206632614,
1793
+ 0.03189562261104584,
1794
+ 0.02982286550104618,
1795
+ 0.043167728930711746,
1796
+ 0.03704871982336044,
1797
+ 0.04170861840248108,
1798
+ 0.042008403688669205,
1799
+ 0.03307444602251053,
1800
+ 0.03558340296149254,
1801
+ 0.028802942484617233,
1802
+ 0.03371186554431915,
1803
+ 0.04046766832470894,
1804
+ 0.02833537384867668,
1805
+ 0.03861928731203079,
1806
+ 0.03014560043811798,
1807
+ 0.03482171520590782,
1808
+ 0.03181702643632889,
1809
+ 0.03712569922208786,
1810
+ 0.03522143512964249,
1811
+ 0.03800087422132492,
1812
+ 0.036534957587718964,
1813
+ 0.041303448379039764,
1814
+ 0.0371018648147583,
1815
+ 0.03902193903923035,
1816
+ 0.03841015696525574,
1817
+ 0.035081569105386734,
1818
+ 0.031095823273062706,
1819
+ 0.0326416902244091,
1820
+ 0.03731643036007881,
1821
+ 0.03175090253353119,
1822
+ 0.04020028933882713,
1823
+ 0.04699118435382843,
1824
+ 0.033925414085388184,
1825
+ 0.043388448655605316,
1826
+ 0.033347051590681076,
1827
+ 0.04727836698293686,
1828
+ 0.028455037623643875,
1829
+ 0.030180299654603004,
1830
+ 0.04453800246119499,
1831
+ 0.03219585865736008,
1832
+ 0.042228132486343384,
1833
+ 0.02502298727631569,
1834
+ 0.043919242918491364,
1835
+ 0.037101082503795624,
1836
+ 0.04060585796833038,
1837
+ 0.02547113597393036,
1838
+ 0.041510820388793945,
1839
+ 0.038429781794548035,
1840
+ 0.03978222608566284,
1841
+ 0.03376566618680954,
1842
+ 0.024347634986042976,
1843
+ 0.034895122051239014,
1844
+ 0.045462340116500854,
1845
+ 0.02714916504919529,
1846
+ 0.028195256367325783,
1847
+ 0.032876934856176376,
1848
+ 0.037526458501815796,
1849
+ 0.03010200522840023,
1850
+ 0.04508732259273529,
1851
+ 0.02660355716943741,
1852
+ 0.03618592023849487,
1853
+ 0.036261241883039474,
1854
+ 0.03204546868801117,
1855
+ 0.03468030318617821,
1856
+ 0.042041584849357605,
1857
+ 0.034626737236976624,
1858
+ 0.035370122641325,
1859
+ 0.04796532914042473,
1860
+ 0.034394703805446625,
1861
+ 0.04238779842853546,
1862
+ 0.047858525067567825,
1863
+ 0.03719623386859894,
1864
+ 0.03909963369369507,
1865
+ 0.040312789380550385,
1866
+ 0.03939961642026901,
1867
+ 0.03459423780441284,
1868
+ 0.03353364020586014,
1869
+ 0.0446491502225399,
1870
+ 0.03721851482987404,
1871
+ 0.03274112194776535,
1872
+ 0.041602373123168945,
1873
+ 0.036418367177248
1874
+ ],
1875
+ "denoise_loss": [],
1876
+ "ortho_loss": [
1877
+ 0.9376026391983032,
1878
+ 0.7007379531860352,
1879
+ 0.37365850806236267,
1880
+ 0.17707382142543793,
1881
+ 0.13603900372982025,
1882
+ 0.11406496912240982,
1883
+ 0.11125006526708603,
1884
+ 0.09397157281637192,
1885
+ 0.07696004956960678,
1886
+ 0.07365667074918747,
1887
+ 0.06984909623861313,
1888
+ 0.07013429701328278,
1889
+ 0.0726105347275734,
1890
+ 0.08216109126806259,
1891
+ 0.09343095868825912,
1892
+ 0.10101717710494995,
1893
+ 0.11018366366624832,
1894
+ 0.12144909054040909,
1895
+ 0.12832850217819214,
1896
+ 0.13581342995166779,
1897
+ 0.14066903293132782,
1898
+ 0.14225120842456818,
1899
+ 0.1478288471698761,
1900
+ 0.15492728352546692,
1901
+ 0.1571032702922821,
1902
+ 0.16372014582157135,
1903
+ 0.16633547842502594,
1904
+ 0.1622837334871292,
1905
+ 0.16084976494312286,
1906
+ 0.1617647111415863,
1907
+ 0.16280022263526917,
1908
+ 0.16535624861717224,
1909
+ 0.16594181954860687,
1910
+ 0.16564251482486725,
1911
+ 0.16546635329723358,
1912
+ 0.17148426175117493,
1913
+ 0.17380870878696442,
1914
+ 0.17337679862976074,
1915
+ 0.1736914962530136,
1916
+ 0.17132428288459778,
1917
+ 0.17216801643371582,
1918
+ 0.17449916899204254,
1919
+ 0.17322836816310883,
1920
+ 0.16973356902599335,
1921
+ 0.16920511424541473,
1922
+ 0.1716797947883606,
1923
+ 0.17414869368076324,
1924
+ 0.17601533234119415,
1925
+ 0.17666906118392944,
1926
+ 0.17435750365257263,
1927
+ 0.17338787019252777,
1928
+ 0.16770310699939728,
1929
+ 0.16753749549388885,
1930
+ 0.16614221036434174,
1931
+ 0.16688509285449982,
1932
+ 0.16613218188285828,
1933
+ 0.16598309576511383,
1934
+ 0.16184593737125397,
1935
+ 0.16513119637966156,
1936
+ 0.16607776284217834,
1937
+ 0.1637232005596161,
1938
+ 0.16369865834712982,
1939
+ 0.16271312534809113,
1940
+ 0.1628275215625763,
1941
+ 0.1633443683385849,
1942
+ 0.16463616490364075,
1943
+ 0.16384243965148926,
1944
+ 0.16403073072433472,
1945
+ 0.16306927800178528,
1946
+ 0.16321074962615967,
1947
+ 0.16127385199069977,
1948
+ 0.16195642948150635,
1949
+ 0.15985889732837677,
1950
+ 0.15926982462406158,
1951
+ 0.16034196317195892,
1952
+ 0.16088230907917023,
1953
+ 0.15765608847141266,
1954
+ 0.1602407991886139,
1955
+ 0.15936952829360962,
1956
+ 0.1593628227710724,
1957
+ 0.15990209579467773,
1958
+ 0.15901857614517212,
1959
+ 0.15795736014842987,
1960
+ 0.15815134346485138,
1961
+ 0.1573365330696106,
1962
+ 0.1556706428527832,
1963
+ 0.1550082415342331,
1964
+ 0.15830345451831818,
1965
+ 0.1582198590040207,
1966
+ 0.1589011549949646,
1967
+ 0.158173069357872,
1968
+ 0.15694555640220642,
1969
+ 0.1595757007598877,
1970
+ 0.16192790865898132,
1971
+ 0.16351115703582764,
1972
+ 0.16438187658786774,
1973
+ 0.16531293094158173,
1974
+ 0.16702312231063843,
1975
+ 0.16985896229743958,
1976
+ 0.1693105846643448,
1977
+ 0.17127972841262817,
1978
+ 0.17190822958946228,
1979
+ 0.17324590682983398,
1980
+ 0.17407527565956116,
1981
+ 0.1757299154996872,
1982
+ 0.1768612265586853,
1983
+ 0.17668069899082184,
1984
+ 0.1795107126235962,
1985
+ 0.18070606887340546,
1986
+ 0.1816258281469345,
1987
+ 0.18243959546089172,
1988
+ 0.18394018709659576,
1989
+ 0.18018585443496704,
1990
+ 0.18063102662563324,
1991
+ 0.18172721564769745,
1992
+ 0.1841171234846115,
1993
+ 0.18386167287826538,
1994
+ 0.18460595607757568,
1995
+ 0.1837480515241623,
1996
+ 0.18452468514442444,
1997
+ 0.18600761890411377,
1998
+ 0.18638421595096588,
1999
+ 0.18696655333042145,
2000
+ 0.1878429800271988,
2001
+ 0.18817274272441864,
2002
+ 0.18914417922496796,
2003
+ 0.18814365565776825,
2004
+ 0.18918098509311676,
2005
+ 0.18824653327465057,
2006
+ 0.1904299408197403,
2007
+ 0.19006557762622833,
2008
+ 0.18870225548744202,
2009
+ 0.19202673435211182,
2010
+ 0.19460506737232208,
2011
+ 0.19416780769824982,
2012
+ 0.19183270633220673,
2013
+ 0.1925390511751175,
2014
+ 0.1931300014257431,
2015
+ 0.19357861578464508,
2016
+ 0.19207623600959778,
2017
+ 0.19490733742713928,
2018
+ 0.19721658527851105,
2019
+ 0.19635190069675446,
2020
+ 0.19660061597824097,
2021
+ 0.19664490222930908,
2022
+ 0.1963832527399063,
2023
+ 0.19566887617111206,
2024
+ 0.19512927532196045,
2025
+ 0.19788357615470886,
2026
+ 0.19646130502223969,
2027
+ 0.19517861306667328,
2028
+ 0.19499053061008453,
2029
+ 0.19515110552310944,
2030
+ 0.1946483999490738,
2031
+ 0.19441621005535126,
2032
+ 0.1933158040046692,
2033
+ 0.1917847990989685,
2034
+ 0.1935388296842575,
2035
+ 0.19408902525901794,
2036
+ 0.19307000935077667,
2037
+ 0.19243291020393372,
2038
+ 0.193073108792305,
2039
+ 0.19170504808425903,
2040
+ 0.1914815902709961,
2041
+ 0.19016189873218536,
2042
+ 0.19077704846858978,
2043
+ 0.19021084904670715,
2044
+ 0.1877760887145996,
2045
+ 0.18453443050384521,
2046
+ 0.18317680060863495,
2047
+ 0.18410567939281464,
2048
+ 0.18364721536636353,
2049
+ 0.18457013368606567,
2050
+ 0.1845579445362091,
2051
+ 0.1845027059316635,
2052
+ 0.1864791065454483,
2053
+ 0.18972516059875488,
2054
+ 0.18964499235153198,
2055
+ 0.18956349790096283,
2056
+ 0.18870678544044495,
2057
+ 0.19041423499584198,
2058
+ 0.19195054471492767,
2059
+ 0.1924402415752411,
2060
+ 0.19053557515144348,
2061
+ 0.19165074825286865,
2062
+ 0.18905256688594818,
2063
+ 0.18983224034309387,
2064
+ 0.19006890058517456,
2065
+ 0.19178606569766998,
2066
+ 0.19018283486366272,
2067
+ 0.18780332803726196,
2068
+ 0.18591709434986115,
2069
+ 0.18611155450344086,
2070
+ 0.1854625791311264,
2071
+ 0.18614430725574493,
2072
+ 0.1885843575000763,
2073
+ 0.1881093531847,
2074
+ 0.18770897388458252,
2075
+ 0.18775226175785065,
2076
+ 0.18829002976417542,
2077
+ 0.1884324997663498,
2078
+ 0.18891721963882446,
2079
+ 0.1891082227230072,
2080
+ 0.19009685516357422,
2081
+ 0.1888415515422821,
2082
+ 0.1887965351343155,
2083
+ 0.1903047412633896,
2084
+ 0.19142413139343262,
2085
+ 0.19155000150203705,
2086
+ 0.19131244719028473,
2087
+ 0.1908448040485382,
2088
+ 0.19115927815437317,
2089
+ 0.1922212839126587,
2090
+ 0.19240479171276093,
2091
+ 0.19312167167663574,
2092
+ 0.1938711553812027,
2093
+ 0.1930093914270401,
2094
+ 0.19212397933006287,
2095
+ 0.19303347170352936,
2096
+ 0.19321812689304352,
2097
+ 0.1929994523525238,
2098
+ 0.19236275553703308,
2099
+ 0.19305941462516785,
2100
+ 0.19336196780204773,
2101
+ 0.19336533546447754,
2102
+ 0.19388779997825623,
2103
+ 0.19523002207279205,
2104
+ 0.1957283765077591,
2105
+ 0.19540676474571228,
2106
+ 0.19567818939685822,
2107
+ 0.19473984837532043,
2108
+ 0.1937522292137146,
2109
+ 0.19390758872032166,
2110
+ 0.19370445609092712,
2111
+ 0.1946900635957718,
2112
+ 0.19524890184402466,
2113
+ 0.19600768387317657,
2114
+ 0.1955704241991043,
2115
+ 0.1936069279909134,
2116
+ 0.19363188743591309,
2117
+ 0.19429054856300354,
2118
+ 0.19530171155929565,
2119
+ 0.1953572928905487,
2120
+ 0.19692355394363403,
2121
+ 0.19669665396213531,
2122
+ 0.19710610806941986,
2123
+ 0.1971132457256317,
2124
+ 0.19692033529281616,
2125
+ 0.19605320692062378,
2126
+ 0.19645871222019196,
2127
+ 0.19657059013843536,
2128
+ 0.19716912508010864,
2129
+ 0.19678904116153717,
2130
+ 0.19640706479549408,
2131
+ 0.1967984288930893,
2132
+ 0.19748914241790771,
2133
+ 0.19796286523342133,
2134
+ 0.1982904076576233,
2135
+ 0.19822557270526886,
2136
+ 0.19888262450695038,
2137
+ 0.19839127361774445,
2138
+ 0.19945591688156128,
2139
+ 0.19956566393375397,
2140
+ 0.19941307604312897,
2141
+ 0.19912470877170563,
2142
+ 0.19910463690757751,
2143
+ 0.19947828352451324,
2144
+ 0.20000645518302917,
2145
+ 0.19983041286468506,
2146
+ 0.20001770555973053,
2147
+ 0.19992980360984802,
2148
+ 0.2003318965435028,
2149
+ 0.20038704574108124,
2150
+ 0.2018159180879593,
2151
+ 0.20244568586349487,
2152
+ 0.20244380831718445,
2153
+ 0.20229730010032654,
2154
+ 0.20237348973751068,
2155
+ 0.20252251625061035,
2156
+ 0.20246721804141998,
2157
+ 0.20219771564006805,
2158
+ 0.2017725110054016,
2159
+ 0.20196059346199036,
2160
+ 0.20181001722812653,
2161
+ 0.20208409428596497,
2162
+ 0.20199620723724365,
2163
+ 0.20227329432964325,
2164
+ 0.202107235789299,
2165
+ 0.20229637622833252,
2166
+ 0.20304076373577118,
2167
+ 0.20311787724494934,
2168
+ 0.20346969366073608,
2169
+ 0.20387688279151917,
2170
+ 0.20401278138160706,
2171
+ 0.20426422357559204,
2172
+ 0.20429830253124237,
2173
+ 0.2043059915304184,
2174
+ 0.2045273631811142,
2175
+ 0.20442618429660797,
2176
+ 0.20433297753334045,
2177
+ 0.20436905324459076,
2178
+ 0.2047407031059265,
2179
+ 0.20479217171669006,
2180
+ 0.20455767214298248,
2181
+ 0.20455561578273773,
2182
+ 0.20480582118034363,
2183
+ 0.20472575724124908,
2184
+ 0.20471437275409698,
2185
+ 0.20480979979038239,
2186
+ 0.2046213448047638
2187
+ ],
2188
+ "lr": [
2189
+ 4.188034188034189e-06,
2190
+ 8.461538461538462e-06,
2191
+ 1.2735042735042738e-05,
2192
+ 1.700854700854701e-05,
2193
+ 2.1282051282051282e-05,
2194
+ 2.5555555555555557e-05,
2195
+ 2.9829059829059833e-05,
2196
+ 3.4102564102564105e-05,
2197
+ 3.837606837606838e-05,
2198
+ 4e-05,
2199
+ 4e-05,
2200
+ 4e-05,
2201
+ 4e-05,
2202
+ 4e-05,
2203
+ 4e-05,
2204
+ 4e-05,
2205
+ 4e-05,
2206
+ 4e-05,
2207
+ 4e-05,
2208
+ 4e-05,
2209
+ 4e-05,
2210
+ 4e-05,
2211
+ 4e-05,
2212
+ 4e-05,
2213
+ 4e-05,
2214
+ 4e-05,
2215
+ 4e-05,
2216
+ 4e-05,
2217
+ 4e-05,
2218
+ 4e-05,
2219
+ 4e-05,
2220
+ 4e-05,
2221
+ 4e-05,
2222
+ 4e-05,
2223
+ 4e-05,
2224
+ 4e-05,
2225
+ 4e-05,
2226
+ 4e-05,
2227
+ 4e-05,
2228
+ 4e-05,
2229
+ 4e-05,
2230
+ 4e-05,
2231
+ 4e-05,
2232
+ 4e-05,
2233
+ 4e-05,
2234
+ 4e-05,
2235
+ 4e-05,
2236
+ 4e-05,
2237
+ 4e-05,
2238
+ 4e-05,
2239
+ 4e-05,
2240
+ 4e-05,
2241
+ 4e-05,
2242
+ 4e-05,
2243
+ 4e-05,
2244
+ 4e-05,
2245
+ 4e-05,
2246
+ 4e-05,
2247
+ 4e-05,
2248
+ 4e-05,
2249
+ 4e-05,
2250
+ 4e-05,
2251
+ 4e-05,
2252
+ 4e-05,
2253
+ 4e-05,
2254
+ 4e-05,
2255
+ 4e-05,
2256
+ 4e-05,
2257
+ 4e-05,
2258
+ 4e-05,
2259
+ 4e-05,
2260
+ 4e-05,
2261
+ 4e-05,
2262
+ 4e-05,
2263
+ 4e-05,
2264
+ 4e-05,
2265
+ 4e-05,
2266
+ 4e-05,
2267
+ 4e-05,
2268
+ 4e-05,
2269
+ 4e-05,
2270
+ 4e-05,
2271
+ 4e-05,
2272
+ 4e-05,
2273
+ 4e-05,
2274
+ 4e-05,
2275
+ 4e-05,
2276
+ 4e-05,
2277
+ 4e-05,
2278
+ 4e-05,
2279
+ 4e-05,
2280
+ 4e-05,
2281
+ 4e-05,
2282
+ 4e-05,
2283
+ 4e-05,
2284
+ 4e-05,
2285
+ 4e-05,
2286
+ 4e-05,
2287
+ 4e-05,
2288
+ 4e-05,
2289
+ 4e-05,
2290
+ 4e-05,
2291
+ 4e-05,
2292
+ 4e-05,
2293
+ 4e-05,
2294
+ 4e-05,
2295
+ 4e-05,
2296
+ 4e-05,
2297
+ 4e-05,
2298
+ 4e-05,
2299
+ 4e-05,
2300
+ 4e-05,
2301
+ 4e-05,
2302
+ 4e-05,
2303
+ 4e-05,
2304
+ 4e-05,
2305
+ 4e-05,
2306
+ 4e-05,
2307
+ 4e-05,
2308
+ 4e-05,
2309
+ 4e-05,
2310
+ 4e-05,
2311
+ 4e-05,
2312
+ 4e-05,
2313
+ 4e-05,
2314
+ 4e-05,
2315
+ 4e-05,
2316
+ 4e-05,
2317
+ 4e-05,
2318
+ 4e-05,
2319
+ 4e-05,
2320
+ 4e-05,
2321
+ 4e-05,
2322
+ 4e-05,
2323
+ 4e-05,
2324
+ 4e-05,
2325
+ 4e-05,
2326
+ 4e-05,
2327
+ 4e-05,
2328
+ 4e-05,
2329
+ 4e-05,
2330
+ 4e-05,
2331
+ 4e-05,
2332
+ 4e-05,
2333
+ 4e-05,
2334
+ 4e-05,
2335
+ 4e-05,
2336
+ 4e-05,
2337
+ 4e-05,
2338
+ 4e-05,
2339
+ 4e-05,
2340
+ 4e-05,
2341
+ 4e-05,
2342
+ 4e-05,
2343
+ 4e-05,
2344
+ 4e-05,
2345
+ 4e-05,
2346
+ 4e-05,
2347
+ 4e-05,
2348
+ 4e-05,
2349
+ 4e-05,
2350
+ 4e-05,
2351
+ 4e-05,
2352
+ 4e-05,
2353
+ 4e-05,
2354
+ 4e-05,
2355
+ 4e-05,
2356
+ 4e-05,
2357
+ 4e-05,
2358
+ 4e-05,
2359
+ 4e-05,
2360
+ 4e-05,
2361
+ 4e-05,
2362
+ 4e-05,
2363
+ 4e-05,
2364
+ 4e-05,
2365
+ 4e-05,
2366
+ 4e-05,
2367
+ 4e-05,
2368
+ 4e-05,
2369
+ 4e-05,
2370
+ 4e-05,
2371
+ 4e-05,
2372
+ 4e-05,
2373
+ 4e-05,
2374
+ 4e-05,
2375
+ 4e-05,
2376
+ 4e-05,
2377
+ 4e-05,
2378
+ 3.992995647012267e-05,
2379
+ 3.963316185199842e-05,
2380
+ 3.933636723387416e-05,
2381
+ 3.90395726157499e-05,
2382
+ 3.874277799762565e-05,
2383
+ 3.844598337950139e-05,
2384
+ 3.814918876137713e-05,
2385
+ 3.785239414325287e-05,
2386
+ 3.7555599525128613e-05,
2387
+ 3.725880490700435e-05,
2388
+ 3.696201028888009e-05,
2389
+ 3.666521567075585e-05,
2390
+ 3.6368421052631585e-05,
2391
+ 3.607162643450732e-05,
2392
+ 3.577483181638307e-05,
2393
+ 3.547803719825881e-05,
2394
+ 3.518124258013455e-05,
2395
+ 3.4884447962010287e-05,
2396
+ 3.458765334388604e-05,
2397
+ 3.4290858725761776e-05,
2398
+ 3.399406410763751e-05,
2399
+ 3.3697269489513265e-05,
2400
+ 3.3400474871389e-05,
2401
+ 3.310368025326474e-05,
2402
+ 3.280688563514048e-05,
2403
+ 3.251009101701623e-05,
2404
+ 3.2213296398891967e-05,
2405
+ 3.191650178076771e-05,
2406
+ 3.1542540561931145e-05,
2407
+ 3.124574594380688e-05,
2408
+ 3.094895132568263e-05,
2409
+ 3.065215670755838e-05,
2410
+ 3.0355362089434113e-05,
2411
+ 3.0058567471309854e-05,
2412
+ 2.97617728531856e-05,
2413
+ 2.9464978235061336e-05,
2414
+ 2.9168183616937077e-05,
2415
+ 2.8871388998812818e-05,
2416
+ 2.857459438068857e-05,
2417
+ 2.8277799762564307e-05,
2418
+ 2.798100514444005e-05,
2419
+ 2.7684210526315793e-05,
2420
+ 2.738741590819153e-05,
2421
+ 2.709062129006727e-05,
2422
+ 2.6793826671943013e-05,
2423
+ 2.6497032053818764e-05,
2424
+ 2.62002374356945e-05,
2425
+ 2.5903442817570243e-05,
2426
+ 2.5606648199445987e-05,
2427
+ 2.5309853581321725e-05,
2428
+ 2.5013058963197466e-05,
2429
+ 2.4716264345073214e-05,
2430
+ 2.441946972694896e-05,
2431
+ 2.4122675108824693e-05,
2432
+ 2.3825880490700434e-05,
2433
+ 2.352908587257618e-05,
2434
+ 2.3232291254451916e-05,
2435
+ 2.293549663632766e-05,
2436
+ 2.2638702018203408e-05,
2437
+ 2.226474079936684e-05,
2438
+ 2.196794618124258e-05,
2439
+ 2.1671151563118328e-05,
2440
+ 2.1374356944994066e-05,
2441
+ 2.1077562326869803e-05,
2442
+ 2.0780767708745554e-05,
2443
+ 2.0483973090621296e-05,
2444
+ 2.018717847249703e-05,
2445
+ 1.989038385437277e-05,
2446
+ 1.959358923624852e-05,
2447
+ 1.929679461812426e-05,
2448
+ 1.8999999999999998e-05,
2449
+ 1.8703205381875746e-05,
2450
+ 1.8406410763751487e-05,
2451
+ 1.8109616145627224e-05,
2452
+ 1.7812821527502965e-05,
2453
+ 1.7516026909378713e-05,
2454
+ 1.7219232291254454e-05,
2455
+ 1.6922437673130192e-05,
2456
+ 1.662564305500594e-05,
2457
+ 1.632884843688168e-05,
2458
+ 1.603205381875742e-05,
2459
+ 1.573525920063316e-05,
2460
+ 1.5438464582508908e-05,
2461
+ 1.5141669964384647e-05,
2462
+ 1.4844875346260385e-05,
2463
+ 1.4548080728136134e-05,
2464
+ 1.4251286110011875e-05,
2465
+ 1.3954491491887611e-05,
2466
+ 1.3657696873763363e-05,
2467
+ 1.33609022556391e-05,
2468
+ 1.298694103680253e-05,
2469
+ 1.2690146418678277e-05,
2470
+ 1.2393351800554018e-05,
2471
+ 1.2096557182429756e-05,
2472
+ 1.1799762564305506e-05,
2473
+ 1.1502967946181245e-05,
2474
+ 1.1206173328056984e-05,
2475
+ 1.0909378709932724e-05,
2476
+ 1.0612584091808472e-05,
2477
+ 1.0315789473684213e-05,
2478
+ 1.0018994855559949e-05,
2479
+ 9.7222002374357e-06,
2480
+ 9.425405619311438e-06,
2481
+ 9.128611001187177e-06,
2482
+ 8.831816383062916e-06,
2483
+ 8.535021764938666e-06,
2484
+ 8.238227146814405e-06,
2485
+ 7.941432528690143e-06,
2486
+ 7.644637910565893e-06,
2487
+ 7.347843292441632e-06,
2488
+ 7.0510486743173715e-06,
2489
+ 6.75425405619311e-06,
2490
+ 6.45745943806886e-06,
2491
+ 6.160664819944598e-06,
2492
+ 5.8638702018203375e-06,
2493
+ 5.567075583696086e-06,
2494
+ 5.270280965571826e-06,
2495
+ 4.973486347447565e-06,
2496
+ 4.676691729323314e-06,
2497
+ 4.379897111199053e-06,
2498
+ 4.083102493074792e-06
2499
+ ],
2500
+ "emb_lr": [],
2501
+ "eval_step": [
2502
+ 1550,
2503
+ 3113,
2504
+ 4676,
2505
+ 6239,
2506
+ 7802,
2507
+ 9365,
2508
+ 10928,
2509
+ 12491,
2510
+ 14054,
2511
+ 15617
2512
+ ],
2513
+ "eval_accuracy": [
2514
+ 0.0,
2515
+ 0.0,
2516
+ 0.0,
2517
+ 0.0,
2518
+ 0.0,
2519
+ 0.0,
2520
+ 0.0,
2521
+ 0.0,
2522
+ 0.0,
2523
+ 0.0
2524
+ ]
2525
+ },
2526
+ "final_accuracy": 1.0,
2527
+ "sft_eval": {
2528
+ "config": {
2529
+ "ops": "add_sub",
2530
+ "K": null,
2531
+ "mode": "sft",
2532
+ "n_digits": 6,
2533
+ "n_per_split": 100
2534
+ },
2535
+ "splits": {
2536
+ "add_S0": {
2537
+ "full_accuracy": 1.0,
2538
+ "n_examples": 100,
2539
+ "per_subtask": {
2540
+ "SA": {
2541
+ "accuracy": 1.0,
2542
+ "count": 605
2543
+ },
2544
+ "SS": {
2545
+ "accuracy": 1.0,
2546
+ "count": 95
2547
+ }
2548
+ }
2549
+ },
2550
+ "add_S1": {
2551
+ "full_accuracy": 1.0,
2552
+ "n_examples": 100,
2553
+ "per_subtask": {
2554
+ "SA": {
2555
+ "accuracy": 1.0,
2556
+ "count": 204
2557
+ },
2558
+ "SC": {
2559
+ "accuracy": 1.0,
2560
+ "count": 169
2561
+ },
2562
+ "SS": {
2563
+ "accuracy": 1.0,
2564
+ "count": 31
2565
+ },
2566
+ "UC": {
2567
+ "accuracy": 1.0,
2568
+ "count": 296
2569
+ }
2570
+ }
2571
+ },
2572
+ "add_S2": {
2573
+ "full_accuracy": 1.0,
2574
+ "n_examples": 100,
2575
+ "per_subtask": {
2576
+ "SA": {
2577
+ "accuracy": 1.0,
2578
+ "count": 163
2579
+ },
2580
+ "SC": {
2581
+ "accuracy": 1.0,
2582
+ "count": 130
2583
+ },
2584
+ "SS": {
2585
+ "accuracy": 1.0,
2586
+ "count": 87
2587
+ },
2588
+ "UC": {
2589
+ "accuracy": 1.0,
2590
+ "count": 203
2591
+ },
2592
+ "US": {
2593
+ "accuracy": 1.0,
2594
+ "count": 117
2595
+ }
2596
+ }
2597
+ },
2598
+ "add_S3": {
2599
+ "full_accuracy": 1.0,
2600
+ "n_examples": 100,
2601
+ "per_subtask": {
2602
+ "SA": {
2603
+ "accuracy": 1.0,
2604
+ "count": 121
2605
+ },
2606
+ "SC": {
2607
+ "accuracy": 1.0,
2608
+ "count": 121
2609
+ },
2610
+ "SS": {
2611
+ "accuracy": 1.0,
2612
+ "count": 49
2613
+ },
2614
+ "UC": {
2615
+ "accuracy": 1.0,
2616
+ "count": 186
2617
+ },
2618
+ "US": {
2619
+ "accuracy": 1.0,
2620
+ "count": 223
2621
+ }
2622
+ }
2623
+ },
2624
+ "add_S4": {
2625
+ "full_accuracy": 1.0,
2626
+ "n_examples": 100,
2627
+ "per_subtask": {
2628
+ "SA": {
2629
+ "accuracy": 1.0,
2630
+ "count": 104
2631
+ },
2632
+ "SC": {
2633
+ "accuracy": 1.0,
2634
+ "count": 106
2635
+ },
2636
+ "SS": {
2637
+ "accuracy": 1.0,
2638
+ "count": 23
2639
+ },
2640
+ "UC": {
2641
+ "accuracy": 1.0,
2642
+ "count": 160
2643
+ },
2644
+ "US": {
2645
+ "accuracy": 1.0,
2646
+ "count": 307
2647
+ }
2648
+ }
2649
+ },
2650
+ "add_S5": {
2651
+ "full_accuracy": 1.0,
2652
+ "n_examples": 100,
2653
+ "per_subtask": {
2654
+ "SA": {
2655
+ "accuracy": 1.0,
2656
+ "count": 100
2657
+ },
2658
+ "SC": {
2659
+ "accuracy": 1.0,
2660
+ "count": 100
2661
+ },
2662
+ "UC": {
2663
+ "accuracy": 1.0,
2664
+ "count": 100
2665
+ },
2666
+ "US": {
2667
+ "accuracy": 1.0,
2668
+ "count": 400
2669
+ }
2670
+ }
2671
+ },
2672
+ "add_S6": {
2673
+ "full_accuracy": 1.0,
2674
+ "n_examples": 100,
2675
+ "per_subtask": {
2676
+ "SC": {
2677
+ "accuracy": 1.0,
2678
+ "count": 100
2679
+ },
2680
+ "UC": {
2681
+ "accuracy": 1.0,
2682
+ "count": 100
2683
+ },
2684
+ "US": {
2685
+ "accuracy": 1.0,
2686
+ "count": 500
2687
+ }
2688
+ }
2689
+ },
2690
+ "add_random": {
2691
+ "full_accuracy": 1.0,
2692
+ "n_examples": 200,
2693
+ "per_subtask": {
2694
+ "SA": {
2695
+ "accuracy": 1.0,
2696
+ "count": 447
2697
+ },
2698
+ "SC": {
2699
+ "accuracy": 1.0,
2700
+ "count": 320
2701
+ },
2702
+ "SS": {
2703
+ "accuracy": 1.0,
2704
+ "count": 56
2705
+ },
2706
+ "UC": {
2707
+ "accuracy": 1.0,
2708
+ "count": 529
2709
+ },
2710
+ "US": {
2711
+ "accuracy": 1.0,
2712
+ "count": 48
2713
+ }
2714
+ }
2715
+ },
2716
+ "add_C3": {
2717
+ "full_accuracy": 1.0,
2718
+ "n_examples": 100,
2719
+ "per_subtask": {
2720
+ "SA": {
2721
+ "accuracy": 1.0,
2722
+ "count": 300
2723
+ },
2724
+ "SC": {
2725
+ "accuracy": 1.0,
2726
+ "count": 100
2727
+ },
2728
+ "UC": {
2729
+ "accuracy": 1.0,
2730
+ "count": 193
2731
+ },
2732
+ "US": {
2733
+ "accuracy": 1.0,
2734
+ "count": 107
2735
+ }
2736
+ }
2737
+ },
2738
+ "add_C4": {
2739
+ "full_accuracy": 0.99,
2740
+ "n_examples": 100,
2741
+ "per_subtask": {
2742
+ "SA": {
2743
+ "accuracy": 1.0,
2744
+ "count": 200
2745
+ },
2746
+ "SC": {
2747
+ "accuracy": 1.0,
2748
+ "count": 100
2749
+ },
2750
+ "UC": {
2751
+ "accuracy": 0.99609375,
2752
+ "count": 256
2753
+ },
2754
+ "US": {
2755
+ "accuracy": 1.0,
2756
+ "count": 144
2757
+ }
2758
+ }
2759
+ },
2760
+ "add_C5": {
2761
+ "full_accuracy": 1.0,
2762
+ "n_examples": 100,
2763
+ "per_subtask": {
2764
+ "SA": {
2765
+ "accuracy": 1.0,
2766
+ "count": 100
2767
+ },
2768
+ "SC": {
2769
+ "accuracy": 1.0,
2770
+ "count": 100
2771
+ },
2772
+ "UC": {
2773
+ "accuracy": 1.0,
2774
+ "count": 306
2775
+ },
2776
+ "US": {
2777
+ "accuracy": 1.0,
2778
+ "count": 194
2779
+ }
2780
+ }
2781
+ },
2782
+ "add_C6": {
2783
+ "full_accuracy": 1.0,
2784
+ "n_examples": 100,
2785
+ "per_subtask": {
2786
+ "SC": {
2787
+ "accuracy": 1.0,
2788
+ "count": 100
2789
+ },
2790
+ "UC": {
2791
+ "accuracy": 1.0,
2792
+ "count": 366
2793
+ },
2794
+ "US": {
2795
+ "accuracy": 1.0,
2796
+ "count": 234
2797
+ }
2798
+ }
2799
+ },
2800
+ "sub_M0": {
2801
+ "full_accuracy": 1.0,
2802
+ "n_examples": 100,
2803
+ "per_subtask": {
2804
+ "MD": {
2805
+ "accuracy": 1.0,
2806
+ "count": 601
2807
+ },
2808
+ "ME": {
2809
+ "accuracy": 1.0,
2810
+ "count": 99
2811
+ }
2812
+ }
2813
+ },
2814
+ "sub_M1": {
2815
+ "full_accuracy": 1.0,
2816
+ "n_examples": 100,
2817
+ "per_subtask": {
2818
+ "MD": {
2819
+ "accuracy": 1.0,
2820
+ "count": 279
2821
+ },
2822
+ "MB": {
2823
+ "accuracy": 1.0,
2824
+ "count": 145
2825
+ },
2826
+ "ME": {
2827
+ "accuracy": 1.0,
2828
+ "count": 24
2829
+ },
2830
+ "UB": {
2831
+ "accuracy": 1.0,
2832
+ "count": 252
2833
+ }
2834
+ }
2835
+ },
2836
+ "sub_M2": {
2837
+ "full_accuracy": 1.0,
2838
+ "n_examples": 100,
2839
+ "per_subtask": {
2840
+ "MD": {
2841
+ "accuracy": 1.0,
2842
+ "count": 213
2843
+ },
2844
+ "MB": {
2845
+ "accuracy": 1.0,
2846
+ "count": 113
2847
+ },
2848
+ "ME": {
2849
+ "accuracy": 1.0,
2850
+ "count": 85
2851
+ },
2852
+ "UB": {
2853
+ "accuracy": 1.0,
2854
+ "count": 181
2855
+ },
2856
+ "UD": {
2857
+ "accuracy": 1.0,
2858
+ "count": 108
2859
+ }
2860
+ }
2861
+ },
2862
+ "sub_M3": {
2863
+ "full_accuracy": 1.0,
2864
+ "n_examples": 100,
2865
+ "per_subtask": {
2866
+ "MD": {
2867
+ "accuracy": 1.0,
2868
+ "count": 179
2869
+ },
2870
+ "MB": {
2871
+ "accuracy": 1.0,
2872
+ "count": 103
2873
+ },
2874
+ "ME": {
2875
+ "accuracy": 1.0,
2876
+ "count": 56
2877
+ },
2878
+ "UB": {
2879
+ "accuracy": 1.0,
2880
+ "count": 149
2881
+ },
2882
+ "UD": {
2883
+ "accuracy": 1.0,
2884
+ "count": 213
2885
+ }
2886
+ }
2887
+ },
2888
+ "sub_M4": {
2889
+ "full_accuracy": 1.0,
2890
+ "n_examples": 100,
2891
+ "per_subtask": {
2892
+ "MD": {
2893
+ "accuracy": 1.0,
2894
+ "count": 200
2895
+ },
2896
+ "MB": {
2897
+ "accuracy": 1.0,
2898
+ "count": 100
2899
+ },
2900
+ "UB": {
2901
+ "accuracy": 1.0,
2902
+ "count": 100
2903
+ },
2904
+ "UD": {
2905
+ "accuracy": 1.0,
2906
+ "count": 300
2907
+ }
2908
+ }
2909
+ },
2910
+ "sub_M5": {
2911
+ "full_accuracy": 1.0,
2912
+ "n_examples": 100,
2913
+ "per_subtask": {
2914
+ "MD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 100
2917
+ },
2918
+ "MB": {
2919
+ "accuracy": 1.0,
2920
+ "count": 100
2921
+ },
2922
+ "UB": {
2923
+ "accuracy": 1.0,
2924
+ "count": 100
2925
+ },
2926
+ "UD": {
2927
+ "accuracy": 1.0,
2928
+ "count": 400
2929
+ }
2930
+ }
2931
+ },
2932
+ "sub_random": {
2933
+ "full_accuracy": 1.0,
2934
+ "n_examples": 200,
2935
+ "per_subtask": {
2936
+ "MD": {
2937
+ "accuracy": 1.0,
2938
+ "count": 600
2939
+ },
2940
+ "MB": {
2941
+ "accuracy": 1.0,
2942
+ "count": 267
2943
+ },
2944
+ "ME": {
2945
+ "accuracy": 1.0,
2946
+ "count": 53
2947
+ },
2948
+ "UB": {
2949
+ "accuracy": 1.0,
2950
+ "count": 439
2951
+ },
2952
+ "UD": {
2953
+ "accuracy": 1.0,
2954
+ "count": 41
2955
+ }
2956
+ }
2957
+ },
2958
+ "sub_B3": {
2959
+ "full_accuracy": 1.0,
2960
+ "n_examples": 100,
2961
+ "per_subtask": {
2962
+ "MD": {
2963
+ "accuracy": 1.0,
2964
+ "count": 300
2965
+ },
2966
+ "MB": {
2967
+ "accuracy": 1.0,
2968
+ "count": 100
2969
+ },
2970
+ "UB": {
2971
+ "accuracy": 1.0,
2972
+ "count": 197
2973
+ },
2974
+ "UD": {
2975
+ "accuracy": 1.0,
2976
+ "count": 103
2977
+ }
2978
+ }
2979
+ },
2980
+ "sub_B4": {
2981
+ "full_accuracy": 1.0,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "MD": {
2985
+ "accuracy": 1.0,
2986
+ "count": 200
2987
+ },
2988
+ "MB": {
2989
+ "accuracy": 1.0,
2990
+ "count": 100
2991
+ },
2992
+ "UB": {
2993
+ "accuracy": 1.0,
2994
+ "count": 247
2995
+ },
2996
+ "UD": {
2997
+ "accuracy": 1.0,
2998
+ "count": 153
2999
+ }
3000
+ }
3001
+ },
3002
+ "sub_B5": {
3003
+ "full_accuracy": 1.0,
3004
+ "n_examples": 100,
3005
+ "per_subtask": {
3006
+ "MD": {
3007
+ "accuracy": 1.0,
3008
+ "count": 100
3009
+ },
3010
+ "MB": {
3011
+ "accuracy": 1.0,
3012
+ "count": 100
3013
+ },
3014
+ "UB": {
3015
+ "accuracy": 1.0,
3016
+ "count": 298
3017
+ },
3018
+ "UD": {
3019
+ "accuracy": 1.0,
3020
+ "count": 202
3021
+ }
3022
+ }
3023
+ }
3024
+ },
3025
+ "summary": {
3026
+ "overall_accuracy": 0.9995833333333334,
3027
+ "total_examples": 2400,
3028
+ "n_splits": 22
3029
+ }
3030
+ },
3031
+ "sorl_eval": {
3032
+ "config": {
3033
+ "ops": "add_sub",
3034
+ "K": 1,
3035
+ "mode": "sorl",
3036
+ "n_digits": 6,
3037
+ "n_per_split": 100
3038
+ },
3039
+ "splits": {
3040
+ "add_S0": {
3041
+ "full_accuracy": 1.0,
3042
+ "n_examples": 100,
3043
+ "per_subtask": {
3044
+ "SA": {
3045
+ "accuracy": 1.0,
3046
+ "count": 605
3047
+ },
3048
+ "SS": {
3049
+ "accuracy": 1.0,
3050
+ "count": 95
3051
+ }
3052
+ }
3053
+ },
3054
+ "add_S1": {
3055
+ "full_accuracy": 1.0,
3056
+ "n_examples": 100,
3057
+ "per_subtask": {
3058
+ "SA": {
3059
+ "accuracy": 1.0,
3060
+ "count": 204
3061
+ },
3062
+ "SC": {
3063
+ "accuracy": 1.0,
3064
+ "count": 169
3065
+ },
3066
+ "SS": {
3067
+ "accuracy": 1.0,
3068
+ "count": 31
3069
+ },
3070
+ "UC": {
3071
+ "accuracy": 1.0,
3072
+ "count": 296
3073
+ }
3074
+ }
3075
+ },
3076
+ "add_S2": {
3077
+ "full_accuracy": 1.0,
3078
+ "n_examples": 100,
3079
+ "per_subtask": {
3080
+ "SA": {
3081
+ "accuracy": 1.0,
3082
+ "count": 163
3083
+ },
3084
+ "SC": {
3085
+ "accuracy": 1.0,
3086
+ "count": 130
3087
+ },
3088
+ "SS": {
3089
+ "accuracy": 1.0,
3090
+ "count": 87
3091
+ },
3092
+ "UC": {
3093
+ "accuracy": 1.0,
3094
+ "count": 203
3095
+ },
3096
+ "US": {
3097
+ "accuracy": 1.0,
3098
+ "count": 117
3099
+ }
3100
+ }
3101
+ },
3102
+ "add_S3": {
3103
+ "full_accuracy": 1.0,
3104
+ "n_examples": 100,
3105
+ "per_subtask": {
3106
+ "SA": {
3107
+ "accuracy": 1.0,
3108
+ "count": 121
3109
+ },
3110
+ "SC": {
3111
+ "accuracy": 1.0,
3112
+ "count": 121
3113
+ },
3114
+ "SS": {
3115
+ "accuracy": 1.0,
3116
+ "count": 49
3117
+ },
3118
+ "UC": {
3119
+ "accuracy": 1.0,
3120
+ "count": 186
3121
+ },
3122
+ "US": {
3123
+ "accuracy": 1.0,
3124
+ "count": 223
3125
+ }
3126
+ }
3127
+ },
3128
+ "add_S4": {
3129
+ "full_accuracy": 1.0,
3130
+ "n_examples": 100,
3131
+ "per_subtask": {
3132
+ "SA": {
3133
+ "accuracy": 1.0,
3134
+ "count": 104
3135
+ },
3136
+ "SC": {
3137
+ "accuracy": 1.0,
3138
+ "count": 106
3139
+ },
3140
+ "SS": {
3141
+ "accuracy": 1.0,
3142
+ "count": 23
3143
+ },
3144
+ "UC": {
3145
+ "accuracy": 1.0,
3146
+ "count": 160
3147
+ },
3148
+ "US": {
3149
+ "accuracy": 1.0,
3150
+ "count": 307
3151
+ }
3152
+ }
3153
+ },
3154
+ "add_S5": {
3155
+ "full_accuracy": 1.0,
3156
+ "n_examples": 100,
3157
+ "per_subtask": {
3158
+ "SA": {
3159
+ "accuracy": 1.0,
3160
+ "count": 100
3161
+ },
3162
+ "SC": {
3163
+ "accuracy": 1.0,
3164
+ "count": 100
3165
+ },
3166
+ "UC": {
3167
+ "accuracy": 1.0,
3168
+ "count": 100
3169
+ },
3170
+ "US": {
3171
+ "accuracy": 1.0,
3172
+ "count": 400
3173
+ }
3174
+ }
3175
+ },
3176
+ "add_S6": {
3177
+ "full_accuracy": 1.0,
3178
+ "n_examples": 100,
3179
+ "per_subtask": {
3180
+ "SC": {
3181
+ "accuracy": 1.0,
3182
+ "count": 100
3183
+ },
3184
+ "UC": {
3185
+ "accuracy": 1.0,
3186
+ "count": 100
3187
+ },
3188
+ "US": {
3189
+ "accuracy": 1.0,
3190
+ "count": 500
3191
+ }
3192
+ }
3193
+ },
3194
+ "add_random": {
3195
+ "full_accuracy": 1.0,
3196
+ "n_examples": 200,
3197
+ "per_subtask": {
3198
+ "SA": {
3199
+ "accuracy": 1.0,
3200
+ "count": 447
3201
+ },
3202
+ "SC": {
3203
+ "accuracy": 1.0,
3204
+ "count": 320
3205
+ },
3206
+ "SS": {
3207
+ "accuracy": 1.0,
3208
+ "count": 56
3209
+ },
3210
+ "UC": {
3211
+ "accuracy": 1.0,
3212
+ "count": 529
3213
+ },
3214
+ "US": {
3215
+ "accuracy": 1.0,
3216
+ "count": 48
3217
+ }
3218
+ }
3219
+ },
3220
+ "add_C3": {
3221
+ "full_accuracy": 1.0,
3222
+ "n_examples": 100,
3223
+ "per_subtask": {
3224
+ "SA": {
3225
+ "accuracy": 1.0,
3226
+ "count": 300
3227
+ },
3228
+ "SC": {
3229
+ "accuracy": 1.0,
3230
+ "count": 100
3231
+ },
3232
+ "UC": {
3233
+ "accuracy": 1.0,
3234
+ "count": 193
3235
+ },
3236
+ "US": {
3237
+ "accuracy": 1.0,
3238
+ "count": 107
3239
+ }
3240
+ }
3241
+ },
3242
+ "add_C4": {
3243
+ "full_accuracy": 1.0,
3244
+ "n_examples": 100,
3245
+ "per_subtask": {
3246
+ "SA": {
3247
+ "accuracy": 1.0,
3248
+ "count": 200
3249
+ },
3250
+ "SC": {
3251
+ "accuracy": 1.0,
3252
+ "count": 100
3253
+ },
3254
+ "UC": {
3255
+ "accuracy": 1.0,
3256
+ "count": 256
3257
+ },
3258
+ "US": {
3259
+ "accuracy": 1.0,
3260
+ "count": 144
3261
+ }
3262
+ }
3263
+ },
3264
+ "add_C5": {
3265
+ "full_accuracy": 1.0,
3266
+ "n_examples": 100,
3267
+ "per_subtask": {
3268
+ "SA": {
3269
+ "accuracy": 1.0,
3270
+ "count": 100
3271
+ },
3272
+ "SC": {
3273
+ "accuracy": 1.0,
3274
+ "count": 100
3275
+ },
3276
+ "UC": {
3277
+ "accuracy": 1.0,
3278
+ "count": 306
3279
+ },
3280
+ "US": {
3281
+ "accuracy": 1.0,
3282
+ "count": 194
3283
+ }
3284
+ }
3285
+ },
3286
+ "add_C6": {
3287
+ "full_accuracy": 1.0,
3288
+ "n_examples": 100,
3289
+ "per_subtask": {
3290
+ "SC": {
3291
+ "accuracy": 1.0,
3292
+ "count": 100
3293
+ },
3294
+ "UC": {
3295
+ "accuracy": 1.0,
3296
+ "count": 366
3297
+ },
3298
+ "US": {
3299
+ "accuracy": 1.0,
3300
+ "count": 234
3301
+ }
3302
+ }
3303
+ },
3304
+ "sub_M0": {
3305
+ "full_accuracy": 1.0,
3306
+ "n_examples": 100,
3307
+ "per_subtask": {
3308
+ "MD": {
3309
+ "accuracy": 1.0,
3310
+ "count": 601
3311
+ },
3312
+ "ME": {
3313
+ "accuracy": 1.0,
3314
+ "count": 99
3315
+ }
3316
+ }
3317
+ },
3318
+ "sub_M1": {
3319
+ "full_accuracy": 1.0,
3320
+ "n_examples": 100,
3321
+ "per_subtask": {
3322
+ "MD": {
3323
+ "accuracy": 1.0,
3324
+ "count": 279
3325
+ },
3326
+ "MB": {
3327
+ "accuracy": 1.0,
3328
+ "count": 145
3329
+ },
3330
+ "ME": {
3331
+ "accuracy": 1.0,
3332
+ "count": 24
3333
+ },
3334
+ "UB": {
3335
+ "accuracy": 1.0,
3336
+ "count": 252
3337
+ }
3338
+ }
3339
+ },
3340
+ "sub_M2": {
3341
+ "full_accuracy": 1.0,
3342
+ "n_examples": 100,
3343
+ "per_subtask": {
3344
+ "MD": {
3345
+ "accuracy": 1.0,
3346
+ "count": 213
3347
+ },
3348
+ "MB": {
3349
+ "accuracy": 1.0,
3350
+ "count": 113
3351
+ },
3352
+ "ME": {
3353
+ "accuracy": 1.0,
3354
+ "count": 85
3355
+ },
3356
+ "UB": {
3357
+ "accuracy": 1.0,
3358
+ "count": 181
3359
+ },
3360
+ "UD": {
3361
+ "accuracy": 1.0,
3362
+ "count": 108
3363
+ }
3364
+ }
3365
+ },
3366
+ "sub_M3": {
3367
+ "full_accuracy": 1.0,
3368
+ "n_examples": 100,
3369
+ "per_subtask": {
3370
+ "MD": {
3371
+ "accuracy": 1.0,
3372
+ "count": 179
3373
+ },
3374
+ "MB": {
3375
+ "accuracy": 1.0,
3376
+ "count": 103
3377
+ },
3378
+ "ME": {
3379
+ "accuracy": 1.0,
3380
+ "count": 56
3381
+ },
3382
+ "UB": {
3383
+ "accuracy": 1.0,
3384
+ "count": 149
3385
+ },
3386
+ "UD": {
3387
+ "accuracy": 1.0,
3388
+ "count": 213
3389
+ }
3390
+ }
3391
+ },
3392
+ "sub_M4": {
3393
+ "full_accuracy": 1.0,
3394
+ "n_examples": 100,
3395
+ "per_subtask": {
3396
+ "MD": {
3397
+ "accuracy": 1.0,
3398
+ "count": 200
3399
+ },
3400
+ "MB": {
3401
+ "accuracy": 1.0,
3402
+ "count": 100
3403
+ },
3404
+ "UB": {
3405
+ "accuracy": 1.0,
3406
+ "count": 100
3407
+ },
3408
+ "UD": {
3409
+ "accuracy": 1.0,
3410
+ "count": 300
3411
+ }
3412
+ }
3413
+ },
3414
+ "sub_M5": {
3415
+ "full_accuracy": 1.0,
3416
+ "n_examples": 100,
3417
+ "per_subtask": {
3418
+ "MD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 100
3421
+ },
3422
+ "MB": {
3423
+ "accuracy": 1.0,
3424
+ "count": 100
3425
+ },
3426
+ "UB": {
3427
+ "accuracy": 1.0,
3428
+ "count": 100
3429
+ },
3430
+ "UD": {
3431
+ "accuracy": 1.0,
3432
+ "count": 400
3433
+ }
3434
+ }
3435
+ },
3436
+ "sub_random": {
3437
+ "full_accuracy": 1.0,
3438
+ "n_examples": 200,
3439
+ "per_subtask": {
3440
+ "MD": {
3441
+ "accuracy": 1.0,
3442
+ "count": 600
3443
+ },
3444
+ "MB": {
3445
+ "accuracy": 1.0,
3446
+ "count": 267
3447
+ },
3448
+ "ME": {
3449
+ "accuracy": 1.0,
3450
+ "count": 53
3451
+ },
3452
+ "UB": {
3453
+ "accuracy": 1.0,
3454
+ "count": 439
3455
+ },
3456
+ "UD": {
3457
+ "accuracy": 1.0,
3458
+ "count": 41
3459
+ }
3460
+ }
3461
+ },
3462
+ "sub_B3": {
3463
+ "full_accuracy": 1.0,
3464
+ "n_examples": 100,
3465
+ "per_subtask": {
3466
+ "MD": {
3467
+ "accuracy": 1.0,
3468
+ "count": 300
3469
+ },
3470
+ "MB": {
3471
+ "accuracy": 1.0,
3472
+ "count": 100
3473
+ },
3474
+ "UB": {
3475
+ "accuracy": 1.0,
3476
+ "count": 197
3477
+ },
3478
+ "UD": {
3479
+ "accuracy": 1.0,
3480
+ "count": 103
3481
+ }
3482
+ }
3483
+ },
3484
+ "sub_B4": {
3485
+ "full_accuracy": 1.0,
3486
+ "n_examples": 100,
3487
+ "per_subtask": {
3488
+ "MD": {
3489
+ "accuracy": 1.0,
3490
+ "count": 200
3491
+ },
3492
+ "MB": {
3493
+ "accuracy": 1.0,
3494
+ "count": 100
3495
+ },
3496
+ "UB": {
3497
+ "accuracy": 1.0,
3498
+ "count": 247
3499
+ },
3500
+ "UD": {
3501
+ "accuracy": 1.0,
3502
+ "count": 153
3503
+ }
3504
+ }
3505
+ },
3506
+ "sub_B5": {
3507
+ "full_accuracy": 1.0,
3508
+ "n_examples": 100,
3509
+ "per_subtask": {
3510
+ "MD": {
3511
+ "accuracy": 1.0,
3512
+ "count": 100
3513
+ },
3514
+ "MB": {
3515
+ "accuracy": 1.0,
3516
+ "count": 100
3517
+ },
3518
+ "UB": {
3519
+ "accuracy": 1.0,
3520
+ "count": 298
3521
+ },
3522
+ "UD": {
3523
+ "accuracy": 1.0,
3524
+ "count": 202
3525
+ }
3526
+ }
3527
+ }
3528
+ },
3529
+ "summary": {
3530
+ "overall_accuracy": 1.0,
3531
+ "total_examples": 2400,
3532
+ "n_splits": 22
3533
+ }
3534
+ },
3535
+ "sorl_overall_accuracy": 1.0,
3536
+ "sft_overall_accuracy": 0.9995833333333334
3537
+ }
add_sub_sorl_v1_abs100_K1_100K/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:e2a8948743a446223e5d1ceddd65f06af08219a1593d6ddc749c71730e85b855
3
+ size 650671040
add_sub_sorl_v1_abs100_K1_100K/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 1,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 4e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 10,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 1562,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs100_K1_100K",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 2,
61
+ "n_head": 3,
62
+ "n_embd": 510,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 100,
65
+ "dataset_size": 100000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 162591062,
71
+ "run_name": "add_sub_sorl_v1_abs100_K1_100K",
72
+ "git_commit": "f447da529caceac8c7d256cbb2cd185cbc50feac",
73
+ "timestamp": "2026-04-12T10:09:33.195768+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "xxyqyffy",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/xxyqyffy",
81
+ "final_accuracy": 1.0,
82
+ "sft_accuracy": 0.9995833333333334,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }