amirali1985 commited on
Commit
7647fd5
·
verified ·
1 Parent(s): 418d1cd

Upload add_sub_sorl_v1_abs30_K1_100K

Browse files
add_sub_sorl_v1_abs30_K1_100K/config.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 510,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 2040,
15
+ "layer_types": [
16
+ "full_attention",
17
+ "full_attention"
18
+ ],
19
+ "max_position_embeddings": 128,
20
+ "max_window_layers": 28,
21
+ "model_type": "qwen3",
22
+ "num_attention_heads": 3,
23
+ "num_hidden_layers": 2,
24
+ "num_key_value_heads": 3,
25
+ "pad_token_id": null,
26
+ "rms_norm_eps": 1e-06,
27
+ "rope_parameters": {
28
+ "rope_theta": 10000.0,
29
+ "rope_type": "default"
30
+ },
31
+ "sliding_window": null,
32
+ "tie_word_embeddings": false,
33
+ "transformers_version": "5.5.0",
34
+ "use_cache": true,
35
+ "use_sliding_window": false,
36
+ "vocab_size": 151674
37
+ }
add_sub_sorl_v1_abs30_K1_100K/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs30_K1_100K/metrics.json ADDED
@@ -0,0 +1,3537 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 800,
20
+ 850,
21
+ 900,
22
+ 950,
23
+ 1000,
24
+ 1050,
25
+ 1100,
26
+ 1150,
27
+ 1200,
28
+ 1250,
29
+ 1300,
30
+ 1350,
31
+ 1400,
32
+ 1450,
33
+ 1500,
34
+ 1550,
35
+ 1613,
36
+ 1663,
37
+ 1713,
38
+ 1763,
39
+ 1813,
40
+ 1863,
41
+ 1913,
42
+ 1963,
43
+ 2013,
44
+ 2063,
45
+ 2113,
46
+ 2163,
47
+ 2213,
48
+ 2263,
49
+ 2313,
50
+ 2363,
51
+ 2413,
52
+ 2463,
53
+ 2513,
54
+ 2563,
55
+ 2613,
56
+ 2663,
57
+ 2713,
58
+ 2763,
59
+ 2813,
60
+ 2863,
61
+ 2913,
62
+ 2963,
63
+ 3013,
64
+ 3063,
65
+ 3113,
66
+ 3176,
67
+ 3226,
68
+ 3276,
69
+ 3326,
70
+ 3376,
71
+ 3426,
72
+ 3476,
73
+ 3526,
74
+ 3576,
75
+ 3626,
76
+ 3676,
77
+ 3726,
78
+ 3776,
79
+ 3826,
80
+ 3876,
81
+ 3926,
82
+ 3976,
83
+ 4026,
84
+ 4076,
85
+ 4126,
86
+ 4176,
87
+ 4226,
88
+ 4276,
89
+ 4326,
90
+ 4376,
91
+ 4426,
92
+ 4476,
93
+ 4526,
94
+ 4576,
95
+ 4626,
96
+ 4676,
97
+ 4739,
98
+ 4789,
99
+ 4839,
100
+ 4889,
101
+ 4939,
102
+ 4989,
103
+ 5039,
104
+ 5089,
105
+ 5139,
106
+ 5189,
107
+ 5239,
108
+ 5289,
109
+ 5339,
110
+ 5389,
111
+ 5439,
112
+ 5489,
113
+ 5539,
114
+ 5589,
115
+ 5639,
116
+ 5689,
117
+ 5739,
118
+ 5789,
119
+ 5839,
120
+ 5889,
121
+ 5939,
122
+ 5989,
123
+ 6039,
124
+ 6089,
125
+ 6139,
126
+ 6189,
127
+ 6239,
128
+ 6302,
129
+ 6352,
130
+ 6402,
131
+ 6452,
132
+ 6502,
133
+ 6552,
134
+ 6602,
135
+ 6652,
136
+ 6702,
137
+ 6752,
138
+ 6802,
139
+ 6852,
140
+ 6902,
141
+ 6952,
142
+ 7002,
143
+ 7052,
144
+ 7102,
145
+ 7152,
146
+ 7202,
147
+ 7252,
148
+ 7302,
149
+ 7352,
150
+ 7402,
151
+ 7452,
152
+ 7502,
153
+ 7552,
154
+ 7602,
155
+ 7652,
156
+ 7702,
157
+ 7752,
158
+ 7802,
159
+ 7865,
160
+ 7915,
161
+ 7965,
162
+ 8015,
163
+ 8065,
164
+ 8115,
165
+ 8165,
166
+ 8215,
167
+ 8265,
168
+ 8315,
169
+ 8365,
170
+ 8415,
171
+ 8465,
172
+ 8515,
173
+ 8565,
174
+ 8615,
175
+ 8665,
176
+ 8715,
177
+ 8765,
178
+ 8815,
179
+ 8865,
180
+ 8915,
181
+ 8965,
182
+ 9015,
183
+ 9065,
184
+ 9115,
185
+ 9165,
186
+ 9215,
187
+ 9265,
188
+ 9315,
189
+ 9365,
190
+ 9428,
191
+ 9478,
192
+ 9528,
193
+ 9578,
194
+ 9628,
195
+ 9678,
196
+ 9728,
197
+ 9778,
198
+ 9828,
199
+ 9878,
200
+ 9928,
201
+ 9978,
202
+ 10028,
203
+ 10078,
204
+ 10128,
205
+ 10178,
206
+ 10228,
207
+ 10278,
208
+ 10328,
209
+ 10378,
210
+ 10428,
211
+ 10478,
212
+ 10528,
213
+ 10578,
214
+ 10628,
215
+ 10678,
216
+ 10728,
217
+ 10778,
218
+ 10828,
219
+ 10878,
220
+ 10928,
221
+ 10991,
222
+ 11041,
223
+ 11091,
224
+ 11141,
225
+ 11191,
226
+ 11241,
227
+ 11291,
228
+ 11341,
229
+ 11391,
230
+ 11441,
231
+ 11491,
232
+ 11541,
233
+ 11591,
234
+ 11641,
235
+ 11691,
236
+ 11741,
237
+ 11791,
238
+ 11841,
239
+ 11891,
240
+ 11941,
241
+ 11991,
242
+ 12041,
243
+ 12091,
244
+ 12141,
245
+ 12191,
246
+ 12241,
247
+ 12291,
248
+ 12341,
249
+ 12391,
250
+ 12441,
251
+ 12491,
252
+ 12554,
253
+ 12604,
254
+ 12654,
255
+ 12704,
256
+ 12754,
257
+ 12804,
258
+ 12854,
259
+ 12904,
260
+ 12954,
261
+ 13004,
262
+ 13054,
263
+ 13104,
264
+ 13154,
265
+ 13204,
266
+ 13254,
267
+ 13304,
268
+ 13354,
269
+ 13404,
270
+ 13454,
271
+ 13504,
272
+ 13554,
273
+ 13604,
274
+ 13654,
275
+ 13704,
276
+ 13754,
277
+ 13804,
278
+ 13854,
279
+ 13904,
280
+ 13954,
281
+ 14004,
282
+ 14054,
283
+ 14117,
284
+ 14167,
285
+ 14217,
286
+ 14267,
287
+ 14317,
288
+ 14367,
289
+ 14417,
290
+ 14467,
291
+ 14517,
292
+ 14567,
293
+ 14617,
294
+ 14667,
295
+ 14717,
296
+ 14767,
297
+ 14817,
298
+ 14867,
299
+ 14917,
300
+ 14967,
301
+ 15017,
302
+ 15067,
303
+ 15117,
304
+ 15167,
305
+ 15217,
306
+ 15267,
307
+ 15317,
308
+ 15367,
309
+ 15417,
310
+ 15467,
311
+ 15517,
312
+ 15567,
313
+ 15617
314
+ ],
315
+ "loss": [
316
+ 0.6740970611572266,
317
+ -4.550182819366455,
318
+ 3.4813899993896484,
319
+ 6.129793643951416,
320
+ 4.952874660491943,
321
+ 3.551248073577881,
322
+ 2.7374675273895264,
323
+ 2.642364501953125,
324
+ 2.546827793121338,
325
+ 2.222029209136963,
326
+ 2.18642520904541,
327
+ 1.692894458770752,
328
+ 1.2222495079040527,
329
+ -0.4533480405807495,
330
+ -5.11752986907959,
331
+ -6.007235527038574,
332
+ -5.759991645812988,
333
+ -4.846492290496826,
334
+ -4.504001140594482,
335
+ -3.289268970489502,
336
+ -3.108947515487671,
337
+ -2.94197416305542,
338
+ -2.7386274337768555,
339
+ -2.536914348602295,
340
+ -2.4570322036743164,
341
+ -2.0626423358917236,
342
+ -2.5411453247070312,
343
+ -2.001025915145874,
344
+ -1.9104180335998535,
345
+ -1.7866570949554443,
346
+ -1.4493488073349,
347
+ -2.2201766967773438,
348
+ -1.3762651681900024,
349
+ -1.2861659526824951,
350
+ -0.9900193214416504,
351
+ -0.6757111549377441,
352
+ -1.3362367153167725,
353
+ -1.2853680849075317,
354
+ -1.2487475872039795,
355
+ -0.751352071762085,
356
+ -1.162947654724121,
357
+ -1.3089065551757812,
358
+ -0.717445969581604,
359
+ -0.6190880537033081,
360
+ -0.8564563989639282,
361
+ -0.5846812725067139,
362
+ -0.4223213195800781,
363
+ -0.2847200632095337,
364
+ -0.2850603461265564,
365
+ -0.6715193390846252,
366
+ -0.4275590777397156,
367
+ -0.24846726655960083,
368
+ -0.298381507396698,
369
+ -0.21033816039562225,
370
+ -0.6978311538696289,
371
+ -0.5567100644111633,
372
+ -0.08622289448976517,
373
+ -0.46259573101997375,
374
+ -0.11854743212461472,
375
+ -0.2933117747306824,
376
+ -0.18288816511631012,
377
+ -0.028837069869041443,
378
+ -0.10079759359359741,
379
+ -0.10146437585353851,
380
+ -0.04020918905735016,
381
+ -0.17104049026966095,
382
+ 0.03080505132675171,
383
+ -0.06636752933263779,
384
+ -0.09336651861667633,
385
+ 0.04093829542398453,
386
+ -0.18856458365917206,
387
+ -0.5159808397293091,
388
+ -0.1291065216064453,
389
+ 0.005189757794141769,
390
+ 0.03898356854915619,
391
+ 0.04612784460186958,
392
+ -0.035799235105514526,
393
+ 0.017833951860666275,
394
+ 0.008807066828012466,
395
+ -0.06113648787140846,
396
+ 0.05030018463730812,
397
+ 0.008559092879295349,
398
+ -0.03814322128891945,
399
+ -0.35033321380615234,
400
+ 0.022228460758924484,
401
+ -0.14529463648796082,
402
+ -0.2573607861995697,
403
+ 0.1615849733352661,
404
+ 0.005920305848121643,
405
+ -0.17471525073051453,
406
+ 0.04031040892004967,
407
+ 0.15831109881401062,
408
+ 0.017531119287014008,
409
+ 0.025253821164369583,
410
+ -0.03998721018433571,
411
+ -0.007496364414691925,
412
+ -0.08198462426662445,
413
+ 0.005123011767864227,
414
+ 0.013146581128239632,
415
+ 0.021802786737680435,
416
+ 0.010888367891311646,
417
+ 0.01744697242975235,
418
+ -0.011754129081964493,
419
+ 0.010674640536308289,
420
+ 0.026038404554128647,
421
+ -0.008711300790309906,
422
+ -0.026323799043893814,
423
+ -0.0012233927845954895,
424
+ 0.0051741283386945724,
425
+ -0.05305163562297821,
426
+ 0.022504277527332306,
427
+ -0.13647110760211945,
428
+ -0.07036244124174118,
429
+ 0.03079453483223915,
430
+ -0.003495320677757263,
431
+ -0.004044299945235252,
432
+ 0.07291208952665329,
433
+ 0.0158882737159729,
434
+ -0.05404190719127655,
435
+ 0.031853821128606796,
436
+ -0.00931493379175663,
437
+ 0.030048897489905357,
438
+ 0.03535217419266701,
439
+ 0.02074359357357025,
440
+ 0.02245134674012661,
441
+ 0.018024209886789322,
442
+ 0.019024260342121124,
443
+ 0.016671666875481606,
444
+ 0.02318689413368702,
445
+ -0.16695775091648102,
446
+ -0.09018514305353165,
447
+ -0.02566644549369812,
448
+ 0.04127392917871475,
449
+ 0.024764355272054672,
450
+ -0.09843560308218002,
451
+ -0.011365063488483429,
452
+ 0.03550856187939644,
453
+ 0.017145691439509392,
454
+ -0.13998593389987946,
455
+ 0.038096681237220764,
456
+ 0.021543879061937332,
457
+ 0.04749413579702377,
458
+ 0.033979713916778564,
459
+ 0.03674383834004402,
460
+ -0.27052831649780273,
461
+ 0.02465873956680298,
462
+ 0.011796783655881882,
463
+ 0.014996586367487907,
464
+ 0.004961196333169937,
465
+ 0.023028558120131493,
466
+ 0.026358719915151596,
467
+ 0.01939976215362549,
468
+ -0.005309898406267166,
469
+ 0.020909907296299934,
470
+ 0.0012779179960489273,
471
+ 0.01730952039361,
472
+ 0.02640022523701191,
473
+ 0.0036910362541675568,
474
+ 0.027950383722782135,
475
+ 0.01147831417620182,
476
+ -0.05264598876237869,
477
+ 0.03575543314218521,
478
+ 0.03973792493343353,
479
+ 0.02252863347530365,
480
+ -0.009360365569591522,
481
+ 0.015801431611180305,
482
+ 0.02285904251039028,
483
+ -0.08570974320173264,
484
+ -0.024168234318494797,
485
+ -0.048223428428173065,
486
+ -0.01638774946331978,
487
+ 0.0006880722939968109,
488
+ 0.03306081146001816,
489
+ -0.043127525597810745,
490
+ 0.0020329076796770096,
491
+ 0.01305706799030304,
492
+ 0.02981213480234146,
493
+ 0.029193194583058357,
494
+ 0.02433847077190876,
495
+ -0.005482485517859459,
496
+ 0.014438088983297348,
497
+ 0.028228456154465675,
498
+ 0.01625111512839794,
499
+ 0.019915776327252388,
500
+ 0.034516170620918274,
501
+ 0.008582454174757004,
502
+ 0.024511806666851044,
503
+ -0.024253854528069496,
504
+ 0.01701337844133377,
505
+ -0.0373363271355629,
506
+ 0.027363358065485954,
507
+ 0.03041806071996689,
508
+ 0.12457426637411118,
509
+ 0.027725394815206528,
510
+ 0.013912304304540157,
511
+ 0.023901334032416344,
512
+ 0.020304588600993156,
513
+ 0.028389938175678253,
514
+ -0.06357190012931824,
515
+ 0.033661819994449615,
516
+ -0.07012784481048584,
517
+ 0.00801593717187643,
518
+ -0.0050064027309417725,
519
+ -0.09235908091068268,
520
+ -0.01229124329984188,
521
+ 0.006246935576200485,
522
+ 0.02044505998492241,
523
+ -0.0047648195177316666,
524
+ 0.025742169469594955,
525
+ 0.0010393057018518448,
526
+ 0.03094959259033203,
527
+ 0.02283795177936554,
528
+ -0.036882538348436356,
529
+ 0.02033250965178013,
530
+ 0.015916980803012848,
531
+ 0.005782921798527241,
532
+ 0.018086083233356476,
533
+ -0.0076748523861169815,
534
+ 0.02724587917327881,
535
+ 0.024482186883687973,
536
+ -0.09868386387825012,
537
+ 0.0167199969291687,
538
+ 0.012935709208250046,
539
+ 0.02163371443748474,
540
+ 0.021752143278717995,
541
+ 0.020082633942365646,
542
+ 0.019570238888263702,
543
+ 0.03249555826187134,
544
+ 0.027163658291101456,
545
+ -0.014401596039533615,
546
+ 0.022197101265192032,
547
+ 0.022188032045960426,
548
+ 0.03264985978603363,
549
+ 0.024040594696998596,
550
+ 0.011879267171025276,
551
+ 0.03255181014537811,
552
+ 0.023215238004922867,
553
+ 0.0023117028176784515,
554
+ 0.024495478719472885,
555
+ 0.019720498472452164,
556
+ 0.023135492578148842,
557
+ 0.014651769772171974,
558
+ -0.07951529324054718,
559
+ 0.03233766555786133,
560
+ 0.024470800533890724,
561
+ 0.012430749833583832,
562
+ 0.034896910190582275,
563
+ 0.0302310511469841,
564
+ 0.030738510191440582,
565
+ 0.026226412504911423,
566
+ 0.020528079941868782,
567
+ 0.05512729659676552,
568
+ 0.023782307282090187,
569
+ 0.03561301529407501,
570
+ 0.03899824991822243,
571
+ 0.04859517514705658,
572
+ 0.025169283151626587,
573
+ 0.020543096587061882,
574
+ 0.029567118734121323,
575
+ 0.02862093225121498,
576
+ 0.024188119918107986,
577
+ 0.008323835209012032,
578
+ 0.01983008161187172,
579
+ 0.02144598215818405,
580
+ 0.019778920337557793,
581
+ 0.02909342385828495,
582
+ 0.018559956923127174,
583
+ 0.02560761198401451,
584
+ 0.020072082057595253,
585
+ 0.027100972831249237,
586
+ 0.02295202761888504,
587
+ 0.029123857617378235,
588
+ 0.026096206158399582,
589
+ 0.021702082827687263,
590
+ 0.016750920563936234,
591
+ 0.021258926019072533,
592
+ 0.02797173708677292,
593
+ 0.03243739902973175,
594
+ 0.016977261751890182,
595
+ 0.02330954745411873,
596
+ 0.019976291805505753,
597
+ 0.013898602686822414,
598
+ 0.01689036749303341,
599
+ 0.017199471592903137,
600
+ 0.017278049141168594,
601
+ 0.0165029875934124,
602
+ 0.027514660730957985,
603
+ 0.014729876071214676,
604
+ 0.016875755041837692,
605
+ 0.03120841272175312,
606
+ 0.014980831183493137,
607
+ 0.01650414802134037,
608
+ 0.0152245769277215,
609
+ 0.01621233858168125,
610
+ 0.017918068915605545,
611
+ 0.024394424632191658,
612
+ 0.020674878731369972,
613
+ 0.022252261638641357,
614
+ 0.02144944667816162,
615
+ 0.021988647058606148,
616
+ 0.012099644169211388,
617
+ 0.018198803067207336,
618
+ 0.020583491772413254,
619
+ 0.013832390308380127,
620
+ 0.016547255218029022,
621
+ 0.014451662078499794,
622
+ 0.023647719994187355,
623
+ 0.01148418989032507,
624
+ 0.014027438126504421,
625
+ 0.01586928404867649
626
+ ],
627
+ "base_loss": [
628
+ 11.356026649475098,
629
+ 9.631194114685059,
630
+ 8.192168235778809,
631
+ 6.82120418548584,
632
+ 5.469183444976807,
633
+ 3.667222499847412,
634
+ 2.1800343990325928,
635
+ 2.0134799480438232,
636
+ 1.8902651071548462,
637
+ 1.8171883821487427,
638
+ 1.831566572189331,
639
+ 1.7631242275238037,
640
+ 1.8302593231201172,
641
+ 1.7793418169021606,
642
+ 1.7493199110031128,
643
+ 1.6062908172607422,
644
+ 1.4234923124313354,
645
+ 1.2260541915893555,
646
+ 1.0503933429718018,
647
+ 0.8701945543289185,
648
+ 0.7965256571769714,
649
+ 0.7610203623771667,
650
+ 0.7659856081008911,
651
+ 0.6486948728561401,
652
+ 0.6037761569023132,
653
+ 0.5409098267555237,
654
+ 0.6157110333442688,
655
+ 0.537693202495575,
656
+ 0.4848516285419464,
657
+ 0.47311052680015564,
658
+ 0.36529630422592163,
659
+ 0.4196758270263672,
660
+ 0.34379932284355164,
661
+ 0.3498077988624573,
662
+ 0.27728471159935,
663
+ 0.3462373912334442,
664
+ 0.2944621741771698,
665
+ 0.29158657789230347,
666
+ 0.2628433406352997,
667
+ 0.2456883043050766,
668
+ 0.2572735846042633,
669
+ 0.24886596202850342,
670
+ 0.15836580097675323,
671
+ 0.13796664774417877,
672
+ 0.15766572952270508,
673
+ 0.13893279433250427,
674
+ 0.09202127903699875,
675
+ 0.0762753039598465,
676
+ 0.09009210020303726,
677
+ 0.10502225905656815,
678
+ 0.08243220299482346,
679
+ 0.05596935749053955,
680
+ 0.07416750490665436,
681
+ 0.056125104427337646,
682
+ 0.10202639549970627,
683
+ 0.0857960507273674,
684
+ 0.033538710325956345,
685
+ 0.07196591049432755,
686
+ 0.0300368070602417,
687
+ 0.04979466274380684,
688
+ 0.034712500870227814,
689
+ 0.021323591470718384,
690
+ 0.03061729297041893,
691
+ 0.0243806391954422,
692
+ 0.017203472554683685,
693
+ 0.03176433965563774,
694
+ 0.009061001241207123,
695
+ 0.017964502796530724,
696
+ 0.023406967520713806,
697
+ 0.0077172196470201015,
698
+ 0.03076944686472416,
699
+ 0.06775210797786713,
700
+ 0.024297479540109634,
701
+ 0.00829256046563387,
702
+ 0.003892586100846529,
703
+ 0.0024990288075059652,
704
+ 0.011014272458851337,
705
+ 0.004383252467960119,
706
+ 0.006406955420970917,
707
+ 0.01326407678425312,
708
+ 0.0017964880680665374,
709
+ 0.005481006111949682,
710
+ 0.012037997134029865,
711
+ 0.044263992458581924,
712
+ 0.005022068973630667,
713
+ 0.021807847544550896,
714
+ 0.03292359039187431,
715
+ 0.003572768298909068,
716
+ 0.00446776719763875,
717
+ 0.024249836802482605,
718
+ 0.0017572713550180197,
719
+ 0.004465059842914343,
720
+ 0.003973008599132299,
721
+ 0.003093535779044032,
722
+ 0.009311909787356853,
723
+ 0.005410215817391872,
724
+ 0.014211111702024937,
725
+ 0.0034575473982840776,
726
+ 0.0019197268411517143,
727
+ 0.0033427230082452297,
728
+ 0.003699967637658119,
729
+ 0.001604084623977542,
730
+ 0.005739237181842327,
731
+ 0.003080210415646434,
732
+ 0.0015003395965322852,
733
+ 0.004763317760080099,
734
+ 0.006590183824300766,
735
+ 0.004715103190392256,
736
+ 0.0035070686135441065,
737
+ 0.008657963015139103,
738
+ 0.0003322688862681389,
739
+ 0.01885424368083477,
740
+ 0.010693478398025036,
741
+ 0.0005817242781631649,
742
+ 0.004215598572045565,
743
+ 0.003816906362771988,
744
+ 0.003886388149112463,
745
+ 0.003007725114002824,
746
+ 0.010286539793014526,
747
+ 0.0009298769873566926,
748
+ 0.004372141789644957,
749
+ 0.00039718716288916767,
750
+ 0.0013855819124728441,
751
+ 0.000452018080977723,
752
+ 0.0010533257154747844,
753
+ 0.0029780082404613495,
754
+ 0.001559087890200317,
755
+ 0.0014608645578846335,
756
+ 0.00307484227232635,
757
+ 0.02185017243027687,
758
+ 0.013785426504909992,
759
+ 0.006048695184290409,
760
+ 0.00217792228795588,
761
+ 0.001179423532448709,
762
+ 0.017274845391511917,
763
+ 0.0050835153087973595,
764
+ 0.0009023203165270388,
765
+ 0.00184809067286551,
766
+ 0.01991746947169304,
767
+ 0.00039157853461802006,
768
+ 0.003423531772568822,
769
+ 0.0001724983740132302,
770
+ 0.000554570578970015,
771
+ 0.00017678069707471877,
772
+ 0.03262777253985405,
773
+ 0.00029608188197016716,
774
+ 0.004467927850782871,
775
+ 0.0026619676500558853,
776
+ 0.00304457382299006,
777
+ 0.0005487267626449466,
778
+ 0.00014045450370758772,
779
+ 0.000306745117995888,
780
+ 0.0030850092880427837,
781
+ 0.0002520345733501017,
782
+ 0.003663628827780485,
783
+ 0.0009150320547632873,
784
+ 0.0009810777846723795,
785
+ 0.004521961789578199,
786
+ 0.0005316039896570146,
787
+ 0.0028678581584244967,
788
+ 0.009407954290509224,
789
+ 0.0010586724383756518,
790
+ 9.7081639978569e-05,
791
+ 0.0011830349685624242,
792
+ 0.003912817686796188,
793
+ 0.00036425379221327603,
794
+ 0.00018008511688094586,
795
+ 0.013768239878118038,
796
+ 0.006027285009622574,
797
+ 0.008561733178794384,
798
+ 0.005584522150456905,
799
+ 0.004016578663140535,
800
+ 0.00027379707898944616,
801
+ 0.007990238256752491,
802
+ 0.0037911939434707165,
803
+ 0.0017629734938964248,
804
+ 0.00024030738859437406,
805
+ 0.0005787690752185881,
806
+ 0.00018286806880496442,
807
+ 0.0031564664095640182,
808
+ 0.0010887740645557642,
809
+ 0.0006292345351539552,
810
+ 0.00043399655260145664,
811
+ 0.00029165399610064924,
812
+ 0.0008086164598353207,
813
+ 0.002190670231357217,
814
+ 0.00016634409257676452,
815
+ 0.005654097069054842,
816
+ 0.0007038725889287889,
817
+ 0.007417007349431515,
818
+ 0.00011201239976799116,
819
+ 0.00010763022146420553,
820
+ 0.0022711276542395353,
821
+ 0.0004151062748860568,
822
+ 0.0001313961111009121,
823
+ 8.628344221506268e-05,
824
+ 0.00045848326408304274,
825
+ 0.00032122276024892926,
826
+ 0.009824968874454498,
827
+ 0.00012736987264361233,
828
+ 0.010177732445299625,
829
+ 0.0010128446156159043,
830
+ 0.004551018122583628,
831
+ 0.013036270625889301,
832
+ 0.0037082901690155268,
833
+ 0.002745306584984064,
834
+ 9.197835606755689e-05,
835
+ 0.0026039115618914366,
836
+ 0.00013443033094517887,
837
+ 0.0028798342682421207,
838
+ 8.376793266506866e-05,
839
+ 3.4521566703915596e-05,
840
+ 0.006287913303822279,
841
+ 0.000488495163153857,
842
+ 0.0015168219106271863,
843
+ 0.001650623744353652,
844
+ 0.00019628273730631918,
845
+ 0.0032842964865267277,
846
+ 0.00045201057218946517,
847
+ 0.0003367347235325724,
848
+ 0.012855315580964088,
849
+ 0.0005910869804210961,
850
+ 0.0011569021735340357,
851
+ 0.00038534580380655825,
852
+ 0.00017291684343945235,
853
+ 3.4607968700584024e-05,
854
+ 7.030936831142753e-05,
855
+ 0.00021958326396998018,
856
+ 6.0223665059311315e-05,
857
+ 0.005668822210282087,
858
+ 2.0555753508233465e-05,
859
+ 1.8682430891203694e-05,
860
+ 2.363364546908997e-05,
861
+ 5.7613910030340776e-05,
862
+ 0.0010363028850406408,
863
+ 3.1130286515690386e-05,
864
+ 1.534678813186474e-05,
865
+ 0.0031705431174486876,
866
+ 0.00017218641005456448,
867
+ 0.0001772747200448066,
868
+ 0.0002666492946445942,
869
+ 9.376927482662722e-05,
870
+ 0.011100794188678265,
871
+ 1.4641766028944403e-05,
872
+ 1.0835289685928728e-05,
873
+ 0.0026217966806143522,
874
+ 0.0001616269291844219,
875
+ 6.171682616695762e-05,
876
+ 9.293656330555677e-05,
877
+ 4.332200842327438e-05,
878
+ 4.211247505736537e-05,
879
+ 0.00012382295972201973,
880
+ 5.505144872586243e-05,
881
+ 1.5595851436955854e-05,
882
+ 0.0001040818024193868,
883
+ 0.0015936119016259909,
884
+ 0.0002965541207231581,
885
+ 0.0002465788566041738,
886
+ 7.969176658662036e-05,
887
+ 7.859185279812664e-05,
888
+ 1.8917620764113963e-05,
889
+ 0.0011198128340765834,
890
+ 4.6502420445904136e-05,
891
+ 0.00011284415086265653,
892
+ 0.00010124589607585222,
893
+ 1.891675310616847e-05,
894
+ 0.00014527658640872687,
895
+ 5.916170994169079e-05,
896
+ 1.7848889910965227e-05,
897
+ 1.8014457964454778e-05,
898
+ 0.000127076476928778,
899
+ 4.3773507059086114e-05,
900
+ 2.9668290153495036e-05,
901
+ 4.1452207369729877e-05,
902
+ 1.0970002222165931e-05,
903
+ 1.6135436453623697e-05,
904
+ 1.2064027941960376e-05,
905
+ 0.00010817877046065405,
906
+ 6.877558917040005e-06,
907
+ 6.24669628450647e-05,
908
+ 9.740904715727083e-06,
909
+ 6.209537332324544e-06,
910
+ 4.491790241445415e-05,
911
+ 7.744681170152035e-06,
912
+ 0.000721240823622793,
913
+ 0.0005756255122832954,
914
+ 7.592778729303973e-06,
915
+ 0.000425457808887586,
916
+ 8.788871491560712e-05,
917
+ 1.8696180632105097e-05,
918
+ 1.0503771591174882e-05,
919
+ 8.51023432915099e-05,
920
+ 1.927906669152435e-05,
921
+ 2.6535662982496433e-05,
922
+ 8.09933953860309e-06,
923
+ 1.4273643500928301e-05,
924
+ 1.1488074960652739e-05,
925
+ 6.521457544295117e-05,
926
+ 1.4513118912873324e-05,
927
+ 6.31172297289595e-05,
928
+ 0.00020963601127732545,
929
+ 7.592925157950958e-06,
930
+ 7.2776251727191266e-06,
931
+ 7.568458386231214e-06,
932
+ 0.00020133117504883558,
933
+ 8.974142474471591e-06,
934
+ 1.848995452746749e-05,
935
+ 7.909872692835052e-06,
936
+ 1.0007915079768281e-05,
937
+ 7.120363534340868e-06
938
+ ],
939
+ "info_loss": [
940
+ -1.7890558242797852,
941
+ -2.0338239669799805,
942
+ -0.9482707977294922,
943
+ -0.40160417556762695,
944
+ -0.2615690231323242,
945
+ -0.15079426765441895,
946
+ -0.06246805191040039,
947
+ -0.05041790008544922,
948
+ -0.046514034271240234,
949
+ -0.07114255428314209,
950
+ -0.0759742259979248,
951
+ -0.1182030439376831,
952
+ -0.17184579372406006,
953
+ -0.3341081142425537,
954
+ -0.7977063655853271,
955
+ -0.8726139068603516,
956
+ -0.828260600566864,
957
+ -0.7154039144515991,
958
+ -0.6624167561531067,
959
+ -0.5188260078430176,
960
+ -0.4914211332798004,
961
+ -0.4694363474845886,
962
+ -0.44739606976509094,
963
+ -0.4149097204208374,
964
+ -0.39935627579689026,
965
+ -0.3504805564880371,
966
+ -0.40426820516586304,
967
+ -0.3374651074409485,
968
+ -0.320678174495697,
969
+ -0.30643635988235474,
970
+ -0.2568308711051941,
971
+ -0.3357636332511902,
972
+ -0.23645959794521332,
973
+ -0.23092350363731384,
974
+ -0.19038887321949005,
975
+ -0.16156063973903656,
976
+ -0.22003400325775146,
977
+ -0.2115722894668579,
978
+ -0.20114350318908691,
979
+ -0.15098732709884644,
980
+ -0.19291964173316956,
981
+ -0.20082661509513855,
982
+ -0.13588814437389374,
983
+ -0.12022731453180313,
984
+ -0.14502620697021484,
985
+ -0.11288445442914963,
986
+ -0.08485924452543259,
987
+ -0.07067755609750748,
988
+ -0.06549526751041412,
989
+ -0.10249876976013184,
990
+ -0.07931748777627945,
991
+ -0.05338749662041664,
992
+ -0.06161873787641525,
993
+ -0.04923267289996147,
994
+ -0.09974635392427444,
995
+ -0.08387186378240585,
996
+ -0.026406487450003624,
997
+ -0.06957025825977325,
998
+ -0.029383406043052673,
999
+ -0.047899384051561356,
1000
+ -0.034090615808963776,
1001
+ -0.02017339877784252,
1002
+ -0.02552923932671547,
1003
+ -0.023796377703547478,
1004
+ -0.016712982207536697,
1005
+ -0.03141834959387779,
1006
+ -0.008702496066689491,
1007
+ -0.01777610555291176,
1008
+ -0.023175155743956566,
1009
+ -0.007410112768411636,
1010
+ -0.030521877110004425,
1011
+ -0.06679011136293411,
1012
+ -0.024130171164870262,
1013
+ -0.008060572668910027,
1014
+ -0.0038049675058573484,
1015
+ -0.002234472194686532,
1016
+ -0.010922570712864399,
1017
+ -0.004309913143515587,
1018
+ -0.00633973628282547,
1019
+ -0.013188357464969158,
1020
+ -0.0017262588953599334,
1021
+ -0.005346525926142931,
1022
+ -0.011774897575378418,
1023
+ -0.04415065050125122,
1024
+ -0.004944274667650461,
1025
+ -0.021722447127103806,
1026
+ -0.032871976494789124,
1027
+ 0.010226638056337833,
1028
+ -0.00442873639985919,
1029
+ -0.024205442517995834,
1030
+ -0.0017210857477039099,
1031
+ 0.009605957195162773,
1032
+ -0.0038327304646372795,
1033
+ -0.003049204358831048,
1034
+ -0.009267322719097137,
1035
+ -0.005381999537348747,
1036
+ -0.014152013696730137,
1037
+ -0.0033899759873747826,
1038
+ -0.001888719736598432,
1039
+ -0.0033195270225405693,
1040
+ -0.0036388984881341457,
1041
+ -0.0015598938334733248,
1042
+ -0.005652206018567085,
1043
+ -0.0030528190545737743,
1044
+ -0.0014716533478349447,
1045
+ -0.004738667979836464,
1046
+ -0.006567519623786211,
1047
+ -0.00465953117236495,
1048
+ -0.003490664064884186,
1049
+ -0.008616232313215733,
1050
+ -0.00014296182780526578,
1051
+ -0.018821515142917633,
1052
+ -0.0105670765042305,
1053
+ -0.0005634925328195095,
1054
+ -0.0041562579572200775,
1055
+ -0.0037870830856263638,
1056
+ -0.0037928519304841757,
1057
+ -0.002935892902314663,
1058
+ -0.010225500911474228,
1059
+ -0.0009113152627833188,
1060
+ -0.004355199635028839,
1061
+ -0.00035779280005954206,
1062
+ -0.0011598645942285657,
1063
+ -0.0004282161535229534,
1064
+ -0.001037601730786264,
1065
+ -0.002960778307169676,
1066
+ -0.0015378620009869337,
1067
+ -0.0014182236045598984,
1068
+ -0.003061524359509349,
1069
+ -0.021842218935489655,
1070
+ -0.013775412924587727,
1071
+ -0.0060298447497189045,
1072
+ -0.0003302695695310831,
1073
+ -0.0011622959282249212,
1074
+ -0.01726355403661728,
1075
+ -0.005036278162151575,
1076
+ -0.00041794925346039236,
1077
+ -0.0018197885947301984,
1078
+ -0.01988215371966362,
1079
+ -0.0003762421547435224,
1080
+ -0.003400198882445693,
1081
+ -0.00015940802404657006,
1082
+ -0.0005233503761701286,
1083
+ -0.00015287620772141963,
1084
+ -0.03261752426624298,
1085
+ -0.0002691608387976885,
1086
+ -0.0044571529142558575,
1087
+ -0.0026539356913417578,
1088
+ -0.003012097207829356,
1089
+ -0.0005078242975287139,
1090
+ -0.00013505083916243166,
1091
+ -0.0003015396650880575,
1092
+ -0.003070201026275754,
1093
+ -0.0002374972536927089,
1094
+ -0.0036586765199899673,
1095
+ -0.0009081086027435958,
1096
+ -0.0003338689566589892,
1097
+ -0.004436817951500416,
1098
+ -0.0004963281098753214,
1099
+ -0.002862064866349101,
1100
+ -0.009401691146194935,
1101
+ -0.0010455616284161806,
1102
+ -8.600996079621837e-05,
1103
+ -0.0011703305644914508,
1104
+ -0.0038957232609391212,
1105
+ -0.00034908443922176957,
1106
+ -0.00017510104225948453,
1107
+ -0.013707173988223076,
1108
+ -0.006002034991979599,
1109
+ -0.008538494817912579,
1110
+ -0.005569901317358017,
1111
+ -0.004009208641946316,
1112
+ -0.0002337438054382801,
1113
+ -0.007973904721438885,
1114
+ -0.00378547259606421,
1115
+ -0.0015358731616288424,
1116
+ -0.00023604519083164632,
1117
+ -0.0005697747110389173,
1118
+ -0.00016817497089505196,
1119
+ -0.003141829976812005,
1120
+ -0.0010833129053935409,
1121
+ -0.000625795335508883,
1122
+ -0.0004284863534849137,
1123
+ -0.00027779044467024505,
1124
+ -0.0007803748594596982,
1125
+ -0.0012746010906994343,
1126
+ -0.00015991127293091267,
1127
+ -0.005650668870657682,
1128
+ -0.0006989692919887602,
1129
+ -0.007410449907183647,
1130
+ -0.00010782053141156211,
1131
+ -8.742442878428847e-05,
1132
+ 0.008178682066500187,
1133
+ -0.00041095964843407273,
1134
+ -0.0001164748755400069,
1135
+ -6.856003892607987e-05,
1136
+ -0.0004533177416305989,
1137
+ -0.00031492739799432456,
1138
+ -0.009818059392273426,
1139
+ -0.00012356028310023248,
1140
+ -0.010169540531933308,
1141
+ -0.0010074570309370756,
1142
+ -0.00452058669179678,
1143
+ -0.013032909482717514,
1144
+ -0.003703873371705413,
1145
+ -0.0027421782724559307,
1146
+ -8.945290755946189e-05,
1147
+ -0.002599295461550355,
1148
+ -0.00012219540076330304,
1149
+ -0.0028765909373760223,
1150
+ -6.239667709451169e-05,
1151
+ -3.049292354262434e-05,
1152
+ -0.006285164505243301,
1153
+ -0.000484316871734336,
1154
+ -0.001514196745119989,
1155
+ -0.0016474260482937098,
1156
+ -0.00019226217409595847,
1157
+ -0.003281482495367527,
1158
+ -0.000449836632469669,
1159
+ -0.0003332652267999947,
1160
+ -0.012853292748332024,
1161
+ -0.0005873491172678769,
1162
+ -0.0011497307568788528,
1163
+ -0.00037652216269634664,
1164
+ -0.00016018647875171155,
1165
+ -3.0155661079334095e-05,
1166
+ -6.62122038193047e-05,
1167
+ -0.00020255916751921177,
1168
+ -5.408488505054265e-05,
1169
+ -0.005652152467519045,
1170
+ -1.6025685908971354e-05,
1171
+ -1.5044855899759568e-05,
1172
+ -2.1465304598677903e-05,
1173
+ -5.105826130602509e-05,
1174
+ -0.0010347074130550027,
1175
+ -1.907377372845076e-05,
1176
+ -1.2802254786947742e-05,
1177
+ -0.0017700940370559692,
1178
+ -0.0001699523563729599,
1179
+ -0.00017307884991168976,
1180
+ -0.0002653632836882025,
1181
+ -8.952543430496007e-05,
1182
+ -0.011098955757915974,
1183
+ -1.267616062250454e-05,
1184
+ -9.07962748897262e-06,
1185
+ -0.0026156750973314047,
1186
+ -0.00015660403005313128,
1187
+ -4.651540075428784e-05,
1188
+ -8.610812074039131e-05,
1189
+ -3.715619823196903e-05,
1190
+ -3.755074067157693e-05,
1191
+ -0.00012043094466207549,
1192
+ -5.0913546147057787e-05,
1193
+ -1.0800137715705205e-05,
1194
+ -9.554681309964508e-05,
1195
+ -0.0015626936219632626,
1196
+ -0.00028642217512242496,
1197
+ -0.0002437218645354733,
1198
+ -6.973075505811721e-05,
1199
+ -7.534190081059933e-05,
1200
+ -1.5272318705683574e-05,
1201
+ -0.0011173563543707132,
1202
+ -3.8153659261297435e-05,
1203
+ -9.573547140462324e-05,
1204
+ -7.302961603272706e-05,
1205
+ -1.7509401004645042e-05,
1206
+ -0.00014374923193827271,
1207
+ -5.755531674367376e-05,
1208
+ -1.6221218174905516e-05,
1209
+ 3.5054064937867224e-05,
1210
+ -0.00012420724669937044,
1211
+ -3.818568802671507e-05,
1212
+ -2.7303436581860296e-05,
1213
+ -4.013958459836431e-05,
1214
+ -7.484359230147675e-06,
1215
+ -1.4186858606990427e-05,
1216
+ -7.645062396477442e-06,
1217
+ -0.000106018444057554,
1218
+ -4.252270173310535e-06,
1219
+ -5.9775567933684215e-05,
1220
+ -8.242283911386039e-06,
1221
+ -5.06002697875374e-06,
1222
+ -4.421116318553686e-05,
1223
+ -6.299577762547415e-06,
1224
+ -0.000720062293112278,
1225
+ -0.0005746351089328527,
1226
+ -6.277238753682468e-06,
1227
+ -0.00042429924360476434,
1228
+ -8.700289617991075e-05,
1229
+ -1.789098678273149e-05,
1230
+ -9.702303941594437e-06,
1231
+ -8.410264126723632e-05,
1232
+ -1.8023398297373205e-05,
1233
+ -2.533986116759479e-05,
1234
+ -7.160304903663928e-06,
1235
+ -1.340539711236488e-05,
1236
+ -1.0124642358277924e-05,
1237
+ -6.414462404791266e-05,
1238
+ -1.3188522643758915e-05,
1239
+ -6.239931099116802e-05,
1240
+ -0.0002082925202557817,
1241
+ -6.2832409639668185e-06,
1242
+ -6.361206487781601e-06,
1243
+ -6.34949947198038e-06,
1244
+ -0.00020040091476403177,
1245
+ -7.874392395024188e-06,
1246
+ -1.763314321578946e-05,
1247
+ -6.871585355838761e-06,
1248
+ -8.002768481674138e-06,
1249
+ -6.212992502696579e-06
1250
+ ],
1251
+ "abs_loss": [
1252
+ 3.400221586227417,
1253
+ 3.3749444484710693,
1254
+ 3.3227717876434326,
1255
+ 3.2700469493865967,
1256
+ 3.0865707397460938,
1257
+ 2.835861921310425,
1258
+ 2.728372573852539,
1259
+ 2.7506744861602783,
1260
+ 2.7388916015625,
1261
+ 2.7243969440460205,
1262
+ 2.6911118030548096,
1263
+ 2.7227325439453125,
1264
+ 2.711573839187622,
1265
+ 2.7065513134002686,
1266
+ 2.6780731678009033,
1267
+ 2.6901721954345703,
1268
+ 2.667034149169922,
1269
+ 2.5448572635650635,
1270
+ 2.4869515895843506,
1271
+ 2.359622001647949,
1272
+ 2.235144853591919,
1273
+ 2.180715799331665,
1274
+ 2.1124141216278076,
1275
+ 2.011976480484009,
1276
+ 2.0321614742279053,
1277
+ 1.9616875648498535,
1278
+ 1.801836609840393,
1279
+ 1.8774360418319702,
1280
+ 1.72232186794281,
1281
+ 1.5954824686050415,
1282
+ 1.6342706680297852,
1283
+ 1.4825626611709595,
1284
+ 1.3536456823349,
1285
+ 1.3639774322509766,
1286
+ 1.3342081308364868,
1287
+ 1.3440603017807007,
1288
+ 1.254590630531311,
1289
+ 1.1744147539138794,
1290
+ 1.065630316734314,
1291
+ 1.0658882856369019,
1292
+ 1.0787917375564575,
1293
+ 0.9862263798713684,
1294
+ 1.0132602453231812,
1295
+ 0.9369902610778809,
1296
+ 0.9065744280815125,
1297
+ 0.7865585684776306,
1298
+ 0.80427485704422,
1299
+ 0.7036848664283752,
1300
+ 0.5578082203865051,
1301
+ 0.5439424514770508,
1302
+ 0.5409030318260193,
1303
+ 0.47011399269104004,
1304
+ 0.5740960240364075,
1305
+ 0.5397010445594788,
1306
+ 0.4535597264766693,
1307
+ 0.3936477601528168,
1308
+ 0.4094356596469879,
1309
+ 0.3892175257205963,
1310
+ 0.3264791965484619,
1311
+ 0.3573044240474701,
1312
+ 0.2997516691684723,
1313
+ 0.3188786506652832,
1314
+ 0.30981138348579407,
1315
+ 0.24736468493938446,
1316
+ 0.2696608901023865,
1317
+ 0.3189583718776703,
1318
+ 0.2266036719083786,
1319
+ 0.22413313388824463,
1320
+ 0.19217394292354584,
1321
+ 0.1975734680891037,
1322
+ 0.18984945118427277,
1323
+ 0.18902957439422607,
1324
+ 0.16657519340515137,
1325
+ 0.16911743581295013,
1326
+ 0.13720349967479706,
1327
+ 0.11513227224349976,
1328
+ 0.14049004018306732,
1329
+ 0.13792578876018524,
1330
+ 0.12941564619541168,
1331
+ 0.12365423887968063,
1332
+ 0.10792890936136246,
1333
+ 0.08864489942789078,
1334
+ 0.1043628379702568,
1335
+ 0.11446789652109146,
1336
+ 0.0968158021569252,
1337
+ 0.11080390214920044,
1338
+ 0.092313252389431,
1339
+ 0.10519183427095413,
1340
+ 0.08616107702255249,
1341
+ 0.09144207835197449,
1342
+ 0.0939544215798378,
1343
+ 0.075531966984272,
1344
+ 0.09000606089830399,
1345
+ 0.07730904221534729,
1346
+ 0.10152538865804672,
1347
+ 0.07238713651895523,
1348
+ 0.06638116389513016,
1349
+ 0.0714423879981041,
1350
+ 0.05998113751411438,
1351
+ 0.08143870532512665,
1352
+ 0.07830570638179779,
1353
+ 0.061825867742300034,
1354
+ 0.05181339755654335,
1355
+ 0.05899941548705101,
1356
+ 0.09622979909181595,
1357
+ 0.05658048391342163,
1358
+ 0.07066275924444199,
1359
+ 0.04587157070636749,
1360
+ 0.08620896190404892,
1361
+ 0.04473419487476349,
1362
+ 0.05273726209998131,
1363
+ 0.04513105750083923,
1364
+ 0.0452953577041626,
1365
+ 0.0503426156938076,
1366
+ 0.04764794185757637,
1367
+ 0.041065242141485214,
1368
+ 0.0642910972237587,
1369
+ 0.0393511988222599,
1370
+ 0.053640592843294144,
1371
+ 0.04719572141766548,
1372
+ 0.03421347215771675,
1373
+ 0.050639551132917404,
1374
+ 0.051145922392606735,
1375
+ 0.04705527797341347,
1376
+ 0.034941766411066055,
1377
+ 0.04037773981690407,
1378
+ 0.04842052981257439,
1379
+ 0.05336771532893181,
1380
+ 0.06259221583604813,
1381
+ 0.026474887505173683,
1382
+ 0.031480368226766586,
1383
+ 0.06849294155836105,
1384
+ 0.031607963144779205,
1385
+ 0.03826194629073143,
1386
+ 0.04014688357710838,
1387
+ 0.03380918502807617,
1388
+ 0.030318809673190117,
1389
+ 0.02713879942893982,
1390
+ 0.06298081576824188,
1391
+ 0.03328637406229973,
1392
+ 0.061558797955513,
1393
+ 0.039092469960451126,
1394
+ 0.04050593823194504,
1395
+ 0.03157830610871315,
1396
+ 0.039200589060783386,
1397
+ 0.04502244293689728,
1398
+ 0.04802577570080757,
1399
+ 0.033281903713941574,
1400
+ 0.0406477265059948,
1401
+ 0.04972783103585243,
1402
+ 0.037740204483270645,
1403
+ 0.04166874289512634,
1404
+ 0.02565709315240383,
1405
+ 0.03303562104701996,
1406
+ 0.03330441191792488,
1407
+ 0.03580398112535477,
1408
+ 0.03196847438812256,
1409
+ 0.046718478202819824,
1410
+ 0.04452933743596077,
1411
+ 0.024944854900240898,
1412
+ 0.0416223406791687,
1413
+ 0.036224447190761566,
1414
+ 0.05375756695866585,
1415
+ 0.0367773212492466,
1416
+ 0.03235439583659172,
1417
+ 0.02875889278948307,
1418
+ 0.03506853058934212,
1419
+ 0.04399366304278374,
1420
+ 0.03728214651346207,
1421
+ 0.0427677147090435,
1422
+ 0.0378706157207489,
1423
+ 0.035004809498786926,
1424
+ 0.04873510077595711,
1425
+ 0.035581763833761215,
1426
+ 0.04483659937977791,
1427
+ 0.03673766180872917,
1428
+ 0.037086594849824905,
1429
+ 0.03477691113948822,
1430
+ 0.027956614270806313,
1431
+ 0.03586661070585251,
1432
+ 0.033001434057950974,
1433
+ 0.031290311366319656,
1434
+ 0.035908281803131104,
1435
+ 0.030315974727272987,
1436
+ 0.03552045300602913,
1437
+ 0.04022013023495674,
1438
+ 0.026197584345936775,
1439
+ 0.035174209624528885,
1440
+ 0.02384295128285885,
1441
+ 0.037081893533468246,
1442
+ 0.0395648367702961,
1443
+ 0.03571036830544472,
1444
+ 0.04348386451601982,
1445
+ 0.02467021346092224,
1446
+ 0.02426413632929325,
1447
+ 0.029572337865829468,
1448
+ 0.03587673231959343,
1449
+ 0.04099087044596672,
1450
+ 0.025093600153923035,
1451
+ 0.03426919877529144,
1452
+ 0.024828441441059113,
1453
+ 0.027611741796135902,
1454
+ 0.02356303296983242,
1455
+ 0.026904771104454994,
1456
+ 0.028047552332282066,
1457
+ 0.029466355219483376,
1458
+ 0.03148570656776428,
1459
+ 0.021179335191845894,
1460
+ 0.04117191955447197,
1461
+ 0.03302908316254616,
1462
+ 0.026304379105567932,
1463
+ 0.04027620330452919,
1464
+ 0.033575210720300674,
1465
+ 0.03448949381709099,
1466
+ 0.021397188305854797,
1467
+ 0.028684427961707115,
1468
+ 0.032612934708595276,
1469
+ 0.019171735271811485,
1470
+ 0.030285999178886414,
1471
+ 0.019913824275135994,
1472
+ 0.01965104602277279,
1473
+ 0.02198127470910549,
1474
+ 0.032737139612436295,
1475
+ 0.025666287168860435,
1476
+ 0.023947492241859436,
1477
+ 0.026168445125222206,
1478
+ 0.02097104676067829,
1479
+ 0.030548997223377228,
1480
+ 0.027204474434256554,
1481
+ 0.0273570716381073,
1482
+ 0.0234281737357378,
1483
+ 0.030982812866568565,
1484
+ 0.024150425568223,
1485
+ 0.030628904700279236,
1486
+ 0.027146128937602043,
1487
+ 0.02773093245923519,
1488
+ 0.028193825855851173,
1489
+ 0.026094062253832817,
1490
+ 0.028047211468219757,
1491
+ 0.03213946893811226,
1492
+ 0.02489076741039753,
1493
+ 0.027458617463707924,
1494
+ 0.02401149272918701,
1495
+ 0.04969260096549988,
1496
+ 0.040320202708244324,
1497
+ 0.0385587178170681,
1498
+ 0.03392435237765312,
1499
+ 0.03432046249508858,
1500
+ 0.04117554798722267,
1501
+ 0.045425236225128174,
1502
+ 0.027294665575027466,
1503
+ 0.04759006202220917,
1504
+ 0.03798606991767883,
1505
+ 0.04059753939509392,
1506
+ 0.038912393152713776,
1507
+ 0.0981680378317833,
1508
+ 0.048965733498334885,
1509
+ 0.050136175006628036,
1510
+ 0.026505114510655403,
1511
+ 0.02815972827374935,
1512
+ 0.025639228522777557,
1513
+ 0.02983478270471096,
1514
+ 0.03243863955140114,
1515
+ 0.027228472754359245,
1516
+ 0.03602074086666107,
1517
+ 0.03893369436264038,
1518
+ 0.02168719470500946,
1519
+ 0.027577867731451988,
1520
+ 0.027573436498641968,
1521
+ 0.027087293565273285,
1522
+ 0.031455520540475845,
1523
+ 0.03223405405879021,
1524
+ 0.028805658221244812,
1525
+ 0.02321797050535679,
1526
+ 0.02031596750020981,
1527
+ 0.028041882440447807,
1528
+ 0.023989439010620117,
1529
+ 0.02367476187646389,
1530
+ 0.02858881466090679,
1531
+ 0.025053301826119423,
1532
+ 0.018464459106326103,
1533
+ 0.017213404178619385,
1534
+ 0.02135978639125824,
1535
+ 0.01722577027976513,
1536
+ 0.02366158552467823,
1537
+ 0.018046531826257706,
1538
+ 0.036419834941625595,
1539
+ 0.019340110942721367,
1540
+ 0.03182953596115112,
1541
+ 0.017846064642071724,
1542
+ 0.02648819424211979,
1543
+ 0.025615304708480835,
1544
+ 0.021788349375128746,
1545
+ 0.028488459065556526,
1546
+ 0.02397303842008114,
1547
+ 0.029911711812019348,
1548
+ 0.023171788081526756,
1549
+ 0.030988125130534172,
1550
+ 0.023679383099079132,
1551
+ 0.02411339245736599,
1552
+ 0.025272300466895103,
1553
+ 0.022435227409005165,
1554
+ 0.02144625596702099,
1555
+ 0.024688227102160454,
1556
+ 0.02549501322209835,
1557
+ 0.018564846366643906,
1558
+ 0.020725158974528313,
1559
+ 0.022303933277726173,
1560
+ 0.015030582435429096,
1561
+ 0.018608180806040764
1562
+ ],
1563
+ "zipf_loss": [
1564
+ 6.8686065673828125,
1565
+ 5.8193678855896,
1566
+ 4.439652442932129,
1567
+ 2.997626543045044,
1568
+ 1.790724277496338,
1569
+ 1.1083821058273315,
1570
+ 0.9092764258384705,
1571
+ 0.8579962253570557,
1572
+ 0.8478137254714966,
1573
+ 0.8438266515731812,
1574
+ 0.8454896211624146,
1575
+ 0.839527428150177,
1576
+ 0.8392906785011292,
1577
+ 0.8377361297607422,
1578
+ 0.8424060940742493,
1579
+ 0.843595564365387,
1580
+ 0.8324185609817505,
1581
+ 0.8270072937011719,
1582
+ 0.8210777044296265,
1583
+ 0.7928341627120972,
1584
+ 0.785223662853241,
1585
+ 0.7732972502708435,
1586
+ 0.7581063508987427,
1587
+ 0.762290358543396,
1588
+ 0.7295382022857666,
1589
+ 0.7050848603248596,
1590
+ 0.7056423425674438,
1591
+ 0.648188054561615,
1592
+ 0.6392800807952881,
1593
+ 0.645047664642334,
1594
+ 0.5902365446090698,
1595
+ 0.5695276260375977,
1596
+ 0.5091668367385864,
1597
+ 0.5368636846542358,
1598
+ 0.5031638145446777,
1599
+ 0.45925191044807434,
1600
+ 0.44418203830718994,
1601
+ 0.42132675647735596,
1602
+ 0.39328092336654663,
1603
+ 0.40624403953552246,
1604
+ 0.40109601616859436,
1605
+ 0.3518710434436798,
1606
+ 0.3817436695098877,
1607
+ 0.3515194058418274,
1608
+ 0.3454824388027191,
1609
+ 0.3265745937824249,
1610
+ 0.253822386264801,
1611
+ 0.2754117250442505,
1612
+ 0.2240193635225296,
1613
+ 0.19405187666416168,
1614
+ 0.2290932536125183,
1615
+ 0.18242695927619934,
1616
+ 0.18622878193855286,
1617
+ 0.17189337313175201,
1618
+ 0.15224997699260712,
1619
+ 0.1568477600812912,
1620
+ 0.10335970669984818,
1621
+ 0.12221911549568176,
1622
+ 0.11260189861059189,
1623
+ 0.10015691816806793,
1624
+ 0.09333030879497528,
1625
+ 0.11968545615673065,
1626
+ 0.09289635717868805,
1627
+ 0.08738230168819427,
1628
+ 0.08275105804204941,
1629
+ 0.07948283851146698,
1630
+ 0.08610863983631134,
1631
+ 0.07101570814847946,
1632
+ 0.09576068818569183,
1633
+ 0.0875648558139801,
1634
+ 0.06689979135990143,
1635
+ 0.06526514887809753,
1636
+ 0.07124019414186478,
1637
+ 0.06059117987751961,
1638
+ 0.059420306235551834,
1639
+ 0.054460309445858,
1640
+ 0.04836319386959076,
1641
+ 0.04275725409388542,
1642
+ 0.05285590887069702,
1643
+ 0.045117590576410294,
1644
+ 0.05497339367866516,
1645
+ 0.047678858041763306,
1646
+ 0.05713147297501564,
1647
+ 0.03546249866485596,
1648
+ 0.056967560201883316,
1649
+ 0.03904160484671593,
1650
+ 0.029204068705439568,
1651
+ 0.045226648449897766,
1652
+ 0.037123795598745346,
1653
+ 0.03394513577222824,
1654
+ 0.0463685542345047,
1655
+ 0.05023325979709625,
1656
+ 0.042884811758995056,
1657
+ 0.044921424239873886,
1658
+ 0.033221568912267685,
1659
+ 0.0336747020483017,
1660
+ 0.03868628293275833,
1661
+ 0.028420986607670784,
1662
+ 0.02411593869328499,
1663
+ 0.043511465191841125,
1664
+ 0.03574681654572487,
1665
+ 0.025259237736463547,
1666
+ 0.03384735435247421,
1667
+ 0.032222680747509,
1668
+ 0.029631618410348892,
1669
+ 0.028254013508558273,
1670
+ 0.025694940239191055,
1671
+ 0.036069657653570175,
1672
+ 0.027952803298830986,
1673
+ 0.01997930370271206,
1674
+ 0.018327901139855385,
1675
+ 0.02837669476866722,
1676
+ 0.02008531056344509,
1677
+ 0.03081347420811653,
1678
+ 0.029086865484714508,
1679
+ 0.02590310014784336,
1680
+ 0.10052511096000671,
1681
+ 0.03830435872077942,
1682
+ 0.0325625017285347,
1683
+ 0.03531752526760101,
1684
+ 0.026443572714924812,
1685
+ 0.028165683150291443,
1686
+ 0.040450647473335266,
1687
+ 0.019868209958076477,
1688
+ 0.02827986143529415,
1689
+ 0.04061621055006981,
1690
+ 0.02800174057483673,
1691
+ 0.024056266993284225,
1692
+ 0.044468075037002563,
1693
+ 0.02696678228676319,
1694
+ 0.030635518953204155,
1695
+ 0.02173401415348053,
1696
+ 0.03923790529370308,
1697
+ 0.031381696462631226,
1698
+ 0.05291040986776352,
1699
+ 0.030533283948898315,
1700
+ 0.03575385361909866,
1701
+ 0.030781608074903488,
1702
+ 0.032620057463645935,
1703
+ 0.03813888877630234,
1704
+ 0.04596645385026932,
1705
+ 0.04500647261738777,
1706
+ 0.03460805490612984,
1707
+ 0.034937988966703415,
1708
+ 0.019099101424217224,
1709
+ 0.022552020847797394,
1710
+ 0.04709780961275101,
1711
+ 0.03554578498005867,
1712
+ 0.02797282300889492,
1713
+ 0.022585291415452957,
1714
+ 0.02379475347697735,
1715
+ 0.017941538244485855,
1716
+ 0.019741391763091087,
1717
+ 0.019729282706975937,
1718
+ 0.03087061271071434,
1719
+ 0.02189517766237259,
1720
+ 0.02556098997592926,
1721
+ 0.03886540234088898,
1722
+ 0.02792912721633911,
1723
+ 0.034736618399620056,
1724
+ 0.027800733223557472,
1725
+ 0.041529931128025055,
1726
+ 0.035125184804201126,
1727
+ 0.029371172189712524,
1728
+ 0.02244860678911209,
1729
+ 0.016052132472395897,
1730
+ 0.02092311531305313,
1731
+ 0.033194392919540405,
1732
+ 0.026096615940332413,
1733
+ 0.02432301640510559,
1734
+ 0.0299396775662899,
1735
+ 0.03326310217380524,
1736
+ 0.030250942334532738,
1737
+ 0.025063108652830124,
1738
+ 0.03161277994513512,
1739
+ 0.02297906018793583,
1740
+ 0.028223620727658272,
1741
+ 0.030834481120109558,
1742
+ 0.02304169163107872,
1743
+ 0.019192688167095184,
1744
+ 0.020882301032543182,
1745
+ 0.030728142708539963,
1746
+ 0.016511153429746628,
1747
+ 0.0193704292178154,
1748
+ 0.037959255278110504,
1749
+ 0.01511578168720007,
1750
+ 0.023324817419052124,
1751
+ 0.02308131568133831,
1752
+ 0.020914902910590172,
1753
+ 0.02564297616481781,
1754
+ 0.024373067542910576,
1755
+ 0.02761363796889782,
1756
+ 0.0361679270863533,
1757
+ 0.028952863067388535,
1758
+ 0.01251924317330122,
1759
+ 0.021543417125940323,
1760
+ 0.020791608840227127,
1761
+ 0.027118902653455734,
1762
+ 0.022274363785982132,
1763
+ 0.03134313225746155,
1764
+ 0.018906977027654648,
1765
+ 0.014316488988697529,
1766
+ 0.033292144536972046,
1767
+ 0.02224327251315117,
1768
+ 0.018234441056847572,
1769
+ 0.027976777404546738,
1770
+ 0.018099039793014526,
1771
+ 0.016506290063261986,
1772
+ 0.022712500765919685,
1773
+ 0.02362247370183468,
1774
+ 0.028859354555606842,
1775
+ 0.019080739468336105,
1776
+ 0.016323670744895935,
1777
+ 0.021238233894109726,
1778
+ 0.027402406558394432,
1779
+ 0.017738115042448044,
1780
+ 0.016551129519939423,
1781
+ 0.019938500598073006,
1782
+ 0.02826363407075405,
1783
+ 0.025486722588539124,
1784
+ 0.015028645284473896,
1785
+ 0.019804272800683975,
1786
+ 0.020002400502562523,
1787
+ 0.02244696207344532,
1788
+ 0.020786341279745102,
1789
+ 0.017732737585902214,
1790
+ 0.018064947798848152,
1791
+ 0.031246665865182877,
1792
+ 0.024923836812376976,
1793
+ 0.033715397119522095,
1794
+ 0.019993985071778297,
1795
+ 0.019221516326069832,
1796
+ 0.030425837263464928,
1797
+ 0.021430673077702522,
1798
+ 0.018475424498319626,
1799
+ 0.02993832528591156,
1800
+ 0.020508531481027603,
1801
+ 0.014232693240046501,
1802
+ 0.023218095302581787,
1803
+ 0.018060065805912018,
1804
+ 0.023033399134874344,
1805
+ 0.012707392685115337,
1806
+ 0.017972322180867195,
1807
+ 0.02748052403330803,
1808
+ 0.020518740639090538,
1809
+ 0.032109834253787994,
1810
+ 0.032908886671066284,
1811
+ 0.027202442288398743,
1812
+ 0.027389099821448326,
1813
+ 0.022012129426002502,
1814
+ 0.018132008612155914,
1815
+ 0.05144877731800079,
1816
+ 0.020437784492969513,
1817
+ 0.03164566680788994,
1818
+ 0.03595839813351631,
1819
+ 0.052811697125434875,
1820
+ 0.022840376943349838,
1821
+ 0.017720118165016174,
1822
+ 0.02753422223031521,
1823
+ 0.02647978626191616,
1824
+ 0.021758003160357475,
1825
+ 0.015394107438623905,
1826
+ 0.016921252012252808,
1827
+ 0.019567646086215973,
1828
+ 0.016805896535515785,
1829
+ 0.02535623125731945,
1830
+ 0.017683453857898712,
1831
+ 0.02336621657013893,
1832
+ 0.017459101974964142,
1833
+ 0.024023689329624176,
1834
+ 0.02092147059738636,
1835
+ 0.026238536462187767,
1836
+ 0.02345900610089302,
1837
+ 0.019740229472517967,
1838
+ 0.01478319801390171,
1839
+ 0.018580470234155655,
1840
+ 0.025637179613113403,
1841
+ 0.031021928414702415,
1842
+ 0.014154024422168732,
1843
+ 0.021339505910873413,
1844
+ 0.0182025283575058,
1845
+ 0.012221653014421463,
1846
+ 0.015151582658290863,
1847
+ 0.015532146207988262,
1848
+ 0.02139127254486084,
1849
+ 0.019869059324264526,
1850
+ 0.023927856236696243,
1851
+ 0.016613399609923363,
1852
+ 0.014474941417574883,
1853
+ 0.029584020376205444,
1854
+ 0.012418530881404877,
1855
+ 0.014698540791869164,
1856
+ 0.013206697069108486,
1857
+ 0.013590356335043907,
1858
+ 0.015584267675876617,
1859
+ 0.02152303420007229,
1860
+ 0.018447458744049072,
1861
+ 0.019729681313037872,
1862
+ 0.019198879599571228,
1863
+ 0.02013818360865116,
1864
+ 0.011445702984929085,
1865
+ 0.016010519117116928,
1866
+ 0.01849520020186901,
1867
+ 0.011419493705034256,
1868
+ 0.01580043137073517,
1869
+ 0.012664947658777237,
1870
+ 0.02173304557800293,
1871
+ 0.009314602240920067,
1872
+ 0.012594399973750114,
1873
+ 0.014063475653529167
1874
+ ],
1875
+ "denoise_loss": [],
1876
+ "ortho_loss": [
1877
+ 0.9333709478378296,
1878
+ 0.6308308839797974,
1879
+ 0.4150587022304535,
1880
+ 0.2892041802406311,
1881
+ 0.19332674145698547,
1882
+ 0.17707014083862305,
1883
+ 0.166446715593338,
1884
+ 0.13733863830566406,
1885
+ 0.11083301901817322,
1886
+ 0.10711774230003357,
1887
+ 0.10654493421316147,
1888
+ 0.1081528589129448,
1889
+ 0.11822911351919174,
1890
+ 0.12990574538707733,
1891
+ 0.15268974006175995,
1892
+ 0.16605304181575775,
1893
+ 0.17477574944496155,
1894
+ 0.18307840824127197,
1895
+ 0.19441837072372437,
1896
+ 0.2060604691505432,
1897
+ 0.21536315977573395,
1898
+ 0.22143158316612244,
1899
+ 0.2279053032398224,
1900
+ 0.23052586615085602,
1901
+ 0.23592153191566467,
1902
+ 0.24382653832435608,
1903
+ 0.24329723417758942,
1904
+ 0.24600692093372345,
1905
+ 0.2511166036128998,
1906
+ 0.2505258619785309,
1907
+ 0.25530147552490234,
1908
+ 0.25758427381515503,
1909
+ 0.25553104281425476,
1910
+ 0.2592415511608124,
1911
+ 0.2596992254257202,
1912
+ 0.2601006031036377,
1913
+ 0.2595624625682831,
1914
+ 0.2595066428184509,
1915
+ 0.26065850257873535,
1916
+ 0.2611340284347534,
1917
+ 0.2594366669654846,
1918
+ 0.26323431730270386,
1919
+ 0.2660321891307831,
1920
+ 0.2679878771305084,
1921
+ 0.2684157192707062,
1922
+ 0.26988834142684937,
1923
+ 0.2704735994338989,
1924
+ 0.2655894160270691,
1925
+ 0.2642352879047394,
1926
+ 0.2643618583679199,
1927
+ 0.26621660590171814,
1928
+ 0.26454290747642517,
1929
+ 0.262870728969574,
1930
+ 0.26233384013175964,
1931
+ 0.26171162724494934,
1932
+ 0.2598952353000641,
1933
+ 0.2565430998802185,
1934
+ 0.254987508058548,
1935
+ 0.2577458918094635,
1936
+ 0.25746971368789673,
1937
+ 0.25535234808921814,
1938
+ 0.2547993063926697,
1939
+ 0.24966923892498016,
1940
+ 0.25087061524391174,
1941
+ 0.2469557821750641,
1942
+ 0.24440476298332214,
1943
+ 0.24528679251670837,
1944
+ 0.25163495540618896,
1945
+ 0.25011399388313293,
1946
+ 0.25165289640426636,
1947
+ 0.2533286511898041,
1948
+ 0.2535499036312103,
1949
+ 0.24993078410625458,
1950
+ 0.25142911076545715,
1951
+ 0.24880218505859375,
1952
+ 0.24764417111873627,
1953
+ 0.24868673086166382,
1954
+ 0.25567251443862915,
1955
+ 0.2550661265850067,
1956
+ 0.25474682450294495,
1957
+ 0.2570652663707733,
1958
+ 0.25641271471977234,
1959
+ 0.260037362575531,
1960
+ 0.25931286811828613,
1961
+ 0.2570188641548157,
1962
+ 0.25402596592903137,
1963
+ 0.24845820665359497,
1964
+ 0.24738140404224396,
1965
+ 0.24976491928100586,
1966
+ 0.24371632933616638,
1967
+ 0.24283857643604279,
1968
+ 0.2415243536233902,
1969
+ 0.2389516532421112,
1970
+ 0.23993976414203644,
1971
+ 0.23685067892074585,
1972
+ 0.23623093962669373,
1973
+ 0.23535040020942688,
1974
+ 0.23545700311660767,
1975
+ 0.23676586151123047,
1976
+ 0.2359374463558197,
1977
+ 0.23601751029491425,
1978
+ 0.23786631226539612,
1979
+ 0.23994474112987518,
1980
+ 0.23437577486038208,
1981
+ 0.2316410094499588,
1982
+ 0.22984708845615387,
1983
+ 0.2367476522922516,
1984
+ 0.23675338923931122,
1985
+ 0.23577436804771423,
1986
+ 0.23775532841682434,
1987
+ 0.23460887372493744,
1988
+ 0.23389208316802979,
1989
+ 0.23258386552333832,
1990
+ 0.2268686443567276,
1991
+ 0.2264840453863144,
1992
+ 0.22687679529190063,
1993
+ 0.2271483689546585,
1994
+ 0.22968031466007233,
1995
+ 0.22700731456279755,
1996
+ 0.2234393209218979,
1997
+ 0.22132118046283722,
1998
+ 0.21585044264793396,
1999
+ 0.22008442878723145,
2000
+ 0.22143056988716125,
2001
+ 0.2230714112520218,
2002
+ 0.22327327728271484,
2003
+ 0.2229500561952591,
2004
+ 0.2197694629430771,
2005
+ 0.22258102893829346,
2006
+ 0.2234944850206375,
2007
+ 0.22243764996528625,
2008
+ 0.2204165905714035,
2009
+ 0.22256164252758026,
2010
+ 0.22307437658309937,
2011
+ 0.22309176623821259,
2012
+ 0.22266785800457,
2013
+ 0.2229180932044983,
2014
+ 0.22392676770687103,
2015
+ 0.22399261593818665,
2016
+ 0.2252259999513626,
2017
+ 0.22278866171836853,
2018
+ 0.22075329720973969,
2019
+ 0.22390493750572205,
2020
+ 0.22366319596767426,
2021
+ 0.22134855389595032,
2022
+ 0.22104404866695404,
2023
+ 0.22058901190757751,
2024
+ 0.22168795764446259,
2025
+ 0.21861295402050018,
2026
+ 0.21891270577907562,
2027
+ 0.2173292189836502,
2028
+ 0.21650256216526031,
2029
+ 0.2147790789604187,
2030
+ 0.2152273803949356,
2031
+ 0.2126801759004593,
2032
+ 0.21074366569519043,
2033
+ 0.2088627964258194,
2034
+ 0.20668046176433563,
2035
+ 0.2081356644630432,
2036
+ 0.20418785512447357,
2037
+ 0.2027214765548706,
2038
+ 0.20179711282253265,
2039
+ 0.2047148197889328,
2040
+ 0.20528995990753174,
2041
+ 0.2082604467868805,
2042
+ 0.20916081964969635,
2043
+ 0.20792485773563385,
2044
+ 0.20808105170726776,
2045
+ 0.2057202160358429,
2046
+ 0.20713961124420166,
2047
+ 0.2063913643360138,
2048
+ 0.20946520566940308,
2049
+ 0.21049541234970093,
2050
+ 0.20999348163604736,
2051
+ 0.21008725464344025,
2052
+ 0.20702557265758514,
2053
+ 0.20705953240394592,
2054
+ 0.2053450644016266,
2055
+ 0.20888005197048187,
2056
+ 0.20728805661201477,
2057
+ 0.2072432041168213,
2058
+ 0.2075180858373642,
2059
+ 0.20379330217838287,
2060
+ 0.20430469512939453,
2061
+ 0.203228160738945,
2062
+ 0.2039157599210739,
2063
+ 0.19957931339740753,
2064
+ 0.20222312211990356,
2065
+ 0.20464438199996948,
2066
+ 0.20372842252254486,
2067
+ 0.20377814769744873,
2068
+ 0.2038251906633377,
2069
+ 0.20239806175231934,
2070
+ 0.20012249052524567,
2071
+ 0.19935493171215057,
2072
+ 0.19491460919380188,
2073
+ 0.1950601041316986,
2074
+ 0.1933392435312271,
2075
+ 0.1931627243757248,
2076
+ 0.194549560546875,
2077
+ 0.19782963395118713,
2078
+ 0.1952061504125595,
2079
+ 0.19629552960395813,
2080
+ 0.19705578684806824,
2081
+ 0.1944155991077423,
2082
+ 0.19655749201774597,
2083
+ 0.19557835161685944,
2084
+ 0.19652190804481506,
2085
+ 0.19533191621303558,
2086
+ 0.19499757885932922,
2087
+ 0.19416728615760803,
2088
+ 0.19508403539657593,
2089
+ 0.192694753408432,
2090
+ 0.19308702647686005,
2091
+ 0.19311173260211945,
2092
+ 0.1946423202753067,
2093
+ 0.19308170676231384,
2094
+ 0.19140398502349854,
2095
+ 0.1922903060913086,
2096
+ 0.1936880648136139,
2097
+ 0.19247913360595703,
2098
+ 0.1918903887271881,
2099
+ 0.19200348854064941,
2100
+ 0.1914215385913849,
2101
+ 0.19212058186531067,
2102
+ 0.1931421309709549,
2103
+ 0.19275791943073273,
2104
+ 0.1919129341840744,
2105
+ 0.19288034737110138,
2106
+ 0.19191424548625946,
2107
+ 0.1923104077577591,
2108
+ 0.19141116738319397,
2109
+ 0.19080063700675964,
2110
+ 0.1909828782081604,
2111
+ 0.19203798472881317,
2112
+ 0.19173741340637207,
2113
+ 0.19222232699394226,
2114
+ 0.19140870869159698,
2115
+ 0.1906118392944336,
2116
+ 0.19115376472473145,
2117
+ 0.19102847576141357,
2118
+ 0.1911878138780594,
2119
+ 0.19050511717796326,
2120
+ 0.18949173390865326,
2121
+ 0.18837480247020721,
2122
+ 0.18857349455356598,
2123
+ 0.19203560054302216,
2124
+ 0.19109252095222473,
2125
+ 0.19306501746177673,
2126
+ 0.19350570440292358,
2127
+ 0.19490084052085876,
2128
+ 0.1954215168952942,
2129
+ 0.19767098128795624,
2130
+ 0.19803857803344727,
2131
+ 0.19837264716625214,
2132
+ 0.19853557646274567,
2133
+ 0.19824384152889252,
2134
+ 0.199829563498497,
2135
+ 0.19941304624080658,
2136
+ 0.2001725435256958,
2137
+ 0.20109978318214417,
2138
+ 0.20163023471832275,
2139
+ 0.20199553668498993,
2140
+ 0.20207828283309937,
2141
+ 0.2020748108625412,
2142
+ 0.2010546326637268,
2143
+ 0.2014133781194687,
2144
+ 0.20234157145023346,
2145
+ 0.20224446058273315,
2146
+ 0.20123662054538727,
2147
+ 0.20157521963119507,
2148
+ 0.201634019613266,
2149
+ 0.20164793729782104,
2150
+ 0.20207831263542175,
2151
+ 0.20247094333171844,
2152
+ 0.2016265094280243,
2153
+ 0.20163075625896454,
2154
+ 0.20101690292358398,
2155
+ 0.20207585394382477,
2156
+ 0.2025221586227417,
2157
+ 0.20208317041397095,
2158
+ 0.20152181386947632,
2159
+ 0.2012781947851181,
2160
+ 0.20215976238250732,
2161
+ 0.20119856297969818,
2162
+ 0.20118388533592224,
2163
+ 0.20139957964420319,
2164
+ 0.2009301483631134,
2165
+ 0.2007567584514618,
2166
+ 0.20078420639038086,
2167
+ 0.20057371258735657,
2168
+ 0.20089110732078552,
2169
+ 0.20103169977664948,
2170
+ 0.20069797337055206,
2171
+ 0.2004106193780899,
2172
+ 0.20041851699352264,
2173
+ 0.20023564994335175,
2174
+ 0.20043036341667175,
2175
+ 0.20020100474357605,
2176
+ 0.20024654269218445,
2177
+ 0.20010225474834442,
2178
+ 0.1999865621328354,
2179
+ 0.1999346911907196,
2180
+ 0.2005068063735962,
2181
+ 0.20037813484668732,
2182
+ 0.20055745542049408,
2183
+ 0.20020297169685364,
2184
+ 0.20010267198085785,
2185
+ 0.19998785853385925,
2186
+ 0.2001042664051056
2187
+ ],
2188
+ "lr": [
2189
+ 4.188034188034189e-06,
2190
+ 8.461538461538462e-06,
2191
+ 1.2735042735042738e-05,
2192
+ 1.700854700854701e-05,
2193
+ 2.1282051282051282e-05,
2194
+ 2.5555555555555557e-05,
2195
+ 2.9829059829059833e-05,
2196
+ 3.4102564102564105e-05,
2197
+ 3.837606837606838e-05,
2198
+ 4e-05,
2199
+ 4e-05,
2200
+ 4e-05,
2201
+ 4e-05,
2202
+ 4e-05,
2203
+ 4e-05,
2204
+ 4e-05,
2205
+ 4e-05,
2206
+ 4e-05,
2207
+ 4e-05,
2208
+ 4e-05,
2209
+ 4e-05,
2210
+ 4e-05,
2211
+ 4e-05,
2212
+ 4e-05,
2213
+ 4e-05,
2214
+ 4e-05,
2215
+ 4e-05,
2216
+ 4e-05,
2217
+ 4e-05,
2218
+ 4e-05,
2219
+ 4e-05,
2220
+ 4e-05,
2221
+ 4e-05,
2222
+ 4e-05,
2223
+ 4e-05,
2224
+ 4e-05,
2225
+ 4e-05,
2226
+ 4e-05,
2227
+ 4e-05,
2228
+ 4e-05,
2229
+ 4e-05,
2230
+ 4e-05,
2231
+ 4e-05,
2232
+ 4e-05,
2233
+ 4e-05,
2234
+ 4e-05,
2235
+ 4e-05,
2236
+ 4e-05,
2237
+ 4e-05,
2238
+ 4e-05,
2239
+ 4e-05,
2240
+ 4e-05,
2241
+ 4e-05,
2242
+ 4e-05,
2243
+ 4e-05,
2244
+ 4e-05,
2245
+ 4e-05,
2246
+ 4e-05,
2247
+ 4e-05,
2248
+ 4e-05,
2249
+ 4e-05,
2250
+ 4e-05,
2251
+ 4e-05,
2252
+ 4e-05,
2253
+ 4e-05,
2254
+ 4e-05,
2255
+ 4e-05,
2256
+ 4e-05,
2257
+ 4e-05,
2258
+ 4e-05,
2259
+ 4e-05,
2260
+ 4e-05,
2261
+ 4e-05,
2262
+ 4e-05,
2263
+ 4e-05,
2264
+ 4e-05,
2265
+ 4e-05,
2266
+ 4e-05,
2267
+ 4e-05,
2268
+ 4e-05,
2269
+ 4e-05,
2270
+ 4e-05,
2271
+ 4e-05,
2272
+ 4e-05,
2273
+ 4e-05,
2274
+ 4e-05,
2275
+ 4e-05,
2276
+ 4e-05,
2277
+ 4e-05,
2278
+ 4e-05,
2279
+ 4e-05,
2280
+ 4e-05,
2281
+ 4e-05,
2282
+ 4e-05,
2283
+ 4e-05,
2284
+ 4e-05,
2285
+ 4e-05,
2286
+ 4e-05,
2287
+ 4e-05,
2288
+ 4e-05,
2289
+ 4e-05,
2290
+ 4e-05,
2291
+ 4e-05,
2292
+ 4e-05,
2293
+ 4e-05,
2294
+ 4e-05,
2295
+ 4e-05,
2296
+ 4e-05,
2297
+ 4e-05,
2298
+ 4e-05,
2299
+ 4e-05,
2300
+ 4e-05,
2301
+ 4e-05,
2302
+ 4e-05,
2303
+ 4e-05,
2304
+ 4e-05,
2305
+ 4e-05,
2306
+ 4e-05,
2307
+ 4e-05,
2308
+ 4e-05,
2309
+ 4e-05,
2310
+ 4e-05,
2311
+ 4e-05,
2312
+ 4e-05,
2313
+ 4e-05,
2314
+ 4e-05,
2315
+ 4e-05,
2316
+ 4e-05,
2317
+ 4e-05,
2318
+ 4e-05,
2319
+ 4e-05,
2320
+ 4e-05,
2321
+ 4e-05,
2322
+ 4e-05,
2323
+ 4e-05,
2324
+ 4e-05,
2325
+ 4e-05,
2326
+ 4e-05,
2327
+ 4e-05,
2328
+ 4e-05,
2329
+ 4e-05,
2330
+ 4e-05,
2331
+ 4e-05,
2332
+ 4e-05,
2333
+ 4e-05,
2334
+ 4e-05,
2335
+ 4e-05,
2336
+ 4e-05,
2337
+ 4e-05,
2338
+ 4e-05,
2339
+ 4e-05,
2340
+ 4e-05,
2341
+ 4e-05,
2342
+ 4e-05,
2343
+ 4e-05,
2344
+ 4e-05,
2345
+ 4e-05,
2346
+ 4e-05,
2347
+ 4e-05,
2348
+ 4e-05,
2349
+ 4e-05,
2350
+ 4e-05,
2351
+ 4e-05,
2352
+ 4e-05,
2353
+ 4e-05,
2354
+ 4e-05,
2355
+ 4e-05,
2356
+ 4e-05,
2357
+ 4e-05,
2358
+ 4e-05,
2359
+ 4e-05,
2360
+ 4e-05,
2361
+ 4e-05,
2362
+ 4e-05,
2363
+ 4e-05,
2364
+ 4e-05,
2365
+ 4e-05,
2366
+ 4e-05,
2367
+ 4e-05,
2368
+ 4e-05,
2369
+ 4e-05,
2370
+ 4e-05,
2371
+ 4e-05,
2372
+ 4e-05,
2373
+ 4e-05,
2374
+ 4e-05,
2375
+ 4e-05,
2376
+ 4e-05,
2377
+ 4e-05,
2378
+ 3.992995647012267e-05,
2379
+ 3.963316185199842e-05,
2380
+ 3.933636723387416e-05,
2381
+ 3.90395726157499e-05,
2382
+ 3.874277799762565e-05,
2383
+ 3.844598337950139e-05,
2384
+ 3.814918876137713e-05,
2385
+ 3.785239414325287e-05,
2386
+ 3.7555599525128613e-05,
2387
+ 3.725880490700435e-05,
2388
+ 3.696201028888009e-05,
2389
+ 3.666521567075585e-05,
2390
+ 3.6368421052631585e-05,
2391
+ 3.607162643450732e-05,
2392
+ 3.577483181638307e-05,
2393
+ 3.547803719825881e-05,
2394
+ 3.518124258013455e-05,
2395
+ 3.4884447962010287e-05,
2396
+ 3.458765334388604e-05,
2397
+ 3.4290858725761776e-05,
2398
+ 3.399406410763751e-05,
2399
+ 3.3697269489513265e-05,
2400
+ 3.3400474871389e-05,
2401
+ 3.310368025326474e-05,
2402
+ 3.280688563514048e-05,
2403
+ 3.251009101701623e-05,
2404
+ 3.2213296398891967e-05,
2405
+ 3.191650178076771e-05,
2406
+ 3.1542540561931145e-05,
2407
+ 3.124574594380688e-05,
2408
+ 3.094895132568263e-05,
2409
+ 3.065215670755838e-05,
2410
+ 3.0355362089434113e-05,
2411
+ 3.0058567471309854e-05,
2412
+ 2.97617728531856e-05,
2413
+ 2.9464978235061336e-05,
2414
+ 2.9168183616937077e-05,
2415
+ 2.8871388998812818e-05,
2416
+ 2.857459438068857e-05,
2417
+ 2.8277799762564307e-05,
2418
+ 2.798100514444005e-05,
2419
+ 2.7684210526315793e-05,
2420
+ 2.738741590819153e-05,
2421
+ 2.709062129006727e-05,
2422
+ 2.6793826671943013e-05,
2423
+ 2.6497032053818764e-05,
2424
+ 2.62002374356945e-05,
2425
+ 2.5903442817570243e-05,
2426
+ 2.5606648199445987e-05,
2427
+ 2.5309853581321725e-05,
2428
+ 2.5013058963197466e-05,
2429
+ 2.4716264345073214e-05,
2430
+ 2.441946972694896e-05,
2431
+ 2.4122675108824693e-05,
2432
+ 2.3825880490700434e-05,
2433
+ 2.352908587257618e-05,
2434
+ 2.3232291254451916e-05,
2435
+ 2.293549663632766e-05,
2436
+ 2.2638702018203408e-05,
2437
+ 2.226474079936684e-05,
2438
+ 2.196794618124258e-05,
2439
+ 2.1671151563118328e-05,
2440
+ 2.1374356944994066e-05,
2441
+ 2.1077562326869803e-05,
2442
+ 2.0780767708745554e-05,
2443
+ 2.0483973090621296e-05,
2444
+ 2.018717847249703e-05,
2445
+ 1.989038385437277e-05,
2446
+ 1.959358923624852e-05,
2447
+ 1.929679461812426e-05,
2448
+ 1.8999999999999998e-05,
2449
+ 1.8703205381875746e-05,
2450
+ 1.8406410763751487e-05,
2451
+ 1.8109616145627224e-05,
2452
+ 1.7812821527502965e-05,
2453
+ 1.7516026909378713e-05,
2454
+ 1.7219232291254454e-05,
2455
+ 1.6922437673130192e-05,
2456
+ 1.662564305500594e-05,
2457
+ 1.632884843688168e-05,
2458
+ 1.603205381875742e-05,
2459
+ 1.573525920063316e-05,
2460
+ 1.5438464582508908e-05,
2461
+ 1.5141669964384647e-05,
2462
+ 1.4844875346260385e-05,
2463
+ 1.4548080728136134e-05,
2464
+ 1.4251286110011875e-05,
2465
+ 1.3954491491887611e-05,
2466
+ 1.3657696873763363e-05,
2467
+ 1.33609022556391e-05,
2468
+ 1.298694103680253e-05,
2469
+ 1.2690146418678277e-05,
2470
+ 1.2393351800554018e-05,
2471
+ 1.2096557182429756e-05,
2472
+ 1.1799762564305506e-05,
2473
+ 1.1502967946181245e-05,
2474
+ 1.1206173328056984e-05,
2475
+ 1.0909378709932724e-05,
2476
+ 1.0612584091808472e-05,
2477
+ 1.0315789473684213e-05,
2478
+ 1.0018994855559949e-05,
2479
+ 9.7222002374357e-06,
2480
+ 9.425405619311438e-06,
2481
+ 9.128611001187177e-06,
2482
+ 8.831816383062916e-06,
2483
+ 8.535021764938666e-06,
2484
+ 8.238227146814405e-06,
2485
+ 7.941432528690143e-06,
2486
+ 7.644637910565893e-06,
2487
+ 7.347843292441632e-06,
2488
+ 7.0510486743173715e-06,
2489
+ 6.75425405619311e-06,
2490
+ 6.45745943806886e-06,
2491
+ 6.160664819944598e-06,
2492
+ 5.8638702018203375e-06,
2493
+ 5.567075583696086e-06,
2494
+ 5.270280965571826e-06,
2495
+ 4.973486347447565e-06,
2496
+ 4.676691729323314e-06,
2497
+ 4.379897111199053e-06,
2498
+ 4.083102493074792e-06
2499
+ ],
2500
+ "emb_lr": [],
2501
+ "eval_step": [
2502
+ 1550,
2503
+ 3113,
2504
+ 4676,
2505
+ 6239,
2506
+ 7802,
2507
+ 9365,
2508
+ 10928,
2509
+ 12491,
2510
+ 14054,
2511
+ 15617
2512
+ ],
2513
+ "eval_accuracy": [
2514
+ 0.0,
2515
+ 0.0,
2516
+ 0.0,
2517
+ 0.0,
2518
+ 0.0,
2519
+ 0.0,
2520
+ 0.0,
2521
+ 0.0,
2522
+ 0.0,
2523
+ 0.0
2524
+ ]
2525
+ },
2526
+ "final_accuracy": 1.0,
2527
+ "sft_eval": {
2528
+ "config": {
2529
+ "ops": "add_sub",
2530
+ "K": null,
2531
+ "mode": "sft",
2532
+ "n_digits": 6,
2533
+ "n_per_split": 100
2534
+ },
2535
+ "splits": {
2536
+ "add_S0": {
2537
+ "full_accuracy": 1.0,
2538
+ "n_examples": 100,
2539
+ "per_subtask": {
2540
+ "SA": {
2541
+ "accuracy": 1.0,
2542
+ "count": 605
2543
+ },
2544
+ "SS": {
2545
+ "accuracy": 1.0,
2546
+ "count": 95
2547
+ }
2548
+ }
2549
+ },
2550
+ "add_S1": {
2551
+ "full_accuracy": 1.0,
2552
+ "n_examples": 100,
2553
+ "per_subtask": {
2554
+ "SA": {
2555
+ "accuracy": 1.0,
2556
+ "count": 204
2557
+ },
2558
+ "SC": {
2559
+ "accuracy": 1.0,
2560
+ "count": 169
2561
+ },
2562
+ "SS": {
2563
+ "accuracy": 1.0,
2564
+ "count": 31
2565
+ },
2566
+ "UC": {
2567
+ "accuracy": 1.0,
2568
+ "count": 296
2569
+ }
2570
+ }
2571
+ },
2572
+ "add_S2": {
2573
+ "full_accuracy": 1.0,
2574
+ "n_examples": 100,
2575
+ "per_subtask": {
2576
+ "SA": {
2577
+ "accuracy": 1.0,
2578
+ "count": 163
2579
+ },
2580
+ "SC": {
2581
+ "accuracy": 1.0,
2582
+ "count": 130
2583
+ },
2584
+ "SS": {
2585
+ "accuracy": 1.0,
2586
+ "count": 87
2587
+ },
2588
+ "UC": {
2589
+ "accuracy": 1.0,
2590
+ "count": 203
2591
+ },
2592
+ "US": {
2593
+ "accuracy": 1.0,
2594
+ "count": 117
2595
+ }
2596
+ }
2597
+ },
2598
+ "add_S3": {
2599
+ "full_accuracy": 1.0,
2600
+ "n_examples": 100,
2601
+ "per_subtask": {
2602
+ "SA": {
2603
+ "accuracy": 1.0,
2604
+ "count": 121
2605
+ },
2606
+ "SC": {
2607
+ "accuracy": 1.0,
2608
+ "count": 121
2609
+ },
2610
+ "SS": {
2611
+ "accuracy": 1.0,
2612
+ "count": 49
2613
+ },
2614
+ "UC": {
2615
+ "accuracy": 1.0,
2616
+ "count": 186
2617
+ },
2618
+ "US": {
2619
+ "accuracy": 1.0,
2620
+ "count": 223
2621
+ }
2622
+ }
2623
+ },
2624
+ "add_S4": {
2625
+ "full_accuracy": 1.0,
2626
+ "n_examples": 100,
2627
+ "per_subtask": {
2628
+ "SA": {
2629
+ "accuracy": 1.0,
2630
+ "count": 104
2631
+ },
2632
+ "SC": {
2633
+ "accuracy": 1.0,
2634
+ "count": 106
2635
+ },
2636
+ "SS": {
2637
+ "accuracy": 1.0,
2638
+ "count": 23
2639
+ },
2640
+ "UC": {
2641
+ "accuracy": 1.0,
2642
+ "count": 160
2643
+ },
2644
+ "US": {
2645
+ "accuracy": 1.0,
2646
+ "count": 307
2647
+ }
2648
+ }
2649
+ },
2650
+ "add_S5": {
2651
+ "full_accuracy": 1.0,
2652
+ "n_examples": 100,
2653
+ "per_subtask": {
2654
+ "SA": {
2655
+ "accuracy": 1.0,
2656
+ "count": 100
2657
+ },
2658
+ "SC": {
2659
+ "accuracy": 1.0,
2660
+ "count": 100
2661
+ },
2662
+ "UC": {
2663
+ "accuracy": 1.0,
2664
+ "count": 100
2665
+ },
2666
+ "US": {
2667
+ "accuracy": 1.0,
2668
+ "count": 400
2669
+ }
2670
+ }
2671
+ },
2672
+ "add_S6": {
2673
+ "full_accuracy": 1.0,
2674
+ "n_examples": 100,
2675
+ "per_subtask": {
2676
+ "SC": {
2677
+ "accuracy": 1.0,
2678
+ "count": 100
2679
+ },
2680
+ "UC": {
2681
+ "accuracy": 1.0,
2682
+ "count": 100
2683
+ },
2684
+ "US": {
2685
+ "accuracy": 1.0,
2686
+ "count": 500
2687
+ }
2688
+ }
2689
+ },
2690
+ "add_random": {
2691
+ "full_accuracy": 1.0,
2692
+ "n_examples": 200,
2693
+ "per_subtask": {
2694
+ "SA": {
2695
+ "accuracy": 1.0,
2696
+ "count": 447
2697
+ },
2698
+ "SC": {
2699
+ "accuracy": 1.0,
2700
+ "count": 320
2701
+ },
2702
+ "SS": {
2703
+ "accuracy": 1.0,
2704
+ "count": 56
2705
+ },
2706
+ "UC": {
2707
+ "accuracy": 1.0,
2708
+ "count": 529
2709
+ },
2710
+ "US": {
2711
+ "accuracy": 1.0,
2712
+ "count": 48
2713
+ }
2714
+ }
2715
+ },
2716
+ "add_C3": {
2717
+ "full_accuracy": 1.0,
2718
+ "n_examples": 100,
2719
+ "per_subtask": {
2720
+ "SA": {
2721
+ "accuracy": 1.0,
2722
+ "count": 300
2723
+ },
2724
+ "SC": {
2725
+ "accuracy": 1.0,
2726
+ "count": 100
2727
+ },
2728
+ "UC": {
2729
+ "accuracy": 1.0,
2730
+ "count": 193
2731
+ },
2732
+ "US": {
2733
+ "accuracy": 1.0,
2734
+ "count": 107
2735
+ }
2736
+ }
2737
+ },
2738
+ "add_C4": {
2739
+ "full_accuracy": 1.0,
2740
+ "n_examples": 100,
2741
+ "per_subtask": {
2742
+ "SA": {
2743
+ "accuracy": 1.0,
2744
+ "count": 200
2745
+ },
2746
+ "SC": {
2747
+ "accuracy": 1.0,
2748
+ "count": 100
2749
+ },
2750
+ "UC": {
2751
+ "accuracy": 1.0,
2752
+ "count": 256
2753
+ },
2754
+ "US": {
2755
+ "accuracy": 1.0,
2756
+ "count": 144
2757
+ }
2758
+ }
2759
+ },
2760
+ "add_C5": {
2761
+ "full_accuracy": 1.0,
2762
+ "n_examples": 100,
2763
+ "per_subtask": {
2764
+ "SA": {
2765
+ "accuracy": 1.0,
2766
+ "count": 100
2767
+ },
2768
+ "SC": {
2769
+ "accuracy": 1.0,
2770
+ "count": 100
2771
+ },
2772
+ "UC": {
2773
+ "accuracy": 1.0,
2774
+ "count": 306
2775
+ },
2776
+ "US": {
2777
+ "accuracy": 1.0,
2778
+ "count": 194
2779
+ }
2780
+ }
2781
+ },
2782
+ "add_C6": {
2783
+ "full_accuracy": 1.0,
2784
+ "n_examples": 100,
2785
+ "per_subtask": {
2786
+ "SC": {
2787
+ "accuracy": 1.0,
2788
+ "count": 100
2789
+ },
2790
+ "UC": {
2791
+ "accuracy": 1.0,
2792
+ "count": 366
2793
+ },
2794
+ "US": {
2795
+ "accuracy": 1.0,
2796
+ "count": 234
2797
+ }
2798
+ }
2799
+ },
2800
+ "sub_M0": {
2801
+ "full_accuracy": 1.0,
2802
+ "n_examples": 100,
2803
+ "per_subtask": {
2804
+ "MD": {
2805
+ "accuracy": 1.0,
2806
+ "count": 601
2807
+ },
2808
+ "ME": {
2809
+ "accuracy": 1.0,
2810
+ "count": 99
2811
+ }
2812
+ }
2813
+ },
2814
+ "sub_M1": {
2815
+ "full_accuracy": 1.0,
2816
+ "n_examples": 100,
2817
+ "per_subtask": {
2818
+ "MD": {
2819
+ "accuracy": 1.0,
2820
+ "count": 279
2821
+ },
2822
+ "MB": {
2823
+ "accuracy": 1.0,
2824
+ "count": 145
2825
+ },
2826
+ "ME": {
2827
+ "accuracy": 1.0,
2828
+ "count": 24
2829
+ },
2830
+ "UB": {
2831
+ "accuracy": 1.0,
2832
+ "count": 252
2833
+ }
2834
+ }
2835
+ },
2836
+ "sub_M2": {
2837
+ "full_accuracy": 1.0,
2838
+ "n_examples": 100,
2839
+ "per_subtask": {
2840
+ "MD": {
2841
+ "accuracy": 1.0,
2842
+ "count": 213
2843
+ },
2844
+ "MB": {
2845
+ "accuracy": 1.0,
2846
+ "count": 113
2847
+ },
2848
+ "ME": {
2849
+ "accuracy": 1.0,
2850
+ "count": 85
2851
+ },
2852
+ "UB": {
2853
+ "accuracy": 1.0,
2854
+ "count": 181
2855
+ },
2856
+ "UD": {
2857
+ "accuracy": 1.0,
2858
+ "count": 108
2859
+ }
2860
+ }
2861
+ },
2862
+ "sub_M3": {
2863
+ "full_accuracy": 1.0,
2864
+ "n_examples": 100,
2865
+ "per_subtask": {
2866
+ "MD": {
2867
+ "accuracy": 1.0,
2868
+ "count": 179
2869
+ },
2870
+ "MB": {
2871
+ "accuracy": 1.0,
2872
+ "count": 103
2873
+ },
2874
+ "ME": {
2875
+ "accuracy": 1.0,
2876
+ "count": 56
2877
+ },
2878
+ "UB": {
2879
+ "accuracy": 1.0,
2880
+ "count": 149
2881
+ },
2882
+ "UD": {
2883
+ "accuracy": 1.0,
2884
+ "count": 213
2885
+ }
2886
+ }
2887
+ },
2888
+ "sub_M4": {
2889
+ "full_accuracy": 1.0,
2890
+ "n_examples": 100,
2891
+ "per_subtask": {
2892
+ "MD": {
2893
+ "accuracy": 1.0,
2894
+ "count": 200
2895
+ },
2896
+ "MB": {
2897
+ "accuracy": 1.0,
2898
+ "count": 100
2899
+ },
2900
+ "UB": {
2901
+ "accuracy": 1.0,
2902
+ "count": 100
2903
+ },
2904
+ "UD": {
2905
+ "accuracy": 1.0,
2906
+ "count": 300
2907
+ }
2908
+ }
2909
+ },
2910
+ "sub_M5": {
2911
+ "full_accuracy": 1.0,
2912
+ "n_examples": 100,
2913
+ "per_subtask": {
2914
+ "MD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 100
2917
+ },
2918
+ "MB": {
2919
+ "accuracy": 1.0,
2920
+ "count": 100
2921
+ },
2922
+ "UB": {
2923
+ "accuracy": 1.0,
2924
+ "count": 100
2925
+ },
2926
+ "UD": {
2927
+ "accuracy": 1.0,
2928
+ "count": 400
2929
+ }
2930
+ }
2931
+ },
2932
+ "sub_random": {
2933
+ "full_accuracy": 1.0,
2934
+ "n_examples": 200,
2935
+ "per_subtask": {
2936
+ "MD": {
2937
+ "accuracy": 1.0,
2938
+ "count": 600
2939
+ },
2940
+ "MB": {
2941
+ "accuracy": 1.0,
2942
+ "count": 267
2943
+ },
2944
+ "ME": {
2945
+ "accuracy": 1.0,
2946
+ "count": 53
2947
+ },
2948
+ "UB": {
2949
+ "accuracy": 1.0,
2950
+ "count": 439
2951
+ },
2952
+ "UD": {
2953
+ "accuracy": 1.0,
2954
+ "count": 41
2955
+ }
2956
+ }
2957
+ },
2958
+ "sub_B3": {
2959
+ "full_accuracy": 1.0,
2960
+ "n_examples": 100,
2961
+ "per_subtask": {
2962
+ "MD": {
2963
+ "accuracy": 1.0,
2964
+ "count": 300
2965
+ },
2966
+ "MB": {
2967
+ "accuracy": 1.0,
2968
+ "count": 100
2969
+ },
2970
+ "UB": {
2971
+ "accuracy": 1.0,
2972
+ "count": 197
2973
+ },
2974
+ "UD": {
2975
+ "accuracy": 1.0,
2976
+ "count": 103
2977
+ }
2978
+ }
2979
+ },
2980
+ "sub_B4": {
2981
+ "full_accuracy": 1.0,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "MD": {
2985
+ "accuracy": 1.0,
2986
+ "count": 200
2987
+ },
2988
+ "MB": {
2989
+ "accuracy": 1.0,
2990
+ "count": 100
2991
+ },
2992
+ "UB": {
2993
+ "accuracy": 1.0,
2994
+ "count": 247
2995
+ },
2996
+ "UD": {
2997
+ "accuracy": 1.0,
2998
+ "count": 153
2999
+ }
3000
+ }
3001
+ },
3002
+ "sub_B5": {
3003
+ "full_accuracy": 1.0,
3004
+ "n_examples": 100,
3005
+ "per_subtask": {
3006
+ "MD": {
3007
+ "accuracy": 1.0,
3008
+ "count": 100
3009
+ },
3010
+ "MB": {
3011
+ "accuracy": 1.0,
3012
+ "count": 100
3013
+ },
3014
+ "UB": {
3015
+ "accuracy": 1.0,
3016
+ "count": 298
3017
+ },
3018
+ "UD": {
3019
+ "accuracy": 1.0,
3020
+ "count": 202
3021
+ }
3022
+ }
3023
+ }
3024
+ },
3025
+ "summary": {
3026
+ "overall_accuracy": 1.0,
3027
+ "total_examples": 2400,
3028
+ "n_splits": 22
3029
+ }
3030
+ },
3031
+ "sorl_eval": {
3032
+ "config": {
3033
+ "ops": "add_sub",
3034
+ "K": 1,
3035
+ "mode": "sorl",
3036
+ "n_digits": 6,
3037
+ "n_per_split": 100
3038
+ },
3039
+ "splits": {
3040
+ "add_S0": {
3041
+ "full_accuracy": 1.0,
3042
+ "n_examples": 100,
3043
+ "per_subtask": {
3044
+ "SA": {
3045
+ "accuracy": 1.0,
3046
+ "count": 605
3047
+ },
3048
+ "SS": {
3049
+ "accuracy": 1.0,
3050
+ "count": 95
3051
+ }
3052
+ }
3053
+ },
3054
+ "add_S1": {
3055
+ "full_accuracy": 1.0,
3056
+ "n_examples": 100,
3057
+ "per_subtask": {
3058
+ "SA": {
3059
+ "accuracy": 1.0,
3060
+ "count": 204
3061
+ },
3062
+ "SC": {
3063
+ "accuracy": 1.0,
3064
+ "count": 169
3065
+ },
3066
+ "SS": {
3067
+ "accuracy": 1.0,
3068
+ "count": 31
3069
+ },
3070
+ "UC": {
3071
+ "accuracy": 1.0,
3072
+ "count": 296
3073
+ }
3074
+ }
3075
+ },
3076
+ "add_S2": {
3077
+ "full_accuracy": 1.0,
3078
+ "n_examples": 100,
3079
+ "per_subtask": {
3080
+ "SA": {
3081
+ "accuracy": 1.0,
3082
+ "count": 163
3083
+ },
3084
+ "SC": {
3085
+ "accuracy": 1.0,
3086
+ "count": 130
3087
+ },
3088
+ "SS": {
3089
+ "accuracy": 1.0,
3090
+ "count": 87
3091
+ },
3092
+ "UC": {
3093
+ "accuracy": 1.0,
3094
+ "count": 203
3095
+ },
3096
+ "US": {
3097
+ "accuracy": 1.0,
3098
+ "count": 117
3099
+ }
3100
+ }
3101
+ },
3102
+ "add_S3": {
3103
+ "full_accuracy": 1.0,
3104
+ "n_examples": 100,
3105
+ "per_subtask": {
3106
+ "SA": {
3107
+ "accuracy": 1.0,
3108
+ "count": 121
3109
+ },
3110
+ "SC": {
3111
+ "accuracy": 1.0,
3112
+ "count": 121
3113
+ },
3114
+ "SS": {
3115
+ "accuracy": 1.0,
3116
+ "count": 49
3117
+ },
3118
+ "UC": {
3119
+ "accuracy": 1.0,
3120
+ "count": 186
3121
+ },
3122
+ "US": {
3123
+ "accuracy": 1.0,
3124
+ "count": 223
3125
+ }
3126
+ }
3127
+ },
3128
+ "add_S4": {
3129
+ "full_accuracy": 1.0,
3130
+ "n_examples": 100,
3131
+ "per_subtask": {
3132
+ "SA": {
3133
+ "accuracy": 1.0,
3134
+ "count": 104
3135
+ },
3136
+ "SC": {
3137
+ "accuracy": 1.0,
3138
+ "count": 106
3139
+ },
3140
+ "SS": {
3141
+ "accuracy": 1.0,
3142
+ "count": 23
3143
+ },
3144
+ "UC": {
3145
+ "accuracy": 1.0,
3146
+ "count": 160
3147
+ },
3148
+ "US": {
3149
+ "accuracy": 1.0,
3150
+ "count": 307
3151
+ }
3152
+ }
3153
+ },
3154
+ "add_S5": {
3155
+ "full_accuracy": 1.0,
3156
+ "n_examples": 100,
3157
+ "per_subtask": {
3158
+ "SA": {
3159
+ "accuracy": 1.0,
3160
+ "count": 100
3161
+ },
3162
+ "SC": {
3163
+ "accuracy": 1.0,
3164
+ "count": 100
3165
+ },
3166
+ "UC": {
3167
+ "accuracy": 1.0,
3168
+ "count": 100
3169
+ },
3170
+ "US": {
3171
+ "accuracy": 1.0,
3172
+ "count": 400
3173
+ }
3174
+ }
3175
+ },
3176
+ "add_S6": {
3177
+ "full_accuracy": 1.0,
3178
+ "n_examples": 100,
3179
+ "per_subtask": {
3180
+ "SC": {
3181
+ "accuracy": 1.0,
3182
+ "count": 100
3183
+ },
3184
+ "UC": {
3185
+ "accuracy": 1.0,
3186
+ "count": 100
3187
+ },
3188
+ "US": {
3189
+ "accuracy": 1.0,
3190
+ "count": 500
3191
+ }
3192
+ }
3193
+ },
3194
+ "add_random": {
3195
+ "full_accuracy": 1.0,
3196
+ "n_examples": 200,
3197
+ "per_subtask": {
3198
+ "SA": {
3199
+ "accuracy": 1.0,
3200
+ "count": 447
3201
+ },
3202
+ "SC": {
3203
+ "accuracy": 1.0,
3204
+ "count": 320
3205
+ },
3206
+ "SS": {
3207
+ "accuracy": 1.0,
3208
+ "count": 56
3209
+ },
3210
+ "UC": {
3211
+ "accuracy": 1.0,
3212
+ "count": 529
3213
+ },
3214
+ "US": {
3215
+ "accuracy": 1.0,
3216
+ "count": 48
3217
+ }
3218
+ }
3219
+ },
3220
+ "add_C3": {
3221
+ "full_accuracy": 1.0,
3222
+ "n_examples": 100,
3223
+ "per_subtask": {
3224
+ "SA": {
3225
+ "accuracy": 1.0,
3226
+ "count": 300
3227
+ },
3228
+ "SC": {
3229
+ "accuracy": 1.0,
3230
+ "count": 100
3231
+ },
3232
+ "UC": {
3233
+ "accuracy": 1.0,
3234
+ "count": 193
3235
+ },
3236
+ "US": {
3237
+ "accuracy": 1.0,
3238
+ "count": 107
3239
+ }
3240
+ }
3241
+ },
3242
+ "add_C4": {
3243
+ "full_accuracy": 1.0,
3244
+ "n_examples": 100,
3245
+ "per_subtask": {
3246
+ "SA": {
3247
+ "accuracy": 1.0,
3248
+ "count": 200
3249
+ },
3250
+ "SC": {
3251
+ "accuracy": 1.0,
3252
+ "count": 100
3253
+ },
3254
+ "UC": {
3255
+ "accuracy": 1.0,
3256
+ "count": 256
3257
+ },
3258
+ "US": {
3259
+ "accuracy": 1.0,
3260
+ "count": 144
3261
+ }
3262
+ }
3263
+ },
3264
+ "add_C5": {
3265
+ "full_accuracy": 1.0,
3266
+ "n_examples": 100,
3267
+ "per_subtask": {
3268
+ "SA": {
3269
+ "accuracy": 1.0,
3270
+ "count": 100
3271
+ },
3272
+ "SC": {
3273
+ "accuracy": 1.0,
3274
+ "count": 100
3275
+ },
3276
+ "UC": {
3277
+ "accuracy": 1.0,
3278
+ "count": 306
3279
+ },
3280
+ "US": {
3281
+ "accuracy": 1.0,
3282
+ "count": 194
3283
+ }
3284
+ }
3285
+ },
3286
+ "add_C6": {
3287
+ "full_accuracy": 1.0,
3288
+ "n_examples": 100,
3289
+ "per_subtask": {
3290
+ "SC": {
3291
+ "accuracy": 1.0,
3292
+ "count": 100
3293
+ },
3294
+ "UC": {
3295
+ "accuracy": 1.0,
3296
+ "count": 366
3297
+ },
3298
+ "US": {
3299
+ "accuracy": 1.0,
3300
+ "count": 234
3301
+ }
3302
+ }
3303
+ },
3304
+ "sub_M0": {
3305
+ "full_accuracy": 1.0,
3306
+ "n_examples": 100,
3307
+ "per_subtask": {
3308
+ "MD": {
3309
+ "accuracy": 1.0,
3310
+ "count": 601
3311
+ },
3312
+ "ME": {
3313
+ "accuracy": 1.0,
3314
+ "count": 99
3315
+ }
3316
+ }
3317
+ },
3318
+ "sub_M1": {
3319
+ "full_accuracy": 1.0,
3320
+ "n_examples": 100,
3321
+ "per_subtask": {
3322
+ "MD": {
3323
+ "accuracy": 1.0,
3324
+ "count": 279
3325
+ },
3326
+ "MB": {
3327
+ "accuracy": 1.0,
3328
+ "count": 145
3329
+ },
3330
+ "ME": {
3331
+ "accuracy": 1.0,
3332
+ "count": 24
3333
+ },
3334
+ "UB": {
3335
+ "accuracy": 1.0,
3336
+ "count": 252
3337
+ }
3338
+ }
3339
+ },
3340
+ "sub_M2": {
3341
+ "full_accuracy": 1.0,
3342
+ "n_examples": 100,
3343
+ "per_subtask": {
3344
+ "MD": {
3345
+ "accuracy": 1.0,
3346
+ "count": 213
3347
+ },
3348
+ "MB": {
3349
+ "accuracy": 1.0,
3350
+ "count": 113
3351
+ },
3352
+ "ME": {
3353
+ "accuracy": 1.0,
3354
+ "count": 85
3355
+ },
3356
+ "UB": {
3357
+ "accuracy": 1.0,
3358
+ "count": 181
3359
+ },
3360
+ "UD": {
3361
+ "accuracy": 1.0,
3362
+ "count": 108
3363
+ }
3364
+ }
3365
+ },
3366
+ "sub_M3": {
3367
+ "full_accuracy": 1.0,
3368
+ "n_examples": 100,
3369
+ "per_subtask": {
3370
+ "MD": {
3371
+ "accuracy": 1.0,
3372
+ "count": 179
3373
+ },
3374
+ "MB": {
3375
+ "accuracy": 1.0,
3376
+ "count": 103
3377
+ },
3378
+ "ME": {
3379
+ "accuracy": 1.0,
3380
+ "count": 56
3381
+ },
3382
+ "UB": {
3383
+ "accuracy": 1.0,
3384
+ "count": 149
3385
+ },
3386
+ "UD": {
3387
+ "accuracy": 1.0,
3388
+ "count": 213
3389
+ }
3390
+ }
3391
+ },
3392
+ "sub_M4": {
3393
+ "full_accuracy": 1.0,
3394
+ "n_examples": 100,
3395
+ "per_subtask": {
3396
+ "MD": {
3397
+ "accuracy": 1.0,
3398
+ "count": 200
3399
+ },
3400
+ "MB": {
3401
+ "accuracy": 1.0,
3402
+ "count": 100
3403
+ },
3404
+ "UB": {
3405
+ "accuracy": 1.0,
3406
+ "count": 100
3407
+ },
3408
+ "UD": {
3409
+ "accuracy": 1.0,
3410
+ "count": 300
3411
+ }
3412
+ }
3413
+ },
3414
+ "sub_M5": {
3415
+ "full_accuracy": 1.0,
3416
+ "n_examples": 100,
3417
+ "per_subtask": {
3418
+ "MD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 100
3421
+ },
3422
+ "MB": {
3423
+ "accuracy": 1.0,
3424
+ "count": 100
3425
+ },
3426
+ "UB": {
3427
+ "accuracy": 1.0,
3428
+ "count": 100
3429
+ },
3430
+ "UD": {
3431
+ "accuracy": 1.0,
3432
+ "count": 400
3433
+ }
3434
+ }
3435
+ },
3436
+ "sub_random": {
3437
+ "full_accuracy": 1.0,
3438
+ "n_examples": 200,
3439
+ "per_subtask": {
3440
+ "MD": {
3441
+ "accuracy": 1.0,
3442
+ "count": 600
3443
+ },
3444
+ "MB": {
3445
+ "accuracy": 1.0,
3446
+ "count": 267
3447
+ },
3448
+ "ME": {
3449
+ "accuracy": 1.0,
3450
+ "count": 53
3451
+ },
3452
+ "UB": {
3453
+ "accuracy": 1.0,
3454
+ "count": 439
3455
+ },
3456
+ "UD": {
3457
+ "accuracy": 1.0,
3458
+ "count": 41
3459
+ }
3460
+ }
3461
+ },
3462
+ "sub_B3": {
3463
+ "full_accuracy": 1.0,
3464
+ "n_examples": 100,
3465
+ "per_subtask": {
3466
+ "MD": {
3467
+ "accuracy": 1.0,
3468
+ "count": 300
3469
+ },
3470
+ "MB": {
3471
+ "accuracy": 1.0,
3472
+ "count": 100
3473
+ },
3474
+ "UB": {
3475
+ "accuracy": 1.0,
3476
+ "count": 197
3477
+ },
3478
+ "UD": {
3479
+ "accuracy": 1.0,
3480
+ "count": 103
3481
+ }
3482
+ }
3483
+ },
3484
+ "sub_B4": {
3485
+ "full_accuracy": 1.0,
3486
+ "n_examples": 100,
3487
+ "per_subtask": {
3488
+ "MD": {
3489
+ "accuracy": 1.0,
3490
+ "count": 200
3491
+ },
3492
+ "MB": {
3493
+ "accuracy": 1.0,
3494
+ "count": 100
3495
+ },
3496
+ "UB": {
3497
+ "accuracy": 1.0,
3498
+ "count": 247
3499
+ },
3500
+ "UD": {
3501
+ "accuracy": 1.0,
3502
+ "count": 153
3503
+ }
3504
+ }
3505
+ },
3506
+ "sub_B5": {
3507
+ "full_accuracy": 1.0,
3508
+ "n_examples": 100,
3509
+ "per_subtask": {
3510
+ "MD": {
3511
+ "accuracy": 1.0,
3512
+ "count": 100
3513
+ },
3514
+ "MB": {
3515
+ "accuracy": 1.0,
3516
+ "count": 100
3517
+ },
3518
+ "UB": {
3519
+ "accuracy": 1.0,
3520
+ "count": 298
3521
+ },
3522
+ "UD": {
3523
+ "accuracy": 1.0,
3524
+ "count": 202
3525
+ }
3526
+ }
3527
+ }
3528
+ },
3529
+ "summary": {
3530
+ "overall_accuracy": 1.0,
3531
+ "total_examples": 2400,
3532
+ "n_splits": 22
3533
+ }
3534
+ },
3535
+ "sorl_overall_accuracy": 1.0,
3536
+ "sft_overall_accuracy": 1.0
3537
+ }
add_sub_sorl_v1_abs30_K1_100K/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:3e8b4c1e17d72c9091961d6426ecc8aecb49fc0016bf701e6079d6a99ddd0ef8
3
+ size 650385300
add_sub_sorl_v1_abs30_K1_100K/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 1,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 4e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 10,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 1562,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs30_K1_100K",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 2,
61
+ "n_head": 3,
62
+ "n_embd": 510,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 30,
65
+ "dataset_size": 100000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 162519662,
71
+ "run_name": "add_sub_sorl_v1_abs30_K1_100K",
72
+ "git_commit": "f447da529caceac8c7d256cbb2cd185cbc50feac",
73
+ "timestamp": "2026-04-12T15:30:36.095637+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "4zimijm6",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/4zimijm6",
81
+ "final_accuracy": 1.0,
82
+ "sft_accuracy": 1.0,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }