amirali1985 commited on
Commit
f543f14
·
verified ·
1 Parent(s): 75bd8ea

Upload add_sub_sorl_v1_abs50_K1_100K

Browse files
add_sub_sorl_v1_abs50_K1_100K/config.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 510,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 2040,
15
+ "layer_types": [
16
+ "full_attention",
17
+ "full_attention"
18
+ ],
19
+ "max_position_embeddings": 128,
20
+ "max_window_layers": 28,
21
+ "model_type": "qwen3",
22
+ "num_attention_heads": 3,
23
+ "num_hidden_layers": 2,
24
+ "num_key_value_heads": 3,
25
+ "pad_token_id": null,
26
+ "rms_norm_eps": 1e-06,
27
+ "rope_parameters": {
28
+ "rope_theta": 10000.0,
29
+ "rope_type": "default"
30
+ },
31
+ "sliding_window": null,
32
+ "tie_word_embeddings": false,
33
+ "transformers_version": "5.5.0",
34
+ "use_cache": true,
35
+ "use_sliding_window": false,
36
+ "vocab_size": 151694
37
+ }
add_sub_sorl_v1_abs50_K1_100K/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs50_K1_100K/metrics.json ADDED
@@ -0,0 +1,3537 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 800,
20
+ 850,
21
+ 900,
22
+ 950,
23
+ 1000,
24
+ 1050,
25
+ 1100,
26
+ 1150,
27
+ 1200,
28
+ 1250,
29
+ 1300,
30
+ 1350,
31
+ 1400,
32
+ 1450,
33
+ 1500,
34
+ 1550,
35
+ 1613,
36
+ 1663,
37
+ 1713,
38
+ 1763,
39
+ 1813,
40
+ 1863,
41
+ 1913,
42
+ 1963,
43
+ 2013,
44
+ 2063,
45
+ 2113,
46
+ 2163,
47
+ 2213,
48
+ 2263,
49
+ 2313,
50
+ 2363,
51
+ 2413,
52
+ 2463,
53
+ 2513,
54
+ 2563,
55
+ 2613,
56
+ 2663,
57
+ 2713,
58
+ 2763,
59
+ 2813,
60
+ 2863,
61
+ 2913,
62
+ 2963,
63
+ 3013,
64
+ 3063,
65
+ 3113,
66
+ 3176,
67
+ 3226,
68
+ 3276,
69
+ 3326,
70
+ 3376,
71
+ 3426,
72
+ 3476,
73
+ 3526,
74
+ 3576,
75
+ 3626,
76
+ 3676,
77
+ 3726,
78
+ 3776,
79
+ 3826,
80
+ 3876,
81
+ 3926,
82
+ 3976,
83
+ 4026,
84
+ 4076,
85
+ 4126,
86
+ 4176,
87
+ 4226,
88
+ 4276,
89
+ 4326,
90
+ 4376,
91
+ 4426,
92
+ 4476,
93
+ 4526,
94
+ 4576,
95
+ 4626,
96
+ 4676,
97
+ 4739,
98
+ 4789,
99
+ 4839,
100
+ 4889,
101
+ 4939,
102
+ 4989,
103
+ 5039,
104
+ 5089,
105
+ 5139,
106
+ 5189,
107
+ 5239,
108
+ 5289,
109
+ 5339,
110
+ 5389,
111
+ 5439,
112
+ 5489,
113
+ 5539,
114
+ 5589,
115
+ 5639,
116
+ 5689,
117
+ 5739,
118
+ 5789,
119
+ 5839,
120
+ 5889,
121
+ 5939,
122
+ 5989,
123
+ 6039,
124
+ 6089,
125
+ 6139,
126
+ 6189,
127
+ 6239,
128
+ 6302,
129
+ 6352,
130
+ 6402,
131
+ 6452,
132
+ 6502,
133
+ 6552,
134
+ 6602,
135
+ 6652,
136
+ 6702,
137
+ 6752,
138
+ 6802,
139
+ 6852,
140
+ 6902,
141
+ 6952,
142
+ 7002,
143
+ 7052,
144
+ 7102,
145
+ 7152,
146
+ 7202,
147
+ 7252,
148
+ 7302,
149
+ 7352,
150
+ 7402,
151
+ 7452,
152
+ 7502,
153
+ 7552,
154
+ 7602,
155
+ 7652,
156
+ 7702,
157
+ 7752,
158
+ 7802,
159
+ 7865,
160
+ 7915,
161
+ 7965,
162
+ 8015,
163
+ 8065,
164
+ 8115,
165
+ 8165,
166
+ 8215,
167
+ 8265,
168
+ 8315,
169
+ 8365,
170
+ 8415,
171
+ 8465,
172
+ 8515,
173
+ 8565,
174
+ 8615,
175
+ 8665,
176
+ 8715,
177
+ 8765,
178
+ 8815,
179
+ 8865,
180
+ 8915,
181
+ 8965,
182
+ 9015,
183
+ 9065,
184
+ 9115,
185
+ 9165,
186
+ 9215,
187
+ 9265,
188
+ 9315,
189
+ 9365,
190
+ 9428,
191
+ 9478,
192
+ 9528,
193
+ 9578,
194
+ 9628,
195
+ 9678,
196
+ 9728,
197
+ 9778,
198
+ 9828,
199
+ 9878,
200
+ 9928,
201
+ 9978,
202
+ 10028,
203
+ 10078,
204
+ 10128,
205
+ 10178,
206
+ 10228,
207
+ 10278,
208
+ 10328,
209
+ 10378,
210
+ 10428,
211
+ 10478,
212
+ 10528,
213
+ 10578,
214
+ 10628,
215
+ 10678,
216
+ 10728,
217
+ 10778,
218
+ 10828,
219
+ 10878,
220
+ 10928,
221
+ 10991,
222
+ 11041,
223
+ 11091,
224
+ 11141,
225
+ 11191,
226
+ 11241,
227
+ 11291,
228
+ 11341,
229
+ 11391,
230
+ 11441,
231
+ 11491,
232
+ 11541,
233
+ 11591,
234
+ 11641,
235
+ 11691,
236
+ 11741,
237
+ 11791,
238
+ 11841,
239
+ 11891,
240
+ 11941,
241
+ 11991,
242
+ 12041,
243
+ 12091,
244
+ 12141,
245
+ 12191,
246
+ 12241,
247
+ 12291,
248
+ 12341,
249
+ 12391,
250
+ 12441,
251
+ 12491,
252
+ 12554,
253
+ 12604,
254
+ 12654,
255
+ 12704,
256
+ 12754,
257
+ 12804,
258
+ 12854,
259
+ 12904,
260
+ 12954,
261
+ 13004,
262
+ 13054,
263
+ 13104,
264
+ 13154,
265
+ 13204,
266
+ 13254,
267
+ 13304,
268
+ 13354,
269
+ 13404,
270
+ 13454,
271
+ 13504,
272
+ 13554,
273
+ 13604,
274
+ 13654,
275
+ 13704,
276
+ 13754,
277
+ 13804,
278
+ 13854,
279
+ 13904,
280
+ 13954,
281
+ 14004,
282
+ 14054,
283
+ 14117,
284
+ 14167,
285
+ 14217,
286
+ 14267,
287
+ 14317,
288
+ 14367,
289
+ 14417,
290
+ 14467,
291
+ 14517,
292
+ 14567,
293
+ 14617,
294
+ 14667,
295
+ 14717,
296
+ 14767,
297
+ 14817,
298
+ 14867,
299
+ 14917,
300
+ 14967,
301
+ 15017,
302
+ 15067,
303
+ 15117,
304
+ 15167,
305
+ 15217,
306
+ 15267,
307
+ 15317,
308
+ 15367,
309
+ 15417,
310
+ 15467,
311
+ 15517,
312
+ 15567,
313
+ 15617
314
+ ],
315
+ "loss": [
316
+ 0.8793072700500488,
317
+ -4.557682991027832,
318
+ 3.945315361022949,
319
+ 6.532111644744873,
320
+ 4.72694730758667,
321
+ 3.3974697589874268,
322
+ 2.6203341484069824,
323
+ 2.544694185256958,
324
+ 2.474928379058838,
325
+ 2.301546096801758,
326
+ 2.134119749069214,
327
+ 1.1167329549789429,
328
+ -1.3394086360931396,
329
+ -4.72641134262085,
330
+ -4.811535835266113,
331
+ -2.576375961303711,
332
+ -1.0075209140777588,
333
+ -1.3872089385986328,
334
+ -1.4432183504104614,
335
+ -1.4433867931365967,
336
+ -1.803222417831421,
337
+ -1.2808027267456055,
338
+ -1.0695509910583496,
339
+ -0.7846286296844482,
340
+ -0.7284835577011108,
341
+ -0.7496466636657715,
342
+ -0.8122822642326355,
343
+ -0.532228410243988,
344
+ -0.41442811489105225,
345
+ -0.8966416716575623,
346
+ -0.2750622630119324,
347
+ -0.7970641851425171,
348
+ -0.2488846778869629,
349
+ -0.22032293677330017,
350
+ -0.05407524108886719,
351
+ -0.30909571051597595,
352
+ -0.4708501994609833,
353
+ -0.043576836585998535,
354
+ -0.07583993673324585,
355
+ -0.6057784557342529,
356
+ -0.22415095567703247,
357
+ -0.24675825238227844,
358
+ 0.02088850736618042,
359
+ -0.14688682556152344,
360
+ -0.004432946443557739,
361
+ -0.4482615888118744,
362
+ -0.0304650217294693,
363
+ -0.2053374946117401,
364
+ -0.2001218944787979,
365
+ -0.2562982439994812,
366
+ -1.079793930053711,
367
+ -0.3027035593986511,
368
+ -0.5672270059585571,
369
+ -0.1839711219072342,
370
+ -0.2499769628047943,
371
+ -0.12174144387245178,
372
+ -0.0955045223236084,
373
+ -0.0927371084690094,
374
+ -0.21636243164539337,
375
+ -0.3999066650867462,
376
+ -0.11761140823364258,
377
+ -0.1235857903957367,
378
+ -0.6707497239112854,
379
+ -0.10870647430419922,
380
+ -0.26432910561561584,
381
+ -0.5489974617958069,
382
+ -0.2955520451068878,
383
+ -0.13704964518547058,
384
+ -0.17987529933452606,
385
+ -0.2948598563671112,
386
+ -0.4160359799861908,
387
+ -0.47342371940612793,
388
+ -0.30369460582733154,
389
+ -0.5336835384368896,
390
+ -0.33963853120803833,
391
+ -0.16569268703460693,
392
+ -0.28100794553756714,
393
+ -0.09371660649776459,
394
+ -0.329658180475235,
395
+ -0.1649886667728424,
396
+ -0.08418028801679611,
397
+ -0.2127760946750641,
398
+ -0.2515207529067993,
399
+ -0.4989566504955292,
400
+ -0.1675868034362793,
401
+ -0.3154517710208893,
402
+ -0.29198193550109863,
403
+ -0.23230299353599548,
404
+ -0.30763623118400574,
405
+ -0.3012218475341797,
406
+ -0.166826531291008,
407
+ -0.17864090204238892,
408
+ -0.13514383137226105,
409
+ -0.06121335178613663,
410
+ -0.15541976690292358,
411
+ -0.29266083240509033,
412
+ -0.07417450100183487,
413
+ -0.010071318596601486,
414
+ -0.10823608934879303,
415
+ -0.036244817078113556,
416
+ -0.08790963888168335,
417
+ -0.0498308464884758,
418
+ -0.03580029308795929,
419
+ -0.07768949866294861,
420
+ 0.017386823892593384,
421
+ -0.05269555002450943,
422
+ -0.04851272702217102,
423
+ -0.015783585608005524,
424
+ 0.013150635175406933,
425
+ 0.028122255578637123,
426
+ 0.01595453731715679,
427
+ -0.08603314310312271,
428
+ -0.07443135976791382,
429
+ 0.02399209514260292,
430
+ -0.006037743762135506,
431
+ -0.046386152505874634,
432
+ 0.01122601330280304,
433
+ -0.05982036888599396,
434
+ -0.11936657130718231,
435
+ -0.037023354321718216,
436
+ -0.08698643743991852,
437
+ 0.01087209302932024,
438
+ 0.012216201052069664,
439
+ 0.027771372348070145,
440
+ -0.016258858144283295,
441
+ 0.006583958864212036,
442
+ -0.004937758669257164,
443
+ 0.04394557699561119,
444
+ -0.10809867084026337,
445
+ 0.010671194642782211,
446
+ -0.0460967980325222,
447
+ 0.039323590695858,
448
+ -0.01787477731704712,
449
+ 0.029121840372681618,
450
+ -0.026205148547887802,
451
+ 0.022960329428315163,
452
+ 0.021646002307534218,
453
+ -0.03326135128736496,
454
+ -0.11378178000450134,
455
+ 0.006849285215139389,
456
+ 0.01761329546570778,
457
+ 0.022349704056978226,
458
+ 0.03914421796798706,
459
+ -0.02611180767416954,
460
+ 0.021699609234929085,
461
+ 0.01957082934677601,
462
+ 0.013363128527998924,
463
+ -0.021764134988188744,
464
+ -0.07776618003845215,
465
+ 0.020661285147070885,
466
+ 0.02226482518017292,
467
+ -0.05438518524169922,
468
+ -0.06914329528808594,
469
+ -0.002914411947131157,
470
+ -0.011443082243204117,
471
+ 0.021878832951188087,
472
+ 0.014752330258488655,
473
+ -0.02418067678809166,
474
+ 0.006434757262468338,
475
+ 0.033864736557006836,
476
+ -0.1172642782330513,
477
+ -0.008184622973203659,
478
+ 0.033443063497543335,
479
+ -0.03762055188417435,
480
+ 0.01753869652748108,
481
+ 0.005519811064004898,
482
+ 0.00024016760289669037,
483
+ 0.01246030442416668,
484
+ 0.03886703774333,
485
+ -0.1489391177892685,
486
+ 0.006597569212317467,
487
+ 0.0007694996893405914,
488
+ 0.016658440232276917,
489
+ -0.16039103269577026,
490
+ 0.027697507292032242,
491
+ 0.0240585096180439,
492
+ 0.03574578836560249,
493
+ 0.014707371592521667,
494
+ -0.015416000038385391,
495
+ -0.20053425431251526,
496
+ 0.021575435996055603,
497
+ 0.030901774764060974,
498
+ 0.023122712969779968,
499
+ 0.03245032951235771,
500
+ -0.35969942808151245,
501
+ 0.013166043907403946,
502
+ 0.02934935875236988,
503
+ 0.013501297682523727,
504
+ 0.017913665622472763,
505
+ -0.004542285576462746,
506
+ 0.015910688787698746,
507
+ -0.002435259521007538,
508
+ -0.011715129017829895,
509
+ 0.03188084065914154,
510
+ 0.011587947607040405,
511
+ 0.026018982753157616,
512
+ 0.025039900094270706,
513
+ 0.020184341818094254,
514
+ 0.024985218420624733,
515
+ 0.02591882087290287,
516
+ -0.0122615285217762,
517
+ 0.019379204139113426,
518
+ 0.025564368814229965,
519
+ -0.003141876310110092,
520
+ 0.0035779811441898346,
521
+ -0.009943334385752678,
522
+ -0.029678095132112503,
523
+ 0.013146287761628628,
524
+ 0.030820732936263084,
525
+ -0.1258346140384674,
526
+ -0.019851606339216232,
527
+ 0.012696838937699795,
528
+ 0.026656880974769592,
529
+ 0.009932195767760277,
530
+ 0.02451024390757084,
531
+ -0.06035705655813217,
532
+ -0.14478589594364166,
533
+ -0.00664106011390686,
534
+ 0.003923642449080944,
535
+ 0.024498794227838516,
536
+ -0.04950043559074402,
537
+ 0.028375547379255295,
538
+ 0.022171344608068466,
539
+ 0.006763886660337448,
540
+ 0.016951054334640503,
541
+ 0.02775147557258606,
542
+ 0.01829732023179531,
543
+ 0.021201690658926964,
544
+ 0.025561708956956863,
545
+ 0.019114773720502853,
546
+ 0.020513786002993584,
547
+ 0.042111024260520935,
548
+ 0.02553929202258587,
549
+ 0.015924805775284767,
550
+ 0.022776134312152863,
551
+ 0.02991604618728161,
552
+ 0.029099412262439728,
553
+ -0.04503129422664642,
554
+ 0.024411184713244438,
555
+ 0.01758555881679058,
556
+ -0.054419152438640594,
557
+ -0.0114205963909626,
558
+ 0.008897339925169945,
559
+ 0.03393123671412468,
560
+ 0.02686172164976597,
561
+ -0.03536038100719452,
562
+ 0.03133343905210495,
563
+ 0.024179954081773758,
564
+ 0.021813442930579185,
565
+ 0.024799799546599388,
566
+ 0.02012506313621998,
567
+ 0.01691095344722271,
568
+ 0.028604893013834953,
569
+ 0.04053346440196037,
570
+ 0.022266777232289314,
571
+ 0.03397966921329498,
572
+ 0.031599946320056915,
573
+ 0.024446003139019012,
574
+ 0.03555386886000633,
575
+ 0.023791510611772537,
576
+ 0.028894606977701187,
577
+ 0.0001649763435125351,
578
+ 0.032161928713321686,
579
+ 0.024588581174612045,
580
+ 0.017756029963493347,
581
+ 0.027024097740650177,
582
+ 0.025857599452137947,
583
+ -0.03726355731487274,
584
+ 0.03172441944479942,
585
+ 0.03862748667597771,
586
+ 0.024849383160471916,
587
+ 0.021331746131181717,
588
+ 0.025282954797148705,
589
+ 0.021858539432287216,
590
+ 0.022209014743566513,
591
+ 0.02866678312420845,
592
+ 0.039874590933322906,
593
+ -0.00557183101773262,
594
+ 0.025868263095617294,
595
+ 0.024863965809345245,
596
+ 0.021220605820417404,
597
+ 0.03036733716726303,
598
+ 0.019596464931964874,
599
+ 0.017102953046560287,
600
+ 0.025336796417832375,
601
+ 0.023993855342268944,
602
+ 0.022393351420760155,
603
+ 0.022890813648700714,
604
+ 0.02799217961728573,
605
+ 0.025767609477043152,
606
+ 0.020770160481333733,
607
+ 0.025682464241981506,
608
+ 0.019536113366484642,
609
+ 0.019240833818912506,
610
+ 0.021054189652204514,
611
+ 0.041958287358284,
612
+ 0.025849830359220505,
613
+ 0.024066584184765816,
614
+ 0.023014742881059647,
615
+ 0.023878082633018494,
616
+ 0.019091343507170677,
617
+ 0.04283755272626877,
618
+ 0.024016324430704117,
619
+ 0.027863766998052597,
620
+ 0.026920557022094727,
621
+ 0.024275902658700943,
622
+ 0.028992624953389168,
623
+ 0.03695023059844971,
624
+ 0.03257744386792183,
625
+ 0.020896634086966515
626
+ ],
627
+ "base_loss": [
628
+ 11.354902267456055,
629
+ 9.619476318359375,
630
+ 8.130751609802246,
631
+ 6.807829856872559,
632
+ 5.4560370445251465,
633
+ 3.5696353912353516,
634
+ 2.1277003288269043,
635
+ 1.9940003156661987,
636
+ 1.8792340755462646,
637
+ 1.778296709060669,
638
+ 1.820477843284607,
639
+ 1.7617279291152954,
640
+ 1.8593480587005615,
641
+ 1.745758056640625,
642
+ 1.5065184831619263,
643
+ 1.0960109233856201,
644
+ 0.8341459631919861,
645
+ 0.8041783571243286,
646
+ 0.6385746002197266,
647
+ 0.6072742342948914,
648
+ 0.5624108910560608,
649
+ 0.4968210756778717,
650
+ 0.44730648398399353,
651
+ 0.3511924147605896,
652
+ 0.3345043659210205,
653
+ 0.3197433352470398,
654
+ 0.3210335075855255,
655
+ 0.3214714229106903,
656
+ 0.2237830013036728,
657
+ 0.26585131883621216,
658
+ 0.1817438155412674,
659
+ 0.22315724194049835,
660
+ 0.14824306964874268,
661
+ 0.17239229381084442,
662
+ 0.14353437721729279,
663
+ 0.16023890674114227,
664
+ 0.16021332144737244,
665
+ 0.12249647080898285,
666
+ 0.09916845709085464,
667
+ 0.1469610035419464,
668
+ 0.1400381326675415,
669
+ 0.10619890689849854,
670
+ 0.07646704465150833,
671
+ 0.10491969436407089,
672
+ 0.09419133514165878,
673
+ 0.1305452138185501,
674
+ 0.0678355023264885,
675
+ 0.09236187487840652,
676
+ 0.12952150404453278,
677
+ 0.08002316951751709,
678
+ 0.18990421295166016,
679
+ 0.09865695983171463,
680
+ 0.11963018029928207,
681
+ 0.08220357447862625,
682
+ 0.1007433608174324,
683
+ 0.0954989343881607,
684
+ 0.07067380100488663,
685
+ 0.06859846413135529,
686
+ 0.05933056026697159,
687
+ 0.07883036136627197,
688
+ 0.05551758036017418,
689
+ 0.048164304345846176,
690
+ 0.11315275728702545,
691
+ 0.04112541303038597,
692
+ 0.059350378811359406,
693
+ 0.09123921394348145,
694
+ 0.06157296895980835,
695
+ 0.04738176241517067,
696
+ 0.041634202003479004,
697
+ 0.055201027542352676,
698
+ 0.08019154518842697,
699
+ 0.07904402166604996,
700
+ 0.05514637008309364,
701
+ 0.10348294675350189,
702
+ 0.05645943433046341,
703
+ 0.03977251052856445,
704
+ 0.0554334782063961,
705
+ 0.036599669605493546,
706
+ 0.056209079921245575,
707
+ 0.03545624762773514,
708
+ 0.02682807669043541,
709
+ 0.03998107463121414,
710
+ 0.05404913052916527,
711
+ 0.07497896254062653,
712
+ 0.04433978348970413,
713
+ 0.04918047413229942,
714
+ 0.04802717640995979,
715
+ 0.03953424468636513,
716
+ 0.045616548508405685,
717
+ 0.044817231595516205,
718
+ 0.03032597526907921,
719
+ 0.031423501670360565,
720
+ 0.023572741076350212,
721
+ 0.017564991489052773,
722
+ 0.02600538171827793,
723
+ 0.04100664332509041,
724
+ 0.01607869379222393,
725
+ 0.008917765691876411,
726
+ 0.019925076514482498,
727
+ 0.01216939091682434,
728
+ 0.016869796440005302,
729
+ 0.012725042179226875,
730
+ 0.0102456733584404,
731
+ 0.01590334065258503,
732
+ 0.0047952658496797085,
733
+ 0.011497433297336102,
734
+ 0.012098747305572033,
735
+ 0.007142555434256792,
736
+ 0.0038218761328607798,
737
+ 0.002109906869009137,
738
+ 0.0034211091697216034,
739
+ 0.015994401648640633,
740
+ 0.012902417220175266,
741
+ 0.0024884960148483515,
742
+ 0.004833155311644077,
743
+ 0.010148318484425545,
744
+ 0.004628085996955633,
745
+ 0.011428607627749443,
746
+ 0.019086044281721115,
747
+ 0.009554388001561165,
748
+ 0.014633984304964542,
749
+ 0.002517522545531392,
750
+ 0.004276275169104338,
751
+ 0.0017393995076417923,
752
+ 0.005628875456750393,
753
+ 0.0039735762402415276,
754
+ 0.004733487498015165,
755
+ 0.0016199646051973104,
756
+ 0.016592636704444885,
757
+ 0.0035542051773518324,
758
+ 0.010028673335909843,
759
+ 0.00040924036875367165,
760
+ 0.007201785687357187,
761
+ 0.0006683436222374439,
762
+ 0.00829078909009695,
763
+ 0.0017987389583140612,
764
+ 0.0010684876469895244,
765
+ 0.008472238667309284,
766
+ 0.016244305297732353,
767
+ 0.002869021613150835,
768
+ 0.0031283958815038204,
769
+ 0.0022019422613084316,
770
+ 0.0004035625606775284,
771
+ 0.006791552063077688,
772
+ 0.0011557966936379671,
773
+ 0.0008532117353752255,
774
+ 0.0032540052197873592,
775
+ 0.005603688769042492,
776
+ 0.012657723389565945,
777
+ 0.0005092295468784869,
778
+ 0.0010295194806531072,
779
+ 0.009815016761422157,
780
+ 0.010954980738461018,
781
+ 0.0029354526195675135,
782
+ 0.005530492402613163,
783
+ 0.000797468121163547,
784
+ 0.0018827719613909721,
785
+ 0.0076822019182145596,
786
+ 0.0022407553624361753,
787
+ 0.0009795849910005927,
788
+ 0.017207054421305656,
789
+ 0.004975206684321165,
790
+ 0.000368430744856596,
791
+ 0.007918541319668293,
792
+ 0.0013579931110143661,
793
+ 0.002656040247529745,
794
+ 0.0029781318735331297,
795
+ 0.0032940662931650877,
796
+ 0.0007902187062427402,
797
+ 0.020759092643857002,
798
+ 0.025971150025725365,
799
+ 0.003461887827143073,
800
+ 0.0016995306359604,
801
+ 0.021632632240653038,
802
+ 0.0003880455915350467,
803
+ 0.001397465355694294,
804
+ 0.00030403825803659856,
805
+ 0.0020705878268927336,
806
+ 0.004525614436715841,
807
+ 0.02685791626572609,
808
+ 0.0006216937326826155,
809
+ 0.0010118251666426659,
810
+ 0.0008113172953017056,
811
+ 0.0002240273024654016,
812
+ 0.04504799842834473,
813
+ 0.0015609429683536291,
814
+ 0.0005780804203823209,
815
+ 0.0022545286919921637,
816
+ 0.0007725828909315169,
817
+ 0.003736443119123578,
818
+ 0.002966423286125064,
819
+ 0.004257167223840952,
820
+ 0.0048461672849953175,
821
+ 0.0006816848763264716,
822
+ 0.003050495171919465,
823
+ 0.0009072899702005088,
824
+ 0.00027717239572666585,
825
+ 0.0006319586536847055,
826
+ 0.0011747808894142509,
827
+ 0.0001518602657597512,
828
+ 0.004137661308050156,
829
+ 0.00019556829647626728,
830
+ 0.0007796343415975571,
831
+ 0.003540764795616269,
832
+ 0.0031884273048490286,
833
+ 0.0036890930496156216,
834
+ 0.006483628414571285,
835
+ 0.0018271852750331163,
836
+ 0.00027773826150223613,
837
+ 0.016763756051659584,
838
+ 0.006423712242394686,
839
+ 0.001957931090146303,
840
+ 0.00025845892378129065,
841
+ 0.0023654543329030275,
842
+ 0.00032435316825285554,
843
+ 0.00942069198936224,
844
+ 0.019012629985809326,
845
+ 0.004030904732644558,
846
+ 0.002140968106687069,
847
+ 0.0004519534413702786,
848
+ 0.008156306110322475,
849
+ 0.0005255067371763289,
850
+ 6.81299134157598e-05,
851
+ 0.002138505456969142,
852
+ 0.0014500885736197233,
853
+ 0.00020060435053892434,
854
+ 0.00035458055208437145,
855
+ 0.0007856138399802148,
856
+ 0.00014310672122519463,
857
+ 0.0012812147615477443,
858
+ 0.00022322598670143634,
859
+ 0.000436297181295231,
860
+ 0.00011576743418117985,
861
+ 0.0012859638081863523,
862
+ 0.0005143244634382427,
863
+ 6.025502079864964e-05,
864
+ 0.00019221320690121502,
865
+ 0.007957907393574715,
866
+ 0.00014822494995314628,
867
+ 0.0014601113507524133,
868
+ 0.008723047561943531,
869
+ 0.0043920488096773624,
870
+ 0.0014019532827660441,
871
+ 3.626879333751276e-05,
872
+ 3.528634624672122e-05,
873
+ 0.007602563593536615,
874
+ 0.00010167565051233396,
875
+ 3.648105848697014e-05,
876
+ 0.0003249097499065101,
877
+ 4.7194680519169196e-05,
878
+ 0.0007050277781672776,
879
+ 0.0006095104617998004,
880
+ 0.00022558416821993887,
881
+ 1.7922138795256615e-05,
882
+ 0.00012923660688102245,
883
+ 0.00011796010221587494,
884
+ 0.00011410734441597015,
885
+ 5.379039066610858e-05,
886
+ 0.00014431810996029526,
887
+ 4.39703326264862e-05,
888
+ 0.0001760836021276191,
889
+ 0.0032698672730475664,
890
+ 1.0670499250409193e-05,
891
+ 0.00011346897372277454,
892
+ 0.002302784938365221,
893
+ 0.00026522204279899597,
894
+ 0.0012583305360749364,
895
+ 0.007555671036243439,
896
+ 2.5744331651367247e-05,
897
+ 8.980598795460537e-05,
898
+ 6.1836137319915e-05,
899
+ 1.9674447685247287e-05,
900
+ 3.210911017959006e-05,
901
+ 0.00017015096091199666,
902
+ 1.8454913515597582e-05,
903
+ 6.926675996510312e-05,
904
+ 1.964170951396227e-05,
905
+ 0.0030478867702186108,
906
+ 1.7391646906617098e-05,
907
+ 1.1291275768599007e-05,
908
+ 1.6856354704941623e-05,
909
+ 2.419223528704606e-05,
910
+ 6.455252878367901e-05,
911
+ 5.313939254847355e-05,
912
+ 1.0072631994262338e-05,
913
+ 2.2529971829499118e-05,
914
+ 1.3181961548980325e-05,
915
+ 3.893485336448066e-05,
916
+ 6.0693128034472466e-05,
917
+ 1.1840793376904912e-05,
918
+ 2.4969294827315025e-05,
919
+ 4.796602297574282e-05,
920
+ 1.5566796719213016e-05,
921
+ 2.5332241420983337e-05,
922
+ 1.1200068911421113e-05,
923
+ 9.845345630310476e-06,
924
+ 8.674382115714252e-06,
925
+ 1.5246259863488376e-05,
926
+ 2.1107602151460014e-05,
927
+ 1.836235423979815e-05,
928
+ 1.927776975207962e-05,
929
+ 8.702610102773178e-06,
930
+ 2.1925961846136488e-05,
931
+ 9.651708751334809e-06,
932
+ 2.9662509405170567e-05,
933
+ 1.3283395674079657e-05,
934
+ 9.9586777650984e-06,
935
+ 8.589026947447564e-06,
936
+ 1.179453556687804e-05,
937
+ 7.600993285450386e-06
938
+ ],
939
+ "info_loss": [
940
+ -1.7131338119506836,
941
+ -1.9878039360046387,
942
+ -0.8607902526855469,
943
+ -0.343416690826416,
944
+ -0.27082347869873047,
945
+ -0.13865256309509277,
946
+ -0.052397727966308594,
947
+ -0.0423356294631958,
948
+ -0.03699600696563721,
949
+ -0.043445587158203125,
950
+ -0.06507444381713867,
951
+ -0.15992426872253418,
952
+ -0.4150509834289551,
953
+ -0.7428005933761597,
954
+ -0.7276861667633057,
955
+ -0.4624685049057007,
956
+ -0.2779492139816284,
957
+ -0.3108817934989929,
958
+ -0.30032607913017273,
959
+ -0.29420244693756104,
960
+ -0.3239292502403259,
961
+ -0.26364535093307495,
962
+ -0.23538976907730103,
963
+ -0.19680123031139374,
964
+ -0.18817496299743652,
965
+ -0.18621370196342468,
966
+ -0.18980754911899567,
967
+ -0.15879178047180176,
968
+ -0.13470777869224548,
969
+ -0.1839972287416458,
970
+ -0.11035551130771637,
971
+ -0.16300663352012634,
972
+ -0.09734988212585449,
973
+ -0.09699394553899765,
974
+ -0.07697362452745438,
975
+ -0.10090111941099167,
976
+ -0.11517143249511719,
977
+ -0.06642338633537292,
978
+ -0.06478674709796906,
979
+ -0.12275853008031845,
980
+ -0.08251140266656876,
981
+ -0.07660090923309326,
982
+ -0.048429496586322784,
983
+ -0.06653877347707748,
984
+ -0.053453486412763596,
985
+ -0.09985008835792542,
986
+ -0.04629219323396683,
987
+ -0.0712423324584961,
988
+ -0.06884448230266571,
989
+ -0.06782782077789307,
990
+ -0.16537919640541077,
991
+ -0.07562237977981567,
992
+ -0.10252176225185394,
993
+ -0.05866117402911186,
994
+ -0.06620694696903229,
995
+ -0.05184585601091385,
996
+ -0.04774373024702072,
997
+ -0.04839886352419853,
998
+ -0.05516344681382179,
999
+ -0.07325172424316406,
1000
+ -0.042329758405685425,
1001
+ -0.040246520191431046,
1002
+ -0.10164471715688705,
1003
+ -0.0373082235455513,
1004
+ -0.05317864939570427,
1005
+ -0.08476268500089645,
1006
+ -0.05598641559481621,
1007
+ -0.037800855934619904,
1008
+ -0.04003060981631279,
1009
+ -0.05340470001101494,
1010
+ -0.06776013970375061,
1011
+ -0.07399261742830276,
1012
+ -0.05010056868195534,
1013
+ -0.08082228899002075,
1014
+ -0.054453715682029724,
1015
+ -0.035927727818489075,
1016
+ -0.045634906738996506,
1017
+ -0.028730852529406548,
1018
+ -0.053217265754938126,
1019
+ -0.03469575196504593,
1020
+ -0.024422042071819305,
1021
+ -0.03822420537471771,
1022
+ -0.043456658720970154,
1023
+ -0.0705932006239891,
1024
+ -0.03254368156194687,
1025
+ -0.04738222807645798,
1026
+ -0.047146376222372055,
1027
+ -0.038757313042879105,
1028
+ -0.04511863738298416,
1029
+ -0.044538818299770355,
1030
+ -0.030123282223939896,
1031
+ -0.030372440814971924,
1032
+ -0.023335659876465797,
1033
+ -0.017431115731596947,
1034
+ -0.02585216611623764,
1035
+ -0.04085705429315567,
1036
+ -0.015927845612168312,
1037
+ -0.00878168921917677,
1038
+ -0.01885957084596157,
1039
+ -0.011983344331383705,
1040
+ -0.01676131598651409,
1041
+ -0.012616250663995743,
1042
+ -0.010080559179186821,
1043
+ -0.015823306515812874,
1044
+ -0.00466143386438489,
1045
+ -0.011390343308448792,
1046
+ -0.012019429355859756,
1047
+ -0.006937987171113491,
1048
+ -0.003349082078784704,
1049
+ -0.0020443047396838665,
1050
+ -0.0033661662600934505,
1051
+ -0.01590695045888424,
1052
+ -0.012850151397287846,
1053
+ -0.0023344852961599827,
1054
+ -0.004767741076648235,
1055
+ -0.010024209506809711,
1056
+ -0.004549992736428976,
1057
+ -0.011376718990504742,
1058
+ -0.019021080806851387,
1059
+ -0.009498468600213528,
1060
+ -0.014589231461286545,
1061
+ -0.002486016834154725,
1062
+ -0.004247958771884441,
1063
+ -0.001699471496976912,
1064
+ -0.005558435805141926,
1065
+ -0.00393689377233386,
1066
+ -0.004702319391071796,
1067
+ -0.0003044349141418934,
1068
+ -0.01655041053891182,
1069
+ -0.0035031919833272696,
1070
+ -0.00998228881508112,
1071
+ -0.0003558158641681075,
1072
+ -0.00714930659160018,
1073
+ -0.0006295697530731559,
1074
+ -0.008250396698713303,
1075
+ -0.0017516581574454904,
1076
+ -0.001038093352690339,
1077
+ -0.008434775285422802,
1078
+ -0.016211409121751785,
1079
+ -0.0028474254067987204,
1080
+ -0.003096792846918106,
1081
+ -0.0021675738971680403,
1082
+ -0.0003787819587159902,
1083
+ -0.006768254097551107,
1084
+ -0.00110574287828058,
1085
+ -0.000609182461630553,
1086
+ -0.0032347021624445915,
1087
+ -0.005555766634643078,
1088
+ -0.012623850256204605,
1089
+ -0.0004824258212465793,
1090
+ -0.0010148858418688178,
1091
+ -0.009800522588193417,
1092
+ -0.01089291088283062,
1093
+ -0.002919699065387249,
1094
+ -0.005509648472070694,
1095
+ -0.0007093790918588638,
1096
+ -0.0017709487583488226,
1097
+ -0.007096725050359964,
1098
+ -0.0022284225560724735,
1099
+ -0.0009606123203411698,
1100
+ -0.017192592844367027,
1101
+ -0.004958974663168192,
1102
+ -0.000321025843732059,
1103
+ -0.007865279912948608,
1104
+ -0.0013248363975435495,
1105
+ -0.0026323902420699596,
1106
+ -0.002967209555208683,
1107
+ -0.003275538794696331,
1108
+ -0.0007697101100347936,
1109
+ -0.02069810777902603,
1110
+ -0.00600612536072731,
1111
+ -0.003454132005572319,
1112
+ -0.00164946005679667,
1113
+ -0.021616628393530846,
1114
+ -0.00037547998363152146,
1115
+ -0.0013791971141472459,
1116
+ -0.0002931484195869416,
1117
+ -0.0020377198234200478,
1118
+ -0.004515333101153374,
1119
+ -0.026843883097171783,
1120
+ -0.0006049006478860974,
1121
+ -0.0006070983945392072,
1122
+ -0.0007667711470276117,
1123
+ -0.00021536584245041013,
1124
+ -0.0450412854552269,
1125
+ -0.0015369504690170288,
1126
+ -0.0005645402707159519,
1127
+ -0.002216763561591506,
1128
+ -0.0007594142225570977,
1129
+ -0.0037237321957945824,
1130
+ -0.002905755303800106,
1131
+ -0.00424158712849021,
1132
+ -0.004837940912693739,
1133
+ -0.0006752160843461752,
1134
+ -0.0030186076182872057,
1135
+ -0.0009017926640808582,
1136
+ -0.00026729219825938344,
1137
+ -0.0006156229064799845,
1138
+ -0.0011618678690865636,
1139
+ -0.0001462623622501269,
1140
+ -0.004122164100408554,
1141
+ -0.0001859295298345387,
1142
+ -0.0007514554308727384,
1143
+ -0.003534250194206834,
1144
+ -0.0030365008860826492,
1145
+ -0.0036810182500630617,
1146
+ -0.0064766560681164265,
1147
+ -0.0018187804380431771,
1148
+ -0.000253577483817935,
1149
+ -0.01675243116915226,
1150
+ -0.006413512397557497,
1151
+ -0.0019517249893397093,
1152
+ -0.00025289144832640886,
1153
+ -0.0023404271341860294,
1154
+ -0.00031484346254728734,
1155
+ -0.00941128097474575,
1156
+ -0.019002120941877365,
1157
+ -0.004024147056043148,
1158
+ -0.0021259698551148176,
1159
+ -0.0004454626177903265,
1160
+ -0.008115903474390507,
1161
+ -0.0005199434235692024,
1162
+ -6.396112439688295e-05,
1163
+ -0.0021351408213377,
1164
+ -0.001437849598005414,
1165
+ -0.0001965994742931798,
1166
+ -0.00035130474134348333,
1167
+ -0.0007774023106321692,
1168
+ -0.0001280636206502095,
1169
+ -0.0012665236135944724,
1170
+ -0.00021530069352593273,
1171
+ -0.000425885955337435,
1172
+ -0.00010600911627989262,
1173
+ -0.0012709213187918067,
1174
+ -0.0005109088378958404,
1175
+ -5.4605796321993694e-05,
1176
+ -0.0001892093278001994,
1177
+ -0.007937698625028133,
1178
+ -0.00014467535947915167,
1179
+ -0.0014578413683921099,
1180
+ -0.008719262667000294,
1181
+ -0.0043871584348380566,
1182
+ -0.0013978895731270313,
1183
+ -3.224361717002466e-05,
1184
+ -3.281969475210644e-05,
1185
+ -0.007597143296152353,
1186
+ -9.899612632580101e-05,
1187
+ -2.738368493737653e-05,
1188
+ -0.00031613255850970745,
1189
+ -4.128325963392854e-05,
1190
+ -0.0007011730340309441,
1191
+ -0.0006041606538929045,
1192
+ -0.00022185097623150796,
1193
+ -1.5747378711239435e-05,
1194
+ -0.0001257083349628374,
1195
+ -0.00011497300874907523,
1196
+ -0.00011105320299975574,
1197
+ -5.157307896297425e-05,
1198
+ -0.0001417464081896469,
1199
+ -4.0079659811453894e-05,
1200
+ -0.0001711562799755484,
1201
+ -0.003267128486186266,
1202
+ -8.380002327612601e-06,
1203
+ -0.00011130699567729607,
1204
+ -0.0022985294926911592,
1205
+ -0.0002603848115541041,
1206
+ -0.0012561411131173372,
1207
+ -0.007548708934336901,
1208
+ -2.3311802578973584e-05,
1209
+ -8.536979294149205e-05,
1210
+ -5.928838800173253e-05,
1211
+ -1.7859445506474003e-05,
1212
+ -2.8874992494820617e-05,
1213
+ -0.00016634466010145843,
1214
+ -1.664549927227199e-05,
1215
+ -6.716864299960434e-05,
1216
+ -1.7809690689318813e-05,
1217
+ -0.0030463875737041235,
1218
+ -1.591697036928963e-05,
1219
+ -9.979978131013922e-06,
1220
+ -1.458264796383446e-05,
1221
+ -2.2660085960524157e-05,
1222
+ -6.295119237620384e-05,
1223
+ -5.158302519703284e-05,
1224
+ -8.870430065144319e-06,
1225
+ 2.4651939384057187e-05,
1226
+ -1.0839266906259581e-05,
1227
+ -3.726567592821084e-05,
1228
+ -5.868282460141927e-05,
1229
+ -1.065588730853051e-05,
1230
+ -2.3740489268675447e-05,
1231
+ -4.6571971324738115e-05,
1232
+ -1.4279713468567934e-05,
1233
+ -2.412179128441494e-05,
1234
+ -1.0100046893057879e-05,
1235
+ -8.060726031544618e-06,
1236
+ -7.528061360062566e-06,
1237
+ -1.038836853695102e-05,
1238
+ -1.9785129552474245e-05,
1239
+ -1.6565183614147827e-05,
1240
+ -1.7817466869018972e-05,
1241
+ -7.467680006811861e-06,
1242
+ -2.0526860680547543e-05,
1243
+ -8.646415153634734e-06,
1244
+ -2.842918001988437e-05,
1245
+ -1.2150379916420206e-05,
1246
+ -8.60803629620932e-06,
1247
+ -7.291034307854716e-06,
1248
+ -1.0754650247690734e-05,
1249
+ -6.411308731912868e-06
1250
+ ],
1251
+ "abs_loss": [
1252
+ 3.9100465774536133,
1253
+ 3.8975870609283447,
1254
+ 3.8392674922943115,
1255
+ 3.7595930099487305,
1256
+ 3.581761598587036,
1257
+ 3.077859878540039,
1258
+ 3.094771146774292,
1259
+ 3.077636957168579,
1260
+ 3.1082115173339844,
1261
+ 3.0092105865478516,
1262
+ 3.141963243484497,
1263
+ 3.0576484203338623,
1264
+ 3.0487613677978516,
1265
+ 3.056673049926758,
1266
+ 3.06050705909729,
1267
+ 2.977795362472534,
1268
+ 2.929574966430664,
1269
+ 2.7671806812286377,
1270
+ 2.842601776123047,
1271
+ 2.7369773387908936,
1272
+ 2.681629180908203,
1273
+ 2.5334365367889404,
1274
+ 2.4646987915039062,
1275
+ 2.3455915451049805,
1276
+ 2.323493242263794,
1277
+ 2.225255012512207,
1278
+ 2.0635712146759033,
1279
+ 2.201101064682007,
1280
+ 1.9572720527648926,
1281
+ 1.9138232469558716,
1282
+ 1.9275528192520142,
1283
+ 1.7616440057754517,
1284
+ 1.7060261964797974,
1285
+ 1.7646626234054565,
1286
+ 1.6927824020385742,
1287
+ 1.6781312227249146,
1288
+ 1.614211082458496,
1289
+ 1.6111903190612793,
1290
+ 1.5514603853225708,
1291
+ 1.5403081178665161,
1292
+ 1.408429503440857,
1293
+ 1.4391018152236938,
1294
+ 1.4640899896621704,
1295
+ 1.3647264242172241,
1296
+ 1.4949804544448853,
1297
+ 1.2549307346343994,
1298
+ 1.272302508354187,
1299
+ 1.2950795888900757,
1300
+ 1.2709366083145142,
1301
+ 1.203320026397705,
1302
+ 1.2418088912963867,
1303
+ 1.1795908212661743,
1304
+ 1.2100251913070679,
1305
+ 1.0959945917129517,
1306
+ 1.0862230062484741,
1307
+ 1.0877859592437744,
1308
+ 1.141281247138977,
1309
+ 1.0249780416488647,
1310
+ 0.9890892505645752,
1311
+ 0.9109721183776855,
1312
+ 1.0081976652145386,
1313
+ 0.928091824054718,
1314
+ 0.9609468579292297,
1315
+ 0.9811637997627258,
1316
+ 0.7913894653320312,
1317
+ 0.8156485557556152,
1318
+ 0.8584363460540771,
1319
+ 0.6847303509712219,
1320
+ 0.687626838684082,
1321
+ 0.6748706698417664,
1322
+ 0.7412440180778503,
1323
+ 0.7287342548370361,
1324
+ 0.6193475127220154,
1325
+ 0.720916211605072,
1326
+ 0.6421559453010559,
1327
+ 0.642063558101654,
1328
+ 0.5613493919372559,
1329
+ 0.5891659259796143,
1330
+ 0.5479210615158081,
1331
+ 0.5314231514930725,
1332
+ 0.5439849495887756,
1333
+ 0.5367106795310974,
1334
+ 0.507027804851532,
1335
+ 0.45817089080810547,
1336
+ 0.5355744957923889,
1337
+ 0.45088496804237366,
1338
+ 0.46670737862586975,
1339
+ 0.4583347737789154,
1340
+ 0.3799661695957184,
1341
+ 0.3906151056289673,
1342
+ 0.42524102330207825,
1343
+ 0.30378833413124084,
1344
+ 0.34402838349342346,
1345
+ 0.23706363141536713,
1346
+ 0.2770039737224579,
1347
+ 0.23684363067150116,
1348
+ 0.27812063694000244,
1349
+ 0.23869305849075317,
1350
+ 0.25324514508247375,
1351
+ 0.27824679017066956,
1352
+ 0.22837097942829132,
1353
+ 0.24062645435333252,
1354
+ 0.1953345686197281,
1355
+ 0.2186935693025589,
1356
+ 0.19244857132434845,
1357
+ 0.20102375745773315,
1358
+ 0.18487371504306793,
1359
+ 0.16867367923259735,
1360
+ 0.15062938630580902,
1361
+ 0.18083924055099487,
1362
+ 0.11583039164543152,
1363
+ 0.19421494007110596,
1364
+ 0.1377987265586853,
1365
+ 0.12761341035366058,
1366
+ 0.1398167759180069,
1367
+ 0.13316531479358673,
1368
+ 0.13546839356422424,
1369
+ 0.10419720411300659,
1370
+ 0.10089924186468124,
1371
+ 0.10359545797109604,
1372
+ 0.08913455158472061,
1373
+ 0.0836791917681694,
1374
+ 0.09513048082590103,
1375
+ 0.10752777010202408,
1376
+ 0.07869306206703186,
1377
+ 0.09269803017377853,
1378
+ 0.0664750263094902,
1379
+ 0.10058172792196274,
1380
+ 0.0942007526755333,
1381
+ 0.07060393691062927,
1382
+ 0.07069623470306396,
1383
+ 0.08343581110239029,
1384
+ 0.08978813886642456,
1385
+ 0.06264176219701767,
1386
+ 0.0727839320898056,
1387
+ 0.08141377568244934,
1388
+ 0.06984963268041611,
1389
+ 0.08312416076660156,
1390
+ 0.06752229481935501,
1391
+ 0.06518099457025528,
1392
+ 0.0723346397280693,
1393
+ 0.0926949754357338,
1394
+ 0.07708333432674408,
1395
+ 0.06434222310781479,
1396
+ 0.0732760801911354,
1397
+ 0.05879487469792366,
1398
+ 0.07625218480825424,
1399
+ 0.07054731249809265,
1400
+ 0.05598445609211922,
1401
+ 0.04704497382044792,
1402
+ 0.05821196362376213,
1403
+ 0.05910499021410942,
1404
+ 0.050326455384492874,
1405
+ 0.04014730826020241,
1406
+ 0.05032016709446907,
1407
+ 0.0559832789003849,
1408
+ 0.05798080563545227,
1409
+ 0.060850322246551514,
1410
+ 0.05990013852715492,
1411
+ 0.0649031326174736,
1412
+ 0.05214034020900726,
1413
+ 0.03999574854969978,
1414
+ 0.06125303730368614,
1415
+ 0.04810075834393501,
1416
+ 0.057810503989458084,
1417
+ 0.04367963597178459,
1418
+ 0.04500923678278923,
1419
+ 0.04815249145030975,
1420
+ 0.06941595673561096,
1421
+ 0.04378579184412956,
1422
+ 0.039449017494916916,
1423
+ 0.062223684042692184,
1424
+ 0.05087001249194145,
1425
+ 0.05693439766764641,
1426
+ 0.05195432901382446,
1427
+ 0.044212400913238525,
1428
+ 0.03281838819384575,
1429
+ 0.07130736857652664,
1430
+ 0.04234795644879341,
1431
+ 0.037031132727861404,
1432
+ 0.056286055594682693,
1433
+ 0.05698028579354286,
1434
+ 0.04710875824093819,
1435
+ 0.0431063137948513,
1436
+ 0.05567215010523796,
1437
+ 0.04408109560608864,
1438
+ 0.03917383402585983,
1439
+ 0.04425838589668274,
1440
+ 0.04848232865333557,
1441
+ 0.041234616190195084,
1442
+ 0.055955249816179276,
1443
+ 0.03867678716778755,
1444
+ 0.05803993344306946,
1445
+ 0.058457791805267334,
1446
+ 0.0351126492023468,
1447
+ 0.047668252140283585,
1448
+ 0.051030561327934265,
1449
+ 0.06693687289953232,
1450
+ 0.037342045456171036,
1451
+ 0.04897139593958855,
1452
+ 0.04071170464158058,
1453
+ 0.03195817396044731,
1454
+ 0.04455135390162468,
1455
+ 0.037423621863126755,
1456
+ 0.03185616061091423,
1457
+ 0.04340950772166252,
1458
+ 0.04206155613064766,
1459
+ 0.03775278851389885,
1460
+ 0.046762850135564804,
1461
+ 0.02975139021873474,
1462
+ 0.03377072140574455,
1463
+ 0.048947807401418686,
1464
+ 0.02991846390068531,
1465
+ 0.043979253619909286,
1466
+ 0.03999378904700279,
1467
+ 0.029062345623970032,
1468
+ 0.03937942162156105,
1469
+ 0.043757364153862,
1470
+ 0.035556841641664505,
1471
+ 0.03750767558813095,
1472
+ 0.037997055798769,
1473
+ 0.03813956305384636,
1474
+ 0.03332119807600975,
1475
+ 0.04382672905921936,
1476
+ 0.03575631603598595,
1477
+ 0.03302134945988655,
1478
+ 0.030200744047760963,
1479
+ 0.03823885694146156,
1480
+ 0.03453255072236061,
1481
+ 0.03653145954012871,
1482
+ 0.04374239966273308,
1483
+ 0.047345180064439774,
1484
+ 0.040144938975572586,
1485
+ 0.04836520925164223,
1486
+ 0.03711860999464989,
1487
+ 0.03266342356801033,
1488
+ 0.03952832892537117,
1489
+ 0.04084258899092674,
1490
+ 0.03149488940834999,
1491
+ 0.05244305729866028,
1492
+ 0.042809247970581055,
1493
+ 0.027759669348597527,
1494
+ 0.037863582372665405,
1495
+ 0.04004785045981407,
1496
+ 0.03883574903011322,
1497
+ 0.03282098099589348,
1498
+ 0.04005662724375725,
1499
+ 0.0291286613792181,
1500
+ 0.0357460118830204,
1501
+ 0.03452034667134285,
1502
+ 0.04267224296927452,
1503
+ 0.03179382160305977,
1504
+ 0.039745133370161057,
1505
+ 0.04173777624964714,
1506
+ 0.0354158878326416,
1507
+ 0.03331361338496208,
1508
+ 0.04022645950317383,
1509
+ 0.03608141466975212,
1510
+ 0.03537673130631447,
1511
+ 0.03464791551232338,
1512
+ 0.032951224595308304,
1513
+ 0.02508355677127838,
1514
+ 0.04105520620942116,
1515
+ 0.03586887568235397,
1516
+ 0.04789206385612488,
1517
+ 0.04689581319689751,
1518
+ 0.039730969816446304,
1519
+ 0.03624783456325531,
1520
+ 0.03239130601286888,
1521
+ 0.02859114110469818,
1522
+ 0.0327032208442688,
1523
+ 0.03129056468605995,
1524
+ 0.0358058363199234,
1525
+ 0.029234059154987335,
1526
+ 0.030198248103260994,
1527
+ 0.028243616223335266,
1528
+ 0.0331985168159008,
1529
+ 0.04053870961070061,
1530
+ 0.02295183204114437,
1531
+ 0.02807433344423771,
1532
+ 0.027615806087851524,
1533
+ 0.02944447100162506,
1534
+ 0.03079299069941044,
1535
+ 0.027692163363099098,
1536
+ 0.03086685575544834,
1537
+ 0.025942102074623108,
1538
+ 0.03200956806540489,
1539
+ 0.03382093831896782,
1540
+ 0.03204977512359619,
1541
+ 0.024898899719119072,
1542
+ 0.024450920522212982,
1543
+ 0.031034136191010475,
1544
+ 0.029439685866236687,
1545
+ 0.024981820955872536,
1546
+ 0.0282369926571846,
1547
+ 0.033129725605249405,
1548
+ 0.03465596213936806,
1549
+ 0.026924612000584602,
1550
+ 0.027515172958374023,
1551
+ 0.02585337497293949,
1552
+ 0.024600399658083916,
1553
+ 0.03324790671467781,
1554
+ 0.031333841383457184,
1555
+ 0.04458741471171379,
1556
+ 0.03677447512745857,
1557
+ 0.030864620581269264,
1558
+ 0.034290824085474014,
1559
+ 0.026761651039123535,
1560
+ 0.022752979770302773,
1561
+ 0.0276681836694479
1562
+ ],
1563
+ "zipf_loss": [
1564
+ 6.2647385597229,
1565
+ 5.311121940612793,
1566
+ 4.038539409637451,
1567
+ 2.78248929977417,
1568
+ 1.6209688186645508,
1569
+ 0.9065740704536438,
1570
+ 0.7071341276168823,
1571
+ 0.6662864685058594,
1572
+ 0.6548333168029785,
1573
+ 0.6567842960357666,
1574
+ 0.6501899361610413,
1575
+ 0.6484828591346741,
1576
+ 0.646877110004425,
1577
+ 0.6501692533493042,
1578
+ 0.652756929397583,
1579
+ 0.6545189619064331,
1580
+ 0.6448677182197571,
1581
+ 0.6407127380371094,
1582
+ 0.6372076272964478,
1583
+ 0.6176654696464539,
1584
+ 0.605496346950531,
1585
+ 0.6054860353469849,
1586
+ 0.5905702710151672,
1587
+ 0.5976320505142212,
1588
+ 0.5864124298095703,
1589
+ 0.5702215433120728,
1590
+ 0.5584025979042053,
1591
+ 0.514107882976532,
1592
+ 0.5131394863128662,
1593
+ 0.4860970377922058,
1594
+ 0.4539937376976013,
1595
+ 0.43368053436279297,
1596
+ 0.4057684540748596,
1597
+ 0.40075793862342834,
1598
+ 0.40284836292266846,
1599
+ 0.37186339497566223,
1600
+ 0.3592296540737152,
1601
+ 0.3370414972305298,
1602
+ 0.3177129626274109,
1603
+ 0.3208150863647461,
1604
+ 0.3200819492340088,
1605
+ 0.2691417634487152,
1606
+ 0.2823074162006378,
1607
+ 0.2771086096763611,
1608
+ 0.2864125370979309,
1609
+ 0.2942010462284088,
1610
+ 0.2373911291360855,
1611
+ 0.28521600365638733,
1612
+ 0.23170779645442963,
1613
+ 0.22162479162216187,
1614
+ 0.25991278886795044,
1615
+ 0.23690418899059296,
1616
+ 0.21735797822475433,
1617
+ 0.21083758771419525,
1618
+ 0.202726811170578,
1619
+ 0.19243958592414856,
1620
+ 0.19713085889816284,
1621
+ 0.220155268907547,
1622
+ 0.17703257501125336,
1623
+ 0.16268298029899597,
1624
+ 0.14934882521629333,
1625
+ 0.13790592551231384,
1626
+ 0.13645006716251373,
1627
+ 0.1251339465379715,
1628
+ 0.12896808981895447,
1629
+ 0.12582536041736603,
1630
+ 0.11689553409814835,
1631
+ 0.12510409951210022,
1632
+ 0.11003391444683075,
1633
+ 0.11649907380342484,
1634
+ 0.10724946111440659,
1635
+ 0.11458496749401093,
1636
+ 0.0802299976348877,
1637
+ 0.09896475821733475,
1638
+ 0.08422364294528961,
1639
+ 0.08960572630167007,
1640
+ 0.06377270072698593,
1641
+ 0.09807564318180084,
1642
+ 0.09151331335306168,
1643
+ 0.09337028115987778,
1644
+ 0.07881356030702591,
1645
+ 0.07581382989883423,
1646
+ 0.07829391211271286,
1647
+ 0.08617934584617615,
1648
+ 0.059952788054943085,
1649
+ 0.06410154700279236,
1650
+ 0.0847838968038559,
1651
+ 0.06990242749452591,
1652
+ 0.059936970472335815,
1653
+ 0.06028757989406586,
1654
+ 0.06155620887875557,
1655
+ 0.06328116357326508,
1656
+ 0.040237169712781906,
1657
+ 0.07182645052671432,
1658
+ 0.049396127462387085,
1659
+ 0.05121868848800659,
1660
+ 0.04121319204568863,
1661
+ 0.044958505779504776,
1662
+ 0.03511004522442818,
1663
+ 0.04359455406665802,
1664
+ 0.03999662399291992,
1665
+ 0.039543963968753815,
1666
+ 0.03522617369890213,
1667
+ 0.042770866304636,
1668
+ 0.039961040019989014,
1669
+ 0.02960807830095291,
1670
+ 0.04109545052051544,
1671
+ 0.029586367309093475,
1672
+ 0.027756642550230026,
1673
+ 0.028371471911668777,
1674
+ 0.03461205214262009,
1675
+ 0.03762046992778778,
1676
+ 0.02738787606358528,
1677
+ 0.03208710998296738,
1678
+ 0.022824836894869804,
1679
+ 0.030391091480851173,
1680
+ 0.03855101764202118,
1681
+ 0.032098494470119476,
1682
+ 0.04166826605796814,
1683
+ 0.03804739937186241,
1684
+ 0.03535844758152962,
1685
+ 0.024846818298101425,
1686
+ 0.04090646654367447,
1687
+ 0.03227391093969345,
1688
+ 0.0258273147046566,
1689
+ 0.0327095165848732,
1690
+ 0.030704444274306297,
1691
+ 0.03531178832054138,
1692
+ 0.03139270469546318,
1693
+ 0.03508851304650307,
1694
+ 0.036627788096666336,
1695
+ 0.03412892669439316,
1696
+ 0.037437692284584045,
1697
+ 0.028485018759965897,
1698
+ 0.04072963818907738,
1699
+ 0.030536793172359467,
1700
+ 0.023973483592271805,
1701
+ 0.034301742911338806,
1702
+ 0.025335777550935745,
1703
+ 0.025936419144272804,
1704
+ 0.03821936249732971,
1705
+ 0.03255400434136391,
1706
+ 0.03482013940811157,
1707
+ 0.028344962745904922,
1708
+ 0.02427363395690918,
1709
+ 0.01892995461821556,
1710
+ 0.03483092784881592,
1711
+ 0.021135112270712852,
1712
+ 0.030216146260499954,
1713
+ 0.020271817222237587,
1714
+ 0.025562968105077744,
1715
+ 0.027894524857401848,
1716
+ 0.02379819191992283,
1717
+ 0.019332395866513252,
1718
+ 0.03309089317917824,
1719
+ 0.02257682755589485,
1720
+ 0.024780966341495514,
1721
+ 0.03301933780312538,
1722
+ 0.020488213747739792,
1723
+ 0.03600095957517624,
1724
+ 0.03224056214094162,
1725
+ 0.032430339604616165,
1726
+ 0.030159588903188705,
1727
+ 0.028303630650043488,
1728
+ 0.023648016154766083,
1729
+ 0.024819709360599518,
1730
+ 0.0224332083016634,
1731
+ 0.03710637986660004,
1732
+ 0.038832325488328934,
1733
+ 0.03290429338812828,
1734
+ 0.03674276918172836,
1735
+ 0.025626562535762787,
1736
+ 0.02636650763452053,
1737
+ 0.02844918519258499,
1738
+ 0.02586882933974266,
1739
+ 0.03203177452087402,
1740
+ 0.03509139642119408,
1741
+ 0.025883246213197708,
1742
+ 0.020976923406124115,
1743
+ 0.03734353929758072,
1744
+ 0.021374141797423363,
1745
+ 0.0302629042416811,
1746
+ 0.025268230587244034,
1747
+ 0.03006932884454727,
1748
+ 0.04009821638464928,
1749
+ 0.022566495463252068,
1750
+ 0.030499298125505447,
1751
+ 0.028988566249608994,
1752
+ 0.019886991009116173,
1753
+ 0.02483513206243515,
1754
+ 0.036406293511390686,
1755
+ 0.03185576573014259,
1756
+ 0.026014119386672974,
1757
+ 0.03210553899407387,
1758
+ 0.03521226346492767,
1759
+ 0.029362794011831284,
1760
+ 0.02233259379863739,
1761
+ 0.01901492476463318,
1762
+ 0.031694911420345306,
1763
+ 0.02233244478702545,
1764
+ 0.02075127884745598,
1765
+ 0.01784711331129074,
1766
+ 0.027844153344631195,
1767
+ 0.024917500093579292,
1768
+ 0.027568945661187172,
1769
+ 0.01883680559694767,
1770
+ 0.02439868450164795,
1771
+ 0.025731626898050308,
1772
+ 0.028402484953403473,
1773
+ 0.02195078879594803,
1774
+ 0.03448273614048958,
1775
+ 0.025361377745866776,
1776
+ 0.025935489684343338,
1777
+ 0.02657308615744114,
1778
+ 0.023334946483373642,
1779
+ 0.021428830921649933,
1780
+ 0.022284740582108498,
1781
+ 0.025193769484758377,
1782
+ 0.0194866880774498,
1783
+ 0.02475069835782051,
1784
+ 0.01970258168876171,
1785
+ 0.029235519468784332,
1786
+ 0.01941070705652237,
1787
+ 0.02159411646425724,
1788
+ 0.02630382962524891,
1789
+ 0.026214729994535446,
1790
+ 0.018435712903738022,
1791
+ 0.024366214871406555,
1792
+ 0.023245982825756073,
1793
+ 0.026845648884773254,
1794
+ 0.018069326877593994,
1795
+ 0.04119906947016716,
1796
+ 0.02246912196278572,
1797
+ 0.02251153439283371,
1798
+ 0.023659037426114082,
1799
+ 0.02713550627231598,
1800
+ 0.02684645913541317,
1801
+ 0.02230352908372879,
1802
+ 0.022560223937034607,
1803
+ 0.02545955404639244,
1804
+ 0.019769499078392982,
1805
+ 0.025282971560955048,
1806
+ 0.017687924206256866,
1807
+ 0.03021261841058731,
1808
+ 0.02327105775475502,
1809
+ 0.029726387932896614,
1810
+ 0.028216063976287842,
1811
+ 0.021504443138837814,
1812
+ 0.021075258031487465,
1813
+ 0.02171340212225914,
1814
+ 0.022164540365338326,
1815
+ 0.019163666293025017,
1816
+ 0.026623304933309555,
1817
+ 0.03649923950433731,
1818
+ 0.019853034988045692,
1819
+ 0.03168007731437683,
1820
+ 0.02857372537255287,
1821
+ 0.021299801766872406,
1822
+ 0.0332893431186676,
1823
+ 0.020683545619249344,
1824
+ 0.027134964242577553,
1825
+ 0.027058036997914314,
1826
+ 0.028129536658525467,
1827
+ 0.022001294419169426,
1828
+ 0.03364933282136917,
1829
+ 0.024673141539096832,
1830
+ 0.03318758308887482,
1831
+ 0.027043083682656288,
1832
+ 0.028692662715911865,
1833
+ 0.036532264202833176,
1834
+ 0.02211010828614235,
1835
+ 0.018361609429121017,
1836
+ 0.021959012374281883,
1837
+ 0.020428428426384926,
1838
+ 0.019337190315127373,
1839
+ 0.02644484117627144,
1840
+ 0.036713194102048874,
1841
+ 0.017790287733078003,
1842
+ 0.023714857175946236,
1843
+ 0.022145040333271027,
1844
+ 0.018587995320558548,
1845
+ 0.027625298127532005,
1846
+ 0.017082124948501587,
1847
+ 0.014796427451074123,
1848
+ 0.02232874184846878,
1849
+ 0.021130595356225967,
1850
+ 0.019287604838609695,
1851
+ 0.019842442125082016,
1852
+ 0.02531333640217781,
1853
+ 0.023372437804937363,
1854
+ 0.018537504598498344,
1855
+ 0.022996803745627403,
1856
+ 0.016719374805688858,
1857
+ 0.016958536580204964,
1858
+ 0.018320290371775627,
1859
+ 0.03871607780456543,
1860
+ 0.02245084010064602,
1861
+ 0.021462760865688324,
1862
+ 0.02043996937572956,
1863
+ 0.021440034732222557,
1864
+ 0.016790200024843216,
1865
+ 0.03957873582839966,
1866
+ 0.02106628194451332,
1867
+ 0.023481836542487144,
1868
+ 0.02349773794412613,
1869
+ 0.02129766158759594,
1870
+ 0.025639664381742477,
1871
+ 0.03433838486671448,
1872
+ 0.030397899448871613,
1873
+ 0.018186327069997787
1874
+ ],
1875
+ "denoise_loss": [],
1876
+ "ortho_loss": [
1877
+ 0.9382966756820679,
1878
+ 0.6588878035545349,
1879
+ 0.42088937759399414,
1880
+ 0.2320655733346939,
1881
+ 0.16124394536018372,
1882
+ 0.1256297528743744,
1883
+ 0.1165647804737091,
1884
+ 0.10543155670166016,
1885
+ 0.08511611074209213,
1886
+ 0.08207160979509354,
1887
+ 0.09057501703500748,
1888
+ 0.09505771845579147,
1889
+ 0.11708667874336243,
1890
+ 0.1503661572933197,
1891
+ 0.16437821090221405,
1892
+ 0.1690972000360489,
1893
+ 0.1732271909713745,
1894
+ 0.17905646562576294,
1895
+ 0.18898454308509827,
1896
+ 0.1928926408290863,
1897
+ 0.20392286777496338,
1898
+ 0.20940101146697998,
1899
+ 0.21187590062618256,
1900
+ 0.21231071650981903,
1901
+ 0.21626794338226318,
1902
+ 0.2212129533290863,
1903
+ 0.22394777834415436,
1904
+ 0.22969666123390198,
1905
+ 0.23175372183322906,
1906
+ 0.2357863336801529,
1907
+ 0.23864339292049408,
1908
+ 0.23572774231433868,
1909
+ 0.23480254411697388,
1910
+ 0.23319430649280548,
1911
+ 0.2373831570148468,
1912
+ 0.23410111665725708,
1913
+ 0.2355644702911377,
1914
+ 0.23719055950641632,
1915
+ 0.23637425899505615,
1916
+ 0.22925691306591034,
1917
+ 0.23422953486442566,
1918
+ 0.23229242861270905,
1919
+ 0.22866179049015045,
1920
+ 0.2280547022819519,
1921
+ 0.23064395785331726,
1922
+ 0.2346450686454773,
1923
+ 0.23569199442863464,
1924
+ 0.23687110841274261,
1925
+ 0.231954425573349,
1926
+ 0.23199519515037537,
1927
+ 0.2336961328983307,
1928
+ 0.2374170869588852,
1929
+ 0.23457828164100647,
1930
+ 0.23417001962661743,
1931
+ 0.23284892737865448,
1932
+ 0.23757337033748627,
1933
+ 0.23529747128486633,
1934
+ 0.23589220643043518,
1935
+ 0.2349993735551834,
1936
+ 0.23567408323287964,
1937
+ 0.23425427079200745,
1938
+ 0.23390081524848938,
1939
+ 0.23371915519237518,
1940
+ 0.23257684707641602,
1941
+ 0.23165081441402435,
1942
+ 0.23166172206401825,
1943
+ 0.23003865778446198,
1944
+ 0.22524842619895935,
1945
+ 0.22767741978168488,
1946
+ 0.22799386084079742,
1947
+ 0.2327577918767929,
1948
+ 0.23616527020931244,
1949
+ 0.2315577119588852,
1950
+ 0.22831550240516663,
1951
+ 0.23036615550518036,
1952
+ 0.22815334796905518,
1953
+ 0.23284174501895905,
1954
+ 0.235682874917984,
1955
+ 0.23753470182418823,
1956
+ 0.23702216148376465,
1957
+ 0.23697084188461304,
1958
+ 0.23746462166309357,
1959
+ 0.23534896969795227,
1960
+ 0.23484240472316742,
1961
+ 0.2350679337978363,
1962
+ 0.23661695420742035,
1963
+ 0.2368382066488266,
1964
+ 0.23605409264564514,
1965
+ 0.23691511154174805,
1966
+ 0.2369929403066635,
1967
+ 0.238261416554451,
1968
+ 0.23982560634613037,
1969
+ 0.24032315611839294,
1970
+ 0.24284431338310242,
1971
+ 0.24316035211086273,
1972
+ 0.24490563571453094,
1973
+ 0.2502349615097046,
1974
+ 0.25157418847084045,
1975
+ 0.2509077191352844,
1976
+ 0.25075310468673706,
1977
+ 0.25295525789260864,
1978
+ 0.25359466671943665,
1979
+ 0.25517353415489197,
1980
+ 0.2559907138347626,
1981
+ 0.2543465197086334,
1982
+ 0.25437554717063904,
1983
+ 0.2520972788333893,
1984
+ 0.25316494703292847,
1985
+ 0.25730597972869873,
1986
+ 0.25913918018341064,
1987
+ 0.2582869231700897,
1988
+ 0.2586173117160797,
1989
+ 0.2576594352722168,
1990
+ 0.25898581743240356,
1991
+ 0.25822708010673523,
1992
+ 0.2578895092010498,
1993
+ 0.25819700956344604,
1994
+ 0.25727710127830505,
1995
+ 0.2606615126132965,
1996
+ 0.2619830071926117,
1997
+ 0.2622619867324829,
1998
+ 0.25970587134361267,
1999
+ 0.2611936628818512,
2000
+ 0.26302391290664673,
2001
+ 0.2645387351512909,
2002
+ 0.26300355792045593,
2003
+ 0.26311883330345154,
2004
+ 0.26086539030075073,
2005
+ 0.25930899381637573,
2006
+ 0.26092007756233215,
2007
+ 0.2588067352771759,
2008
+ 0.25977230072021484,
2009
+ 0.2625751197338104,
2010
+ 0.2618725895881653,
2011
+ 0.2615964412689209,
2012
+ 0.2614551782608032,
2013
+ 0.2617577612400055,
2014
+ 0.2621341347694397,
2015
+ 0.26312968134880066,
2016
+ 0.2630600333213806,
2017
+ 0.2603296935558319,
2018
+ 0.25991344451904297,
2019
+ 0.2614287734031677,
2020
+ 0.26091518998146057,
2021
+ 0.2609129548072815,
2022
+ 0.2581985890865326,
2023
+ 0.26171350479125977,
2024
+ 0.2627491354942322,
2025
+ 0.2628113627433777,
2026
+ 0.2627332806587219,
2027
+ 0.26485535502433777,
2028
+ 0.26244014501571655,
2029
+ 0.26064935326576233,
2030
+ 0.2604113519191742,
2031
+ 0.25912243127822876,
2032
+ 0.2599487006664276,
2033
+ 0.25977423787117004,
2034
+ 0.25723594427108765,
2035
+ 0.2589156925678253,
2036
+ 0.26139792799949646,
2037
+ 0.2608095109462738,
2038
+ 0.257353812456131,
2039
+ 0.25579380989074707,
2040
+ 0.26192590594291687,
2041
+ 0.26170575618743896,
2042
+ 0.2573934495449066,
2043
+ 0.25857028365135193,
2044
+ 0.25556641817092896,
2045
+ 0.25666487216949463,
2046
+ 0.2564474940299988,
2047
+ 0.2584974765777588,
2048
+ 0.257750928401947,
2049
+ 0.2586265504360199,
2050
+ 0.25900962948799133,
2051
+ 0.25536540150642395,
2052
+ 0.2561735510826111,
2053
+ 0.25549590587615967,
2054
+ 0.25259003043174744,
2055
+ 0.25580865144729614,
2056
+ 0.2599583566188812,
2057
+ 0.2634178102016449,
2058
+ 0.2614739239215851,
2059
+ 0.2609767019748688,
2060
+ 0.25872913002967834,
2061
+ 0.2598873972892761,
2062
+ 0.2598589360713959,
2063
+ 0.26039913296699524,
2064
+ 0.261478066444397,
2065
+ 0.26389962434768677,
2066
+ 0.25965964794158936,
2067
+ 0.26012369990348816,
2068
+ 0.2614912986755371,
2069
+ 0.2609478235244751,
2070
+ 0.25799471139907837,
2071
+ 0.25930672883987427,
2072
+ 0.25793910026550293,
2073
+ 0.25631362199783325,
2074
+ 0.25630810856819153,
2075
+ 0.2574211359024048,
2076
+ 0.2584388852119446,
2077
+ 0.25894883275032043,
2078
+ 0.25936877727508545,
2079
+ 0.25757738947868347,
2080
+ 0.25764116644859314,
2081
+ 0.25714877247810364,
2082
+ 0.2566877007484436,
2083
+ 0.2558593153953552,
2084
+ 0.2578563094139099,
2085
+ 0.25735586881637573,
2086
+ 0.2594856023788452,
2087
+ 0.26005852222442627,
2088
+ 0.2609432339668274,
2089
+ 0.2613309919834137,
2090
+ 0.26132115721702576,
2091
+ 0.2618064880371094,
2092
+ 0.2622898817062378,
2093
+ 0.2635512948036194,
2094
+ 0.2644326984882355,
2095
+ 0.2645467519760132,
2096
+ 0.26274412870407104,
2097
+ 0.26223519444465637,
2098
+ 0.2642705738544464,
2099
+ 0.2645619213581085,
2100
+ 0.263324499130249,
2101
+ 0.26275208592414856,
2102
+ 0.2628836929798126,
2103
+ 0.26300525665283203,
2104
+ 0.2626466453075409,
2105
+ 0.2614835202693939,
2106
+ 0.25612545013427734,
2107
+ 0.25756406784057617,
2108
+ 0.2580561637878418,
2109
+ 0.25907471776008606,
2110
+ 0.2586274743080139,
2111
+ 0.25821614265441895,
2112
+ 0.25944051146507263,
2113
+ 0.2599451541900635,
2114
+ 0.259314626455307,
2115
+ 0.25966089963912964,
2116
+ 0.2610854208469391,
2117
+ 0.2613784372806549,
2118
+ 0.2618248164653778,
2119
+ 0.26279670000076294,
2120
+ 0.2625303268432617,
2121
+ 0.2617781162261963,
2122
+ 0.2611786425113678,
2123
+ 0.2609390914440155,
2124
+ 0.2614979147911072,
2125
+ 0.26170775294303894,
2126
+ 0.26245665550231934,
2127
+ 0.26383984088897705,
2128
+ 0.26516062021255493,
2129
+ 0.26491519808769226,
2130
+ 0.2647554278373718,
2131
+ 0.264583557844162,
2132
+ 0.264553040266037,
2133
+ 0.2634003162384033,
2134
+ 0.26309484243392944,
2135
+ 0.2632202208042145,
2136
+ 0.2634616196155548,
2137
+ 0.2637457251548767,
2138
+ 0.264485627412796,
2139
+ 0.26475146412849426,
2140
+ 0.26460742950439453,
2141
+ 0.2654464840888977,
2142
+ 0.26473498344421387,
2143
+ 0.2649029791355133,
2144
+ 0.26524946093559265,
2145
+ 0.26537907123565674,
2146
+ 0.26649829745292664,
2147
+ 0.2667599320411682,
2148
+ 0.26727795600891113,
2149
+ 0.267291784286499,
2150
+ 0.2673085629940033,
2151
+ 0.26682019233703613,
2152
+ 0.2667543888092041,
2153
+ 0.2673811912536621,
2154
+ 0.2676103115081787,
2155
+ 0.26768064498901367,
2156
+ 0.26766034960746765,
2157
+ 0.2680952548980713,
2158
+ 0.26837679743766785,
2159
+ 0.2683418393135071,
2160
+ 0.26831912994384766,
2161
+ 0.26809704303741455,
2162
+ 0.26841503381729126,
2163
+ 0.2688930928707123,
2164
+ 0.2697807848453522,
2165
+ 0.2697928547859192,
2166
+ 0.2695028781890869,
2167
+ 0.2695123851299286,
2168
+ 0.2696168124675751,
2169
+ 0.268787682056427,
2170
+ 0.269096314907074,
2171
+ 0.26906323432922363,
2172
+ 0.26884567737579346,
2173
+ 0.2693849503993988,
2174
+ 0.2692883610725403,
2175
+ 0.2692651152610779,
2176
+ 0.269359290599823,
2177
+ 0.2692016661167145,
2178
+ 0.26934701204299927,
2179
+ 0.2694322466850281,
2180
+ 0.26922088861465454,
2181
+ 0.26940470933914185,
2182
+ 0.2694062292575836,
2183
+ 0.2694178521633148,
2184
+ 0.26934027671813965,
2185
+ 0.2695278227329254,
2186
+ 0.26959916949272156
2187
+ ],
2188
+ "lr": [
2189
+ 4.188034188034189e-06,
2190
+ 8.461538461538462e-06,
2191
+ 1.2735042735042738e-05,
2192
+ 1.700854700854701e-05,
2193
+ 2.1282051282051282e-05,
2194
+ 2.5555555555555557e-05,
2195
+ 2.9829059829059833e-05,
2196
+ 3.4102564102564105e-05,
2197
+ 3.837606837606838e-05,
2198
+ 4e-05,
2199
+ 4e-05,
2200
+ 4e-05,
2201
+ 4e-05,
2202
+ 4e-05,
2203
+ 4e-05,
2204
+ 4e-05,
2205
+ 4e-05,
2206
+ 4e-05,
2207
+ 4e-05,
2208
+ 4e-05,
2209
+ 4e-05,
2210
+ 4e-05,
2211
+ 4e-05,
2212
+ 4e-05,
2213
+ 4e-05,
2214
+ 4e-05,
2215
+ 4e-05,
2216
+ 4e-05,
2217
+ 4e-05,
2218
+ 4e-05,
2219
+ 4e-05,
2220
+ 4e-05,
2221
+ 4e-05,
2222
+ 4e-05,
2223
+ 4e-05,
2224
+ 4e-05,
2225
+ 4e-05,
2226
+ 4e-05,
2227
+ 4e-05,
2228
+ 4e-05,
2229
+ 4e-05,
2230
+ 4e-05,
2231
+ 4e-05,
2232
+ 4e-05,
2233
+ 4e-05,
2234
+ 4e-05,
2235
+ 4e-05,
2236
+ 4e-05,
2237
+ 4e-05,
2238
+ 4e-05,
2239
+ 4e-05,
2240
+ 4e-05,
2241
+ 4e-05,
2242
+ 4e-05,
2243
+ 4e-05,
2244
+ 4e-05,
2245
+ 4e-05,
2246
+ 4e-05,
2247
+ 4e-05,
2248
+ 4e-05,
2249
+ 4e-05,
2250
+ 4e-05,
2251
+ 4e-05,
2252
+ 4e-05,
2253
+ 4e-05,
2254
+ 4e-05,
2255
+ 4e-05,
2256
+ 4e-05,
2257
+ 4e-05,
2258
+ 4e-05,
2259
+ 4e-05,
2260
+ 4e-05,
2261
+ 4e-05,
2262
+ 4e-05,
2263
+ 4e-05,
2264
+ 4e-05,
2265
+ 4e-05,
2266
+ 4e-05,
2267
+ 4e-05,
2268
+ 4e-05,
2269
+ 4e-05,
2270
+ 4e-05,
2271
+ 4e-05,
2272
+ 4e-05,
2273
+ 4e-05,
2274
+ 4e-05,
2275
+ 4e-05,
2276
+ 4e-05,
2277
+ 4e-05,
2278
+ 4e-05,
2279
+ 4e-05,
2280
+ 4e-05,
2281
+ 4e-05,
2282
+ 4e-05,
2283
+ 4e-05,
2284
+ 4e-05,
2285
+ 4e-05,
2286
+ 4e-05,
2287
+ 4e-05,
2288
+ 4e-05,
2289
+ 4e-05,
2290
+ 4e-05,
2291
+ 4e-05,
2292
+ 4e-05,
2293
+ 4e-05,
2294
+ 4e-05,
2295
+ 4e-05,
2296
+ 4e-05,
2297
+ 4e-05,
2298
+ 4e-05,
2299
+ 4e-05,
2300
+ 4e-05,
2301
+ 4e-05,
2302
+ 4e-05,
2303
+ 4e-05,
2304
+ 4e-05,
2305
+ 4e-05,
2306
+ 4e-05,
2307
+ 4e-05,
2308
+ 4e-05,
2309
+ 4e-05,
2310
+ 4e-05,
2311
+ 4e-05,
2312
+ 4e-05,
2313
+ 4e-05,
2314
+ 4e-05,
2315
+ 4e-05,
2316
+ 4e-05,
2317
+ 4e-05,
2318
+ 4e-05,
2319
+ 4e-05,
2320
+ 4e-05,
2321
+ 4e-05,
2322
+ 4e-05,
2323
+ 4e-05,
2324
+ 4e-05,
2325
+ 4e-05,
2326
+ 4e-05,
2327
+ 4e-05,
2328
+ 4e-05,
2329
+ 4e-05,
2330
+ 4e-05,
2331
+ 4e-05,
2332
+ 4e-05,
2333
+ 4e-05,
2334
+ 4e-05,
2335
+ 4e-05,
2336
+ 4e-05,
2337
+ 4e-05,
2338
+ 4e-05,
2339
+ 4e-05,
2340
+ 4e-05,
2341
+ 4e-05,
2342
+ 4e-05,
2343
+ 4e-05,
2344
+ 4e-05,
2345
+ 4e-05,
2346
+ 4e-05,
2347
+ 4e-05,
2348
+ 4e-05,
2349
+ 4e-05,
2350
+ 4e-05,
2351
+ 4e-05,
2352
+ 4e-05,
2353
+ 4e-05,
2354
+ 4e-05,
2355
+ 4e-05,
2356
+ 4e-05,
2357
+ 4e-05,
2358
+ 4e-05,
2359
+ 4e-05,
2360
+ 4e-05,
2361
+ 4e-05,
2362
+ 4e-05,
2363
+ 4e-05,
2364
+ 4e-05,
2365
+ 4e-05,
2366
+ 4e-05,
2367
+ 4e-05,
2368
+ 4e-05,
2369
+ 4e-05,
2370
+ 4e-05,
2371
+ 4e-05,
2372
+ 4e-05,
2373
+ 4e-05,
2374
+ 4e-05,
2375
+ 4e-05,
2376
+ 4e-05,
2377
+ 4e-05,
2378
+ 3.992995647012267e-05,
2379
+ 3.963316185199842e-05,
2380
+ 3.933636723387416e-05,
2381
+ 3.90395726157499e-05,
2382
+ 3.874277799762565e-05,
2383
+ 3.844598337950139e-05,
2384
+ 3.814918876137713e-05,
2385
+ 3.785239414325287e-05,
2386
+ 3.7555599525128613e-05,
2387
+ 3.725880490700435e-05,
2388
+ 3.696201028888009e-05,
2389
+ 3.666521567075585e-05,
2390
+ 3.6368421052631585e-05,
2391
+ 3.607162643450732e-05,
2392
+ 3.577483181638307e-05,
2393
+ 3.547803719825881e-05,
2394
+ 3.518124258013455e-05,
2395
+ 3.4884447962010287e-05,
2396
+ 3.458765334388604e-05,
2397
+ 3.4290858725761776e-05,
2398
+ 3.399406410763751e-05,
2399
+ 3.3697269489513265e-05,
2400
+ 3.3400474871389e-05,
2401
+ 3.310368025326474e-05,
2402
+ 3.280688563514048e-05,
2403
+ 3.251009101701623e-05,
2404
+ 3.2213296398891967e-05,
2405
+ 3.191650178076771e-05,
2406
+ 3.1542540561931145e-05,
2407
+ 3.124574594380688e-05,
2408
+ 3.094895132568263e-05,
2409
+ 3.065215670755838e-05,
2410
+ 3.0355362089434113e-05,
2411
+ 3.0058567471309854e-05,
2412
+ 2.97617728531856e-05,
2413
+ 2.9464978235061336e-05,
2414
+ 2.9168183616937077e-05,
2415
+ 2.8871388998812818e-05,
2416
+ 2.857459438068857e-05,
2417
+ 2.8277799762564307e-05,
2418
+ 2.798100514444005e-05,
2419
+ 2.7684210526315793e-05,
2420
+ 2.738741590819153e-05,
2421
+ 2.709062129006727e-05,
2422
+ 2.6793826671943013e-05,
2423
+ 2.6497032053818764e-05,
2424
+ 2.62002374356945e-05,
2425
+ 2.5903442817570243e-05,
2426
+ 2.5606648199445987e-05,
2427
+ 2.5309853581321725e-05,
2428
+ 2.5013058963197466e-05,
2429
+ 2.4716264345073214e-05,
2430
+ 2.441946972694896e-05,
2431
+ 2.4122675108824693e-05,
2432
+ 2.3825880490700434e-05,
2433
+ 2.352908587257618e-05,
2434
+ 2.3232291254451916e-05,
2435
+ 2.293549663632766e-05,
2436
+ 2.2638702018203408e-05,
2437
+ 2.226474079936684e-05,
2438
+ 2.196794618124258e-05,
2439
+ 2.1671151563118328e-05,
2440
+ 2.1374356944994066e-05,
2441
+ 2.1077562326869803e-05,
2442
+ 2.0780767708745554e-05,
2443
+ 2.0483973090621296e-05,
2444
+ 2.018717847249703e-05,
2445
+ 1.989038385437277e-05,
2446
+ 1.959358923624852e-05,
2447
+ 1.929679461812426e-05,
2448
+ 1.8999999999999998e-05,
2449
+ 1.8703205381875746e-05,
2450
+ 1.8406410763751487e-05,
2451
+ 1.8109616145627224e-05,
2452
+ 1.7812821527502965e-05,
2453
+ 1.7516026909378713e-05,
2454
+ 1.7219232291254454e-05,
2455
+ 1.6922437673130192e-05,
2456
+ 1.662564305500594e-05,
2457
+ 1.632884843688168e-05,
2458
+ 1.603205381875742e-05,
2459
+ 1.573525920063316e-05,
2460
+ 1.5438464582508908e-05,
2461
+ 1.5141669964384647e-05,
2462
+ 1.4844875346260385e-05,
2463
+ 1.4548080728136134e-05,
2464
+ 1.4251286110011875e-05,
2465
+ 1.3954491491887611e-05,
2466
+ 1.3657696873763363e-05,
2467
+ 1.33609022556391e-05,
2468
+ 1.298694103680253e-05,
2469
+ 1.2690146418678277e-05,
2470
+ 1.2393351800554018e-05,
2471
+ 1.2096557182429756e-05,
2472
+ 1.1799762564305506e-05,
2473
+ 1.1502967946181245e-05,
2474
+ 1.1206173328056984e-05,
2475
+ 1.0909378709932724e-05,
2476
+ 1.0612584091808472e-05,
2477
+ 1.0315789473684213e-05,
2478
+ 1.0018994855559949e-05,
2479
+ 9.7222002374357e-06,
2480
+ 9.425405619311438e-06,
2481
+ 9.128611001187177e-06,
2482
+ 8.831816383062916e-06,
2483
+ 8.535021764938666e-06,
2484
+ 8.238227146814405e-06,
2485
+ 7.941432528690143e-06,
2486
+ 7.644637910565893e-06,
2487
+ 7.347843292441632e-06,
2488
+ 7.0510486743173715e-06,
2489
+ 6.75425405619311e-06,
2490
+ 6.45745943806886e-06,
2491
+ 6.160664819944598e-06,
2492
+ 5.8638702018203375e-06,
2493
+ 5.567075583696086e-06,
2494
+ 5.270280965571826e-06,
2495
+ 4.973486347447565e-06,
2496
+ 4.676691729323314e-06,
2497
+ 4.379897111199053e-06,
2498
+ 4.083102493074792e-06
2499
+ ],
2500
+ "emb_lr": [],
2501
+ "eval_step": [
2502
+ 1550,
2503
+ 3113,
2504
+ 4676,
2505
+ 6239,
2506
+ 7802,
2507
+ 9365,
2508
+ 10928,
2509
+ 12491,
2510
+ 14054,
2511
+ 15617
2512
+ ],
2513
+ "eval_accuracy": [
2514
+ 0.0,
2515
+ 0.0,
2516
+ 0.0,
2517
+ 0.0,
2518
+ 0.0,
2519
+ 0.0,
2520
+ 0.0,
2521
+ 0.0,
2522
+ 0.0,
2523
+ 0.0
2524
+ ]
2525
+ },
2526
+ "final_accuracy": 1.0,
2527
+ "sft_eval": {
2528
+ "config": {
2529
+ "ops": "add_sub",
2530
+ "K": null,
2531
+ "mode": "sft",
2532
+ "n_digits": 6,
2533
+ "n_per_split": 100
2534
+ },
2535
+ "splits": {
2536
+ "add_S0": {
2537
+ "full_accuracy": 1.0,
2538
+ "n_examples": 100,
2539
+ "per_subtask": {
2540
+ "SA": {
2541
+ "accuracy": 1.0,
2542
+ "count": 605
2543
+ },
2544
+ "SS": {
2545
+ "accuracy": 1.0,
2546
+ "count": 95
2547
+ }
2548
+ }
2549
+ },
2550
+ "add_S1": {
2551
+ "full_accuracy": 1.0,
2552
+ "n_examples": 100,
2553
+ "per_subtask": {
2554
+ "SA": {
2555
+ "accuracy": 1.0,
2556
+ "count": 204
2557
+ },
2558
+ "SC": {
2559
+ "accuracy": 1.0,
2560
+ "count": 169
2561
+ },
2562
+ "SS": {
2563
+ "accuracy": 1.0,
2564
+ "count": 31
2565
+ },
2566
+ "UC": {
2567
+ "accuracy": 1.0,
2568
+ "count": 296
2569
+ }
2570
+ }
2571
+ },
2572
+ "add_S2": {
2573
+ "full_accuracy": 1.0,
2574
+ "n_examples": 100,
2575
+ "per_subtask": {
2576
+ "SA": {
2577
+ "accuracy": 1.0,
2578
+ "count": 163
2579
+ },
2580
+ "SC": {
2581
+ "accuracy": 1.0,
2582
+ "count": 130
2583
+ },
2584
+ "SS": {
2585
+ "accuracy": 1.0,
2586
+ "count": 87
2587
+ },
2588
+ "UC": {
2589
+ "accuracy": 1.0,
2590
+ "count": 203
2591
+ },
2592
+ "US": {
2593
+ "accuracy": 1.0,
2594
+ "count": 117
2595
+ }
2596
+ }
2597
+ },
2598
+ "add_S3": {
2599
+ "full_accuracy": 1.0,
2600
+ "n_examples": 100,
2601
+ "per_subtask": {
2602
+ "SA": {
2603
+ "accuracy": 1.0,
2604
+ "count": 121
2605
+ },
2606
+ "SC": {
2607
+ "accuracy": 1.0,
2608
+ "count": 121
2609
+ },
2610
+ "SS": {
2611
+ "accuracy": 1.0,
2612
+ "count": 49
2613
+ },
2614
+ "UC": {
2615
+ "accuracy": 1.0,
2616
+ "count": 186
2617
+ },
2618
+ "US": {
2619
+ "accuracy": 1.0,
2620
+ "count": 223
2621
+ }
2622
+ }
2623
+ },
2624
+ "add_S4": {
2625
+ "full_accuracy": 1.0,
2626
+ "n_examples": 100,
2627
+ "per_subtask": {
2628
+ "SA": {
2629
+ "accuracy": 1.0,
2630
+ "count": 104
2631
+ },
2632
+ "SC": {
2633
+ "accuracy": 1.0,
2634
+ "count": 106
2635
+ },
2636
+ "SS": {
2637
+ "accuracy": 1.0,
2638
+ "count": 23
2639
+ },
2640
+ "UC": {
2641
+ "accuracy": 1.0,
2642
+ "count": 160
2643
+ },
2644
+ "US": {
2645
+ "accuracy": 1.0,
2646
+ "count": 307
2647
+ }
2648
+ }
2649
+ },
2650
+ "add_S5": {
2651
+ "full_accuracy": 1.0,
2652
+ "n_examples": 100,
2653
+ "per_subtask": {
2654
+ "SA": {
2655
+ "accuracy": 1.0,
2656
+ "count": 100
2657
+ },
2658
+ "SC": {
2659
+ "accuracy": 1.0,
2660
+ "count": 100
2661
+ },
2662
+ "UC": {
2663
+ "accuracy": 1.0,
2664
+ "count": 100
2665
+ },
2666
+ "US": {
2667
+ "accuracy": 1.0,
2668
+ "count": 400
2669
+ }
2670
+ }
2671
+ },
2672
+ "add_S6": {
2673
+ "full_accuracy": 1.0,
2674
+ "n_examples": 100,
2675
+ "per_subtask": {
2676
+ "SC": {
2677
+ "accuracy": 1.0,
2678
+ "count": 100
2679
+ },
2680
+ "UC": {
2681
+ "accuracy": 1.0,
2682
+ "count": 100
2683
+ },
2684
+ "US": {
2685
+ "accuracy": 1.0,
2686
+ "count": 500
2687
+ }
2688
+ }
2689
+ },
2690
+ "add_random": {
2691
+ "full_accuracy": 1.0,
2692
+ "n_examples": 200,
2693
+ "per_subtask": {
2694
+ "SA": {
2695
+ "accuracy": 1.0,
2696
+ "count": 447
2697
+ },
2698
+ "SC": {
2699
+ "accuracy": 1.0,
2700
+ "count": 320
2701
+ },
2702
+ "SS": {
2703
+ "accuracy": 1.0,
2704
+ "count": 56
2705
+ },
2706
+ "UC": {
2707
+ "accuracy": 1.0,
2708
+ "count": 529
2709
+ },
2710
+ "US": {
2711
+ "accuracy": 1.0,
2712
+ "count": 48
2713
+ }
2714
+ }
2715
+ },
2716
+ "add_C3": {
2717
+ "full_accuracy": 1.0,
2718
+ "n_examples": 100,
2719
+ "per_subtask": {
2720
+ "SA": {
2721
+ "accuracy": 1.0,
2722
+ "count": 300
2723
+ },
2724
+ "SC": {
2725
+ "accuracy": 1.0,
2726
+ "count": 100
2727
+ },
2728
+ "UC": {
2729
+ "accuracy": 1.0,
2730
+ "count": 193
2731
+ },
2732
+ "US": {
2733
+ "accuracy": 1.0,
2734
+ "count": 107
2735
+ }
2736
+ }
2737
+ },
2738
+ "add_C4": {
2739
+ "full_accuracy": 1.0,
2740
+ "n_examples": 100,
2741
+ "per_subtask": {
2742
+ "SA": {
2743
+ "accuracy": 1.0,
2744
+ "count": 200
2745
+ },
2746
+ "SC": {
2747
+ "accuracy": 1.0,
2748
+ "count": 100
2749
+ },
2750
+ "UC": {
2751
+ "accuracy": 1.0,
2752
+ "count": 256
2753
+ },
2754
+ "US": {
2755
+ "accuracy": 1.0,
2756
+ "count": 144
2757
+ }
2758
+ }
2759
+ },
2760
+ "add_C5": {
2761
+ "full_accuracy": 1.0,
2762
+ "n_examples": 100,
2763
+ "per_subtask": {
2764
+ "SA": {
2765
+ "accuracy": 1.0,
2766
+ "count": 100
2767
+ },
2768
+ "SC": {
2769
+ "accuracy": 1.0,
2770
+ "count": 100
2771
+ },
2772
+ "UC": {
2773
+ "accuracy": 1.0,
2774
+ "count": 306
2775
+ },
2776
+ "US": {
2777
+ "accuracy": 1.0,
2778
+ "count": 194
2779
+ }
2780
+ }
2781
+ },
2782
+ "add_C6": {
2783
+ "full_accuracy": 1.0,
2784
+ "n_examples": 100,
2785
+ "per_subtask": {
2786
+ "SC": {
2787
+ "accuracy": 1.0,
2788
+ "count": 100
2789
+ },
2790
+ "UC": {
2791
+ "accuracy": 1.0,
2792
+ "count": 366
2793
+ },
2794
+ "US": {
2795
+ "accuracy": 1.0,
2796
+ "count": 234
2797
+ }
2798
+ }
2799
+ },
2800
+ "sub_M0": {
2801
+ "full_accuracy": 1.0,
2802
+ "n_examples": 100,
2803
+ "per_subtask": {
2804
+ "MD": {
2805
+ "accuracy": 1.0,
2806
+ "count": 601
2807
+ },
2808
+ "ME": {
2809
+ "accuracy": 1.0,
2810
+ "count": 99
2811
+ }
2812
+ }
2813
+ },
2814
+ "sub_M1": {
2815
+ "full_accuracy": 1.0,
2816
+ "n_examples": 100,
2817
+ "per_subtask": {
2818
+ "MD": {
2819
+ "accuracy": 1.0,
2820
+ "count": 279
2821
+ },
2822
+ "MB": {
2823
+ "accuracy": 1.0,
2824
+ "count": 145
2825
+ },
2826
+ "ME": {
2827
+ "accuracy": 1.0,
2828
+ "count": 24
2829
+ },
2830
+ "UB": {
2831
+ "accuracy": 1.0,
2832
+ "count": 252
2833
+ }
2834
+ }
2835
+ },
2836
+ "sub_M2": {
2837
+ "full_accuracy": 1.0,
2838
+ "n_examples": 100,
2839
+ "per_subtask": {
2840
+ "MD": {
2841
+ "accuracy": 1.0,
2842
+ "count": 213
2843
+ },
2844
+ "MB": {
2845
+ "accuracy": 1.0,
2846
+ "count": 113
2847
+ },
2848
+ "ME": {
2849
+ "accuracy": 1.0,
2850
+ "count": 85
2851
+ },
2852
+ "UB": {
2853
+ "accuracy": 1.0,
2854
+ "count": 181
2855
+ },
2856
+ "UD": {
2857
+ "accuracy": 1.0,
2858
+ "count": 108
2859
+ }
2860
+ }
2861
+ },
2862
+ "sub_M3": {
2863
+ "full_accuracy": 1.0,
2864
+ "n_examples": 100,
2865
+ "per_subtask": {
2866
+ "MD": {
2867
+ "accuracy": 1.0,
2868
+ "count": 179
2869
+ },
2870
+ "MB": {
2871
+ "accuracy": 1.0,
2872
+ "count": 103
2873
+ },
2874
+ "ME": {
2875
+ "accuracy": 1.0,
2876
+ "count": 56
2877
+ },
2878
+ "UB": {
2879
+ "accuracy": 1.0,
2880
+ "count": 149
2881
+ },
2882
+ "UD": {
2883
+ "accuracy": 1.0,
2884
+ "count": 213
2885
+ }
2886
+ }
2887
+ },
2888
+ "sub_M4": {
2889
+ "full_accuracy": 1.0,
2890
+ "n_examples": 100,
2891
+ "per_subtask": {
2892
+ "MD": {
2893
+ "accuracy": 1.0,
2894
+ "count": 200
2895
+ },
2896
+ "MB": {
2897
+ "accuracy": 1.0,
2898
+ "count": 100
2899
+ },
2900
+ "UB": {
2901
+ "accuracy": 1.0,
2902
+ "count": 100
2903
+ },
2904
+ "UD": {
2905
+ "accuracy": 1.0,
2906
+ "count": 300
2907
+ }
2908
+ }
2909
+ },
2910
+ "sub_M5": {
2911
+ "full_accuracy": 1.0,
2912
+ "n_examples": 100,
2913
+ "per_subtask": {
2914
+ "MD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 100
2917
+ },
2918
+ "MB": {
2919
+ "accuracy": 1.0,
2920
+ "count": 100
2921
+ },
2922
+ "UB": {
2923
+ "accuracy": 1.0,
2924
+ "count": 100
2925
+ },
2926
+ "UD": {
2927
+ "accuracy": 1.0,
2928
+ "count": 400
2929
+ }
2930
+ }
2931
+ },
2932
+ "sub_random": {
2933
+ "full_accuracy": 1.0,
2934
+ "n_examples": 200,
2935
+ "per_subtask": {
2936
+ "MD": {
2937
+ "accuracy": 1.0,
2938
+ "count": 600
2939
+ },
2940
+ "MB": {
2941
+ "accuracy": 1.0,
2942
+ "count": 267
2943
+ },
2944
+ "ME": {
2945
+ "accuracy": 1.0,
2946
+ "count": 53
2947
+ },
2948
+ "UB": {
2949
+ "accuracy": 1.0,
2950
+ "count": 439
2951
+ },
2952
+ "UD": {
2953
+ "accuracy": 1.0,
2954
+ "count": 41
2955
+ }
2956
+ }
2957
+ },
2958
+ "sub_B3": {
2959
+ "full_accuracy": 1.0,
2960
+ "n_examples": 100,
2961
+ "per_subtask": {
2962
+ "MD": {
2963
+ "accuracy": 1.0,
2964
+ "count": 300
2965
+ },
2966
+ "MB": {
2967
+ "accuracy": 1.0,
2968
+ "count": 100
2969
+ },
2970
+ "UB": {
2971
+ "accuracy": 1.0,
2972
+ "count": 197
2973
+ },
2974
+ "UD": {
2975
+ "accuracy": 1.0,
2976
+ "count": 103
2977
+ }
2978
+ }
2979
+ },
2980
+ "sub_B4": {
2981
+ "full_accuracy": 1.0,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "MD": {
2985
+ "accuracy": 1.0,
2986
+ "count": 200
2987
+ },
2988
+ "MB": {
2989
+ "accuracy": 1.0,
2990
+ "count": 100
2991
+ },
2992
+ "UB": {
2993
+ "accuracy": 1.0,
2994
+ "count": 247
2995
+ },
2996
+ "UD": {
2997
+ "accuracy": 1.0,
2998
+ "count": 153
2999
+ }
3000
+ }
3001
+ },
3002
+ "sub_B5": {
3003
+ "full_accuracy": 1.0,
3004
+ "n_examples": 100,
3005
+ "per_subtask": {
3006
+ "MD": {
3007
+ "accuracy": 1.0,
3008
+ "count": 100
3009
+ },
3010
+ "MB": {
3011
+ "accuracy": 1.0,
3012
+ "count": 100
3013
+ },
3014
+ "UB": {
3015
+ "accuracy": 1.0,
3016
+ "count": 298
3017
+ },
3018
+ "UD": {
3019
+ "accuracy": 1.0,
3020
+ "count": 202
3021
+ }
3022
+ }
3023
+ }
3024
+ },
3025
+ "summary": {
3026
+ "overall_accuracy": 1.0,
3027
+ "total_examples": 2400,
3028
+ "n_splits": 22
3029
+ }
3030
+ },
3031
+ "sorl_eval": {
3032
+ "config": {
3033
+ "ops": "add_sub",
3034
+ "K": 1,
3035
+ "mode": "sorl",
3036
+ "n_digits": 6,
3037
+ "n_per_split": 100
3038
+ },
3039
+ "splits": {
3040
+ "add_S0": {
3041
+ "full_accuracy": 1.0,
3042
+ "n_examples": 100,
3043
+ "per_subtask": {
3044
+ "SA": {
3045
+ "accuracy": 1.0,
3046
+ "count": 605
3047
+ },
3048
+ "SS": {
3049
+ "accuracy": 1.0,
3050
+ "count": 95
3051
+ }
3052
+ }
3053
+ },
3054
+ "add_S1": {
3055
+ "full_accuracy": 1.0,
3056
+ "n_examples": 100,
3057
+ "per_subtask": {
3058
+ "SA": {
3059
+ "accuracy": 1.0,
3060
+ "count": 204
3061
+ },
3062
+ "SC": {
3063
+ "accuracy": 1.0,
3064
+ "count": 169
3065
+ },
3066
+ "SS": {
3067
+ "accuracy": 1.0,
3068
+ "count": 31
3069
+ },
3070
+ "UC": {
3071
+ "accuracy": 1.0,
3072
+ "count": 296
3073
+ }
3074
+ }
3075
+ },
3076
+ "add_S2": {
3077
+ "full_accuracy": 1.0,
3078
+ "n_examples": 100,
3079
+ "per_subtask": {
3080
+ "SA": {
3081
+ "accuracy": 1.0,
3082
+ "count": 163
3083
+ },
3084
+ "SC": {
3085
+ "accuracy": 1.0,
3086
+ "count": 130
3087
+ },
3088
+ "SS": {
3089
+ "accuracy": 1.0,
3090
+ "count": 87
3091
+ },
3092
+ "UC": {
3093
+ "accuracy": 1.0,
3094
+ "count": 203
3095
+ },
3096
+ "US": {
3097
+ "accuracy": 1.0,
3098
+ "count": 117
3099
+ }
3100
+ }
3101
+ },
3102
+ "add_S3": {
3103
+ "full_accuracy": 1.0,
3104
+ "n_examples": 100,
3105
+ "per_subtask": {
3106
+ "SA": {
3107
+ "accuracy": 1.0,
3108
+ "count": 121
3109
+ },
3110
+ "SC": {
3111
+ "accuracy": 1.0,
3112
+ "count": 121
3113
+ },
3114
+ "SS": {
3115
+ "accuracy": 1.0,
3116
+ "count": 49
3117
+ },
3118
+ "UC": {
3119
+ "accuracy": 1.0,
3120
+ "count": 186
3121
+ },
3122
+ "US": {
3123
+ "accuracy": 1.0,
3124
+ "count": 223
3125
+ }
3126
+ }
3127
+ },
3128
+ "add_S4": {
3129
+ "full_accuracy": 1.0,
3130
+ "n_examples": 100,
3131
+ "per_subtask": {
3132
+ "SA": {
3133
+ "accuracy": 1.0,
3134
+ "count": 104
3135
+ },
3136
+ "SC": {
3137
+ "accuracy": 1.0,
3138
+ "count": 106
3139
+ },
3140
+ "SS": {
3141
+ "accuracy": 1.0,
3142
+ "count": 23
3143
+ },
3144
+ "UC": {
3145
+ "accuracy": 1.0,
3146
+ "count": 160
3147
+ },
3148
+ "US": {
3149
+ "accuracy": 1.0,
3150
+ "count": 307
3151
+ }
3152
+ }
3153
+ },
3154
+ "add_S5": {
3155
+ "full_accuracy": 1.0,
3156
+ "n_examples": 100,
3157
+ "per_subtask": {
3158
+ "SA": {
3159
+ "accuracy": 1.0,
3160
+ "count": 100
3161
+ },
3162
+ "SC": {
3163
+ "accuracy": 1.0,
3164
+ "count": 100
3165
+ },
3166
+ "UC": {
3167
+ "accuracy": 1.0,
3168
+ "count": 100
3169
+ },
3170
+ "US": {
3171
+ "accuracy": 1.0,
3172
+ "count": 400
3173
+ }
3174
+ }
3175
+ },
3176
+ "add_S6": {
3177
+ "full_accuracy": 1.0,
3178
+ "n_examples": 100,
3179
+ "per_subtask": {
3180
+ "SC": {
3181
+ "accuracy": 1.0,
3182
+ "count": 100
3183
+ },
3184
+ "UC": {
3185
+ "accuracy": 1.0,
3186
+ "count": 100
3187
+ },
3188
+ "US": {
3189
+ "accuracy": 1.0,
3190
+ "count": 500
3191
+ }
3192
+ }
3193
+ },
3194
+ "add_random": {
3195
+ "full_accuracy": 1.0,
3196
+ "n_examples": 200,
3197
+ "per_subtask": {
3198
+ "SA": {
3199
+ "accuracy": 1.0,
3200
+ "count": 447
3201
+ },
3202
+ "SC": {
3203
+ "accuracy": 1.0,
3204
+ "count": 320
3205
+ },
3206
+ "SS": {
3207
+ "accuracy": 1.0,
3208
+ "count": 56
3209
+ },
3210
+ "UC": {
3211
+ "accuracy": 1.0,
3212
+ "count": 529
3213
+ },
3214
+ "US": {
3215
+ "accuracy": 1.0,
3216
+ "count": 48
3217
+ }
3218
+ }
3219
+ },
3220
+ "add_C3": {
3221
+ "full_accuracy": 1.0,
3222
+ "n_examples": 100,
3223
+ "per_subtask": {
3224
+ "SA": {
3225
+ "accuracy": 1.0,
3226
+ "count": 300
3227
+ },
3228
+ "SC": {
3229
+ "accuracy": 1.0,
3230
+ "count": 100
3231
+ },
3232
+ "UC": {
3233
+ "accuracy": 1.0,
3234
+ "count": 193
3235
+ },
3236
+ "US": {
3237
+ "accuracy": 1.0,
3238
+ "count": 107
3239
+ }
3240
+ }
3241
+ },
3242
+ "add_C4": {
3243
+ "full_accuracy": 1.0,
3244
+ "n_examples": 100,
3245
+ "per_subtask": {
3246
+ "SA": {
3247
+ "accuracy": 1.0,
3248
+ "count": 200
3249
+ },
3250
+ "SC": {
3251
+ "accuracy": 1.0,
3252
+ "count": 100
3253
+ },
3254
+ "UC": {
3255
+ "accuracy": 1.0,
3256
+ "count": 256
3257
+ },
3258
+ "US": {
3259
+ "accuracy": 1.0,
3260
+ "count": 144
3261
+ }
3262
+ }
3263
+ },
3264
+ "add_C5": {
3265
+ "full_accuracy": 1.0,
3266
+ "n_examples": 100,
3267
+ "per_subtask": {
3268
+ "SA": {
3269
+ "accuracy": 1.0,
3270
+ "count": 100
3271
+ },
3272
+ "SC": {
3273
+ "accuracy": 1.0,
3274
+ "count": 100
3275
+ },
3276
+ "UC": {
3277
+ "accuracy": 1.0,
3278
+ "count": 306
3279
+ },
3280
+ "US": {
3281
+ "accuracy": 1.0,
3282
+ "count": 194
3283
+ }
3284
+ }
3285
+ },
3286
+ "add_C6": {
3287
+ "full_accuracy": 1.0,
3288
+ "n_examples": 100,
3289
+ "per_subtask": {
3290
+ "SC": {
3291
+ "accuracy": 1.0,
3292
+ "count": 100
3293
+ },
3294
+ "UC": {
3295
+ "accuracy": 1.0,
3296
+ "count": 366
3297
+ },
3298
+ "US": {
3299
+ "accuracy": 1.0,
3300
+ "count": 234
3301
+ }
3302
+ }
3303
+ },
3304
+ "sub_M0": {
3305
+ "full_accuracy": 1.0,
3306
+ "n_examples": 100,
3307
+ "per_subtask": {
3308
+ "MD": {
3309
+ "accuracy": 1.0,
3310
+ "count": 601
3311
+ },
3312
+ "ME": {
3313
+ "accuracy": 1.0,
3314
+ "count": 99
3315
+ }
3316
+ }
3317
+ },
3318
+ "sub_M1": {
3319
+ "full_accuracy": 1.0,
3320
+ "n_examples": 100,
3321
+ "per_subtask": {
3322
+ "MD": {
3323
+ "accuracy": 1.0,
3324
+ "count": 279
3325
+ },
3326
+ "MB": {
3327
+ "accuracy": 1.0,
3328
+ "count": 145
3329
+ },
3330
+ "ME": {
3331
+ "accuracy": 1.0,
3332
+ "count": 24
3333
+ },
3334
+ "UB": {
3335
+ "accuracy": 1.0,
3336
+ "count": 252
3337
+ }
3338
+ }
3339
+ },
3340
+ "sub_M2": {
3341
+ "full_accuracy": 1.0,
3342
+ "n_examples": 100,
3343
+ "per_subtask": {
3344
+ "MD": {
3345
+ "accuracy": 1.0,
3346
+ "count": 213
3347
+ },
3348
+ "MB": {
3349
+ "accuracy": 1.0,
3350
+ "count": 113
3351
+ },
3352
+ "ME": {
3353
+ "accuracy": 1.0,
3354
+ "count": 85
3355
+ },
3356
+ "UB": {
3357
+ "accuracy": 1.0,
3358
+ "count": 181
3359
+ },
3360
+ "UD": {
3361
+ "accuracy": 1.0,
3362
+ "count": 108
3363
+ }
3364
+ }
3365
+ },
3366
+ "sub_M3": {
3367
+ "full_accuracy": 1.0,
3368
+ "n_examples": 100,
3369
+ "per_subtask": {
3370
+ "MD": {
3371
+ "accuracy": 1.0,
3372
+ "count": 179
3373
+ },
3374
+ "MB": {
3375
+ "accuracy": 1.0,
3376
+ "count": 103
3377
+ },
3378
+ "ME": {
3379
+ "accuracy": 1.0,
3380
+ "count": 56
3381
+ },
3382
+ "UB": {
3383
+ "accuracy": 1.0,
3384
+ "count": 149
3385
+ },
3386
+ "UD": {
3387
+ "accuracy": 1.0,
3388
+ "count": 213
3389
+ }
3390
+ }
3391
+ },
3392
+ "sub_M4": {
3393
+ "full_accuracy": 1.0,
3394
+ "n_examples": 100,
3395
+ "per_subtask": {
3396
+ "MD": {
3397
+ "accuracy": 1.0,
3398
+ "count": 200
3399
+ },
3400
+ "MB": {
3401
+ "accuracy": 1.0,
3402
+ "count": 100
3403
+ },
3404
+ "UB": {
3405
+ "accuracy": 1.0,
3406
+ "count": 100
3407
+ },
3408
+ "UD": {
3409
+ "accuracy": 1.0,
3410
+ "count": 300
3411
+ }
3412
+ }
3413
+ },
3414
+ "sub_M5": {
3415
+ "full_accuracy": 1.0,
3416
+ "n_examples": 100,
3417
+ "per_subtask": {
3418
+ "MD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 100
3421
+ },
3422
+ "MB": {
3423
+ "accuracy": 1.0,
3424
+ "count": 100
3425
+ },
3426
+ "UB": {
3427
+ "accuracy": 1.0,
3428
+ "count": 100
3429
+ },
3430
+ "UD": {
3431
+ "accuracy": 1.0,
3432
+ "count": 400
3433
+ }
3434
+ }
3435
+ },
3436
+ "sub_random": {
3437
+ "full_accuracy": 1.0,
3438
+ "n_examples": 200,
3439
+ "per_subtask": {
3440
+ "MD": {
3441
+ "accuracy": 1.0,
3442
+ "count": 600
3443
+ },
3444
+ "MB": {
3445
+ "accuracy": 1.0,
3446
+ "count": 267
3447
+ },
3448
+ "ME": {
3449
+ "accuracy": 1.0,
3450
+ "count": 53
3451
+ },
3452
+ "UB": {
3453
+ "accuracy": 1.0,
3454
+ "count": 439
3455
+ },
3456
+ "UD": {
3457
+ "accuracy": 1.0,
3458
+ "count": 41
3459
+ }
3460
+ }
3461
+ },
3462
+ "sub_B3": {
3463
+ "full_accuracy": 1.0,
3464
+ "n_examples": 100,
3465
+ "per_subtask": {
3466
+ "MD": {
3467
+ "accuracy": 1.0,
3468
+ "count": 300
3469
+ },
3470
+ "MB": {
3471
+ "accuracy": 1.0,
3472
+ "count": 100
3473
+ },
3474
+ "UB": {
3475
+ "accuracy": 1.0,
3476
+ "count": 197
3477
+ },
3478
+ "UD": {
3479
+ "accuracy": 1.0,
3480
+ "count": 103
3481
+ }
3482
+ }
3483
+ },
3484
+ "sub_B4": {
3485
+ "full_accuracy": 1.0,
3486
+ "n_examples": 100,
3487
+ "per_subtask": {
3488
+ "MD": {
3489
+ "accuracy": 1.0,
3490
+ "count": 200
3491
+ },
3492
+ "MB": {
3493
+ "accuracy": 1.0,
3494
+ "count": 100
3495
+ },
3496
+ "UB": {
3497
+ "accuracy": 1.0,
3498
+ "count": 247
3499
+ },
3500
+ "UD": {
3501
+ "accuracy": 1.0,
3502
+ "count": 153
3503
+ }
3504
+ }
3505
+ },
3506
+ "sub_B5": {
3507
+ "full_accuracy": 1.0,
3508
+ "n_examples": 100,
3509
+ "per_subtask": {
3510
+ "MD": {
3511
+ "accuracy": 1.0,
3512
+ "count": 100
3513
+ },
3514
+ "MB": {
3515
+ "accuracy": 1.0,
3516
+ "count": 100
3517
+ },
3518
+ "UB": {
3519
+ "accuracy": 1.0,
3520
+ "count": 298
3521
+ },
3522
+ "UD": {
3523
+ "accuracy": 1.0,
3524
+ "count": 202
3525
+ }
3526
+ }
3527
+ }
3528
+ },
3529
+ "summary": {
3530
+ "overall_accuracy": 1.0,
3531
+ "total_examples": 2400,
3532
+ "n_splits": 22
3533
+ }
3534
+ },
3535
+ "sorl_overall_accuracy": 1.0,
3536
+ "sft_overall_accuracy": 1.0
3537
+ }
add_sub_sorl_v1_abs50_K1_100K/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6513404626ebae6e2af5c39a4d009410b3c7f4f7513373fd35914c7a939152e0
3
+ size 650466940
add_sub_sorl_v1_abs50_K1_100K/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 1,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 4e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 10,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 1562,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs50_K1_100K",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 2,
61
+ "n_head": 3,
62
+ "n_embd": 510,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 50,
65
+ "dataset_size": 100000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 162540062,
71
+ "run_name": "add_sub_sorl_v1_abs50_K1_100K",
72
+ "git_commit": "f447da529caceac8c7d256cbb2cd185cbc50feac",
73
+ "timestamp": "2026-04-12T17:36:59.871013+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "5a6y460h",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/5a6y460h",
81
+ "final_accuracy": 1.0,
82
+ "sft_accuracy": 1.0,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }