amirali1985 commited on
Commit
75bd8ea
·
verified ·
1 Parent(s): a5e45d5

Upload add_sub_sorl_v1_abs2_100K

Browse files
add_sub_sorl_v1_abs2_100K/config.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 510,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 2040,
15
+ "layer_types": [
16
+ "full_attention",
17
+ "full_attention"
18
+ ],
19
+ "max_position_embeddings": 128,
20
+ "max_window_layers": 28,
21
+ "model_type": "qwen3",
22
+ "num_attention_heads": 3,
23
+ "num_hidden_layers": 2,
24
+ "num_key_value_heads": 3,
25
+ "pad_token_id": null,
26
+ "rms_norm_eps": 1e-06,
27
+ "rope_parameters": {
28
+ "rope_theta": 10000.0,
29
+ "rope_type": "default"
30
+ },
31
+ "sliding_window": null,
32
+ "tie_word_embeddings": false,
33
+ "transformers_version": "5.5.0",
34
+ "use_cache": true,
35
+ "use_sliding_window": false,
36
+ "vocab_size": 151646
37
+ }
add_sub_sorl_v1_abs2_100K/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs2_100K/metrics.json ADDED
@@ -0,0 +1,3537 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 800,
20
+ 850,
21
+ 900,
22
+ 950,
23
+ 1000,
24
+ 1050,
25
+ 1100,
26
+ 1150,
27
+ 1200,
28
+ 1250,
29
+ 1300,
30
+ 1350,
31
+ 1400,
32
+ 1450,
33
+ 1500,
34
+ 1550,
35
+ 1613,
36
+ 1663,
37
+ 1713,
38
+ 1763,
39
+ 1813,
40
+ 1863,
41
+ 1913,
42
+ 1963,
43
+ 2013,
44
+ 2063,
45
+ 2113,
46
+ 2163,
47
+ 2213,
48
+ 2263,
49
+ 2313,
50
+ 2363,
51
+ 2413,
52
+ 2463,
53
+ 2513,
54
+ 2563,
55
+ 2613,
56
+ 2663,
57
+ 2713,
58
+ 2763,
59
+ 2813,
60
+ 2863,
61
+ 2913,
62
+ 2963,
63
+ 3013,
64
+ 3063,
65
+ 3113,
66
+ 3176,
67
+ 3226,
68
+ 3276,
69
+ 3326,
70
+ 3376,
71
+ 3426,
72
+ 3476,
73
+ 3526,
74
+ 3576,
75
+ 3626,
76
+ 3676,
77
+ 3726,
78
+ 3776,
79
+ 3826,
80
+ 3876,
81
+ 3926,
82
+ 3976,
83
+ 4026,
84
+ 4076,
85
+ 4126,
86
+ 4176,
87
+ 4226,
88
+ 4276,
89
+ 4326,
90
+ 4376,
91
+ 4426,
92
+ 4476,
93
+ 4526,
94
+ 4576,
95
+ 4626,
96
+ 4676,
97
+ 4739,
98
+ 4789,
99
+ 4839,
100
+ 4889,
101
+ 4939,
102
+ 4989,
103
+ 5039,
104
+ 5089,
105
+ 5139,
106
+ 5189,
107
+ 5239,
108
+ 5289,
109
+ 5339,
110
+ 5389,
111
+ 5439,
112
+ 5489,
113
+ 5539,
114
+ 5589,
115
+ 5639,
116
+ 5689,
117
+ 5739,
118
+ 5789,
119
+ 5839,
120
+ 5889,
121
+ 5939,
122
+ 5989,
123
+ 6039,
124
+ 6089,
125
+ 6139,
126
+ 6189,
127
+ 6239,
128
+ 6302,
129
+ 6352,
130
+ 6402,
131
+ 6452,
132
+ 6502,
133
+ 6552,
134
+ 6602,
135
+ 6652,
136
+ 6702,
137
+ 6752,
138
+ 6802,
139
+ 6852,
140
+ 6902,
141
+ 6952,
142
+ 7002,
143
+ 7052,
144
+ 7102,
145
+ 7152,
146
+ 7202,
147
+ 7252,
148
+ 7302,
149
+ 7352,
150
+ 7402,
151
+ 7452,
152
+ 7502,
153
+ 7552,
154
+ 7602,
155
+ 7652,
156
+ 7702,
157
+ 7752,
158
+ 7802,
159
+ 7865,
160
+ 7915,
161
+ 7965,
162
+ 8015,
163
+ 8065,
164
+ 8115,
165
+ 8165,
166
+ 8215,
167
+ 8265,
168
+ 8315,
169
+ 8365,
170
+ 8415,
171
+ 8465,
172
+ 8515,
173
+ 8565,
174
+ 8615,
175
+ 8665,
176
+ 8715,
177
+ 8765,
178
+ 8815,
179
+ 8865,
180
+ 8915,
181
+ 8965,
182
+ 9015,
183
+ 9065,
184
+ 9115,
185
+ 9165,
186
+ 9215,
187
+ 9265,
188
+ 9315,
189
+ 9365,
190
+ 9428,
191
+ 9478,
192
+ 9528,
193
+ 9578,
194
+ 9628,
195
+ 9678,
196
+ 9728,
197
+ 9778,
198
+ 9828,
199
+ 9878,
200
+ 9928,
201
+ 9978,
202
+ 10028,
203
+ 10078,
204
+ 10128,
205
+ 10178,
206
+ 10228,
207
+ 10278,
208
+ 10328,
209
+ 10378,
210
+ 10428,
211
+ 10478,
212
+ 10528,
213
+ 10578,
214
+ 10628,
215
+ 10678,
216
+ 10728,
217
+ 10778,
218
+ 10828,
219
+ 10878,
220
+ 10928,
221
+ 10991,
222
+ 11041,
223
+ 11091,
224
+ 11141,
225
+ 11191,
226
+ 11241,
227
+ 11291,
228
+ 11341,
229
+ 11391,
230
+ 11441,
231
+ 11491,
232
+ 11541,
233
+ 11591,
234
+ 11641,
235
+ 11691,
236
+ 11741,
237
+ 11791,
238
+ 11841,
239
+ 11891,
240
+ 11941,
241
+ 11991,
242
+ 12041,
243
+ 12091,
244
+ 12141,
245
+ 12191,
246
+ 12241,
247
+ 12291,
248
+ 12341,
249
+ 12391,
250
+ 12441,
251
+ 12491,
252
+ 12554,
253
+ 12604,
254
+ 12654,
255
+ 12704,
256
+ 12754,
257
+ 12804,
258
+ 12854,
259
+ 12904,
260
+ 12954,
261
+ 13004,
262
+ 13054,
263
+ 13104,
264
+ 13154,
265
+ 13204,
266
+ 13254,
267
+ 13304,
268
+ 13354,
269
+ 13404,
270
+ 13454,
271
+ 13504,
272
+ 13554,
273
+ 13604,
274
+ 13654,
275
+ 13704,
276
+ 13754,
277
+ 13804,
278
+ 13854,
279
+ 13904,
280
+ 13954,
281
+ 14004,
282
+ 14054,
283
+ 14117,
284
+ 14167,
285
+ 14217,
286
+ 14267,
287
+ 14317,
288
+ 14367,
289
+ 14417,
290
+ 14467,
291
+ 14517,
292
+ 14567,
293
+ 14617,
294
+ 14667,
295
+ 14717,
296
+ 14767,
297
+ 14817,
298
+ 14867,
299
+ 14917,
300
+ 14967,
301
+ 15017,
302
+ 15067,
303
+ 15117,
304
+ 15167,
305
+ 15217,
306
+ 15267,
307
+ 15317,
308
+ 15367,
309
+ 15417,
310
+ 15467,
311
+ 15517,
312
+ 15567,
313
+ 15617
314
+ ],
315
+ "loss": [
316
+ 21.55743980407715,
317
+ 14.456762313842773,
318
+ 13.332813262939453,
319
+ 11.099372863769531,
320
+ 9.76402759552002,
321
+ 8.166985511779785,
322
+ 6.677196502685547,
323
+ 5.956841468811035,
324
+ 5.798933029174805,
325
+ 4.650259494781494,
326
+ 4.677316665649414,
327
+ 4.337405204772949,
328
+ 4.556812286376953,
329
+ 4.077780723571777,
330
+ 3.8547043800354004,
331
+ 2.160536050796509,
332
+ 0.08490012586116791,
333
+ -0.15047906339168549,
334
+ 0.34938758611679077,
335
+ -0.07935617864131927,
336
+ -0.062447674572467804,
337
+ -0.04229782521724701,
338
+ 0.23106995224952698,
339
+ 0.14142271876335144,
340
+ 0.2878555953502655,
341
+ -0.8651682734489441,
342
+ -1.5847699642181396,
343
+ -2.3202571868896484,
344
+ -3.3132762908935547,
345
+ -3.8882954120635986,
346
+ -4.961565017700195,
347
+ -5.984193325042725,
348
+ -6.995052814483643,
349
+ -8.3079195022583,
350
+ -9.01822280883789,
351
+ -9.272224426269531,
352
+ -9.959793090820312,
353
+ -9.428740501403809,
354
+ -10.53104019165039,
355
+ -9.90003776550293,
356
+ -10.468411445617676,
357
+ -10.950371742248535,
358
+ -11.26554012298584,
359
+ -11.296932220458984,
360
+ -11.408262252807617,
361
+ -12.537223815917969,
362
+ -12.446996688842773,
363
+ -12.266963958740234,
364
+ -12.521815299987793,
365
+ -12.351020812988281,
366
+ -12.981197357177734,
367
+ -13.050939559936523,
368
+ -12.874207496643066,
369
+ -13.596314430236816,
370
+ -13.118048667907715,
371
+ -12.82033920288086,
372
+ -12.900100708007812,
373
+ -13.404964447021484,
374
+ -13.971785545349121,
375
+ -14.11911392211914,
376
+ -13.840298652648926,
377
+ -13.950313568115234,
378
+ -13.34890365600586,
379
+ -14.914931297302246,
380
+ -14.512497901916504,
381
+ -13.609143257141113,
382
+ -13.685526847839355,
383
+ -13.983019828796387,
384
+ -14.2177095413208,
385
+ -13.94830322265625,
386
+ -14.049311637878418,
387
+ -13.777447700500488,
388
+ -14.062230110168457,
389
+ -14.017431259155273,
390
+ -13.942742347717285,
391
+ -14.194819450378418,
392
+ -14.288540840148926,
393
+ -13.903726577758789,
394
+ -13.793651580810547,
395
+ -14.276308059692383,
396
+ -14.7862548828125,
397
+ -13.599206924438477,
398
+ -13.381665229797363,
399
+ -13.555388450622559,
400
+ -14.167590141296387,
401
+ -13.62869930267334,
402
+ -13.118552207946777,
403
+ -12.308067321777344,
404
+ -10.674836158752441,
405
+ -8.095012664794922,
406
+ -8.552412986755371,
407
+ -6.768813133239746,
408
+ -6.4329681396484375,
409
+ -5.3595757484436035,
410
+ -5.664283752441406,
411
+ -5.1527419090271,
412
+ -4.728729724884033,
413
+ -5.28671932220459,
414
+ -4.602601051330566,
415
+ -4.507763385772705,
416
+ -3.9181900024414062,
417
+ -4.268271446228027,
418
+ -4.134187698364258,
419
+ -4.568851947784424,
420
+ -4.330838680267334,
421
+ -4.221950054168701,
422
+ -3.783834934234619,
423
+ -4.0207133293151855,
424
+ -4.3817243576049805,
425
+ -3.8077564239501953,
426
+ -3.842586040496826,
427
+ -3.489835739135742,
428
+ -4.192014217376709,
429
+ -3.756579875946045,
430
+ -3.0009307861328125,
431
+ -2.9890785217285156,
432
+ -3.1000733375549316,
433
+ -3.1378750801086426,
434
+ -4.129668712615967,
435
+ -3.153613328933716,
436
+ -3.7414538860321045,
437
+ -3.187767267227173,
438
+ -3.159456729888916,
439
+ -2.40816330909729,
440
+ -3.079115629196167,
441
+ -2.8455893993377686,
442
+ -2.674211025238037,
443
+ -2.6699635982513428,
444
+ -3.312190055847168,
445
+ -2.572709798812866,
446
+ -2.7692463397979736,
447
+ -2.3675882816314697,
448
+ -2.5942609310150146,
449
+ -2.752772808074951,
450
+ -2.179344415664673,
451
+ -2.1692566871643066,
452
+ -3.2311666011810303,
453
+ -2.5556187629699707,
454
+ -2.5724711418151855,
455
+ -2.1499860286712646,
456
+ -3.1964876651763916,
457
+ -2.218101739883423,
458
+ -2.623993158340454,
459
+ -2.063426971435547,
460
+ -2.512239456176758,
461
+ -2.2239904403686523,
462
+ -2.098299741744995,
463
+ -2.2338473796844482,
464
+ -2.2596230506896973,
465
+ -2.153071880340576,
466
+ -2.321948766708374,
467
+ -1.9581347703933716,
468
+ -2.570591449737549,
469
+ -2.1422479152679443,
470
+ -1.8671281337738037,
471
+ -1.921321153640747,
472
+ -2.3773269653320312,
473
+ -2.2209441661834717,
474
+ -1.8629577159881592,
475
+ -1.8766900300979614,
476
+ -1.7334203720092773,
477
+ -1.6970460414886475,
478
+ -1.9741642475128174,
479
+ -1.9299850463867188,
480
+ -1.70906662940979,
481
+ -1.8495261669158936,
482
+ -1.7984683513641357,
483
+ -1.5267865657806396,
484
+ -1.6772974729537964,
485
+ -1.6340644359588623,
486
+ -3.483680486679077,
487
+ -1.6918689012527466,
488
+ -1.8547474145889282,
489
+ -1.629125952720642,
490
+ -1.6546547412872314,
491
+ -1.189652919769287,
492
+ -1.7392150163650513,
493
+ -1.6066049337387085,
494
+ -2.0829155445098877,
495
+ -1.5005329847335815,
496
+ -1.697817325592041,
497
+ -2.0126705169677734,
498
+ -1.7649344205856323,
499
+ -1.6129711866378784,
500
+ -2.1282825469970703,
501
+ -1.4418532848358154,
502
+ -1.6184873580932617,
503
+ -1.1675630807876587,
504
+ -1.8687047958374023,
505
+ -1.6724880933761597,
506
+ -2.17988920211792,
507
+ -1.3837471008300781,
508
+ -1.1479820013046265,
509
+ -1.249972939491272,
510
+ -1.8096187114715576,
511
+ -1.4028083086013794,
512
+ -1.5338959693908691,
513
+ -1.2512074708938599,
514
+ -1.3164658546447754,
515
+ -0.9766436219215393,
516
+ -1.290589690208435,
517
+ -1.2838385105133057,
518
+ -1.1990852355957031,
519
+ -1.4214012622833252,
520
+ -1.2117725610733032,
521
+ -1.4734677076339722,
522
+ -0.77535080909729,
523
+ -1.0201669931411743,
524
+ -1.6018017530441284,
525
+ -1.133147120475769,
526
+ -1.1521793603897095,
527
+ -0.9268485903739929,
528
+ -0.9853177070617676,
529
+ -1.1100549697875977,
530
+ -1.2448731660842896,
531
+ -1.3782854080200195,
532
+ -1.0712212324142456,
533
+ -0.8957306742668152,
534
+ -1.0588748455047607,
535
+ -0.7864165902137756,
536
+ -0.7465080618858337,
537
+ -0.9283392429351807,
538
+ -0.7342801094055176,
539
+ -1.0154541730880737,
540
+ -0.9934065341949463,
541
+ -1.2512985467910767,
542
+ -0.9935685396194458,
543
+ -1.2980875968933105,
544
+ -1.1094932556152344,
545
+ -1.0540815591812134,
546
+ -0.7584136724472046,
547
+ -0.8151233792304993,
548
+ -0.8131420016288757,
549
+ -0.9537174701690674,
550
+ -0.8363350033760071,
551
+ -1.402547836303711,
552
+ -0.8352566957473755,
553
+ -0.8664710521697998,
554
+ -1.0080583095550537,
555
+ -0.7523218393325806,
556
+ -1.4662609100341797,
557
+ -0.9632124304771423,
558
+ -1.0357917547225952,
559
+ -0.8007121682167053,
560
+ -0.8814998269081116,
561
+ -0.8099896311759949,
562
+ -0.7689655423164368,
563
+ -0.6990557312965393,
564
+ -0.6981830596923828,
565
+ -0.5704962611198425,
566
+ -0.5685226321220398,
567
+ -0.47645679116249084,
568
+ -0.7991287112236023,
569
+ -0.4307916760444641,
570
+ -0.2727436423301697,
571
+ -0.5455629229545593,
572
+ -0.3937355875968933,
573
+ -0.334403932094574,
574
+ -0.5208835601806641,
575
+ -0.42717838287353516,
576
+ -0.39090976119041443,
577
+ -0.4524388015270233,
578
+ -0.4628322422504425,
579
+ -0.4377143979072571,
580
+ -0.34418362379074097,
581
+ -0.421299546957016,
582
+ -0.43138304352760315,
583
+ -0.39728233218193054,
584
+ -0.3580074608325958,
585
+ -0.22887344658374786,
586
+ -0.25300633907318115,
587
+ -0.205618754029274,
588
+ -0.3025527000427246,
589
+ -0.2220858335494995,
590
+ -0.2500958740711212,
591
+ -0.3251419961452484,
592
+ -0.25898948311805725,
593
+ -0.2661969065666199,
594
+ -0.18099558353424072,
595
+ -0.3117075562477112,
596
+ -0.24770574271678925,
597
+ -0.26206326484680176,
598
+ -0.3404958248138428,
599
+ -0.22024191915988922,
600
+ -0.18646451830863953,
601
+ -0.2535249888896942,
602
+ -0.20417502522468567,
603
+ -0.2095787525177002,
604
+ -0.259319931268692,
605
+ -0.41926753520965576,
606
+ -0.23228217661380768,
607
+ -0.19904252886772156,
608
+ -0.14680063724517822,
609
+ -0.1614488959312439,
610
+ -0.14487634599208832,
611
+ -0.2808101773262024,
612
+ -0.18040938675403595,
613
+ -0.14410051703453064,
614
+ -0.049752090126276016,
615
+ -0.10657652467489243,
616
+ -0.05924094840884209,
617
+ -0.10887810587882996,
618
+ -0.2908860146999359,
619
+ -0.0975363627076149,
620
+ -0.17220471799373627,
621
+ -0.15736867487430573,
622
+ -0.1087040826678276,
623
+ -0.10741429030895233,
624
+ -0.11429610848426819,
625
+ -0.07702717185020447
626
+ ],
627
+ "base_loss": [
628
+ 10.55781364440918,
629
+ 8.231264114379883,
630
+ 7.375144958496094,
631
+ 6.467900276184082,
632
+ 5.595902442932129,
633
+ 4.134605407714844,
634
+ 2.3774359226226807,
635
+ 2.105088472366333,
636
+ 1.9189599752426147,
637
+ 1.8717594146728516,
638
+ 1.8702201843261719,
639
+ 1.8352535963058472,
640
+ 1.8482831716537476,
641
+ 1.869525671005249,
642
+ 1.8779953718185425,
643
+ 1.8948261737823486,
644
+ 1.8043323755264282,
645
+ 1.8525203466415405,
646
+ 1.8378676176071167,
647
+ 1.8408254384994507,
648
+ 1.7881041765213013,
649
+ 1.8258365392684937,
650
+ 1.8472777605056763,
651
+ 1.750261902809143,
652
+ 1.731013298034668,
653
+ 1.708060383796692,
654
+ 1.7264175415039062,
655
+ 1.6409509181976318,
656
+ 1.7112095355987549,
657
+ 1.7249946594238281,
658
+ 1.6471461057662964,
659
+ 1.7835009098052979,
660
+ 1.7195311784744263,
661
+ 1.7008330821990967,
662
+ 1.7077165842056274,
663
+ 1.6616802215576172,
664
+ 1.7441548109054565,
665
+ 1.7079802751541138,
666
+ 1.7124301195144653,
667
+ 1.6236799955368042,
668
+ 1.6541255712509155,
669
+ 1.6965360641479492,
670
+ 1.6469358205795288,
671
+ 1.6354162693023682,
672
+ 1.6002006530761719,
673
+ 1.710097074508667,
674
+ 1.6456886529922485,
675
+ 1.6939975023269653,
676
+ 1.632445216178894,
677
+ 1.6538705825805664,
678
+ 1.710196614265442,
679
+ 1.6665986776351929,
680
+ 1.6424137353897095,
681
+ 1.6636838912963867,
682
+ 1.6194913387298584,
683
+ 1.6220190525054932,
684
+ 1.539172887802124,
685
+ 1.6079224348068237,
686
+ 1.6561269760131836,
687
+ 1.6791114807128906,
688
+ 1.6207760572433472,
689
+ 1.6462295055389404,
690
+ 1.5754941701889038,
691
+ 1.6986427307128906,
692
+ 1.660187005996704,
693
+ 1.5879908800125122,
694
+ 1.5971603393554688,
695
+ 1.595866322517395,
696
+ 1.620086908340454,
697
+ 1.577508568763733,
698
+ 1.5957127809524536,
699
+ 1.5771719217300415,
700
+ 1.5998361110687256,
701
+ 1.585344672203064,
702
+ 1.5755517482757568,
703
+ 1.592895746231079,
704
+ 1.606165885925293,
705
+ 1.58901047706604,
706
+ 1.5569877624511719,
707
+ 1.6083017587661743,
708
+ 1.6573187112808228,
709
+ 1.529327630996704,
710
+ 1.5545157194137573,
711
+ 1.5298712253570557,
712
+ 1.5886039733886719,
713
+ 1.5447196960449219,
714
+ 1.472448706626892,
715
+ 1.4083069562911987,
716
+ 1.1975148916244507,
717
+ 0.9487571716308594,
718
+ 0.9713836908340454,
719
+ 0.7721220254898071,
720
+ 0.7260175347328186,
721
+ 0.6046575903892517,
722
+ 0.6525946259498596,
723
+ 0.5858612060546875,
724
+ 0.5463818311691284,
725
+ 0.596659243106842,
726
+ 0.5324410200119019,
727
+ 0.5113546848297119,
728
+ 0.4467690885066986,
729
+ 0.49367403984069824,
730
+ 0.4715045392513275,
731
+ 0.5395259261131287,
732
+ 0.48863282799720764,
733
+ 0.4811270833015442,
734
+ 0.4409574866294861,
735
+ 0.46015387773513794,
736
+ 0.5071967244148254,
737
+ 0.4407365024089813,
738
+ 0.43596014380455017,
739
+ 0.3976394236087799,
740
+ 0.4789476990699768,
741
+ 0.4261191785335541,
742
+ 0.3488524854183197,
743
+ 0.3421429991722107,
744
+ 0.3513649106025696,
745
+ 0.3556698262691498,
746
+ 0.4667738378047943,
747
+ 0.357208251953125,
748
+ 0.4270372688770294,
749
+ 0.3612685203552246,
750
+ 0.36596614122390747,
751
+ 0.28447532653808594,
752
+ 0.3500048518180847,
753
+ 0.34377458691596985,
754
+ 0.3037779629230499,
755
+ 0.3040713369846344,
756
+ 0.374905526638031,
757
+ 0.2936929166316986,
758
+ 0.31861549615859985,
759
+ 0.2704242169857025,
760
+ 0.2960323691368103,
761
+ 0.31331783533096313,
762
+ 0.2655356824398041,
763
+ 0.2478264421224594,
764
+ 0.3676256537437439,
765
+ 0.2925736606121063,
766
+ 0.2932095229625702,
767
+ 0.27233609557151794,
768
+ 0.36574485898017883,
769
+ 0.25314006209373474,
770
+ 0.29876837134361267,
771
+ 0.23810824751853943,
772
+ 0.2855685353279114,
773
+ 0.2536938488483429,
774
+ 0.24312074482440948,
775
+ 0.25708886981010437,
776
+ 0.2590205669403076,
777
+ 0.24564266204833984,
778
+ 0.2646576762199402,
779
+ 0.22410044074058533,
780
+ 0.2995555102825165,
781
+ 0.24821220338344574,
782
+ 0.23046858608722687,
783
+ 0.22727033495903015,
784
+ 0.27086523175239563,
785
+ 0.2533358037471771,
786
+ 0.2169254869222641,
787
+ 0.22717027366161346,
788
+ 0.2051292210817337,
789
+ 0.1950482279062271,
790
+ 0.23457269370555878,
791
+ 0.22084100544452667,
792
+ 0.1970510482788086,
793
+ 0.21207870543003082,
794
+ 0.2063349336385727,
795
+ 0.17636503279209137,
796
+ 0.19287574291229248,
797
+ 0.18833866715431213,
798
+ 0.3938497006893158,
799
+ 0.19834022223949432,
800
+ 0.21254512667655945,
801
+ 0.1910787969827652,
802
+ 0.19024720788002014,
803
+ 0.14706312119960785,
804
+ 0.19971981644630432,
805
+ 0.18616066873073578,
806
+ 0.2377772331237793,
807
+ 0.1731453239917755,
808
+ 0.19504819810390472,
809
+ 0.2301284223794937,
810
+ 0.2027578353881836,
811
+ 0.18562926352024078,
812
+ 0.2430158108472824,
813
+ 0.1668236255645752,
814
+ 0.18670785427093506,
815
+ 0.1360914409160614,
816
+ 0.21598540246486664,
817
+ 0.19217689335346222,
818
+ 0.24856576323509216,
819
+ 0.16024446487426758,
820
+ 0.1372070610523224,
821
+ 0.15015220642089844,
822
+ 0.2074291706085205,
823
+ 0.16735093295574188,
824
+ 0.1768689900636673,
825
+ 0.14595003426074982,
826
+ 0.15265120565891266,
827
+ 0.11484047025442123,
828
+ 0.1501741111278534,
829
+ 0.14941106736660004,
830
+ 0.1398736834526062,
831
+ 0.1644693911075592,
832
+ 0.14105084538459778,
833
+ 0.17046555876731873,
834
+ 0.09274041652679443,
835
+ 0.12018904834985733,
836
+ 0.18430931866168976,
837
+ 0.13885965943336487,
838
+ 0.13433656096458435,
839
+ 0.10935930907726288,
840
+ 0.11638494580984116,
841
+ 0.1296434849500656,
842
+ 0.14469733834266663,
843
+ 0.1595931202173233,
844
+ 0.12532873451709747,
845
+ 0.10585658997297287,
846
+ 0.12406021356582642,
847
+ 0.09367185086011887,
848
+ 0.0893135592341423,
849
+ 0.10987697541713715,
850
+ 0.08813031017780304,
851
+ 0.11914919316768646,
852
+ 0.11809062957763672,
853
+ 0.14532360434532166,
854
+ 0.12125253677368164,
855
+ 0.1505296230316162,
856
+ 0.12963902950286865,
857
+ 0.12339673936367035,
858
+ 0.0905638113617897,
859
+ 0.09690284729003906,
860
+ 0.09675943851470947,
861
+ 0.11234831809997559,
862
+ 0.09925606101751328,
863
+ 0.16212299466133118,
864
+ 0.09914389997720718,
865
+ 0.10257159173488617,
866
+ 0.11831194162368774,
867
+ 0.08988779038190842,
868
+ 0.16919860243797302,
869
+ 0.11332643032073975,
870
+ 0.1219133734703064,
871
+ 0.09550021588802338,
872
+ 0.1042398065328598,
873
+ 0.09629204124212265,
874
+ 0.09185947477817535,
875
+ 0.08394961804151535,
876
+ 0.0838543176651001,
877
+ 0.06975314766168594,
878
+ 0.06948263198137283,
879
+ 0.05922183766961098,
880
+ 0.09506983309984207,
881
+ 0.054161328822374344,
882
+ 0.03661850467324257,
883
+ 0.06693246215581894,
884
+ 0.050016459077596664,
885
+ 0.044011440128088,
886
+ 0.06418493390083313,
887
+ 0.053776971995830536,
888
+ 0.04977472871541977,
889
+ 0.05943726375699043,
890
+ 0.05769496411085129,
891
+ 0.0548989363014698,
892
+ 0.044522084295749664,
893
+ 0.05372154712677002,
894
+ 0.05429927259683609,
895
+ 0.05040301755070686,
896
+ 0.04686831310391426,
897
+ 0.03171539679169655,
898
+ 0.034375984221696854,
899
+ 0.02913111075758934,
900
+ 0.03988438844680786,
901
+ 0.030962970107793808,
902
+ 0.03404800966382027,
903
+ 0.04251670092344284,
904
+ 0.03505539894104004,
905
+ 0.03583652153611183,
906
+ 0.026452062651515007,
907
+ 0.04097387567162514,
908
+ 0.033787403255701065,
909
+ 0.035386499017477036,
910
+ 0.04416670277714729,
911
+ 0.030734002590179443,
912
+ 0.026986896991729736,
913
+ 0.034428056329488754,
914
+ 0.028954336419701576,
915
+ 0.02955194003880024,
916
+ 0.03509492427110672,
917
+ 0.05284568667411804,
918
+ 0.03208259865641594,
919
+ 0.02837185375392437,
920
+ 0.022582465782761574,
921
+ 0.024208368733525276,
922
+ 0.0223563052713871,
923
+ 0.03746243566274643,
924
+ 0.026329679414629936,
925
+ 0.022274931892752647,
926
+ 0.011795973405241966,
927
+ 0.018098199740052223,
928
+ 0.012842332012951374,
929
+ 0.018380993977189064,
930
+ 0.038584090769290924,
931
+ 0.017115477472543716,
932
+ 0.025396117940545082,
933
+ 0.023746242746710777,
934
+ 0.01833145134150982,
935
+ 0.018189962953329086,
936
+ 0.018952786922454834,
937
+ 0.014812135137617588
938
+ ],
939
+ "info_loss": [
940
+ -0.23081111907958984,
941
+ -0.5864462852478027,
942
+ -0.36399364471435547,
943
+ -0.28661489486694336,
944
+ -0.17821931838989258,
945
+ -0.10320901870727539,
946
+ -0.028664588928222656,
947
+ -0.05982160568237305,
948
+ -0.052922725677490234,
949
+ -0.16179072856903076,
950
+ -0.15811514854431152,
951
+ -0.18838560581207275,
952
+ -0.16759395599365234,
953
+ -0.21485137939453125,
954
+ -0.21427619457244873,
955
+ -0.21580040454864502,
956
+ -0.20179104804992676,
957
+ -0.213822603225708,
958
+ -0.16826021671295166,
959
+ -0.2020508050918579,
960
+ -0.1943281888961792,
961
+ -0.20006966590881348,
962
+ -0.16979622840881348,
963
+ -0.1685103178024292,
964
+ -0.15185558795928955,
965
+ -0.265255331993103,
966
+ -0.33891570568084717,
967
+ -0.40550482273101807,
968
+ -0.5117264986038208,
969
+ -0.5712318420410156,
970
+ -0.6699534058570862,
971
+ -0.7878265976905823,
972
+ -0.8829475045204163,
973
+ -1.0115578174591064,
974
+ -1.083652138710022,
975
+ -1.1040446758270264,
976
+ -1.180250644683838,
977
+ -1.1229536533355713,
978
+ -1.2351194620132446,
979
+ -1.1612054109573364,
980
+ -1.2211158275604248,
981
+ -1.2747255563735962,
982
+ -1.3001933097839355,
983
+ -1.3030011653900146,
984
+ -1.310207724571228,
985
+ -1.4331682920455933,
986
+ -1.4174022674560547,
987
+ -1.4047023057937622,
988
+ -1.4245320558547974,
989
+ -1.4083890914916992,
990
+ -1.4774441719055176,
991
+ -1.4791162014007568,
992
+ -1.458984136581421,
993
+ -1.5335596799850464,
994
+ -1.4807966947555542,
995
+ -1.451379418373108,
996
+ -1.4512931108474731,
997
+ -1.5090150833129883,
998
+ -1.5702227354049683,
999
+ -1.5864689350128174,
1000
+ -1.5529896020889282,
1001
+ -1.5662482976913452,
1002
+ -1.4988164901733398,
1003
+ -1.667850136756897,
1004
+ -1.6237952709197998,
1005
+ -1.5258361101150513,
1006
+ -1.5347386598587036,
1007
+ -1.5641248226165771,
1008
+ -1.590108871459961,
1009
+ -1.5585733652114868,
1010
+ -1.5704230070114136,
1011
+ -1.5418198108673096,
1012
+ -1.5720810890197754,
1013
+ -1.5662081241607666,
1014
+ -1.5576754808425903,
1015
+ -1.5846681594848633,
1016
+ -1.5954533815383911,
1017
+ -1.5551222562789917,
1018
+ -1.5410363674163818,
1019
+ -1.5942590236663818,
1020
+ -1.6501209735870361,
1021
+ -1.5187057256698608,
1022
+ -1.4995180368423462,
1023
+ -1.514379620552063,
1024
+ -1.5813732147216797,
1025
+ -1.5231415033340454,
1026
+ -1.4648243188858032,
1027
+ -1.3773880004882812,
1028
+ -1.1932123899459839,
1029
+ -0.9102264642715454,
1030
+ -0.9582034945487976,
1031
+ -0.7599639892578125,
1032
+ -0.7217062711715698,
1033
+ -0.6021677851676941,
1034
+ -0.6374126672744751,
1035
+ -0.5795924663543701,
1036
+ -0.5332291126251221,
1037
+ -0.5940366983413696,
1038
+ -0.5192331671714783,
1039
+ -0.5076391696929932,
1040
+ -0.4421822428703308,
1041
+ -0.48185449838638306,
1042
+ -0.4663180410861969,
1043
+ -0.5165236592292786,
1044
+ -0.4875980317592621,
1045
+ -0.47597524523735046,
1046
+ -0.4281480610370636,
1047
+ -0.453742116689682,
1048
+ -0.49453476071357727,
1049
+ -0.4305174648761749,
1050
+ -0.43351098895072937,
1051
+ -0.3944139778614044,
1052
+ -0.47276315093040466,
1053
+ -0.4239259362220764,
1054
+ -0.3406214714050293,
1055
+ -0.33879050612449646,
1056
+ -0.35079655051231384,
1057
+ -0.35499829053878784,
1058
+ -0.4652974009513855,
1059
+ -0.35673290491104126,
1060
+ -0.4225170314311981,
1061
+ -0.3605479300022125,
1062
+ -0.3581975996494293,
1063
+ -0.27489882707595825,
1064
+ -0.34855759143829346,
1065
+ -0.3245709240436554,
1066
+ -0.3034340739250183,
1067
+ -0.3030414879322052,
1068
+ -0.3743423819541931,
1069
+ -0.2922758162021637,
1070
+ -0.3144170939922333,
1071
+ -0.26943954825401306,
1072
+ -0.29466721415519714,
1073
+ -0.312252938747406,
1074
+ -0.2501186728477478,
1075
+ -0.24738256633281708,
1076
+ -0.36551225185394287,
1077
+ -0.29044491052627563,
1078
+ -0.2921958565711975,
1079
+ -0.24785564839839935,
1080
+ -0.36184948682785034,
1081
+ -0.252761572599411,
1082
+ -0.29790693521499634,
1083
+ -0.23578904569149017,
1084
+ -0.28542351722717285,
1085
+ -0.25339555740356445,
1086
+ -0.23976655304431915,
1087
+ -0.2547180652618408,
1088
+ -0.25748777389526367,
1089
+ -0.24550583958625793,
1090
+ -0.26428404450416565,
1091
+ -0.22384725511074066,
1092
+ -0.29263776540756226,
1093
+ -0.2446698695421219,
1094
+ -0.2153833955526352,
1095
+ -0.22048817574977875,
1096
+ -0.2704443633556366,
1097
+ -0.25305241346359253,
1098
+ -0.21361403167247772,
1099
+ -0.21601071953773499,
1100
+ -0.19948036968708038,
1101
+ -0.1948372721672058,
1102
+ -0.22649627923965454,
1103
+ -0.22070898115634918,
1104
+ -0.19623607397079468,
1105
+ -0.2117931991815567,
1106
+ -0.2061016857624054,
1107
+ -0.17594103515148163,
1108
+ -0.19263973832130432,
1109
+ -0.18786264955997467,
1110
+ -0.393390417098999,
1111
+ -0.19464483857154846,
1112
+ -0.21235060691833496,
1113
+ -0.18764138221740723,
1114
+ -0.1901116818189621,
1115
+ -0.13929884135723114,
1116
+ -0.1995152086019516,
1117
+ -0.18489839136600494,
1118
+ -0.23769024014472961,
1119
+ -0.172989621758461,
1120
+ -0.1949077546596527,
1121
+ -0.22990308701992035,
1122
+ -0.20239092409610748,
1123
+ -0.18548186123371124,
1124
+ -0.24277549982070923,
1125
+ -0.16649411618709564,
1126
+ -0.18614347279071808,
1127
+ -0.1359878033399582,
1128
+ -0.2140895277261734,
1129
+ -0.19208790361881256,
1130
+ -0.24846652150154114,
1131
+ -0.16002069413661957,
1132
+ -0.13413934409618378,
1133
+ -0.14563290774822235,
1134
+ -0.20732542872428894,
1135
+ -0.1626378893852234,
1136
+ -0.17669813334941864,
1137
+ -0.14533713459968567,
1138
+ -0.15253326296806335,
1139
+ -0.11477691680192947,
1140
+ -0.1496976613998413,
1141
+ -0.14894747734069824,
1142
+ -0.13951662182807922,
1143
+ -0.1642075926065445,
1144
+ -0.1409120261669159,
1145
+ -0.1700175404548645,
1146
+ -0.09242932498455048,
1147
+ -0.11965568363666534,
1148
+ -0.18423114717006683,
1149
+ -0.1328209638595581,
1150
+ -0.13427221775054932,
1151
+ -0.10924125462770462,
1152
+ -0.11579099297523499,
1153
+ -0.12959317862987518,
1154
+ -0.14457730948925018,
1155
+ -0.15940792858600616,
1156
+ -0.12527652084827423,
1157
+ -0.10578018426895142,
1158
+ -0.12391418218612671,
1159
+ -0.09362959116697311,
1160
+ -0.08920267224311829,
1161
+ -0.10944169014692307,
1162
+ -0.08786164969205856,
1163
+ -0.11908160150051117,
1164
+ -0.11677320301532745,
1165
+ -0.14528240263462067,
1166
+ -0.11710207909345627,
1167
+ -0.15048231184482574,
1168
+ -0.12953327596187592,
1169
+ -0.12336805462837219,
1170
+ -0.09051825851202011,
1171
+ -0.09682397544384003,
1172
+ -0.09661003202199936,
1173
+ -0.1122264415025711,
1174
+ -0.09917972981929779,
1175
+ -0.1620868593454361,
1176
+ -0.09905996918678284,
1177
+ -0.10252546519041061,
1178
+ -0.11825735867023468,
1179
+ -0.08984114974737167,
1180
+ -0.16916626691818237,
1181
+ -0.11327371746301651,
1182
+ -0.12139031291007996,
1183
+ -0.09524128586053848,
1184
+ -0.10419416427612305,
1185
+ -0.09624885767698288,
1186
+ -0.09170279651880264,
1187
+ -0.08392082899808884,
1188
+ -0.08382471650838852,
1189
+ -0.06964603811502457,
1190
+ -0.06942091137170792,
1191
+ -0.05918891355395317,
1192
+ -0.09504035860300064,
1193
+ -0.054116759449243546,
1194
+ -0.036556001752614975,
1195
+ -0.06687008589506149,
1196
+ -0.049994878470897675,
1197
+ -0.04346111789345741,
1198
+ -0.06412678211927414,
1199
+ -0.053715310990810394,
1200
+ -0.0496886745095253,
1201
+ -0.05680719017982483,
1202
+ -0.057672612369060516,
1203
+ -0.05488137900829315,
1204
+ -0.04449116438627243,
1205
+ -0.05312187969684601,
1206
+ -0.05418844148516655,
1207
+ -0.050388071686029434,
1208
+ -0.0461072102189064,
1209
+ -0.031678467988967896,
1210
+ -0.034358035773038864,
1211
+ -0.02909480407834053,
1212
+ -0.0398634597659111,
1213
+ -0.030924513936042786,
1214
+ -0.03403429314494133,
1215
+ -0.04238564148545265,
1216
+ -0.035024289041757584,
1217
+ -0.035823091864585876,
1218
+ -0.02636440470814705,
1219
+ -0.040887799113988876,
1220
+ -0.033768974244594574,
1221
+ -0.0353645496070385,
1222
+ -0.044085800647735596,
1223
+ -0.030717631801962852,
1224
+ -0.026965029537677765,
1225
+ -0.034415047615766525,
1226
+ -0.028932679444551468,
1227
+ -0.02953263372182846,
1228
+ -0.035061128437519073,
1229
+ -0.05283093452453613,
1230
+ -0.032056089490652084,
1231
+ -0.028361082077026367,
1232
+ -0.022557955235242844,
1233
+ -0.02418987825512886,
1234
+ -0.02234337106347084,
1235
+ -0.03744680806994438,
1236
+ -0.026293661445379257,
1237
+ -0.02225743979215622,
1238
+ -0.011774775572121143,
1239
+ -0.018087247386574745,
1240
+ -0.012828130275011063,
1241
+ -0.018345512449741364,
1242
+ -0.0385664664208889,
1243
+ -0.01708495244383812,
1244
+ -0.025379735976457596,
1245
+ -0.023731086403131485,
1246
+ -0.018323229625821114,
1247
+ -0.01817993074655533,
1248
+ -0.018944548442959785,
1249
+ -0.014803697355091572
1250
+ ],
1251
+ "abs_loss": [
1252
+ 0.6956941485404968,
1253
+ 0.6403825283050537,
1254
+ 0.4830767512321472,
1255
+ 0.36317873001098633,
1256
+ 0.22355778515338898,
1257
+ 0.06646791100502014,
1258
+ 0.02232569456100464,
1259
+ 0.008802840486168861,
1260
+ 0.004403675906360149,
1261
+ 0.002795965876430273,
1262
+ 0.0021197409369051456,
1263
+ 0.0018710936419665813,
1264
+ 0.0015149149112403393,
1265
+ 0.0012303799157962203,
1266
+ 0.001454415381886065,
1267
+ 0.0016817658906802535,
1268
+ 0.005805621854960918,
1269
+ 0.008533228188753128,
1270
+ 0.009683016687631607,
1271
+ 0.008380381390452385,
1272
+ 0.010228028520941734,
1273
+ 0.00821185577660799,
1274
+ 0.0081139225512743,
1275
+ 0.008338656276464462,
1276
+ 0.007492415141314268,
1277
+ 0.0086920615285635,
1278
+ 0.009874568320810795,
1279
+ 0.01173701323568821,
1280
+ 0.011567603796720505,
1281
+ 0.014372609555721283,
1282
+ 0.014484841376543045,
1283
+ 0.015789855271577835,
1284
+ 0.018379611894488335,
1285
+ 0.02154083363711834,
1286
+ 0.02140096388757229,
1287
+ 0.019036047160625458,
1288
+ 0.03399075195193291,
1289
+ 0.01921842247247696,
1290
+ 0.021755583584308624,
1291
+ 0.02301720529794693,
1292
+ 0.020673472434282303,
1293
+ 0.02469949796795845,
1294
+ 0.028265394270420074,
1295
+ 0.03813191130757332,
1296
+ 0.032795242965221405,
1297
+ 0.02499081939458847,
1298
+ 0.02345442585647106,
1299
+ 0.017639651894569397,
1300
+ 0.01972111128270626,
1301
+ 0.02040751278400421,
1302
+ 0.02078351005911827,
1303
+ 0.02873343415558338,
1304
+ 0.023858370259404182,
1305
+ 0.024083605036139488,
1306
+ 0.01723884418606758,
1307
+ 0.012871598824858665,
1308
+ 0.01174084097146988,
1309
+ 0.02683127671480179,
1310
+ 0.019723625853657722,
1311
+ 0.01465850230306387,
1312
+ 0.01228727214038372,
1313
+ 0.012644937261939049,
1314
+ 0.008676152676343918,
1315
+ 0.0073304432444274426,
1316
+ 0.005936686880886555,
1317
+ 0.006608534604310989,
1318
+ 0.004954442847520113,
1319
+ 0.006269386038184166,
1320
+ 0.0035136525984853506,
1321
+ 0.008629296906292439,
1322
+ 0.004004452843219042,
1323
+ 0.002656985307112336,
1324
+ 0.003876788541674614,
1325
+ 0.0022140294313430786,
1326
+ 0.0027813275810331106,
1327
+ 0.0029296008870005608,
1328
+ 0.002483564196154475,
1329
+ 0.0011703572236001492,
1330
+ 0.002269966062158346,
1331
+ 0.001995225204154849,
1332
+ 0.0017770285485312343,
1333
+ 0.001401030458509922,
1334
+ 0.0013372995890676975,
1335
+ 0.0008072683122009039,
1336
+ 0.001991731347516179,
1337
+ 0.0012733193580061197,
1338
+ 0.0004471038992051035,
1339
+ 0.001032060943543911,
1340
+ 0.0025046896189451218,
1341
+ 0.00157322664745152,
1342
+ 0.0015743678668513894,
1343
+ 0.0009261806262657046,
1344
+ 0.0016998673090711236,
1345
+ 0.0012237753253430128,
1346
+ 0.0011928051244467497,
1347
+ 0.0009904535254463553,
1348
+ 0.0010454843286424875,
1349
+ 0.0010850548278540373,
1350
+ 0.0007955672917887568,
1351
+ 0.0004715621180366725,
1352
+ 0.0010601218091323972,
1353
+ 0.0005062565905973315,
1354
+ 0.0011024527484551072,
1355
+ 0.0006975189317017794,
1356
+ 0.00041120214154943824,
1357
+ 0.0005454591591842473,
1358
+ 0.00043180410284549,
1359
+ 0.00047692624502815306,
1360
+ 0.00032515102066099644,
1361
+ 0.0005417237989604473,
1362
+ 0.0003396912943571806,
1363
+ 0.0006373580545186996,
1364
+ 0.0004139956145081669,
1365
+ 0.0002848997828550637,
1366
+ 0.0002313605509698391,
1367
+ 0.0002655877615325153,
1368
+ 0.000346259301295504,
1369
+ 0.0002491240738891065,
1370
+ 0.00022521737264469266,
1371
+ 0.0004311777011025697,
1372
+ 0.0002283934154547751,
1373
+ 0.00011914936476387084,
1374
+ 0.00012467293709050864,
1375
+ 0.00017286086222156882,
1376
+ 0.00014875028864480555,
1377
+ 0.00010279472917318344,
1378
+ 0.00013618305092677474,
1379
+ 0.00016037074965424836,
1380
+ 8.233635162469e-05,
1381
+ 0.00011739895853679627,
1382
+ 0.00015547614020761102,
1383
+ 0.00017099488468375057,
1384
+ 0.00012639487977139652,
1385
+ 0.00010321970330551267,
1386
+ 9.091859101317823e-05,
1387
+ 0.00012881489237770438,
1388
+ 0.00012048651842633262,
1389
+ 0.00010087819828186184,
1390
+ 7.654543151147664e-05,
1391
+ 6.016628321958706e-05,
1392
+ 9.542417683405802e-05,
1393
+ 0.0001161744148703292,
1394
+ 9.009813948068768e-05,
1395
+ 0.0001134482808993198,
1396
+ 0.0001473266165703535,
1397
+ 6.867557385703549e-05,
1398
+ 6.132695853011683e-05,
1399
+ 4.410174005897716e-05,
1400
+ 4.993489710614085e-05,
1401
+ 5.260844773147255e-05,
1402
+ 3.442721572355367e-05,
1403
+ 5.96915851929225e-05,
1404
+ 3.4494209103286266e-05,
1405
+ 1.4586964425689075e-05,
1406
+ 3.2134674256667495e-05,
1407
+ 7.720987196080387e-05,
1408
+ 5.327590770320967e-05,
1409
+ 5.947142926743254e-05,
1410
+ 3.0571085517294705e-05,
1411
+ 3.140626722597517e-05,
1412
+ 3.9412054320564494e-05,
1413
+ 4.637734673451632e-05,
1414
+ 3.103291237493977e-05,
1415
+ 3.9987040509004146e-05,
1416
+ 7.223954162327573e-05,
1417
+ 7.384084892692044e-05,
1418
+ 1.8627084500622004e-05,
1419
+ 1.5019706552266143e-05,
1420
+ 2.026137735811062e-05,
1421
+ 2.9476159397745505e-05,
1422
+ 2.0226163542247377e-05,
1423
+ 2.787144694593735e-05,
1424
+ 1.995943057409022e-05,
1425
+ 1.4738093341293279e-05,
1426
+ 1.4859501789032947e-05,
1427
+ 0.00012163238716311753,
1428
+ 8.50914693728555e-06,
1429
+ 2.5399749574717134e-05,
1430
+ 1.3118664355715737e-05,
1431
+ 8.922604138206225e-06,
1432
+ 1.2929611330037005e-05,
1433
+ 3.2667107007000595e-05,
1434
+ 2.8868156732642092e-05,
1435
+ 2.782613955787383e-05,
1436
+ 1.045096360030584e-05,
1437
+ 1.0925508831860498e-05,
1438
+ 3.188596019754186e-05,
1439
+ 2.5854613340925425e-05,
1440
+ 7.569581612187903e-06,
1441
+ 1.5833149518584833e-05,
1442
+ 1.7612708688830025e-05,
1443
+ 1.6430862160632387e-05,
1444
+ 7.91602815297665e-06,
1445
+ 6.077641501178732e-06,
1446
+ 4.861400611844147e-06,
1447
+ 2.4933491658885032e-05,
1448
+ 3.9220751204993576e-05,
1449
+ 2.1398182070697658e-05,
1450
+ 1.5906902262941003e-05,
1451
+ 1.361541490041418e-05,
1452
+ 9.693720130599104e-06,
1453
+ 1.472571511840215e-05,
1454
+ 7.660580195079092e-06,
1455
+ 5.466765287565067e-06,
1456
+ 1.3933775335317478e-05,
1457
+ 1.1707485100487247e-05,
1458
+ 6.2591211644758005e-06,
1459
+ 3.795095381065039e-06,
1460
+ 7.233882570290007e-06,
1461
+ 7.799499144311994e-06,
1462
+ 3.169261390212341e-06,
1463
+ 5.056033842265606e-06,
1464
+ 1.7979424228542484e-05,
1465
+ 8.17397449281998e-06,
1466
+ 4.836298103327863e-06,
1467
+ 4.192570486338809e-06,
1468
+ 4.917276783089619e-06,
1469
+ 1.2816100024792831e-05,
1470
+ 6.51421032671351e-06,
1471
+ 5.48346952200518e-06,
1472
+ 4.327761871536495e-06,
1473
+ 2.0200492144795135e-05,
1474
+ 7.318658390431665e-06,
1475
+ 1.0495868082216475e-05,
1476
+ 1.3226725968706887e-05,
1477
+ 3.3489959605503827e-06,
1478
+ 3.98590782424435e-06,
1479
+ 3.988625849160599e-06,
1480
+ 3.8015793961676536e-06,
1481
+ 2.28077988140285e-06,
1482
+ 8.904497008188628e-06,
1483
+ 3.6851079130428843e-06,
1484
+ 5.232717740000226e-06,
1485
+ 3.3871547202579677e-06,
1486
+ 3.0314097330119694e-06,
1487
+ 1.3606569382318412e-06,
1488
+ 2.3692584818491014e-06,
1489
+ 6.790003681089729e-06,
1490
+ 3.873267814924475e-06,
1491
+ 4.318375431466848e-06,
1492
+ 2.1140845092304517e-06,
1493
+ 2.8637773539230693e-06,
1494
+ 2.913083790190285e-06,
1495
+ 2.412086359981913e-06,
1496
+ 2.5638828446972184e-06,
1497
+ 7.4935278462362476e-06,
1498
+ 4.210303814033978e-06,
1499
+ 2.1997677777108038e-06,
1500
+ 3.6832982459600316e-06,
1501
+ 6.044816927897045e-06,
1502
+ 1.5851035186642548e-06,
1503
+ 2.7483069970912766e-06,
1504
+ 3.7745935514976736e-06,
1505
+ 4.3389072743593715e-06,
1506
+ 2.80880317404808e-06,
1507
+ 5.580228389590047e-06,
1508
+ 5.642981705022976e-06,
1509
+ 3.0220026019378565e-06,
1510
+ 2.6318678010284202e-06,
1511
+ 2.429781488899607e-06,
1512
+ 4.930218892695848e-06,
1513
+ 2.4428300093859434e-06,
1514
+ 1.884986886580009e-06,
1515
+ 2.056345692835748e-06,
1516
+ 4.830387297261041e-06,
1517
+ 3.494228167255642e-06,
1518
+ 2.521029500712757e-06,
1519
+ 1.7527327145216987e-06,
1520
+ 3.6217859360476723e-06,
1521
+ 2.2481840460386593e-06,
1522
+ 6.567560376424808e-06,
1523
+ 2.340391802135855e-06,
1524
+ 4.115353931410937e-06,
1525
+ 1.026311906571209e-06,
1526
+ 2.5918307073879987e-06,
1527
+ 2.5536487555655185e-06,
1528
+ 3.7009060633863555e-06,
1529
+ 3.1235319966071984e-06,
1530
+ 2.0786774257430807e-06,
1531
+ 2.4688247322046664e-06,
1532
+ 2.1541113710554782e-06,
1533
+ 8.577446237723052e-07,
1534
+ 2.0712334389827447e-06,
1535
+ 3.0062208224990172e-06,
1536
+ 1.5115176665858598e-06,
1537
+ 1.4630893474532058e-06,
1538
+ 8.338574843946844e-06,
1539
+ 1.9445451471256092e-06,
1540
+ 1.1371309938112972e-06,
1541
+ 2.892598558901227e-06,
1542
+ 1.1874237770825857e-06,
1543
+ 1.3829974250256782e-06,
1544
+ 2.24999280362681e-06,
1545
+ 1.70522923781391e-06,
1546
+ 1.7257099216294591e-06,
1547
+ 2.3840793801355176e-06,
1548
+ 2.663546410985873e-06,
1549
+ 1.912902689582552e-06,
1550
+ 2.279763066326268e-06,
1551
+ 1.7657548596616834e-06,
1552
+ 2.6402431103633717e-06,
1553
+ 1.6065087038441561e-06,
1554
+ 1.0067433322547004e-06,
1555
+ 1.7247876940018614e-06,
1556
+ 1.3410799510893412e-06,
1557
+ 9.7602014648146e-07,
1558
+ 9.72294060375134e-07,
1559
+ 9.490138950241089e-07,
1560
+ 2.2453482415585313e-06,
1561
+ 1.0877777185669402e-06
1562
+ ],
1563
+ "zipf_loss": [
1564
+ 13.238167762756348,
1565
+ 12.025922775268555,
1566
+ 9.549297332763672,
1567
+ 7.461304187774658,
1568
+ 5.927962303161621,
1569
+ 5.057823181152344,
1570
+ 4.584174156188965,
1571
+ 4.449089050292969,
1572
+ 4.408760070800781,
1573
+ 4.396127700805664,
1574
+ 4.388035774230957,
1575
+ 4.385820388793945,
1576
+ 4.384317398071289,
1577
+ 4.356645584106445,
1578
+ 4.119325637817383,
1579
+ 2.4235458374023438,
1580
+ 0.29789766669273376,
1581
+ 0.13437329232692719,
1582
+ 0.19315381348133087,
1583
+ 0.09948839247226715,
1584
+ 0.09170723706483841,
1585
+ 0.13174110651016235,
1586
+ 0.08094307780265808,
1587
+ 0.07543011754751205,
1588
+ 0.07464892417192459,
1589
+ 0.07845544070005417,
1590
+ 0.07698220014572144,
1591
+ 0.09266608953475952,
1592
+ 0.09162209182977676,
1593
+ 0.09759122133255005,
1594
+ 0.08937418460845947,
1595
+ 0.10899271070957184,
1596
+ 0.11305401474237442,
1597
+ 0.10467098653316498,
1598
+ 0.10844150930643082,
1599
+ 0.10463868826627731,
1600
+ 0.09515910595655441,
1601
+ 0.09089392423629761,
1602
+ 0.105549156665802,
1603
+ 0.08603363484144211,
1604
+ 0.08655494451522827,
1605
+ 0.09787715971469879,
1606
+ 0.08663065731525421,
1607
+ 0.09385061264038086,
1608
+ 0.09033532440662384,
1609
+ 0.08186376839876175,
1610
+ 0.0789923220872879,
1611
+ 0.08429710566997528,
1612
+ 0.08908750116825104,
1613
+ 0.07695901393890381,
1614
+ 0.08096971362829208,
1615
+ 0.07075130939483643,
1616
+ 0.07083433121442795,
1617
+ 0.07319030910730362,
1618
+ 0.06870314478874207,
1619
+ 0.07014846056699753,
1620
+ 0.07248274236917496,
1621
+ 0.07458160817623138,
1622
+ 0.07234246283769608,
1623
+ 0.06499738991260529,
1624
+ 0.06759276241064072,
1625
+ 0.06467528641223907,
1626
+ 0.06289983540773392,
1627
+ 0.06419418752193451,
1628
+ 0.06467416137456894,
1629
+ 0.06056584045290947,
1630
+ 0.06420311331748962,
1631
+ 0.06173606216907501,
1632
+ 0.06294124573469162,
1633
+ 0.05905795097351074,
1634
+ 0.05880500748753548,
1635
+ 0.0633116364479065,
1636
+ 0.05835648626089096,
1637
+ 0.05908438563346863,
1638
+ 0.05818147584795952,
1639
+ 0.05867404863238335,
1640
+ 0.05957905575633049,
1641
+ 0.058368220925331116,
1642
+ 0.05949830263853073,
1643
+ 0.05778094753623009,
1644
+ 0.05745793133974075,
1645
+ 0.05838259682059288,
1646
+ 0.058865610510110855,
1647
+ 0.05845583230257034,
1648
+ 0.057338785380125046,
1649
+ 0.0578676275908947,
1650
+ 0.05719779059290886,
1651
+ 0.057402364909648895,
1652
+ 0.05952220782637596,
1653
+ 0.05833706632256508,
1654
+ 0.05808050557971001,
1655
+ 0.058612123131752014,
1656
+ 0.05790776014328003,
1657
+ 0.05732208490371704,
1658
+ 0.05712893232703209,
1659
+ 0.0572221502661705,
1660
+ 0.05707494169473648,
1661
+ 0.05687945336103439,
1662
+ 0.057209938764572144,
1663
+ 0.057226262986660004,
1664
+ 0.05675734207034111,
1665
+ 0.056549109518527985,
1666
+ 0.05737769603729248,
1667
+ 0.056788817048072815,
1668
+ 0.056468088179826736,
1669
+ 0.056620460003614426,
1670
+ 0.05664516240358353,
1671
+ 0.05650634691119194,
1672
+ 0.0563943088054657,
1673
+ 0.056627657264471054,
1674
+ 0.05652966350317001,
1675
+ 0.056600745767354965,
1676
+ 0.056628454476594925,
1677
+ 0.056531790643930435,
1678
+ 0.05640837550163269,
1679
+ 0.056657079607248306,
1680
+ 0.05649270862340927,
1681
+ 0.056413501501083374,
1682
+ 0.056508868932724,
1683
+ 0.05646416172385216,
1684
+ 0.05665615573525429,
1685
+ 0.056431449949741364,
1686
+ 0.05654072016477585,
1687
+ 0.05633200705051422,
1688
+ 0.05644070729613304,
1689
+ 0.0563349649310112,
1690
+ 0.05633821338415146,
1691
+ 0.056363750249147415,
1692
+ 0.056320011615753174,
1693
+ 0.05634379759430885,
1694
+ 0.05629381537437439,
1695
+ 0.05636588856577873,
1696
+ 0.05636616423726082,
1697
+ 0.05642855912446976,
1698
+ 0.05629773437976837,
1699
+ 0.05672983080148697,
1700
+ 0.05631798505783081,
1701
+ 0.05624647065997124,
1702
+ 0.056270141154527664,
1703
+ 0.05622841790318489,
1704
+ 0.05625290796160698,
1705
+ 0.05636227875947952,
1706
+ 0.056298837065696716,
1707
+ 0.05634373798966408,
1708
+ 0.05641256272792816,
1709
+ 0.056264478713274,
1710
+ 0.05623895302414894,
1711
+ 0.05624010041356087,
1712
+ 0.056229181587696075,
1713
+ 0.0563385933637619,
1714
+ 0.056230440735816956,
1715
+ 0.056231409311294556,
1716
+ 0.05622752383351326,
1717
+ 0.05623721703886986,
1718
+ 0.05623391270637512,
1719
+ 0.056282367557287216,
1720
+ 0.056246183812618256,
1721
+ 0.056238412857055664,
1722
+ 0.05625399947166443,
1723
+ 0.05624382942914963,
1724
+ 0.05625015124678612,
1725
+ 0.05627382919192314,
1726
+ 0.05622268468141556,
1727
+ 0.056259721517562866,
1728
+ 0.05623580515384674,
1729
+ 0.05631982907652855,
1730
+ 0.05621163919568062,
1731
+ 0.05625718832015991,
1732
+ 0.05622205510735512,
1733
+ 0.05622036010026932,
1734
+ 0.05637209489941597,
1735
+ 0.05623649060726166,
1736
+ 0.056211501359939575,
1737
+ 0.056207671761512756,
1738
+ 0.05621355026960373,
1739
+ 0.05626016855239868,
1740
+ 0.05621645599603653,
1741
+ 0.05621577799320221,
1742
+ 0.056208156049251556,
1743
+ 0.05621710047125816,
1744
+ 0.056210730224847794,
1745
+ 0.05622842535376549,
1746
+ 0.05621420592069626,
1747
+ 0.056215353310108185,
1748
+ 0.05645565316081047,
1749
+ 0.05626315250992775,
1750
+ 0.05623631179332733,
1751
+ 0.05622094124555588,
1752
+ 0.056204475462436676,
1753
+ 0.056212443858385086,
1754
+ 0.05620865523815155,
1755
+ 0.05621373653411865,
1756
+ 0.05620357766747475,
1757
+ 0.056203365325927734,
1758
+ 0.056205932050943375,
1759
+ 0.05621718987822533,
1760
+ 0.056212417781353,
1761
+ 0.05621163919568062,
1762
+ 0.056214120239019394,
1763
+ 0.056283775717020035,
1764
+ 0.05621178820729256,
1765
+ 0.056223753839731216,
1766
+ 0.05620645359158516,
1767
+ 0.05620468407869339,
1768
+ 0.056295569986104965,
1769
+ 0.056240878999233246,
1770
+ 0.05620139464735985,
1771
+ 0.05620034784078598,
1772
+ 0.05619967728853226,
1773
+ 0.05620207265019417,
1774
+ 0.056205909699201584,
1775
+ 0.05620419979095459,
1776
+ 0.05620541051030159,
1777
+ 0.05623263120651245,
1778
+ 0.056202132254838943,
1779
+ 0.05620027706027031,
1780
+ 0.056214697659015656,
1781
+ 0.05621323361992836,
1782
+ 0.056206077337265015,
1783
+ 0.05620695650577545,
1784
+ 0.0562046580016613,
1785
+ 0.05619858577847481,
1786
+ 0.056205399334430695,
1787
+ 0.05621153488755226,
1788
+ 0.05623354762792587,
1789
+ 0.0562015101313591,
1790
+ 0.0561993382871151,
1791
+ 0.05620548129081726,
1792
+ 0.056200191378593445,
1793
+ 0.05620197579264641,
1794
+ 0.056204184889793396,
1795
+ 0.05621318146586418,
1796
+ 0.0561983659863472,
1797
+ 0.05619821324944496,
1798
+ 0.056206002831459045,
1799
+ 0.05619761720299721,
1800
+ 0.0561988390982151,
1801
+ 0.056211285293102264,
1802
+ 0.05620306357741356,
1803
+ 0.056201428174972534,
1804
+ 0.05620291084051132,
1805
+ 0.05619806796312332,
1806
+ 0.056197818368673325,
1807
+ 0.05620019510388374,
1808
+ 0.05620177835226059,
1809
+ 0.05620618909597397,
1810
+ 0.056202542036771774,
1811
+ 0.0562027245759964,
1812
+ 0.05620947107672691,
1813
+ 0.05621035769581795,
1814
+ 0.05620364472270012,
1815
+ 0.05621017888188362,
1816
+ 0.05620468035340309,
1817
+ 0.056214168667793274,
1818
+ 0.056197620928287506,
1819
+ 0.05620499700307846,
1820
+ 0.056196168065071106,
1821
+ 0.05619549751281738,
1822
+ 0.056199103593826294,
1823
+ 0.056197527796030045,
1824
+ 0.05620173364877701,
1825
+ 0.05619557574391365,
1826
+ 0.05619874596595764,
1827
+ 0.05620028078556061,
1828
+ 0.056205496191978455,
1829
+ 0.056197308003902435,
1830
+ 0.05620187520980835,
1831
+ 0.0561952069401741,
1832
+ 0.0561959445476532,
1833
+ 0.05619560182094574,
1834
+ 0.05619737133383751,
1835
+ 0.05619792640209198,
1836
+ 0.056197091937065125,
1837
+ 0.05619625002145767,
1838
+ 0.05619877576828003,
1839
+ 0.05619743466377258,
1840
+ 0.0561976358294487,
1841
+ 0.05619720742106438,
1842
+ 0.0561961904168129,
1843
+ 0.05619632825255394,
1844
+ 0.05619640648365021,
1845
+ 0.056195635348558426,
1846
+ 0.05619524419307709,
1847
+ 0.05620010569691658,
1848
+ 0.05619870871305466,
1849
+ 0.05619727447628975,
1850
+ 0.05619659647345543,
1851
+ 0.05619543418288231,
1852
+ 0.05619629845023155,
1853
+ 0.05619582533836365,
1854
+ 0.056196022778749466,
1855
+ 0.05619630962610245,
1856
+ 0.05619623512029648,
1857
+ 0.05624135583639145,
1858
+ 0.05620087310671806,
1859
+ 0.05619524419307709,
1860
+ 0.056197285652160645,
1861
+ 0.05619876831769943,
1862
+ 0.05619945749640465,
1863
+ 0.05619756132364273,
1864
+ 0.05619775131344795,
1865
+ 0.056195855140686035,
1866
+ 0.0561944879591465,
1867
+ 0.05619751662015915,
1868
+ 0.05619637668132782,
1869
+ 0.05619584023952484,
1870
+ 0.056196652352809906,
1871
+ 0.056194957345724106,
1872
+ 0.056196365505456924,
1873
+ 0.056197553873062134
1874
+ ],
1875
+ "denoise_loss": [],
1876
+ "ortho_loss": [
1877
+ 0.6502658724784851,
1878
+ 0.2811811864376068,
1879
+ 0.2346016764640808,
1880
+ 0.21476693451404572,
1881
+ 0.18344977498054504,
1882
+ 0.10495298355817795,
1883
+ 0.08588869124650955,
1884
+ 0.018477406352758408,
1885
+ 0.0006744824349880219,
1886
+ 0.0031205001287162304,
1887
+ 0.00575696025043726,
1888
+ 0.010777078568935394,
1889
+ 0.00391048938035965,
1890
+ 0.004867402836680412,
1891
+ 0.0020913775078952312,
1892
+ 0.008061191067099571,
1893
+ 0.0064541189931333065,
1894
+ 0.011848259717226028,
1895
+ 0.014426968060433865,
1896
+ 0.02709692344069481,
1897
+ 0.02255256287753582,
1898
+ 0.02122652158141136,
1899
+ 0.032681021839380264,
1900
+ 0.03130153566598892,
1901
+ 0.036686282604932785,
1902
+ 0.045077789574861526,
1903
+ 0.050404731184244156,
1904
+ 0.06439576297998428,
1905
+ 0.07356862723827362,
1906
+ 0.07624772191047668,
1907
+ 0.0712992250919342,
1908
+ 0.08815018087625504,
1909
+ 0.10727302730083466,
1910
+ 0.12698137760162354,
1911
+ 0.13273373246192932,
1912
+ 0.13109514117240906,
1913
+ 0.1526988297700882,
1914
+ 0.168387308716774,
1915
+ 0.20321153104305267,
1916
+ 0.2037270963191986,
1917
+ 0.23864588141441345,
1918
+ 0.2625564932823181,
1919
+ 0.25588732957839966,
1920
+ 0.31165599822998047,
1921
+ 0.3387743830680847,
1922
+ 0.3405305743217468,
1923
+ 0.31628188490867615,
1924
+ 0.35578322410583496,
1925
+ 0.333683043718338,
1926
+ 0.3485804498195648,
1927
+ 0.3498348593711853,
1928
+ 0.35685494542121887,
1929
+ 0.3422837555408478,
1930
+ 0.33916112780570984,
1931
+ 0.3598865270614624,
1932
+ 0.3872186839580536,
1933
+ 0.34882667660713196,
1934
+ 0.364061564207077,
1935
+ 0.34618881344795227,
1936
+ 0.3438187837600708,
1937
+ 0.33586207032203674,
1938
+ 0.3409693241119385,
1939
+ 0.3413761556148529,
1940
+ 0.3447628617286682,
1941
+ 0.32198095321655273,
1942
+ 0.32699164748191833,
1943
+ 0.3171702027320862,
1944
+ 0.343483567237854,
1945
+ 0.34123876690864563,
1946
+ 0.34286391735076904,
1947
+ 0.35002151131629944,
1948
+ 0.35763251781463623,
1949
+ 0.35160672664642334,
1950
+ 0.35453924536705017,
1951
+ 0.35218292474746704,
1952
+ 0.3646450638771057,
1953
+ 0.37005844712257385,
1954
+ 0.3746702969074249,
1955
+ 0.3777448236942291,
1956
+ 0.38459891080856323,
1957
+ 0.3768923282623291,
1958
+ 0.35704317688941956,
1959
+ 0.35337740182876587,
1960
+ 0.3574754595756531,
1961
+ 0.3560780882835388,
1962
+ 0.37906306982040405,
1963
+ 0.3762606978416443,
1964
+ 0.37327563762664795,
1965
+ 0.38858166337013245,
1966
+ 0.3942738473415375,
1967
+ 0.41465315222740173,
1968
+ 0.42790403962135315,
1969
+ 0.4204115867614746,
1970
+ 0.44135281443595886,
1971
+ 0.45378515124320984,
1972
+ 0.45165520906448364,
1973
+ 0.4539830684661865,
1974
+ 0.48027288913726807,
1975
+ 0.47597694396972656,
1976
+ 0.47761377692222595,
1977
+ 0.48030611872673035,
1978
+ 0.48506608605384827,
1979
+ 0.4838334619998932,
1980
+ 0.4895510673522949,
1981
+ 0.49041271209716797,
1982
+ 0.48350363969802856,
1983
+ 0.48788440227508545,
1984
+ 0.5029377341270447,
1985
+ 0.505985677242279,
1986
+ 0.5064969658851624,
1987
+ 0.5154033899307251,
1988
+ 0.5173416137695312,
1989
+ 0.5221923589706421,
1990
+ 0.5203668475151062,
1991
+ 0.5313696265220642,
1992
+ 0.5403210520744324,
1993
+ 0.5236276388168335,
1994
+ 0.5321092009544373,
1995
+ 0.5334134697914124,
1996
+ 0.5349195599555969,
1997
+ 0.5409315228462219,
1998
+ 0.518031895160675,
1999
+ 0.5159770250320435,
2000
+ 0.5262935161590576,
2001
+ 0.5362329483032227,
2002
+ 0.5446694493293762,
2003
+ 0.5397369861602783,
2004
+ 0.5460827350616455,
2005
+ 0.5383400321006775,
2006
+ 0.5269708633422852,
2007
+ 0.4982045292854309,
2008
+ 0.48877066373825073,
2009
+ 0.5075152516365051,
2010
+ 0.5103316903114319,
2011
+ 0.5342748165130615,
2012
+ 0.5479627847671509,
2013
+ 0.5441040396690369,
2014
+ 0.5527230501174927,
2015
+ 0.5749324560165405,
2016
+ 0.5673231482505798,
2017
+ 0.5627517700195312,
2018
+ 0.5668912529945374,
2019
+ 0.569943368434906,
2020
+ 0.5715296864509583,
2021
+ 0.5803252458572388,
2022
+ 0.5838395357131958,
2023
+ 0.606804370880127,
2024
+ 0.6081652045249939,
2025
+ 0.6045222282409668,
2026
+ 0.606292724609375,
2027
+ 0.6084168553352356,
2028
+ 0.6058701872825623,
2029
+ 0.6053699851036072,
2030
+ 0.5967050790786743,
2031
+ 0.6303905248641968,
2032
+ 0.6074860095977783,
2033
+ 0.6097574234008789,
2034
+ 0.6100372672080994,
2035
+ 0.621992826461792,
2036
+ 0.6150597929954529,
2037
+ 0.6282275915145874,
2038
+ 0.6282679438591003,
2039
+ 0.6219140887260437,
2040
+ 0.6237756609916687,
2041
+ 0.6266230940818787,
2042
+ 0.6319355368614197,
2043
+ 0.6140732169151306,
2044
+ 0.6123427748680115,
2045
+ 0.5977766513824463,
2046
+ 0.5882521867752075,
2047
+ 0.6038938760757446,
2048
+ 0.6030605435371399,
2049
+ 0.5987586975097656,
2050
+ 0.5784411430358887,
2051
+ 0.5886924266815186,
2052
+ 0.5950058102607727,
2053
+ 0.6019317507743835,
2054
+ 0.6207942366600037,
2055
+ 0.6202986836433411,
2056
+ 0.6206125020980835,
2057
+ 0.6213878393173218,
2058
+ 0.6198179721832275,
2059
+ 0.6370460987091064,
2060
+ 0.6362895369529724,
2061
+ 0.631364643573761,
2062
+ 0.6306073665618896,
2063
+ 0.6332530975341797,
2064
+ 0.6333451271057129,
2065
+ 0.6305362582206726,
2066
+ 0.6334693431854248,
2067
+ 0.626459538936615,
2068
+ 0.6242359280586243,
2069
+ 0.6261436939239502,
2070
+ 0.6296249628067017,
2071
+ 0.6298355460166931,
2072
+ 0.6314758658409119,
2073
+ 0.6265407800674438,
2074
+ 0.6235003471374512,
2075
+ 0.6169945001602173,
2076
+ 0.6198533773422241,
2077
+ 0.6230413913726807,
2078
+ 0.6242404580116272,
2079
+ 0.6321998238563538,
2080
+ 0.6288551092147827,
2081
+ 0.6274933218955994,
2082
+ 0.6307497620582581,
2083
+ 0.6272670030593872,
2084
+ 0.6341568827629089,
2085
+ 0.6304832100868225,
2086
+ 0.6272768378257751,
2087
+ 0.6211402416229248,
2088
+ 0.6236705780029297,
2089
+ 0.6292702555656433,
2090
+ 0.6233572363853455,
2091
+ 0.6246389150619507,
2092
+ 0.6268891096115112,
2093
+ 0.6349132657051086,
2094
+ 0.605574905872345,
2095
+ 0.6070116758346558,
2096
+ 0.6122633814811707,
2097
+ 0.6229851245880127,
2098
+ 0.6252979636192322,
2099
+ 0.6241100430488586,
2100
+ 0.6217414736747742,
2101
+ 0.627311646938324,
2102
+ 0.6314742565155029,
2103
+ 0.6266555786132812,
2104
+ 0.6285045146942139,
2105
+ 0.6282162070274353,
2106
+ 0.6257549524307251,
2107
+ 0.6248719692230225,
2108
+ 0.6256452798843384,
2109
+ 0.6277334094047546,
2110
+ 0.6294560432434082,
2111
+ 0.6282111406326294,
2112
+ 0.6301722526550293,
2113
+ 0.6323681473731995,
2114
+ 0.6334131360054016,
2115
+ 0.631639838218689,
2116
+ 0.6324410438537598,
2117
+ 0.6289135217666626,
2118
+ 0.6276329159736633,
2119
+ 0.6267264485359192,
2120
+ 0.6281037330627441,
2121
+ 0.6255887150764465,
2122
+ 0.6275599002838135,
2123
+ 0.6262612342834473,
2124
+ 0.6259809732437134,
2125
+ 0.6265996098518372,
2126
+ 0.6338443160057068,
2127
+ 0.6319806575775146,
2128
+ 0.635006844997406,
2129
+ 0.6332499980926514,
2130
+ 0.634567141532898,
2131
+ 0.6330824494361877,
2132
+ 0.6282050013542175,
2133
+ 0.6263772249221802,
2134
+ 0.6274346113204956,
2135
+ 0.626335859298706,
2136
+ 0.6266767978668213,
2137
+ 0.6246297955513,
2138
+ 0.6254687905311584,
2139
+ 0.6249617338180542,
2140
+ 0.6263309717178345,
2141
+ 0.6262295246124268,
2142
+ 0.6264058947563171,
2143
+ 0.6264864802360535,
2144
+ 0.6223540306091309,
2145
+ 0.6259410977363586,
2146
+ 0.6367257833480835,
2147
+ 0.6359933614730835,
2148
+ 0.6366913318634033,
2149
+ 0.636050283908844,
2150
+ 0.6368836760520935,
2151
+ 0.63709557056427,
2152
+ 0.6359667181968689,
2153
+ 0.6363386511802673,
2154
+ 0.6391788721084595,
2155
+ 0.6415848731994629,
2156
+ 0.6400963664054871,
2157
+ 0.6401890516281128,
2158
+ 0.6399085521697998,
2159
+ 0.6401390433311462,
2160
+ 0.6399528384208679,
2161
+ 0.6384453177452087,
2162
+ 0.6376702189445496,
2163
+ 0.636957049369812,
2164
+ 0.6382962465286255,
2165
+ 0.6389310359954834,
2166
+ 0.6387096047401428,
2167
+ 0.6374481320381165,
2168
+ 0.6395060420036316,
2169
+ 0.6384611129760742,
2170
+ 0.638874888420105,
2171
+ 0.638683021068573,
2172
+ 0.6387286186218262,
2173
+ 0.639114260673523,
2174
+ 0.6400926113128662,
2175
+ 0.6399978399276733,
2176
+ 0.6397255659103394,
2177
+ 0.6396890878677368,
2178
+ 0.6395076513290405,
2179
+ 0.639596700668335,
2180
+ 0.6389221549034119,
2181
+ 0.6387419104576111,
2182
+ 0.6388429999351501,
2183
+ 0.6392461657524109,
2184
+ 0.6398524045944214,
2185
+ 0.6402888298034668,
2186
+ 0.6405676603317261
2187
+ ],
2188
+ "lr": [
2189
+ 4.188034188034189e-06,
2190
+ 8.461538461538462e-06,
2191
+ 1.2735042735042738e-05,
2192
+ 1.700854700854701e-05,
2193
+ 2.1282051282051282e-05,
2194
+ 2.5555555555555557e-05,
2195
+ 2.9829059829059833e-05,
2196
+ 3.4102564102564105e-05,
2197
+ 3.837606837606838e-05,
2198
+ 4e-05,
2199
+ 4e-05,
2200
+ 4e-05,
2201
+ 4e-05,
2202
+ 4e-05,
2203
+ 4e-05,
2204
+ 4e-05,
2205
+ 4e-05,
2206
+ 4e-05,
2207
+ 4e-05,
2208
+ 4e-05,
2209
+ 4e-05,
2210
+ 4e-05,
2211
+ 4e-05,
2212
+ 4e-05,
2213
+ 4e-05,
2214
+ 4e-05,
2215
+ 4e-05,
2216
+ 4e-05,
2217
+ 4e-05,
2218
+ 4e-05,
2219
+ 4e-05,
2220
+ 4e-05,
2221
+ 4e-05,
2222
+ 4e-05,
2223
+ 4e-05,
2224
+ 4e-05,
2225
+ 4e-05,
2226
+ 4e-05,
2227
+ 4e-05,
2228
+ 4e-05,
2229
+ 4e-05,
2230
+ 4e-05,
2231
+ 4e-05,
2232
+ 4e-05,
2233
+ 4e-05,
2234
+ 4e-05,
2235
+ 4e-05,
2236
+ 4e-05,
2237
+ 4e-05,
2238
+ 4e-05,
2239
+ 4e-05,
2240
+ 4e-05,
2241
+ 4e-05,
2242
+ 4e-05,
2243
+ 4e-05,
2244
+ 4e-05,
2245
+ 4e-05,
2246
+ 4e-05,
2247
+ 4e-05,
2248
+ 4e-05,
2249
+ 4e-05,
2250
+ 4e-05,
2251
+ 4e-05,
2252
+ 4e-05,
2253
+ 4e-05,
2254
+ 4e-05,
2255
+ 4e-05,
2256
+ 4e-05,
2257
+ 4e-05,
2258
+ 4e-05,
2259
+ 4e-05,
2260
+ 4e-05,
2261
+ 4e-05,
2262
+ 4e-05,
2263
+ 4e-05,
2264
+ 4e-05,
2265
+ 4e-05,
2266
+ 4e-05,
2267
+ 4e-05,
2268
+ 4e-05,
2269
+ 4e-05,
2270
+ 4e-05,
2271
+ 4e-05,
2272
+ 4e-05,
2273
+ 4e-05,
2274
+ 4e-05,
2275
+ 4e-05,
2276
+ 4e-05,
2277
+ 4e-05,
2278
+ 4e-05,
2279
+ 4e-05,
2280
+ 4e-05,
2281
+ 4e-05,
2282
+ 4e-05,
2283
+ 4e-05,
2284
+ 4e-05,
2285
+ 4e-05,
2286
+ 4e-05,
2287
+ 4e-05,
2288
+ 4e-05,
2289
+ 4e-05,
2290
+ 4e-05,
2291
+ 4e-05,
2292
+ 4e-05,
2293
+ 4e-05,
2294
+ 4e-05,
2295
+ 4e-05,
2296
+ 4e-05,
2297
+ 4e-05,
2298
+ 4e-05,
2299
+ 4e-05,
2300
+ 4e-05,
2301
+ 4e-05,
2302
+ 4e-05,
2303
+ 4e-05,
2304
+ 4e-05,
2305
+ 4e-05,
2306
+ 4e-05,
2307
+ 4e-05,
2308
+ 4e-05,
2309
+ 4e-05,
2310
+ 4e-05,
2311
+ 4e-05,
2312
+ 4e-05,
2313
+ 4e-05,
2314
+ 4e-05,
2315
+ 4e-05,
2316
+ 4e-05,
2317
+ 4e-05,
2318
+ 4e-05,
2319
+ 4e-05,
2320
+ 4e-05,
2321
+ 4e-05,
2322
+ 4e-05,
2323
+ 4e-05,
2324
+ 4e-05,
2325
+ 4e-05,
2326
+ 4e-05,
2327
+ 4e-05,
2328
+ 4e-05,
2329
+ 4e-05,
2330
+ 4e-05,
2331
+ 4e-05,
2332
+ 4e-05,
2333
+ 4e-05,
2334
+ 4e-05,
2335
+ 4e-05,
2336
+ 4e-05,
2337
+ 4e-05,
2338
+ 4e-05,
2339
+ 4e-05,
2340
+ 4e-05,
2341
+ 4e-05,
2342
+ 4e-05,
2343
+ 4e-05,
2344
+ 4e-05,
2345
+ 4e-05,
2346
+ 4e-05,
2347
+ 4e-05,
2348
+ 4e-05,
2349
+ 4e-05,
2350
+ 4e-05,
2351
+ 4e-05,
2352
+ 4e-05,
2353
+ 4e-05,
2354
+ 4e-05,
2355
+ 4e-05,
2356
+ 4e-05,
2357
+ 4e-05,
2358
+ 4e-05,
2359
+ 4e-05,
2360
+ 4e-05,
2361
+ 4e-05,
2362
+ 4e-05,
2363
+ 4e-05,
2364
+ 4e-05,
2365
+ 4e-05,
2366
+ 4e-05,
2367
+ 4e-05,
2368
+ 4e-05,
2369
+ 4e-05,
2370
+ 4e-05,
2371
+ 4e-05,
2372
+ 4e-05,
2373
+ 4e-05,
2374
+ 4e-05,
2375
+ 4e-05,
2376
+ 4e-05,
2377
+ 4e-05,
2378
+ 3.992995647012267e-05,
2379
+ 3.963316185199842e-05,
2380
+ 3.933636723387416e-05,
2381
+ 3.90395726157499e-05,
2382
+ 3.874277799762565e-05,
2383
+ 3.844598337950139e-05,
2384
+ 3.814918876137713e-05,
2385
+ 3.785239414325287e-05,
2386
+ 3.7555599525128613e-05,
2387
+ 3.725880490700435e-05,
2388
+ 3.696201028888009e-05,
2389
+ 3.666521567075585e-05,
2390
+ 3.6368421052631585e-05,
2391
+ 3.607162643450732e-05,
2392
+ 3.577483181638307e-05,
2393
+ 3.547803719825881e-05,
2394
+ 3.518124258013455e-05,
2395
+ 3.4884447962010287e-05,
2396
+ 3.458765334388604e-05,
2397
+ 3.4290858725761776e-05,
2398
+ 3.399406410763751e-05,
2399
+ 3.3697269489513265e-05,
2400
+ 3.3400474871389e-05,
2401
+ 3.310368025326474e-05,
2402
+ 3.280688563514048e-05,
2403
+ 3.251009101701623e-05,
2404
+ 3.2213296398891967e-05,
2405
+ 3.191650178076771e-05,
2406
+ 3.1542540561931145e-05,
2407
+ 3.124574594380688e-05,
2408
+ 3.094895132568263e-05,
2409
+ 3.065215670755838e-05,
2410
+ 3.0355362089434113e-05,
2411
+ 3.0058567471309854e-05,
2412
+ 2.97617728531856e-05,
2413
+ 2.9464978235061336e-05,
2414
+ 2.9168183616937077e-05,
2415
+ 2.8871388998812818e-05,
2416
+ 2.857459438068857e-05,
2417
+ 2.8277799762564307e-05,
2418
+ 2.798100514444005e-05,
2419
+ 2.7684210526315793e-05,
2420
+ 2.738741590819153e-05,
2421
+ 2.709062129006727e-05,
2422
+ 2.6793826671943013e-05,
2423
+ 2.6497032053818764e-05,
2424
+ 2.62002374356945e-05,
2425
+ 2.5903442817570243e-05,
2426
+ 2.5606648199445987e-05,
2427
+ 2.5309853581321725e-05,
2428
+ 2.5013058963197466e-05,
2429
+ 2.4716264345073214e-05,
2430
+ 2.441946972694896e-05,
2431
+ 2.4122675108824693e-05,
2432
+ 2.3825880490700434e-05,
2433
+ 2.352908587257618e-05,
2434
+ 2.3232291254451916e-05,
2435
+ 2.293549663632766e-05,
2436
+ 2.2638702018203408e-05,
2437
+ 2.226474079936684e-05,
2438
+ 2.196794618124258e-05,
2439
+ 2.1671151563118328e-05,
2440
+ 2.1374356944994066e-05,
2441
+ 2.1077562326869803e-05,
2442
+ 2.0780767708745554e-05,
2443
+ 2.0483973090621296e-05,
2444
+ 2.018717847249703e-05,
2445
+ 1.989038385437277e-05,
2446
+ 1.959358923624852e-05,
2447
+ 1.929679461812426e-05,
2448
+ 1.8999999999999998e-05,
2449
+ 1.8703205381875746e-05,
2450
+ 1.8406410763751487e-05,
2451
+ 1.8109616145627224e-05,
2452
+ 1.7812821527502965e-05,
2453
+ 1.7516026909378713e-05,
2454
+ 1.7219232291254454e-05,
2455
+ 1.6922437673130192e-05,
2456
+ 1.662564305500594e-05,
2457
+ 1.632884843688168e-05,
2458
+ 1.603205381875742e-05,
2459
+ 1.573525920063316e-05,
2460
+ 1.5438464582508908e-05,
2461
+ 1.5141669964384647e-05,
2462
+ 1.4844875346260385e-05,
2463
+ 1.4548080728136134e-05,
2464
+ 1.4251286110011875e-05,
2465
+ 1.3954491491887611e-05,
2466
+ 1.3657696873763363e-05,
2467
+ 1.33609022556391e-05,
2468
+ 1.298694103680253e-05,
2469
+ 1.2690146418678277e-05,
2470
+ 1.2393351800554018e-05,
2471
+ 1.2096557182429756e-05,
2472
+ 1.1799762564305506e-05,
2473
+ 1.1502967946181245e-05,
2474
+ 1.1206173328056984e-05,
2475
+ 1.0909378709932724e-05,
2476
+ 1.0612584091808472e-05,
2477
+ 1.0315789473684213e-05,
2478
+ 1.0018994855559949e-05,
2479
+ 9.7222002374357e-06,
2480
+ 9.425405619311438e-06,
2481
+ 9.128611001187177e-06,
2482
+ 8.831816383062916e-06,
2483
+ 8.535021764938666e-06,
2484
+ 8.238227146814405e-06,
2485
+ 7.941432528690143e-06,
2486
+ 7.644637910565893e-06,
2487
+ 7.347843292441632e-06,
2488
+ 7.0510486743173715e-06,
2489
+ 6.75425405619311e-06,
2490
+ 6.45745943806886e-06,
2491
+ 6.160664819944598e-06,
2492
+ 5.8638702018203375e-06,
2493
+ 5.567075583696086e-06,
2494
+ 5.270280965571826e-06,
2495
+ 4.973486347447565e-06,
2496
+ 4.676691729323314e-06,
2497
+ 4.379897111199053e-06,
2498
+ 4.083102493074792e-06
2499
+ ],
2500
+ "emb_lr": [],
2501
+ "eval_step": [
2502
+ 1550,
2503
+ 3113,
2504
+ 4676,
2505
+ 6239,
2506
+ 7802,
2507
+ 9365,
2508
+ 10928,
2509
+ 12491,
2510
+ 14054,
2511
+ 15617
2512
+ ],
2513
+ "eval_accuracy": [
2514
+ 0.04,
2515
+ 0.79,
2516
+ 0.99,
2517
+ 1.0,
2518
+ 0.99,
2519
+ 1.0,
2520
+ 0.99,
2521
+ 0.99,
2522
+ 0.99,
2523
+ 1.0
2524
+ ]
2525
+ },
2526
+ "final_accuracy": 0.99875,
2527
+ "sft_eval": {
2528
+ "config": {
2529
+ "ops": "add_sub",
2530
+ "K": null,
2531
+ "mode": "sft",
2532
+ "n_digits": 6,
2533
+ "n_per_split": 100
2534
+ },
2535
+ "splits": {
2536
+ "add_S0": {
2537
+ "full_accuracy": 0.99,
2538
+ "n_examples": 100,
2539
+ "per_subtask": {
2540
+ "SA": {
2541
+ "accuracy": 0.9983471074380166,
2542
+ "count": 605
2543
+ },
2544
+ "SS": {
2545
+ "accuracy": 1.0,
2546
+ "count": 95
2547
+ }
2548
+ }
2549
+ },
2550
+ "add_S1": {
2551
+ "full_accuracy": 0.99,
2552
+ "n_examples": 100,
2553
+ "per_subtask": {
2554
+ "SA": {
2555
+ "accuracy": 1.0,
2556
+ "count": 204
2557
+ },
2558
+ "SC": {
2559
+ "accuracy": 0.9940828402366864,
2560
+ "count": 169
2561
+ },
2562
+ "SS": {
2563
+ "accuracy": 1.0,
2564
+ "count": 31
2565
+ },
2566
+ "UC": {
2567
+ "accuracy": 1.0,
2568
+ "count": 296
2569
+ }
2570
+ }
2571
+ },
2572
+ "add_S2": {
2573
+ "full_accuracy": 0.99,
2574
+ "n_examples": 100,
2575
+ "per_subtask": {
2576
+ "SA": {
2577
+ "accuracy": 1.0,
2578
+ "count": 163
2579
+ },
2580
+ "SC": {
2581
+ "accuracy": 0.9923076923076923,
2582
+ "count": 130
2583
+ },
2584
+ "SS": {
2585
+ "accuracy": 1.0,
2586
+ "count": 87
2587
+ },
2588
+ "UC": {
2589
+ "accuracy": 1.0,
2590
+ "count": 203
2591
+ },
2592
+ "US": {
2593
+ "accuracy": 1.0,
2594
+ "count": 117
2595
+ }
2596
+ }
2597
+ },
2598
+ "add_S3": {
2599
+ "full_accuracy": 0.91,
2600
+ "n_examples": 100,
2601
+ "per_subtask": {
2602
+ "SA": {
2603
+ "accuracy": 1.0,
2604
+ "count": 121
2605
+ },
2606
+ "SC": {
2607
+ "accuracy": 1.0,
2608
+ "count": 121
2609
+ },
2610
+ "SS": {
2611
+ "accuracy": 0.9795918367346939,
2612
+ "count": 49
2613
+ },
2614
+ "UC": {
2615
+ "accuracy": 0.956989247311828,
2616
+ "count": 186
2617
+ },
2618
+ "US": {
2619
+ "accuracy": 1.0,
2620
+ "count": 223
2621
+ }
2622
+ }
2623
+ },
2624
+ "add_S4": {
2625
+ "full_accuracy": 0.75,
2626
+ "n_examples": 100,
2627
+ "per_subtask": {
2628
+ "SA": {
2629
+ "accuracy": 1.0,
2630
+ "count": 104
2631
+ },
2632
+ "SC": {
2633
+ "accuracy": 1.0,
2634
+ "count": 106
2635
+ },
2636
+ "SS": {
2637
+ "accuracy": 1.0,
2638
+ "count": 23
2639
+ },
2640
+ "UC": {
2641
+ "accuracy": 0.86875,
2642
+ "count": 160
2643
+ },
2644
+ "US": {
2645
+ "accuracy": 0.9706840390879479,
2646
+ "count": 307
2647
+ }
2648
+ }
2649
+ },
2650
+ "add_S5": {
2651
+ "full_accuracy": 0.57,
2652
+ "n_examples": 100,
2653
+ "per_subtask": {
2654
+ "SA": {
2655
+ "accuracy": 1.0,
2656
+ "count": 100
2657
+ },
2658
+ "SC": {
2659
+ "accuracy": 1.0,
2660
+ "count": 100
2661
+ },
2662
+ "UC": {
2663
+ "accuracy": 0.69,
2664
+ "count": 100
2665
+ },
2666
+ "US": {
2667
+ "accuracy": 0.86,
2668
+ "count": 400
2669
+ }
2670
+ }
2671
+ },
2672
+ "add_S6": {
2673
+ "full_accuracy": 0.6,
2674
+ "n_examples": 100,
2675
+ "per_subtask": {
2676
+ "SC": {
2677
+ "accuracy": 1.0,
2678
+ "count": 100
2679
+ },
2680
+ "UC": {
2681
+ "accuracy": 0.62,
2682
+ "count": 100
2683
+ },
2684
+ "US": {
2685
+ "accuracy": 0.83,
2686
+ "count": 500
2687
+ }
2688
+ }
2689
+ },
2690
+ "add_random": {
2691
+ "full_accuracy": 1.0,
2692
+ "n_examples": 200,
2693
+ "per_subtask": {
2694
+ "SA": {
2695
+ "accuracy": 1.0,
2696
+ "count": 447
2697
+ },
2698
+ "SC": {
2699
+ "accuracy": 1.0,
2700
+ "count": 320
2701
+ },
2702
+ "SS": {
2703
+ "accuracy": 1.0,
2704
+ "count": 56
2705
+ },
2706
+ "UC": {
2707
+ "accuracy": 1.0,
2708
+ "count": 529
2709
+ },
2710
+ "US": {
2711
+ "accuracy": 1.0,
2712
+ "count": 48
2713
+ }
2714
+ }
2715
+ },
2716
+ "add_C3": {
2717
+ "full_accuracy": 0.95,
2718
+ "n_examples": 100,
2719
+ "per_subtask": {
2720
+ "SA": {
2721
+ "accuracy": 1.0,
2722
+ "count": 300
2723
+ },
2724
+ "SC": {
2725
+ "accuracy": 0.99,
2726
+ "count": 100
2727
+ },
2728
+ "UC": {
2729
+ "accuracy": 0.9792746113989638,
2730
+ "count": 193
2731
+ },
2732
+ "US": {
2733
+ "accuracy": 1.0,
2734
+ "count": 107
2735
+ }
2736
+ }
2737
+ },
2738
+ "add_C4": {
2739
+ "full_accuracy": 0.92,
2740
+ "n_examples": 100,
2741
+ "per_subtask": {
2742
+ "SA": {
2743
+ "accuracy": 0.99,
2744
+ "count": 200
2745
+ },
2746
+ "SC": {
2747
+ "accuracy": 1.0,
2748
+ "count": 100
2749
+ },
2750
+ "UC": {
2751
+ "accuracy": 0.98046875,
2752
+ "count": 256
2753
+ },
2754
+ "US": {
2755
+ "accuracy": 0.9930555555555556,
2756
+ "count": 144
2757
+ }
2758
+ }
2759
+ },
2760
+ "add_C5": {
2761
+ "full_accuracy": 0.9,
2762
+ "n_examples": 100,
2763
+ "per_subtask": {
2764
+ "SA": {
2765
+ "accuracy": 1.0,
2766
+ "count": 100
2767
+ },
2768
+ "SC": {
2769
+ "accuracy": 1.0,
2770
+ "count": 100
2771
+ },
2772
+ "UC": {
2773
+ "accuracy": 0.9705882352941176,
2774
+ "count": 306
2775
+ },
2776
+ "US": {
2777
+ "accuracy": 0.979381443298969,
2778
+ "count": 194
2779
+ }
2780
+ }
2781
+ },
2782
+ "add_C6": {
2783
+ "full_accuracy": 0.94,
2784
+ "n_examples": 100,
2785
+ "per_subtask": {
2786
+ "SC": {
2787
+ "accuracy": 1.0,
2788
+ "count": 100
2789
+ },
2790
+ "UC": {
2791
+ "accuracy": 0.9836065573770492,
2792
+ "count": 366
2793
+ },
2794
+ "US": {
2795
+ "accuracy": 0.9914529914529915,
2796
+ "count": 234
2797
+ }
2798
+ }
2799
+ },
2800
+ "sub_M0": {
2801
+ "full_accuracy": 1.0,
2802
+ "n_examples": 100,
2803
+ "per_subtask": {
2804
+ "MD": {
2805
+ "accuracy": 1.0,
2806
+ "count": 601
2807
+ },
2808
+ "ME": {
2809
+ "accuracy": 1.0,
2810
+ "count": 99
2811
+ }
2812
+ }
2813
+ },
2814
+ "sub_M1": {
2815
+ "full_accuracy": 0.99,
2816
+ "n_examples": 100,
2817
+ "per_subtask": {
2818
+ "MD": {
2819
+ "accuracy": 0.996415770609319,
2820
+ "count": 279
2821
+ },
2822
+ "MB": {
2823
+ "accuracy": 1.0,
2824
+ "count": 145
2825
+ },
2826
+ "ME": {
2827
+ "accuracy": 1.0,
2828
+ "count": 24
2829
+ },
2830
+ "UB": {
2831
+ "accuracy": 1.0,
2832
+ "count": 252
2833
+ }
2834
+ }
2835
+ },
2836
+ "sub_M2": {
2837
+ "full_accuracy": 1.0,
2838
+ "n_examples": 100,
2839
+ "per_subtask": {
2840
+ "MD": {
2841
+ "accuracy": 1.0,
2842
+ "count": 213
2843
+ },
2844
+ "MB": {
2845
+ "accuracy": 1.0,
2846
+ "count": 113
2847
+ },
2848
+ "ME": {
2849
+ "accuracy": 1.0,
2850
+ "count": 85
2851
+ },
2852
+ "UB": {
2853
+ "accuracy": 1.0,
2854
+ "count": 181
2855
+ },
2856
+ "UD": {
2857
+ "accuracy": 1.0,
2858
+ "count": 108
2859
+ }
2860
+ }
2861
+ },
2862
+ "sub_M3": {
2863
+ "full_accuracy": 0.93,
2864
+ "n_examples": 100,
2865
+ "per_subtask": {
2866
+ "MD": {
2867
+ "accuracy": 1.0,
2868
+ "count": 179
2869
+ },
2870
+ "MB": {
2871
+ "accuracy": 1.0,
2872
+ "count": 103
2873
+ },
2874
+ "ME": {
2875
+ "accuracy": 1.0,
2876
+ "count": 56
2877
+ },
2878
+ "UB": {
2879
+ "accuracy": 0.9530201342281879,
2880
+ "count": 149
2881
+ },
2882
+ "UD": {
2883
+ "accuracy": 1.0,
2884
+ "count": 213
2885
+ }
2886
+ }
2887
+ },
2888
+ "sub_M4": {
2889
+ "full_accuracy": 0.62,
2890
+ "n_examples": 100,
2891
+ "per_subtask": {
2892
+ "MD": {
2893
+ "accuracy": 1.0,
2894
+ "count": 200
2895
+ },
2896
+ "MB": {
2897
+ "accuracy": 1.0,
2898
+ "count": 100
2899
+ },
2900
+ "UB": {
2901
+ "accuracy": 0.7,
2902
+ "count": 100
2903
+ },
2904
+ "UD": {
2905
+ "accuracy": 0.9533333333333334,
2906
+ "count": 300
2907
+ }
2908
+ }
2909
+ },
2910
+ "sub_M5": {
2911
+ "full_accuracy": 0.49,
2912
+ "n_examples": 100,
2913
+ "per_subtask": {
2914
+ "MD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 100
2917
+ },
2918
+ "MB": {
2919
+ "accuracy": 1.0,
2920
+ "count": 100
2921
+ },
2922
+ "UB": {
2923
+ "accuracy": 0.8,
2924
+ "count": 100
2925
+ },
2926
+ "UD": {
2927
+ "accuracy": 0.875,
2928
+ "count": 400
2929
+ }
2930
+ }
2931
+ },
2932
+ "sub_random": {
2933
+ "full_accuracy": 0.99,
2934
+ "n_examples": 200,
2935
+ "per_subtask": {
2936
+ "MD": {
2937
+ "accuracy": 0.9983333333333333,
2938
+ "count": 600
2939
+ },
2940
+ "MB": {
2941
+ "accuracy": 1.0,
2942
+ "count": 267
2943
+ },
2944
+ "ME": {
2945
+ "accuracy": 1.0,
2946
+ "count": 53
2947
+ },
2948
+ "UB": {
2949
+ "accuracy": 0.9977220956719818,
2950
+ "count": 439
2951
+ },
2952
+ "UD": {
2953
+ "accuracy": 1.0,
2954
+ "count": 41
2955
+ }
2956
+ }
2957
+ },
2958
+ "sub_B3": {
2959
+ "full_accuracy": 0.9,
2960
+ "n_examples": 100,
2961
+ "per_subtask": {
2962
+ "MD": {
2963
+ "accuracy": 0.99,
2964
+ "count": 300
2965
+ },
2966
+ "MB": {
2967
+ "accuracy": 1.0,
2968
+ "count": 100
2969
+ },
2970
+ "UB": {
2971
+ "accuracy": 0.9644670050761421,
2972
+ "count": 197
2973
+ },
2974
+ "UD": {
2975
+ "accuracy": 1.0,
2976
+ "count": 103
2977
+ }
2978
+ }
2979
+ },
2980
+ "sub_B4": {
2981
+ "full_accuracy": 0.9,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "MD": {
2985
+ "accuracy": 1.0,
2986
+ "count": 200
2987
+ },
2988
+ "MB": {
2989
+ "accuracy": 1.0,
2990
+ "count": 100
2991
+ },
2992
+ "UB": {
2993
+ "accuracy": 0.9595141700404858,
2994
+ "count": 247
2995
+ },
2996
+ "UD": {
2997
+ "accuracy": 0.9934640522875817,
2998
+ "count": 153
2999
+ }
3000
+ }
3001
+ },
3002
+ "sub_B5": {
3003
+ "full_accuracy": 0.89,
3004
+ "n_examples": 100,
3005
+ "per_subtask": {
3006
+ "MD": {
3007
+ "accuracy": 1.0,
3008
+ "count": 100
3009
+ },
3010
+ "MB": {
3011
+ "accuracy": 1.0,
3012
+ "count": 100
3013
+ },
3014
+ "UB": {
3015
+ "accuracy": 0.9697986577181208,
3016
+ "count": 298
3017
+ },
3018
+ "UD": {
3019
+ "accuracy": 0.9900990099009901,
3020
+ "count": 202
3021
+ }
3022
+ }
3023
+ }
3024
+ },
3025
+ "summary": {
3026
+ "overall_accuracy": 0.8833333333333333,
3027
+ "total_examples": 2400,
3028
+ "n_splits": 22
3029
+ }
3030
+ },
3031
+ "sorl_eval": {
3032
+ "config": {
3033
+ "ops": "add_sub",
3034
+ "K": 4,
3035
+ "mode": "sorl",
3036
+ "n_digits": 6,
3037
+ "n_per_split": 100
3038
+ },
3039
+ "splits": {
3040
+ "add_S0": {
3041
+ "full_accuracy": 1.0,
3042
+ "n_examples": 100,
3043
+ "per_subtask": {
3044
+ "SA": {
3045
+ "accuracy": 1.0,
3046
+ "count": 605
3047
+ },
3048
+ "SS": {
3049
+ "accuracy": 1.0,
3050
+ "count": 95
3051
+ }
3052
+ }
3053
+ },
3054
+ "add_S1": {
3055
+ "full_accuracy": 1.0,
3056
+ "n_examples": 100,
3057
+ "per_subtask": {
3058
+ "SA": {
3059
+ "accuracy": 1.0,
3060
+ "count": 204
3061
+ },
3062
+ "SC": {
3063
+ "accuracy": 1.0,
3064
+ "count": 169
3065
+ },
3066
+ "SS": {
3067
+ "accuracy": 1.0,
3068
+ "count": 31
3069
+ },
3070
+ "UC": {
3071
+ "accuracy": 1.0,
3072
+ "count": 296
3073
+ }
3074
+ }
3075
+ },
3076
+ "add_S2": {
3077
+ "full_accuracy": 1.0,
3078
+ "n_examples": 100,
3079
+ "per_subtask": {
3080
+ "SA": {
3081
+ "accuracy": 1.0,
3082
+ "count": 163
3083
+ },
3084
+ "SC": {
3085
+ "accuracy": 1.0,
3086
+ "count": 130
3087
+ },
3088
+ "SS": {
3089
+ "accuracy": 1.0,
3090
+ "count": 87
3091
+ },
3092
+ "UC": {
3093
+ "accuracy": 1.0,
3094
+ "count": 203
3095
+ },
3096
+ "US": {
3097
+ "accuracy": 1.0,
3098
+ "count": 117
3099
+ }
3100
+ }
3101
+ },
3102
+ "add_S3": {
3103
+ "full_accuracy": 1.0,
3104
+ "n_examples": 100,
3105
+ "per_subtask": {
3106
+ "SA": {
3107
+ "accuracy": 1.0,
3108
+ "count": 121
3109
+ },
3110
+ "SC": {
3111
+ "accuracy": 1.0,
3112
+ "count": 121
3113
+ },
3114
+ "SS": {
3115
+ "accuracy": 1.0,
3116
+ "count": 49
3117
+ },
3118
+ "UC": {
3119
+ "accuracy": 1.0,
3120
+ "count": 186
3121
+ },
3122
+ "US": {
3123
+ "accuracy": 1.0,
3124
+ "count": 223
3125
+ }
3126
+ }
3127
+ },
3128
+ "add_S4": {
3129
+ "full_accuracy": 1.0,
3130
+ "n_examples": 100,
3131
+ "per_subtask": {
3132
+ "SA": {
3133
+ "accuracy": 1.0,
3134
+ "count": 104
3135
+ },
3136
+ "SC": {
3137
+ "accuracy": 1.0,
3138
+ "count": 106
3139
+ },
3140
+ "SS": {
3141
+ "accuracy": 1.0,
3142
+ "count": 23
3143
+ },
3144
+ "UC": {
3145
+ "accuracy": 1.0,
3146
+ "count": 160
3147
+ },
3148
+ "US": {
3149
+ "accuracy": 1.0,
3150
+ "count": 307
3151
+ }
3152
+ }
3153
+ },
3154
+ "add_S5": {
3155
+ "full_accuracy": 1.0,
3156
+ "n_examples": 100,
3157
+ "per_subtask": {
3158
+ "SA": {
3159
+ "accuracy": 1.0,
3160
+ "count": 100
3161
+ },
3162
+ "SC": {
3163
+ "accuracy": 1.0,
3164
+ "count": 100
3165
+ },
3166
+ "UC": {
3167
+ "accuracy": 1.0,
3168
+ "count": 100
3169
+ },
3170
+ "US": {
3171
+ "accuracy": 1.0,
3172
+ "count": 400
3173
+ }
3174
+ }
3175
+ },
3176
+ "add_S6": {
3177
+ "full_accuracy": 1.0,
3178
+ "n_examples": 100,
3179
+ "per_subtask": {
3180
+ "SC": {
3181
+ "accuracy": 1.0,
3182
+ "count": 100
3183
+ },
3184
+ "UC": {
3185
+ "accuracy": 1.0,
3186
+ "count": 100
3187
+ },
3188
+ "US": {
3189
+ "accuracy": 1.0,
3190
+ "count": 500
3191
+ }
3192
+ }
3193
+ },
3194
+ "add_random": {
3195
+ "full_accuracy": 1.0,
3196
+ "n_examples": 200,
3197
+ "per_subtask": {
3198
+ "SA": {
3199
+ "accuracy": 1.0,
3200
+ "count": 447
3201
+ },
3202
+ "SC": {
3203
+ "accuracy": 1.0,
3204
+ "count": 320
3205
+ },
3206
+ "SS": {
3207
+ "accuracy": 1.0,
3208
+ "count": 56
3209
+ },
3210
+ "UC": {
3211
+ "accuracy": 1.0,
3212
+ "count": 529
3213
+ },
3214
+ "US": {
3215
+ "accuracy": 1.0,
3216
+ "count": 48
3217
+ }
3218
+ }
3219
+ },
3220
+ "add_C3": {
3221
+ "full_accuracy": 1.0,
3222
+ "n_examples": 100,
3223
+ "per_subtask": {
3224
+ "SA": {
3225
+ "accuracy": 1.0,
3226
+ "count": 300
3227
+ },
3228
+ "SC": {
3229
+ "accuracy": 1.0,
3230
+ "count": 100
3231
+ },
3232
+ "UC": {
3233
+ "accuracy": 1.0,
3234
+ "count": 193
3235
+ },
3236
+ "US": {
3237
+ "accuracy": 1.0,
3238
+ "count": 107
3239
+ }
3240
+ }
3241
+ },
3242
+ "add_C4": {
3243
+ "full_accuracy": 1.0,
3244
+ "n_examples": 100,
3245
+ "per_subtask": {
3246
+ "SA": {
3247
+ "accuracy": 1.0,
3248
+ "count": 200
3249
+ },
3250
+ "SC": {
3251
+ "accuracy": 1.0,
3252
+ "count": 100
3253
+ },
3254
+ "UC": {
3255
+ "accuracy": 1.0,
3256
+ "count": 256
3257
+ },
3258
+ "US": {
3259
+ "accuracy": 1.0,
3260
+ "count": 144
3261
+ }
3262
+ }
3263
+ },
3264
+ "add_C5": {
3265
+ "full_accuracy": 1.0,
3266
+ "n_examples": 100,
3267
+ "per_subtask": {
3268
+ "SA": {
3269
+ "accuracy": 1.0,
3270
+ "count": 100
3271
+ },
3272
+ "SC": {
3273
+ "accuracy": 1.0,
3274
+ "count": 100
3275
+ },
3276
+ "UC": {
3277
+ "accuracy": 1.0,
3278
+ "count": 306
3279
+ },
3280
+ "US": {
3281
+ "accuracy": 1.0,
3282
+ "count": 194
3283
+ }
3284
+ }
3285
+ },
3286
+ "add_C6": {
3287
+ "full_accuracy": 1.0,
3288
+ "n_examples": 100,
3289
+ "per_subtask": {
3290
+ "SC": {
3291
+ "accuracy": 1.0,
3292
+ "count": 100
3293
+ },
3294
+ "UC": {
3295
+ "accuracy": 1.0,
3296
+ "count": 366
3297
+ },
3298
+ "US": {
3299
+ "accuracy": 1.0,
3300
+ "count": 234
3301
+ }
3302
+ }
3303
+ },
3304
+ "sub_M0": {
3305
+ "full_accuracy": 1.0,
3306
+ "n_examples": 100,
3307
+ "per_subtask": {
3308
+ "MD": {
3309
+ "accuracy": 1.0,
3310
+ "count": 601
3311
+ },
3312
+ "ME": {
3313
+ "accuracy": 1.0,
3314
+ "count": 99
3315
+ }
3316
+ }
3317
+ },
3318
+ "sub_M1": {
3319
+ "full_accuracy": 1.0,
3320
+ "n_examples": 100,
3321
+ "per_subtask": {
3322
+ "MD": {
3323
+ "accuracy": 1.0,
3324
+ "count": 279
3325
+ },
3326
+ "MB": {
3327
+ "accuracy": 1.0,
3328
+ "count": 145
3329
+ },
3330
+ "ME": {
3331
+ "accuracy": 1.0,
3332
+ "count": 24
3333
+ },
3334
+ "UB": {
3335
+ "accuracy": 1.0,
3336
+ "count": 252
3337
+ }
3338
+ }
3339
+ },
3340
+ "sub_M2": {
3341
+ "full_accuracy": 1.0,
3342
+ "n_examples": 100,
3343
+ "per_subtask": {
3344
+ "MD": {
3345
+ "accuracy": 1.0,
3346
+ "count": 213
3347
+ },
3348
+ "MB": {
3349
+ "accuracy": 1.0,
3350
+ "count": 113
3351
+ },
3352
+ "ME": {
3353
+ "accuracy": 1.0,
3354
+ "count": 85
3355
+ },
3356
+ "UB": {
3357
+ "accuracy": 1.0,
3358
+ "count": 181
3359
+ },
3360
+ "UD": {
3361
+ "accuracy": 1.0,
3362
+ "count": 108
3363
+ }
3364
+ }
3365
+ },
3366
+ "sub_M3": {
3367
+ "full_accuracy": 1.0,
3368
+ "n_examples": 100,
3369
+ "per_subtask": {
3370
+ "MD": {
3371
+ "accuracy": 1.0,
3372
+ "count": 179
3373
+ },
3374
+ "MB": {
3375
+ "accuracy": 1.0,
3376
+ "count": 103
3377
+ },
3378
+ "ME": {
3379
+ "accuracy": 1.0,
3380
+ "count": 56
3381
+ },
3382
+ "UB": {
3383
+ "accuracy": 1.0,
3384
+ "count": 149
3385
+ },
3386
+ "UD": {
3387
+ "accuracy": 1.0,
3388
+ "count": 213
3389
+ }
3390
+ }
3391
+ },
3392
+ "sub_M4": {
3393
+ "full_accuracy": 0.98,
3394
+ "n_examples": 100,
3395
+ "per_subtask": {
3396
+ "MD": {
3397
+ "accuracy": 1.0,
3398
+ "count": 200
3399
+ },
3400
+ "MB": {
3401
+ "accuracy": 1.0,
3402
+ "count": 100
3403
+ },
3404
+ "UB": {
3405
+ "accuracy": 0.99,
3406
+ "count": 100
3407
+ },
3408
+ "UD": {
3409
+ "accuracy": 0.9966666666666667,
3410
+ "count": 300
3411
+ }
3412
+ }
3413
+ },
3414
+ "sub_M5": {
3415
+ "full_accuracy": 0.99,
3416
+ "n_examples": 100,
3417
+ "per_subtask": {
3418
+ "MD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 100
3421
+ },
3422
+ "MB": {
3423
+ "accuracy": 1.0,
3424
+ "count": 100
3425
+ },
3426
+ "UB": {
3427
+ "accuracy": 1.0,
3428
+ "count": 100
3429
+ },
3430
+ "UD": {
3431
+ "accuracy": 0.9975,
3432
+ "count": 400
3433
+ }
3434
+ }
3435
+ },
3436
+ "sub_random": {
3437
+ "full_accuracy": 1.0,
3438
+ "n_examples": 200,
3439
+ "per_subtask": {
3440
+ "MD": {
3441
+ "accuracy": 1.0,
3442
+ "count": 600
3443
+ },
3444
+ "MB": {
3445
+ "accuracy": 1.0,
3446
+ "count": 267
3447
+ },
3448
+ "ME": {
3449
+ "accuracy": 1.0,
3450
+ "count": 53
3451
+ },
3452
+ "UB": {
3453
+ "accuracy": 1.0,
3454
+ "count": 439
3455
+ },
3456
+ "UD": {
3457
+ "accuracy": 1.0,
3458
+ "count": 41
3459
+ }
3460
+ }
3461
+ },
3462
+ "sub_B3": {
3463
+ "full_accuracy": 1.0,
3464
+ "n_examples": 100,
3465
+ "per_subtask": {
3466
+ "MD": {
3467
+ "accuracy": 1.0,
3468
+ "count": 300
3469
+ },
3470
+ "MB": {
3471
+ "accuracy": 1.0,
3472
+ "count": 100
3473
+ },
3474
+ "UB": {
3475
+ "accuracy": 1.0,
3476
+ "count": 197
3477
+ },
3478
+ "UD": {
3479
+ "accuracy": 1.0,
3480
+ "count": 103
3481
+ }
3482
+ }
3483
+ },
3484
+ "sub_B4": {
3485
+ "full_accuracy": 1.0,
3486
+ "n_examples": 100,
3487
+ "per_subtask": {
3488
+ "MD": {
3489
+ "accuracy": 1.0,
3490
+ "count": 200
3491
+ },
3492
+ "MB": {
3493
+ "accuracy": 1.0,
3494
+ "count": 100
3495
+ },
3496
+ "UB": {
3497
+ "accuracy": 1.0,
3498
+ "count": 247
3499
+ },
3500
+ "UD": {
3501
+ "accuracy": 1.0,
3502
+ "count": 153
3503
+ }
3504
+ }
3505
+ },
3506
+ "sub_B5": {
3507
+ "full_accuracy": 1.0,
3508
+ "n_examples": 100,
3509
+ "per_subtask": {
3510
+ "MD": {
3511
+ "accuracy": 1.0,
3512
+ "count": 100
3513
+ },
3514
+ "MB": {
3515
+ "accuracy": 1.0,
3516
+ "count": 100
3517
+ },
3518
+ "UB": {
3519
+ "accuracy": 1.0,
3520
+ "count": 298
3521
+ },
3522
+ "UD": {
3523
+ "accuracy": 1.0,
3524
+ "count": 202
3525
+ }
3526
+ }
3527
+ }
3528
+ },
3529
+ "summary": {
3530
+ "overall_accuracy": 0.99875,
3531
+ "total_examples": 2400,
3532
+ "n_splits": 22
3533
+ }
3534
+ },
3535
+ "sorl_overall_accuracy": 0.99875,
3536
+ "sft_overall_accuracy": 0.8833333333333333
3537
+ }
add_sub_sorl_v1_abs2_100K/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:a3139180f867078da4cdae7e87fa4be93f25a3704718ec0ff77e4996d232a489
3
+ size 650271004
add_sub_sorl_v1_abs2_100K/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 4,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 4e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 10,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 1562,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs2_K4_100K",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 2,
61
+ "n_head": 3,
62
+ "n_embd": 510,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 2,
65
+ "dataset_size": 100000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 162491102,
71
+ "run_name": "add_sub_sorl_v1_abs2_100K",
72
+ "git_commit": "f447da529caceac8c7d256cbb2cd185cbc50feac",
73
+ "timestamp": "2026-04-12T17:28:05.950563+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "9339oiey",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/9339oiey",
81
+ "final_accuracy": 0.99875,
82
+ "sft_accuracy": 0.8833333333333333,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }