amirali1985 commited on
Commit
ba05dd7
·
verified ·
1 Parent(s): a6c6e65

Upload add_sub_sorl_v1_abs5_100K

Browse files
add_sub_sorl_v1_abs5_100K/config.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 510,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 2040,
15
+ "layer_types": [
16
+ "full_attention",
17
+ "full_attention"
18
+ ],
19
+ "max_position_embeddings": 128,
20
+ "max_window_layers": 28,
21
+ "model_type": "qwen3",
22
+ "num_attention_heads": 3,
23
+ "num_hidden_layers": 2,
24
+ "num_key_value_heads": 3,
25
+ "pad_token_id": null,
26
+ "rms_norm_eps": 1e-06,
27
+ "rope_parameters": {
28
+ "rope_theta": 10000.0,
29
+ "rope_type": "default"
30
+ },
31
+ "sliding_window": null,
32
+ "tie_word_embeddings": false,
33
+ "transformers_version": "5.5.0",
34
+ "use_cache": true,
35
+ "use_sliding_window": false,
36
+ "vocab_size": 151649
37
+ }
add_sub_sorl_v1_abs5_100K/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs5_100K/metrics.json ADDED
@@ -0,0 +1,3537 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 800,
20
+ 850,
21
+ 900,
22
+ 950,
23
+ 1000,
24
+ 1050,
25
+ 1100,
26
+ 1150,
27
+ 1200,
28
+ 1250,
29
+ 1300,
30
+ 1350,
31
+ 1400,
32
+ 1450,
33
+ 1500,
34
+ 1550,
35
+ 1613,
36
+ 1663,
37
+ 1713,
38
+ 1763,
39
+ 1813,
40
+ 1863,
41
+ 1913,
42
+ 1963,
43
+ 2013,
44
+ 2063,
45
+ 2113,
46
+ 2163,
47
+ 2213,
48
+ 2263,
49
+ 2313,
50
+ 2363,
51
+ 2413,
52
+ 2463,
53
+ 2513,
54
+ 2563,
55
+ 2613,
56
+ 2663,
57
+ 2713,
58
+ 2763,
59
+ 2813,
60
+ 2863,
61
+ 2913,
62
+ 2963,
63
+ 3013,
64
+ 3063,
65
+ 3113,
66
+ 3176,
67
+ 3226,
68
+ 3276,
69
+ 3326,
70
+ 3376,
71
+ 3426,
72
+ 3476,
73
+ 3526,
74
+ 3576,
75
+ 3626,
76
+ 3676,
77
+ 3726,
78
+ 3776,
79
+ 3826,
80
+ 3876,
81
+ 3926,
82
+ 3976,
83
+ 4026,
84
+ 4076,
85
+ 4126,
86
+ 4176,
87
+ 4226,
88
+ 4276,
89
+ 4326,
90
+ 4376,
91
+ 4426,
92
+ 4476,
93
+ 4526,
94
+ 4576,
95
+ 4626,
96
+ 4676,
97
+ 4739,
98
+ 4789,
99
+ 4839,
100
+ 4889,
101
+ 4939,
102
+ 4989,
103
+ 5039,
104
+ 5089,
105
+ 5139,
106
+ 5189,
107
+ 5239,
108
+ 5289,
109
+ 5339,
110
+ 5389,
111
+ 5439,
112
+ 5489,
113
+ 5539,
114
+ 5589,
115
+ 5639,
116
+ 5689,
117
+ 5739,
118
+ 5789,
119
+ 5839,
120
+ 5889,
121
+ 5939,
122
+ 5989,
123
+ 6039,
124
+ 6089,
125
+ 6139,
126
+ 6189,
127
+ 6239,
128
+ 6302,
129
+ 6352,
130
+ 6402,
131
+ 6452,
132
+ 6502,
133
+ 6552,
134
+ 6602,
135
+ 6652,
136
+ 6702,
137
+ 6752,
138
+ 6802,
139
+ 6852,
140
+ 6902,
141
+ 6952,
142
+ 7002,
143
+ 7052,
144
+ 7102,
145
+ 7152,
146
+ 7202,
147
+ 7252,
148
+ 7302,
149
+ 7352,
150
+ 7402,
151
+ 7452,
152
+ 7502,
153
+ 7552,
154
+ 7602,
155
+ 7652,
156
+ 7702,
157
+ 7752,
158
+ 7802,
159
+ 7865,
160
+ 7915,
161
+ 7965,
162
+ 8015,
163
+ 8065,
164
+ 8115,
165
+ 8165,
166
+ 8215,
167
+ 8265,
168
+ 8315,
169
+ 8365,
170
+ 8415,
171
+ 8465,
172
+ 8515,
173
+ 8565,
174
+ 8615,
175
+ 8665,
176
+ 8715,
177
+ 8765,
178
+ 8815,
179
+ 8865,
180
+ 8915,
181
+ 8965,
182
+ 9015,
183
+ 9065,
184
+ 9115,
185
+ 9165,
186
+ 9215,
187
+ 9265,
188
+ 9315,
189
+ 9365,
190
+ 9428,
191
+ 9478,
192
+ 9528,
193
+ 9578,
194
+ 9628,
195
+ 9678,
196
+ 9728,
197
+ 9778,
198
+ 9828,
199
+ 9878,
200
+ 9928,
201
+ 9978,
202
+ 10028,
203
+ 10078,
204
+ 10128,
205
+ 10178,
206
+ 10228,
207
+ 10278,
208
+ 10328,
209
+ 10378,
210
+ 10428,
211
+ 10478,
212
+ 10528,
213
+ 10578,
214
+ 10628,
215
+ 10678,
216
+ 10728,
217
+ 10778,
218
+ 10828,
219
+ 10878,
220
+ 10928,
221
+ 10991,
222
+ 11041,
223
+ 11091,
224
+ 11141,
225
+ 11191,
226
+ 11241,
227
+ 11291,
228
+ 11341,
229
+ 11391,
230
+ 11441,
231
+ 11491,
232
+ 11541,
233
+ 11591,
234
+ 11641,
235
+ 11691,
236
+ 11741,
237
+ 11791,
238
+ 11841,
239
+ 11891,
240
+ 11941,
241
+ 11991,
242
+ 12041,
243
+ 12091,
244
+ 12141,
245
+ 12191,
246
+ 12241,
247
+ 12291,
248
+ 12341,
249
+ 12391,
250
+ 12441,
251
+ 12491,
252
+ 12554,
253
+ 12604,
254
+ 12654,
255
+ 12704,
256
+ 12754,
257
+ 12804,
258
+ 12854,
259
+ 12904,
260
+ 12954,
261
+ 13004,
262
+ 13054,
263
+ 13104,
264
+ 13154,
265
+ 13204,
266
+ 13254,
267
+ 13304,
268
+ 13354,
269
+ 13404,
270
+ 13454,
271
+ 13504,
272
+ 13554,
273
+ 13604,
274
+ 13654,
275
+ 13704,
276
+ 13754,
277
+ 13804,
278
+ 13854,
279
+ 13904,
280
+ 13954,
281
+ 14004,
282
+ 14054,
283
+ 14117,
284
+ 14167,
285
+ 14217,
286
+ 14267,
287
+ 14317,
288
+ 14367,
289
+ 14417,
290
+ 14467,
291
+ 14517,
292
+ 14567,
293
+ 14617,
294
+ 14667,
295
+ 14717,
296
+ 14767,
297
+ 14817,
298
+ 14867,
299
+ 14917,
300
+ 14967,
301
+ 15017,
302
+ 15067,
303
+ 15117,
304
+ 15167,
305
+ 15217,
306
+ 15267,
307
+ 15317,
308
+ 15367,
309
+ 15417,
310
+ 15467,
311
+ 15517,
312
+ 15567,
313
+ 15617
314
+ ],
315
+ "loss": [
316
+ 18.44952964782715,
317
+ 13.085131645202637,
318
+ 9.236353874206543,
319
+ 6.564369201660156,
320
+ 4.726602554321289,
321
+ 4.29766845703125,
322
+ 3.989104747772217,
323
+ 3.6649608612060547,
324
+ 3.7498269081115723,
325
+ 3.190838575363159,
326
+ 2.7308132648468018,
327
+ 2.375901699066162,
328
+ 2.3600034713745117,
329
+ 1.1223392486572266,
330
+ -0.17718391120433807,
331
+ 0.21777509152889252,
332
+ -0.49384427070617676,
333
+ 0.11907894164323807,
334
+ -0.07290219515562057,
335
+ 0.6291598081588745,
336
+ 0.8631189465522766,
337
+ 0.6290956139564514,
338
+ 0.39158040285110474,
339
+ 0.405124306678772,
340
+ 0.0058848317712545395,
341
+ -2.2432780265808105,
342
+ -5.301384925842285,
343
+ -6.254613876342773,
344
+ -7.836089611053467,
345
+ -8.577259063720703,
346
+ -9.0380277633667,
347
+ -10.52203369140625,
348
+ -10.115748405456543,
349
+ -9.83785343170166,
350
+ -10.031425476074219,
351
+ -10.07608413696289,
352
+ -10.924676895141602,
353
+ -11.304506301879883,
354
+ -11.676875114440918,
355
+ -11.347262382507324,
356
+ -11.275835990905762,
357
+ -12.261313438415527,
358
+ -11.929290771484375,
359
+ -12.343928337097168,
360
+ -12.007375717163086,
361
+ -13.055440902709961,
362
+ -12.452829360961914,
363
+ -12.293601989746094,
364
+ -11.662895202636719,
365
+ -12.369410514831543,
366
+ -13.215283393859863,
367
+ -12.675363540649414,
368
+ -12.844850540161133,
369
+ -12.796992301940918,
370
+ -11.95716381072998,
371
+ -12.096969604492188,
372
+ -12.005210876464844,
373
+ -12.04047679901123,
374
+ -12.584002494812012,
375
+ -13.298893928527832,
376
+ -12.562734603881836,
377
+ -12.922416687011719,
378
+ -11.108821868896484,
379
+ -10.939716339111328,
380
+ -7.941163539886475,
381
+ -6.545567512512207,
382
+ -5.882503986358643,
383
+ -5.302046298980713,
384
+ -5.577780246734619,
385
+ -5.092601776123047,
386
+ -4.7532243728637695,
387
+ -4.90067720413208,
388
+ -4.917669296264648,
389
+ -5.0563530921936035,
390
+ -5.2757697105407715,
391
+ -4.790847301483154,
392
+ -5.037464618682861,
393
+ -4.602815628051758,
394
+ -4.5183281898498535,
395
+ -4.514697074890137,
396
+ -4.717558860778809,
397
+ -4.100062370300293,
398
+ -4.470508575439453,
399
+ -4.3069939613342285,
400
+ -4.153955936431885,
401
+ -3.684964179992676,
402
+ -3.7342634201049805,
403
+ -3.747032642364502,
404
+ -3.6904678344726562,
405
+ -3.405682325363159,
406
+ -3.685788154602051,
407
+ -3.850557565689087,
408
+ -3.6356136798858643,
409
+ -3.1476175785064697,
410
+ -3.251828908920288,
411
+ -3.135917901992798,
412
+ -3.240488290786743,
413
+ -2.811195135116577,
414
+ -2.6634764671325684,
415
+ -2.7416841983795166,
416
+ -2.5149338245391846,
417
+ -2.283905506134033,
418
+ -2.4918549060821533,
419
+ -2.5136289596557617,
420
+ -2.1629631519317627,
421
+ -2.510160446166992,
422
+ -2.2044715881347656,
423
+ -2.2444427013397217,
424
+ -2.527953863143921,
425
+ -1.9695202112197876,
426
+ -1.6617175340652466,
427
+ -2.2789957523345947,
428
+ -1.8233462572097778,
429
+ -1.653923511505127,
430
+ -1.7793313264846802,
431
+ -1.8508384227752686,
432
+ -1.6064250469207764,
433
+ -1.7450577020645142,
434
+ -1.7883766889572144,
435
+ -1.4824211597442627,
436
+ -1.5947823524475098,
437
+ -1.6336987018585205,
438
+ -1.444771647453308,
439
+ -1.6101677417755127,
440
+ -1.2629313468933105,
441
+ -1.7626909017562866,
442
+ -1.6012898683547974,
443
+ -1.4036366939544678,
444
+ -1.5126478672027588,
445
+ -1.446610927581787,
446
+ -1.29166579246521,
447
+ -1.2759038209915161,
448
+ -1.3668582439422607,
449
+ -1.4401066303253174,
450
+ -1.0013864040374756,
451
+ -0.8619095087051392,
452
+ -1.4348336458206177,
453
+ -2.4039411544799805,
454
+ -1.4596158266067505,
455
+ -1.398054599761963,
456
+ -1.828598976135254,
457
+ -1.2163857221603394,
458
+ -1.5147732496261597,
459
+ -1.6283231973648071,
460
+ -1.4824330806732178,
461
+ -1.472625970840454,
462
+ -1.42937171459198,
463
+ -1.1744720935821533,
464
+ -1.6057438850402832,
465
+ -1.3259679079055786,
466
+ -1.2305545806884766,
467
+ -1.3312289714813232,
468
+ -1.4408652782440186,
469
+ -1.5268746614456177,
470
+ -1.1499279737472534,
471
+ -1.3859295845031738,
472
+ -1.785064458847046,
473
+ -1.305832862854004,
474
+ -1.252516269683838,
475
+ -0.9547231793403625,
476
+ -1.7971051931381226,
477
+ -0.8948331475257874,
478
+ -1.3490352630615234,
479
+ -1.5993345975875854,
480
+ -1.225102424621582,
481
+ -1.217328429222107,
482
+ -1.1172164678573608,
483
+ -0.9223637580871582,
484
+ -1.349583625793457,
485
+ -0.6935772895812988,
486
+ -1.0280042886734009,
487
+ -1.1942574977874756,
488
+ -1.0854111909866333,
489
+ -0.8622591495513916,
490
+ -0.8715866208076477,
491
+ -0.9555827975273132,
492
+ -1.0593785047531128,
493
+ -0.9565988779067993,
494
+ -1.0662693977355957,
495
+ -0.9495633840560913,
496
+ -0.9095310568809509,
497
+ -1.3188884258270264,
498
+ -0.8761703372001648,
499
+ -0.8991231918334961,
500
+ -0.9201684594154358,
501
+ -0.9895074963569641,
502
+ -0.9261743426322937,
503
+ -0.6609992384910583,
504
+ -1.2606618404388428,
505
+ -0.8851873278617859,
506
+ -0.9310636520385742,
507
+ -0.5770999789237976,
508
+ -0.7159540057182312,
509
+ -0.9257229566574097,
510
+ -0.7062601447105408,
511
+ -0.9430025815963745,
512
+ -1.0685992240905762,
513
+ -0.7815626859664917,
514
+ -0.43587052822113037,
515
+ -0.6508090496063232,
516
+ -0.7445836067199707,
517
+ -0.962096095085144,
518
+ -0.858736515045166,
519
+ -0.7710210084915161,
520
+ -0.4534062445163727,
521
+ -0.6560110449790955,
522
+ -0.452778697013855,
523
+ -0.5636731386184692,
524
+ -0.8553899526596069,
525
+ -0.7786545157432556,
526
+ -0.6765991449356079,
527
+ -0.6170997023582458,
528
+ -0.8050151467323303,
529
+ -0.5370979905128479,
530
+ -0.9018643498420715,
531
+ -0.7443892359733582,
532
+ -0.817240297794342,
533
+ -0.7205577492713928,
534
+ -0.3836860656738281,
535
+ -0.663180947303772,
536
+ -0.5142239332199097,
537
+ -0.6271234750747681,
538
+ -0.35162416100502014,
539
+ -0.6422045826911926,
540
+ -0.5748727321624756,
541
+ -0.6405174732208252,
542
+ -0.5978391766548157,
543
+ -0.7506594061851501,
544
+ -0.41857194900512695,
545
+ -0.6290716528892517,
546
+ -0.5650010108947754,
547
+ -0.4634154140949249,
548
+ -0.4642519950866699,
549
+ -0.4609730839729309,
550
+ -0.5808088183403015,
551
+ -0.6225427985191345,
552
+ -0.6624266505241394,
553
+ -0.5210221409797668,
554
+ -0.6969188451766968,
555
+ -0.5200772285461426,
556
+ -0.6061062216758728,
557
+ -0.49697935581207275,
558
+ -0.5649558901786804,
559
+ -0.3923027217388153,
560
+ -0.44581127166748047,
561
+ -0.5210878252983093,
562
+ -0.5564239025115967,
563
+ -0.46670758724212646,
564
+ -0.4823647439479828,
565
+ -0.43254268169403076,
566
+ -0.4324648976325989,
567
+ -0.4741377830505371,
568
+ -0.8426257371902466,
569
+ -0.3482810854911804,
570
+ -0.39642080664634705,
571
+ -0.6418145895004272,
572
+ -0.5931370854377747,
573
+ -0.519498348236084,
574
+ -0.4377537667751312,
575
+ -0.60709547996521,
576
+ -0.5115737318992615,
577
+ -0.44077298045158386,
578
+ -0.5465641617774963,
579
+ -0.5352060794830322,
580
+ -0.5848107933998108,
581
+ -0.489984393119812,
582
+ -0.6054369807243347,
583
+ -0.4451814889907837,
584
+ -0.41332635283470154,
585
+ -0.5274278521537781,
586
+ -0.3277418911457062,
587
+ -0.4081784784793854,
588
+ -0.38111817836761475,
589
+ -0.34374675154685974,
590
+ -0.5816388130187988,
591
+ -0.4023304879665375,
592
+ -0.40927591919898987,
593
+ -0.4844159185886383,
594
+ -0.4173373579978943,
595
+ -0.35617947578430176,
596
+ -0.3747662603855133,
597
+ -0.4198073446750641,
598
+ -0.4224252700805664,
599
+ -0.4228634238243103,
600
+ -0.23087544739246368,
601
+ -0.5353215336799622,
602
+ -0.38394245505332947,
603
+ -0.46698734164237976,
604
+ -0.4426981508731842,
605
+ -0.5118622779846191,
606
+ -0.3715713620185852,
607
+ -0.24227172136306763,
608
+ -0.25442948937416077,
609
+ -0.3570634722709656,
610
+ -0.3031069040298462,
611
+ -0.8304105401039124,
612
+ -0.35720691084861755,
613
+ -0.2766706943511963,
614
+ -0.21187397837638855,
615
+ -0.3504505157470703,
616
+ -0.25292885303497314,
617
+ -0.2106543779373169,
618
+ -0.3711566925048828,
619
+ -0.2840205430984497,
620
+ -0.3919123709201813,
621
+ -0.35385793447494507,
622
+ -0.33695098757743835,
623
+ -0.368748277425766,
624
+ -0.41509464383125305,
625
+ -0.31920623779296875
626
+ ],
627
+ "base_loss": [
628
+ 9.478815078735352,
629
+ 7.147007465362549,
630
+ 6.176869869232178,
631
+ 4.685658931732178,
632
+ 2.787061929702759,
633
+ 2.0358169078826904,
634
+ 1.877733826637268,
635
+ 1.9838597774505615,
636
+ 1.8801013231277466,
637
+ 1.820031762123108,
638
+ 1.879629373550415,
639
+ 1.808982253074646,
640
+ 1.842345952987671,
641
+ 1.857324481010437,
642
+ 1.866514801979065,
643
+ 1.847004771232605,
644
+ 1.7901628017425537,
645
+ 1.8024442195892334,
646
+ 1.8005038499832153,
647
+ 1.7149734497070312,
648
+ 1.657784104347229,
649
+ 1.7428425550460815,
650
+ 1.7641716003417969,
651
+ 1.6597461700439453,
652
+ 1.6715914011001587,
653
+ 1.630522608757019,
654
+ 1.6926891803741455,
655
+ 1.5843595266342163,
656
+ 1.5954675674438477,
657
+ 1.6489832401275635,
658
+ 1.5687618255615234,
659
+ 1.6780462265014648,
660
+ 1.6140142679214478,
661
+ 1.5678704977035522,
662
+ 1.5868467092514038,
663
+ 1.5147616863250732,
664
+ 1.6142460107803345,
665
+ 1.6015769243240356,
666
+ 1.6059281826019287,
667
+ 1.5515403747558594,
668
+ 1.5241461992263794,
669
+ 1.6281310319900513,
670
+ 1.522217035293579,
671
+ 1.5715965032577515,
672
+ 1.521254539489746,
673
+ 1.6077793836593628,
674
+ 1.5328742265701294,
675
+ 1.5772770643234253,
676
+ 1.4971659183502197,
677
+ 1.516211748123169,
678
+ 1.6045831441879272,
679
+ 1.5815789699554443,
680
+ 1.573682427406311,
681
+ 1.5641165971755981,
682
+ 1.4875094890594482,
683
+ 1.4711979627609253,
684
+ 1.41169273853302,
685
+ 1.4731208086013794,
686
+ 1.496317744255066,
687
+ 1.5736018419265747,
688
+ 1.497803807258606,
689
+ 1.513519525527954,
690
+ 1.3411214351654053,
691
+ 1.294536828994751,
692
+ 0.9521709084510803,
693
+ 0.8137292265892029,
694
+ 0.7460617423057556,
695
+ 0.6637206077575684,
696
+ 0.6727820634841919,
697
+ 0.6252961158752441,
698
+ 0.6120854616165161,
699
+ 0.6280654668807983,
700
+ 0.608968198299408,
701
+ 0.6165491938591003,
702
+ 0.6302626729011536,
703
+ 0.5648792386054993,
704
+ 0.5815601348876953,
705
+ 0.5425162315368652,
706
+ 0.5602009296417236,
707
+ 0.5320432186126709,
708
+ 0.5548504590988159,
709
+ 0.47913244366645813,
710
+ 0.5280306339263916,
711
+ 0.5023998618125916,
712
+ 0.4917462468147278,
713
+ 0.443521648645401,
714
+ 0.45187312364578247,
715
+ 0.4393064081668854,
716
+ 0.43677452206611633,
717
+ 0.40351608395576477,
718
+ 0.43782588839530945,
719
+ 0.43998581171035767,
720
+ 0.4332793354988098,
721
+ 0.3735405504703522,
722
+ 0.38679054379463196,
723
+ 0.36955150961875916,
724
+ 0.385150283575058,
725
+ 0.32080963253974915,
726
+ 0.31036800146102905,
727
+ 0.3505243957042694,
728
+ 0.30904823541641235,
729
+ 0.2788742184638977,
730
+ 0.2882492244243622,
731
+ 0.30237480998039246,
732
+ 0.24547524750232697,
733
+ 0.3053366243839264,
734
+ 0.259798526763916,
735
+ 0.2723730802536011,
736
+ 0.3113707900047302,
737
+ 0.22505664825439453,
738
+ 0.2224322110414505,
739
+ 0.2788628339767456,
740
+ 0.22666394710540771,
741
+ 0.19256557524204254,
742
+ 0.22168363630771637,
743
+ 0.23763836920261383,
744
+ 0.18722184002399445,
745
+ 0.21815802156925201,
746
+ 0.20957694947719574,
747
+ 0.16867589950561523,
748
+ 0.19812573492527008,
749
+ 0.1907508224248886,
750
+ 0.17580600082874298,
751
+ 0.18482735753059387,
752
+ 0.1696944236755371,
753
+ 0.21134884655475616,
754
+ 0.18224011361598969,
755
+ 0.16670148074626923,
756
+ 0.1823485940694809,
757
+ 0.1764475256204605,
758
+ 0.18433916568756104,
759
+ 0.15989899635314941,
760
+ 0.1958816945552826,
761
+ 0.17056076228618622,
762
+ 0.16027210652828217,
763
+ 0.14637412130832672,
764
+ 0.16548265516757965,
765
+ 0.27574387192726135,
766
+ 0.16816933453083038,
767
+ 0.17710550129413605,
768
+ 0.21935905516147614,
769
+ 0.1367485523223877,
770
+ 0.17449618875980377,
771
+ 0.1823546141386032,
772
+ 0.1821918785572052,
773
+ 0.16603636741638184,
774
+ 0.16063928604125977,
775
+ 0.13537771999835968,
776
+ 0.18368904292583466,
777
+ 0.14854037761688232,
778
+ 0.1395270675420761,
779
+ 0.15166796743869781,
780
+ 0.17095863819122314,
781
+ 0.17842306196689606,
782
+ 0.131307452917099,
783
+ 0.15927840769290924,
784
+ 0.20380905270576477,
785
+ 0.149281308054924,
786
+ 0.1428130716085434,
787
+ 0.10824687033891678,
788
+ 0.20649409294128418,
789
+ 0.10403601080179214,
790
+ 0.1521756649017334,
791
+ 0.18943654000759125,
792
+ 0.13651980459690094,
793
+ 0.1377752125263214,
794
+ 0.12476317584514618,
795
+ 0.10559020936489105,
796
+ 0.15177801251411438,
797
+ 0.10150890797376633,
798
+ 0.11630219966173172,
799
+ 0.1332741230726242,
800
+ 0.1367233544588089,
801
+ 0.09795082360506058,
802
+ 0.09837458282709122,
803
+ 0.11475709825754166,
804
+ 0.12007645517587662,
805
+ 0.10695642977952957,
806
+ 0.1194952055811882,
807
+ 0.1135689988732338,
808
+ 0.10178102552890778,
809
+ 0.14920473098754883,
810
+ 0.09827220439910889,
811
+ 0.10088849067687988,
812
+ 0.10268665105104446,
813
+ 0.11169253289699554,
814
+ 0.10481532663106918,
815
+ 0.07450170069932938,
816
+ 0.14566169679164886,
817
+ 0.10045651346445084,
818
+ 0.10866272449493408,
819
+ 0.06537692993879318,
820
+ 0.08126810938119888,
821
+ 0.10344010591506958,
822
+ 0.07878991216421127,
823
+ 0.10556399077177048,
824
+ 0.12452854216098785,
825
+ 0.08715303987264633,
826
+ 0.06283383071422577,
827
+ 0.07278473675251007,
828
+ 0.08324276655912399,
829
+ 0.1073467880487442,
830
+ 0.0959773063659668,
831
+ 0.0903191789984703,
832
+ 0.0734538659453392,
833
+ 0.07329253107309341,
834
+ 0.0613003671169281,
835
+ 0.07355638593435287,
836
+ 0.09880624711513519,
837
+ 0.08773256838321686,
838
+ 0.07558536529541016,
839
+ 0.07866930961608887,
840
+ 0.09029243141412735,
841
+ 0.060021985322237015,
842
+ 0.10877584666013718,
843
+ 0.08304883539676666,
844
+ 0.09336527436971664,
845
+ 0.08078878372907639,
846
+ 0.04604396969079971,
847
+ 0.0739465281367302,
848
+ 0.05788648873567581,
849
+ 0.07136060297489166,
850
+ 0.03972526267170906,
851
+ 0.07363789528608322,
852
+ 0.06858444213867188,
853
+ 0.07210712879896164,
854
+ 0.06665065139532089,
855
+ 0.0842098519206047,
856
+ 0.04666807875037193,
857
+ 0.07024309784173965,
858
+ 0.06373830139636993,
859
+ 0.05268338695168495,
860
+ 0.05181283503770828,
861
+ 0.0532914437353611,
862
+ 0.06561119109392166,
863
+ 0.06976865977048874,
864
+ 0.07406623661518097,
865
+ 0.060560788959264755,
866
+ 0.07924336940050125,
867
+ 0.05855170264840126,
868
+ 0.06876732409000397,
869
+ 0.05866331234574318,
870
+ 0.06375259906053543,
871
+ 0.04413650557398796,
872
+ 0.050514571368694305,
873
+ 0.05819368362426758,
874
+ 0.06327065825462341,
875
+ 0.05219113826751709,
876
+ 0.05453881248831749,
877
+ 0.04892338067293167,
878
+ 0.049468424171209335,
879
+ 0.052953965961933136,
880
+ 0.09524880349636078,
881
+ 0.039073824882507324,
882
+ 0.04476191848516464,
883
+ 0.07190631330013275,
884
+ 0.06800847500562668,
885
+ 0.05787040665745735,
886
+ 0.050239454954862595,
887
+ 0.06768538057804108,
888
+ 0.057207752019166946,
889
+ 0.05006319656968117,
890
+ 0.061503369361162186,
891
+ 0.05985274165868759,
892
+ 0.06554742902517319,
893
+ 0.05472767353057861,
894
+ 0.06759121268987656,
895
+ 0.05012698844075203,
896
+ 0.04650840535759926,
897
+ 0.058920033276081085,
898
+ 0.03701305016875267,
899
+ 0.04568685218691826,
900
+ 0.04329124093055725,
901
+ 0.03899969533085823,
902
+ 0.06514454632997513,
903
+ 0.045412953943014145,
904
+ 0.045837707817554474,
905
+ 0.0540190152823925,
906
+ 0.04707704111933708,
907
+ 0.04026341438293457,
908
+ 0.042074140161275864,
909
+ 0.04687413573265076,
910
+ 0.04716089740395546,
911
+ 0.05027259513735771,
912
+ 0.026406314224004745,
913
+ 0.0597325824201107,
914
+ 0.043301086872816086,
915
+ 0.0521482415497303,
916
+ 0.0506330169737339,
917
+ 0.05718604102730751,
918
+ 0.0414709709584713,
919
+ 0.027818426489830017,
920
+ 0.02862350083887577,
921
+ 0.040087614208459854,
922
+ 0.033949438482522964,
923
+ 0.09281567484140396,
924
+ 0.040391433984041214,
925
+ 0.03121653012931347,
926
+ 0.02385253645479679,
927
+ 0.03970903158187866,
928
+ 0.028319206088781357,
929
+ 0.023725956678390503,
930
+ 0.04406922310590744,
931
+ 0.03261449560523033,
932
+ 0.04449618607759476,
933
+ 0.03972644731402397,
934
+ 0.03816765546798706,
935
+ 0.04165048152208328,
936
+ 0.04628567025065422,
937
+ 0.03601330518722534
938
+ ],
939
+ "info_loss": [
940
+ -0.24746036529541016,
941
+ -0.2758293151855469,
942
+ -0.23881292343139648,
943
+ -0.20038366317749023,
944
+ -0.1349635124206543,
945
+ -0.08571147918701172,
946
+ -0.09480726718902588,
947
+ -0.13600599765777588,
948
+ -0.11611413955688477,
949
+ -0.1656198501586914,
950
+ -0.21736717224121094,
951
+ -0.24530434608459473,
952
+ -0.24701166152954102,
953
+ -0.28169214725494385,
954
+ -0.2314901351928711,
955
+ -0.1858144998550415,
956
+ -0.23688781261444092,
957
+ -0.17470812797546387,
958
+ -0.19258201122283936,
959
+ -0.11244618892669678,
960
+ -0.08269965648651123,
961
+ -0.11517906188964844,
962
+ -0.1401442289352417,
963
+ -0.1294572353363037,
964
+ -0.17010819911956787,
965
+ -0.3923828601837158,
966
+ -0.705969512462616,
967
+ -0.7913603782653809,
968
+ -0.9512405395507812,
969
+ -1.029664158821106,
970
+ -1.066483497619629,
971
+ -1.2262372970581055,
972
+ -1.1775835752487183,
973
+ -1.1446707248687744,
974
+ -1.1663867235183716,
975
+ -1.163946270942688,
976
+ -1.2576193809509277,
977
+ -1.2948627471923828,
978
+ -1.332379698753357,
979
+ -1.2938930988311768,
980
+ -1.2832956314086914,
981
+ -1.3922922611236572,
982
+ -1.3484569787979126,
983
+ -1.3945118188858032,
984
+ -1.3569127321243286,
985
+ -1.468339443206787,
986
+ -1.4016437530517578,
987
+ -1.3889812231063843,
988
+ -1.3179041147232056,
989
+ -1.3906015157699585,
990
+ -1.4845846891403198,
991
+ -1.4269402027130127,
992
+ -1.4428510665893555,
993
+ -1.4374557733535767,
994
+ -1.3475759029388428,
995
+ -1.3586021661758423,
996
+ -1.344419240951538,
997
+ -1.3533596992492676,
998
+ -1.41006600856781,
999
+ -1.4885072708129883,
1000
+ -1.4076002836227417,
1001
+ -1.4455060958862305,
1002
+ -1.246247410774231,
1003
+ -1.2240954637527466,
1004
+ -0.8900468349456787,
1005
+ -0.7369465827941895,
1006
+ -0.6641952991485596,
1007
+ -0.5974841713905334,
1008
+ -0.627163827419281,
1009
+ -0.576034426689148,
1010
+ -0.5380439162254333,
1011
+ -0.5532349348068237,
1012
+ -0.5536358952522278,
1013
+ -0.5676578879356384,
1014
+ -0.5917368531227112,
1015
+ -0.5372372269630432,
1016
+ -0.56263267993927,
1017
+ -0.517175018787384,
1018
+ -0.508733868598938,
1019
+ -0.506136417388916,
1020
+ -0.527775228023529,
1021
+ -0.4586986005306244,
1022
+ -0.5005542039871216,
1023
+ -0.48131003975868225,
1024
+ -0.46668779850006104,
1025
+ -0.413947731256485,
1026
+ -0.41922691464424133,
1027
+ -0.419247567653656,
1028
+ -0.41337156295776367,
1029
+ -0.38181614875793457,
1030
+ -0.41289258003234863,
1031
+ -0.4295651912689209,
1032
+ -0.40810590982437134,
1033
+ -0.3561195135116577,
1034
+ -0.36415907740592957,
1035
+ -0.3510327637195587,
1036
+ -0.36301058530807495,
1037
+ -0.31381264328956604,
1038
+ -0.2978881001472473,
1039
+ -0.30990442633628845,
1040
+ -0.2828633487224579,
1041
+ -0.25747063755989075,
1042
+ -0.27936798334121704,
1043
+ -0.28309839963912964,
1044
+ -0.24245284497737885,
1045
+ -0.28460994362831116,
1046
+ -0.24765269458293915,
1047
+ -0.25302544236183167,
1048
+ -0.28492802381515503,
1049
+ -0.22052563726902008,
1050
+ -0.18923313915729523,
1051
+ -0.25695767998695374,
1052
+ -0.2097332626581192,
1053
+ -0.18484467267990112,
1054
+ -0.20055602490901947,
1055
+ -0.21083897352218628,
1056
+ -0.18026942014694214,
1057
+ -0.19725432991981506,
1058
+ -0.20036013424396515,
1059
+ -0.1662653386592865,
1060
+ -0.17948386073112488,
1061
+ -0.18314407765865326,
1062
+ -0.16280633211135864,
1063
+ -0.180500328540802,
1064
+ -0.1438557207584381,
1065
+ -0.1987953782081604,
1066
+ -0.17859095335006714,
1067
+ -0.16000238060951233,
1068
+ -0.1707027405500412,
1069
+ -0.1631038337945938,
1070
+ -0.14900822937488556,
1071
+ -0.14502517879009247,
1072
+ -0.1574653685092926,
1073
+ -0.16321077942848206,
1074
+ -0.11656152456998825,
1075
+ -0.10202033817768097,
1076
+ -0.16051462292671204,
1077
+ -0.2681931257247925,
1078
+ -0.16319163143634796,
1079
+ -0.15779775381088257,
1080
+ -0.20554491877555847,
1081
+ -0.13561710715293884,
1082
+ -0.1709831953048706,
1083
+ -0.1813998967409134,
1084
+ -0.16671568155288696,
1085
+ -0.16449113190174103,
1086
+ -0.15988177061080933,
1087
+ -0.13258007168769836,
1088
+ -0.17931175231933594,
1089
+ -0.148224338889122,
1090
+ -0.13804210722446442,
1091
+ -0.1484738290309906,
1092
+ -0.16194096207618713,
1093
+ -0.17081204056739807,
1094
+ -0.12893566489219666,
1095
+ -0.1547948271036148,
1096
+ -0.19968445599079132,
1097
+ -0.14876215159893036,
1098
+ -0.14158760011196136,
1099
+ -0.10761424899101257,
1100
+ -0.20079588890075684,
1101
+ -0.10236789286136627,
1102
+ -0.15164384245872498,
1103
+ -0.17914894223213196,
1104
+ -0.13636644184589386,
1105
+ -0.13589240610599518,
1106
+ -0.12452322244644165,
1107
+ -0.10313521325588226,
1108
+ -0.15057386457920074,
1109
+ -0.07971213012933731,
1110
+ -0.11526139080524445,
1111
+ -0.1332167536020279,
1112
+ -0.12428569793701172,
1113
+ -0.0971180722117424,
1114
+ -0.09776707738637924,
1115
+ -0.10750783979892731,
1116
+ -0.11857262998819351,
1117
+ -0.1066167801618576,
1118
+ -0.11932756751775742,
1119
+ -0.10674172639846802,
1120
+ -0.10168048739433289,
1121
+ -0.14808465540409088,
1122
+ -0.09817315638065338,
1123
+ -0.10079306364059448,
1124
+ -0.10262572020292282,
1125
+ -0.11101125925779343,
1126
+ -0.1037193089723587,
1127
+ -0.07370161265134811,
1128
+ -0.1410427838563919,
1129
+ -0.09944266825914383,
1130
+ -0.10417608916759491,
1131
+ -0.06530590355396271,
1132
+ -0.0803341269493103,
1133
+ -0.10331270843744278,
1134
+ -0.0786375105381012,
1135
+ -0.1054707020521164,
1136
+ -0.119558185338974,
1137
+ -0.08709551393985748,
1138
+ -0.05025278776884079,
1139
+ -0.07257865369319916,
1140
+ -0.08294828981161118,
1141
+ -0.107086680829525,
1142
+ -0.09570429474115372,
1143
+ -0.08692388236522675,
1144
+ -0.052821774035692215,
1145
+ -0.07326008379459381,
1146
+ -0.0516117662191391,
1147
+ -0.06417225301265717,
1148
+ -0.09715473651885986,
1149
+ -0.08743984252214432,
1150
+ -0.07549464702606201,
1151
+ -0.06975524127483368,
1152
+ -0.09015349298715591,
1153
+ -0.05998589098453522,
1154
+ -0.10181828588247299,
1155
+ -0.08298134803771973,
1156
+ -0.09185295552015305,
1157
+ -0.08075430244207382,
1158
+ -0.043630681931972504,
1159
+ -0.07384850084781647,
1160
+ -0.05750010162591934,
1161
+ -0.07025234401226044,
1162
+ -0.039659470319747925,
1163
+ -0.0735572874546051,
1164
+ -0.06451164186000824,
1165
+ -0.07173311710357666,
1166
+ -0.06661474704742432,
1167
+ -0.08418307453393936,
1168
+ -0.04665147513151169,
1169
+ -0.07021082937717438,
1170
+ -0.0637119933962822,
1171
+ -0.05267366021871567,
1172
+ -0.05179346725344658,
1173
+ -0.05323582515120506,
1174
+ -0.06519252806901932,
1175
+ -0.06972390413284302,
1176
+ -0.07403936237096786,
1177
+ -0.058382898569107056,
1178
+ -0.07815470546483994,
1179
+ -0.05841157212853432,
1180
+ -0.06865391135215759,
1181
+ -0.055786989629268646,
1182
+ -0.06329059600830078,
1183
+ -0.044128019362688065,
1184
+ -0.050502464175224304,
1185
+ -0.05816315859556198,
1186
+ -0.06325214356184006,
1187
+ -0.05217985436320305,
1188
+ -0.054528024047613144,
1189
+ -0.048883337527513504,
1190
+ -0.048519305884838104,
1191
+ -0.052907995879650116,
1192
+ -0.09503248333930969,
1193
+ -0.03906627744436264,
1194
+ -0.04475462809205055,
1195
+ -0.07161007076501846,
1196
+ -0.0666651800274849,
1197
+ -0.05786250904202461,
1198
+ -0.050222866237163544,
1199
+ -0.06761092692613602,
1200
+ -0.057174813002347946,
1201
+ -0.04933343827724457,
1202
+ -0.061432238668203354,
1203
+ -0.05984765663743019,
1204
+ -0.06550679355859756,
1205
+ -0.054724521934986115,
1206
+ -0.06751931458711624,
1207
+ -0.04966246709227562,
1208
+ -0.046499382704496384,
1209
+ -0.05887816101312637,
1210
+ -0.036921266466379166,
1211
+ -0.04566673934459686,
1212
+ -0.04327061027288437,
1213
+ -0.03899180516600609,
1214
+ -0.06513749063014984,
1215
+ -0.04527737572789192,
1216
+ -0.04579845815896988,
1217
+ -0.05398871377110481,
1218
+ -0.047070346772670746,
1219
+ -0.040253836661577225,
1220
+ -0.04206092283129692,
1221
+ -0.04686303064227104,
1222
+ -0.04713711515069008,
1223
+ -0.04755039140582085,
1224
+ -0.026394391432404518,
1225
+ -0.059719450771808624,
1226
+ -0.043288592249155045,
1227
+ -0.05214283987879753,
1228
+ -0.050238627940416336,
1229
+ -0.057172250002622604,
1230
+ -0.04146181046962738,
1231
+ -0.027805551886558533,
1232
+ -0.02861672081053257,
1233
+ -0.04002641886472702,
1234
+ -0.03390965238213539,
1235
+ -0.09281256049871445,
1236
+ -0.040354739874601364,
1237
+ -0.031207451596856117,
1238
+ -0.023845793679356575,
1239
+ -0.03969898819923401,
1240
+ -0.02830086648464203,
1241
+ -0.023720722645521164,
1242
+ -0.04318676516413689,
1243
+ -0.03261061757802963,
1244
+ -0.044458597898483276,
1245
+ -0.03972158581018448,
1246
+ -0.038163602352142334,
1247
+ -0.041647665202617645,
1248
+ -0.046281177550554276,
1249
+ -0.03601086512207985
1250
+ ],
1251
+ "abs_loss": [
1252
+ 1.596919059753418,
1253
+ 1.4947857856750488,
1254
+ 1.272780418395996,
1255
+ 1.1532820463180542,
1256
+ 1.0954599380493164,
1257
+ 1.0691957473754883,
1258
+ 1.0738341808319092,
1259
+ 1.0862774848937988,
1260
+ 1.076493263244629,
1261
+ 1.0707249641418457,
1262
+ 1.0633931159973145,
1263
+ 1.0700206756591797,
1264
+ 1.04740571975708,
1265
+ 0.7284477949142456,
1266
+ 0.27670353651046753,
1267
+ 0.3479034900665283,
1268
+ 0.3737618625164032,
1269
+ 0.2770856022834778,
1270
+ 0.25724223256111145,
1271
+ 0.21221217513084412,
1272
+ 0.18176080286502838,
1273
+ 0.2101953625679016,
1274
+ 0.16143487393856049,
1275
+ 0.21087051928043365,
1276
+ 0.18534056842327118,
1277
+ 0.2236458957195282,
1278
+ 0.1967623233795166,
1279
+ 0.2382446974515915,
1280
+ 0.2674140930175781,
1281
+ 0.26551109552383423,
1282
+ 0.1889098882675171,
1283
+ 0.2353925108909607,
1284
+ 0.18361970782279968,
1285
+ 0.19251857697963715,
1286
+ 0.19663862884044647,
1287
+ 0.21570132672786713,
1288
+ 0.15264488756656647,
1289
+ 0.23524253070354462,
1290
+ 0.20087885856628418,
1291
+ 0.19272246956825256,
1292
+ 0.17692875862121582,
1293
+ 0.18186329305171967,
1294
+ 0.1845722794532776,
1295
+ 0.1634385734796524,
1296
+ 0.1223602145910263,
1297
+ 0.0807499960064888,
1298
+ 0.08542364090681076,
1299
+ 0.08870146423578262,
1300
+ 0.07707524299621582,
1301
+ 0.07842298597097397,
1302
+ 0.056058961898088455,
1303
+ 0.04188915342092514,
1304
+ 0.03148265182971954,
1305
+ 0.034343309700489044,
1306
+ 0.04402808099985123,
1307
+ 0.05053535848855972,
1308
+ 0.03719761222600937,
1309
+ 0.03085540235042572,
1310
+ 0.030315913259983063,
1311
+ 0.03826269879937172,
1312
+ 0.018028227612376213,
1313
+ 0.01966400444507599,
1314
+ 0.025648467242717743,
1315
+ 0.0174420103430748,
1316
+ 0.02302210032939911,
1317
+ 0.01107926107943058,
1318
+ 0.011899472214281559,
1319
+ 0.025297150015830994,
1320
+ 0.006678640376776457,
1321
+ 0.025592511519789696,
1322
+ 0.021416539326310158,
1323
+ 0.003772859927266836,
1324
+ 0.004001403693109751,
1325
+ 0.015317991375923157,
1326
+ 0.004922089166939259,
1327
+ 0.014212886802852154,
1328
+ 0.006655131932348013,
1329
+ 0.0011241815518587828,
1330
+ 0.005378206260502338,
1331
+ 0.01237943023443222,
1332
+ 0.022908588871359825,
1333
+ 0.007470221258699894,
1334
+ 0.005204240325838327,
1335
+ 0.002487875521183014,
1336
+ 0.010804742574691772,
1337
+ 0.012848813086748123,
1338
+ 0.0012782838894054294,
1339
+ 0.026987312361598015,
1340
+ 0.017897434532642365,
1341
+ 0.0032508480362594128,
1342
+ 0.0018659287597984076,
1343
+ 0.014394900761544704,
1344
+ 0.003501119092106819,
1345
+ 0.006911094766110182,
1346
+ 0.009087074548006058,
1347
+ 0.0016418073792010546,
1348
+ 0.004669916816055775,
1349
+ 0.019071029499173164,
1350
+ 0.005373222753405571,
1351
+ 0.0006761085242033005,
1352
+ 0.00045162433525547385,
1353
+ 0.006719629280269146,
1354
+ 0.007513158954679966,
1355
+ 0.002733794739469886,
1356
+ 0.04615173116326332,
1357
+ 0.006636207923293114,
1358
+ 0.00824967585504055,
1359
+ 0.004405905492603779,
1360
+ 0.005903213284909725,
1361
+ 0.01138284895569086,
1362
+ 0.0025351380463689566,
1363
+ 0.06793241202831268,
1364
+ 0.005575981922447681,
1365
+ 0.005631899926811457,
1366
+ 0.0036704731173813343,
1367
+ 0.010995674878358841,
1368
+ 0.006839643232524395,
1369
+ 0.0016634350176900625,
1370
+ 0.00783868320286274,
1371
+ 0.0003229841822758317,
1372
+ 0.0012815918307751417,
1373
+ 0.002405180362984538,
1374
+ 0.007452835328876972,
1375
+ 0.010544407181441784,
1376
+ 0.0028931081760674715,
1377
+ 0.004344127606600523,
1378
+ 0.002171870553866029,
1379
+ 0.00365426461212337,
1380
+ 0.011692658066749573,
1381
+ 0.0009850180940702558,
1382
+ 0.0026010049041360617,
1383
+ 0.00044118365622125566,
1384
+ 0.0003429003991186619,
1385
+ 0.0060530430637300014,
1386
+ 0.0007225353037938476,
1387
+ 0.0048428988084197044,
1388
+ 0.008732423186302185,
1389
+ 0.0014445744454860687,
1390
+ 0.018670761957764626,
1391
+ 0.00017304674838669598,
1392
+ 0.009912424720823765,
1393
+ 0.00906207226216793,
1394
+ 0.005737516097724438,
1395
+ 0.0067735351622104645,
1396
+ 0.0011667599901556969,
1397
+ 0.00191461481153965,
1398
+ 0.00020122816204093397,
1399
+ 0.001410648226737976,
1400
+ 0.006405932828783989,
1401
+ 0.0015682578086853027,
1402
+ 0.001102718524634838,
1403
+ 8.373481978196651e-05,
1404
+ 0.009828781709074974,
1405
+ 0.0020935870707035065,
1406
+ 0.0002035672659985721,
1407
+ 0.00022269962937571108,
1408
+ 0.0001766529749147594,
1409
+ 0.00014260719763115048,
1410
+ 0.012527580372989178,
1411
+ 1.0576462955214083e-05,
1412
+ 0.01100655272603035,
1413
+ 8.591853838879615e-05,
1414
+ 0.006023123860359192,
1415
+ 0.0008255345746874809,
1416
+ 2.0563868019962683e-05,
1417
+ 0.004955709911882877,
1418
+ 0.001584604731760919,
1419
+ 0.0050061955116689205,
1420
+ 0.00016951750149019063,
1421
+ 3.583452053135261e-05,
1422
+ 0.00014310883125290275,
1423
+ 0.0001688483462203294,
1424
+ 0.007586191408336163,
1425
+ 0.0011576192919164896,
1426
+ 3.7255649658618495e-05,
1427
+ 6.426421168725938e-05,
1428
+ 0.00040817269473336637,
1429
+ 0.006447537802159786,
1430
+ 0.03395574912428856,
1431
+ 0.0006136471638455987,
1432
+ 0.005575705785304308,
1433
+ 0.0032049526926130056,
1434
+ 0.010097612626850605,
1435
+ 0.006191258784383535,
1436
+ 0.005436952691525221,
1437
+ 0.01112685352563858,
1438
+ 0.0045395283959805965,
1439
+ 8.249337406596169e-05,
1440
+ 0.004922164604067802,
1441
+ 0.005476090125739574,
1442
+ 0.0017399060307070613,
1443
+ 0.007035619579255581,
1444
+ 0.0007214326178655028,
1445
+ 2.291693090228364e-05,
1446
+ 3.1971553653420415e-06,
1447
+ 0.00023343230714090168,
1448
+ 0.0002320274943485856,
1449
+ 0.0003754912759177387,
1450
+ 0.003981406334787607,
1451
+ 0.00023642885207664222,
1452
+ 3.009071406268049e-06,
1453
+ 1.161950876849005e-05,
1454
+ 8.238548616645858e-05,
1455
+ 0.0009311531321145594,
1456
+ 0.00017720420146360993,
1457
+ 0.004855811595916748,
1458
+ 1.2067213901900686e-05,
1459
+ 0.00033638064633123577,
1460
+ 1.394089667883236e-05,
1461
+ 0.0009420081041753292,
1462
+ 0.0002318583137821406,
1463
+ 0.00034358506673015654,
1464
+ 0.007310624700039625,
1465
+ 0.00010950634896289557,
1466
+ 0.004586211871355772,
1467
+ 2.008353294513654e-05,
1468
+ 0.0010729751083999872,
1469
+ 0.00040907826041802764,
1470
+ 0.00013855722500011325,
1471
+ 8.351419819518924e-05,
1472
+ 5.036394668422872e-06,
1473
+ 0.0009947380749508739,
1474
+ 6.696867785649374e-05,
1475
+ 0.0020369698759168386,
1476
+ 1.8229318811791018e-05,
1477
+ 0.0001292597153224051,
1478
+ 0.00010432380076963454,
1479
+ 6.665389719273662e-06,
1480
+ 0.0002083564322674647,
1481
+ 0.0004092064336873591,
1482
+ 7.959028152981773e-06,
1483
+ 2.3773649445502087e-05,
1484
+ 0.0038372615817934275,
1485
+ 0.0002493303909432143,
1486
+ 5.2793920986005105e-06,
1487
+ 4.785179771715775e-05,
1488
+ 0.00028111590654589236,
1489
+ 3.5398265936237294e-06,
1490
+ 0.0004384462081361562,
1491
+ 7.704014933551662e-06,
1492
+ 7.928567356429994e-06,
1493
+ 2.565624708950054e-05,
1494
+ 0.0001698183041298762,
1495
+ 9.799407052923925e-06,
1496
+ 9.231342119164765e-05,
1497
+ 5.7054494391195476e-05,
1498
+ 3.831291905953549e-06,
1499
+ 2.336510078748688e-05,
1500
+ 1.7051501345122233e-05,
1501
+ 4.266294126864523e-06,
1502
+ 5.003729529562406e-05,
1503
+ 1.928949677676428e-05,
1504
+ 0.00017112484783865511,
1505
+ 6.942585969227366e-06,
1506
+ 7.328124047489837e-05,
1507
+ 5.447128387459088e-06,
1508
+ 1.1434322004788555e-05,
1509
+ 6.850100180599838e-05,
1510
+ 0.0016534426249563694,
1511
+ 8.242504009103868e-06,
1512
+ 1.7369038687320426e-06,
1513
+ 0.0019085220992565155,
1514
+ 0.0008398008649237454,
1515
+ 0.0006672751624137163,
1516
+ 0.00375841255299747,
1517
+ 9.171140845865011e-06,
1518
+ 0.00024457444669678807,
1519
+ 0.0005654327687807381,
1520
+ 6.293559636105783e-06,
1521
+ 3.222317900508642e-06,
1522
+ 3.5538059819373302e-06,
1523
+ 1.044741384248482e-05,
1524
+ 2.5573756374797085e-06,
1525
+ 7.579227258247556e-06,
1526
+ 0.00015041269944049418,
1527
+ 8.011316094780341e-05,
1528
+ 3.87199834221974e-05,
1529
+ 5.500045972439693e-06,
1530
+ 1.005646845442243e-05,
1531
+ 0.010801905766129494,
1532
+ 2.8740305424435064e-06,
1533
+ 0.0003652515879366547,
1534
+ 8.872371108736843e-05,
1535
+ 1.3331699847185519e-05,
1536
+ 0.0003143040812574327,
1537
+ 3.1608587960363366e-06,
1538
+ 4.033338427689159e-06,
1539
+ 5.55466249352321e-06,
1540
+ 5.573667294811457e-06,
1541
+ 1.3822506844007876e-05,
1542
+ 5.380641596275382e-06,
1543
+ 0.0002552082878537476,
1544
+ 0.00014873349573463202,
1545
+ 0.00019721119315363467,
1546
+ 3.990438472101232e-06,
1547
+ 3.1747381399327423e-06,
1548
+ 1.3066473002254497e-05,
1549
+ 1.3943534213467501e-05,
1550
+ 4.306153641664423e-06,
1551
+ 0.003424054477363825,
1552
+ 2.1004128939239308e-05,
1553
+ 3.551704139681533e-05,
1554
+ 0.0007386493380181491,
1555
+ 2.6840225473279133e-06,
1556
+ 2.487375240889378e-05,
1557
+ 2.2416193132812623e-06,
1558
+ 0.0058481995947659016,
1559
+ 0.004598032217472792,
1560
+ 1.1445843028923264e-06,
1561
+ 4.5684268116019666e-05
1562
+ ],
1563
+ "zipf_loss": [
1564
+ 11.285626411437988,
1565
+ 8.5469388961792,
1566
+ 5.320335388183594,
1567
+ 3.767218589782715,
1568
+ 3.1796300411224365,
1569
+ 3.0120468139648438,
1570
+ 2.9520602226257324,
1571
+ 2.9325332641601562,
1572
+ 2.923217535018921,
1573
+ 2.9199328422546387,
1574
+ 2.9185163974761963,
1575
+ 2.9129607677459717,
1576
+ 2.883033514022827,
1577
+ 2.009091377258301,
1578
+ 0.24353228509426117,
1579
+ 0.1941249668598175,
1580
+ 0.04749487712979317,
1581
+ 0.03600744158029556,
1582
+ 0.026689842343330383,
1583
+ 0.01742704026401043,
1584
+ 0.014155315235257149,
1585
+ 0.017024187371134758,
1586
+ 0.012707581743597984,
1587
+ 0.01886345073580742,
1588
+ 0.01684136502444744,
1589
+ 0.027663227170705795,
1590
+ 0.045945003628730774,
1591
+ 0.05080542340874672,
1592
+ 0.05410684645175934,
1593
+ 0.04384762421250343,
1594
+ 0.03915369510650635,
1595
+ 0.03875356912612915,
1596
+ 0.02771097980439663,
1597
+ 0.021731721237301826,
1598
+ 0.025930888950824738,
1599
+ 0.027046270668506622,
1600
+ 0.022006195038557053,
1601
+ 0.01902031898498535,
1602
+ 0.020905204117298126,
1603
+ 0.020855877548456192,
1604
+ 0.015282095409929752,
1605
+ 0.01529134251177311,
1606
+ 0.014604698866605759,
1607
+ 0.013249149546027184,
1608
+ 0.028260793536901474,
1609
+ 0.012099381536245346,
1610
+ 0.022192221134901047,
1611
+ 0.010063612833619118,
1612
+ 0.01127258874475956,
1613
+ 0.012551696039736271,
1614
+ 0.02037505991756916,
1615
+ 0.00827052816748619,
1616
+ 0.006829372141510248,
1617
+ 0.0100149717181921,
1618
+ 0.0266830176115036,
1619
+ 0.012799793854355812,
1620
+ 0.023570306599140167,
1621
+ 0.016914743930101395,
1622
+ 0.01730828545987606,
1623
+ 0.00875080469995737,
1624
+ 0.013662377372384071,
1625
+ 0.01715860143303871,
1626
+ 0.009965881705284119,
1627
+ 0.004956849385052919,
1628
+ 0.004832414910197258,
1629
+ 0.009061310440301895,
1630
+ 0.012197121977806091,
1631
+ 0.006544884294271469,
1632
+ 0.020408371463418007,
1633
+ 0.039887260645627975,
1634
+ 0.012988101691007614,
1635
+ 0.0032295328564941883,
1636
+ 0.00932139903306961,
1637
+ 0.002145064063370228,
1638
+ 0.010843830183148384,
1639
+ 0.015223775058984756,
1640
+ 0.006636364385485649,
1641
+ 0.0263056643307209,
1642
+ 0.008271460421383381,
1643
+ 0.013385691680014133,
1644
+ 0.0030522430315613747,
1645
+ 0.0070436131209135056,
1646
+ 0.0064826663583517075,
1647
+ 0.0034574205055832863,
1648
+ 0.02009494975209236,
1649
+ 0.009706387296319008,
1650
+ 0.006005052477121353,
1651
+ 0.0034380692522972822,
1652
+ 0.004683607257902622,
1653
+ 0.008637895807623863,
1654
+ 0.005124982446432114,
1655
+ 0.0036689992994070053,
1656
+ 0.011816032230854034,
1657
+ 0.03934585303068161,
1658
+ 0.002062798012048006,
1659
+ 0.004693880677223206,
1660
+ 0.004000416025519371,
1661
+ 0.004214541986584663,
1662
+ 0.004499017260968685,
1663
+ 0.0067680589854717255,
1664
+ 0.004606388509273529,
1665
+ 0.011254856362938881,
1666
+ 0.012824291363358498,
1667
+ 0.014706926420331001,
1668
+ 0.011474795639514923,
1669
+ 0.029938679188489914,
1670
+ 0.011431977152824402,
1671
+ 0.0129978246986866,
1672
+ 0.009365284815430641,
1673
+ 0.009541323408484459,
1674
+ 0.007928065955638885,
1675
+ 0.004924816079437733,
1676
+ 0.04676493629813194,
1677
+ 0.0013944688253104687,
1678
+ 0.0041782185435295105,
1679
+ 0.018813494592905045,
1680
+ 0.008363252505660057,
1681
+ 0.009161192923784256,
1682
+ 0.004863737151026726,
1683
+ 0.011524049565196037,
1684
+ 0.0018024137243628502,
1685
+ 0.006750702857971191,
1686
+ 0.0067403484135866165,
1687
+ 0.008953789249062538,
1688
+ 0.005642112344503403,
1689
+ 0.013479547575116158,
1690
+ 0.0021623901557177305,
1691
+ 0.029320240020751953,
1692
+ 0.010861575603485107,
1693
+ 0.00788138434290886,
1694
+ 0.013817166909575462,
1695
+ 0.014404838904738426,
1696
+ 0.01187937706708908,
1697
+ 0.020834989845752716,
1698
+ 0.003884402569383383,
1699
+ 0.011435426771640778,
1700
+ 0.003956676926463842,
1701
+ 0.0021015757229179144,
1702
+ 0.002263993490487337,
1703
+ 0.0028001414611935616,
1704
+ 0.00649994844570756,
1705
+ 0.0021306348498910666,
1706
+ 0.019988827407360077,
1707
+ 0.00264377286657691,
1708
+ 0.0024151471443474293,
1709
+ 0.006057506427168846,
1710
+ 0.008786540478467941,
1711
+ 0.015809718519449234,
1712
+ 0.0030439659021794796,
1713
+ 0.007578206714242697,
1714
+ 0.010229166597127914,
1715
+ 0.001833135262131691,
1716
+ 0.006602782756090164,
1717
+ 0.002613284159451723,
1718
+ 0.008100843988358974,
1719
+ 0.00271791685372591,
1720
+ 0.007953394204378128,
1721
+ 0.03249310329556465,
1722
+ 0.019293881952762604,
1723
+ 0.01317145861685276,
1724
+ 0.003258969634771347,
1725
+ 0.024801120162010193,
1726
+ 0.014625225216150284,
1727
+ 0.002635540906339884,
1728
+ 0.002040124498307705,
1729
+ 0.0033249035477638245,
1730
+ 0.0030941711738705635,
1731
+ 0.0028975531458854675,
1732
+ 0.00436011515557766,
1733
+ 0.002031490206718445,
1734
+ 0.008293037302792072,
1735
+ 0.0046190437860786915,
1736
+ 0.0199637021869421,
1737
+ 0.010855032131075859,
1738
+ 0.007705803960561752,
1739
+ 0.00473202858120203,
1740
+ 0.00623058807104826,
1741
+ 0.0019678021781146526,
1742
+ 0.004115616902709007,
1743
+ 0.00422345194965601,
1744
+ 0.004935308359563351,
1745
+ 0.012432852759957314,
1746
+ 0.0062792375683784485,
1747
+ 0.007299851626157761,
1748
+ 0.002858368679881096,
1749
+ 0.007799813523888588,
1750
+ 0.005749467760324478,
1751
+ 0.0015069943619892001,
1752
+ 0.003612073138356209,
1753
+ 0.008235236629843712,
1754
+ 0.0018605850636959076,
1755
+ 0.00987850222736597,
1756
+ 0.006047021597623825,
1757
+ 0.00396173819899559,
1758
+ 0.0013247602619230747,
1759
+ 0.006117135286331177,
1760
+ 0.002430863678455353,
1761
+ 0.0022018789313733578,
1762
+ 0.003425393719226122,
1763
+ 0.002169111743569374,
1764
+ 0.0016562379896640778,
1765
+ 0.0014228317886590958,
1766
+ 0.002320891013368964,
1767
+ 0.0078055839985609055,
1768
+ 0.0013398686423897743,
1769
+ 0.0028115883469581604,
1770
+ 0.0020374455489218235,
1771
+ 0.004459431394934654,
1772
+ 0.017349809408187866,
1773
+ 0.007917150855064392,
1774
+ 0.0027387626469135284,
1775
+ 0.0017491262406110764,
1776
+ 0.005496285855770111,
1777
+ 0.002727912738919258,
1778
+ 0.007084077224135399,
1779
+ 0.0023733749985694885,
1780
+ 0.007816703990101814,
1781
+ 0.006155618466436863,
1782
+ 0.006562959402799606,
1783
+ 0.001349154394119978,
1784
+ 0.0028901174664497375,
1785
+ 0.003939938731491566,
1786
+ 0.0052385590970516205,
1787
+ 0.019526738673448563,
1788
+ 0.0016574084293097258,
1789
+ 0.004693618975579739,
1790
+ 0.0016472507268190384,
1791
+ 0.0069608259946107864,
1792
+ 0.0012539103627204895,
1793
+ 0.002752535045146942,
1794
+ 0.008379869163036346,
1795
+ 0.010635429993271828,
1796
+ 0.0014861254021525383,
1797
+ 0.01806875504553318,
1798
+ 0.005504699423909187,
1799
+ 0.004922785796225071,
1800
+ 0.0038726171478629112,
1801
+ 0.0022457530722022057,
1802
+ 0.005341008305549622,
1803
+ 0.005486038513481617,
1804
+ 0.011664791032671928,
1805
+ 0.002224674681201577,
1806
+ 0.004180466756224632,
1807
+ 0.004839997738599777,
1808
+ 0.008689593523740768,
1809
+ 0.002344392938539386,
1810
+ 0.012826589867472649,
1811
+ 0.0028975000604987144,
1812
+ 0.008374970406293869,
1813
+ 0.007366897538304329,
1814
+ 0.003254727926105261,
1815
+ 0.001986307092010975,
1816
+ 0.012433165684342384,
1817
+ 0.003307197242975235,
1818
+ 0.006356198340654373,
1819
+ 0.002379254437983036,
1820
+ 0.005505101755261421,
1821
+ 0.0012494893744587898,
1822
+ 0.014070112258195877,
1823
+ 0.0013275519013404846,
1824
+ 0.002966462168842554,
1825
+ 0.0023073574993759394,
1826
+ 0.00617084838449955,
1827
+ 0.0033510299399495125,
1828
+ 0.00433387141674757,
1829
+ 0.0025322227738797665,
1830
+ 0.0021405271254479885,
1831
+ 0.001259658019989729,
1832
+ 0.005158456042408943,
1833
+ 0.002433418994769454,
1834
+ 0.004457367584109306,
1835
+ 0.002801033202558756,
1836
+ 0.008296439424157143,
1837
+ 0.007170850411057472,
1838
+ 0.004576575011014938,
1839
+ 0.0050222985446453094,
1840
+ 0.002867069561034441,
1841
+ 0.001451676245778799,
1842
+ 0.0062880851328372955,
1843
+ 0.005015293136239052,
1844
+ 0.00376853346824646,
1845
+ 0.0019123069941997528,
1846
+ 0.0017760999035090208,
1847
+ 0.0023665805347263813,
1848
+ 0.006630713120102882,
1849
+ 0.002140127355232835,
1850
+ 0.005641967058181763,
1851
+ 0.0022922551725059748,
1852
+ 0.00905453972518444,
1853
+ 0.002672804519534111,
1854
+ 0.001575235277414322,
1855
+ 0.007939880713820457,
1856
+ 0.0030993595719337463,
1857
+ 0.0030933814123272896,
1858
+ 0.0020398027263581753,
1859
+ 0.00489910040050745,
1860
+ 0.005947738885879517,
1861
+ 0.004185874946415424,
1862
+ 0.0027309805154800415,
1863
+ 0.00648793950676918,
1864
+ 0.0017585107125341892,
1865
+ 0.002823358401656151,
1866
+ 0.01656787097454071,
1867
+ 0.009470885619521141,
1868
+ 0.008174968883395195,
1869
+ 0.0036312490701675415,
1870
+ 0.005932582542300224,
1871
+ 0.005618139170110226,
1872
+ 0.0014313401188701391,
1873
+ 0.004884552210569382
1874
+ ],
1875
+ "denoise_loss": [],
1876
+ "ortho_loss": [
1877
+ 0.6644464731216431,
1878
+ 0.390718936920166,
1879
+ 0.3397873342037201,
1880
+ 0.220010444521904,
1881
+ 0.17606858909130096,
1882
+ 0.11906886100769043,
1883
+ 0.09468584507703781,
1884
+ 0.0884234756231308,
1885
+ 0.06945794820785522,
1886
+ 0.0574568510055542,
1887
+ 0.04932135343551636,
1888
+ 0.06153758242726326,
1889
+ 0.05611604079604149,
1890
+ 0.05805246904492378,
1891
+ 0.07358357310295105,
1892
+ 0.05414161831140518,
1893
+ 0.05728568509221077,
1894
+ 0.05426923185586929,
1895
+ 0.05367695167660713,
1896
+ 0.05449531227350235,
1897
+ 0.06227414682507515,
1898
+ 0.0533452033996582,
1899
+ 0.04716930538415909,
1900
+ 0.0462658666074276,
1901
+ 0.05089081451296806,
1902
+ 0.04803353548049927,
1903
+ 0.044982124119997025,
1904
+ 0.05346018075942993,
1905
+ 0.05227212980389595,
1906
+ 0.05755770206451416,
1907
+ 0.07542824745178223,
1908
+ 0.09152878820896149,
1909
+ 0.10082665830850601,
1910
+ 0.09812896698713303,
1911
+ 0.12396321445703506,
1912
+ 0.12976472079753876,
1913
+ 0.10502009838819504,
1914
+ 0.11594293266534805,
1915
+ 0.12908928096294403,
1916
+ 0.1413189023733139,
1917
+ 0.13866053521633148,
1918
+ 0.12943346798419952,
1919
+ 0.13647392392158508,
1920
+ 0.1408652812242508,
1921
+ 0.15507225692272186,
1922
+ 0.16842518746852875,
1923
+ 0.2103387862443924,
1924
+ 0.20515666902065277,
1925
+ 0.21254098415374756,
1926
+ 0.21778546273708344,
1927
+ 0.22489629685878754,
1928
+ 0.23182642459869385,
1929
+ 0.2397346943616867,
1930
+ 0.2505520284175873,
1931
+ 0.25581789016723633,
1932
+ 0.2709047496318817,
1933
+ 0.2767433822154999,
1934
+ 0.28250429034233093,
1935
+ 0.27925848960876465,
1936
+ 0.29402247071266174,
1937
+ 0.29541489481925964,
1938
+ 0.30194178223609924,
1939
+ 0.2817853093147278,
1940
+ 0.29107022285461426,
1941
+ 0.2928965985774994,
1942
+ 0.30889639258384705,
1943
+ 0.30842041969299316,
1944
+ 0.30617886781692505,
1945
+ 0.3055952489376068,
1946
+ 0.3025607466697693,
1947
+ 0.3075685501098633,
1948
+ 0.3120739758014679,
1949
+ 0.320017546415329,
1950
+ 0.323820024728775,
1951
+ 0.31776610016822815,
1952
+ 0.3086092174053192,
1953
+ 0.3121654987335205,
1954
+ 0.32862967252731323,
1955
+ 0.32827210426330566,
1956
+ 0.3089290261268616,
1957
+ 0.3160431981086731,
1958
+ 0.3320402503013611,
1959
+ 0.33413752913475037,
1960
+ 0.3475281000137329,
1961
+ 0.34444400668144226,
1962
+ 0.3437744081020355,
1963
+ 0.340019553899765,
1964
+ 0.3456742465496063,
1965
+ 0.35318875312805176,
1966
+ 0.3524748682975769,
1967
+ 0.3447343111038208,
1968
+ 0.3309643268585205,
1969
+ 0.3429817855358124,
1970
+ 0.3501330316066742,
1971
+ 0.37218067049980164,
1972
+ 0.3503168821334839,
1973
+ 0.34891870617866516,
1974
+ 0.35859641432762146,
1975
+ 0.35393843054771423,
1976
+ 0.35644397139549255,
1977
+ 0.3608522117137909,
1978
+ 0.36008793115615845,
1979
+ 0.3715854287147522,
1980
+ 0.36290615797042847,
1981
+ 0.35269445180892944,
1982
+ 0.3623688220977783,
1983
+ 0.37372899055480957,
1984
+ 0.3635806739330292,
1985
+ 0.3644300401210785,
1986
+ 0.3613739013671875,
1987
+ 0.3820236027240753,
1988
+ 0.3934689462184906,
1989
+ 0.40816766023635864,
1990
+ 0.39851799607276917,
1991
+ 0.38966116309165955,
1992
+ 0.39526575803756714,
1993
+ 0.39007678627967834,
1994
+ 0.3972146511077881,
1995
+ 0.40363237261772156,
1996
+ 0.3965681791305542,
1997
+ 0.3984060287475586,
1998
+ 0.40615272521972656,
1999
+ 0.3946124017238617,
2000
+ 0.3920044004917145,
2001
+ 0.40209197998046875,
2002
+ 0.4067413806915283,
2003
+ 0.40874406695365906,
2004
+ 0.4083837568759918,
2005
+ 0.40983501076698303,
2006
+ 0.40673351287841797,
2007
+ 0.4112052023410797,
2008
+ 0.4046363830566406,
2009
+ 0.42072486877441406,
2010
+ 0.4345296025276184,
2011
+ 0.43328163027763367,
2012
+ 0.4279066026210785,
2013
+ 0.41759130358695984,
2014
+ 0.4037562906742096,
2015
+ 0.4145204722881317,
2016
+ 0.4159364402294159,
2017
+ 0.409978449344635,
2018
+ 0.40836572647094727,
2019
+ 0.42102542519569397,
2020
+ 0.4176710247993469,
2021
+ 0.4233308732509613,
2022
+ 0.41641727089881897,
2023
+ 0.437593936920166,
2024
+ 0.43382301926612854,
2025
+ 0.4270397126674652,
2026
+ 0.43054914474487305,
2027
+ 0.427566260099411,
2028
+ 0.4299742877483368,
2029
+ 0.43167996406555176,
2030
+ 0.43732354044914246,
2031
+ 0.4419519603252411,
2032
+ 0.44340643286705017,
2033
+ 0.44566842913627625,
2034
+ 0.4446880519390106,
2035
+ 0.4471912384033203,
2036
+ 0.4491994380950928,
2037
+ 0.45555001497268677,
2038
+ 0.4542686939239502,
2039
+ 0.43496283888816833,
2040
+ 0.4431009292602539,
2041
+ 0.4456893503665924,
2042
+ 0.4535500705242157,
2043
+ 0.45205479860305786,
2044
+ 0.44086360931396484,
2045
+ 0.46105995774269104,
2046
+ 0.4644389748573303,
2047
+ 0.4546182155609131,
2048
+ 0.4628783166408539,
2049
+ 0.463123619556427,
2050
+ 0.4668252468109131,
2051
+ 0.4742497503757477,
2052
+ 0.4820367395877838,
2053
+ 0.4765673577785492,
2054
+ 0.47878319025039673,
2055
+ 0.4698505401611328,
2056
+ 0.4846014082431793,
2057
+ 0.48912617564201355,
2058
+ 0.4972328245639801,
2059
+ 0.5014645457267761,
2060
+ 0.5092229247093201,
2061
+ 0.5129060745239258,
2062
+ 0.522394597530365,
2063
+ 0.5310458540916443,
2064
+ 0.5425419807434082,
2065
+ 0.5471708178520203,
2066
+ 0.5470795631408691,
2067
+ 0.5413408279418945,
2068
+ 0.5409379005432129,
2069
+ 0.5409113764762878,
2070
+ 0.537050724029541,
2071
+ 0.5376296639442444,
2072
+ 0.5384513139724731,
2073
+ 0.5365539789199829,
2074
+ 0.5468458533287048,
2075
+ 0.5518631339073181,
2076
+ 0.5440913438796997,
2077
+ 0.5436188578605652,
2078
+ 0.5479923486709595,
2079
+ 0.5452127456665039,
2080
+ 0.5501694083213806,
2081
+ 0.5610882639884949,
2082
+ 0.556338906288147,
2083
+ 0.5536699295043945,
2084
+ 0.5646674036979675,
2085
+ 0.5674131512641907,
2086
+ 0.5633151531219482,
2087
+ 0.567596435546875,
2088
+ 0.564018726348877,
2089
+ 0.5691948533058167,
2090
+ 0.5586506724357605,
2091
+ 0.5658769607543945,
2092
+ 0.5602114796638489,
2093
+ 0.5630201697349548,
2094
+ 0.5669975876808167,
2095
+ 0.5680027008056641,
2096
+ 0.562749445438385,
2097
+ 0.5649909377098083,
2098
+ 0.5620891451835632,
2099
+ 0.5636012554168701,
2100
+ 0.5655064582824707,
2101
+ 0.5570403337478638,
2102
+ 0.5550257563591003,
2103
+ 0.5560483336448669,
2104
+ 0.5633824467658997,
2105
+ 0.5675045847892761,
2106
+ 0.5643922686576843,
2107
+ 0.5696682333946228,
2108
+ 0.5690222978591919,
2109
+ 0.5665627717971802,
2110
+ 0.5666993260383606,
2111
+ 0.5652199983596802,
2112
+ 0.5618746876716614,
2113
+ 0.5575634837150574,
2114
+ 0.5577389001846313,
2115
+ 0.5654399394989014,
2116
+ 0.5689845085144043,
2117
+ 0.5666268467903137,
2118
+ 0.5639982223510742,
2119
+ 0.5644475817680359,
2120
+ 0.5620675086975098,
2121
+ 0.564915657043457,
2122
+ 0.5630634427070618,
2123
+ 0.5648998618125916,
2124
+ 0.5590072870254517,
2125
+ 0.5604531764984131,
2126
+ 0.5593754649162292,
2127
+ 0.5623536109924316,
2128
+ 0.5646090507507324,
2129
+ 0.5602173209190369,
2130
+ 0.5559281706809998,
2131
+ 0.5578214526176453,
2132
+ 0.5604626536369324,
2133
+ 0.5620313882827759,
2134
+ 0.5616292953491211,
2135
+ 0.5635948181152344,
2136
+ 0.5586933493614197,
2137
+ 0.5560607314109802,
2138
+ 0.554778516292572,
2139
+ 0.5548190474510193,
2140
+ 0.5562477707862854,
2141
+ 0.5549036860466003,
2142
+ 0.5571350455284119,
2143
+ 0.555806577205658,
2144
+ 0.5569379925727844,
2145
+ 0.5573353171348572,
2146
+ 0.5563571453094482,
2147
+ 0.5522323846817017,
2148
+ 0.5545682311058044,
2149
+ 0.5520962476730347,
2150
+ 0.5536748766899109,
2151
+ 0.5544080138206482,
2152
+ 0.550173282623291,
2153
+ 0.551995575428009,
2154
+ 0.5538771152496338,
2155
+ 0.5502065420150757,
2156
+ 0.5552479028701782,
2157
+ 0.5531644225120544,
2158
+ 0.552257239818573,
2159
+ 0.5502626299858093,
2160
+ 0.5510493516921997,
2161
+ 0.5554757118225098,
2162
+ 0.5564853549003601,
2163
+ 0.5578190684318542,
2164
+ 0.5565758943557739,
2165
+ 0.5565757155418396,
2166
+ 0.5545722842216492,
2167
+ 0.5547272562980652,
2168
+ 0.5568007826805115,
2169
+ 0.5567353367805481,
2170
+ 0.5578407645225525,
2171
+ 0.5593713521957397,
2172
+ 0.5583187937736511,
2173
+ 0.5594400763511658,
2174
+ 0.5608003735542297,
2175
+ 0.5613595247268677,
2176
+ 0.5619935989379883,
2177
+ 0.5630896687507629,
2178
+ 0.5623959302902222,
2179
+ 0.5624557137489319,
2180
+ 0.5634995698928833,
2181
+ 0.5621915459632874,
2182
+ 0.5627752542495728,
2183
+ 0.5633371472358704,
2184
+ 0.5640240907669067,
2185
+ 0.5638148188591003,
2186
+ 0.5640226006507874
2187
+ ],
2188
+ "lr": [
2189
+ 8.376068376068378e-06,
2190
+ 1.6923076923076924e-05,
2191
+ 2.5470085470085475e-05,
2192
+ 3.401709401709402e-05,
2193
+ 4.2564102564102564e-05,
2194
+ 5.1111111111111115e-05,
2195
+ 5.9658119658119666e-05,
2196
+ 6.820512820512821e-05,
2197
+ 7.675213675213675e-05,
2198
+ 8e-05,
2199
+ 8e-05,
2200
+ 8e-05,
2201
+ 8e-05,
2202
+ 8e-05,
2203
+ 8e-05,
2204
+ 8e-05,
2205
+ 8e-05,
2206
+ 8e-05,
2207
+ 8e-05,
2208
+ 8e-05,
2209
+ 8e-05,
2210
+ 8e-05,
2211
+ 8e-05,
2212
+ 8e-05,
2213
+ 8e-05,
2214
+ 8e-05,
2215
+ 8e-05,
2216
+ 8e-05,
2217
+ 8e-05,
2218
+ 8e-05,
2219
+ 8e-05,
2220
+ 8e-05,
2221
+ 8e-05,
2222
+ 8e-05,
2223
+ 8e-05,
2224
+ 8e-05,
2225
+ 8e-05,
2226
+ 8e-05,
2227
+ 8e-05,
2228
+ 8e-05,
2229
+ 8e-05,
2230
+ 8e-05,
2231
+ 8e-05,
2232
+ 8e-05,
2233
+ 8e-05,
2234
+ 8e-05,
2235
+ 8e-05,
2236
+ 8e-05,
2237
+ 8e-05,
2238
+ 8e-05,
2239
+ 8e-05,
2240
+ 8e-05,
2241
+ 8e-05,
2242
+ 8e-05,
2243
+ 8e-05,
2244
+ 8e-05,
2245
+ 8e-05,
2246
+ 8e-05,
2247
+ 8e-05,
2248
+ 8e-05,
2249
+ 8e-05,
2250
+ 8e-05,
2251
+ 8e-05,
2252
+ 8e-05,
2253
+ 8e-05,
2254
+ 8e-05,
2255
+ 8e-05,
2256
+ 8e-05,
2257
+ 8e-05,
2258
+ 8e-05,
2259
+ 8e-05,
2260
+ 8e-05,
2261
+ 8e-05,
2262
+ 8e-05,
2263
+ 8e-05,
2264
+ 8e-05,
2265
+ 8e-05,
2266
+ 8e-05,
2267
+ 8e-05,
2268
+ 8e-05,
2269
+ 8e-05,
2270
+ 8e-05,
2271
+ 8e-05,
2272
+ 8e-05,
2273
+ 8e-05,
2274
+ 8e-05,
2275
+ 8e-05,
2276
+ 8e-05,
2277
+ 8e-05,
2278
+ 8e-05,
2279
+ 8e-05,
2280
+ 8e-05,
2281
+ 8e-05,
2282
+ 8e-05,
2283
+ 8e-05,
2284
+ 8e-05,
2285
+ 8e-05,
2286
+ 8e-05,
2287
+ 8e-05,
2288
+ 8e-05,
2289
+ 8e-05,
2290
+ 8e-05,
2291
+ 8e-05,
2292
+ 8e-05,
2293
+ 8e-05,
2294
+ 8e-05,
2295
+ 8e-05,
2296
+ 8e-05,
2297
+ 8e-05,
2298
+ 8e-05,
2299
+ 8e-05,
2300
+ 8e-05,
2301
+ 8e-05,
2302
+ 8e-05,
2303
+ 8e-05,
2304
+ 8e-05,
2305
+ 8e-05,
2306
+ 8e-05,
2307
+ 8e-05,
2308
+ 8e-05,
2309
+ 8e-05,
2310
+ 8e-05,
2311
+ 8e-05,
2312
+ 8e-05,
2313
+ 8e-05,
2314
+ 8e-05,
2315
+ 8e-05,
2316
+ 8e-05,
2317
+ 8e-05,
2318
+ 8e-05,
2319
+ 8e-05,
2320
+ 8e-05,
2321
+ 8e-05,
2322
+ 8e-05,
2323
+ 8e-05,
2324
+ 8e-05,
2325
+ 8e-05,
2326
+ 8e-05,
2327
+ 8e-05,
2328
+ 8e-05,
2329
+ 8e-05,
2330
+ 8e-05,
2331
+ 8e-05,
2332
+ 8e-05,
2333
+ 8e-05,
2334
+ 8e-05,
2335
+ 8e-05,
2336
+ 8e-05,
2337
+ 8e-05,
2338
+ 8e-05,
2339
+ 8e-05,
2340
+ 8e-05,
2341
+ 8e-05,
2342
+ 8e-05,
2343
+ 8e-05,
2344
+ 8e-05,
2345
+ 8e-05,
2346
+ 8e-05,
2347
+ 8e-05,
2348
+ 8e-05,
2349
+ 8e-05,
2350
+ 8e-05,
2351
+ 8e-05,
2352
+ 8e-05,
2353
+ 8e-05,
2354
+ 8e-05,
2355
+ 8e-05,
2356
+ 8e-05,
2357
+ 8e-05,
2358
+ 8e-05,
2359
+ 8e-05,
2360
+ 8e-05,
2361
+ 8e-05,
2362
+ 8e-05,
2363
+ 8e-05,
2364
+ 8e-05,
2365
+ 8e-05,
2366
+ 8e-05,
2367
+ 8e-05,
2368
+ 8e-05,
2369
+ 8e-05,
2370
+ 8e-05,
2371
+ 8e-05,
2372
+ 8e-05,
2373
+ 8e-05,
2374
+ 8e-05,
2375
+ 8e-05,
2376
+ 8e-05,
2377
+ 8e-05,
2378
+ 7.985991294024534e-05,
2379
+ 7.926632370399684e-05,
2380
+ 7.867273446774832e-05,
2381
+ 7.80791452314998e-05,
2382
+ 7.74855559952513e-05,
2383
+ 7.689196675900277e-05,
2384
+ 7.629837752275426e-05,
2385
+ 7.570478828650574e-05,
2386
+ 7.511119905025723e-05,
2387
+ 7.45176098140087e-05,
2388
+ 7.392402057776018e-05,
2389
+ 7.33304313415117e-05,
2390
+ 7.273684210526317e-05,
2391
+ 7.214325286901464e-05,
2392
+ 7.154966363276613e-05,
2393
+ 7.095607439651762e-05,
2394
+ 7.03624851602691e-05,
2395
+ 6.976889592402057e-05,
2396
+ 6.917530668777208e-05,
2397
+ 6.858171745152355e-05,
2398
+ 6.798812821527503e-05,
2399
+ 6.739453897902653e-05,
2400
+ 6.6800949742778e-05,
2401
+ 6.620736050652948e-05,
2402
+ 6.561377127028096e-05,
2403
+ 6.502018203403246e-05,
2404
+ 6.442659279778393e-05,
2405
+ 6.383300356153542e-05,
2406
+ 6.308508112386229e-05,
2407
+ 6.249149188761377e-05,
2408
+ 6.189790265136525e-05,
2409
+ 6.130431341511676e-05,
2410
+ 6.0710724178868226e-05,
2411
+ 6.011713494261971e-05,
2412
+ 5.95235457063712e-05,
2413
+ 5.892995647012267e-05,
2414
+ 5.8336367233874154e-05,
2415
+ 5.7742777997625637e-05,
2416
+ 5.714918876137714e-05,
2417
+ 5.6555599525128614e-05,
2418
+ 5.59620102888801e-05,
2419
+ 5.5368421052631586e-05,
2420
+ 5.477483181638306e-05,
2421
+ 5.418124258013454e-05,
2422
+ 5.3587653343886025e-05,
2423
+ 5.299406410763753e-05,
2424
+ 5.2400474871389e-05,
2425
+ 5.1806885635140485e-05,
2426
+ 5.1213296398891974e-05,
2427
+ 5.061970716264345e-05,
2428
+ 5.002611792639493e-05,
2429
+ 4.943252869014643e-05,
2430
+ 4.883893945389792e-05,
2431
+ 4.8245350217649385e-05,
2432
+ 4.765176098140087e-05,
2433
+ 4.705817174515236e-05,
2434
+ 4.646458250890383e-05,
2435
+ 4.587099327265532e-05,
2436
+ 4.5277404036406817e-05,
2437
+ 4.452948159873368e-05,
2438
+ 4.393589236248516e-05,
2439
+ 4.3342303126236656e-05,
2440
+ 4.274871388998813e-05,
2441
+ 4.2155124653739606e-05,
2442
+ 4.156153541749111e-05,
2443
+ 4.096794618124259e-05,
2444
+ 4.037435694499406e-05,
2445
+ 3.978076770874554e-05,
2446
+ 3.918717847249704e-05,
2447
+ 3.859358923624852e-05,
2448
+ 3.7999999999999995e-05,
2449
+ 3.740641076375149e-05,
2450
+ 3.681282152750297e-05,
2451
+ 3.621923229125445e-05,
2452
+ 3.562564305500593e-05,
2453
+ 3.5032053818757427e-05,
2454
+ 3.443846458250891e-05,
2455
+ 3.3844875346260384e-05,
2456
+ 3.325128611001188e-05,
2457
+ 3.265769687376336e-05,
2458
+ 3.206410763751484e-05,
2459
+ 3.147051840126632e-05,
2460
+ 3.0876929165017815e-05,
2461
+ 3.0283339928769294e-05,
2462
+ 2.968975069252077e-05,
2463
+ 2.909616145627227e-05,
2464
+ 2.850257222002375e-05,
2465
+ 2.7908982983775223e-05,
2466
+ 2.7315393747526725e-05,
2467
+ 2.67218045112782e-05,
2468
+ 2.597388207360506e-05,
2469
+ 2.5380292837356554e-05,
2470
+ 2.4786703601108037e-05,
2471
+ 2.4193114364859512e-05,
2472
+ 2.359952512861101e-05,
2473
+ 2.300593589236249e-05,
2474
+ 2.241234665611397e-05,
2475
+ 2.1818757419865447e-05,
2476
+ 2.1225168183616943e-05,
2477
+ 2.0631578947368425e-05,
2478
+ 2.0037989711119897e-05,
2479
+ 1.94444004748714e-05,
2480
+ 1.8850811238622875e-05,
2481
+ 1.8257222002374354e-05,
2482
+ 1.7663632766125833e-05,
2483
+ 1.7070043529877332e-05,
2484
+ 1.647645429362881e-05,
2485
+ 1.5882865057380286e-05,
2486
+ 1.5289275821131785e-05,
2487
+ 1.4695686584883264e-05,
2488
+ 1.4102097348634743e-05,
2489
+ 1.350850811238622e-05,
2490
+ 1.291491887613772e-05,
2491
+ 1.2321329639889196e-05,
2492
+ 1.1727740403640675e-05,
2493
+ 1.1134151167392172e-05,
2494
+ 1.0540561931143651e-05,
2495
+ 9.94697269489513e-06,
2496
+ 9.353383458646628e-06,
2497
+ 8.759794222398106e-06,
2498
+ 8.166204986149583e-06
2499
+ ],
2500
+ "emb_lr": [],
2501
+ "eval_step": [
2502
+ 1550,
2503
+ 3113,
2504
+ 4676,
2505
+ 6239,
2506
+ 7802,
2507
+ 9365,
2508
+ 10928,
2509
+ 12491,
2510
+ 14054,
2511
+ 15617
2512
+ ],
2513
+ "eval_accuracy": [
2514
+ 0.06,
2515
+ 0.81,
2516
+ 0.95,
2517
+ 0.99,
2518
+ 1.0,
2519
+ 1.0,
2520
+ 1.0,
2521
+ 1.0,
2522
+ 1.0,
2523
+ 1.0
2524
+ ]
2525
+ },
2526
+ "final_accuracy": 0.99875,
2527
+ "sft_eval": {
2528
+ "config": {
2529
+ "ops": "add_sub",
2530
+ "K": null,
2531
+ "mode": "sft",
2532
+ "n_digits": 6,
2533
+ "n_per_split": 100
2534
+ },
2535
+ "splits": {
2536
+ "add_S0": {
2537
+ "full_accuracy": 0.99,
2538
+ "n_examples": 100,
2539
+ "per_subtask": {
2540
+ "SA": {
2541
+ "accuracy": 0.9983471074380166,
2542
+ "count": 605
2543
+ },
2544
+ "SS": {
2545
+ "accuracy": 1.0,
2546
+ "count": 95
2547
+ }
2548
+ }
2549
+ },
2550
+ "add_S1": {
2551
+ "full_accuracy": 1.0,
2552
+ "n_examples": 100,
2553
+ "per_subtask": {
2554
+ "SA": {
2555
+ "accuracy": 1.0,
2556
+ "count": 204
2557
+ },
2558
+ "SC": {
2559
+ "accuracy": 1.0,
2560
+ "count": 169
2561
+ },
2562
+ "SS": {
2563
+ "accuracy": 1.0,
2564
+ "count": 31
2565
+ },
2566
+ "UC": {
2567
+ "accuracy": 1.0,
2568
+ "count": 296
2569
+ }
2570
+ }
2571
+ },
2572
+ "add_S2": {
2573
+ "full_accuracy": 0.97,
2574
+ "n_examples": 100,
2575
+ "per_subtask": {
2576
+ "SA": {
2577
+ "accuracy": 1.0,
2578
+ "count": 163
2579
+ },
2580
+ "SC": {
2581
+ "accuracy": 0.9923076923076923,
2582
+ "count": 130
2583
+ },
2584
+ "SS": {
2585
+ "accuracy": 0.9770114942528736,
2586
+ "count": 87
2587
+ },
2588
+ "UC": {
2589
+ "accuracy": 0.9950738916256158,
2590
+ "count": 203
2591
+ },
2592
+ "US": {
2593
+ "accuracy": 1.0,
2594
+ "count": 117
2595
+ }
2596
+ }
2597
+ },
2598
+ "add_S3": {
2599
+ "full_accuracy": 0.55,
2600
+ "n_examples": 100,
2601
+ "per_subtask": {
2602
+ "SA": {
2603
+ "accuracy": 1.0,
2604
+ "count": 121
2605
+ },
2606
+ "SC": {
2607
+ "accuracy": 1.0,
2608
+ "count": 121
2609
+ },
2610
+ "SS": {
2611
+ "accuracy": 1.0,
2612
+ "count": 49
2613
+ },
2614
+ "UC": {
2615
+ "accuracy": 0.7634408602150538,
2616
+ "count": 186
2617
+ },
2618
+ "US": {
2619
+ "accuracy": 0.9865470852017937,
2620
+ "count": 223
2621
+ }
2622
+ }
2623
+ },
2624
+ "add_S4": {
2625
+ "full_accuracy": 0.48,
2626
+ "n_examples": 100,
2627
+ "per_subtask": {
2628
+ "SA": {
2629
+ "accuracy": 1.0,
2630
+ "count": 104
2631
+ },
2632
+ "SC": {
2633
+ "accuracy": 1.0,
2634
+ "count": 106
2635
+ },
2636
+ "SS": {
2637
+ "accuracy": 1.0,
2638
+ "count": 23
2639
+ },
2640
+ "UC": {
2641
+ "accuracy": 0.74375,
2642
+ "count": 160
2643
+ },
2644
+ "US": {
2645
+ "accuracy": 0.8501628664495114,
2646
+ "count": 307
2647
+ }
2648
+ }
2649
+ },
2650
+ "add_S5": {
2651
+ "full_accuracy": 0.43,
2652
+ "n_examples": 100,
2653
+ "per_subtask": {
2654
+ "SA": {
2655
+ "accuracy": 1.0,
2656
+ "count": 100
2657
+ },
2658
+ "SC": {
2659
+ "accuracy": 1.0,
2660
+ "count": 100
2661
+ },
2662
+ "UC": {
2663
+ "accuracy": 0.54,
2664
+ "count": 100
2665
+ },
2666
+ "US": {
2667
+ "accuracy": 0.685,
2668
+ "count": 400
2669
+ }
2670
+ }
2671
+ },
2672
+ "add_S6": {
2673
+ "full_accuracy": 0.77,
2674
+ "n_examples": 100,
2675
+ "per_subtask": {
2676
+ "SC": {
2677
+ "accuracy": 1.0,
2678
+ "count": 100
2679
+ },
2680
+ "UC": {
2681
+ "accuracy": 0.86,
2682
+ "count": 100
2683
+ },
2684
+ "US": {
2685
+ "accuracy": 0.89,
2686
+ "count": 500
2687
+ }
2688
+ }
2689
+ },
2690
+ "add_random": {
2691
+ "full_accuracy": 0.98,
2692
+ "n_examples": 200,
2693
+ "per_subtask": {
2694
+ "SA": {
2695
+ "accuracy": 0.9977628635346756,
2696
+ "count": 447
2697
+ },
2698
+ "SC": {
2699
+ "accuracy": 1.0,
2700
+ "count": 320
2701
+ },
2702
+ "SS": {
2703
+ "accuracy": 1.0,
2704
+ "count": 56
2705
+ },
2706
+ "UC": {
2707
+ "accuracy": 0.994328922495274,
2708
+ "count": 529
2709
+ },
2710
+ "US": {
2711
+ "accuracy": 1.0,
2712
+ "count": 48
2713
+ }
2714
+ }
2715
+ },
2716
+ "add_C3": {
2717
+ "full_accuracy": 0.79,
2718
+ "n_examples": 100,
2719
+ "per_subtask": {
2720
+ "SA": {
2721
+ "accuracy": 1.0,
2722
+ "count": 300
2723
+ },
2724
+ "SC": {
2725
+ "accuracy": 1.0,
2726
+ "count": 100
2727
+ },
2728
+ "UC": {
2729
+ "accuracy": 0.8911917098445595,
2730
+ "count": 193
2731
+ },
2732
+ "US": {
2733
+ "accuracy": 0.9626168224299065,
2734
+ "count": 107
2735
+ }
2736
+ }
2737
+ },
2738
+ "add_C4": {
2739
+ "full_accuracy": 0.72,
2740
+ "n_examples": 100,
2741
+ "per_subtask": {
2742
+ "SA": {
2743
+ "accuracy": 1.0,
2744
+ "count": 200
2745
+ },
2746
+ "SC": {
2747
+ "accuracy": 1.0,
2748
+ "count": 100
2749
+ },
2750
+ "UC": {
2751
+ "accuracy": 0.8984375,
2752
+ "count": 256
2753
+ },
2754
+ "US": {
2755
+ "accuracy": 0.9305555555555556,
2756
+ "count": 144
2757
+ }
2758
+ }
2759
+ },
2760
+ "add_C5": {
2761
+ "full_accuracy": 0.7,
2762
+ "n_examples": 100,
2763
+ "per_subtask": {
2764
+ "SA": {
2765
+ "accuracy": 1.0,
2766
+ "count": 100
2767
+ },
2768
+ "SC": {
2769
+ "accuracy": 1.0,
2770
+ "count": 100
2771
+ },
2772
+ "UC": {
2773
+ "accuracy": 0.9215686274509803,
2774
+ "count": 306
2775
+ },
2776
+ "US": {
2777
+ "accuracy": 0.8762886597938144,
2778
+ "count": 194
2779
+ }
2780
+ }
2781
+ },
2782
+ "add_C6": {
2783
+ "full_accuracy": 0.7,
2784
+ "n_examples": 100,
2785
+ "per_subtask": {
2786
+ "SC": {
2787
+ "accuracy": 1.0,
2788
+ "count": 100
2789
+ },
2790
+ "UC": {
2791
+ "accuracy": 0.9316939890710383,
2792
+ "count": 366
2793
+ },
2794
+ "US": {
2795
+ "accuracy": 0.9572649572649573,
2796
+ "count": 234
2797
+ }
2798
+ }
2799
+ },
2800
+ "sub_M0": {
2801
+ "full_accuracy": 0.98,
2802
+ "n_examples": 100,
2803
+ "per_subtask": {
2804
+ "MD": {
2805
+ "accuracy": 0.9966722129783694,
2806
+ "count": 601
2807
+ },
2808
+ "ME": {
2809
+ "accuracy": 1.0,
2810
+ "count": 99
2811
+ }
2812
+ }
2813
+ },
2814
+ "sub_M1": {
2815
+ "full_accuracy": 1.0,
2816
+ "n_examples": 100,
2817
+ "per_subtask": {
2818
+ "MD": {
2819
+ "accuracy": 1.0,
2820
+ "count": 279
2821
+ },
2822
+ "MB": {
2823
+ "accuracy": 1.0,
2824
+ "count": 145
2825
+ },
2826
+ "ME": {
2827
+ "accuracy": 1.0,
2828
+ "count": 24
2829
+ },
2830
+ "UB": {
2831
+ "accuracy": 1.0,
2832
+ "count": 252
2833
+ }
2834
+ }
2835
+ },
2836
+ "sub_M2": {
2837
+ "full_accuracy": 0.99,
2838
+ "n_examples": 100,
2839
+ "per_subtask": {
2840
+ "MD": {
2841
+ "accuracy": 1.0,
2842
+ "count": 213
2843
+ },
2844
+ "MB": {
2845
+ "accuracy": 0.9911504424778761,
2846
+ "count": 113
2847
+ },
2848
+ "ME": {
2849
+ "accuracy": 1.0,
2850
+ "count": 85
2851
+ },
2852
+ "UB": {
2853
+ "accuracy": 1.0,
2854
+ "count": 181
2855
+ },
2856
+ "UD": {
2857
+ "accuracy": 1.0,
2858
+ "count": 108
2859
+ }
2860
+ }
2861
+ },
2862
+ "sub_M3": {
2863
+ "full_accuracy": 0.36,
2864
+ "n_examples": 100,
2865
+ "per_subtask": {
2866
+ "MD": {
2867
+ "accuracy": 1.0,
2868
+ "count": 179
2869
+ },
2870
+ "MB": {
2871
+ "accuracy": 0.9902912621359223,
2872
+ "count": 103
2873
+ },
2874
+ "ME": {
2875
+ "accuracy": 1.0,
2876
+ "count": 56
2877
+ },
2878
+ "UB": {
2879
+ "accuracy": 0.5637583892617449,
2880
+ "count": 149
2881
+ },
2882
+ "UD": {
2883
+ "accuracy": 1.0,
2884
+ "count": 213
2885
+ }
2886
+ }
2887
+ },
2888
+ "sub_M4": {
2889
+ "full_accuracy": 0.07,
2890
+ "n_examples": 100,
2891
+ "per_subtask": {
2892
+ "MD": {
2893
+ "accuracy": 1.0,
2894
+ "count": 200
2895
+ },
2896
+ "MB": {
2897
+ "accuracy": 1.0,
2898
+ "count": 100
2899
+ },
2900
+ "UB": {
2901
+ "accuracy": 0.29,
2902
+ "count": 100
2903
+ },
2904
+ "UD": {
2905
+ "accuracy": 0.7066666666666667,
2906
+ "count": 300
2907
+ }
2908
+ }
2909
+ },
2910
+ "sub_M5": {
2911
+ "full_accuracy": 0.03,
2912
+ "n_examples": 100,
2913
+ "per_subtask": {
2914
+ "MD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 100
2917
+ },
2918
+ "MB": {
2919
+ "accuracy": 1.0,
2920
+ "count": 100
2921
+ },
2922
+ "UB": {
2923
+ "accuracy": 0.32,
2924
+ "count": 100
2925
+ },
2926
+ "UD": {
2927
+ "accuracy": 0.5275,
2928
+ "count": 400
2929
+ }
2930
+ }
2931
+ },
2932
+ "sub_random": {
2933
+ "full_accuracy": 0.995,
2934
+ "n_examples": 200,
2935
+ "per_subtask": {
2936
+ "MD": {
2937
+ "accuracy": 1.0,
2938
+ "count": 600
2939
+ },
2940
+ "MB": {
2941
+ "accuracy": 1.0,
2942
+ "count": 267
2943
+ },
2944
+ "ME": {
2945
+ "accuracy": 1.0,
2946
+ "count": 53
2947
+ },
2948
+ "UB": {
2949
+ "accuracy": 0.9977220956719818,
2950
+ "count": 439
2951
+ },
2952
+ "UD": {
2953
+ "accuracy": 1.0,
2954
+ "count": 41
2955
+ }
2956
+ }
2957
+ },
2958
+ "sub_B3": {
2959
+ "full_accuracy": 0.81,
2960
+ "n_examples": 100,
2961
+ "per_subtask": {
2962
+ "MD": {
2963
+ "accuracy": 1.0,
2964
+ "count": 300
2965
+ },
2966
+ "MB": {
2967
+ "accuracy": 1.0,
2968
+ "count": 100
2969
+ },
2970
+ "UB": {
2971
+ "accuracy": 0.9035532994923858,
2972
+ "count": 197
2973
+ },
2974
+ "UD": {
2975
+ "accuracy": 1.0,
2976
+ "count": 103
2977
+ }
2978
+ }
2979
+ },
2980
+ "sub_B4": {
2981
+ "full_accuracy": 0.68,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "MD": {
2985
+ "accuracy": 1.0,
2986
+ "count": 200
2987
+ },
2988
+ "MB": {
2989
+ "accuracy": 1.0,
2990
+ "count": 100
2991
+ },
2992
+ "UB": {
2993
+ "accuracy": 0.8785425101214575,
2994
+ "count": 247
2995
+ },
2996
+ "UD": {
2997
+ "accuracy": 0.9281045751633987,
2998
+ "count": 153
2999
+ }
3000
+ }
3001
+ },
3002
+ "sub_B5": {
3003
+ "full_accuracy": 0.57,
3004
+ "n_examples": 100,
3005
+ "per_subtask": {
3006
+ "MD": {
3007
+ "accuracy": 1.0,
3008
+ "count": 100
3009
+ },
3010
+ "MB": {
3011
+ "accuracy": 1.0,
3012
+ "count": 100
3013
+ },
3014
+ "UB": {
3015
+ "accuracy": 0.8590604026845637,
3016
+ "count": 298
3017
+ },
3018
+ "UD": {
3019
+ "accuracy": 0.9257425742574258,
3020
+ "count": 202
3021
+ }
3022
+ }
3023
+ }
3024
+ },
3025
+ "summary": {
3026
+ "overall_accuracy": 0.7304166666666667,
3027
+ "total_examples": 2400,
3028
+ "n_splits": 22
3029
+ }
3030
+ },
3031
+ "sorl_eval": {
3032
+ "config": {
3033
+ "ops": "add_sub",
3034
+ "K": 4,
3035
+ "mode": "sorl",
3036
+ "n_digits": 6,
3037
+ "n_per_split": 100
3038
+ },
3039
+ "splits": {
3040
+ "add_S0": {
3041
+ "full_accuracy": 1.0,
3042
+ "n_examples": 100,
3043
+ "per_subtask": {
3044
+ "SA": {
3045
+ "accuracy": 1.0,
3046
+ "count": 605
3047
+ },
3048
+ "SS": {
3049
+ "accuracy": 1.0,
3050
+ "count": 95
3051
+ }
3052
+ }
3053
+ },
3054
+ "add_S1": {
3055
+ "full_accuracy": 1.0,
3056
+ "n_examples": 100,
3057
+ "per_subtask": {
3058
+ "SA": {
3059
+ "accuracy": 1.0,
3060
+ "count": 204
3061
+ },
3062
+ "SC": {
3063
+ "accuracy": 1.0,
3064
+ "count": 169
3065
+ },
3066
+ "SS": {
3067
+ "accuracy": 1.0,
3068
+ "count": 31
3069
+ },
3070
+ "UC": {
3071
+ "accuracy": 1.0,
3072
+ "count": 296
3073
+ }
3074
+ }
3075
+ },
3076
+ "add_S2": {
3077
+ "full_accuracy": 1.0,
3078
+ "n_examples": 100,
3079
+ "per_subtask": {
3080
+ "SA": {
3081
+ "accuracy": 1.0,
3082
+ "count": 163
3083
+ },
3084
+ "SC": {
3085
+ "accuracy": 1.0,
3086
+ "count": 130
3087
+ },
3088
+ "SS": {
3089
+ "accuracy": 1.0,
3090
+ "count": 87
3091
+ },
3092
+ "UC": {
3093
+ "accuracy": 1.0,
3094
+ "count": 203
3095
+ },
3096
+ "US": {
3097
+ "accuracy": 1.0,
3098
+ "count": 117
3099
+ }
3100
+ }
3101
+ },
3102
+ "add_S3": {
3103
+ "full_accuracy": 1.0,
3104
+ "n_examples": 100,
3105
+ "per_subtask": {
3106
+ "SA": {
3107
+ "accuracy": 1.0,
3108
+ "count": 121
3109
+ },
3110
+ "SC": {
3111
+ "accuracy": 1.0,
3112
+ "count": 121
3113
+ },
3114
+ "SS": {
3115
+ "accuracy": 1.0,
3116
+ "count": 49
3117
+ },
3118
+ "UC": {
3119
+ "accuracy": 1.0,
3120
+ "count": 186
3121
+ },
3122
+ "US": {
3123
+ "accuracy": 1.0,
3124
+ "count": 223
3125
+ }
3126
+ }
3127
+ },
3128
+ "add_S4": {
3129
+ "full_accuracy": 1.0,
3130
+ "n_examples": 100,
3131
+ "per_subtask": {
3132
+ "SA": {
3133
+ "accuracy": 1.0,
3134
+ "count": 104
3135
+ },
3136
+ "SC": {
3137
+ "accuracy": 1.0,
3138
+ "count": 106
3139
+ },
3140
+ "SS": {
3141
+ "accuracy": 1.0,
3142
+ "count": 23
3143
+ },
3144
+ "UC": {
3145
+ "accuracy": 1.0,
3146
+ "count": 160
3147
+ },
3148
+ "US": {
3149
+ "accuracy": 1.0,
3150
+ "count": 307
3151
+ }
3152
+ }
3153
+ },
3154
+ "add_S5": {
3155
+ "full_accuracy": 0.97,
3156
+ "n_examples": 100,
3157
+ "per_subtask": {
3158
+ "SA": {
3159
+ "accuracy": 1.0,
3160
+ "count": 100
3161
+ },
3162
+ "SC": {
3163
+ "accuracy": 1.0,
3164
+ "count": 100
3165
+ },
3166
+ "UC": {
3167
+ "accuracy": 0.97,
3168
+ "count": 100
3169
+ },
3170
+ "US": {
3171
+ "accuracy": 1.0,
3172
+ "count": 400
3173
+ }
3174
+ }
3175
+ },
3176
+ "add_S6": {
3177
+ "full_accuracy": 1.0,
3178
+ "n_examples": 100,
3179
+ "per_subtask": {
3180
+ "SC": {
3181
+ "accuracy": 1.0,
3182
+ "count": 100
3183
+ },
3184
+ "UC": {
3185
+ "accuracy": 1.0,
3186
+ "count": 100
3187
+ },
3188
+ "US": {
3189
+ "accuracy": 1.0,
3190
+ "count": 500
3191
+ }
3192
+ }
3193
+ },
3194
+ "add_random": {
3195
+ "full_accuracy": 1.0,
3196
+ "n_examples": 200,
3197
+ "per_subtask": {
3198
+ "SA": {
3199
+ "accuracy": 1.0,
3200
+ "count": 447
3201
+ },
3202
+ "SC": {
3203
+ "accuracy": 1.0,
3204
+ "count": 320
3205
+ },
3206
+ "SS": {
3207
+ "accuracy": 1.0,
3208
+ "count": 56
3209
+ },
3210
+ "UC": {
3211
+ "accuracy": 1.0,
3212
+ "count": 529
3213
+ },
3214
+ "US": {
3215
+ "accuracy": 1.0,
3216
+ "count": 48
3217
+ }
3218
+ }
3219
+ },
3220
+ "add_C3": {
3221
+ "full_accuracy": 1.0,
3222
+ "n_examples": 100,
3223
+ "per_subtask": {
3224
+ "SA": {
3225
+ "accuracy": 1.0,
3226
+ "count": 300
3227
+ },
3228
+ "SC": {
3229
+ "accuracy": 1.0,
3230
+ "count": 100
3231
+ },
3232
+ "UC": {
3233
+ "accuracy": 1.0,
3234
+ "count": 193
3235
+ },
3236
+ "US": {
3237
+ "accuracy": 1.0,
3238
+ "count": 107
3239
+ }
3240
+ }
3241
+ },
3242
+ "add_C4": {
3243
+ "full_accuracy": 1.0,
3244
+ "n_examples": 100,
3245
+ "per_subtask": {
3246
+ "SA": {
3247
+ "accuracy": 1.0,
3248
+ "count": 200
3249
+ },
3250
+ "SC": {
3251
+ "accuracy": 1.0,
3252
+ "count": 100
3253
+ },
3254
+ "UC": {
3255
+ "accuracy": 1.0,
3256
+ "count": 256
3257
+ },
3258
+ "US": {
3259
+ "accuracy": 1.0,
3260
+ "count": 144
3261
+ }
3262
+ }
3263
+ },
3264
+ "add_C5": {
3265
+ "full_accuracy": 1.0,
3266
+ "n_examples": 100,
3267
+ "per_subtask": {
3268
+ "SA": {
3269
+ "accuracy": 1.0,
3270
+ "count": 100
3271
+ },
3272
+ "SC": {
3273
+ "accuracy": 1.0,
3274
+ "count": 100
3275
+ },
3276
+ "UC": {
3277
+ "accuracy": 1.0,
3278
+ "count": 306
3279
+ },
3280
+ "US": {
3281
+ "accuracy": 1.0,
3282
+ "count": 194
3283
+ }
3284
+ }
3285
+ },
3286
+ "add_C6": {
3287
+ "full_accuracy": 1.0,
3288
+ "n_examples": 100,
3289
+ "per_subtask": {
3290
+ "SC": {
3291
+ "accuracy": 1.0,
3292
+ "count": 100
3293
+ },
3294
+ "UC": {
3295
+ "accuracy": 1.0,
3296
+ "count": 366
3297
+ },
3298
+ "US": {
3299
+ "accuracy": 1.0,
3300
+ "count": 234
3301
+ }
3302
+ }
3303
+ },
3304
+ "sub_M0": {
3305
+ "full_accuracy": 1.0,
3306
+ "n_examples": 100,
3307
+ "per_subtask": {
3308
+ "MD": {
3309
+ "accuracy": 1.0,
3310
+ "count": 601
3311
+ },
3312
+ "ME": {
3313
+ "accuracy": 1.0,
3314
+ "count": 99
3315
+ }
3316
+ }
3317
+ },
3318
+ "sub_M1": {
3319
+ "full_accuracy": 1.0,
3320
+ "n_examples": 100,
3321
+ "per_subtask": {
3322
+ "MD": {
3323
+ "accuracy": 1.0,
3324
+ "count": 279
3325
+ },
3326
+ "MB": {
3327
+ "accuracy": 1.0,
3328
+ "count": 145
3329
+ },
3330
+ "ME": {
3331
+ "accuracy": 1.0,
3332
+ "count": 24
3333
+ },
3334
+ "UB": {
3335
+ "accuracy": 1.0,
3336
+ "count": 252
3337
+ }
3338
+ }
3339
+ },
3340
+ "sub_M2": {
3341
+ "full_accuracy": 1.0,
3342
+ "n_examples": 100,
3343
+ "per_subtask": {
3344
+ "MD": {
3345
+ "accuracy": 1.0,
3346
+ "count": 213
3347
+ },
3348
+ "MB": {
3349
+ "accuracy": 1.0,
3350
+ "count": 113
3351
+ },
3352
+ "ME": {
3353
+ "accuracy": 1.0,
3354
+ "count": 85
3355
+ },
3356
+ "UB": {
3357
+ "accuracy": 1.0,
3358
+ "count": 181
3359
+ },
3360
+ "UD": {
3361
+ "accuracy": 1.0,
3362
+ "count": 108
3363
+ }
3364
+ }
3365
+ },
3366
+ "sub_M3": {
3367
+ "full_accuracy": 1.0,
3368
+ "n_examples": 100,
3369
+ "per_subtask": {
3370
+ "MD": {
3371
+ "accuracy": 1.0,
3372
+ "count": 179
3373
+ },
3374
+ "MB": {
3375
+ "accuracy": 1.0,
3376
+ "count": 103
3377
+ },
3378
+ "ME": {
3379
+ "accuracy": 1.0,
3380
+ "count": 56
3381
+ },
3382
+ "UB": {
3383
+ "accuracy": 1.0,
3384
+ "count": 149
3385
+ },
3386
+ "UD": {
3387
+ "accuracy": 1.0,
3388
+ "count": 213
3389
+ }
3390
+ }
3391
+ },
3392
+ "sub_M4": {
3393
+ "full_accuracy": 1.0,
3394
+ "n_examples": 100,
3395
+ "per_subtask": {
3396
+ "MD": {
3397
+ "accuracy": 1.0,
3398
+ "count": 200
3399
+ },
3400
+ "MB": {
3401
+ "accuracy": 1.0,
3402
+ "count": 100
3403
+ },
3404
+ "UB": {
3405
+ "accuracy": 1.0,
3406
+ "count": 100
3407
+ },
3408
+ "UD": {
3409
+ "accuracy": 1.0,
3410
+ "count": 300
3411
+ }
3412
+ }
3413
+ },
3414
+ "sub_M5": {
3415
+ "full_accuracy": 1.0,
3416
+ "n_examples": 100,
3417
+ "per_subtask": {
3418
+ "MD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 100
3421
+ },
3422
+ "MB": {
3423
+ "accuracy": 1.0,
3424
+ "count": 100
3425
+ },
3426
+ "UB": {
3427
+ "accuracy": 1.0,
3428
+ "count": 100
3429
+ },
3430
+ "UD": {
3431
+ "accuracy": 1.0,
3432
+ "count": 400
3433
+ }
3434
+ }
3435
+ },
3436
+ "sub_random": {
3437
+ "full_accuracy": 1.0,
3438
+ "n_examples": 200,
3439
+ "per_subtask": {
3440
+ "MD": {
3441
+ "accuracy": 1.0,
3442
+ "count": 600
3443
+ },
3444
+ "MB": {
3445
+ "accuracy": 1.0,
3446
+ "count": 267
3447
+ },
3448
+ "ME": {
3449
+ "accuracy": 1.0,
3450
+ "count": 53
3451
+ },
3452
+ "UB": {
3453
+ "accuracy": 1.0,
3454
+ "count": 439
3455
+ },
3456
+ "UD": {
3457
+ "accuracy": 1.0,
3458
+ "count": 41
3459
+ }
3460
+ }
3461
+ },
3462
+ "sub_B3": {
3463
+ "full_accuracy": 1.0,
3464
+ "n_examples": 100,
3465
+ "per_subtask": {
3466
+ "MD": {
3467
+ "accuracy": 1.0,
3468
+ "count": 300
3469
+ },
3470
+ "MB": {
3471
+ "accuracy": 1.0,
3472
+ "count": 100
3473
+ },
3474
+ "UB": {
3475
+ "accuracy": 1.0,
3476
+ "count": 197
3477
+ },
3478
+ "UD": {
3479
+ "accuracy": 1.0,
3480
+ "count": 103
3481
+ }
3482
+ }
3483
+ },
3484
+ "sub_B4": {
3485
+ "full_accuracy": 1.0,
3486
+ "n_examples": 100,
3487
+ "per_subtask": {
3488
+ "MD": {
3489
+ "accuracy": 1.0,
3490
+ "count": 200
3491
+ },
3492
+ "MB": {
3493
+ "accuracy": 1.0,
3494
+ "count": 100
3495
+ },
3496
+ "UB": {
3497
+ "accuracy": 1.0,
3498
+ "count": 247
3499
+ },
3500
+ "UD": {
3501
+ "accuracy": 1.0,
3502
+ "count": 153
3503
+ }
3504
+ }
3505
+ },
3506
+ "sub_B5": {
3507
+ "full_accuracy": 1.0,
3508
+ "n_examples": 100,
3509
+ "per_subtask": {
3510
+ "MD": {
3511
+ "accuracy": 1.0,
3512
+ "count": 100
3513
+ },
3514
+ "MB": {
3515
+ "accuracy": 1.0,
3516
+ "count": 100
3517
+ },
3518
+ "UB": {
3519
+ "accuracy": 1.0,
3520
+ "count": 298
3521
+ },
3522
+ "UD": {
3523
+ "accuracy": 1.0,
3524
+ "count": 202
3525
+ }
3526
+ }
3527
+ }
3528
+ },
3529
+ "summary": {
3530
+ "overall_accuracy": 0.99875,
3531
+ "total_examples": 2400,
3532
+ "n_splits": 22
3533
+ }
3534
+ },
3535
+ "sorl_overall_accuracy": 0.99875,
3536
+ "sft_overall_accuracy": 0.7304166666666667
3537
+ }
add_sub_sorl_v1_abs5_100K/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:78256689c3ca0e47e7b7c5bdcfa771d65b002e2b5b45898c75644917cfd92c91
3
+ size 650283250
add_sub_sorl_v1_abs5_100K/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 4,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 8e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 10,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 1562,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs5_K4_100K",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 2,
61
+ "n_head": 3,
62
+ "n_embd": 510,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 5,
65
+ "dataset_size": 100000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 162494162,
71
+ "run_name": "add_sub_sorl_v1_abs5_100K",
72
+ "git_commit": "3ae8ca0d6b88706715f25991b1e1acd0e3a6e0a6",
73
+ "timestamp": "2026-04-12T20:08:41.300584+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "s8jw6eh2",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/s8jw6eh2",
81
+ "final_accuracy": 0.99875,
82
+ "sft_accuracy": 0.7304166666666667,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }