amirali1985 commited on
Commit
56fbc81
·
verified ·
1 Parent(s): 82f29de

Upload add_sub_sorl_v1_abs30_K3_50K

Browse files
add_sub_sorl_v1_abs30_K3_50K/config.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "SorlModelWrapper"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": null,
10
+ "head_dim": 128,
11
+ "hidden_act": "silu",
12
+ "hidden_size": 510,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 2040,
15
+ "layer_types": [
16
+ "full_attention",
17
+ "full_attention"
18
+ ],
19
+ "max_position_embeddings": 128,
20
+ "max_window_layers": 28,
21
+ "model_type": "qwen3",
22
+ "num_attention_heads": 3,
23
+ "num_hidden_layers": 2,
24
+ "num_key_value_heads": 3,
25
+ "pad_token_id": null,
26
+ "rms_norm_eps": 1e-06,
27
+ "rope_parameters": {
28
+ "rope_theta": 10000.0,
29
+ "rope_type": "default"
30
+ },
31
+ "sliding_window": null,
32
+ "tie_word_embeddings": false,
33
+ "transformers_version": "5.5.0",
34
+ "use_cache": true,
35
+ "use_sliding_window": false,
36
+ "vocab_size": 151674
37
+ }
add_sub_sorl_v1_abs30_K3_50K/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "output_attentions": false,
4
+ "output_hidden_states": false,
5
+ "transformers_version": "5.5.0",
6
+ "use_cache": true
7
+ }
add_sub_sorl_v1_abs30_K3_50K/metrics.json ADDED
@@ -0,0 +1,3477 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "history": {
3
+ "step": [
4
+ 50,
5
+ 100,
6
+ 150,
7
+ 200,
8
+ 250,
9
+ 300,
10
+ 350,
11
+ 400,
12
+ 450,
13
+ 500,
14
+ 550,
15
+ 600,
16
+ 650,
17
+ 700,
18
+ 750,
19
+ 832,
20
+ 882,
21
+ 932,
22
+ 982,
23
+ 1032,
24
+ 1082,
25
+ 1132,
26
+ 1182,
27
+ 1232,
28
+ 1282,
29
+ 1332,
30
+ 1382,
31
+ 1432,
32
+ 1482,
33
+ 1532,
34
+ 1614,
35
+ 1664,
36
+ 1714,
37
+ 1764,
38
+ 1814,
39
+ 1864,
40
+ 1914,
41
+ 1964,
42
+ 2014,
43
+ 2064,
44
+ 2114,
45
+ 2164,
46
+ 2214,
47
+ 2264,
48
+ 2314,
49
+ 2396,
50
+ 2446,
51
+ 2496,
52
+ 2546,
53
+ 2596,
54
+ 2646,
55
+ 2696,
56
+ 2746,
57
+ 2796,
58
+ 2846,
59
+ 2896,
60
+ 2946,
61
+ 2996,
62
+ 3046,
63
+ 3096,
64
+ 3178,
65
+ 3228,
66
+ 3278,
67
+ 3328,
68
+ 3378,
69
+ 3428,
70
+ 3478,
71
+ 3528,
72
+ 3578,
73
+ 3628,
74
+ 3678,
75
+ 3728,
76
+ 3778,
77
+ 3828,
78
+ 3878,
79
+ 3960,
80
+ 4010,
81
+ 4060,
82
+ 4110,
83
+ 4160,
84
+ 4210,
85
+ 4260,
86
+ 4310,
87
+ 4360,
88
+ 4410,
89
+ 4460,
90
+ 4510,
91
+ 4560,
92
+ 4610,
93
+ 4660,
94
+ 4742,
95
+ 4792,
96
+ 4842,
97
+ 4892,
98
+ 4942,
99
+ 4992,
100
+ 5042,
101
+ 5092,
102
+ 5142,
103
+ 5192,
104
+ 5242,
105
+ 5292,
106
+ 5342,
107
+ 5392,
108
+ 5442,
109
+ 5524,
110
+ 5574,
111
+ 5624,
112
+ 5674,
113
+ 5724,
114
+ 5774,
115
+ 5824,
116
+ 5874,
117
+ 5924,
118
+ 5974,
119
+ 6024,
120
+ 6074,
121
+ 6124,
122
+ 6174,
123
+ 6224,
124
+ 6306,
125
+ 6356,
126
+ 6406,
127
+ 6456,
128
+ 6506,
129
+ 6556,
130
+ 6606,
131
+ 6656,
132
+ 6706,
133
+ 6756,
134
+ 6806,
135
+ 6856,
136
+ 6906,
137
+ 6956,
138
+ 7006,
139
+ 7088,
140
+ 7138,
141
+ 7188,
142
+ 7238,
143
+ 7288,
144
+ 7338,
145
+ 7388,
146
+ 7438,
147
+ 7488,
148
+ 7538,
149
+ 7588,
150
+ 7638,
151
+ 7688,
152
+ 7738,
153
+ 7788,
154
+ 7870,
155
+ 7920,
156
+ 7970,
157
+ 8020,
158
+ 8070,
159
+ 8120,
160
+ 8170,
161
+ 8220,
162
+ 8270,
163
+ 8320,
164
+ 8370,
165
+ 8420,
166
+ 8470,
167
+ 8520,
168
+ 8570,
169
+ 8652,
170
+ 8702,
171
+ 8752,
172
+ 8802,
173
+ 8852,
174
+ 8902,
175
+ 8952,
176
+ 9002,
177
+ 9052,
178
+ 9102,
179
+ 9152,
180
+ 9202,
181
+ 9252,
182
+ 9302,
183
+ 9352,
184
+ 9434,
185
+ 9484,
186
+ 9534,
187
+ 9584,
188
+ 9634,
189
+ 9684,
190
+ 9734,
191
+ 9784,
192
+ 9834,
193
+ 9884,
194
+ 9934,
195
+ 9984,
196
+ 10034,
197
+ 10084,
198
+ 10134,
199
+ 10216,
200
+ 10266,
201
+ 10316,
202
+ 10366,
203
+ 10416,
204
+ 10466,
205
+ 10516,
206
+ 10566,
207
+ 10616,
208
+ 10666,
209
+ 10716,
210
+ 10766,
211
+ 10816,
212
+ 10866,
213
+ 10916,
214
+ 10998,
215
+ 11048,
216
+ 11098,
217
+ 11148,
218
+ 11198,
219
+ 11248,
220
+ 11298,
221
+ 11348,
222
+ 11398,
223
+ 11448,
224
+ 11498,
225
+ 11548,
226
+ 11598,
227
+ 11648,
228
+ 11698,
229
+ 11780,
230
+ 11830,
231
+ 11880,
232
+ 11930,
233
+ 11980,
234
+ 12030,
235
+ 12080,
236
+ 12130,
237
+ 12180,
238
+ 12230,
239
+ 12280,
240
+ 12330,
241
+ 12380,
242
+ 12430,
243
+ 12480,
244
+ 12562,
245
+ 12612,
246
+ 12662,
247
+ 12712,
248
+ 12762,
249
+ 12812,
250
+ 12862,
251
+ 12912,
252
+ 12962,
253
+ 13012,
254
+ 13062,
255
+ 13112,
256
+ 13162,
257
+ 13212,
258
+ 13262,
259
+ 13344,
260
+ 13394,
261
+ 13444,
262
+ 13494,
263
+ 13544,
264
+ 13594,
265
+ 13644,
266
+ 13694,
267
+ 13744,
268
+ 13794,
269
+ 13844,
270
+ 13894,
271
+ 13944,
272
+ 13994,
273
+ 14044,
274
+ 14126,
275
+ 14176,
276
+ 14226,
277
+ 14276,
278
+ 14326,
279
+ 14376,
280
+ 14426,
281
+ 14476,
282
+ 14526,
283
+ 14576,
284
+ 14626,
285
+ 14676,
286
+ 14726,
287
+ 14776,
288
+ 14826,
289
+ 14908,
290
+ 14958,
291
+ 15008,
292
+ 15058,
293
+ 15108,
294
+ 15158,
295
+ 15208,
296
+ 15258,
297
+ 15308,
298
+ 15358,
299
+ 15408,
300
+ 15458,
301
+ 15508,
302
+ 15558,
303
+ 15608
304
+ ],
305
+ "loss": [
306
+ 13.509393692016602,
307
+ 9.749732971191406,
308
+ 5.9360880851745605,
309
+ 3.8922414779663086,
310
+ 2.9130501747131348,
311
+ 2.5895895957946777,
312
+ 2.3288536071777344,
313
+ 1.7239751815795898,
314
+ 1.3578572273254395,
315
+ 0.6631852388381958,
316
+ 0.7125436067581177,
317
+ 0.22906304895877838,
318
+ 0.11403137445449829,
319
+ -0.18299715220928192,
320
+ -0.1072545275092125,
321
+ -2.3244917392730713,
322
+ -9.210739135742188,
323
+ -10.258565902709961,
324
+ -11.842880249023438,
325
+ -12.723512649536133,
326
+ -13.822088241577148,
327
+ -13.786534309387207,
328
+ -14.823137283325195,
329
+ -13.667715072631836,
330
+ -15.485278129577637,
331
+ -14.717754364013672,
332
+ -14.689838409423828,
333
+ -14.371696472167969,
334
+ -14.705050468444824,
335
+ -14.5253324508667,
336
+ -14.996114730834961,
337
+ -14.544259071350098,
338
+ -14.397850036621094,
339
+ -15.307740211486816,
340
+ -14.620795249938965,
341
+ -14.343721389770508,
342
+ -14.886155128479004,
343
+ -14.080240249633789,
344
+ -14.099590301513672,
345
+ -14.724437713623047,
346
+ -14.093734741210938,
347
+ -13.550093650817871,
348
+ -11.328234672546387,
349
+ -10.802987098693848,
350
+ -8.087011337280273,
351
+ -7.161535263061523,
352
+ -6.76300048828125,
353
+ -5.766507148742676,
354
+ -5.0977959632873535,
355
+ -5.875992298126221,
356
+ -4.497377395629883,
357
+ -4.863527774810791,
358
+ -4.927530765533447,
359
+ -4.935651779174805,
360
+ -4.701904296875,
361
+ -4.331963539123535,
362
+ -3.767944574356079,
363
+ -3.393040418624878,
364
+ -3.2145793437957764,
365
+ -2.731534242630005,
366
+ -3.1932218074798584,
367
+ -4.5905680656433105,
368
+ -2.8137407302856445,
369
+ -3.041274309158325,
370
+ -2.6139461994171143,
371
+ -2.4471042156219482,
372
+ -2.4882166385650635,
373
+ -2.434157609939575,
374
+ -2.7672336101531982,
375
+ -2.69252610206604,
376
+ -2.0434446334838867,
377
+ -1.9935232400894165,
378
+ -3.210987091064453,
379
+ -2.203340530395508,
380
+ -1.61903977394104,
381
+ -1.8135666847229004,
382
+ -2.2731308937072754,
383
+ -1.7342028617858887,
384
+ -2.345428705215454,
385
+ -2.3986122608184814,
386
+ -2.6395304203033447,
387
+ -2.1111576557159424,
388
+ -1.9803094863891602,
389
+ -2.002279281616211,
390
+ -2.1121442317962646,
391
+ -2.3220841884613037,
392
+ -1.642890453338623,
393
+ -1.5122915506362915,
394
+ -1.352969765663147,
395
+ -1.790658950805664,
396
+ -2.0493268966674805,
397
+ -1.6816511154174805,
398
+ -1.5232160091400146,
399
+ -1.385091781616211,
400
+ -1.6739228963851929,
401
+ -3.1018519401550293,
402
+ -1.7351073026657104,
403
+ -2.2683258056640625,
404
+ -2.4009287357330322,
405
+ -1.8868049383163452,
406
+ -1.7282708883285522,
407
+ -1.1806395053863525,
408
+ -1.5342776775360107,
409
+ -1.2198463678359985,
410
+ -1.1997792720794678,
411
+ -1.6372817754745483,
412
+ -1.1737879514694214,
413
+ -1.8703954219818115,
414
+ -1.1837074756622314,
415
+ -2.0487072467803955,
416
+ -1.3988951444625854,
417
+ -1.3324480056762695,
418
+ -1.3330432176589966,
419
+ -1.4838277101516724,
420
+ -1.5514414310455322,
421
+ -1.4017307758331299,
422
+ -1.4976024627685547,
423
+ -1.3571642637252808,
424
+ -1.1720738410949707,
425
+ -1.2919104099273682,
426
+ -1.350249171257019,
427
+ -1.4729357957839966,
428
+ -1.1817578077316284,
429
+ -1.1564174890518188,
430
+ -1.5251946449279785,
431
+ -1.2372384071350098,
432
+ -0.932648777961731,
433
+ -1.0012640953063965,
434
+ -1.4444644451141357,
435
+ -1.2965625524520874,
436
+ -1.3345240354537964,
437
+ -1.3559203147888184,
438
+ -1.0545915365219116,
439
+ -1.1038869619369507,
440
+ -1.0856115818023682,
441
+ -1.0255887508392334,
442
+ -1.0998259782791138,
443
+ -0.7609472274780273,
444
+ -1.4960383176803589,
445
+ -1.0091618299484253,
446
+ -1.098103404045105,
447
+ -0.9137800335884094,
448
+ -0.836209237575531,
449
+ -0.7871055603027344,
450
+ -0.9814184308052063,
451
+ -0.8756022453308105,
452
+ -0.9116973280906677,
453
+ -0.782789945602417,
454
+ -1.2794203758239746,
455
+ -0.8758397698402405,
456
+ -1.1934887170791626,
457
+ -0.9208111763000488,
458
+ -1.0771613121032715,
459
+ -1.5408060550689697,
460
+ -1.2266724109649658,
461
+ -0.9050666689872742,
462
+ -0.5775320529937744,
463
+ -1.0902734994888306,
464
+ -1.2348861694335938,
465
+ -1.3116742372512817,
466
+ -0.7466331720352173,
467
+ -0.9078770875930786,
468
+ -0.7932072877883911,
469
+ -0.8755908608436584,
470
+ -1.191214680671692,
471
+ -0.6539024114608765,
472
+ -0.8499408960342407,
473
+ -0.9262394309043884,
474
+ -0.5675032138824463,
475
+ -0.45079314708709717,
476
+ -0.6070061326026917,
477
+ -1.1951838731765747,
478
+ -0.7711151838302612,
479
+ -0.9214723706245422,
480
+ -1.322747826576233,
481
+ -1.0038766860961914,
482
+ -0.21057185530662537,
483
+ -0.7360962629318237,
484
+ -1.047795295715332,
485
+ -0.5658537149429321,
486
+ -0.5452471971511841,
487
+ -0.6649935841560364,
488
+ -0.9057523012161255,
489
+ -0.9455522894859314,
490
+ -0.6777364015579224,
491
+ -0.6301040053367615,
492
+ -0.6875035762786865,
493
+ -0.7744766473770142,
494
+ -0.36955589056015015,
495
+ -0.7586586475372314,
496
+ -0.8452391624450684,
497
+ -0.6979129314422607,
498
+ -0.4924622178077698,
499
+ -0.5034284591674805,
500
+ -0.07909169793128967,
501
+ -0.4357263743877411,
502
+ -0.4921090304851532,
503
+ -0.6217997670173645,
504
+ -0.3099788427352905,
505
+ -0.3058575987815857,
506
+ -0.491129070520401,
507
+ -0.4106674790382385,
508
+ -0.5844934582710266,
509
+ -0.26459887623786926,
510
+ -0.4641355872154236,
511
+ -0.4777032434940338,
512
+ -0.5105655193328857,
513
+ -0.7228485941886902,
514
+ -0.37706509232521057,
515
+ -0.40531256794929504,
516
+ -0.3295072913169861,
517
+ -0.4547842741012573,
518
+ -0.4582812190055847,
519
+ -0.4903515577316284,
520
+ -0.4897080361843109,
521
+ -0.36798498034477234,
522
+ -0.6037724018096924,
523
+ -0.2460249364376068,
524
+ -0.3986009955406189,
525
+ -0.5716195702552795,
526
+ -0.23653608560562134,
527
+ -0.31190627813339233,
528
+ -0.44520020484924316,
529
+ -0.2482786774635315,
530
+ -0.47306254506111145,
531
+ -0.33344653248786926,
532
+ -0.39349013566970825,
533
+ -0.33977243304252625,
534
+ -0.3621232807636261,
535
+ -0.48065319657325745,
536
+ -0.30519622564315796,
537
+ -0.3248542249202728,
538
+ -0.30721086263656616,
539
+ -0.4892882704734802,
540
+ -0.5734624266624451,
541
+ -0.3485679030418396,
542
+ -0.2581605017185211,
543
+ -0.3928232491016388,
544
+ -0.18135161697864532,
545
+ -0.2859618067741394,
546
+ -0.1581522524356842,
547
+ -0.24521522223949432,
548
+ -0.40374138951301575,
549
+ -0.47672492265701294,
550
+ -0.1581224650144577,
551
+ -0.29607728123664856,
552
+ -0.04652285575866699,
553
+ -0.20653583109378815,
554
+ -0.2537737488746643,
555
+ -0.4445362985134125,
556
+ -0.1114339828491211,
557
+ -0.489991694688797,
558
+ -0.40431979298591614,
559
+ -0.5255370736122131,
560
+ -0.2891177833080292,
561
+ -0.13589264452457428,
562
+ -0.24943886697292328,
563
+ -0.1608649492263794,
564
+ -0.35039061307907104,
565
+ -0.21615290641784668,
566
+ -0.43050703406333923,
567
+ -0.25556042790412903,
568
+ -0.2582490146160126,
569
+ -0.42218878865242004,
570
+ -0.3240232765674591,
571
+ -0.12729018926620483,
572
+ -0.14628957211971283,
573
+ -0.14741162955760956,
574
+ -0.274014413356781,
575
+ -0.11761685460805893,
576
+ -0.1516052484512329,
577
+ -0.16077259182929993,
578
+ -0.2511594593524933,
579
+ -0.010212086141109467,
580
+ -0.2537863254547119,
581
+ -0.29016000032424927,
582
+ -0.16137613356113434,
583
+ -0.21936403214931488,
584
+ -0.14548173546791077,
585
+ -0.14406554400920868,
586
+ -0.32225245237350464,
587
+ -0.21201518177986145,
588
+ -0.25709688663482666,
589
+ -0.09402480721473694,
590
+ -0.14027932286262512,
591
+ -0.08345134556293488,
592
+ -0.19392192363739014,
593
+ 0.007833808660507202,
594
+ -0.20100173354148865,
595
+ -0.14701750874519348,
596
+ -0.33041656017303467,
597
+ -0.16883714497089386,
598
+ -0.08166240155696869,
599
+ -0.15378451347351074,
600
+ -0.21001671254634857,
601
+ -0.1452471911907196,
602
+ -0.09268718957901001,
603
+ 7.594376802444458e-05,
604
+ -0.16848143935203552,
605
+ -0.052198126912117004
606
+ ],
607
+ "base_loss": [
608
+ 9.620177268981934,
609
+ 7.274699687957764,
610
+ 6.204272747039795,
611
+ 4.166467189788818,
612
+ 2.2501654624938965,
613
+ 1.9623774290084839,
614
+ 1.9064360857009888,
615
+ 1.9552589654922485,
616
+ 1.8678728342056274,
617
+ 1.7965959310531616,
618
+ 1.8250160217285156,
619
+ 1.788840651512146,
620
+ 1.8576834201812744,
621
+ 1.8137224912643433,
622
+ 1.8437130451202393,
623
+ 1.8456766605377197,
624
+ 1.989670991897583,
625
+ 1.849730134010315,
626
+ 1.9440898895263672,
627
+ 1.8215068578720093,
628
+ 1.811987280845642,
629
+ 1.7906662225723267,
630
+ 1.8050600290298462,
631
+ 1.6350735425949097,
632
+ 1.8098596334457397,
633
+ 1.7310606241226196,
634
+ 1.73845636844635,
635
+ 1.7080748081207275,
636
+ 1.6872161626815796,
637
+ 1.6848351955413818,
638
+ 1.7108510732650757,
639
+ 1.658853530883789,
640
+ 1.6322201490402222,
641
+ 1.728717565536499,
642
+ 1.6502704620361328,
643
+ 1.6198476552963257,
644
+ 1.6768041849136353,
645
+ 1.6007717847824097,
646
+ 1.577912449836731,
647
+ 1.6503422260284424,
648
+ 1.5837620496749878,
649
+ 1.51720130443573,
650
+ 1.2733173370361328,
651
+ 1.2153533697128296,
652
+ 0.9087010622024536,
653
+ 0.8046143651008606,
654
+ 0.760909914970398,
655
+ 0.653200089931488,
656
+ 0.576078474521637,
657
+ 0.6617172956466675,
658
+ 0.5092791318893433,
659
+ 0.5486401319503784,
660
+ 0.5964444875717163,
661
+ 0.5582998394966125,
662
+ 0.5341429114341736,
663
+ 0.489955335855484,
664
+ 0.4256270229816437,
665
+ 0.3848516643047333,
666
+ 0.36419087648391724,
667
+ 0.31207147240638733,
668
+ 0.36289140582084656,
669
+ 0.5198935270309448,
670
+ 0.31770092248916626,
671
+ 0.3470384478569031,
672
+ 0.3001234233379364,
673
+ 0.28539514541625977,
674
+ 0.28449442982673645,
675
+ 0.27902907133102417,
676
+ 0.3160552978515625,
677
+ 0.3043105900287628,
678
+ 0.23538364470005035,
679
+ 0.22816064953804016,
680
+ 0.3635883033275604,
681
+ 0.2505258023738861,
682
+ 0.18705177307128906,
683
+ 0.2077564001083374,
684
+ 0.25986963510513306,
685
+ 0.2002851516008377,
686
+ 0.2696126401424408,
687
+ 0.27336403727531433,
688
+ 0.29874229431152344,
689
+ 0.24122998118400574,
690
+ 0.22744552791118622,
691
+ 0.22859355807304382,
692
+ 0.24051980674266815,
693
+ 0.2640826106071472,
694
+ 0.1906505525112152,
695
+ 0.17343030869960785,
696
+ 0.15632306039333344,
697
+ 0.20517291128635406,
698
+ 0.23487980663776398,
699
+ 0.1935703456401825,
700
+ 0.17757008969783783,
701
+ 0.16017813980579376,
702
+ 0.1929638385772705,
703
+ 0.3533931374549866,
704
+ 0.19844293594360352,
705
+ 0.25687453150749207,
706
+ 0.27493026852607727,
707
+ 0.21510256826877594,
708
+ 0.1985342800617218,
709
+ 0.1377100944519043,
710
+ 0.17895111441612244,
711
+ 0.1440882384777069,
712
+ 0.13970573246479034,
713
+ 0.18795418739318848,
714
+ 0.142202690243721,
715
+ 0.21577799320220947,
716
+ 0.13755567371845245,
717
+ 0.23404911160469055,
718
+ 0.16638506948947906,
719
+ 0.15567395091056824,
720
+ 0.1552688181400299,
721
+ 0.1740662306547165,
722
+ 0.18159958720207214,
723
+ 0.1600363701581955,
724
+ 0.1719866544008255,
725
+ 0.15725398063659668,
726
+ 0.13674183189868927,
727
+ 0.15326379239559174,
728
+ 0.15582379698753357,
729
+ 0.16946016252040863,
730
+ 0.135700523853302,
731
+ 0.13945254683494568,
732
+ 0.17806246876716614,
733
+ 0.14694233238697052,
734
+ 0.12567099928855896,
735
+ 0.11750459671020508,
736
+ 0.16599784791469574,
737
+ 0.15093906223773956,
738
+ 0.15538986027240753,
739
+ 0.15526553988456726,
740
+ 0.12194647639989853,
741
+ 0.1285392940044403,
742
+ 0.1254655122756958,
743
+ 0.12065047770738602,
744
+ 0.12589503824710846,
745
+ 0.09028182923793793,
746
+ 0.17123977839946747,
747
+ 0.1230500265955925,
748
+ 0.12619636952877045,
749
+ 0.10803552716970444,
750
+ 0.09788729250431061,
751
+ 0.09319708496332169,
752
+ 0.11327429860830307,
753
+ 0.10097881406545639,
754
+ 0.10638836771249771,
755
+ 0.09176915138959885,
756
+ 0.14741040766239166,
757
+ 0.10740412771701813,
758
+ 0.1361636370420456,
759
+ 0.12075847387313843,
760
+ 0.12333475798368454,
761
+ 0.17989730834960938,
762
+ 0.14102159440517426,
763
+ 0.11652173101902008,
764
+ 0.06868256628513336,
765
+ 0.12516002357006073,
766
+ 0.141461580991745,
767
+ 0.15087445080280304,
768
+ 0.08888103067874908,
769
+ 0.1065240427851677,
770
+ 0.09194660931825638,
771
+ 0.10156156122684479,
772
+ 0.14206565916538239,
773
+ 0.0768805667757988,
774
+ 0.10412381589412689,
775
+ 0.11042814701795578,
776
+ 0.10985857993364334,
777
+ 0.0573594756424427,
778
+ 0.07315342873334885,
779
+ 0.13767044246196747,
780
+ 0.09264820069074631,
781
+ 0.10909143835306168,
782
+ 0.15286903083324432,
783
+ 0.12395979464054108,
784
+ 0.0777847170829773,
785
+ 0.09892841428518295,
786
+ 0.12121900171041489,
787
+ 0.06989651918411255,
788
+ 0.06681704521179199,
789
+ 0.07782609015703201,
790
+ 0.11105065792798996,
791
+ 0.10854284465312958,
792
+ 0.07878432422876358,
793
+ 0.07466436922550201,
794
+ 0.08287449926137924,
795
+ 0.09146697074174881,
796
+ 0.04641620069742203,
797
+ 0.08733348548412323,
798
+ 0.09853975474834442,
799
+ 0.0975751206278801,
800
+ 0.06128227710723877,
801
+ 0.061950184404850006,
802
+ 0.06638076901435852,
803
+ 0.052723176777362823,
804
+ 0.057864073663949966,
805
+ 0.07467615604400635,
806
+ 0.08593636751174927,
807
+ 0.041386980563402176,
808
+ 0.05814815312623978,
809
+ 0.050658438354730606,
810
+ 0.06955800205469131,
811
+ 0.04857265204191208,
812
+ 0.0566335991024971,
813
+ 0.05846080556511879,
814
+ 0.0625414326786995,
815
+ 0.08379863202571869,
816
+ 0.04710562154650688,
817
+ 0.048435620963573456,
818
+ 0.04122187942266464,
819
+ 0.053831856697797775,
820
+ 0.05445948988199234,
821
+ 0.05889381840825081,
822
+ 0.058188822120428085,
823
+ 0.04711601510643959,
824
+ 0.07027188688516617,
825
+ 0.030178751796483994,
826
+ 0.04915710538625717,
827
+ 0.06689925491809845,
828
+ 0.03054959885776043,
829
+ 0.04069678112864494,
830
+ 0.05244181677699089,
831
+ 0.03186619281768799,
832
+ 0.05536025017499924,
833
+ 0.043754756450653076,
834
+ 0.04784201830625534,
835
+ 0.042507562786340714,
836
+ 0.06403299421072006,
837
+ 0.05792354419827461,
838
+ 0.03965076431632042,
839
+ 0.040603041648864746,
840
+ 0.03727508336305618,
841
+ 0.05885818973183632,
842
+ 0.06674869358539581,
843
+ 0.0428953543305397,
844
+ 0.03251257166266441,
845
+ 0.0478118360042572,
846
+ 0.023396877571940422,
847
+ 0.03521552309393883,
848
+ 0.02183755859732628,
849
+ 0.030320053920149803,
850
+ 0.04852340742945671,
851
+ 0.05709812045097351,
852
+ 0.020526060834527016,
853
+ 0.03813812509179115,
854
+ 0.02402515895664692,
855
+ 0.02654096856713295,
856
+ 0.032051630318164825,
857
+ 0.054777830839157104,
858
+ 0.018536703661084175,
859
+ 0.05893069505691528,
860
+ 0.0486418791115284,
861
+ 0.06543079763650894,
862
+ 0.035314351320266724,
863
+ 0.018703743815422058,
864
+ 0.03151312842965126,
865
+ 0.023690471425652504,
866
+ 0.04184756055474281,
867
+ 0.028494222089648247,
868
+ 0.04992935433983803,
869
+ 0.030887356027960777,
870
+ 0.03226137161254883,
871
+ 0.050099123269319534,
872
+ 0.0390518493950367,
873
+ 0.017795631662011147,
874
+ 0.019216744229197502,
875
+ 0.022917110472917557,
876
+ 0.03587643429636955,
877
+ 0.016961442306637764,
878
+ 0.021900543943047523,
879
+ 0.021325627341866493,
880
+ 0.030909908935427666,
881
+ 0.007513721007853746,
882
+ 0.03314381465315819,
883
+ 0.03860088065266609,
884
+ 0.021070923656225204,
885
+ 0.02842792496085167,
886
+ 0.020011277869343758,
887
+ 0.02126014418900013,
888
+ 0.039515621960163116,
889
+ 0.03040228597819805,
890
+ 0.032819073647260666,
891
+ 0.01422138325870037,
892
+ 0.017915237694978714,
893
+ 0.01341172493994236,
894
+ 0.02505233883857727,
895
+ 0.00482439249753952,
896
+ 0.026765646412968636,
897
+ 0.02130223624408245,
898
+ 0.04042539373040199,
899
+ 0.02248985692858696,
900
+ 0.01175006479024887,
901
+ 0.020824184641242027,
902
+ 0.02868003584444523,
903
+ 0.018705619499087334,
904
+ 0.014115615747869015,
905
+ 0.004133924841880798,
906
+ 0.022322585806250572,
907
+ 0.008793945424258709
908
+ ],
909
+ "info_loss": [
910
+ -0.3039093017578125,
911
+ -0.25568628311157227,
912
+ -0.31884098052978516,
913
+ -0.19432926177978516,
914
+ -0.054767608642578125,
915
+ -0.049605607986450195,
916
+ -0.04014873504638672,
917
+ -0.05167961120605469,
918
+ -0.07442402839660645,
919
+ -0.13443315029144287,
920
+ -0.12893474102020264,
921
+ -0.17337191104888916,
922
+ -0.19108903408050537,
923
+ -0.21625876426696777,
924
+ -0.20988011360168457,
925
+ -0.4322943687438965,
926
+ -1.1377909183502197,
927
+ -1.229161024093628,
928
+ -1.3951693773269653,
929
+ -1.4703682661056519,
930
+ -1.580564260482788,
931
+ -1.5719064474105835,
932
+ -1.6765954494476318,
933
+ -1.5430896282196045,
934
+ -1.7418283224105835,
935
+ -1.6556910276412964,
936
+ -1.6543322801589966,
937
+ -1.6190367937088013,
938
+ -1.650298833847046,
939
+ -1.633048415184021,
940
+ -1.6830683946609497,
941
+ -1.6315804719924927,
942
+ -1.6118990182876587,
943
+ -1.7115004062652588,
944
+ -1.6398777961730957,
945
+ -1.6054381132125854,
946
+ -1.6660842895507812,
947
+ -1.5763437747955322,
948
+ -1.575171947479248,
949
+ -1.6467103958129883,
950
+ -1.5790048837661743,
951
+ -1.514373540878296,
952
+ -1.2676775455474854,
953
+ -1.2094448804855347,
954
+ -0.9074189066886902,
955
+ -0.8032690286636353,
956
+ -0.7583819031715393,
957
+ -0.6490398645401001,
958
+ -0.5744845867156982,
959
+ -0.6607133150100708,
960
+ -0.5075458884239197,
961
+ -0.5478048920631409,
962
+ -0.5586112141609192,
963
+ -0.5572612881660461,
964
+ -0.5309542417526245,
965
+ -0.48941725492477417,
966
+ -0.4249153137207031,
967
+ -0.3829994797706604,
968
+ -0.3637515902519226,
969
+ -0.31148210167884827,
970
+ -0.3624016046524048,
971
+ -0.5192978978157043,
972
+ -0.3173016309738159,
973
+ -0.34558427333831787,
974
+ -0.2973107695579529,
975
+ -0.28006038069725037,
976
+ -0.28304430842399597,
977
+ -0.27716898918151855,
978
+ -0.31370648741722107,
979
+ -0.3037734031677246,
980
+ -0.23494072258472443,
981
+ -0.22656802833080292,
982
+ -0.3627624213695526,
983
+ -0.25011780858039856,
984
+ -0.18683567643165588,
985
+ -0.20739343762397766,
986
+ -0.2596602737903595,
987
+ -0.19889728724956512,
988
+ -0.26800841093063354,
989
+ -0.27274608612060547,
990
+ -0.2986396551132202,
991
+ -0.24110020697116852,
992
+ -0.22729624807834625,
993
+ -0.2283105105161667,
994
+ -0.2394106090068817,
995
+ -0.2636500298976898,
996
+ -0.1884169727563858,
997
+ -0.1727910190820694,
998
+ -0.15604889392852783,
999
+ -0.20469872653484344,
1000
+ -0.2344672530889511,
1001
+ -0.19138728082180023,
1002
+ -0.1769782155752182,
1003
+ -0.160061314702034,
1004
+ -0.19289621710777283,
1005
+ -0.35286980867385864,
1006
+ -0.1973426192998886,
1007
+ -0.2565523087978363,
1008
+ -0.27472347021102905,
1009
+ -0.2148154079914093,
1010
+ -0.1984354555606842,
1011
+ -0.1368931382894516,
1012
+ -0.17813047766685486,
1013
+ -0.14283229410648346,
1014
+ -0.1391829252243042,
1015
+ -0.1878795474767685,
1016
+ -0.13922472298145294,
1017
+ -0.21557334065437317,
1018
+ -0.137115016579628,
1019
+ -0.23376700282096863,
1020
+ -0.16109754145145416,
1021
+ -0.15478913486003876,
1022
+ -0.15512211620807648,
1023
+ -0.17280195653438568,
1024
+ -0.18132664263248444,
1025
+ -0.1594957411289215,
1026
+ -0.17192837595939636,
1027
+ -0.15713313221931458,
1028
+ -0.1366598904132843,
1029
+ -0.1502690315246582,
1030
+ -0.15552976727485657,
1031
+ -0.16888968646526337,
1032
+ -0.1356629729270935,
1033
+ -0.13934867084026337,
1034
+ -0.17790979146957397,
1035
+ -0.14454492926597595,
1036
+ -0.11023528128862381,
1037
+ -0.11658834666013718,
1038
+ -0.16530659794807434,
1039
+ -0.1505998969078064,
1040
+ -0.15333877503871918,
1041
+ -0.15518233180046082,
1042
+ -0.12159797549247742,
1043
+ -0.12795329093933105,
1044
+ -0.1253867745399475,
1045
+ -0.12043915688991547,
1046
+ -0.125812828540802,
1047
+ -0.09025537967681885,
1048
+ -0.17112232744693756,
1049
+ -0.11628134548664093,
1050
+ -0.12609297037124634,
1051
+ -0.10718151926994324,
1052
+ -0.09783569723367691,
1053
+ -0.09083214402198792,
1054
+ -0.11275403201580048,
1055
+ -0.10062570124864578,
1056
+ -0.10635444521903992,
1057
+ -0.09162037819623947,
1058
+ -0.1473710536956787,
1059
+ -0.10226716101169586,
1060
+ -0.13601011037826538,
1061
+ -0.11056432127952576,
1062
+ -0.12312618643045425,
1063
+ -0.1776789426803589,
1064
+ -0.14076223969459534,
1065
+ -0.10711970180273056,
1066
+ -0.06863991916179657,
1067
+ -0.1251138150691986,
1068
+ -0.14144030213356018,
1069
+ -0.15062983334064484,
1070
+ -0.08860492706298828,
1071
+ -0.10636203736066818,
1072
+ -0.09127325564622879,
1073
+ -0.10154711455106735,
1074
+ -0.13964059948921204,
1075
+ -0.07681436836719513,
1076
+ -0.09958827495574951,
1077
+ -0.10726893693208694,
1078
+ -0.0754103809595108,
1079
+ -0.05706685781478882,
1080
+ -0.07299036532640457,
1081
+ -0.13755835592746735,
1082
+ -0.09162119776010513,
1083
+ -0.10907827317714691,
1084
+ -0.15164072811603546,
1085
+ -0.11811167746782303,
1086
+ -0.03249345347285271,
1087
+ -0.0903124213218689,
1088
+ -0.12119682878255844,
1089
+ -0.06970714777708054,
1090
+ -0.06679243594408035,
1091
+ -0.07746848464012146,
1092
+ -0.1049945279955864,
1093
+ -0.10831177979707718,
1094
+ -0.07852256298065186,
1095
+ -0.07461845874786377,
1096
+ -0.0801382064819336,
1097
+ -0.09072548896074295,
1098
+ -0.0461912527680397,
1099
+ -0.08726274222135544,
1100
+ -0.0985114574432373,
1101
+ -0.08456294983625412,
1102
+ -0.06125200167298317,
1103
+ -0.06186487525701523,
1104
+ -0.020790398120880127,
1105
+ -0.052596382796764374,
1106
+ -0.057847101241350174,
1107
+ -0.07461639493703842,
1108
+ -0.04391394183039665,
1109
+ -0.04002353176474571,
1110
+ -0.05813704803586006,
1111
+ -0.050615258514881134,
1112
+ -0.06931646913290024,
1113
+ -0.03439071774482727,
1114
+ -0.056624509394168854,
1115
+ -0.058373335748910904,
1116
+ -0.06252697855234146,
1117
+ -0.08378857374191284,
1118
+ -0.04694179818034172,
1119
+ -0.048417072743177414,
1120
+ -0.041149038821458817,
1121
+ -0.05321168899536133,
1122
+ -0.05434707552194595,
1123
+ -0.05887436121702194,
1124
+ -0.05817076563835144,
1125
+ -0.04709482938051224,
1126
+ -0.07026635110378265,
1127
+ -0.03015829622745514,
1128
+ -0.04905325546860695,
1129
+ -0.06654560565948486,
1130
+ -0.030544336885213852,
1131
+ -0.04069141298532486,
1132
+ -0.05243115499615669,
1133
+ -0.03185577690601349,
1134
+ -0.05531829595565796,
1135
+ -0.043741751462221146,
1136
+ -0.047834210097789764,
1137
+ -0.04247414320707321,
1138
+ -0.04620106518268585,
1139
+ -0.05786474794149399,
1140
+ -0.039284951984882355,
1141
+ -0.04059477895498276,
1142
+ -0.037263140082359314,
1143
+ -0.05885086953639984,
1144
+ -0.06672535091638565,
1145
+ -0.0428934171795845,
1146
+ -0.03250708058476448,
1147
+ -0.047808755189180374,
1148
+ -0.023388231173157692,
1149
+ -0.03517588973045349,
1150
+ -0.021835356950759888,
1151
+ -0.030310988426208496,
1152
+ -0.048488788306713104,
1153
+ -0.057092029601335526,
1154
+ -0.020513668656349182,
1155
+ -0.03813441842794418,
1156
+ -0.009540590457618237,
1157
+ -0.026532385498285294,
1158
+ -0.032044872641563416,
1159
+ -0.054148320108652115,
1160
+ -0.01852763630449772,
1161
+ -0.05834845080971718,
1162
+ -0.04863329231739044,
1163
+ -0.061629801988601685,
1164
+ -0.035191670060157776,
1165
+ -0.018583303317427635,
1166
+ -0.031511276960372925,
1167
+ -0.023687515407800674,
1168
+ -0.04183052107691765,
1169
+ -0.02848932333290577,
1170
+ -0.04992211237549782,
1171
+ -0.03088497184216976,
1172
+ -0.03225800395011902,
1173
+ -0.050096165388822556,
1174
+ -0.03905072063207626,
1175
+ -0.017788220196962357,
1176
+ -0.01920984499156475,
1177
+ -0.022910727187991142,
1178
+ -0.035870496183633804,
1179
+ -0.016952384263277054,
1180
+ -0.02188054285943508,
1181
+ -0.02132139354944229,
1182
+ -0.030908163636922836,
1183
+ -0.006695533636957407,
1184
+ -0.03312639519572258,
1185
+ -0.03859920799732208,
1186
+ -0.021069664508104324,
1187
+ -0.028425302356481552,
1188
+ -0.01996333710849285,
1189
+ -0.02125830017030239,
1190
+ -0.03950563073158264,
1191
+ -0.030400089919567108,
1192
+ -0.032812416553497314,
1193
+ -0.014219382777810097,
1194
+ -0.017884526401758194,
1195
+ -0.013407579623162746,
1196
+ -0.025049446150660515,
1197
+ -0.00478351628407836,
1198
+ -0.026763346046209335,
1199
+ -0.021270256489515305,
1200
+ -0.04042299464344978,
1201
+ -0.022487716749310493,
1202
+ -0.011748102493584156,
1203
+ -0.020802181214094162,
1204
+ -0.028673797845840454,
1205
+ -0.01862839236855507,
1206
+ -0.014111454598605633,
1207
+ -0.004131872672587633,
1208
+ -0.022314749658107758,
1209
+ -0.008790398947894573
1210
+ ],
1211
+ "abs_loss": [
1212
+ 3.3947887420654297,
1213
+ 3.355994701385498,
1214
+ 3.1868395805358887,
1215
+ 2.9957025051116943,
1216
+ 2.636652708053589,
1217
+ 2.5180301666259766,
1218
+ 1.9289097785949707,
1219
+ 1.1535060405731201,
1220
+ 1.0622076988220215,
1221
+ 1.2105638980865479,
1222
+ 1.2612888813018799,
1223
+ 1.1270835399627686,
1224
+ 1.164677381515503,
1225
+ 1.1221411228179932,
1226
+ 1.0970821380615234,
1227
+ 0.787369966506958,
1228
+ 1.1733012199401855,
1229
+ 1.088056206703186,
1230
+ 1.086652398109436,
1231
+ 1.0431888103485107,
1232
+ 0.8837997913360596,
1233
+ 0.9671907424926758,
1234
+ 0.8009629249572754,
1235
+ 0.7664799690246582,
1236
+ 0.7298077344894409,
1237
+ 0.5918371677398682,
1238
+ 0.5854489803314209,
1239
+ 0.6336506009101868,
1240
+ 0.7560532093048096,
1241
+ 0.4996872842311859,
1242
+ 0.4896530508995056,
1243
+ 0.5172319412231445,
1244
+ 0.5553824305534363,
1245
+ 0.5992914438247681,
1246
+ 0.4079827666282654,
1247
+ 0.6127545833587646,
1248
+ 0.5886710286140442,
1249
+ 0.4055051803588867,
1250
+ 0.5210465788841248,
1251
+ 0.4203464388847351,
1252
+ 0.4285019338130951,
1253
+ 0.47940152883529663,
1254
+ 0.4155282974243164,
1255
+ 0.439352422952652,
1256
+ 0.4332502782344818,
1257
+ 0.5129095315933228,
1258
+ 0.4495353698730469,
1259
+ 0.3472867012023926,
1260
+ 0.40901464223861694,
1261
+ 0.3672488331794739,
1262
+ 0.3482757806777954,
1263
+ 0.37994515895843506,
1264
+ 0.43616002798080444,
1265
+ 0.3600550591945648,
1266
+ 0.3320258855819702,
1267
+ 0.355334997177124,
1268
+ 0.289895236492157,
1269
+ 0.2699585556983948,
1270
+ 0.26594990491867065,
1271
+ 0.2789926528930664,
1272
+ 0.28545188903808594,
1273
+ 0.24128937721252441,
1274
+ 0.21557548642158508,
1275
+ 0.29902154207229614,
1276
+ 0.29513996839523315,
1277
+ 0.2261316329240799,
1278
+ 0.23958441615104675,
1279
+ 0.31923651695251465,
1280
+ 0.27118515968322754,
1281
+ 0.23833268880844116,
1282
+ 0.17458440363407135,
1283
+ 0.2082197368144989,
1284
+ 0.25783029198646545,
1285
+ 0.23325616121292114,
1286
+ 0.28747764229774475,
1287
+ 0.2220531404018402,
1288
+ 0.19746264815330505,
1289
+ 0.2527940273284912,
1290
+ 0.20642422139644623,
1291
+ 0.18559518456459045,
1292
+ 0.20667535066604614,
1293
+ 0.23093782365322113,
1294
+ 0.24432438611984253,
1295
+ 0.20482295751571655,
1296
+ 0.17530974745750427,
1297
+ 0.25710201263427734,
1298
+ 0.24117588996887207,
1299
+ 0.21339458227157593,
1300
+ 0.18219798803329468,
1301
+ 0.29019445180892944,
1302
+ 0.2061009705066681,
1303
+ 0.2884983420372009,
1304
+ 0.15619494020938873,
1305
+ 0.19746707379817963,
1306
+ 0.15183740854263306,
1307
+ 0.24942252039909363,
1308
+ 0.16572964191436768,
1309
+ 0.21800562739372253,
1310
+ 0.18709537386894226,
1311
+ 0.18629208207130432,
1312
+ 0.22767946124076843,
1313
+ 0.1663786768913269,
1314
+ 0.2522010803222656,
1315
+ 0.1544596552848816,
1316
+ 0.1796630322933197,
1317
+ 0.16058242321014404,
1318
+ 0.13038626313209534,
1319
+ 0.15064063668251038,
1320
+ 0.1634083390235901,
1321
+ 0.14795365929603577,
1322
+ 0.11809875071048737,
1323
+ 0.16260576248168945,
1324
+ 0.1509130597114563,
1325
+ 0.14089354872703552,
1326
+ 0.1798515021800995,
1327
+ 0.1337878406047821,
1328
+ 0.16343703866004944,
1329
+ 0.14893639087677002,
1330
+ 0.13968947529792786,
1331
+ 0.15690213441848755,
1332
+ 0.15960702300071716,
1333
+ 0.10107538104057312,
1334
+ 0.10875316709280014,
1335
+ 0.17253854870796204,
1336
+ 0.13098755478858948,
1337
+ 0.10898811370134354,
1338
+ 0.11676128953695297,
1339
+ 0.15887998044490814,
1340
+ 0.06520901620388031,
1341
+ 0.08105364441871643,
1342
+ 0.18425777554512024,
1343
+ 0.08747240155935287,
1344
+ 0.11760591715574265,
1345
+ 0.05891865864396095,
1346
+ 0.09311813116073608,
1347
+ 0.10404924303293228,
1348
+ 0.10930569469928741,
1349
+ 0.07826673984527588,
1350
+ 0.08597943186759949,
1351
+ 0.09667380154132843,
1352
+ 0.08121703565120697,
1353
+ 0.14723467826843262,
1354
+ 0.05955659598112106,
1355
+ 0.0923231914639473,
1356
+ 0.07016702741384506,
1357
+ 0.09162533283233643,
1358
+ 0.07628462463617325,
1359
+ 0.0766228511929512,
1360
+ 0.09439100325107574,
1361
+ 0.08760590851306915,
1362
+ 0.0737878605723381,
1363
+ 0.06837128102779388,
1364
+ 0.08421748876571655,
1365
+ 0.0957871600985527,
1366
+ 0.07666170597076416,
1367
+ 0.1123364269733429,
1368
+ 0.09760688245296478,
1369
+ 0.07807846367359161,
1370
+ 0.06708869338035583,
1371
+ 0.08171576261520386,
1372
+ 0.06592215597629547,
1373
+ 0.08457791060209274,
1374
+ 0.06967782974243164,
1375
+ 0.0786462351679802,
1376
+ 0.06119159981608391,
1377
+ 0.06770946830511093,
1378
+ 0.07555916905403137,
1379
+ 0.09257392585277557,
1380
+ 0.07516339421272278,
1381
+ 0.07899697124958038,
1382
+ 0.07565949112176895,
1383
+ 0.10470855236053467,
1384
+ 0.04123685508966446,
1385
+ 0.04719582572579384,
1386
+ 0.057023901492357254,
1387
+ 0.06000470742583275,
1388
+ 0.050972916185855865,
1389
+ 0.026791758835315704,
1390
+ 0.05733746662735939,
1391
+ 0.057162001729011536,
1392
+ 0.06315764784812927,
1393
+ 0.06523626297712326,
1394
+ 0.06238469481468201,
1395
+ 0.056802794337272644,
1396
+ 0.03760264068841934,
1397
+ 0.057449936866760254,
1398
+ 0.056212738156318665,
1399
+ 0.06407733261585236,
1400
+ 0.05097174644470215,
1401
+ 0.05976347252726555,
1402
+ 0.09436068683862686,
1403
+ 0.04945018142461777,
1404
+ 0.11757603287696838,
1405
+ 0.07025796175003052,
1406
+ 0.056657664477825165,
1407
+ 0.050152845680713654,
1408
+ 0.053100623190402985,
1409
+ 0.06337989121675491,
1410
+ 0.052439115941524506,
1411
+ 0.029815109446644783,
1412
+ 0.05111522600054741,
1413
+ 0.04386456310749054,
1414
+ 0.04625169187784195,
1415
+ 0.05024842917919159,
1416
+ 0.07870125025510788,
1417
+ 0.057452261447906494,
1418
+ 0.04711850360035896,
1419
+ 0.03932467848062515,
1420
+ 0.040417902171611786,
1421
+ 0.044037483632564545,
1422
+ 0.038460854440927505,
1423
+ 0.0472777783870697,
1424
+ 0.030307834967970848,
1425
+ 0.03239193931221962,
1426
+ 0.041062939912080765,
1427
+ 0.028412584215402603,
1428
+ 0.04923238605260849,
1429
+ 0.02583213895559311,
1430
+ 0.03357554227113724,
1431
+ 0.045960620045661926,
1432
+ 0.032667823135852814,
1433
+ 0.0440668985247612,
1434
+ 0.04598768800497055,
1435
+ 0.020485155284404755,
1436
+ 0.03069138713181019,
1437
+ 0.09542465955018997,
1438
+ 0.04972872883081436,
1439
+ 0.04988779500126839,
1440
+ 0.06253587454557419,
1441
+ 0.041065312922000885,
1442
+ 0.056552380323410034,
1443
+ 0.03858733922243118,
1444
+ 0.0346544086933136,
1445
+ 0.04244701936841011,
1446
+ 0.04882288724184036,
1447
+ 0.02505997195839882,
1448
+ 0.08355213701725006,
1449
+ 0.04368632659316063,
1450
+ 0.02518036775290966,
1451
+ 0.03222693130373955,
1452
+ 0.02847285196185112,
1453
+ 0.028555555269122124,
1454
+ 0.04500667750835419,
1455
+ 0.039119310677051544,
1456
+ 0.042069531977176666,
1457
+ 0.04982626438140869,
1458
+ 0.06467273831367493,
1459
+ 0.05387020483613014,
1460
+ 0.044043101370334625,
1461
+ 0.04368911683559418,
1462
+ 0.04396820440888405,
1463
+ 0.059396810829639435,
1464
+ 0.04429316520690918,
1465
+ 0.03188247233629227,
1466
+ 0.0384872704744339,
1467
+ 0.04625459387898445,
1468
+ 0.03219570964574814,
1469
+ 0.0690075159072876,
1470
+ 0.038136277347803116,
1471
+ 0.046186305582523346,
1472
+ 0.0670032873749733,
1473
+ 0.03440630063414574,
1474
+ 0.04002414643764496,
1475
+ 0.0336119569838047,
1476
+ 0.027710601687431335,
1477
+ 0.032281503081321716,
1478
+ 0.024941034615039825,
1479
+ 0.03399371728301048,
1480
+ 0.043286774307489395,
1481
+ 0.031762830913066864,
1482
+ 0.06252194941043854,
1483
+ 0.03299562633037567,
1484
+ 0.03929908946156502,
1485
+ 0.018995758146047592,
1486
+ 0.06292541325092316,
1487
+ 0.035221878439188004,
1488
+ 0.03341846168041229,
1489
+ 0.04938807711005211,
1490
+ 0.027772381901741028,
1491
+ 0.023751210421323776,
1492
+ 0.040190670639276505,
1493
+ 0.03436459228396416,
1494
+ 0.03515885770320892,
1495
+ 0.0373615026473999,
1496
+ 0.021354738622903824,
1497
+ 0.04102501645684242,
1498
+ 0.036710917949676514,
1499
+ 0.036844585090875626,
1500
+ 0.051790397614240646,
1501
+ 0.026980645954608917,
1502
+ 0.04401412978768349,
1503
+ 0.038550522178411484,
1504
+ 0.02942569926381111,
1505
+ 0.04987340420484543,
1506
+ 0.03775779530405998,
1507
+ 0.02882983535528183,
1508
+ 0.05363527312874794,
1509
+ 0.027315087616443634,
1510
+ 0.020971231162548065,
1511
+ 0.035575009882450104
1512
+ ],
1513
+ "zipf_loss": [
1514
+ 6.58882999420166,
1515
+ 4.696296691894531,
1516
+ 2.60154128074646,
1517
+ 1.3694965839385986,
1518
+ 0.9468953609466553,
1519
+ 0.8714652061462402,
1520
+ 0.6310137510299683,
1521
+ 0.1701616644859314,
1522
+ 0.12800396978855133,
1523
+ 0.08986442536115646,
1524
+ 0.050746090710163116,
1525
+ 0.061233147978782654,
1526
+ 0.05077056214213371,
1527
+ 0.053653884679079056,
1528
+ 0.03812534362077713,
1529
+ 0.07403817772865295,
1530
+ 0.06016801297664642,
1531
+ 0.0745084285736084,
1532
+ 0.056058380752801895,
1533
+ 0.05434504151344299,
1534
+ 0.08318846672773361,
1535
+ 0.045144904404878616,
1536
+ 0.05766122043132782,
1537
+ 0.05146005004644394,
1538
+ 0.050165221095085144,
1539
+ 0.048910077661275864,
1540
+ 0.056483615189790726,
1541
+ 0.047232866287231445,
1542
+ 0.03511703759431839,
1543
+ 0.070347361266613,
1544
+ 0.07475403696298599,
1545
+ 0.0609690397977829,
1546
+ 0.0333818756043911,
1547
+ 0.018616575747728348,
1548
+ 0.08691272884607315,
1549
+ 0.029536176472902298,
1550
+ 0.03901568427681923,
1551
+ 0.04187442362308502,
1552
+ 0.02211182191967964,
1553
+ 0.05028867721557617,
1554
+ 0.06970130652189255,
1555
+ 0.028500426560640335,
1556
+ 0.033670824021101,
1557
+ 0.03217380493879318,
1558
+ 0.03515150398015976,
1559
+ 0.01524924673140049,
1560
+ 0.014954814687371254,
1561
+ 0.03596249967813492,
1562
+ 0.030069705098867416,
1563
+ 0.03269797936081886,
1564
+ 0.03397458419203758,
1565
+ 0.027886394411325455,
1566
+ 0.01852090284228325,
1567
+ 0.04265565052628517,
1568
+ 0.04029293358325958,
1569
+ 0.03672034293413162,
1570
+ 0.02659197896718979,
1571
+ 0.02510666288435459,
1572
+ 0.03215096890926361,
1573
+ 0.04331589862704277,
1574
+ 0.03935756906867027,
1575
+ 0.05838822200894356,
1576
+ 0.020017120987176895,
1577
+ 0.03762765973806381,
1578
+ 0.029524000361561775,
1579
+ 0.04549149423837662,
1580
+ 0.03377367556095123,
1581
+ 0.02657960169017315,
1582
+ 0.026657648384571075,
1583
+ 0.017064208164811134,
1584
+ 0.05312030762434006,
1585
+ 0.02317437157034874,
1586
+ 0.027265695855021477,
1587
+ 0.023985985666513443,
1588
+ 0.03351731225848198,
1589
+ 0.030405916273593903,
1590
+ 0.04385584592819214,
1591
+ 0.029205456376075745,
1592
+ 0.04440043494105339,
1593
+ 0.036925189197063446,
1594
+ 0.02745618112385273,
1595
+ 0.03552067652344704,
1596
+ 0.04077502712607384,
1597
+ 0.03174997866153717,
1598
+ 0.02391131781041622,
1599
+ 0.02462334930896759,
1600
+ 0.026511013507843018,
1601
+ 0.020848870277404785,
1602
+ 0.032976262271404266,
1603
+ 0.02213592827320099,
1604
+ 0.03985583782196045,
1605
+ 0.00980145763605833,
1606
+ 0.053376540541648865,
1607
+ 0.03559654951095581,
1608
+ 0.04689183831214905,
1609
+ 0.04851072281599045,
1610
+ 0.023303033784031868,
1611
+ 0.018522314727306366,
1612
+ 0.05266643315553665,
1613
+ 0.02761736884713173,
1614
+ 0.03478141129016876,
1615
+ 0.03394386172294617,
1616
+ 0.04285586625337601,
1617
+ 0.04894232004880905,
1618
+ 0.034377939999103546,
1619
+ 0.03750133141875267,
1620
+ 0.06321785598993301,
1621
+ 0.054495833814144135,
1622
+ 0.03354610502719879,
1623
+ 0.040118470788002014,
1624
+ 0.033885374665260315,
1625
+ 0.043508730828762054,
1626
+ 0.04781779646873474,
1627
+ 0.05603636056184769,
1628
+ 0.06224025413393974,
1629
+ 0.019811511039733887,
1630
+ 0.033350951969623566,
1631
+ 0.042019397020339966,
1632
+ 0.04381423816084862,
1633
+ 0.041825853288173676,
1634
+ 0.03326395899057388,
1635
+ 0.03639336675405502,
1636
+ 0.02829602360725403,
1637
+ 0.08036279678344727,
1638
+ 0.06274212151765823,
1639
+ 0.050369687378406525,
1640
+ 0.03235689923167229,
1641
+ 0.03122669830918312,
1642
+ 0.03608278930187225,
1643
+ 0.05039194971323013,
1644
+ 0.0250480305403471,
1645
+ 0.03189028054475784,
1646
+ 0.02768118493258953,
1647
+ 0.04121473804116249,
1648
+ 0.03347885236144066,
1649
+ 0.04774739593267441,
1650
+ 0.02147674560546875,
1651
+ 0.04349803924560547,
1652
+ 0.03534719720482826,
1653
+ 0.020934192463755608,
1654
+ 0.028508242219686508,
1655
+ 0.035276252776384354,
1656
+ 0.03830478712916374,
1657
+ 0.018786411732435226,
1658
+ 0.025830931961536407,
1659
+ 0.020513445138931274,
1660
+ 0.03783036023378372,
1661
+ 0.03398241102695465,
1662
+ 0.03744061663746834,
1663
+ 0.030667103826999664,
1664
+ 0.02306997776031494,
1665
+ 0.05723650008440018,
1666
+ 0.022343957796692848,
1667
+ 0.0465073361992836,
1668
+ 0.03226206824183464,
1669
+ 0.038375016301870346,
1670
+ 0.030423959717154503,
1671
+ 0.027896907180547714,
1672
+ 0.03134632855653763,
1673
+ 0.03557799756526947,
1674
+ 0.0439428985118866,
1675
+ 0.04076138138771057,
1676
+ 0.020610880106687546,
1677
+ 0.03045407496392727,
1678
+ 0.05700647830963135,
1679
+ 0.030589675530791283,
1680
+ 0.03426211699843407,
1681
+ 0.026764456182718277,
1682
+ 0.06922566890716553,
1683
+ 0.054616279900074005,
1684
+ 0.04217809811234474,
1685
+ 0.032258354127407074,
1686
+ 0.04832490161061287,
1687
+ 0.0554993562400341,
1688
+ 0.035088032484054565,
1689
+ 0.04727983847260475,
1690
+ 0.03148068115115166,
1691
+ 0.06542038917541504,
1692
+ 0.03722023218870163,
1693
+ 0.05560505762696266,
1694
+ 0.0495443157851696,
1695
+ 0.025341596454381943,
1696
+ 0.026903830468654633,
1697
+ 0.023342445492744446,
1698
+ 0.024944588541984558,
1699
+ 0.035671256482601166,
1700
+ 0.025382786989212036,
1701
+ 0.034903496503829956,
1702
+ 0.04084325209259987,
1703
+ 0.020658954977989197,
1704
+ 0.0318995900452137,
1705
+ 0.045196421444416046,
1706
+ 0.04701791703701019,
1707
+ 0.04624432325363159,
1708
+ 0.05676574632525444,
1709
+ 0.03249902278184891,
1710
+ 0.023187857121229172,
1711
+ 0.04335003346204758,
1712
+ 0.03798030689358711,
1713
+ 0.050009217113256454,
1714
+ 0.026981737464666367,
1715
+ 0.040440212935209274,
1716
+ 0.034488074481487274,
1717
+ 0.025710783898830414,
1718
+ 0.03760576993227005,
1719
+ 0.04182407259941101,
1720
+ 0.04745098203420639,
1721
+ 0.02730601467192173,
1722
+ 0.04120548814535141,
1723
+ 0.026018794625997543,
1724
+ 0.036915123462677,
1725
+ 0.018772978335618973,
1726
+ 0.027699263766407967,
1727
+ 0.036259058862924576,
1728
+ 0.02970455214381218,
1729
+ 0.05300603061914444,
1730
+ 0.02369600161910057,
1731
+ 0.02279607206583023,
1732
+ 0.039416879415512085,
1733
+ 0.022341210395097733,
1734
+ 0.035090915858745575,
1735
+ 0.04990437254309654,
1736
+ 0.022070778533816338,
1737
+ 0.03636438027024269,
1738
+ 0.021691016852855682,
1739
+ 0.05067375302314758,
1740
+ 0.03203708678483963,
1741
+ 0.037472669035196304,
1742
+ 0.029600756242871284,
1743
+ 0.035964228212833405,
1744
+ 0.04234728217124939,
1745
+ 0.036631789058446884,
1746
+ 0.024680007249116898,
1747
+ 0.036117538809776306,
1748
+ 0.022160109132528305,
1749
+ 0.034964922815561295,
1750
+ 0.026042522862553596,
1751
+ 0.03308381885290146,
1752
+ 0.026615764945745468,
1753
+ 0.02735886164009571,
1754
+ 0.035516466945409775,
1755
+ 0.02471904456615448,
1756
+ 0.028122467920184135,
1757
+ 0.03318537026643753,
1758
+ 0.02228119783103466,
1759
+ 0.04214617982506752,
1760
+ 0.01839062012732029,
1761
+ 0.026860028505325317,
1762
+ 0.03021903522312641,
1763
+ 0.03780020400881767,
1764
+ 0.05090884864330292,
1765
+ 0.02862248383462429,
1766
+ 0.028941920027136803,
1767
+ 0.022141888737678528,
1768
+ 0.02363584190607071,
1769
+ 0.026611194014549255,
1770
+ 0.030941203236579895,
1771
+ 0.04541895538568497,
1772
+ 0.02225341834127903,
1773
+ 0.03562748432159424,
1774
+ 0.012084392830729485,
1775
+ 0.018961315974593163,
1776
+ 0.02806723490357399,
1777
+ 0.025312531739473343,
1778
+ 0.024661026895046234,
1779
+ 0.02956821769475937,
1780
+ 0.02409803308546543,
1781
+ 0.055379170924425125,
1782
+ 0.04448545724153519,
1783
+ 0.03176925331354141,
1784
+ 0.03904742747545242,
1785
+ 0.02781613916158676,
1786
+ 0.023082362487912178,
1787
+ 0.04732995480298996,
1788
+ 0.03804126754403114,
1789
+ 0.0537090003490448,
1790
+ 0.024907726794481277,
1791
+ 0.03152225539088249,
1792
+ 0.03136312961578369,
1793
+ 0.044882193207740784,
1794
+ 0.029269149526953697,
1795
+ 0.05814700573682785,
1796
+ 0.03469230234622955,
1797
+ 0.03021147847175598,
1798
+ 0.01851522922515869,
1799
+ 0.03311022371053696,
1800
+ 0.027849100530147552,
1801
+ 0.04716012254357338,
1802
+ 0.03468704968690872,
1803
+ 0.04168476164340973,
1804
+ 0.028986569494009018,
1805
+ 0.029695110395550728,
1806
+ 0.02112598717212677,
1807
+ 0.028425775468349457,
1808
+ 0.04426546394824982,
1809
+ 0.019448116421699524,
1810
+ 0.028948213905096054,
1811
+ 0.03452923521399498,
1812
+ 0.030246354639530182,
1813
+ 0.02335442043840885
1814
+ ],
1815
+ "denoise_loss": [],
1816
+ "ortho_loss": [
1817
+ 0.7164890170097351,
1818
+ 0.44001519680023193,
1819
+ 0.23450502753257751,
1820
+ 0.1798117458820343,
1821
+ 0.11821601539850235,
1822
+ 0.08064808696508408,
1823
+ 0.04913584515452385,
1824
+ 0.04442092031240463,
1825
+ 0.03780680522322655,
1826
+ 0.03147492557764053,
1827
+ 0.03255445510149002,
1828
+ 0.03306354209780693,
1829
+ 0.031127508729696274,
1830
+ 0.03149908781051636,
1831
+ 0.03147974982857704,
1832
+ 0.02890501357614994,
1833
+ 0.04472016915678978,
1834
+ 0.05679545924067497,
1835
+ 0.0668342337012291,
1836
+ 0.07476525753736496,
1837
+ 0.08515781164169312,
1838
+ 0.09092093259096146,
1839
+ 0.09147346019744873,
1840
+ 0.09923742711544037,
1841
+ 0.10627821832895279,
1842
+ 0.11134133487939835,
1843
+ 0.11911923438310623,
1844
+ 0.11903499811887741,
1845
+ 0.1265963613986969,
1846
+ 0.1247737854719162,
1847
+ 0.1380072683095932,
1848
+ 0.139429971575737,
1849
+ 0.14270682632923126,
1850
+ 0.1469593346118927,
1851
+ 0.1489012986421585,
1852
+ 0.1440083086490631,
1853
+ 0.14821738004684448,
1854
+ 0.14707738161087036,
1855
+ 0.15268000960350037,
1856
+ 0.15831196308135986,
1857
+ 0.16472434997558594,
1858
+ 0.1661268174648285,
1859
+ 0.17111200094223022,
1860
+ 0.17259204387664795,
1861
+ 0.17933180928230286,
1862
+ 0.1868675798177719,
1863
+ 0.19625088572502136,
1864
+ 0.20457005500793457,
1865
+ 0.21157294511795044,
1866
+ 0.2194136679172516,
1867
+ 0.22429223358631134,
1868
+ 0.23341265320777893,
1869
+ 0.23742900788784027,
1870
+ 0.23962612450122833,
1871
+ 0.23993082344532013,
1872
+ 0.25011855363845825,
1873
+ 0.2589331269264221,
1874
+ 0.26473522186279297,
1875
+ 0.2694035768508911,
1876
+ 0.272711843252182,
1877
+ 0.2754519283771515,
1878
+ 0.2818911373615265,
1879
+ 0.29113882780075073,
1880
+ 0.29514259099960327,
1881
+ 0.29763442277908325,
1882
+ 0.3000759184360504,
1883
+ 0.30084431171417236,
1884
+ 0.3064722716808319,
1885
+ 0.31723761558532715,
1886
+ 0.3191567659378052,
1887
+ 0.3253643810749054,
1888
+ 0.33208969235420227,
1889
+ 0.334012895822525,
1890
+ 0.3363591432571411,
1891
+ 0.33951324224472046,
1892
+ 0.34777316451072693,
1893
+ 0.34541478753089905,
1894
+ 0.33628666400909424,
1895
+ 0.3373204469680786,
1896
+ 0.34333908557891846,
1897
+ 0.34256234765052795,
1898
+ 0.34841620922088623,
1899
+ 0.3535518944263458,
1900
+ 0.35466042160987854,
1901
+ 0.3657434284687042,
1902
+ 0.36002078652381897,
1903
+ 0.3547402620315552,
1904
+ 0.3438624441623688,
1905
+ 0.34744876623153687,
1906
+ 0.35149863362312317,
1907
+ 0.35756582021713257,
1908
+ 0.3576912581920624,
1909
+ 0.3594180643558502,
1910
+ 0.3629657030105591,
1911
+ 0.3711114227771759,
1912
+ 0.3733091950416565,
1913
+ 0.3697828948497772,
1914
+ 0.3735300302505493,
1915
+ 0.37614548206329346,
1916
+ 0.3754543364048004,
1917
+ 0.37430867552757263,
1918
+ 0.3725973665714264,
1919
+ 0.3632843494415283,
1920
+ 0.36546799540519714,
1921
+ 0.3608647584915161,
1922
+ 0.3605231046676636,
1923
+ 0.36258602142333984,
1924
+ 0.3645479083061218,
1925
+ 0.3697208762168884,
1926
+ 0.3715536892414093,
1927
+ 0.37075474858283997,
1928
+ 0.3678865134716034,
1929
+ 0.36681437492370605,
1930
+ 0.36476776003837585,
1931
+ 0.37008997797966003,
1932
+ 0.37324196100234985,
1933
+ 0.3813824951648712,
1934
+ 0.38447922468185425,
1935
+ 0.3872334063053131,
1936
+ 0.3909793496131897,
1937
+ 0.39336153864860535,
1938
+ 0.390764981508255,
1939
+ 0.39270278811454773,
1940
+ 0.3944382965564728,
1941
+ 0.4021323025226593,
1942
+ 0.4101596176624298,
1943
+ 0.41367971897125244,
1944
+ 0.41102364659309387,
1945
+ 0.42576465010643005,
1946
+ 0.42502540349960327,
1947
+ 0.42283493280410767,
1948
+ 0.4223448634147644,
1949
+ 0.4292895197868347,
1950
+ 0.4299042224884033,
1951
+ 0.43099603056907654,
1952
+ 0.4349670708179474,
1953
+ 0.430941641330719,
1954
+ 0.4276216924190521,
1955
+ 0.4218938946723938,
1956
+ 0.43078887462615967,
1957
+ 0.43886658549308777,
1958
+ 0.4456350803375244,
1959
+ 0.4460766613483429,
1960
+ 0.4431578814983368,
1961
+ 0.44184592366218567,
1962
+ 0.44215628504753113,
1963
+ 0.4425334334373474,
1964
+ 0.44719398021698,
1965
+ 0.45072248578071594,
1966
+ 0.45337986946105957,
1967
+ 0.4500051438808441,
1968
+ 0.4455207288265228,
1969
+ 0.4497999846935272,
1970
+ 0.4499672055244446,
1971
+ 0.4508799910545349,
1972
+ 0.4514467418193817,
1973
+ 0.4518853425979614,
1974
+ 0.45511433482170105,
1975
+ 0.45494544506073,
1976
+ 0.45767542719841003,
1977
+ 0.4608568549156189,
1978
+ 0.4599456191062927,
1979
+ 0.45884469151496887,
1980
+ 0.4611905515193939,
1981
+ 0.45628681778907776,
1982
+ 0.45790180563926697,
1983
+ 0.456195205450058,
1984
+ 0.4569515585899353,
1985
+ 0.45791909098625183,
1986
+ 0.46010375022888184,
1987
+ 0.45950251817703247,
1988
+ 0.4618186950683594,
1989
+ 0.4617295265197754,
1990
+ 0.4598270058631897,
1991
+ 0.45474281907081604,
1992
+ 0.4536970853805542,
1993
+ 0.45817336440086365,
1994
+ 0.45483019948005676,
1995
+ 0.4549138844013214,
1996
+ 0.4594607651233673,
1997
+ 0.46500587463378906,
1998
+ 0.4646036624908447,
1999
+ 0.46177607774734497,
2000
+ 0.4655199646949768,
2001
+ 0.4650300145149231,
2002
+ 0.4626225531101227,
2003
+ 0.46814680099487305,
2004
+ 0.46539047360420227,
2005
+ 0.46605440974235535,
2006
+ 0.4705409109592438,
2007
+ 0.4698832929134369,
2008
+ 0.47260361909866333,
2009
+ 0.4737638235092163,
2010
+ 0.47194957733154297,
2011
+ 0.47447729110717773,
2012
+ 0.47706830501556396,
2013
+ 0.4774821698665619,
2014
+ 0.4845934510231018,
2015
+ 0.48296087980270386,
2016
+ 0.4830245077610016,
2017
+ 0.47902020812034607,
2018
+ 0.4795837998390198,
2019
+ 0.4817299246788025,
2020
+ 0.4865899384021759,
2021
+ 0.4874388575553894,
2022
+ 0.4878205955028534,
2023
+ 0.4869936406612396,
2024
+ 0.4862651824951172,
2025
+ 0.48645102977752686,
2026
+ 0.48484084010124207,
2027
+ 0.488354355096817,
2028
+ 0.4892062544822693,
2029
+ 0.48806798458099365,
2030
+ 0.48925110697746277,
2031
+ 0.49163854122161865,
2032
+ 0.49381622672080994,
2033
+ 0.49342846870422363,
2034
+ 0.4912415146827698,
2035
+ 0.4916841983795166,
2036
+ 0.4906071126461029,
2037
+ 0.4897904098033905,
2038
+ 0.49452245235443115,
2039
+ 0.4923728406429291,
2040
+ 0.4922875463962555,
2041
+ 0.49448657035827637,
2042
+ 0.4951864182949066,
2043
+ 0.49540138244628906,
2044
+ 0.4948039650917053,
2045
+ 0.4952405095100403,
2046
+ 0.49712300300598145,
2047
+ 0.4969750642776489,
2048
+ 0.49810075759887695,
2049
+ 0.4981243312358856,
2050
+ 0.4974529445171356,
2051
+ 0.499134361743927,
2052
+ 0.49833613634109497,
2053
+ 0.5001863837242126,
2054
+ 0.4997479021549225,
2055
+ 0.5002753138542175,
2056
+ 0.501311719417572,
2057
+ 0.5036635398864746,
2058
+ 0.5029648542404175,
2059
+ 0.5034725666046143,
2060
+ 0.5049551129341125,
2061
+ 0.5059987306594849,
2062
+ 0.5073911547660828,
2063
+ 0.5067667365074158,
2064
+ 0.5083858370780945,
2065
+ 0.5091679096221924,
2066
+ 0.5096098780632019,
2067
+ 0.5089676976203918,
2068
+ 0.5098400712013245,
2069
+ 0.5101442933082581,
2070
+ 0.5129626989364624,
2071
+ 0.5143404006958008,
2072
+ 0.5133976936340332,
2073
+ 0.5152299404144287,
2074
+ 0.5157557725906372,
2075
+ 0.5187842845916748,
2076
+ 0.5187036395072937,
2077
+ 0.5189111232757568,
2078
+ 0.519492506980896,
2079
+ 0.520779550075531,
2080
+ 0.5204878449440002,
2081
+ 0.5201342105865479,
2082
+ 0.5208142399787903,
2083
+ 0.5219997763633728,
2084
+ 0.5224781632423401,
2085
+ 0.5233966112136841,
2086
+ 0.5231385231018066,
2087
+ 0.5231932401657104,
2088
+ 0.5238833427429199,
2089
+ 0.5240063667297363,
2090
+ 0.5245592594146729,
2091
+ 0.5234469175338745,
2092
+ 0.524029552936554,
2093
+ 0.5236588716506958,
2094
+ 0.52469402551651,
2095
+ 0.5251315832138062,
2096
+ 0.5246515274047852,
2097
+ 0.5242875218391418,
2098
+ 0.5250592231750488,
2099
+ 0.5248522758483887,
2100
+ 0.5247886776924133,
2101
+ 0.5251317620277405,
2102
+ 0.5267933011054993,
2103
+ 0.5268675088882446,
2104
+ 0.5270206332206726,
2105
+ 0.5275089740753174,
2106
+ 0.5276087522506714,
2107
+ 0.5281514525413513,
2108
+ 0.5281208157539368,
2109
+ 0.5284842252731323,
2110
+ 0.528671383857727,
2111
+ 0.5284337401390076,
2112
+ 0.5283054113388062,
2113
+ 0.5284829139709473,
2114
+ 0.5284526944160461,
2115
+ 0.5282247066497803,
2116
+ 0.5278456211090088
2117
+ ],
2118
+ "lr": [
2119
+ 8.376068376068378e-06,
2120
+ 1.6923076923076924e-05,
2121
+ 2.5470085470085475e-05,
2122
+ 3.401709401709402e-05,
2123
+ 4.2564102564102564e-05,
2124
+ 5.1111111111111115e-05,
2125
+ 5.9658119658119666e-05,
2126
+ 6.820512820512821e-05,
2127
+ 7.675213675213675e-05,
2128
+ 8e-05,
2129
+ 8e-05,
2130
+ 8e-05,
2131
+ 8e-05,
2132
+ 8e-05,
2133
+ 8e-05,
2134
+ 8e-05,
2135
+ 8e-05,
2136
+ 8e-05,
2137
+ 8e-05,
2138
+ 8e-05,
2139
+ 8e-05,
2140
+ 8e-05,
2141
+ 8e-05,
2142
+ 8e-05,
2143
+ 8e-05,
2144
+ 8e-05,
2145
+ 8e-05,
2146
+ 8e-05,
2147
+ 8e-05,
2148
+ 8e-05,
2149
+ 8e-05,
2150
+ 8e-05,
2151
+ 8e-05,
2152
+ 8e-05,
2153
+ 8e-05,
2154
+ 8e-05,
2155
+ 8e-05,
2156
+ 8e-05,
2157
+ 8e-05,
2158
+ 8e-05,
2159
+ 8e-05,
2160
+ 8e-05,
2161
+ 8e-05,
2162
+ 8e-05,
2163
+ 8e-05,
2164
+ 8e-05,
2165
+ 8e-05,
2166
+ 8e-05,
2167
+ 8e-05,
2168
+ 8e-05,
2169
+ 8e-05,
2170
+ 8e-05,
2171
+ 8e-05,
2172
+ 8e-05,
2173
+ 8e-05,
2174
+ 8e-05,
2175
+ 8e-05,
2176
+ 8e-05,
2177
+ 8e-05,
2178
+ 8e-05,
2179
+ 8e-05,
2180
+ 8e-05,
2181
+ 8e-05,
2182
+ 8e-05,
2183
+ 8e-05,
2184
+ 8e-05,
2185
+ 8e-05,
2186
+ 8e-05,
2187
+ 8e-05,
2188
+ 8e-05,
2189
+ 8e-05,
2190
+ 8e-05,
2191
+ 8e-05,
2192
+ 8e-05,
2193
+ 8e-05,
2194
+ 8e-05,
2195
+ 8e-05,
2196
+ 8e-05,
2197
+ 8e-05,
2198
+ 8e-05,
2199
+ 8e-05,
2200
+ 8e-05,
2201
+ 8e-05,
2202
+ 8e-05,
2203
+ 8e-05,
2204
+ 8e-05,
2205
+ 8e-05,
2206
+ 8e-05,
2207
+ 8e-05,
2208
+ 8e-05,
2209
+ 8e-05,
2210
+ 8e-05,
2211
+ 8e-05,
2212
+ 8e-05,
2213
+ 8e-05,
2214
+ 8e-05,
2215
+ 8e-05,
2216
+ 8e-05,
2217
+ 8e-05,
2218
+ 8e-05,
2219
+ 8e-05,
2220
+ 8e-05,
2221
+ 8e-05,
2222
+ 8e-05,
2223
+ 8e-05,
2224
+ 8e-05,
2225
+ 8e-05,
2226
+ 8e-05,
2227
+ 8e-05,
2228
+ 8e-05,
2229
+ 8e-05,
2230
+ 8e-05,
2231
+ 8e-05,
2232
+ 8e-05,
2233
+ 8e-05,
2234
+ 8e-05,
2235
+ 8e-05,
2236
+ 8e-05,
2237
+ 8e-05,
2238
+ 8e-05,
2239
+ 8e-05,
2240
+ 8e-05,
2241
+ 8e-05,
2242
+ 8e-05,
2243
+ 8e-05,
2244
+ 8e-05,
2245
+ 8e-05,
2246
+ 8e-05,
2247
+ 8e-05,
2248
+ 8e-05,
2249
+ 8e-05,
2250
+ 8e-05,
2251
+ 8e-05,
2252
+ 8e-05,
2253
+ 8e-05,
2254
+ 8e-05,
2255
+ 8e-05,
2256
+ 8e-05,
2257
+ 8e-05,
2258
+ 8e-05,
2259
+ 8e-05,
2260
+ 8e-05,
2261
+ 8e-05,
2262
+ 8e-05,
2263
+ 8e-05,
2264
+ 8e-05,
2265
+ 8e-05,
2266
+ 8e-05,
2267
+ 8e-05,
2268
+ 8e-05,
2269
+ 8e-05,
2270
+ 8e-05,
2271
+ 8e-05,
2272
+ 8e-05,
2273
+ 8e-05,
2274
+ 8e-05,
2275
+ 8e-05,
2276
+ 8e-05,
2277
+ 8e-05,
2278
+ 8e-05,
2279
+ 8e-05,
2280
+ 8e-05,
2281
+ 8e-05,
2282
+ 8e-05,
2283
+ 8e-05,
2284
+ 8e-05,
2285
+ 8e-05,
2286
+ 8e-05,
2287
+ 8e-05,
2288
+ 8e-05,
2289
+ 8e-05,
2290
+ 8e-05,
2291
+ 8e-05,
2292
+ 8e-05,
2293
+ 8e-05,
2294
+ 8e-05,
2295
+ 8e-05,
2296
+ 8e-05,
2297
+ 8e-05,
2298
+ 8e-05,
2299
+ 8e-05,
2300
+ 8e-05,
2301
+ 8e-05,
2302
+ 7.98600052728711e-05,
2303
+ 7.92668072765621e-05,
2304
+ 7.86736092802531e-05,
2305
+ 7.808041128394411e-05,
2306
+ 7.748721328763512e-05,
2307
+ 7.689401529132612e-05,
2308
+ 7.630081729501713e-05,
2309
+ 7.570761929870815e-05,
2310
+ 7.511442130239916e-05,
2311
+ 7.452122330609016e-05,
2312
+ 7.392802530978118e-05,
2313
+ 7.333482731347219e-05,
2314
+ 7.236198259952545e-05,
2315
+ 7.176878460321646e-05,
2316
+ 7.117558660690747e-05,
2317
+ 7.058238861059848e-05,
2318
+ 6.998919061428949e-05,
2319
+ 6.939599261798048e-05,
2320
+ 6.88027946216715e-05,
2321
+ 6.820959662536251e-05,
2322
+ 6.761639862905352e-05,
2323
+ 6.702320063274453e-05,
2324
+ 6.643000263643554e-05,
2325
+ 6.583680464012655e-05,
2326
+ 6.524360664381755e-05,
2327
+ 6.465040864750859e-05,
2328
+ 6.405721065119958e-05,
2329
+ 6.308436593725284e-05,
2330
+ 6.249116794094385e-05,
2331
+ 6.189796994463487e-05,
2332
+ 6.130477194832587e-05,
2333
+ 6.0711573952016877e-05,
2334
+ 6.011837595570788e-05,
2335
+ 5.9525177959398896e-05,
2336
+ 5.8931979963089905e-05,
2337
+ 5.833878196678091e-05,
2338
+ 5.774558397047194e-05,
2339
+ 5.715238597416294e-05,
2340
+ 5.6559187977853943e-05,
2341
+ 5.5965989981544967e-05,
2342
+ 5.537279198523596e-05,
2343
+ 5.477959398892697e-05,
2344
+ 5.380674927498023e-05,
2345
+ 5.321355127867123e-05,
2346
+ 5.2620353282362255e-05,
2347
+ 5.202715528605326e-05,
2348
+ 5.143395728974426e-05,
2349
+ 5.084075929343529e-05,
2350
+ 5.024756129712629e-05,
2351
+ 4.9654363300817296e-05,
2352
+ 4.9061165304508305e-05,
2353
+ 4.846796730819932e-05,
2354
+ 4.787476931189032e-05,
2355
+ 4.7281571315581334e-05,
2356
+ 4.668837331927235e-05,
2357
+ 4.609517532296336e-05,
2358
+ 4.550197732665436e-05,
2359
+ 4.452913261270761e-05,
2360
+ 4.393593461639862e-05,
2361
+ 4.334273662008965e-05,
2362
+ 4.2749538623780655e-05,
2363
+ 4.215634062747166e-05,
2364
+ 4.156314263116268e-05,
2365
+ 4.0969944634853683e-05,
2366
+ 4.0376746638544686e-05,
2367
+ 3.978354864223571e-05,
2368
+ 3.919035064592671e-05,
2369
+ 3.8597152649617715e-05,
2370
+ 3.800395465330872e-05,
2371
+ 3.741075665699975e-05,
2372
+ 3.681755866069075e-05,
2373
+ 3.622436066438175e-05,
2374
+ 3.525151595043501e-05,
2375
+ 3.465831795412603e-05,
2376
+ 3.4065119957817036e-05,
2377
+ 3.347192196150804e-05,
2378
+ 3.287872396519904e-05,
2379
+ 3.2285525968890064e-05,
2380
+ 3.169232797258107e-05,
2381
+ 3.109912997627207e-05,
2382
+ 3.05059319799631e-05,
2383
+ 2.9912733983654103e-05,
2384
+ 2.9319535987345105e-05,
2385
+ 2.8726337991036132e-05,
2386
+ 2.8133139994727138e-05,
2387
+ 2.753994199841814e-05,
2388
+ 2.6946744002109144e-05,
2389
+ 2.5973899288162397e-05,
2390
+ 2.538070129185342e-05,
2391
+ 2.4787503295544423e-05,
2392
+ 2.419430529923543e-05,
2393
+ 2.3601107302926452e-05,
2394
+ 2.3007909306617458e-05,
2395
+ 2.241471131030846e-05,
2396
+ 2.1821513313999464e-05,
2397
+ 2.122831531769049e-05,
2398
+ 2.0635117321381496e-05,
2399
+ 2.00419193250725e-05,
2400
+ 1.944872132876352e-05,
2401
+ 1.8855523332454525e-05,
2402
+ 1.8262325336145528e-05,
2403
+ 1.766912733983655e-05,
2404
+ 1.6696282625889808e-05,
2405
+ 1.610308462958081e-05,
2406
+ 1.5509886633271817e-05,
2407
+ 1.491668863696282e-05,
2408
+ 1.4323490640653843e-05,
2409
+ 1.3730292644344847e-05,
2410
+ 1.3137094648035852e-05,
2411
+ 1.2543896651726875e-05,
2412
+ 1.1950698655417879e-05,
2413
+ 1.1357500659108882e-05,
2414
+ 1.0764302662799886e-05,
2415
+ 1.017110466649091e-05,
2416
+ 9.577906670181914e-06,
2417
+ 8.984708673872917e-06,
2418
+ 8.391510677563942e-06
2419
+ ],
2420
+ "emb_lr": [],
2421
+ "eval_step": [
2422
+ 750,
2423
+ 1532,
2424
+ 2314,
2425
+ 3096,
2426
+ 3878,
2427
+ 4660,
2428
+ 5442,
2429
+ 6224,
2430
+ 7006,
2431
+ 7788,
2432
+ 8570,
2433
+ 9352,
2434
+ 10134,
2435
+ 10916,
2436
+ 11698,
2437
+ 12480,
2438
+ 13262,
2439
+ 14044,
2440
+ 14826,
2441
+ 15608
2442
+ ],
2443
+ "eval_accuracy": [
2444
+ 0.0,
2445
+ 0.01,
2446
+ 0.0,
2447
+ 0.0,
2448
+ 0.0,
2449
+ 0.01,
2450
+ 0.0,
2451
+ 0.0,
2452
+ 0.0,
2453
+ 0.0,
2454
+ 0.0,
2455
+ 0.0,
2456
+ 0.0,
2457
+ 0.0,
2458
+ 0.0,
2459
+ 0.0,
2460
+ 0.0,
2461
+ 0.0,
2462
+ 0.0,
2463
+ 0.0
2464
+ ]
2465
+ },
2466
+ "final_accuracy": 1.0,
2467
+ "sft_eval": {
2468
+ "config": {
2469
+ "ops": "add_sub",
2470
+ "K": null,
2471
+ "mode": "sft",
2472
+ "n_digits": 6,
2473
+ "n_per_split": 100
2474
+ },
2475
+ "splits": {
2476
+ "add_S0": {
2477
+ "full_accuracy": 1.0,
2478
+ "n_examples": 100,
2479
+ "per_subtask": {
2480
+ "SA": {
2481
+ "accuracy": 1.0,
2482
+ "count": 605
2483
+ },
2484
+ "SS": {
2485
+ "accuracy": 1.0,
2486
+ "count": 95
2487
+ }
2488
+ }
2489
+ },
2490
+ "add_S1": {
2491
+ "full_accuracy": 1.0,
2492
+ "n_examples": 100,
2493
+ "per_subtask": {
2494
+ "SA": {
2495
+ "accuracy": 1.0,
2496
+ "count": 204
2497
+ },
2498
+ "SC": {
2499
+ "accuracy": 1.0,
2500
+ "count": 169
2501
+ },
2502
+ "SS": {
2503
+ "accuracy": 1.0,
2504
+ "count": 31
2505
+ },
2506
+ "UC": {
2507
+ "accuracy": 1.0,
2508
+ "count": 296
2509
+ }
2510
+ }
2511
+ },
2512
+ "add_S2": {
2513
+ "full_accuracy": 1.0,
2514
+ "n_examples": 100,
2515
+ "per_subtask": {
2516
+ "SA": {
2517
+ "accuracy": 1.0,
2518
+ "count": 163
2519
+ },
2520
+ "SC": {
2521
+ "accuracy": 1.0,
2522
+ "count": 130
2523
+ },
2524
+ "SS": {
2525
+ "accuracy": 1.0,
2526
+ "count": 87
2527
+ },
2528
+ "UC": {
2529
+ "accuracy": 1.0,
2530
+ "count": 203
2531
+ },
2532
+ "US": {
2533
+ "accuracy": 1.0,
2534
+ "count": 117
2535
+ }
2536
+ }
2537
+ },
2538
+ "add_S3": {
2539
+ "full_accuracy": 0.88,
2540
+ "n_examples": 100,
2541
+ "per_subtask": {
2542
+ "SA": {
2543
+ "accuracy": 1.0,
2544
+ "count": 121
2545
+ },
2546
+ "SC": {
2547
+ "accuracy": 1.0,
2548
+ "count": 121
2549
+ },
2550
+ "SS": {
2551
+ "accuracy": 1.0,
2552
+ "count": 49
2553
+ },
2554
+ "UC": {
2555
+ "accuracy": 0.9354838709677419,
2556
+ "count": 186
2557
+ },
2558
+ "US": {
2559
+ "accuracy": 1.0,
2560
+ "count": 223
2561
+ }
2562
+ }
2563
+ },
2564
+ "add_S4": {
2565
+ "full_accuracy": 0.81,
2566
+ "n_examples": 100,
2567
+ "per_subtask": {
2568
+ "SA": {
2569
+ "accuracy": 1.0,
2570
+ "count": 104
2571
+ },
2572
+ "SC": {
2573
+ "accuracy": 1.0,
2574
+ "count": 106
2575
+ },
2576
+ "SS": {
2577
+ "accuracy": 1.0,
2578
+ "count": 23
2579
+ },
2580
+ "UC": {
2581
+ "accuracy": 0.90625,
2582
+ "count": 160
2583
+ },
2584
+ "US": {
2585
+ "accuracy": 0.9446254071661238,
2586
+ "count": 307
2587
+ }
2588
+ }
2589
+ },
2590
+ "add_S5": {
2591
+ "full_accuracy": 0.64,
2592
+ "n_examples": 100,
2593
+ "per_subtask": {
2594
+ "SA": {
2595
+ "accuracy": 1.0,
2596
+ "count": 100
2597
+ },
2598
+ "SC": {
2599
+ "accuracy": 1.0,
2600
+ "count": 100
2601
+ },
2602
+ "UC": {
2603
+ "accuracy": 0.75,
2604
+ "count": 100
2605
+ },
2606
+ "US": {
2607
+ "accuracy": 0.8275,
2608
+ "count": 400
2609
+ }
2610
+ }
2611
+ },
2612
+ "add_S6": {
2613
+ "full_accuracy": 0.87,
2614
+ "n_examples": 100,
2615
+ "per_subtask": {
2616
+ "SC": {
2617
+ "accuracy": 1.0,
2618
+ "count": 100
2619
+ },
2620
+ "UC": {
2621
+ "accuracy": 0.88,
2622
+ "count": 100
2623
+ },
2624
+ "US": {
2625
+ "accuracy": 0.946,
2626
+ "count": 500
2627
+ }
2628
+ }
2629
+ },
2630
+ "add_random": {
2631
+ "full_accuracy": 0.99,
2632
+ "n_examples": 200,
2633
+ "per_subtask": {
2634
+ "SA": {
2635
+ "accuracy": 1.0,
2636
+ "count": 447
2637
+ },
2638
+ "SC": {
2639
+ "accuracy": 0.996875,
2640
+ "count": 320
2641
+ },
2642
+ "SS": {
2643
+ "accuracy": 1.0,
2644
+ "count": 56
2645
+ },
2646
+ "UC": {
2647
+ "accuracy": 0.998109640831758,
2648
+ "count": 529
2649
+ },
2650
+ "US": {
2651
+ "accuracy": 0.9791666666666666,
2652
+ "count": 48
2653
+ }
2654
+ }
2655
+ },
2656
+ "add_C3": {
2657
+ "full_accuracy": 0.88,
2658
+ "n_examples": 100,
2659
+ "per_subtask": {
2660
+ "SA": {
2661
+ "accuracy": 1.0,
2662
+ "count": 300
2663
+ },
2664
+ "SC": {
2665
+ "accuracy": 1.0,
2666
+ "count": 100
2667
+ },
2668
+ "UC": {
2669
+ "accuracy": 0.9378238341968912,
2670
+ "count": 193
2671
+ },
2672
+ "US": {
2673
+ "accuracy": 1.0,
2674
+ "count": 107
2675
+ }
2676
+ }
2677
+ },
2678
+ "add_C4": {
2679
+ "full_accuracy": 0.89,
2680
+ "n_examples": 100,
2681
+ "per_subtask": {
2682
+ "SA": {
2683
+ "accuracy": 1.0,
2684
+ "count": 200
2685
+ },
2686
+ "SC": {
2687
+ "accuracy": 1.0,
2688
+ "count": 100
2689
+ },
2690
+ "UC": {
2691
+ "accuracy": 0.95703125,
2692
+ "count": 256
2693
+ },
2694
+ "US": {
2695
+ "accuracy": 0.9513888888888888,
2696
+ "count": 144
2697
+ }
2698
+ }
2699
+ },
2700
+ "add_C5": {
2701
+ "full_accuracy": 0.86,
2702
+ "n_examples": 100,
2703
+ "per_subtask": {
2704
+ "SA": {
2705
+ "accuracy": 1.0,
2706
+ "count": 100
2707
+ },
2708
+ "SC": {
2709
+ "accuracy": 1.0,
2710
+ "count": 100
2711
+ },
2712
+ "UC": {
2713
+ "accuracy": 0.954248366013072,
2714
+ "count": 306
2715
+ },
2716
+ "US": {
2717
+ "accuracy": 0.9329896907216495,
2718
+ "count": 194
2719
+ }
2720
+ }
2721
+ },
2722
+ "add_C6": {
2723
+ "full_accuracy": 0.94,
2724
+ "n_examples": 100,
2725
+ "per_subtask": {
2726
+ "SC": {
2727
+ "accuracy": 1.0,
2728
+ "count": 100
2729
+ },
2730
+ "UC": {
2731
+ "accuracy": 0.9836065573770492,
2732
+ "count": 366
2733
+ },
2734
+ "US": {
2735
+ "accuracy": 0.9957264957264957,
2736
+ "count": 234
2737
+ }
2738
+ }
2739
+ },
2740
+ "sub_M0": {
2741
+ "full_accuracy": 1.0,
2742
+ "n_examples": 100,
2743
+ "per_subtask": {
2744
+ "MD": {
2745
+ "accuracy": 1.0,
2746
+ "count": 601
2747
+ },
2748
+ "ME": {
2749
+ "accuracy": 1.0,
2750
+ "count": 99
2751
+ }
2752
+ }
2753
+ },
2754
+ "sub_M1": {
2755
+ "full_accuracy": 1.0,
2756
+ "n_examples": 100,
2757
+ "per_subtask": {
2758
+ "MD": {
2759
+ "accuracy": 1.0,
2760
+ "count": 279
2761
+ },
2762
+ "MB": {
2763
+ "accuracy": 1.0,
2764
+ "count": 145
2765
+ },
2766
+ "ME": {
2767
+ "accuracy": 1.0,
2768
+ "count": 24
2769
+ },
2770
+ "UB": {
2771
+ "accuracy": 1.0,
2772
+ "count": 252
2773
+ }
2774
+ }
2775
+ },
2776
+ "sub_M2": {
2777
+ "full_accuracy": 1.0,
2778
+ "n_examples": 100,
2779
+ "per_subtask": {
2780
+ "MD": {
2781
+ "accuracy": 1.0,
2782
+ "count": 213
2783
+ },
2784
+ "MB": {
2785
+ "accuracy": 1.0,
2786
+ "count": 113
2787
+ },
2788
+ "ME": {
2789
+ "accuracy": 1.0,
2790
+ "count": 85
2791
+ },
2792
+ "UB": {
2793
+ "accuracy": 1.0,
2794
+ "count": 181
2795
+ },
2796
+ "UD": {
2797
+ "accuracy": 1.0,
2798
+ "count": 108
2799
+ }
2800
+ }
2801
+ },
2802
+ "sub_M3": {
2803
+ "full_accuracy": 0.6,
2804
+ "n_examples": 100,
2805
+ "per_subtask": {
2806
+ "MD": {
2807
+ "accuracy": 1.0,
2808
+ "count": 179
2809
+ },
2810
+ "MB": {
2811
+ "accuracy": 1.0,
2812
+ "count": 103
2813
+ },
2814
+ "ME": {
2815
+ "accuracy": 1.0,
2816
+ "count": 56
2817
+ },
2818
+ "UB": {
2819
+ "accuracy": 0.7315436241610739,
2820
+ "count": 149
2821
+ },
2822
+ "UD": {
2823
+ "accuracy": 1.0,
2824
+ "count": 213
2825
+ }
2826
+ }
2827
+ },
2828
+ "sub_M4": {
2829
+ "full_accuracy": 0.2,
2830
+ "n_examples": 100,
2831
+ "per_subtask": {
2832
+ "MD": {
2833
+ "accuracy": 1.0,
2834
+ "count": 200
2835
+ },
2836
+ "MB": {
2837
+ "accuracy": 1.0,
2838
+ "count": 100
2839
+ },
2840
+ "UB": {
2841
+ "accuracy": 0.36,
2842
+ "count": 100
2843
+ },
2844
+ "UD": {
2845
+ "accuracy": 0.7633333333333333,
2846
+ "count": 300
2847
+ }
2848
+ }
2849
+ },
2850
+ "sub_M5": {
2851
+ "full_accuracy": 0.09,
2852
+ "n_examples": 100,
2853
+ "per_subtask": {
2854
+ "MD": {
2855
+ "accuracy": 1.0,
2856
+ "count": 100
2857
+ },
2858
+ "MB": {
2859
+ "accuracy": 1.0,
2860
+ "count": 100
2861
+ },
2862
+ "UB": {
2863
+ "accuracy": 0.31,
2864
+ "count": 100
2865
+ },
2866
+ "UD": {
2867
+ "accuracy": 0.5875,
2868
+ "count": 400
2869
+ }
2870
+ }
2871
+ },
2872
+ "sub_random": {
2873
+ "full_accuracy": 0.995,
2874
+ "n_examples": 200,
2875
+ "per_subtask": {
2876
+ "MD": {
2877
+ "accuracy": 1.0,
2878
+ "count": 600
2879
+ },
2880
+ "MB": {
2881
+ "accuracy": 1.0,
2882
+ "count": 267
2883
+ },
2884
+ "ME": {
2885
+ "accuracy": 1.0,
2886
+ "count": 53
2887
+ },
2888
+ "UB": {
2889
+ "accuracy": 0.9977220956719818,
2890
+ "count": 439
2891
+ },
2892
+ "UD": {
2893
+ "accuracy": 1.0,
2894
+ "count": 41
2895
+ }
2896
+ }
2897
+ },
2898
+ "sub_B3": {
2899
+ "full_accuracy": 0.81,
2900
+ "n_examples": 100,
2901
+ "per_subtask": {
2902
+ "MD": {
2903
+ "accuracy": 1.0,
2904
+ "count": 300
2905
+ },
2906
+ "MB": {
2907
+ "accuracy": 1.0,
2908
+ "count": 100
2909
+ },
2910
+ "UB": {
2911
+ "accuracy": 0.9035532994923858,
2912
+ "count": 197
2913
+ },
2914
+ "UD": {
2915
+ "accuracy": 1.0,
2916
+ "count": 103
2917
+ }
2918
+ }
2919
+ },
2920
+ "sub_B4": {
2921
+ "full_accuracy": 0.79,
2922
+ "n_examples": 100,
2923
+ "per_subtask": {
2924
+ "MD": {
2925
+ "accuracy": 1.0,
2926
+ "count": 200
2927
+ },
2928
+ "MB": {
2929
+ "accuracy": 1.0,
2930
+ "count": 100
2931
+ },
2932
+ "UB": {
2933
+ "accuracy": 0.9190283400809717,
2934
+ "count": 247
2935
+ },
2936
+ "UD": {
2937
+ "accuracy": 0.9477124183006536,
2938
+ "count": 153
2939
+ }
2940
+ }
2941
+ },
2942
+ "sub_B5": {
2943
+ "full_accuracy": 0.73,
2944
+ "n_examples": 100,
2945
+ "per_subtask": {
2946
+ "MD": {
2947
+ "accuracy": 1.0,
2948
+ "count": 100
2949
+ },
2950
+ "MB": {
2951
+ "accuracy": 1.0,
2952
+ "count": 100
2953
+ },
2954
+ "UB": {
2955
+ "accuracy": 0.9161073825503355,
2956
+ "count": 298
2957
+ },
2958
+ "UD": {
2959
+ "accuracy": 0.9306930693069307,
2960
+ "count": 202
2961
+ }
2962
+ }
2963
+ }
2964
+ },
2965
+ "summary": {
2966
+ "overall_accuracy": 0.8316666666666667,
2967
+ "total_examples": 2400,
2968
+ "n_splits": 22
2969
+ }
2970
+ },
2971
+ "sorl_eval": {
2972
+ "config": {
2973
+ "ops": "add_sub",
2974
+ "K": 3,
2975
+ "mode": "sorl",
2976
+ "n_digits": 6,
2977
+ "n_per_split": 100
2978
+ },
2979
+ "splits": {
2980
+ "add_S0": {
2981
+ "full_accuracy": 1.0,
2982
+ "n_examples": 100,
2983
+ "per_subtask": {
2984
+ "SA": {
2985
+ "accuracy": 1.0,
2986
+ "count": 605
2987
+ },
2988
+ "SS": {
2989
+ "accuracy": 1.0,
2990
+ "count": 95
2991
+ }
2992
+ }
2993
+ },
2994
+ "add_S1": {
2995
+ "full_accuracy": 1.0,
2996
+ "n_examples": 100,
2997
+ "per_subtask": {
2998
+ "SA": {
2999
+ "accuracy": 1.0,
3000
+ "count": 204
3001
+ },
3002
+ "SC": {
3003
+ "accuracy": 1.0,
3004
+ "count": 169
3005
+ },
3006
+ "SS": {
3007
+ "accuracy": 1.0,
3008
+ "count": 31
3009
+ },
3010
+ "UC": {
3011
+ "accuracy": 1.0,
3012
+ "count": 296
3013
+ }
3014
+ }
3015
+ },
3016
+ "add_S2": {
3017
+ "full_accuracy": 1.0,
3018
+ "n_examples": 100,
3019
+ "per_subtask": {
3020
+ "SA": {
3021
+ "accuracy": 1.0,
3022
+ "count": 163
3023
+ },
3024
+ "SC": {
3025
+ "accuracy": 1.0,
3026
+ "count": 130
3027
+ },
3028
+ "SS": {
3029
+ "accuracy": 1.0,
3030
+ "count": 87
3031
+ },
3032
+ "UC": {
3033
+ "accuracy": 1.0,
3034
+ "count": 203
3035
+ },
3036
+ "US": {
3037
+ "accuracy": 1.0,
3038
+ "count": 117
3039
+ }
3040
+ }
3041
+ },
3042
+ "add_S3": {
3043
+ "full_accuracy": 1.0,
3044
+ "n_examples": 100,
3045
+ "per_subtask": {
3046
+ "SA": {
3047
+ "accuracy": 1.0,
3048
+ "count": 121
3049
+ },
3050
+ "SC": {
3051
+ "accuracy": 1.0,
3052
+ "count": 121
3053
+ },
3054
+ "SS": {
3055
+ "accuracy": 1.0,
3056
+ "count": 49
3057
+ },
3058
+ "UC": {
3059
+ "accuracy": 1.0,
3060
+ "count": 186
3061
+ },
3062
+ "US": {
3063
+ "accuracy": 1.0,
3064
+ "count": 223
3065
+ }
3066
+ }
3067
+ },
3068
+ "add_S4": {
3069
+ "full_accuracy": 1.0,
3070
+ "n_examples": 100,
3071
+ "per_subtask": {
3072
+ "SA": {
3073
+ "accuracy": 1.0,
3074
+ "count": 104
3075
+ },
3076
+ "SC": {
3077
+ "accuracy": 1.0,
3078
+ "count": 106
3079
+ },
3080
+ "SS": {
3081
+ "accuracy": 1.0,
3082
+ "count": 23
3083
+ },
3084
+ "UC": {
3085
+ "accuracy": 1.0,
3086
+ "count": 160
3087
+ },
3088
+ "US": {
3089
+ "accuracy": 1.0,
3090
+ "count": 307
3091
+ }
3092
+ }
3093
+ },
3094
+ "add_S5": {
3095
+ "full_accuracy": 1.0,
3096
+ "n_examples": 100,
3097
+ "per_subtask": {
3098
+ "SA": {
3099
+ "accuracy": 1.0,
3100
+ "count": 100
3101
+ },
3102
+ "SC": {
3103
+ "accuracy": 1.0,
3104
+ "count": 100
3105
+ },
3106
+ "UC": {
3107
+ "accuracy": 1.0,
3108
+ "count": 100
3109
+ },
3110
+ "US": {
3111
+ "accuracy": 1.0,
3112
+ "count": 400
3113
+ }
3114
+ }
3115
+ },
3116
+ "add_S6": {
3117
+ "full_accuracy": 1.0,
3118
+ "n_examples": 100,
3119
+ "per_subtask": {
3120
+ "SC": {
3121
+ "accuracy": 1.0,
3122
+ "count": 100
3123
+ },
3124
+ "UC": {
3125
+ "accuracy": 1.0,
3126
+ "count": 100
3127
+ },
3128
+ "US": {
3129
+ "accuracy": 1.0,
3130
+ "count": 500
3131
+ }
3132
+ }
3133
+ },
3134
+ "add_random": {
3135
+ "full_accuracy": 1.0,
3136
+ "n_examples": 200,
3137
+ "per_subtask": {
3138
+ "SA": {
3139
+ "accuracy": 1.0,
3140
+ "count": 447
3141
+ },
3142
+ "SC": {
3143
+ "accuracy": 1.0,
3144
+ "count": 320
3145
+ },
3146
+ "SS": {
3147
+ "accuracy": 1.0,
3148
+ "count": 56
3149
+ },
3150
+ "UC": {
3151
+ "accuracy": 1.0,
3152
+ "count": 529
3153
+ },
3154
+ "US": {
3155
+ "accuracy": 1.0,
3156
+ "count": 48
3157
+ }
3158
+ }
3159
+ },
3160
+ "add_C3": {
3161
+ "full_accuracy": 1.0,
3162
+ "n_examples": 100,
3163
+ "per_subtask": {
3164
+ "SA": {
3165
+ "accuracy": 1.0,
3166
+ "count": 300
3167
+ },
3168
+ "SC": {
3169
+ "accuracy": 1.0,
3170
+ "count": 100
3171
+ },
3172
+ "UC": {
3173
+ "accuracy": 1.0,
3174
+ "count": 193
3175
+ },
3176
+ "US": {
3177
+ "accuracy": 1.0,
3178
+ "count": 107
3179
+ }
3180
+ }
3181
+ },
3182
+ "add_C4": {
3183
+ "full_accuracy": 1.0,
3184
+ "n_examples": 100,
3185
+ "per_subtask": {
3186
+ "SA": {
3187
+ "accuracy": 1.0,
3188
+ "count": 200
3189
+ },
3190
+ "SC": {
3191
+ "accuracy": 1.0,
3192
+ "count": 100
3193
+ },
3194
+ "UC": {
3195
+ "accuracy": 1.0,
3196
+ "count": 256
3197
+ },
3198
+ "US": {
3199
+ "accuracy": 1.0,
3200
+ "count": 144
3201
+ }
3202
+ }
3203
+ },
3204
+ "add_C5": {
3205
+ "full_accuracy": 1.0,
3206
+ "n_examples": 100,
3207
+ "per_subtask": {
3208
+ "SA": {
3209
+ "accuracy": 1.0,
3210
+ "count": 100
3211
+ },
3212
+ "SC": {
3213
+ "accuracy": 1.0,
3214
+ "count": 100
3215
+ },
3216
+ "UC": {
3217
+ "accuracy": 1.0,
3218
+ "count": 306
3219
+ },
3220
+ "US": {
3221
+ "accuracy": 1.0,
3222
+ "count": 194
3223
+ }
3224
+ }
3225
+ },
3226
+ "add_C6": {
3227
+ "full_accuracy": 1.0,
3228
+ "n_examples": 100,
3229
+ "per_subtask": {
3230
+ "SC": {
3231
+ "accuracy": 1.0,
3232
+ "count": 100
3233
+ },
3234
+ "UC": {
3235
+ "accuracy": 1.0,
3236
+ "count": 366
3237
+ },
3238
+ "US": {
3239
+ "accuracy": 1.0,
3240
+ "count": 234
3241
+ }
3242
+ }
3243
+ },
3244
+ "sub_M0": {
3245
+ "full_accuracy": 1.0,
3246
+ "n_examples": 100,
3247
+ "per_subtask": {
3248
+ "MD": {
3249
+ "accuracy": 1.0,
3250
+ "count": 601
3251
+ },
3252
+ "ME": {
3253
+ "accuracy": 1.0,
3254
+ "count": 99
3255
+ }
3256
+ }
3257
+ },
3258
+ "sub_M1": {
3259
+ "full_accuracy": 1.0,
3260
+ "n_examples": 100,
3261
+ "per_subtask": {
3262
+ "MD": {
3263
+ "accuracy": 1.0,
3264
+ "count": 279
3265
+ },
3266
+ "MB": {
3267
+ "accuracy": 1.0,
3268
+ "count": 145
3269
+ },
3270
+ "ME": {
3271
+ "accuracy": 1.0,
3272
+ "count": 24
3273
+ },
3274
+ "UB": {
3275
+ "accuracy": 1.0,
3276
+ "count": 252
3277
+ }
3278
+ }
3279
+ },
3280
+ "sub_M2": {
3281
+ "full_accuracy": 1.0,
3282
+ "n_examples": 100,
3283
+ "per_subtask": {
3284
+ "MD": {
3285
+ "accuracy": 1.0,
3286
+ "count": 213
3287
+ },
3288
+ "MB": {
3289
+ "accuracy": 1.0,
3290
+ "count": 113
3291
+ },
3292
+ "ME": {
3293
+ "accuracy": 1.0,
3294
+ "count": 85
3295
+ },
3296
+ "UB": {
3297
+ "accuracy": 1.0,
3298
+ "count": 181
3299
+ },
3300
+ "UD": {
3301
+ "accuracy": 1.0,
3302
+ "count": 108
3303
+ }
3304
+ }
3305
+ },
3306
+ "sub_M3": {
3307
+ "full_accuracy": 1.0,
3308
+ "n_examples": 100,
3309
+ "per_subtask": {
3310
+ "MD": {
3311
+ "accuracy": 1.0,
3312
+ "count": 179
3313
+ },
3314
+ "MB": {
3315
+ "accuracy": 1.0,
3316
+ "count": 103
3317
+ },
3318
+ "ME": {
3319
+ "accuracy": 1.0,
3320
+ "count": 56
3321
+ },
3322
+ "UB": {
3323
+ "accuracy": 1.0,
3324
+ "count": 149
3325
+ },
3326
+ "UD": {
3327
+ "accuracy": 1.0,
3328
+ "count": 213
3329
+ }
3330
+ }
3331
+ },
3332
+ "sub_M4": {
3333
+ "full_accuracy": 1.0,
3334
+ "n_examples": 100,
3335
+ "per_subtask": {
3336
+ "MD": {
3337
+ "accuracy": 1.0,
3338
+ "count": 200
3339
+ },
3340
+ "MB": {
3341
+ "accuracy": 1.0,
3342
+ "count": 100
3343
+ },
3344
+ "UB": {
3345
+ "accuracy": 1.0,
3346
+ "count": 100
3347
+ },
3348
+ "UD": {
3349
+ "accuracy": 1.0,
3350
+ "count": 300
3351
+ }
3352
+ }
3353
+ },
3354
+ "sub_M5": {
3355
+ "full_accuracy": 1.0,
3356
+ "n_examples": 100,
3357
+ "per_subtask": {
3358
+ "MD": {
3359
+ "accuracy": 1.0,
3360
+ "count": 100
3361
+ },
3362
+ "MB": {
3363
+ "accuracy": 1.0,
3364
+ "count": 100
3365
+ },
3366
+ "UB": {
3367
+ "accuracy": 1.0,
3368
+ "count": 100
3369
+ },
3370
+ "UD": {
3371
+ "accuracy": 1.0,
3372
+ "count": 400
3373
+ }
3374
+ }
3375
+ },
3376
+ "sub_random": {
3377
+ "full_accuracy": 1.0,
3378
+ "n_examples": 200,
3379
+ "per_subtask": {
3380
+ "MD": {
3381
+ "accuracy": 1.0,
3382
+ "count": 600
3383
+ },
3384
+ "MB": {
3385
+ "accuracy": 1.0,
3386
+ "count": 267
3387
+ },
3388
+ "ME": {
3389
+ "accuracy": 1.0,
3390
+ "count": 53
3391
+ },
3392
+ "UB": {
3393
+ "accuracy": 1.0,
3394
+ "count": 439
3395
+ },
3396
+ "UD": {
3397
+ "accuracy": 1.0,
3398
+ "count": 41
3399
+ }
3400
+ }
3401
+ },
3402
+ "sub_B3": {
3403
+ "full_accuracy": 1.0,
3404
+ "n_examples": 100,
3405
+ "per_subtask": {
3406
+ "MD": {
3407
+ "accuracy": 1.0,
3408
+ "count": 300
3409
+ },
3410
+ "MB": {
3411
+ "accuracy": 1.0,
3412
+ "count": 100
3413
+ },
3414
+ "UB": {
3415
+ "accuracy": 1.0,
3416
+ "count": 197
3417
+ },
3418
+ "UD": {
3419
+ "accuracy": 1.0,
3420
+ "count": 103
3421
+ }
3422
+ }
3423
+ },
3424
+ "sub_B4": {
3425
+ "full_accuracy": 1.0,
3426
+ "n_examples": 100,
3427
+ "per_subtask": {
3428
+ "MD": {
3429
+ "accuracy": 1.0,
3430
+ "count": 200
3431
+ },
3432
+ "MB": {
3433
+ "accuracy": 1.0,
3434
+ "count": 100
3435
+ },
3436
+ "UB": {
3437
+ "accuracy": 1.0,
3438
+ "count": 247
3439
+ },
3440
+ "UD": {
3441
+ "accuracy": 1.0,
3442
+ "count": 153
3443
+ }
3444
+ }
3445
+ },
3446
+ "sub_B5": {
3447
+ "full_accuracy": 1.0,
3448
+ "n_examples": 100,
3449
+ "per_subtask": {
3450
+ "MD": {
3451
+ "accuracy": 1.0,
3452
+ "count": 100
3453
+ },
3454
+ "MB": {
3455
+ "accuracy": 1.0,
3456
+ "count": 100
3457
+ },
3458
+ "UB": {
3459
+ "accuracy": 1.0,
3460
+ "count": 298
3461
+ },
3462
+ "UD": {
3463
+ "accuracy": 1.0,
3464
+ "count": 202
3465
+ }
3466
+ }
3467
+ }
3468
+ },
3469
+ "summary": {
3470
+ "overall_accuracy": 1.0,
3471
+ "total_examples": 2400,
3472
+ "n_splits": 22
3473
+ }
3474
+ },
3475
+ "sorl_overall_accuracy": 1.0,
3476
+ "sft_overall_accuracy": 0.8316666666666667
3477
+ }
add_sub_sorl_v1_abs30_K3_50K/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:71138eb1b211df34431f196a198b3c938bef41da28e9d5b41eae4d9a62a276d3
3
+ size 650385300
add_sub_sorl_v1_abs30_K3_50K/train_config.json ADDED
@@ -0,0 +1,84 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "num_rollouts": 4,
3
+ "K": 3,
4
+ "max_iterations": 2,
5
+ "memory_span_abs": 1792,
6
+ "memory_span_traj": 1792,
7
+ "temperature": 1.0,
8
+ "ar_search": false,
9
+ "response_only_abs": false,
10
+ "alpha_info_gain": 10.0,
11
+ "alpha_abs": 0.1,
12
+ "alpha_soft_zipf": 1.0,
13
+ "alpha_ortho": 0.0,
14
+ "alpha_anchor": 0.0,
15
+ "alpha_jacobi": 0.0,
16
+ "decay": 0.8,
17
+ "target_vocab_util": 0.8,
18
+ "min_abs_ppl": 0.0,
19
+ "zipf_alpha": 1.0,
20
+ "lr": 8e-05,
21
+ "emb_lr_mult": 1.0,
22
+ "weight_decay": 0.01,
23
+ "warmup_steps": 468,
24
+ "cooldown_frac": 0.4,
25
+ "max_grad_norm": 1.0,
26
+ "vq_abs_pretrain_steps": 0,
27
+ "vq_abs_pretrain_lr": 0.001,
28
+ "vq_abs_pretrain_layer": -1,
29
+ "vq_abs_pretrain_batch_size": 256,
30
+ "vq_abs_pretrain_target_vectors": 20000,
31
+ "batch_size": 64,
32
+ "gradient_accumulation_steps": 1,
33
+ "num_epochs": 20,
34
+ "emb_warmup_steps": 0,
35
+ "log_every": 50,
36
+ "eval_every": 781,
37
+ "save_every": 999999,
38
+ "eval_samples": 100,
39
+ "output_dir": "ckpt/sweep/as_sorl_abs30_K3_50K",
40
+ "eval_K": 4,
41
+ "alpha_traj": 0.0,
42
+ "corrupt_method": "shuffle",
43
+ "corrupt_ratio": 0.3,
44
+ "alpha_contrastive": 1.0,
45
+ "gamma_contrastive": 0.5,
46
+ "alpha_masked_traj": 0.0,
47
+ "mask_nl_ratio": 0.3,
48
+ "mask_nl_mode": "fixed",
49
+ "mask_nl_fixed_id": 0,
50
+ "use_ste": true,
51
+ "n_inner": 1,
52
+ "random_K": null,
53
+ "strip_suffix": null,
54
+ "compress_prefix": null,
55
+ "random_mem_span": null,
56
+ "warmup_ratio": 0.03,
57
+ "beta2": 0.999,
58
+ "seed": 42,
59
+ "n_digits": 6,
60
+ "n_layer": 2,
61
+ "n_head": 3,
62
+ "n_embd": 510,
63
+ "ops": "add_sub",
64
+ "abs_vocab": 30,
65
+ "dataset_size": 50000,
66
+ "mode": "sorl",
67
+ "device": "cuda",
68
+ "push_to_hub": true,
69
+ "no_wandb": false,
70
+ "n_params": 162519662,
71
+ "run_name": "add_sub_sorl_v1_abs30_K3_50K",
72
+ "git_commit": "dc8dd776fb0c30a4c9073052dcc5e943e0fd80c6",
73
+ "timestamp": "2026-04-13T04:59:45.995142+00:00",
74
+ "tokenizer": "Qwen/Qwen3-0.6B",
75
+ "dataset_repo": "thoughtworks/arithmetic-sorl-data",
76
+ "dataset_config": "add_sub_6digit",
77
+ "model_repo": "thoughtworks/arithmetic-sorl",
78
+ "trainer_version": "v1",
79
+ "wandb_run_id": "gx9albkf",
80
+ "wandb_url": "https://wandb.ai/nlp_and_interpretability/sorl-arithmetic/runs/gx9albkf",
81
+ "final_accuracy": 1.0,
82
+ "sft_accuracy": 0.8316666666666667,
83
+ "eval_method": "ArithmeticEvaluator"
84
+ }