Antonio Linde commited on
Commit
85a2b9e
·
1 Parent(s): 4cb2807

Test trainer

Browse files
test_trainer/checkpoint-1-epoch-1/config.json ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "IIC/roberta-base-spanish-squades",
3
+ "architectures": [
4
+ "RobertaForQuestionAnswering"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.0,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "gradient_checkpointing": false,
11
+ "hidden_act": "gelu",
12
+ "hidden_dropout_prob": 0.0,
13
+ "hidden_size": 768,
14
+ "initializer_range": 0.02,
15
+ "intermediate_size": 3072,
16
+ "layer_norm_eps": 1e-05,
17
+ "max_position_embeddings": 514,
18
+ "model_type": "roberta",
19
+ "num_attention_heads": 12,
20
+ "num_hidden_layers": 12,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "torch_dtype": "float32",
24
+ "transformers_version": "4.25.1",
25
+ "type_vocab_size": 1,
26
+ "use_cache": true,
27
+ "vocab_size": 50262
28
+ }
test_trainer/checkpoint-1-epoch-1/eval_results.txt ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ correct = 0
2
+ eval_loss = -2.8828125
3
+ incorrect = 2
4
+ similar = 1
test_trainer/checkpoint-1-epoch-1/merges.txt ADDED
The diff for this file is too large to render. See raw diff
 
test_trainer/checkpoint-1-epoch-1/model_args.json ADDED
@@ -0,0 +1 @@
 
 
1
+ {"adafactor_beta1": null, "adafactor_clip_threshold": 1.0, "adafactor_decay_rate": -0.8, "adafactor_eps": [1e-30, 0.001], "adafactor_relative_step": true, "adafactor_scale_parameter": true, "adafactor_warmup_init": true, "adam_betas": [0.9, 0.999], "adam_epsilon": 1e-08, "best_model_dir": "outputs/best_model", "cache_dir": "cache_dir/", "config": {}, "cosine_schedule_num_cycles": 0.5, "custom_layer_parameters": [], "custom_parameter_groups": [], "dataloader_num_workers": 0, "do_lower_case": false, "dynamic_quantize": false, "early_stopping_consider_epochs": false, "early_stopping_delta": 0, "early_stopping_metric": "correct", "early_stopping_metric_minimize": false, "early_stopping_patience": 3, "encoding": null, "eval_batch_size": 8, "evaluate_during_training": true, "evaluate_during_training_silent": true, "evaluate_during_training_steps": 2000, "evaluate_during_training_verbose": false, "evaluate_each_epoch": true, "fp16": true, "gradient_accumulation_steps": 1, "learning_rate": 4e-05, "local_rank": -1, "logging_steps": 50, "loss_type": null, "loss_args": {}, "manual_seed": null, "max_grad_norm": 1.0, "max_seq_length": 128, "model_name": "IIC/roberta-base-spanish-squades", "model_type": "roberta", "multiprocessing_chunksize": -1, "n_gpu": 1, "no_cache": false, "no_save": false, "not_saved_args": [], "num_train_epochs": 1, "optimizer": "AdamW", "output_dir": "test_trainer", "overwrite_output_dir": false, "polynomial_decay_schedule_lr_end": 1e-07, "polynomial_decay_schedule_power": 1.0, "process_count": 1, "quantized_model": false, "reprocess_input_data": true, "save_best_model": true, "save_eval_checkpoints": true, "save_model_every_epoch": true, "save_optimizer_and_scheduler": true, "save_steps": 2000, "scheduler": "linear_schedule_with_warmup", "silent": false, "skip_special_tokens": true, "tensorboard_dir": null, "thread_count": null, "tokenizer_name": null, "tokenizer_type": null, "train_batch_size": 16, "train_custom_parameters_only": false, "use_cached_eval_features": false, "use_early_stopping": false, "use_hf_datasets": false, "use_multiprocessing": true, "use_multiprocessing_for_evaluation": true, "wandb_kwargs": {}, "wandb_project": null, "warmup_ratio": 0.06, "warmup_steps": 1, "weight_decay": 0.0, "model_class": "QuestionAnsweringModel", "doc_stride": 384, "lazy_loading": false, "max_answer_length": 100, "max_query_length": 64, "n_best_size": 20, "null_score_diff_threshold": 0.0, "special_tokens_list": []}
test_trainer/checkpoint-1-epoch-1/optimizer.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:010fe4d5c48a7adb984f85c0b36929b4841198ba266f40c09d9b50fafe8eb6c6
3
+ size 1135
test_trainer/checkpoint-1-epoch-1/pytorch_model.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:685e64506f8922ff7b9ab9d5752655594f6a48fa3ee45ad95a6d54aa416a5f38
3
+ size 496288177
test_trainer/checkpoint-1-epoch-1/scheduler.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:10162595c4baeb90b565d2a04c9372e538422edded3c75c31e6f5377435c5ce3
3
+ size 623
test_trainer/checkpoint-1-epoch-1/special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": true,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": true,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": true,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": true,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": true,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": true,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": true,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
test_trainer/checkpoint-1-epoch-1/tokenizer_config.json ADDED
@@ -0,0 +1,67 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "add_prefix_space": true,
3
+ "bos_token": {
4
+ "__type": "AddedToken",
5
+ "content": "<s>",
6
+ "lstrip": false,
7
+ "normalized": true,
8
+ "rstrip": false,
9
+ "single_word": false
10
+ },
11
+ "cls_token": {
12
+ "__type": "AddedToken",
13
+ "content": "<s>",
14
+ "lstrip": false,
15
+ "normalized": true,
16
+ "rstrip": false,
17
+ "single_word": false
18
+ },
19
+ "do_lower_case": false,
20
+ "eos_token": {
21
+ "__type": "AddedToken",
22
+ "content": "</s>",
23
+ "lstrip": false,
24
+ "normalized": true,
25
+ "rstrip": false,
26
+ "single_word": false
27
+ },
28
+ "errors": "replace",
29
+ "mask_token": {
30
+ "__type": "AddedToken",
31
+ "content": "<mask>",
32
+ "lstrip": true,
33
+ "normalized": true,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "max_len": 512,
38
+ "max_length": 512,
39
+ "model_max_length": 512,
40
+ "name_or_path": "IIC/roberta-base-spanish-squades",
41
+ "pad_token": {
42
+ "__type": "AddedToken",
43
+ "content": "<pad>",
44
+ "lstrip": false,
45
+ "normalized": true,
46
+ "rstrip": false,
47
+ "single_word": false
48
+ },
49
+ "sep_token": {
50
+ "__type": "AddedToken",
51
+ "content": "</s>",
52
+ "lstrip": false,
53
+ "normalized": true,
54
+ "rstrip": false,
55
+ "single_word": false
56
+ },
57
+ "special_tokens_map_file": null,
58
+ "tokenizer_class": "RobertaTokenizer",
59
+ "unk_token": {
60
+ "__type": "AddedToken",
61
+ "content": "<unk>",
62
+ "lstrip": false,
63
+ "normalized": true,
64
+ "rstrip": false,
65
+ "single_word": false
66
+ }
67
+ }
test_trainer/checkpoint-1-epoch-1/training_args.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:26afcbee94636950ba925d8de641f3ee3316bec112bf486b63e8c11aa149440a
3
+ size 3055
test_trainer/checkpoint-1-epoch-1/vocab.json ADDED
The diff for this file is too large to render. See raw diff
 
test_trainer/config.json ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "IIC/roberta-base-spanish-squades",
3
+ "architectures": [
4
+ "RobertaForQuestionAnswering"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.0,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "gradient_checkpointing": false,
11
+ "hidden_act": "gelu",
12
+ "hidden_dropout_prob": 0.0,
13
+ "hidden_size": 768,
14
+ "initializer_range": 0.02,
15
+ "intermediate_size": 3072,
16
+ "layer_norm_eps": 1e-05,
17
+ "max_position_embeddings": 514,
18
+ "model_type": "roberta",
19
+ "num_attention_heads": 12,
20
+ "num_hidden_layers": 12,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "torch_dtype": "float32",
24
+ "transformers_version": "4.25.1",
25
+ "type_vocab_size": 1,
26
+ "use_cache": true,
27
+ "vocab_size": 50262
28
+ }
test_trainer/merges.txt ADDED
The diff for this file is too large to render. See raw diff
 
test_trainer/model_args.json ADDED
@@ -0,0 +1 @@
 
 
1
+ {"adafactor_beta1": null, "adafactor_clip_threshold": 1.0, "adafactor_decay_rate": -0.8, "adafactor_eps": [1e-30, 0.001], "adafactor_relative_step": true, "adafactor_scale_parameter": true, "adafactor_warmup_init": true, "adam_betas": [0.9, 0.999], "adam_epsilon": 1e-08, "best_model_dir": "outputs/best_model", "cache_dir": "cache_dir/", "config": {}, "cosine_schedule_num_cycles": 0.5, "custom_layer_parameters": [], "custom_parameter_groups": [], "dataloader_num_workers": 0, "do_lower_case": false, "dynamic_quantize": false, "early_stopping_consider_epochs": false, "early_stopping_delta": 0, "early_stopping_metric": "correct", "early_stopping_metric_minimize": false, "early_stopping_patience": 3, "encoding": null, "eval_batch_size": 8, "evaluate_during_training": true, "evaluate_during_training_silent": true, "evaluate_during_training_steps": 2000, "evaluate_during_training_verbose": false, "evaluate_each_epoch": true, "fp16": true, "gradient_accumulation_steps": 1, "learning_rate": 4e-05, "local_rank": -1, "logging_steps": 50, "loss_type": null, "loss_args": {}, "manual_seed": null, "max_grad_norm": 1.0, "max_seq_length": 128, "model_name": "IIC/roberta-base-spanish-squades", "model_type": "roberta", "multiprocessing_chunksize": -1, "n_gpu": 1, "no_cache": false, "no_save": false, "not_saved_args": [], "num_train_epochs": 1, "optimizer": "AdamW", "output_dir": "test_trainer", "overwrite_output_dir": false, "polynomial_decay_schedule_lr_end": 1e-07, "polynomial_decay_schedule_power": 1.0, "process_count": 1, "quantized_model": false, "reprocess_input_data": true, "save_best_model": true, "save_eval_checkpoints": true, "save_model_every_epoch": true, "save_optimizer_and_scheduler": true, "save_steps": 2000, "scheduler": "linear_schedule_with_warmup", "silent": false, "skip_special_tokens": true, "tensorboard_dir": null, "thread_count": null, "tokenizer_name": null, "tokenizer_type": null, "train_batch_size": 16, "train_custom_parameters_only": false, "use_cached_eval_features": false, "use_early_stopping": false, "use_hf_datasets": false, "use_multiprocessing": true, "use_multiprocessing_for_evaluation": true, "wandb_kwargs": {}, "wandb_project": null, "warmup_ratio": 0.06, "warmup_steps": 1, "weight_decay": 0.0, "model_class": "QuestionAnsweringModel", "doc_stride": 384, "lazy_loading": false, "max_answer_length": 100, "max_query_length": 64, "n_best_size": 20, "null_score_diff_threshold": 0.0, "special_tokens_list": []}
test_trainer/nbest_predictions_test.json ADDED
@@ -0,0 +1,386 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "00001": [
3
+ {
4
+ "text": "preceptiva",
5
+ "probability": 0.13554952204202486,
6
+ "start_logit": 3.0859375,
7
+ "end_logit": 2.58984375
8
+ },
9
+ {
10
+ "text": "art\u00edculo 22",
11
+ "probability": 0.11892317244077824,
12
+ "start_logit": 2.63671875,
13
+ "end_logit": 2.908203125
14
+ },
15
+ {
16
+ "text": "art\u00edculo 22 de la Ley Org\u00e1nica 4/2000. La asistencia jur\u00eddica referida en el p\u00e1rrafo anterior ser\u00e1 preceptiva",
17
+ "probability": 0.08649774116301187,
18
+ "start_logit": 2.63671875,
19
+ "end_logit": 2.58984375
20
+ },
21
+ {
22
+ "text": "Ley Org\u00e1nica 4/2000. La asistencia jur\u00eddica referida en el p\u00e1rrafo anterior ser\u00e1 preceptiva",
23
+ "probability": 0.06593266044450448,
24
+ "start_logit": 2.365234375,
25
+ "end_logit": 2.58984375
26
+ },
27
+ {
28
+ "text": "int\u00e9rprete en los t\u00e9rminos del art\u00edculo 22",
29
+ "probability": 0.06580401139181076,
30
+ "start_logit": 2.044921875,
31
+ "end_logit": 2.908203125
32
+ },
33
+ {
34
+ "text": "int\u00e9rprete en los t\u00e9rminos del art\u00edculo 22 de la Ley Org\u00e1nica 4/2000. La asistencia jur\u00eddica referida en el p\u00e1rrafo anterior ser\u00e1 preceptiva",
35
+ "probability": 0.04786197868788946,
36
+ "start_logit": 2.044921875,
37
+ "end_logit": 2.58984375
38
+ },
39
+ {
40
+ "text": "La asistencia jur\u00eddica referida en el p\u00e1rrafo anterior ser\u00e1 preceptiva",
41
+ "probability": 0.047489513814753394,
42
+ "start_logit": 2.037109375,
43
+ "end_logit": 2.58984375
44
+ },
45
+ {
46
+ "text": "22",
47
+ "probability": 0.04456872422055026,
48
+ "start_logit": 1.6552734375,
49
+ "end_logit": 2.908203125
50
+ },
51
+ {
52
+ "text": "derecho a int\u00e9rprete en los t\u00e9rminos del art\u00edculo 22",
53
+ "probability": 0.04022518531684144,
54
+ "start_logit": 1.552734375,
55
+ "end_logit": 2.908203125
56
+ },
57
+ {
58
+ "text": "ser\u00e1 preceptiva",
59
+ "probability": 0.03917842107225465,
60
+ "start_logit": 1.8447265625,
61
+ "end_logit": 2.58984375
62
+ },
63
+ {
64
+ "text": "art\u00edculo 22 de la Ley Org\u00e1nica",
65
+ "probability": 0.037714331755289855,
66
+ "start_logit": 2.63671875,
67
+ "end_logit": 1.759765625
68
+ },
69
+ {
70
+ "text": "art\u00edculo 22 de la Ley Org\u00e1nica 4/2000.",
71
+ "probability": 0.03760400224338528,
72
+ "start_logit": 2.63671875,
73
+ "end_logit": 1.7568359375
74
+ },
75
+ {
76
+ "text": "22 de la Ley Org\u00e1nica 4/2000. La asistencia jur\u00eddica referida en el p\u00e1rrafo anterior ser\u00e1 preceptiva",
77
+ "probability": 0.03241667618238646,
78
+ "start_logit": 1.6552734375,
79
+ "end_logit": 2.58984375
80
+ },
81
+ {
82
+ "text": "int\u00e9rprete",
83
+ "probability": 0.030721478945397104,
84
+ "start_logit": 2.044921875,
85
+ "end_logit": 2.146484375
86
+ },
87
+ {
88
+ "text": "4/2000. La asistencia jur\u00eddica referida en el p\u00e1rrafo anterior ser\u00e1 preceptiva",
89
+ "probability": 0.0300391374281591,
90
+ "start_logit": 1.5791015625,
91
+ "end_logit": 2.58984375
92
+ },
93
+ {
94
+ "text": "derecho a int\u00e9rprete en los t\u00e9rminos del art\u00edculo 22 de la Ley Org\u00e1nica 4/2000. La asistencia jur\u00eddica referida en el p\u00e1rrafo anterior ser\u00e1 preceptiva",
95
+ "probability": 0.029257440718738082,
96
+ "start_logit": 1.552734375,
97
+ "end_logit": 2.58984375
98
+ },
99
+ {
100
+ "text": "Ley Org\u00e1nica",
101
+ "probability": 0.02874764353472204,
102
+ "start_logit": 2.365234375,
103
+ "end_logit": 1.759765625
104
+ },
105
+ {
106
+ "text": "Ley Org\u00e1nica 4/2000.",
107
+ "probability": 0.02866354517391395,
108
+ "start_logit": 2.365234375,
109
+ "end_logit": 1.7568359375
110
+ },
111
+ {
112
+ "text": "art\u00edculo 22 de la Ley",
113
+ "probability": 0.027111610012130808,
114
+ "start_logit": 2.63671875,
115
+ "end_logit": 1.4296875
116
+ },
117
+ {
118
+ "text": "del art\u00edculo 22",
119
+ "probability": 0.02561867108422518,
120
+ "start_logit": 1.1015625,
121
+ "end_logit": 2.908203125
122
+ },
123
+ {
124
+ "text": "",
125
+ "probability": 7.453232723282555e-05,
126
+ "start_logit": -0.814453125,
127
+ "end_logit": -1.015625
128
+ }
129
+ ],
130
+ "00002": [
131
+ {
132
+ "text": "derecho a int\u00e9rprete",
133
+ "probability": 0.2253081167003518,
134
+ "start_logit": 3.82421875,
135
+ "end_logit": 3.568359375
136
+ },
137
+ {
138
+ "text": "int\u00e9rprete",
139
+ "probability": 0.19844574701382534,
140
+ "start_logit": 3.697265625,
141
+ "end_logit": 3.568359375
142
+ },
143
+ {
144
+ "text": "derecho a",
145
+ "probability": 0.06621185318036428,
146
+ "start_logit": 3.82421875,
147
+ "end_logit": 2.34375
148
+ },
149
+ {
150
+ "text": "derecho a int\u00e9rprete en",
151
+ "probability": 0.06556840002645095,
152
+ "start_logit": 3.82421875,
153
+ "end_logit": 2.333984375
154
+ },
155
+ {
156
+ "text": "int\u00e9rprete en",
157
+ "probability": 0.05775100477651842,
158
+ "start_logit": 3.697265625,
159
+ "end_logit": 2.333984375
160
+ },
161
+ {
162
+ "text": "a int\u00e9rprete",
163
+ "probability": 0.040081158978113825,
164
+ "start_logit": 2.09765625,
165
+ "end_logit": 3.568359375
166
+ },
167
+ {
168
+ "text": "se prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete",
169
+ "probability": 0.039382763579296355,
170
+ "start_logit": 2.080078125,
171
+ "end_logit": 3.568359375
172
+ },
173
+ {
174
+ "text": "se extender\u00e1 a la formalizaci\u00f3n de la solicitud y a toda la tramitaci\u00f3n del procedimiento, y que se prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete",
175
+ "probability": 0.037948078607371455,
176
+ "start_logit": 2.04296875,
177
+ "end_logit": 3.568359375
178
+ },
179
+ {
180
+ "text": "como derecho a int\u00e9rprete",
181
+ "probability": 0.03547527803399087,
182
+ "start_logit": 1.9755859375,
183
+ "end_logit": 3.568359375
184
+ },
185
+ {
186
+ "text": "prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete",
187
+ "probability": 0.032745250723141814,
188
+ "start_logit": 1.8955078125,
189
+ "end_logit": 3.568359375
190
+ },
191
+ {
192
+ "text": "derecho",
193
+ "probability": 0.03133741098576108,
194
+ "start_logit": 3.82421875,
195
+ "end_logit": 1.595703125
196
+ },
197
+ {
198
+ "text": "que se prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete",
199
+ "probability": 0.030195812263015757,
200
+ "start_logit": 1.814453125,
201
+ "end_logit": 3.568359375
202
+ },
203
+ {
204
+ "text": "que se extender\u00e1 a la formalizaci\u00f3n de la solicitud y a toda la tramitaci\u00f3n del procedimiento, y que se prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete",
205
+ "probability": 0.025131184817530617,
206
+ "start_logit": 1.630859375,
207
+ "end_logit": 3.568359375
208
+ },
209
+ {
210
+ "text": "as\u00ed como derecho a int\u00e9rprete",
211
+ "probability": 0.023174552704249275,
212
+ "start_logit": 1.5498046875,
213
+ "end_logit": 3.568359375
214
+ },
215
+ {
216
+ "text": "extender\u00e1 a la formalizaci\u00f3n de la solicitud y a toda la tramitaci\u00f3n del procedimiento, y que se prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete",
217
+ "probability": 0.01917489143576823,
218
+ "start_logit": 1.3603515625,
219
+ "end_logit": 3.568359375
220
+ },
221
+ {
222
+ "text": "los solicitantes de protecci\u00f3n internacional tendr\u00e1n derecho a asistencia sanitaria y a asistencia jur\u00eddica gratuita, que se extender\u00e1 a la formalizaci\u00f3n de la solicitud y a toda la tramitaci\u00f3n del procedimiento, y que se prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete",
223
+ "probability": 0.016643173343964698,
224
+ "start_logit": 1.21875,
225
+ "end_logit": 3.568359375
226
+ },
227
+ {
228
+ "text": "derecho a asistencia sanitaria y a asistencia jur\u00eddica gratuita, que se extender\u00e1 a la formalizaci\u00f3n de la solicitud y a toda la tramitaci\u00f3n del procedimiento, y que se prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete",
229
+ "probability": 0.015452663340384145,
230
+ "start_logit": 1.14453125,
231
+ "end_logit": 3.568359375
232
+ },
233
+ {
234
+ "text": "asistencia sanitaria y a asistencia jur\u00eddica gratuita, que se extender\u00e1 a la formalizaci\u00f3n de la solicitud y a toda la tramitaci\u00f3n del procedimiento, y que se prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete",
235
+ "probability": 0.014616007182339725,
236
+ "start_logit": 1.0888671875,
237
+ "end_logit": 3.568359375
238
+ },
239
+ {
240
+ "text": "tendr\u00e1n derecho a asistencia sanitaria y a asistencia jur\u00eddica gratuita, que se extender\u00e1 a la formalizaci\u00f3n de la solicitud y a toda la tramitaci\u00f3n del procedimiento, y que se prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete",
241
+ "probability": 0.012968046941583452,
242
+ "start_logit": 0.96923828125,
243
+ "end_logit": 3.568359375
244
+ },
245
+ {
246
+ "text": "Para su ejercicio, los solicitantes de protecci\u00f3n internacional tendr\u00e1n derecho a asistencia sanitaria y a asistencia jur\u00eddica gratuita, que se extender\u00e1 a la formalizaci\u00f3n de la solicitud y a toda la tramitaci\u00f3n del procedimiento, y que se prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete",
247
+ "probability": 0.012380240399918564,
248
+ "start_logit": 0.9228515625,
249
+ "end_logit": 3.568359375
250
+ },
251
+ {
252
+ "text": "",
253
+ "probability": 8.364966059261107e-06,
254
+ "start_logit": -1.3466796875,
255
+ "end_logit": -1.4619140625
256
+ }
257
+ ],
258
+ "00003": [
259
+ {
260
+ "text": "asistencia sanitaria",
261
+ "probability": 0.24196454170236012,
262
+ "start_logit": 3.48828125,
263
+ "end_logit": 3.095703125
264
+ },
265
+ {
266
+ "text": "asistencia sanitaria y a asistencia jur\u00eddica gratuita, que se extender\u00e1 a la formalizaci\u00f3n de la solicitud y a toda la tramitaci\u00f3n del procedimiento, y que se prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete en los t\u00e9rminos del art\u00edculo 22 de la Ley Org\u00e1nica 4/2000. La asistencia jur\u00eddica referida en el p\u00e1rrafo anterior ser\u00e1 preceptiva",
267
+ "probability": 0.1280053991040239,
268
+ "start_logit": 3.48828125,
269
+ "end_logit": 2.458984375
270
+ },
271
+ {
272
+ "text": "preceptiva",
273
+ "probability": 0.10970287431467561,
274
+ "start_logit": 3.333984375,
275
+ "end_logit": 2.458984375
276
+ },
277
+ {
278
+ "text": "protecci\u00f3n internacional en Espa\u00f1a. 2. Para su ejercicio, los solicitantes de protecci\u00f3n internacional tendr\u00e1n derecho a asistencia sanitaria",
279
+ "probability": 0.07673467509726783,
280
+ "start_logit": 2.33984375,
281
+ "end_logit": 3.095703125
282
+ },
283
+ {
284
+ "text": "La asistencia jur\u00eddica referida en el p\u00e1rrafo anterior ser\u00e1 preceptiva",
285
+ "probability": 0.05526991309822158,
286
+ "start_logit": 2.6484375,
287
+ "end_logit": 2.458984375
288
+ },
289
+ {
290
+ "text": "asistencia sanitaria y a asistencia jur\u00eddica gratuita, que se extender\u00e1 a la formalizaci\u00f3n de la solicitud y a toda la tramitaci\u00f3n del procedimiento, y que se prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete",
291
+ "probability": 0.04493412118873171,
292
+ "start_logit": 3.48828125,
293
+ "end_logit": 1.412109375
294
+ },
295
+ {
296
+ "text": "protecci\u00f3n internacional en Espa\u00f1a. 2. Para su ejercicio, los solicitantes de protecci\u00f3n internacional tendr\u00e1n derecho a asistencia sanitaria y a asistencia jur\u00eddica gratuita, que se extender\u00e1 a la formalizaci\u00f3n de la solicitud y a toda la tramitaci\u00f3n del procedimiento, y que se prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete en los t\u00e9rminos del art\u00edculo 22 de la Ley Org\u00e1nica 4/2000. La asistencia jur\u00eddica referida en el p\u00e1rrafo anterior ser\u00e1 preceptiva",
297
+ "probability": 0.04059459556279095,
298
+ "start_logit": 2.33984375,
299
+ "end_logit": 2.458984375
300
+ },
301
+ {
302
+ "text": "protecci\u00f3n internacional",
303
+ "probability": 0.03624689395139819,
304
+ "start_logit": 2.33984375,
305
+ "end_logit": 2.345703125
306
+ },
307
+ {
308
+ "text": "asistencia sanitaria y a asistencia jur\u00eddica gratuita, que se extender\u00e1 a la formalizaci\u00f3n de la solicitud y a toda la tramitaci\u00f3n del procedimiento, y que se prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete en los t\u00e9rminos del art\u00edculo 22 de la Ley Org\u00e1nica 4/2000. La asistencia jur\u00eddica",
309
+ "probability": 0.03388494722219353,
310
+ "start_logit": 3.48828125,
311
+ "end_logit": 1.1298828125
312
+ },
313
+ {
314
+ "text": "asistencia sanitaria y a asistencia jur\u00eddica gratuita, que se extender\u00e1 a la formalizaci\u00f3n de la solicitud y a toda la tramitaci\u00f3n del procedimiento, y que se prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete en los t\u00e9rminos del art\u00edculo 22 de la Ley Org\u00e1nica 4/2000. La asistencia jur\u00eddica referida en el p\u00e1rrafo anterior ser\u00e1",
315
+ "probability": 0.03112495607473032,
316
+ "start_logit": 3.48828125,
317
+ "end_logit": 1.044921875
318
+ },
319
+ {
320
+ "text": "protecci\u00f3n internacional. 1. Las personas nacionales no comunitarias y las ap\u00e1tridas presentes en territorio espa\u00f1ol tienen derecho a solicitar protecci\u00f3n internacional en Espa\u00f1a. 2. Para su ejercicio, los solicitantes de protecci\u00f3n internacional tendr\u00e1n derecho a asistencia sanitaria",
321
+ "probability": 0.028229109393255084,
322
+ "start_logit": 1.33984375,
323
+ "end_logit": 3.095703125
324
+ },
325
+ {
326
+ "text": "asistencia jur\u00eddica gratuita, que se extender\u00e1 a la formalizaci\u00f3n de la solicitud y a toda la tramitaci\u00f3n del procedimiento, y que se prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete en los t\u00e9rminos del art\u00edculo 22 de la Ley Org\u00e1nica 4/2000. La asistencia jur\u00eddica referida en el p\u00e1rrafo anterior ser\u00e1 preceptiva",
327
+ "probability": 0.02488778525319816,
328
+ "start_logit": 1.8505859375,
329
+ "end_logit": 2.458984375
330
+ },
331
+ {
332
+ "text": "asistencia jur\u00eddica referida en el p\u00e1rrafo anterior ser\u00e1 preceptiva",
333
+ "probability": 0.024839223736419027,
334
+ "start_logit": 1.8486328125,
335
+ "end_logit": 2.458984375
336
+ },
337
+ {
338
+ "text": "asistencia sanitaria y a asistencia jur\u00eddica gratuita, que se extender\u00e1 a la formalizaci\u00f3n de la solicitud",
339
+ "probability": 0.024323133959941845,
340
+ "start_logit": 3.48828125,
341
+ "end_logit": 0.79833984375
342
+ },
343
+ {
344
+ "text": "asistencia sanitaria y a asistencia jur\u00eddica",
345
+ "probability": 0.021496556425078944,
346
+ "start_logit": 3.48828125,
347
+ "end_logit": 0.6748046875
348
+ },
349
+ {
350
+ "text": "ser\u00e1 preceptiva",
351
+ "probability": 0.020572339762090164,
352
+ "start_logit": 1.66015625,
353
+ "end_logit": 2.458984375
354
+ },
355
+ {
356
+ "text": "asistencia",
357
+ "probability": 0.014810467025911322,
358
+ "start_logit": 3.48828125,
359
+ "end_logit": 0.30224609375
360
+ },
361
+ {
362
+ "text": "La asistencia jur\u00eddica",
363
+ "probability": 0.014630774181536759,
364
+ "start_logit": 2.6484375,
365
+ "end_logit": 1.1298828125
366
+ },
367
+ {
368
+ "text": "protecci\u00f3n internacional en Espa\u00f1a. 2. Para su ejercicio, los solicitantes de protecci\u00f3n internacional tendr\u00e1n derecho a asistencia sanitaria y a asistencia jur\u00eddica gratuita, que se extender\u00e1 a la formalizaci\u00f3n de la solicitud y a toda la tramitaci\u00f3n del procedimiento, y que se prestar\u00e1 en los t\u00e9rminos previstos en la legislaci\u00f3n espa\u00f1ola en esta materia, as\u00ed como derecho a int\u00e9rprete",
369
+ "probability": 0.01425004327468761,
370
+ "start_logit": 2.33984375,
371
+ "end_logit": 1.412109375
372
+ },
373
+ {
374
+ "text": "La asistencia jur\u00eddica referida en el p\u00e1rrafo anterior ser\u00e1",
375
+ "probability": 0.01343907076949406,
376
+ "start_logit": 2.6484375,
377
+ "end_logit": 1.044921875
378
+ },
379
+ {
380
+ "text": "",
381
+ "probability": 5.857890199337721e-05,
382
+ "start_logit": -0.76123046875,
383
+ "end_logit": -0.98095703125
384
+ }
385
+ ]
386
+ }
test_trainer/null_odds_test.json ADDED
@@ -0,0 +1,5 @@
 
 
 
 
 
 
1
+ {
2
+ "00001": -7.505859375,
3
+ "00002": -10.201171875,
4
+ "00003": -8.326171875
5
+ }
test_trainer/predictions_test.json ADDED
@@ -0,0 +1,5 @@
 
 
 
 
 
 
1
+ {
2
+ "00001": "preceptiva",
3
+ "00002": "derecho a int\u00e9rprete",
4
+ "00003": "asistencia sanitaria"
5
+ }
test_trainer/pytorch_model.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:685e64506f8922ff7b9ab9d5752655594f6a48fa3ee45ad95a6d54aa416a5f38
3
+ size 496288177
test_trainer/special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": true,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": true,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": true,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": true,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": true,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": true,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": true,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
test_trainer/tokenizer_config.json ADDED
@@ -0,0 +1,67 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "add_prefix_space": true,
3
+ "bos_token": {
4
+ "__type": "AddedToken",
5
+ "content": "<s>",
6
+ "lstrip": false,
7
+ "normalized": true,
8
+ "rstrip": false,
9
+ "single_word": false
10
+ },
11
+ "cls_token": {
12
+ "__type": "AddedToken",
13
+ "content": "<s>",
14
+ "lstrip": false,
15
+ "normalized": true,
16
+ "rstrip": false,
17
+ "single_word": false
18
+ },
19
+ "do_lower_case": false,
20
+ "eos_token": {
21
+ "__type": "AddedToken",
22
+ "content": "</s>",
23
+ "lstrip": false,
24
+ "normalized": true,
25
+ "rstrip": false,
26
+ "single_word": false
27
+ },
28
+ "errors": "replace",
29
+ "mask_token": {
30
+ "__type": "AddedToken",
31
+ "content": "<mask>",
32
+ "lstrip": true,
33
+ "normalized": true,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "max_len": 512,
38
+ "max_length": 512,
39
+ "model_max_length": 512,
40
+ "name_or_path": "IIC/roberta-base-spanish-squades",
41
+ "pad_token": {
42
+ "__type": "AddedToken",
43
+ "content": "<pad>",
44
+ "lstrip": false,
45
+ "normalized": true,
46
+ "rstrip": false,
47
+ "single_word": false
48
+ },
49
+ "sep_token": {
50
+ "__type": "AddedToken",
51
+ "content": "</s>",
52
+ "lstrip": false,
53
+ "normalized": true,
54
+ "rstrip": false,
55
+ "single_word": false
56
+ },
57
+ "special_tokens_map_file": null,
58
+ "tokenizer_class": "RobertaTokenizer",
59
+ "unk_token": {
60
+ "__type": "AddedToken",
61
+ "content": "<unk>",
62
+ "lstrip": false,
63
+ "normalized": true,
64
+ "rstrip": false,
65
+ "single_word": false
66
+ }
67
+ }
test_trainer/training_args.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:26afcbee94636950ba925d8de641f3ee3316bec112bf486b63e8c11aa149440a
3
+ size 3055
test_trainer/training_progress_scores.csv ADDED
@@ -0,0 +1,2 @@
 
 
 
1
+ global_step,correct,similar,incorrect,train_loss,eval_loss
2
+ 1,0,1,2,3.080120086669922,-2.8828125
test_trainer/vocab.json ADDED
The diff for this file is too large to render. See raw diff