jerawincel commited on Dec 2, 2023

Commit

1610cce

1 Parent(s): e95b402

Training in progress, epoch 4

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

model.safetensors +1 -1
run-5/checkpoint-272/config.json +87 -0
run-5/checkpoint-272/merges.txt +0 -0
run-5/checkpoint-272/model.safetensors +3 -0
run-5/checkpoint-272/optimizer.pt +3 -0
run-5/checkpoint-272/rng_state.pth +3 -0
run-5/checkpoint-272/scheduler.pt +3 -0
run-5/checkpoint-272/special_tokens_map.json +15 -0
run-5/checkpoint-272/tokenizer.json +0 -0
run-5/checkpoint-272/tokenizer_config.json +58 -0
run-5/checkpoint-272/trainer_state.json +42 -0
run-5/checkpoint-272/training_args.bin +3 -0
run-5/checkpoint-272/vocab.json +0 -0
run-6/checkpoint-136/config.json +87 -0
run-6/checkpoint-136/merges.txt +0 -0
run-6/checkpoint-136/model.safetensors +3 -0
run-6/checkpoint-136/optimizer.pt +3 -0
run-6/checkpoint-136/rng_state.pth +3 -0
run-6/checkpoint-136/scheduler.pt +3 -0
run-6/checkpoint-136/special_tokens_map.json +15 -0
run-6/checkpoint-136/tokenizer.json +0 -0
run-6/checkpoint-136/tokenizer_config.json +58 -0
run-6/checkpoint-136/trainer_state.json +42 -0
run-6/checkpoint-136/training_args.bin +3 -0
run-6/checkpoint-136/vocab.json +0 -0
run-6/checkpoint-204/config.json +87 -0
run-6/checkpoint-204/merges.txt +0 -0
run-6/checkpoint-204/model.safetensors +3 -0
run-6/checkpoint-204/optimizer.pt +3 -0
run-6/checkpoint-204/rng_state.pth +3 -0
run-6/checkpoint-204/scheduler.pt +3 -0
run-6/checkpoint-204/special_tokens_map.json +15 -0
run-6/checkpoint-204/tokenizer.json +0 -0
run-6/checkpoint-204/tokenizer_config.json +58 -0
run-6/checkpoint-204/trainer_state.json +51 -0
run-6/checkpoint-204/training_args.bin +3 -0
run-6/checkpoint-204/vocab.json +0 -0
run-6/checkpoint-272/model.safetensors +1 -1
run-6/checkpoint-272/optimizer.pt +1 -1
run-6/checkpoint-272/rng_state.pth +1 -1
run-6/checkpoint-272/scheduler.pt +1 -1
run-6/checkpoint-272/tokenizer.json +2 -2
run-6/checkpoint-272/tokenizer_config.json +1 -1
run-6/checkpoint-272/trainer_state.json +39 -12
run-6/checkpoint-272/training_args.bin +1 -1
run-6/checkpoint-68/config.json +87 -0
run-6/checkpoint-68/merges.txt +0 -0
run-6/checkpoint-68/model.safetensors +3 -0
run-6/checkpoint-68/optimizer.pt +3 -0
run-6/checkpoint-68/rng_state.pth +3 -0

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1d69cb13fd2d8fdeab4fc14d97b5df2c7103232ecee077b6bc544cc617c7c31a
 size 498692800

 version https://git-lfs.github.com/spec/v1
+oid sha256:24df4b297f9fa796d4993f1c3a655ab4472259e1580b2510586de3527689e7da
 size 498692800

run-5/checkpoint-272/config.json ADDED Viewed

	@@ -0,0 +1,87 @@

+{
+  "_name_or_path": "roberta-base",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3",
+    "4": "LABEL_4",
+    "5": "LABEL_5",
+    "6": "LABEL_6",
+    "7": "LABEL_7",
+    "8": "LABEL_8",
+    "9": "LABEL_9",
+    "10": "LABEL_10",
+    "11": "LABEL_11",
+    "12": "LABEL_12",
+    "13": "LABEL_13",
+    "14": "LABEL_14",
+    "15": "LABEL_15",
+    "16": "LABEL_16",
+    "17": "LABEL_17",
+    "18": "LABEL_18",
+    "19": "LABEL_19",
+    "20": "LABEL_20",
+    "21": "LABEL_21",
+    "22": "LABEL_22",
+    "23": "LABEL_23",
+    "24": "LABEL_24",
+    "25": "LABEL_25",
+    "26": "LABEL_26",
+    "27": "LABEL_27"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_10": 10,
+    "LABEL_11": 11,
+    "LABEL_12": 12,
+    "LABEL_13": 13,
+    "LABEL_14": 14,
+    "LABEL_15": 15,
+    "LABEL_16": 16,
+    "LABEL_17": 17,
+    "LABEL_18": 18,
+    "LABEL_19": 19,
+    "LABEL_2": 2,
+    "LABEL_20": 20,
+    "LABEL_21": 21,
+    "LABEL_22": 22,
+    "LABEL_23": 23,
+    "LABEL_24": 24,
+    "LABEL_25": 25,
+    "LABEL_26": 26,
+    "LABEL_27": 27,
+    "LABEL_3": 3,
+    "LABEL_4": 4,
+    "LABEL_5": 5,
+    "LABEL_6": 6,
+    "LABEL_7": 7,
+    "LABEL_8": 8,
+    "LABEL_9": 9
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

run-5/checkpoint-272/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-5/checkpoint-272/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c0a33f8374f0b009669599ddd495aba375d673c547ceda3e1c14837ab4afa758
+size 498692800

run-5/checkpoint-272/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:33ff2d2bfcfa54e192cf372585ea91c76ebb608da530976894325e4a16d9b212
+size 997505402

run-5/checkpoint-272/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:823b0a05c87e760485d9d141a1d80d22ad6f3a0c9d14baa34c611af6732e5309
+size 14244

run-5/checkpoint-272/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c950336249eeab44c29e3dd0cf06efdbc4e8502eb7c2d477aade0a9d5f13c345
+size 1064

run-5/checkpoint-272/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

run-5/checkpoint-272/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-5/checkpoint-272/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50264": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "errors": "replace",
+  "mask_token": "<mask>",
+  "model_max_length": 128,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "RobertaTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
+}

run-5/checkpoint-272/trainer_state.json ADDED Viewed

	@@ -0,0 +1,42 @@

+{
+  "best_metric": 0.0,
+  "best_model_checkpoint": "roberta-base-finetuned/run-5/checkpoint-136",
+  "epoch": 2.0,
+  "eval_steps": 500,
+  "global_step": 272,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_f1": 0.0,
+      "eval_loss": 0.1628250777721405,
+      "eval_runtime": 1.768,
+      "eval_samples_per_second": 153.277,
+      "eval_steps_per_second": 1.131,
+      "step": 136
+    },
+    {
+      "epoch": 2.0,
+      "eval_f1": 0.0,
+      "eval_loss": 0.15479044616222382,
+      "eval_runtime": 1.7694,
+      "eval_samples_per_second": 153.156,
+      "eval_steps_per_second": 1.13,
+      "step": 272
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 272,
+  "num_train_epochs": 2,
+  "save_steps": 500,
+  "total_flos": 0,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 2.4061789637885192e-05,
+    "num_train_epochs": 2,
+    "per_device_train_batch_size": 16,
+    "seed": 5
+  }
+}

run-5/checkpoint-272/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b5e561920b0ab584c535b322f98226660fd2c79e91313f6c5e56d4ca00280fc3
+size 4600

run-5/checkpoint-272/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-6/checkpoint-136/config.json ADDED Viewed

	@@ -0,0 +1,87 @@

+{
+  "_name_or_path": "roberta-base",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3",
+    "4": "LABEL_4",
+    "5": "LABEL_5",
+    "6": "LABEL_6",
+    "7": "LABEL_7",
+    "8": "LABEL_8",
+    "9": "LABEL_9",
+    "10": "LABEL_10",
+    "11": "LABEL_11",
+    "12": "LABEL_12",
+    "13": "LABEL_13",
+    "14": "LABEL_14",
+    "15": "LABEL_15",
+    "16": "LABEL_16",
+    "17": "LABEL_17",
+    "18": "LABEL_18",
+    "19": "LABEL_19",
+    "20": "LABEL_20",
+    "21": "LABEL_21",
+    "22": "LABEL_22",
+    "23": "LABEL_23",
+    "24": "LABEL_24",
+    "25": "LABEL_25",
+    "26": "LABEL_26",
+    "27": "LABEL_27"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_10": 10,
+    "LABEL_11": 11,
+    "LABEL_12": 12,
+    "LABEL_13": 13,
+    "LABEL_14": 14,
+    "LABEL_15": 15,
+    "LABEL_16": 16,
+    "LABEL_17": 17,
+    "LABEL_18": 18,
+    "LABEL_19": 19,
+    "LABEL_2": 2,
+    "LABEL_20": 20,
+    "LABEL_21": 21,
+    "LABEL_22": 22,
+    "LABEL_23": 23,
+    "LABEL_24": 24,
+    "LABEL_25": 25,
+    "LABEL_26": 26,
+    "LABEL_27": 27,
+    "LABEL_3": 3,
+    "LABEL_4": 4,
+    "LABEL_5": 5,
+    "LABEL_6": 6,
+    "LABEL_7": 7,
+    "LABEL_8": 8,
+    "LABEL_9": 9
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

run-6/checkpoint-136/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-6/checkpoint-136/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:17d4f80f9793e83ad34de9d967d2991deab27b8e34c5def3d33e1594aaa84166
+size 498692800

run-6/checkpoint-136/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f5824c696cdfd89fb76098526cfcac2176baa740714d67e3cff6ae2fc18ff372
+size 997505402

run-6/checkpoint-136/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:48110f108e6a5c46c9507598e8bde0de764b16fafd8a07d876a0cf62355a332c
+size 14308

run-6/checkpoint-136/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5c6a398aec080996e6a1b063886e28816554bddb4bb1071b4cf89cb31b63b27d
+size 1064

run-6/checkpoint-136/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

run-6/checkpoint-136/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-6/checkpoint-136/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50264": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "errors": "replace",
+  "mask_token": "<mask>",
+  "model_max_length": 128,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "RobertaTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
+}

run-6/checkpoint-136/trainer_state.json ADDED Viewed

	@@ -0,0 +1,42 @@

+{
+  "best_metric": 0.0,
+  "best_model_checkpoint": "roberta-base-finetuned/run-6/checkpoint-68",
+  "epoch": 2.0,
+  "eval_steps": 500,
+  "global_step": 136,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_f1": 0.0,
+      "eval_loss": 0.27623069286346436,
+      "eval_runtime": 1.7887,
+      "eval_samples_per_second": 151.505,
+      "eval_steps_per_second": 1.118,
+      "step": 68
+    },
+    {
+      "epoch": 2.0,
+      "eval_f1": 0.0,
+      "eval_loss": 0.21532878279685974,
+      "eval_runtime": 1.7558,
+      "eval_samples_per_second": 154.348,
+      "eval_steps_per_second": 1.139,
+      "step": 136
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 340,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "total_flos": 0,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 9.656231101012835e-06,
+    "num_train_epochs": 5,
+    "per_device_train_batch_size": 32,
+    "seed": 13
+  }
+}

run-6/checkpoint-136/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a125737cc9b04c4061972a35907d68d87488b05a430e52db5906b8a58739987f
+size 4600

run-6/checkpoint-136/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-6/checkpoint-204/config.json ADDED Viewed

	@@ -0,0 +1,87 @@

+{
+  "_name_or_path": "roberta-base",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3",
+    "4": "LABEL_4",
+    "5": "LABEL_5",
+    "6": "LABEL_6",
+    "7": "LABEL_7",
+    "8": "LABEL_8",
+    "9": "LABEL_9",
+    "10": "LABEL_10",
+    "11": "LABEL_11",
+    "12": "LABEL_12",
+    "13": "LABEL_13",
+    "14": "LABEL_14",
+    "15": "LABEL_15",
+    "16": "LABEL_16",
+    "17": "LABEL_17",
+    "18": "LABEL_18",
+    "19": "LABEL_19",
+    "20": "LABEL_20",
+    "21": "LABEL_21",
+    "22": "LABEL_22",
+    "23": "LABEL_23",
+    "24": "LABEL_24",
+    "25": "LABEL_25",
+    "26": "LABEL_26",
+    "27": "LABEL_27"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_10": 10,
+    "LABEL_11": 11,
+    "LABEL_12": 12,
+    "LABEL_13": 13,
+    "LABEL_14": 14,
+    "LABEL_15": 15,
+    "LABEL_16": 16,
+    "LABEL_17": 17,
+    "LABEL_18": 18,
+    "LABEL_19": 19,
+    "LABEL_2": 2,
+    "LABEL_20": 20,
+    "LABEL_21": 21,
+    "LABEL_22": 22,
+    "LABEL_23": 23,
+    "LABEL_24": 24,
+    "LABEL_25": 25,
+    "LABEL_26": 26,
+    "LABEL_27": 27,
+    "LABEL_3": 3,
+    "LABEL_4": 4,
+    "LABEL_5": 5,
+    "LABEL_6": 6,
+    "LABEL_7": 7,
+    "LABEL_8": 8,
+    "LABEL_9": 9
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

run-6/checkpoint-204/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-6/checkpoint-204/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:951368aedb90f2b811cb85753dcdd207637783c1f31aa00810f63fa3bccf9fd0
+size 498692800

run-6/checkpoint-204/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dd76bf2a83f994330e0134ce397067df011e5be2eb2d9b9f79d380b47de4040d
+size 997505402

run-6/checkpoint-204/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ebc14a5b892c07b34237a7c212063297e2616310add1966fef13fefce9e62437
+size 14308

run-6/checkpoint-204/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f1691de8e5d89384b5a01a9060f1d7c0c59dd0da9b4ea9811b0f1dbc7dc7e349
+size 1064

run-6/checkpoint-204/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

run-6/checkpoint-204/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-6/checkpoint-204/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50264": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "errors": "replace",
+  "mask_token": "<mask>",
+  "model_max_length": 128,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "RobertaTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
+}

run-6/checkpoint-204/trainer_state.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "best_metric": 0.0,
+  "best_model_checkpoint": "roberta-base-finetuned/run-6/checkpoint-68",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 204,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_f1": 0.0,
+      "eval_loss": 0.27623069286346436,
+      "eval_runtime": 1.7887,
+      "eval_samples_per_second": 151.505,
+      "eval_steps_per_second": 1.118,
+      "step": 68
+    },
+    {
+      "epoch": 2.0,
+      "eval_f1": 0.0,
+      "eval_loss": 0.21532878279685974,
+      "eval_runtime": 1.7558,
+      "eval_samples_per_second": 154.348,
+      "eval_steps_per_second": 1.139,
+      "step": 136
+    },
+    {
+      "epoch": 3.0,
+      "eval_f1": 0.0,
+      "eval_loss": 0.19268403947353363,
+      "eval_runtime": 1.769,
+      "eval_samples_per_second": 153.196,
+      "eval_steps_per_second": 1.131,
+      "step": 204
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 340,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "total_flos": 0,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 9.656231101012835e-06,
+    "num_train_epochs": 5,
+    "per_device_train_batch_size": 32,
+    "seed": 13
+  }
+}

run-6/checkpoint-204/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a125737cc9b04c4061972a35907d68d87488b05a430e52db5906b8a58739987f
+size 4600

run-6/checkpoint-204/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-6/checkpoint-272/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b73dbfff76d25896418567d170743886cdad4d4f1d0ae47918f16e1a9e98d553
 size 498692800

 version https://git-lfs.github.com/spec/v1
+oid sha256:24df4b297f9fa796d4993f1c3a655ab4472259e1580b2510586de3527689e7da
 size 498692800

run-6/checkpoint-272/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ff197fe7ece3cb4afbcad8cb274537c7bce55ef6690484cce16d9c325f4a89be
 size 997505402

 version https://git-lfs.github.com/spec/v1
+oid sha256:363fbebfa284d8cc54fafd67b32758d29d648ac6ca9f5967ccfd1e82b8cab4b0
 size 997505402

run-6/checkpoint-272/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8963118a7aaf4f81d375c22ec40cc54385266242f47882eda34f40a268bf65d3
 size 14308

 version https://git-lfs.github.com/spec/v1
+oid sha256:c1395490277a30f2427a1fc55275bdbc591209f5a83c3f349e99a1f03b2975ce
 size 14308

run-6/checkpoint-272/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:653522563fa3a3592b7c4aabc6e929e927a5791729e025eeec9153ed873bc6bd
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:09b7d77263aa0a9bb24739a2c6e6452dfedbb4047ff897efcb64ba3ce4da6e2d
 size 1064

run-6/checkpoint-272/tokenizer.json CHANGED Viewed

@@ -2,13 +2,13 @@
   "version": "1.0",
   "truncation": {
     "direction": "Right",
-    "max_length": 64,
     "strategy": "LongestFirst",
     "stride": 0
   },
   "padding": {
     "strategy": {
-      "Fixed": 64
     },
     "direction": "Right",
     "pad_to_multiple_of": null,

   "version": "1.0",
   "truncation": {
     "direction": "Right",
+    "max_length": 128,
     "strategy": "LongestFirst",
     "stride": 0
   },
   "padding": {
     "strategy": {
+      "Fixed": 128
     },
     "direction": "Right",
     "pad_to_multiple_of": null,

run-6/checkpoint-272/tokenizer_config.json CHANGED Viewed

@@ -49,7 +49,7 @@
   "eos_token": "</s>",
   "errors": "replace",
   "mask_token": "<mask>",
-  "model_max_length": 64,
   "pad_token": "<pad>",
   "sep_token": "</s>",
   "tokenizer_class": "RobertaTokenizer",

   "eos_token": "</s>",
   "errors": "replace",
   "mask_token": "<mask>",
+  "model_max_length": 128,
   "pad_token": "<pad>",
   "sep_token": "</s>",
   "tokenizer_class": "RobertaTokenizer",

run-6/checkpoint-272/trainer_state.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "best_metric": 0.0,
-  "best_model_checkpoint": "roberta-base-finetuned/run-6/checkpoint-272",
-  "epoch": 1.0,
   "eval_steps": 500,
   "global_step": 272,
   "is_hyper_param_search": true,
@@ -11,23 +11,50 @@
     {
       "epoch": 1.0,
       "eval_f1": 0.0,
-      "eval_loss": 0.22504137456417084,
-      "eval_runtime": 7.2135,
-      "eval_samples_per_second": 752.201,
-      "eval_steps_per_second": 5.961,
       "step": 272
     }
   ],
   "logging_steps": 500,
-  "max_steps": 1088,
-  "num_train_epochs": 4,
   "save_steps": 500,
   "total_flos": 0,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 3.834659722691893e-06,
-    "num_train_epochs": 4,
-    "per_device_train_batch_size": 16,
-    "seed": 8
   }
 }

 {
   "best_metric": 0.0,
+  "best_model_checkpoint": "roberta-base-finetuned/run-6/checkpoint-68",
+  "epoch": 4.0,
   "eval_steps": 500,
   "global_step": 272,
   "is_hyper_param_search": true,
     {
       "epoch": 1.0,
       "eval_f1": 0.0,
+      "eval_loss": 0.27623069286346436,
+      "eval_runtime": 1.7887,
+      "eval_samples_per_second": 151.505,
+      "eval_steps_per_second": 1.118,
+      "step": 68
+    },
+    {
+      "epoch": 2.0,
+      "eval_f1": 0.0,
+      "eval_loss": 0.21532878279685974,
+      "eval_runtime": 1.7558,
+      "eval_samples_per_second": 154.348,
+      "eval_steps_per_second": 1.139,
+      "step": 136
+    },
+    {
+      "epoch": 3.0,
+      "eval_f1": 0.0,
+      "eval_loss": 0.19268403947353363,
+      "eval_runtime": 1.769,
+      "eval_samples_per_second": 153.196,
+      "eval_steps_per_second": 1.131,
+      "step": 204
+    },
+    {
+      "epoch": 4.0,
+      "eval_f1": 0.0,
+      "eval_loss": 0.18309621512889862,
+      "eval_runtime": 1.7578,
+      "eval_samples_per_second": 154.173,
+      "eval_steps_per_second": 1.138,
       "step": 272
     }
   ],
   "logging_steps": 500,
+  "max_steps": 340,
+  "num_train_epochs": 5,
   "save_steps": 500,
   "total_flos": 0,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 9.656231101012835e-06,
+    "num_train_epochs": 5,
+    "per_device_train_batch_size": 32,
+    "seed": 13
   }
 }

run-6/checkpoint-272/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e7eada57037d8586533658d8935ee7f22a0b7f7fd4c4a8bd928fa69ced67e2f1
 size 4600

 version https://git-lfs.github.com/spec/v1
+oid sha256:a125737cc9b04c4061972a35907d68d87488b05a430e52db5906b8a58739987f
 size 4600

run-6/checkpoint-68/config.json ADDED Viewed

	@@ -0,0 +1,87 @@

+{
+  "_name_or_path": "roberta-base",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3",
+    "4": "LABEL_4",
+    "5": "LABEL_5",
+    "6": "LABEL_6",
+    "7": "LABEL_7",
+    "8": "LABEL_8",
+    "9": "LABEL_9",
+    "10": "LABEL_10",
+    "11": "LABEL_11",
+    "12": "LABEL_12",
+    "13": "LABEL_13",
+    "14": "LABEL_14",
+    "15": "LABEL_15",
+    "16": "LABEL_16",
+    "17": "LABEL_17",
+    "18": "LABEL_18",
+    "19": "LABEL_19",
+    "20": "LABEL_20",
+    "21": "LABEL_21",
+    "22": "LABEL_22",
+    "23": "LABEL_23",
+    "24": "LABEL_24",
+    "25": "LABEL_25",
+    "26": "LABEL_26",
+    "27": "LABEL_27"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_10": 10,
+    "LABEL_11": 11,
+    "LABEL_12": 12,
+    "LABEL_13": 13,
+    "LABEL_14": 14,
+    "LABEL_15": 15,
+    "LABEL_16": 16,
+    "LABEL_17": 17,
+    "LABEL_18": 18,
+    "LABEL_19": 19,
+    "LABEL_2": 2,
+    "LABEL_20": 20,
+    "LABEL_21": 21,
+    "LABEL_22": 22,
+    "LABEL_23": 23,
+    "LABEL_24": 24,
+    "LABEL_25": 25,
+    "LABEL_26": 26,
+    "LABEL_27": 27,
+    "LABEL_3": 3,
+    "LABEL_4": 4,
+    "LABEL_5": 5,
+    "LABEL_6": 6,
+    "LABEL_7": 7,
+    "LABEL_8": 8,
+    "LABEL_9": 9
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

run-6/checkpoint-68/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-6/checkpoint-68/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eb194a90f64cdadaf0548defc82f3f9d42bcb3e01e68c650558cc65aaafe26df
+size 498692800

run-6/checkpoint-68/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5de3f9a2fc39dc0aa541b3053ce17a42b08a2c097b88dabcf990b978add9b2e5
+size 997505402

run-6/checkpoint-68/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:af50c8be9865745d31c3ed67983d1179439e59589353b5e68f077457eee7cccc
+size 14308