jerawincel commited on Nov 29, 2023

Commit

2495de4

1 Parent(s): acf6433

Training in progress, epoch 1

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

model.safetensors +1 -1
run-2/checkpoint-272/config.json +87 -0
run-2/checkpoint-272/merges.txt +0 -0
run-2/checkpoint-272/model.safetensors +3 -0
run-2/checkpoint-272/optimizer.pt +3 -0
run-2/checkpoint-272/rng_state.pth +3 -0
run-2/checkpoint-272/scheduler.pt +3 -0
run-2/checkpoint-272/special_tokens_map.json +15 -0
run-2/checkpoint-272/tokenizer.json +0 -0
run-2/checkpoint-272/tokenizer_config.json +58 -0
run-2/checkpoint-272/trainer_state.json +42 -0
run-2/checkpoint-272/training_args.bin +3 -0
run-2/checkpoint-272/vocab.json +0 -0
run-2/checkpoint-408/config.json +87 -0
run-2/checkpoint-408/merges.txt +0 -0
run-2/checkpoint-408/model.safetensors +3 -0
run-2/checkpoint-408/optimizer.pt +3 -0
run-2/checkpoint-408/rng_state.pth +3 -0
run-2/checkpoint-408/scheduler.pt +3 -0
run-2/checkpoint-408/special_tokens_map.json +15 -0
run-2/checkpoint-408/tokenizer.json +0 -0
run-2/checkpoint-408/tokenizer_config.json +58 -0
run-2/checkpoint-408/trainer_state.json +51 -0
run-2/checkpoint-408/training_args.bin +3 -0
run-2/checkpoint-408/vocab.json +0 -0
run-2/checkpoint-544/config.json +87 -0
run-2/checkpoint-544/merges.txt +0 -0
run-2/checkpoint-544/model.safetensors +3 -0
run-2/checkpoint-544/optimizer.pt +3 -0
run-2/checkpoint-544/rng_state.pth +3 -0
run-2/checkpoint-544/scheduler.pt +3 -0
run-2/checkpoint-544/special_tokens_map.json +15 -0
run-2/checkpoint-544/tokenizer.json +0 -0
run-2/checkpoint-544/tokenizer_config.json +58 -0
run-2/checkpoint-544/trainer_state.json +66 -0
run-2/checkpoint-544/training_args.bin +3 -0
run-2/checkpoint-544/vocab.json +0 -0
run-3/checkpoint-272/model.safetensors +1 -1
run-3/checkpoint-272/optimizer.pt +1 -1
run-3/checkpoint-272/rng_state.pth +2 -2
run-3/checkpoint-272/scheduler.pt +1 -1
run-3/checkpoint-272/trainer_state.json +12 -21
run-3/checkpoint-272/training_args.bin +1 -1
run-3/checkpoint-544/model.safetensors +1 -1
run-3/checkpoint-544/optimizer.pt +1 -1
run-3/checkpoint-544/rng_state.pth +2 -2
run-3/checkpoint-544/scheduler.pt +1 -1
run-3/checkpoint-544/trainer_state.json +21 -39
run-3/checkpoint-544/training_args.bin +1 -1
runs/Nov29_08-36-19_ba63dc4ccc8a/events.out.tfevents.1701248867.ba63dc4ccc8a.1291.26 +3 -0

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3aa5bbd9d01dec8b7e71e53606089c393a6a8c958484b768f5305f75244aa175
 size 498692800

 version https://git-lfs.github.com/spec/v1
+oid sha256:fec49f3a0b2296e4d011156d27067cbc32d943744daa803b56c53b9ce1820e6d
 size 498692800

run-2/checkpoint-272/config.json ADDED Viewed

	@@ -0,0 +1,87 @@

+{
+  "_name_or_path": "roberta-base",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3",
+    "4": "LABEL_4",
+    "5": "LABEL_5",
+    "6": "LABEL_6",
+    "7": "LABEL_7",
+    "8": "LABEL_8",
+    "9": "LABEL_9",
+    "10": "LABEL_10",
+    "11": "LABEL_11",
+    "12": "LABEL_12",
+    "13": "LABEL_13",
+    "14": "LABEL_14",
+    "15": "LABEL_15",
+    "16": "LABEL_16",
+    "17": "LABEL_17",
+    "18": "LABEL_18",
+    "19": "LABEL_19",
+    "20": "LABEL_20",
+    "21": "LABEL_21",
+    "22": "LABEL_22",
+    "23": "LABEL_23",
+    "24": "LABEL_24",
+    "25": "LABEL_25",
+    "26": "LABEL_26",
+    "27": "LABEL_27"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_10": 10,
+    "LABEL_11": 11,
+    "LABEL_12": 12,
+    "LABEL_13": 13,
+    "LABEL_14": 14,
+    "LABEL_15": 15,
+    "LABEL_16": 16,
+    "LABEL_17": 17,
+    "LABEL_18": 18,
+    "LABEL_19": 19,
+    "LABEL_2": 2,
+    "LABEL_20": 20,
+    "LABEL_21": 21,
+    "LABEL_22": 22,
+    "LABEL_23": 23,
+    "LABEL_24": 24,
+    "LABEL_25": 25,
+    "LABEL_26": 26,
+    "LABEL_27": 27,
+    "LABEL_3": 3,
+    "LABEL_4": 4,
+    "LABEL_5": 5,
+    "LABEL_6": 6,
+    "LABEL_7": 7,
+    "LABEL_8": 8,
+    "LABEL_9": 9
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

run-2/checkpoint-272/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-2/checkpoint-272/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:46cd563207f13ad00c4a4136629b4acaddf357417a2d0781246bb9343bdf8fec
+size 498692800

run-2/checkpoint-272/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:61cc2bdaa84a6ff4d37e730529b3c96cd61ba11a87f74288b79ee1d7d0752f06
+size 997505402

run-2/checkpoint-272/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:101860b7624c5970c96a2aa296cfb8a02d2094abd45875d9bdc5199e5b10d090
+size 14308

run-2/checkpoint-272/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fa33883d32685fe9296b90ccd40b6bd4c2bcd00a8e51580508490626d3e95a05
+size 1064

run-2/checkpoint-272/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

run-2/checkpoint-272/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-2/checkpoint-272/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50264": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "errors": "replace",
+  "mask_token": "<mask>",
+  "model_max_length": 64,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "RobertaTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
+}

run-2/checkpoint-272/trainer_state.json ADDED Viewed

	@@ -0,0 +1,42 @@

+{
+  "best_metric": 0.0,
+  "best_model_checkpoint": "roberta-base-finetuned/run-2/checkpoint-136",
+  "epoch": 2.0,
+  "eval_steps": 500,
+  "global_step": 272,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_f1": 0.0,
+      "eval_loss": 0.16469642519950867,
+      "eval_runtime": 7.1826,
+      "eval_samples_per_second": 755.433,
+      "eval_steps_per_second": 5.987,
+      "step": 136
+    },
+    {
+      "epoch": 2.0,
+      "eval_f1": 0.0,
+      "eval_loss": 0.15205536782741547,
+      "eval_runtime": 7.2634,
+      "eval_samples_per_second": 747.028,
+      "eval_steps_per_second": 5.92,
+      "step": 272
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 544,
+  "num_train_epochs": 4,
+  "save_steps": 500,
+  "total_flos": 0,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 1.926138732305906e-05,
+    "num_train_epochs": 4,
+    "per_device_train_batch_size": 32,
+    "seed": 17
+  }
+}

run-2/checkpoint-272/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f8ce51cd4ed85cb1b73361ac4ad1622b2a30b61996e1e2ff676bdd08f4451b31
+size 4600

run-2/checkpoint-272/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-2/checkpoint-408/config.json ADDED Viewed

	@@ -0,0 +1,87 @@

+{
+  "_name_or_path": "roberta-base",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3",
+    "4": "LABEL_4",
+    "5": "LABEL_5",
+    "6": "LABEL_6",
+    "7": "LABEL_7",
+    "8": "LABEL_8",
+    "9": "LABEL_9",
+    "10": "LABEL_10",
+    "11": "LABEL_11",
+    "12": "LABEL_12",
+    "13": "LABEL_13",
+    "14": "LABEL_14",
+    "15": "LABEL_15",
+    "16": "LABEL_16",
+    "17": "LABEL_17",
+    "18": "LABEL_18",
+    "19": "LABEL_19",
+    "20": "LABEL_20",
+    "21": "LABEL_21",
+    "22": "LABEL_22",
+    "23": "LABEL_23",
+    "24": "LABEL_24",
+    "25": "LABEL_25",
+    "26": "LABEL_26",
+    "27": "LABEL_27"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_10": 10,
+    "LABEL_11": 11,
+    "LABEL_12": 12,
+    "LABEL_13": 13,
+    "LABEL_14": 14,
+    "LABEL_15": 15,
+    "LABEL_16": 16,
+    "LABEL_17": 17,
+    "LABEL_18": 18,
+    "LABEL_19": 19,
+    "LABEL_2": 2,
+    "LABEL_20": 20,
+    "LABEL_21": 21,
+    "LABEL_22": 22,
+    "LABEL_23": 23,
+    "LABEL_24": 24,
+    "LABEL_25": 25,
+    "LABEL_26": 26,
+    "LABEL_27": 27,
+    "LABEL_3": 3,
+    "LABEL_4": 4,
+    "LABEL_5": 5,
+    "LABEL_6": 6,
+    "LABEL_7": 7,
+    "LABEL_8": 8,
+    "LABEL_9": 9
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

run-2/checkpoint-408/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-2/checkpoint-408/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0b23c775983b2ac78067e9cc93bcdb74803afb3dabd4aea56ed787caa3a63375
+size 498692800

run-2/checkpoint-408/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:32e093ef5a37cde1885f2cd13cd26049a9713d7291d5f5778f111ba1c07f7362
+size 997505402

run-2/checkpoint-408/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:28ec960123b64d53301ab0c29adf76c1774104eed44f92e04822a5329ca86006
+size 14308

run-2/checkpoint-408/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2322e78bbdb7c8ef9bf17a3b071e2a1c21041232209cfe5d068037d1a10f7fa0
+size 1064

run-2/checkpoint-408/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

run-2/checkpoint-408/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-2/checkpoint-408/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50264": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "errors": "replace",
+  "mask_token": "<mask>",
+  "model_max_length": 64,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "RobertaTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
+}

run-2/checkpoint-408/trainer_state.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "best_metric": 0.004065676309616888,
+  "best_model_checkpoint": "roberta-base-finetuned/run-2/checkpoint-408",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 408,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_f1": 0.0,
+      "eval_loss": 0.16469642519950867,
+      "eval_runtime": 7.1826,
+      "eval_samples_per_second": 755.433,
+      "eval_steps_per_second": 5.987,
+      "step": 136
+    },
+    {
+      "epoch": 2.0,
+      "eval_f1": 0.0,
+      "eval_loss": 0.15205536782741547,
+      "eval_runtime": 7.2634,
+      "eval_samples_per_second": 747.028,
+      "eval_steps_per_second": 5.92,
+      "step": 272
+    },
+    {
+      "epoch": 3.0,
+      "eval_f1": 0.004065676309616888,
+      "eval_loss": 0.14375817775726318,
+      "eval_runtime": 7.2392,
+      "eval_samples_per_second": 749.535,
+      "eval_steps_per_second": 5.94,
+      "step": 408
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 544,
+  "num_train_epochs": 4,
+  "save_steps": 500,
+  "total_flos": 0,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 1.926138732305906e-05,
+    "num_train_epochs": 4,
+    "per_device_train_batch_size": 32,
+    "seed": 17
+  }
+}

run-2/checkpoint-408/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f8ce51cd4ed85cb1b73361ac4ad1622b2a30b61996e1e2ff676bdd08f4451b31
+size 4600

run-2/checkpoint-408/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-2/checkpoint-544/config.json ADDED Viewed

	@@ -0,0 +1,87 @@

+{
+  "_name_or_path": "roberta-base",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3",
+    "4": "LABEL_4",
+    "5": "LABEL_5",
+    "6": "LABEL_6",
+    "7": "LABEL_7",
+    "8": "LABEL_8",
+    "9": "LABEL_9",
+    "10": "LABEL_10",
+    "11": "LABEL_11",
+    "12": "LABEL_12",
+    "13": "LABEL_13",
+    "14": "LABEL_14",
+    "15": "LABEL_15",
+    "16": "LABEL_16",
+    "17": "LABEL_17",
+    "18": "LABEL_18",
+    "19": "LABEL_19",
+    "20": "LABEL_20",
+    "21": "LABEL_21",
+    "22": "LABEL_22",
+    "23": "LABEL_23",
+    "24": "LABEL_24",
+    "25": "LABEL_25",
+    "26": "LABEL_26",
+    "27": "LABEL_27"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_10": 10,
+    "LABEL_11": 11,
+    "LABEL_12": 12,
+    "LABEL_13": 13,
+    "LABEL_14": 14,
+    "LABEL_15": 15,
+    "LABEL_16": 16,
+    "LABEL_17": 17,
+    "LABEL_18": 18,
+    "LABEL_19": 19,
+    "LABEL_2": 2,
+    "LABEL_20": 20,
+    "LABEL_21": 21,
+    "LABEL_22": 22,
+    "LABEL_23": 23,
+    "LABEL_24": 24,
+    "LABEL_25": 25,
+    "LABEL_26": 26,
+    "LABEL_27": 27,
+    "LABEL_3": 3,
+    "LABEL_4": 4,
+    "LABEL_5": 5,
+    "LABEL_6": 6,
+    "LABEL_7": 7,
+    "LABEL_8": 8,
+    "LABEL_9": 9
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

run-2/checkpoint-544/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-2/checkpoint-544/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d06279b9d20621d0adfa9bd140405b4b8c77b92e56f32754e884054d0ef9cdcc
+size 498692800

run-2/checkpoint-544/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:955dbecd318598578ff4f1871ea478ef2bf743749a6eec8a74ba760f464b6f10
+size 997505402

run-2/checkpoint-544/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:959bb0bf8818f5735f7f12101fb540108c71e5ef2b95632a65efa3cb17d48161
+size 14308

run-2/checkpoint-544/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:192b1fd96dd73bebaac5316463458719eee3a1ea39f96327627fcc534568c37e
+size 1064

run-2/checkpoint-544/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

run-2/checkpoint-544/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-2/checkpoint-544/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50264": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "errors": "replace",
+  "mask_token": "<mask>",
+  "model_max_length": 64,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "RobertaTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
+}

run-2/checkpoint-544/trainer_state.json ADDED Viewed

	@@ -0,0 +1,66 @@

+{
+  "best_metric": 0.17824233255398156,
+  "best_model_checkpoint": "roberta-base-finetuned/run-2/checkpoint-544",
+  "epoch": 4.0,
+  "eval_steps": 500,
+  "global_step": 544,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_f1": 0.0,
+      "eval_loss": 0.16469642519950867,
+      "eval_runtime": 7.1826,
+      "eval_samples_per_second": 755.433,
+      "eval_steps_per_second": 5.987,
+      "step": 136
+    },
+    {
+      "epoch": 2.0,
+      "eval_f1": 0.0,
+      "eval_loss": 0.15205536782741547,
+      "eval_runtime": 7.2634,
+      "eval_samples_per_second": 747.028,
+      "eval_steps_per_second": 5.92,
+      "step": 272
+    },
+    {
+      "epoch": 3.0,
+      "eval_f1": 0.004065676309616888,
+      "eval_loss": 0.14375817775726318,
+      "eval_runtime": 7.2392,
+      "eval_samples_per_second": 749.535,
+      "eval_steps_per_second": 5.94,
+      "step": 408
+    },
+    {
+      "epoch": 3.68,
+      "learning_rate": 1.5579063276003652e-06,
+      "loss": 0.1843,
+      "step": 500
+    },
+    {
+      "epoch": 4.0,
+      "eval_f1": 0.17824233255398156,
+      "eval_loss": 0.14139315485954285,
+      "eval_runtime": 7.244,
+      "eval_samples_per_second": 749.033,
+      "eval_steps_per_second": 5.936,
+      "step": 544
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 544,
+  "num_train_epochs": 4,
+  "save_steps": 500,
+  "total_flos": 525259367388672.0,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 1.926138732305906e-05,
+    "num_train_epochs": 4,
+    "per_device_train_batch_size": 32,
+    "seed": 17
+  }
+}

run-2/checkpoint-544/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f8ce51cd4ed85cb1b73361ac4ad1622b2a30b61996e1e2ff676bdd08f4451b31
+size 4600

run-2/checkpoint-544/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-3/checkpoint-272/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d6434569cc25d7f86049ae7741255382edabf8fa518264194f349a4b17368b41
 size 498692800

 version https://git-lfs.github.com/spec/v1
+oid sha256:fec49f3a0b2296e4d011156d27067cbc32d943744daa803b56c53b9ce1820e6d
 size 498692800

run-3/checkpoint-272/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:197e099168db276ce460eb8a6dce54bbcc5341a7677ffbbb5e6fe73c252bfc5e
 size 997505402

 version https://git-lfs.github.com/spec/v1
+oid sha256:32802688230b2cca3f9e1a0a1db0bc0970bbc4a8132be3d86b2b86d3fd76da43
 size 997505402

run-3/checkpoint-272/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b32da7cbe3b600fd2457c969a5edd70b3539ce1948e49ebd6329cab0bb764a6a
-size 14308

 version https://git-lfs.github.com/spec/v1
+oid sha256:7627164f6a838ab6071d3af2f4c07c4ae2a8a7750ab699aa23e9b7b2754037c0
+size 14244

run-3/checkpoint-272/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d32047097ae2473850fc82af0458d66a4a7f517b83f45933631d8c2235a15bb2
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:6cbb06ded40b0bac91743e26822e9c4748c00cbfadf00fae5289f79eb8b9670d
 size 1064

run-3/checkpoint-272/trainer_state.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "best_metric": 0.0,
-  "best_model_checkpoint": "roberta-base-finetuned/run-3/checkpoint-136",
-  "epoch": 2.0,
   "eval_steps": 500,
   "global_step": 272,
   "is_hyper_param_search": true,
@@ -11,32 +11,23 @@
     {
       "epoch": 1.0,
       "eval_f1": 0.0,
-      "eval_loss": 0.2652469873428345,
-      "eval_runtime": 7.1726,
-      "eval_samples_per_second": 756.494,
-      "eval_steps_per_second": 5.995,
-      "step": 136
-    },
-    {
-      "epoch": 2.0,
-      "eval_f1": 0.0,
-      "eval_loss": 0.2119114100933075,
-      "eval_runtime": 7.1722,
-      "eval_samples_per_second": 756.534,
-      "eval_steps_per_second": 5.995,
       "step": 272
     }
   ],
   "logging_steps": 500,
-  "max_steps": 544,
-  "num_train_epochs": 4,
   "save_steps": 500,
   "total_flos": 0,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 5.397452827124417e-06,
-    "num_train_epochs": 4,
-    "per_device_train_batch_size": 32,
-    "seed": 31
   }
 }

 {
   "best_metric": 0.0,
+  "best_model_checkpoint": "roberta-base-finetuned/run-3/checkpoint-272",
+  "epoch": 1.0,
   "eval_steps": 500,
   "global_step": 272,
   "is_hyper_param_search": true,
     {
       "epoch": 1.0,
       "eval_f1": 0.0,
+      "eval_loss": 0.2641439437866211,
+      "eval_runtime": 7.1825,
+      "eval_samples_per_second": 755.446,
+      "eval_steps_per_second": 5.987,
       "step": 272
     }
   ],
   "logging_steps": 500,
+  "max_steps": 1360,
+  "num_train_epochs": 5,
   "save_steps": 500,
   "total_flos": 0,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 2.4573800348719033e-06,
+    "num_train_epochs": 5,
+    "per_device_train_batch_size": 16,
+    "seed": 4
   }
 }

run-3/checkpoint-272/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8d637b1a3992216bd20d5154e652d7b76a207e651e512412a90c5c093c69e77f
 size 4600

 version https://git-lfs.github.com/spec/v1
+oid sha256:cedcfdbe7c29e6f37dca0518c3a22279de6ad973240451544d5c9e7a0a75ce08
 size 4600

run-3/checkpoint-544/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:638ac615b1c5b44c87ed34654616c8e0acb5dd98e27ec55b4fe2fc58aca5c930
 size 498692800

 version https://git-lfs.github.com/spec/v1
+oid sha256:cdfce8f3032cbd8c4b0d74efef2735f8539055bec09a2233011c4eb0d661e48f
 size 498692800

run-3/checkpoint-544/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2f23a0fa606516f4132ee3335ad7baeaa1652985f8f1b65e0572f98d98c0fbcd
 size 997505402

 version https://git-lfs.github.com/spec/v1
+oid sha256:c24a56a0800a902724dc7c0b7f22b58754ff27f598a27152cb285236b7902db9
 size 997505402

run-3/checkpoint-544/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7de9e0ab1219ccc503123b8db841ec73510fd83da46358e56fdaba48b1908daf
-size 14308

 version https://git-lfs.github.com/spec/v1
+oid sha256:14d8096c7b42f07796058e655ef84962bca1678f371ed9f7de40e1ebded0bb8e
+size 14244

run-3/checkpoint-544/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a3c8c6b03dc187cd039317a54f71eaeebd325f09b8013b6b13be3cebff7431f2
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:a9f0956cfc7c916e4166a8d12e1f1101bc4cdef22391f28eb944635360adca66
 size 1064

run-3/checkpoint-544/trainer_state.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "best_metric": 0.0,
-  "best_model_checkpoint": "roberta-base-finetuned/run-3/checkpoint-136",
-  "epoch": 4.0,
   "eval_steps": 500,
   "global_step": 544,
   "is_hyper_param_search": true,
@@ -11,56 +11,38 @@
     {
       "epoch": 1.0,
       "eval_f1": 0.0,
-      "eval_loss": 0.2652469873428345,
-      "eval_runtime": 7.1726,
-      "eval_samples_per_second": 756.494,
-      "eval_steps_per_second": 5.995,
-      "step": 136
-    },
-    {
-      "epoch": 2.0,
-      "eval_f1": 0.0,
-      "eval_loss": 0.2119114100933075,
-      "eval_runtime": 7.1722,
-      "eval_samples_per_second": 756.534,
-      "eval_steps_per_second": 5.995,
       "step": 272
     },
     {
-      "epoch": 3.0,
-      "eval_f1": 0.0,
-      "eval_loss": 0.1938687562942505,
-      "eval_runtime": 7.5895,
-      "eval_samples_per_second": 714.934,
-      "eval_steps_per_second": 5.666,
-      "step": 408
-    },
-    {
-      "epoch": 3.68,
-      "learning_rate": 4.365586845468279e-07,
-      "loss": 0.2783,
       "step": 500
     },
     {
-      "epoch": 4.0,
       "eval_f1": 0.0,
-      "eval_loss": 0.18911533057689667,
-      "eval_runtime": 7.2038,
-      "eval_samples_per_second": 753.216,
-      "eval_steps_per_second": 5.969,
       "step": 544
     }
   ],
   "logging_steps": 500,
-  "max_steps": 544,
-  "num_train_epochs": 4,
   "save_steps": 500,
-  "total_flos": 525259367388672.0,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 5.397452827124417e-06,
-    "num_train_epochs": 4,
-    "per_device_train_batch_size": 32,
-    "seed": 31
   }
 }

 {
   "best_metric": 0.0,
+  "best_model_checkpoint": "roberta-base-finetuned/run-3/checkpoint-272",
+  "epoch": 2.0,
   "eval_steps": 500,
   "global_step": 544,
   "is_hyper_param_search": true,
     {
       "epoch": 1.0,
       "eval_f1": 0.0,
+      "eval_loss": 0.2641439437866211,
+      "eval_runtime": 7.1825,
+      "eval_samples_per_second": 755.446,
+      "eval_steps_per_second": 5.987,
       "step": 272
     },
     {
+      "epoch": 1.84,
+      "learning_rate": 1.5539314926395858e-06,
+      "loss": 0.3433,
       "step": 500
     },
     {
+      "epoch": 2.0,
       "eval_f1": 0.0,
+      "eval_loss": 0.21300381422042847,
+      "eval_runtime": 7.2308,
+      "eval_samples_per_second": 750.406,
+      "eval_steps_per_second": 5.947,
       "step": 544
     }
   ],
   "logging_steps": 500,
+  "max_steps": 1360,
+  "num_train_epochs": 5,
   "save_steps": 500,
+  "total_flos": 262810614772224.0,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 2.4573800348719033e-06,
+    "num_train_epochs": 5,
+    "per_device_train_batch_size": 16,
+    "seed": 4
   }
 }

run-3/checkpoint-544/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8d637b1a3992216bd20d5154e652d7b76a207e651e512412a90c5c093c69e77f
 size 4600

 version https://git-lfs.github.com/spec/v1
+oid sha256:cedcfdbe7c29e6f37dca0518c3a22279de6ad973240451544d5c9e7a0a75ce08
 size 4600

runs/Nov29_08-36-19_ba63dc4ccc8a/events.out.tfevents.1701248867.ba63dc4ccc8a.1291.26 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:12d5d2a0b05a38e8bc51baa184352d32132def18ae0d12be19896ad579581090
+size 7674