itsjustahobby commited on May 22, 2025

Commit

3bbae2a

verified ·

1 Parent(s): d3e6786

init

Browse files

Files changed (40) hide show

checkpoint-12874/config.json +35 -0
checkpoint-12874/model.safetensors +3 -0
checkpoint-12874/optimizer.pt +3 -0
checkpoint-12874/rng_state.pth +3 -0
checkpoint-12874/scheduler.pt +3 -0
checkpoint-12874/special_tokens_map.json +37 -0
checkpoint-12874/tokenizer.json +0 -0
checkpoint-12874/tokenizer_config.json +56 -0
checkpoint-12874/trainer_state.json +218 -0
checkpoint-12874/training_args.bin +3 -0
checkpoint-12874/vocab.txt +0 -0
checkpoint-25748/config.json +35 -0
checkpoint-25748/model.safetensors +3 -0
checkpoint-25748/optimizer.pt +3 -0
checkpoint-25748/rng_state.pth +3 -0
checkpoint-25748/scheduler.pt +3 -0
checkpoint-25748/special_tokens_map.json +37 -0
checkpoint-25748/tokenizer.json +0 -0
checkpoint-25748/tokenizer_config.json +56 -0
checkpoint-25748/trainer_state.json +410 -0
checkpoint-25748/training_args.bin +3 -0
checkpoint-25748/vocab.txt +0 -0
checkpoint-38622/config.json +35 -0
checkpoint-38622/model.safetensors +3 -0
checkpoint-38622/optimizer.pt +3 -0
checkpoint-38622/rng_state.pth +3 -0
checkpoint-38622/scheduler.pt +3 -0
checkpoint-38622/special_tokens_map.json +37 -0
checkpoint-38622/tokenizer.json +0 -0
checkpoint-38622/tokenizer_config.json +56 -0
checkpoint-38622/trainer_state.json +602 -0
checkpoint-38622/training_args.bin +3 -0
checkpoint-38622/vocab.txt +0 -0
config.json +35 -0
model.safetensors +3 -0
special_tokens_map.json +37 -0
tokenizer.json +0 -0
tokenizer_config.json +56 -0
training_args.bin +3 -0
vocab.txt +0 -0

checkpoint-12874/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "ealvaradob/bert-finetuned-phishing",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "Safe",
+    "1": "Not Safe"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "label2id": {
+    "Not Safe": 1,
+    "Safe": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.49.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

checkpoint-12874/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cb1eebf35bf97c37b96deb08b43410f3070dc8adf9bc3a1f6a791a1122271f97
+size 1340622760

checkpoint-12874/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3b9f7fd4f604e0db92cb9197aa7aef6ab66d20190d825a2d2dd49b95edf2bce7
+size 8417490

checkpoint-12874/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cf15cecb8b6f939a46f8aaa638b5573fcede1102b1ff7a5aed511feeefcff036
+size 13990

checkpoint-12874/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a714272fcaa73a8f1fe0353a366968a5fc542da16927474a59ff8646ef228806
+size 1064

checkpoint-12874/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "cls_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "[MASK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "[PAD]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

checkpoint-12874/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-12874/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

checkpoint-12874/trainer_state.json ADDED Viewed

	@@ -0,0 +1,218 @@

+{
+  "best_metric": 0.35238268971443176,
+  "best_model_checkpoint": "AthenaMailGuard_v1\\checkpoint-12874",
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 12874,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.03883796799751437,
+      "grad_norm": 1.689921498298645,
+      "learning_rate": 1.9741080213349905e-05,
+      "loss": 0.8085,
+      "step": 500
+    },
+    {
+      "epoch": 0.07767593599502874,
+      "grad_norm": 2.86164927482605,
+      "learning_rate": 1.9482160426699808e-05,
+      "loss": 0.4984,
+      "step": 1000
+    },
+    {
+      "epoch": 0.1165139039925431,
+      "grad_norm": 1.5302910804748535,
+      "learning_rate": 1.9223240640049715e-05,
+      "loss": 0.458,
+      "step": 1500
+    },
+    {
+      "epoch": 0.15535187199005748,
+      "grad_norm": 1.5691194534301758,
+      "learning_rate": 1.8964320853399618e-05,
+      "loss": 0.4565,
+      "step": 2000
+    },
+    {
+      "epoch": 0.19418983998757186,
+      "grad_norm": 2.1296744346618652,
+      "learning_rate": 1.870540106674952e-05,
+      "loss": 0.4509,
+      "step": 2500
+    },
+    {
+      "epoch": 0.2330278079850862,
+      "grad_norm": 2.2671611309051514,
+      "learning_rate": 1.8446481280099425e-05,
+      "loss": 0.4319,
+      "step": 3000
+    },
+    {
+      "epoch": 0.2718657759826006,
+      "grad_norm": 2.0699307918548584,
+      "learning_rate": 1.818756149344933e-05,
+      "loss": 0.4255,
+      "step": 3500
+    },
+    {
+      "epoch": 0.31070374398011497,
+      "grad_norm": 2.077923536300659,
+      "learning_rate": 1.7928641706799235e-05,
+      "loss": 0.4261,
+      "step": 4000
+    },
+    {
+      "epoch": 0.34954171197762934,
+      "grad_norm": 2.9680869579315186,
+      "learning_rate": 1.7669721920149138e-05,
+      "loss": 0.4248,
+      "step": 4500
+    },
+    {
+      "epoch": 0.3883796799751437,
+      "grad_norm": 2.7073068618774414,
+      "learning_rate": 1.741080213349904e-05,
+      "loss": 0.4228,
+      "step": 5000
+    },
+    {
+      "epoch": 0.42721764797265804,
+      "grad_norm": 1.9255578517913818,
+      "learning_rate": 1.7151882346848948e-05,
+      "loss": 0.4108,
+      "step": 5500
+    },
+    {
+      "epoch": 0.4660556159701724,
+      "grad_norm": 2.937633752822876,
+      "learning_rate": 1.689296256019885e-05,
+      "loss": 0.4188,
+      "step": 6000
+    },
+    {
+      "epoch": 0.5048935839676868,
+      "grad_norm": 4.763959884643555,
+      "learning_rate": 1.6634042773548755e-05,
+      "loss": 0.4149,
+      "step": 6500
+    },
+    {
+      "epoch": 0.5437315519652012,
+      "grad_norm": 1.7722175121307373,
+      "learning_rate": 1.6375122986898658e-05,
+      "loss": 0.4051,
+      "step": 7000
+    },
+    {
+      "epoch": 0.5825695199627156,
+      "grad_norm": 1.5043563842773438,
+      "learning_rate": 1.6116203200248565e-05,
+      "loss": 0.4079,
+      "step": 7500
+    },
+    {
+      "epoch": 0.6214074879602299,
+      "grad_norm": 3.100849151611328,
+      "learning_rate": 1.5857283413598468e-05,
+      "loss": 0.3983,
+      "step": 8000
+    },
+    {
+      "epoch": 0.6602454559577443,
+      "grad_norm": 2.095817804336548,
+      "learning_rate": 1.559836362694837e-05,
+      "loss": 0.4214,
+      "step": 8500
+    },
+    {
+      "epoch": 0.6990834239552587,
+      "grad_norm": 1.558356523513794,
+      "learning_rate": 1.5339443840298275e-05,
+      "loss": 0.4203,
+      "step": 9000
+    },
+    {
+      "epoch": 0.7379213919527731,
+      "grad_norm": 4.565003871917725,
+      "learning_rate": 1.508052405364818e-05,
+      "loss": 0.4049,
+      "step": 9500
+    },
+    {
+      "epoch": 0.7767593599502874,
+      "grad_norm": 2.9373462200164795,
+      "learning_rate": 1.4821604266998085e-05,
+      "loss": 0.4091,
+      "step": 10000
+    },
+    {
+      "epoch": 0.8155973279478018,
+      "grad_norm": 1.9515178203582764,
+      "learning_rate": 1.4562684480347988e-05,
+      "loss": 0.4121,
+      "step": 10500
+    },
+    {
+      "epoch": 0.8544352959453161,
+      "grad_norm": 2.4346730709075928,
+      "learning_rate": 1.4303764693697895e-05,
+      "loss": 0.4155,
+      "step": 11000
+    },
+    {
+      "epoch": 0.8932732639428305,
+      "grad_norm": 1.920275330543518,
+      "learning_rate": 1.4044844907047798e-05,
+      "loss": 0.4051,
+      "step": 11500
+    },
+    {
+      "epoch": 0.9321112319403448,
+      "grad_norm": 0.8134564757347107,
+      "learning_rate": 1.3785925120397703e-05,
+      "loss": 0.4115,
+      "step": 12000
+    },
+    {
+      "epoch": 0.9709491999378592,
+      "grad_norm": 1.6996334791183472,
+      "learning_rate": 1.3527005333747607e-05,
+      "loss": 0.4134,
+      "step": 12500
+    },
+    {
+      "epoch": 1.0,
+      "eval_AUC": 0.919,
+      "eval_Accuracy": 0.871,
+      "eval_loss": 0.35238268971443176,
+      "eval_runtime": 9979.0139,
+      "eval_samples_per_second": 2.293,
+      "eval_steps_per_second": 0.143,
+      "step": 12874
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 38622,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 1.919517667673948e+17,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-12874/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9ef81828047111fb8469f346d2515430f70d6821251e87dd33c6c643512ff318
+size 5368

checkpoint-12874/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-25748/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "ealvaradob/bert-finetuned-phishing",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "Safe",
+    "1": "Not Safe"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "label2id": {
+    "Not Safe": 1,
+    "Safe": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.49.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

checkpoint-25748/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5c66ce3800a16bc03ebfa6c05ab86423c99cf5a999483c2e47c90869964668d4
+size 1340622760

checkpoint-25748/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:781b20d4ed2c3da4e6c41f44ac992719eb72949495ae648628c769baabd1571b
+size 8417490

checkpoint-25748/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:71f7cba9396e8d95aec4f0c8d573c1ba347964f5dce317e1c247a91e3c2ce809
+size 13990

checkpoint-25748/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0b1f1471b4ed4d74d245739229a192e925719c064d39460cfad51fcf9c830bd9
+size 1064

checkpoint-25748/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "cls_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "[MASK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "[PAD]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

checkpoint-25748/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-25748/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

checkpoint-25748/trainer_state.json ADDED Viewed

	@@ -0,0 +1,410 @@

+{
+  "best_metric": 0.35110267996788025,
+  "best_model_checkpoint": "AthenaMailGuard_v1\\checkpoint-25748",
+  "epoch": 2.0,
+  "eval_steps": 500,
+  "global_step": 25748,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.03883796799751437,
+      "grad_norm": 1.689921498298645,
+      "learning_rate": 1.9741080213349905e-05,
+      "loss": 0.8085,
+      "step": 500
+    },
+    {
+      "epoch": 0.07767593599502874,
+      "grad_norm": 2.86164927482605,
+      "learning_rate": 1.9482160426699808e-05,
+      "loss": 0.4984,
+      "step": 1000
+    },
+    {
+      "epoch": 0.1165139039925431,
+      "grad_norm": 1.5302910804748535,
+      "learning_rate": 1.9223240640049715e-05,
+      "loss": 0.458,
+      "step": 1500
+    },
+    {
+      "epoch": 0.15535187199005748,
+      "grad_norm": 1.5691194534301758,
+      "learning_rate": 1.8964320853399618e-05,
+      "loss": 0.4565,
+      "step": 2000
+    },
+    {
+      "epoch": 0.19418983998757186,
+      "grad_norm": 2.1296744346618652,
+      "learning_rate": 1.870540106674952e-05,
+      "loss": 0.4509,
+      "step": 2500
+    },
+    {
+      "epoch": 0.2330278079850862,
+      "grad_norm": 2.2671611309051514,
+      "learning_rate": 1.8446481280099425e-05,
+      "loss": 0.4319,
+      "step": 3000
+    },
+    {
+      "epoch": 0.2718657759826006,
+      "grad_norm": 2.0699307918548584,
+      "learning_rate": 1.818756149344933e-05,
+      "loss": 0.4255,
+      "step": 3500
+    },
+    {
+      "epoch": 0.31070374398011497,
+      "grad_norm": 2.077923536300659,
+      "learning_rate": 1.7928641706799235e-05,
+      "loss": 0.4261,
+      "step": 4000
+    },
+    {
+      "epoch": 0.34954171197762934,
+      "grad_norm": 2.9680869579315186,
+      "learning_rate": 1.7669721920149138e-05,
+      "loss": 0.4248,
+      "step": 4500
+    },
+    {
+      "epoch": 0.3883796799751437,
+      "grad_norm": 2.7073068618774414,
+      "learning_rate": 1.741080213349904e-05,
+      "loss": 0.4228,
+      "step": 5000
+    },
+    {
+      "epoch": 0.42721764797265804,
+      "grad_norm": 1.9255578517913818,
+      "learning_rate": 1.7151882346848948e-05,
+      "loss": 0.4108,
+      "step": 5500
+    },
+    {
+      "epoch": 0.4660556159701724,
+      "grad_norm": 2.937633752822876,
+      "learning_rate": 1.689296256019885e-05,
+      "loss": 0.4188,
+      "step": 6000
+    },
+    {
+      "epoch": 0.5048935839676868,
+      "grad_norm": 4.763959884643555,
+      "learning_rate": 1.6634042773548755e-05,
+      "loss": 0.4149,
+      "step": 6500
+    },
+    {
+      "epoch": 0.5437315519652012,
+      "grad_norm": 1.7722175121307373,
+      "learning_rate": 1.6375122986898658e-05,
+      "loss": 0.4051,
+      "step": 7000
+    },
+    {
+      "epoch": 0.5825695199627156,
+      "grad_norm": 1.5043563842773438,
+      "learning_rate": 1.6116203200248565e-05,
+      "loss": 0.4079,
+      "step": 7500
+    },
+    {
+      "epoch": 0.6214074879602299,
+      "grad_norm": 3.100849151611328,
+      "learning_rate": 1.5857283413598468e-05,
+      "loss": 0.3983,
+      "step": 8000
+    },
+    {
+      "epoch": 0.6602454559577443,
+      "grad_norm": 2.095817804336548,
+      "learning_rate": 1.559836362694837e-05,
+      "loss": 0.4214,
+      "step": 8500
+    },
+    {
+      "epoch": 0.6990834239552587,
+      "grad_norm": 1.558356523513794,
+      "learning_rate": 1.5339443840298275e-05,
+      "loss": 0.4203,
+      "step": 9000
+    },
+    {
+      "epoch": 0.7379213919527731,
+      "grad_norm": 4.565003871917725,
+      "learning_rate": 1.508052405364818e-05,
+      "loss": 0.4049,
+      "step": 9500
+    },
+    {
+      "epoch": 0.7767593599502874,
+      "grad_norm": 2.9373462200164795,
+      "learning_rate": 1.4821604266998085e-05,
+      "loss": 0.4091,
+      "step": 10000
+    },
+    {
+      "epoch": 0.8155973279478018,
+      "grad_norm": 1.9515178203582764,
+      "learning_rate": 1.4562684480347988e-05,
+      "loss": 0.4121,
+      "step": 10500
+    },
+    {
+      "epoch": 0.8544352959453161,
+      "grad_norm": 2.4346730709075928,
+      "learning_rate": 1.4303764693697895e-05,
+      "loss": 0.4155,
+      "step": 11000
+    },
+    {
+      "epoch": 0.8932732639428305,
+      "grad_norm": 1.920275330543518,
+      "learning_rate": 1.4044844907047798e-05,
+      "loss": 0.4051,
+      "step": 11500
+    },
+    {
+      "epoch": 0.9321112319403448,
+      "grad_norm": 0.8134564757347107,
+      "learning_rate": 1.3785925120397703e-05,
+      "loss": 0.4115,
+      "step": 12000
+    },
+    {
+      "epoch": 0.9709491999378592,
+      "grad_norm": 1.6996334791183472,
+      "learning_rate": 1.3527005333747607e-05,
+      "loss": 0.4134,
+      "step": 12500
+    },
+    {
+      "epoch": 1.0,
+      "eval_AUC": 0.919,
+      "eval_Accuracy": 0.871,
+      "eval_loss": 0.35238268971443176,
+      "eval_runtime": 9979.0139,
+      "eval_samples_per_second": 2.293,
+      "eval_steps_per_second": 0.143,
+      "step": 12874
+    },
+    {
+      "epoch": 1.0097871679353736,
+      "grad_norm": 1.933709740638733,
+      "learning_rate": 1.3268085547097512e-05,
+      "loss": 0.412,
+      "step": 13000
+    },
+    {
+      "epoch": 1.048625135932888,
+      "grad_norm": 1.2826268672943115,
+      "learning_rate": 1.3009165760447415e-05,
+      "loss": 0.4033,
+      "step": 13500
+    },
+    {
+      "epoch": 1.0874631039304024,
+      "grad_norm": 2.6913065910339355,
+      "learning_rate": 1.275024597379732e-05,
+      "loss": 0.4137,
+      "step": 14000
+    },
+    {
+      "epoch": 1.1263010719279167,
+      "grad_norm": 3.0463294982910156,
+      "learning_rate": 1.2491326187147223e-05,
+      "loss": 0.4045,
+      "step": 14500
+    },
+    {
+      "epoch": 1.165139039925431,
+      "grad_norm": 1.5197412967681885,
+      "learning_rate": 1.2232406400497128e-05,
+      "loss": 0.4023,
+      "step": 15000
+    },
+    {
+      "epoch": 1.2039770079229455,
+      "grad_norm": 2.334850788116455,
+      "learning_rate": 1.1973486613847032e-05,
+      "loss": 0.4076,
+      "step": 15500
+    },
+    {
+      "epoch": 1.2428149759204599,
+      "grad_norm": 3.974278211593628,
+      "learning_rate": 1.1714566827196937e-05,
+      "loss": 0.4071,
+      "step": 16000
+    },
+    {
+      "epoch": 1.2816529439179742,
+      "grad_norm": 1.8683360815048218,
+      "learning_rate": 1.145564704054684e-05,
+      "loss": 0.4101,
+      "step": 16500
+    },
+    {
+      "epoch": 1.3204909119154886,
+      "grad_norm": 2.1151626110076904,
+      "learning_rate": 1.1196727253896745e-05,
+      "loss": 0.3948,
+      "step": 17000
+    },
+    {
+      "epoch": 1.359328879913003,
+      "grad_norm": 1.7954820394515991,
+      "learning_rate": 1.0937807467246648e-05,
+      "loss": 0.4095,
+      "step": 17500
+    },
+    {
+      "epoch": 1.3981668479105174,
+      "grad_norm": 1.9576789140701294,
+      "learning_rate": 1.0678887680596553e-05,
+      "loss": 0.3987,
+      "step": 18000
+    },
+    {
+      "epoch": 1.4370048159080318,
+      "grad_norm": 1.471616268157959,
+      "learning_rate": 1.0419967893946456e-05,
+      "loss": 0.4122,
+      "step": 18500
+    },
+    {
+      "epoch": 1.4758427839055461,
+      "grad_norm": 1.507846713066101,
+      "learning_rate": 1.0161048107296361e-05,
+      "loss": 0.3869,
+      "step": 19000
+    },
+    {
+      "epoch": 1.5146807519030605,
+      "grad_norm": 1.9979530572891235,
+      "learning_rate": 9.902128320646265e-06,
+      "loss": 0.3949,
+      "step": 19500
+    },
+    {
+      "epoch": 1.5535187199005747,
+      "grad_norm": 1.022186040878296,
+      "learning_rate": 9.643208533996168e-06,
+      "loss": 0.4082,
+      "step": 20000
+    },
+    {
+      "epoch": 1.5923566878980893,
+      "grad_norm": 1.725373387336731,
+      "learning_rate": 9.384288747346073e-06,
+      "loss": 0.3983,
+      "step": 20500
+    },
+    {
+      "epoch": 1.6311946558956034,
+      "grad_norm": 1.8882161378860474,
+      "learning_rate": 9.125368960695976e-06,
+      "loss": 0.3913,
+      "step": 21000
+    },
+    {
+      "epoch": 1.670032623893118,
+      "grad_norm": 1.6501694917678833,
+      "learning_rate": 8.866449174045881e-06,
+      "loss": 0.3967,
+      "step": 21500
+    },
+    {
+      "epoch": 1.7088705918906322,
+      "grad_norm": 3.191229820251465,
+      "learning_rate": 8.607529387395785e-06,
+      "loss": 0.4047,
+      "step": 22000
+    },
+    {
+      "epoch": 1.7477085598881468,
+      "grad_norm": 2.09586763381958,
+      "learning_rate": 8.34860960074569e-06,
+      "loss": 0.4066,
+      "step": 22500
+    },
+    {
+      "epoch": 1.786546527885661,
+      "grad_norm": 4.569416522979736,
+      "learning_rate": 8.089689814095593e-06,
+      "loss": 0.4041,
+      "step": 23000
+    },
+    {
+      "epoch": 1.8253844958831755,
+      "grad_norm": 1.9049654006958008,
+      "learning_rate": 7.830770027445498e-06,
+      "loss": 0.4007,
+      "step": 23500
+    },
+    {
+      "epoch": 1.8642224638806897,
+      "grad_norm": 2.03849720954895,
+      "learning_rate": 7.571850240795402e-06,
+      "loss": 0.4049,
+      "step": 24000
+    },
+    {
+      "epoch": 1.9030604318782043,
+      "grad_norm": 2.5075671672821045,
+      "learning_rate": 7.3129304541453064e-06,
+      "loss": 0.3868,
+      "step": 24500
+    },
+    {
+      "epoch": 1.9418983998757184,
+      "grad_norm": 3.445219039916992,
+      "learning_rate": 7.054010667495211e-06,
+      "loss": 0.4054,
+      "step": 25000
+    },
+    {
+      "epoch": 1.9807363678732328,
+      "grad_norm": 4.2253923416137695,
+      "learning_rate": 6.795090880845115e-06,
+      "loss": 0.414,
+      "step": 25500
+    },
+    {
+      "epoch": 2.0,
+      "eval_AUC": 0.924,
+      "eval_Accuracy": 0.873,
+      "eval_loss": 0.35110267996788025,
+      "eval_runtime": 9961.9295,
+      "eval_samples_per_second": 2.297,
+      "eval_steps_per_second": 0.144,
+      "step": 25748
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 38622,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 3.839035335347896e+17,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-25748/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9ef81828047111fb8469f346d2515430f70d6821251e87dd33c6c643512ff318
+size 5368

checkpoint-25748/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-38622/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "ealvaradob/bert-finetuned-phishing",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "Safe",
+    "1": "Not Safe"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "label2id": {
+    "Not Safe": 1,
+    "Safe": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.49.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

checkpoint-38622/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba3c2727fcc23a9001aab178b34a1ce73252b99bb58532e714eefe58721bdddd
+size 1340622760

checkpoint-38622/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:75341253afbafa1b9bb1318953be5d34479d5dbd5d84c1a353146fa676218653
+size 8417490

checkpoint-38622/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f91e3d97ebfd547b5661095ce14603636948432cd2fb8c236ce86bdd52eb256a
+size 13990

checkpoint-38622/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fc1872477825a5d08b958f06ff8baa9c7d19b0bfccdea29596dd86add24e9574
+size 1064

checkpoint-38622/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "cls_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "[MASK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "[PAD]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

checkpoint-38622/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-38622/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

checkpoint-38622/trainer_state.json ADDED Viewed

	@@ -0,0 +1,602 @@

+{
+  "best_metric": 0.342347651720047,
+  "best_model_checkpoint": "AthenaMailGuard_v1\\checkpoint-38622",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 38622,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.03883796799751437,
+      "grad_norm": 1.689921498298645,
+      "learning_rate": 1.9741080213349905e-05,
+      "loss": 0.8085,
+      "step": 500
+    },
+    {
+      "epoch": 0.07767593599502874,
+      "grad_norm": 2.86164927482605,
+      "learning_rate": 1.9482160426699808e-05,
+      "loss": 0.4984,
+      "step": 1000
+    },
+    {
+      "epoch": 0.1165139039925431,
+      "grad_norm": 1.5302910804748535,
+      "learning_rate": 1.9223240640049715e-05,
+      "loss": 0.458,
+      "step": 1500
+    },
+    {
+      "epoch": 0.15535187199005748,
+      "grad_norm": 1.5691194534301758,
+      "learning_rate": 1.8964320853399618e-05,
+      "loss": 0.4565,
+      "step": 2000
+    },
+    {
+      "epoch": 0.19418983998757186,
+      "grad_norm": 2.1296744346618652,
+      "learning_rate": 1.870540106674952e-05,
+      "loss": 0.4509,
+      "step": 2500
+    },
+    {
+      "epoch": 0.2330278079850862,
+      "grad_norm": 2.2671611309051514,
+      "learning_rate": 1.8446481280099425e-05,
+      "loss": 0.4319,
+      "step": 3000
+    },
+    {
+      "epoch": 0.2718657759826006,
+      "grad_norm": 2.0699307918548584,
+      "learning_rate": 1.818756149344933e-05,
+      "loss": 0.4255,
+      "step": 3500
+    },
+    {
+      "epoch": 0.31070374398011497,
+      "grad_norm": 2.077923536300659,
+      "learning_rate": 1.7928641706799235e-05,
+      "loss": 0.4261,
+      "step": 4000
+    },
+    {
+      "epoch": 0.34954171197762934,
+      "grad_norm": 2.9680869579315186,
+      "learning_rate": 1.7669721920149138e-05,
+      "loss": 0.4248,
+      "step": 4500
+    },
+    {
+      "epoch": 0.3883796799751437,
+      "grad_norm": 2.7073068618774414,
+      "learning_rate": 1.741080213349904e-05,
+      "loss": 0.4228,
+      "step": 5000
+    },
+    {
+      "epoch": 0.42721764797265804,
+      "grad_norm": 1.9255578517913818,
+      "learning_rate": 1.7151882346848948e-05,
+      "loss": 0.4108,
+      "step": 5500
+    },
+    {
+      "epoch": 0.4660556159701724,
+      "grad_norm": 2.937633752822876,
+      "learning_rate": 1.689296256019885e-05,
+      "loss": 0.4188,
+      "step": 6000
+    },
+    {
+      "epoch": 0.5048935839676868,
+      "grad_norm": 4.763959884643555,
+      "learning_rate": 1.6634042773548755e-05,
+      "loss": 0.4149,
+      "step": 6500
+    },
+    {
+      "epoch": 0.5437315519652012,
+      "grad_norm": 1.7722175121307373,
+      "learning_rate": 1.6375122986898658e-05,
+      "loss": 0.4051,
+      "step": 7000
+    },
+    {
+      "epoch": 0.5825695199627156,
+      "grad_norm": 1.5043563842773438,
+      "learning_rate": 1.6116203200248565e-05,
+      "loss": 0.4079,
+      "step": 7500
+    },
+    {
+      "epoch": 0.6214074879602299,
+      "grad_norm": 3.100849151611328,
+      "learning_rate": 1.5857283413598468e-05,
+      "loss": 0.3983,
+      "step": 8000
+    },
+    {
+      "epoch": 0.6602454559577443,
+      "grad_norm": 2.095817804336548,
+      "learning_rate": 1.559836362694837e-05,
+      "loss": 0.4214,
+      "step": 8500
+    },
+    {
+      "epoch": 0.6990834239552587,
+      "grad_norm": 1.558356523513794,
+      "learning_rate": 1.5339443840298275e-05,
+      "loss": 0.4203,
+      "step": 9000
+    },
+    {
+      "epoch": 0.7379213919527731,
+      "grad_norm": 4.565003871917725,
+      "learning_rate": 1.508052405364818e-05,
+      "loss": 0.4049,
+      "step": 9500
+    },
+    {
+      "epoch": 0.7767593599502874,
+      "grad_norm": 2.9373462200164795,
+      "learning_rate": 1.4821604266998085e-05,
+      "loss": 0.4091,
+      "step": 10000
+    },
+    {
+      "epoch": 0.8155973279478018,
+      "grad_norm": 1.9515178203582764,
+      "learning_rate": 1.4562684480347988e-05,
+      "loss": 0.4121,
+      "step": 10500
+    },
+    {
+      "epoch": 0.8544352959453161,
+      "grad_norm": 2.4346730709075928,
+      "learning_rate": 1.4303764693697895e-05,
+      "loss": 0.4155,
+      "step": 11000
+    },
+    {
+      "epoch": 0.8932732639428305,
+      "grad_norm": 1.920275330543518,
+      "learning_rate": 1.4044844907047798e-05,
+      "loss": 0.4051,
+      "step": 11500
+    },
+    {
+      "epoch": 0.9321112319403448,
+      "grad_norm": 0.8134564757347107,
+      "learning_rate": 1.3785925120397703e-05,
+      "loss": 0.4115,
+      "step": 12000
+    },
+    {
+      "epoch": 0.9709491999378592,
+      "grad_norm": 1.6996334791183472,
+      "learning_rate": 1.3527005333747607e-05,
+      "loss": 0.4134,
+      "step": 12500
+    },
+    {
+      "epoch": 1.0,
+      "eval_AUC": 0.919,
+      "eval_Accuracy": 0.871,
+      "eval_loss": 0.35238268971443176,
+      "eval_runtime": 9979.0139,
+      "eval_samples_per_second": 2.293,
+      "eval_steps_per_second": 0.143,
+      "step": 12874
+    },
+    {
+      "epoch": 1.0097871679353736,
+      "grad_norm": 1.933709740638733,
+      "learning_rate": 1.3268085547097512e-05,
+      "loss": 0.412,
+      "step": 13000
+    },
+    {
+      "epoch": 1.048625135932888,
+      "grad_norm": 1.2826268672943115,
+      "learning_rate": 1.3009165760447415e-05,
+      "loss": 0.4033,
+      "step": 13500
+    },
+    {
+      "epoch": 1.0874631039304024,
+      "grad_norm": 2.6913065910339355,
+      "learning_rate": 1.275024597379732e-05,
+      "loss": 0.4137,
+      "step": 14000
+    },
+    {
+      "epoch": 1.1263010719279167,
+      "grad_norm": 3.0463294982910156,
+      "learning_rate": 1.2491326187147223e-05,
+      "loss": 0.4045,
+      "step": 14500
+    },
+    {
+      "epoch": 1.165139039925431,
+      "grad_norm": 1.5197412967681885,
+      "learning_rate": 1.2232406400497128e-05,
+      "loss": 0.4023,
+      "step": 15000
+    },
+    {
+      "epoch": 1.2039770079229455,
+      "grad_norm": 2.334850788116455,
+      "learning_rate": 1.1973486613847032e-05,
+      "loss": 0.4076,
+      "step": 15500
+    },
+    {
+      "epoch": 1.2428149759204599,
+      "grad_norm": 3.974278211593628,
+      "learning_rate": 1.1714566827196937e-05,
+      "loss": 0.4071,
+      "step": 16000
+    },
+    {
+      "epoch": 1.2816529439179742,
+      "grad_norm": 1.8683360815048218,
+      "learning_rate": 1.145564704054684e-05,
+      "loss": 0.4101,
+      "step": 16500
+    },
+    {
+      "epoch": 1.3204909119154886,
+      "grad_norm": 2.1151626110076904,
+      "learning_rate": 1.1196727253896745e-05,
+      "loss": 0.3948,
+      "step": 17000
+    },
+    {
+      "epoch": 1.359328879913003,
+      "grad_norm": 1.7954820394515991,
+      "learning_rate": 1.0937807467246648e-05,
+      "loss": 0.4095,
+      "step": 17500
+    },
+    {
+      "epoch": 1.3981668479105174,
+      "grad_norm": 1.9576789140701294,
+      "learning_rate": 1.0678887680596553e-05,
+      "loss": 0.3987,
+      "step": 18000
+    },
+    {
+      "epoch": 1.4370048159080318,
+      "grad_norm": 1.471616268157959,
+      "learning_rate": 1.0419967893946456e-05,
+      "loss": 0.4122,
+      "step": 18500
+    },
+    {
+      "epoch": 1.4758427839055461,
+      "grad_norm": 1.507846713066101,
+      "learning_rate": 1.0161048107296361e-05,
+      "loss": 0.3869,
+      "step": 19000
+    },
+    {
+      "epoch": 1.5146807519030605,
+      "grad_norm": 1.9979530572891235,
+      "learning_rate": 9.902128320646265e-06,
+      "loss": 0.3949,
+      "step": 19500
+    },
+    {
+      "epoch": 1.5535187199005747,
+      "grad_norm": 1.022186040878296,
+      "learning_rate": 9.643208533996168e-06,
+      "loss": 0.4082,
+      "step": 20000
+    },
+    {
+      "epoch": 1.5923566878980893,
+      "grad_norm": 1.725373387336731,
+      "learning_rate": 9.384288747346073e-06,
+      "loss": 0.3983,
+      "step": 20500
+    },
+    {
+      "epoch": 1.6311946558956034,
+      "grad_norm": 1.8882161378860474,
+      "learning_rate": 9.125368960695976e-06,
+      "loss": 0.3913,
+      "step": 21000
+    },
+    {
+      "epoch": 1.670032623893118,
+      "grad_norm": 1.6501694917678833,
+      "learning_rate": 8.866449174045881e-06,
+      "loss": 0.3967,
+      "step": 21500
+    },
+    {
+      "epoch": 1.7088705918906322,
+      "grad_norm": 3.191229820251465,
+      "learning_rate": 8.607529387395785e-06,
+      "loss": 0.4047,
+      "step": 22000
+    },
+    {
+      "epoch": 1.7477085598881468,
+      "grad_norm": 2.09586763381958,
+      "learning_rate": 8.34860960074569e-06,
+      "loss": 0.4066,
+      "step": 22500
+    },
+    {
+      "epoch": 1.786546527885661,
+      "grad_norm": 4.569416522979736,
+      "learning_rate": 8.089689814095593e-06,
+      "loss": 0.4041,
+      "step": 23000
+    },
+    {
+      "epoch": 1.8253844958831755,
+      "grad_norm": 1.9049654006958008,
+      "learning_rate": 7.830770027445498e-06,
+      "loss": 0.4007,
+      "step": 23500
+    },
+    {
+      "epoch": 1.8642224638806897,
+      "grad_norm": 2.03849720954895,
+      "learning_rate": 7.571850240795402e-06,
+      "loss": 0.4049,
+      "step": 24000
+    },
+    {
+      "epoch": 1.9030604318782043,
+      "grad_norm": 2.5075671672821045,
+      "learning_rate": 7.3129304541453064e-06,
+      "loss": 0.3868,
+      "step": 24500
+    },
+    {
+      "epoch": 1.9418983998757184,
+      "grad_norm": 3.445219039916992,
+      "learning_rate": 7.054010667495211e-06,
+      "loss": 0.4054,
+      "step": 25000
+    },
+    {
+      "epoch": 1.9807363678732328,
+      "grad_norm": 4.2253923416137695,
+      "learning_rate": 6.795090880845115e-06,
+      "loss": 0.414,
+      "step": 25500
+    },
+    {
+      "epoch": 2.0,
+      "eval_AUC": 0.924,
+      "eval_Accuracy": 0.873,
+      "eval_loss": 0.35110267996788025,
+      "eval_runtime": 9961.9295,
+      "eval_samples_per_second": 2.297,
+      "eval_steps_per_second": 0.144,
+      "step": 25748
+    },
+    {
+      "epoch": 2.019574335870747,
+      "grad_norm": 1.9335342645645142,
+      "learning_rate": 6.536171094195019e-06,
+      "loss": 0.3919,
+      "step": 26000
+    },
+    {
+      "epoch": 2.058412303868262,
+      "grad_norm": 1.5774650573730469,
+      "learning_rate": 6.277251307544922e-06,
+      "loss": 0.3931,
+      "step": 26500
+    },
+    {
+      "epoch": 2.097250271865776,
+      "grad_norm": 3.0770256519317627,
+      "learning_rate": 6.018331520894826e-06,
+      "loss": 0.4035,
+      "step": 27000
+    },
+    {
+      "epoch": 2.1360882398632905,
+      "grad_norm": 3.341671943664551,
+      "learning_rate": 5.759411734244732e-06,
+      "loss": 0.3992,
+      "step": 27500
+    },
+    {
+      "epoch": 2.1749262078608047,
+      "grad_norm": 2.3136978149414062,
+      "learning_rate": 5.500491947594636e-06,
+      "loss": 0.4097,
+      "step": 28000
+    },
+    {
+      "epoch": 2.2137641758583193,
+      "grad_norm": 2.660843849182129,
+      "learning_rate": 5.2415721609445406e-06,
+      "loss": 0.4059,
+      "step": 28500
+    },
+    {
+      "epoch": 2.2526021438558335,
+      "grad_norm": 2.168541669845581,
+      "learning_rate": 4.982652374294444e-06,
+      "loss": 0.3995,
+      "step": 29000
+    },
+    {
+      "epoch": 2.2914401118533476,
+      "grad_norm": 1.3290666341781616,
+      "learning_rate": 4.723732587644348e-06,
+      "loss": 0.4083,
+      "step": 29500
+    },
+    {
+      "epoch": 2.330278079850862,
+      "grad_norm": 2.1573784351348877,
+      "learning_rate": 4.464812800994252e-06,
+      "loss": 0.3954,
+      "step": 30000
+    },
+    {
+      "epoch": 2.369116047848377,
+      "grad_norm": 1.7208375930786133,
+      "learning_rate": 4.205893014344156e-06,
+      "loss": 0.401,
+      "step": 30500
+    },
+    {
+      "epoch": 2.407954015845891,
+      "grad_norm": 2.6122512817382812,
+      "learning_rate": 3.9469732276940605e-06,
+      "loss": 0.3947,
+      "step": 31000
+    },
+    {
+      "epoch": 2.446791983843405,
+      "grad_norm": 1.2965220212936401,
+      "learning_rate": 3.688053441043965e-06,
+      "loss": 0.3972,
+      "step": 31500
+    },
+    {
+      "epoch": 2.4856299518409197,
+      "grad_norm": 2.537813186645508,
+      "learning_rate": 3.4291336543938693e-06,
+      "loss": 0.4117,
+      "step": 32000
+    },
+    {
+      "epoch": 2.5244679198384343,
+      "grad_norm": 1.7891920804977417,
+      "learning_rate": 3.1702138677437734e-06,
+      "loss": 0.3911,
+      "step": 32500
+    },
+    {
+      "epoch": 2.5633058878359485,
+      "grad_norm": 1.5513118505477905,
+      "learning_rate": 2.911294081093677e-06,
+      "loss": 0.392,
+      "step": 33000
+    },
+    {
+      "epoch": 2.6021438558334626,
+      "grad_norm": 1.7818597555160522,
+      "learning_rate": 2.6523742944435813e-06,
+      "loss": 0.4004,
+      "step": 33500
+    },
+    {
+      "epoch": 2.6409818238309772,
+      "grad_norm": 3.2013604640960693,
+      "learning_rate": 2.3934545077934855e-06,
+      "loss": 0.3873,
+      "step": 34000
+    },
+    {
+      "epoch": 2.6798197918284914,
+      "grad_norm": 1.8388571739196777,
+      "learning_rate": 2.13453472114339e-06,
+      "loss": 0.3905,
+      "step": 34500
+    },
+    {
+      "epoch": 2.718657759826006,
+      "grad_norm": 1.5580964088439941,
+      "learning_rate": 1.8756149344932943e-06,
+      "loss": 0.399,
+      "step": 35000
+    },
+    {
+      "epoch": 2.75749572782352,
+      "grad_norm": 1.9616905450820923,
+      "learning_rate": 1.6166951478431982e-06,
+      "loss": 0.3982,
+      "step": 35500
+    },
+    {
+      "epoch": 2.7963336958210347,
+      "grad_norm": 1.4767934083938599,
+      "learning_rate": 1.3577753611931024e-06,
+      "loss": 0.4026,
+      "step": 36000
+    },
+    {
+      "epoch": 2.835171663818549,
+      "grad_norm": 2.7453653812408447,
+      "learning_rate": 1.0988555745430067e-06,
+      "loss": 0.3974,
+      "step": 36500
+    },
+    {
+      "epoch": 2.8740096318160635,
+      "grad_norm": 1.8026459217071533,
+      "learning_rate": 8.399357878929108e-07,
+      "loss": 0.3922,
+      "step": 37000
+    },
+    {
+      "epoch": 2.9128475998135777,
+      "grad_norm": 2.550091505050659,
+      "learning_rate": 5.810160012428151e-07,
+      "loss": 0.3864,
+      "step": 37500
+    },
+    {
+      "epoch": 2.9516855678110923,
+      "grad_norm": 1.742976427078247,
+      "learning_rate": 3.2209621459271923e-07,
+      "loss": 0.393,
+      "step": 38000
+    },
+    {
+      "epoch": 2.9905235358086064,
+      "grad_norm": 1.7563802003860474,
+      "learning_rate": 6.317642794262338e-08,
+      "loss": 0.4036,
+      "step": 38500
+    },
+    {
+      "epoch": 3.0,
+      "eval_AUC": 0.924,
+      "eval_Accuracy": 0.877,
+      "eval_loss": 0.342347651720047,
+      "eval_runtime": 10030.6709,
+      "eval_samples_per_second": 2.282,
+      "eval_steps_per_second": 0.143,
+      "step": 38622
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 38622,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 5.7585530030218445e+17,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-38622/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9ef81828047111fb8469f346d2515430f70d6821251e87dd33c6c643512ff318
+size 5368

checkpoint-38622/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "ealvaradob/bert-finetuned-phishing",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "Safe",
+    "1": "Not Safe"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "label2id": {
+    "Not Safe": 1,
+    "Safe": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.49.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba3c2727fcc23a9001aab178b34a1ce73252b99bb58532e714eefe58721bdddd
+size 1340622760

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "cls_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "[MASK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "[PAD]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9ef81828047111fb8469f346d2515430f70d6821251e87dd33c6c643512ff318
+size 5368

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff