Upload folder using huggingface_hub

Browse files

Files changed (8) hide show

config.json +27 -0
evaluation/finetuned/bert-base-uncased-imdb.json +6 -0
pytorch_model.bin +3 -0
special_tokens_map.json +7 -0
tokenizer_config.json +15 -0
training_args.bin +3 -0
validation/finetuned/bert-base-uncased-imdb_metrics.json +806 -0
vocab.txt +0 -0

config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "_name_or_path": "bert-base-uncased",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.28.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

evaluation/finetuned/bert-base-uncased-imdb.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+    "accuracy": 0.8734,
+    "precision": 0.866107145658483,
+    "recall": 0.88336,
+    "f1": 0.8746485009307299
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:53504b815938b15732369939423c46f9e8dcc05c906c72e28a23ee9bca459733
+size 438007925

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7a2daf63783968443e029027d2716b8fabda9516b50e0c8aab569f6cdb00c326
+size 3643

validation/finetuned/bert-base-uncased-imdb_metrics.json ADDED Viewed

	@@ -0,0 +1,806 @@

+[
+    {
+        "loss": 0.7037,
+        "learning_rate": 4.96e-05,
+        "epoch": 0.04,
+        "step": 100
+    },
+    {
+        "loss": 0.6403,
+        "learning_rate": 4.92e-05,
+        "epoch": 0.08,
+        "step": 200
+    },
+    {
+        "loss": 0.5428,
+        "learning_rate": 4.88e-05,
+        "epoch": 0.12,
+        "step": 300
+    },
+    {
+        "loss": 0.528,
+        "learning_rate": 4.8400000000000004e-05,
+        "epoch": 0.16,
+        "step": 400
+    },
+    {
+        "loss": 0.4614,
+        "learning_rate": 4.8e-05,
+        "epoch": 0.2,
+        "step": 500
+    },
+    {
+        "loss": 0.4324,
+        "learning_rate": 4.76e-05,
+        "epoch": 0.24,
+        "step": 600
+    },
+    {
+        "loss": 0.4732,
+        "learning_rate": 4.72e-05,
+        "epoch": 0.28,
+        "step": 700
+    },
+    {
+        "loss": 0.4722,
+        "learning_rate": 4.6800000000000006e-05,
+        "epoch": 0.32,
+        "step": 800
+    },
+    {
+        "loss": 0.4329,
+        "learning_rate": 4.64e-05,
+        "epoch": 0.36,
+        "step": 900
+    },
+    {
+        "loss": 0.3969,
+        "learning_rate": 4.600000000000001e-05,
+        "epoch": 0.4,
+        "step": 1000
+    },
+    {
+        "loss": 0.4219,
+        "learning_rate": 4.5600000000000004e-05,
+        "epoch": 0.44,
+        "step": 1100
+    },
+    {
+        "loss": 0.4058,
+        "learning_rate": 4.52e-05,
+        "epoch": 0.48,
+        "step": 1200
+    },
+    {
+        "loss": 0.4187,
+        "learning_rate": 4.4800000000000005e-05,
+        "epoch": 0.52,
+        "step": 1300
+    },
+    {
+        "loss": 0.4051,
+        "learning_rate": 4.44e-05,
+        "epoch": 0.56,
+        "step": 1400
+    },
+    {
+        "loss": 0.4245,
+        "learning_rate": 4.4000000000000006e-05,
+        "epoch": 0.6,
+        "step": 1500
+    },
+    {
+        "loss": 0.3941,
+        "learning_rate": 4.36e-05,
+        "epoch": 0.64,
+        "step": 1600
+    },
+    {
+        "loss": 0.4201,
+        "learning_rate": 4.32e-05,
+        "epoch": 0.68,
+        "step": 1700
+    },
+    {
+        "loss": 0.4049,
+        "learning_rate": 4.2800000000000004e-05,
+        "epoch": 0.72,
+        "step": 1800
+    },
+    {
+        "loss": 0.3882,
+        "learning_rate": 4.24e-05,
+        "epoch": 0.76,
+        "step": 1900
+    },
+    {
+        "loss": 0.3949,
+        "learning_rate": 4.2e-05,
+        "epoch": 0.8,
+        "step": 2000
+    },
+    {
+        "loss": 0.3917,
+        "learning_rate": 4.16e-05,
+        "epoch": 0.84,
+        "step": 2100
+    },
+    {
+        "loss": 0.3748,
+        "learning_rate": 4.12e-05,
+        "epoch": 0.88,
+        "step": 2200
+    },
+    {
+        "loss": 0.3559,
+        "learning_rate": 4.08e-05,
+        "epoch": 0.92,
+        "step": 2300
+    },
+    {
+        "loss": 0.3725,
+        "learning_rate": 4.0400000000000006e-05,
+        "epoch": 0.96,
+        "step": 2400
+    },
+    {
+        "loss": 0.3733,
+        "learning_rate": 4e-05,
+        "epoch": 1.0,
+        "step": 2500
+    },
+    {
+        "eval_loss": 0.32812437415122986,
+        "eval_accuracy": 0.87,
+        "eval_runtime": 10.8517,
+        "eval_samples_per_second": 460.757,
+        "eval_steps_per_second": 57.595,
+        "epoch": 1.0,
+        "step": 2500
+    },
+    {
+        "loss": 0.2679,
+        "learning_rate": 3.960000000000001e-05,
+        "epoch": 1.04,
+        "step": 2600
+    },
+    {
+        "loss": 0.2965,
+        "learning_rate": 3.9200000000000004e-05,
+        "epoch": 1.08,
+        "step": 2700
+    },
+    {
+        "loss": 0.3136,
+        "learning_rate": 3.88e-05,
+        "epoch": 1.12,
+        "step": 2800
+    },
+    {
+        "loss": 0.2939,
+        "learning_rate": 3.8400000000000005e-05,
+        "epoch": 1.16,
+        "step": 2900
+    },
+    {
+        "loss": 0.2492,
+        "learning_rate": 3.8e-05,
+        "epoch": 1.2,
+        "step": 3000
+    },
+    {
+        "loss": 0.2885,
+        "learning_rate": 3.76e-05,
+        "epoch": 1.24,
+        "step": 3100
+    },
+    {
+        "loss": 0.3531,
+        "learning_rate": 3.72e-05,
+        "epoch": 1.28,
+        "step": 3200
+    },
+    {
+        "loss": 0.2984,
+        "learning_rate": 3.68e-05,
+        "epoch": 1.32,
+        "step": 3300
+    },
+    {
+        "loss": 0.2486,
+        "learning_rate": 3.6400000000000004e-05,
+        "epoch": 1.36,
+        "step": 3400
+    },
+    {
+        "loss": 0.2928,
+        "learning_rate": 3.6e-05,
+        "epoch": 1.4,
+        "step": 3500
+    },
+    {
+        "loss": 0.3174,
+        "learning_rate": 3.56e-05,
+        "epoch": 1.44,
+        "step": 3600
+    },
+    {
+        "loss": 0.3064,
+        "learning_rate": 3.52e-05,
+        "epoch": 1.48,
+        "step": 3700
+    },
+    {
+        "loss": 0.3058,
+        "learning_rate": 3.48e-05,
+        "epoch": 1.52,
+        "step": 3800
+    },
+    {
+        "loss": 0.3027,
+        "learning_rate": 3.4399999999999996e-05,
+        "epoch": 1.56,
+        "step": 3900
+    },
+    {
+        "loss": 0.3043,
+        "learning_rate": 3.4000000000000007e-05,
+        "epoch": 1.6,
+        "step": 4000
+    },
+    {
+        "loss": 0.2768,
+        "learning_rate": 3.3600000000000004e-05,
+        "epoch": 1.64,
+        "step": 4100
+    },
+    {
+        "loss": 0.3332,
+        "learning_rate": 3.32e-05,
+        "epoch": 1.68,
+        "step": 4200
+    },
+    {
+        "loss": 0.2833,
+        "learning_rate": 3.2800000000000004e-05,
+        "epoch": 1.72,
+        "step": 4300
+    },
+    {
+        "loss": 0.2934,
+        "learning_rate": 3.24e-05,
+        "epoch": 1.76,
+        "step": 4400
+    },
+    {
+        "loss": 0.3451,
+        "learning_rate": 3.2000000000000005e-05,
+        "epoch": 1.8,
+        "step": 4500
+    },
+    {
+        "loss": 0.2495,
+        "learning_rate": 3.16e-05,
+        "epoch": 1.84,
+        "step": 4600
+    },
+    {
+        "loss": 0.2737,
+        "learning_rate": 3.12e-05,
+        "epoch": 1.88,
+        "step": 4700
+    },
+    {
+        "loss": 0.3108,
+        "learning_rate": 3.08e-05,
+        "epoch": 1.92,
+        "step": 4800
+    },
+    {
+        "loss": 0.3293,
+        "learning_rate": 3.04e-05,
+        "epoch": 1.96,
+        "step": 4900
+    },
+    {
+        "loss": 0.2759,
+        "learning_rate": 3e-05,
+        "epoch": 2.0,
+        "step": 5000
+    },
+    {
+        "eval_loss": 0.4422077238559723,
+        "eval_accuracy": 0.8746,
+        "eval_runtime": 10.8361,
+        "eval_samples_per_second": 461.423,
+        "eval_steps_per_second": 57.678,
+        "epoch": 2.0,
+        "step": 5000
+    },
+    {
+        "loss": 0.1304,
+        "learning_rate": 2.96e-05,
+        "epoch": 2.04,
+        "step": 5100
+    },
+    {
+        "loss": 0.1293,
+        "learning_rate": 2.9199999999999998e-05,
+        "epoch": 2.08,
+        "step": 5200
+    },
+    {
+        "loss": 0.135,
+        "learning_rate": 2.88e-05,
+        "epoch": 2.12,
+        "step": 5300
+    },
+    {
+        "loss": 0.1415,
+        "learning_rate": 2.84e-05,
+        "epoch": 2.16,
+        "step": 5400
+    },
+    {
+        "loss": 0.1637,
+        "learning_rate": 2.8000000000000003e-05,
+        "epoch": 2.2,
+        "step": 5500
+    },
+    {
+        "loss": 0.1651,
+        "learning_rate": 2.7600000000000003e-05,
+        "epoch": 2.24,
+        "step": 5600
+    },
+    {
+        "loss": 0.1564,
+        "learning_rate": 2.7200000000000004e-05,
+        "epoch": 2.28,
+        "step": 5700
+    },
+    {
+        "loss": 0.1822,
+        "learning_rate": 2.6800000000000004e-05,
+        "epoch": 2.32,
+        "step": 5800
+    },
+    {
+        "loss": 0.1447,
+        "learning_rate": 2.64e-05,
+        "epoch": 2.36,
+        "step": 5900
+    },
+    {
+        "loss": 0.1972,
+        "learning_rate": 2.6000000000000002e-05,
+        "epoch": 2.4,
+        "step": 6000
+    },
+    {
+        "loss": 0.1479,
+        "learning_rate": 2.5600000000000002e-05,
+        "epoch": 2.44,
+        "step": 6100
+    },
+    {
+        "loss": 0.1285,
+        "learning_rate": 2.5200000000000003e-05,
+        "epoch": 2.48,
+        "step": 6200
+    },
+    {
+        "loss": 0.2019,
+        "learning_rate": 2.48e-05,
+        "epoch": 2.52,
+        "step": 6300
+    },
+    {
+        "loss": 0.1654,
+        "learning_rate": 2.44e-05,
+        "epoch": 2.56,
+        "step": 6400
+    },
+    {
+        "loss": 0.1906,
+        "learning_rate": 2.4e-05,
+        "epoch": 2.6,
+        "step": 6500
+    },
+    {
+        "loss": 0.1421,
+        "learning_rate": 2.36e-05,
+        "epoch": 2.64,
+        "step": 6600
+    },
+    {
+        "loss": 0.1533,
+        "learning_rate": 2.32e-05,
+        "epoch": 2.68,
+        "step": 6700
+    },
+    {
+        "loss": 0.1359,
+        "learning_rate": 2.2800000000000002e-05,
+        "epoch": 2.72,
+        "step": 6800
+    },
+    {
+        "loss": 0.1618,
+        "learning_rate": 2.2400000000000002e-05,
+        "epoch": 2.76,
+        "step": 6900
+    },
+    {
+        "loss": 0.16,
+        "learning_rate": 2.2000000000000003e-05,
+        "epoch": 2.8,
+        "step": 7000
+    },
+    {
+        "loss": 0.1524,
+        "learning_rate": 2.16e-05,
+        "epoch": 2.84,
+        "step": 7100
+    },
+    {
+        "loss": 0.2025,
+        "learning_rate": 2.12e-05,
+        "epoch": 2.88,
+        "step": 7200
+    },
+    {
+        "loss": 0.1519,
+        "learning_rate": 2.08e-05,
+        "epoch": 2.92,
+        "step": 7300
+    },
+    {
+        "loss": 0.2049,
+        "learning_rate": 2.04e-05,
+        "epoch": 2.96,
+        "step": 7400
+    },
+    {
+        "loss": 0.1221,
+        "learning_rate": 2e-05,
+        "epoch": 3.0,
+        "step": 7500
+    },
+    {
+        "eval_loss": 0.6053758859634399,
+        "eval_accuracy": 0.8778,
+        "eval_runtime": 10.8028,
+        "eval_samples_per_second": 462.845,
+        "eval_steps_per_second": 57.856,
+        "epoch": 3.0,
+        "step": 7500
+    },
+    {
+        "loss": 0.0626,
+        "learning_rate": 1.9600000000000002e-05,
+        "epoch": 3.04,
+        "step": 7600
+    },
+    {
+        "loss": 0.0787,
+        "learning_rate": 1.9200000000000003e-05,
+        "epoch": 3.08,
+        "step": 7700
+    },
+    {
+        "loss": 0.0233,
+        "learning_rate": 1.88e-05,
+        "epoch": 3.12,
+        "step": 7800
+    },
+    {
+        "loss": 0.0566,
+        "learning_rate": 1.84e-05,
+        "epoch": 3.16,
+        "step": 7900
+    },
+    {
+        "loss": 0.0615,
+        "learning_rate": 1.8e-05,
+        "epoch": 3.2,
+        "step": 8000
+    },
+    {
+        "loss": 0.0704,
+        "learning_rate": 1.76e-05,
+        "epoch": 3.24,
+        "step": 8100
+    },
+    {
+        "loss": 0.0995,
+        "learning_rate": 1.7199999999999998e-05,
+        "epoch": 3.28,
+        "step": 8200
+    },
+    {
+        "loss": 0.0538,
+        "learning_rate": 1.6800000000000002e-05,
+        "epoch": 3.32,
+        "step": 8300
+    },
+    {
+        "loss": 0.071,
+        "learning_rate": 1.6400000000000002e-05,
+        "epoch": 3.36,
+        "step": 8400
+    },
+    {
+        "loss": 0.1314,
+        "learning_rate": 1.6000000000000003e-05,
+        "epoch": 3.4,
+        "step": 8500
+    },
+    {
+        "loss": 0.0807,
+        "learning_rate": 1.56e-05,
+        "epoch": 3.44,
+        "step": 8600
+    },
+    {
+        "loss": 0.0832,
+        "learning_rate": 1.52e-05,
+        "epoch": 3.48,
+        "step": 8700
+    },
+    {
+        "loss": 0.1066,
+        "learning_rate": 1.48e-05,
+        "epoch": 3.52,
+        "step": 8800
+    },
+    {
+        "loss": 0.0886,
+        "learning_rate": 1.44e-05,
+        "epoch": 3.56,
+        "step": 8900
+    },
+    {
+        "loss": 0.0424,
+        "learning_rate": 1.4000000000000001e-05,
+        "epoch": 3.6,
+        "step": 9000
+    },
+    {
+        "loss": 0.0312,
+        "learning_rate": 1.3600000000000002e-05,
+        "epoch": 3.64,
+        "step": 9100
+    },
+    {
+        "loss": 0.0577,
+        "learning_rate": 1.32e-05,
+        "epoch": 3.68,
+        "step": 9200
+    },
+    {
+        "loss": 0.076,
+        "learning_rate": 1.2800000000000001e-05,
+        "epoch": 3.72,
+        "step": 9300
+    },
+    {
+        "loss": 0.0558,
+        "learning_rate": 1.24e-05,
+        "epoch": 3.76,
+        "step": 9400
+    },
+    {
+        "loss": 0.0351,
+        "learning_rate": 1.2e-05,
+        "epoch": 3.8,
+        "step": 9500
+    },
+    {
+        "loss": 0.0822,
+        "learning_rate": 1.16e-05,
+        "epoch": 3.84,
+        "step": 9600
+    },
+    {
+        "loss": 0.0458,
+        "learning_rate": 1.1200000000000001e-05,
+        "epoch": 3.88,
+        "step": 9700
+    },
+    {
+        "loss": 0.0734,
+        "learning_rate": 1.08e-05,
+        "epoch": 3.92,
+        "step": 9800
+    },
+    {
+        "loss": 0.033,
+        "learning_rate": 1.04e-05,
+        "epoch": 3.96,
+        "step": 9900
+    },
+    {
+        "loss": 0.0573,
+        "learning_rate": 1e-05,
+        "epoch": 4.0,
+        "step": 10000
+    },
+    {
+        "eval_loss": 0.7817962765693665,
+        "eval_accuracy": 0.8812,
+        "eval_runtime": 10.7946,
+        "eval_samples_per_second": 463.194,
+        "eval_steps_per_second": 57.899,
+        "epoch": 4.0,
+        "step": 10000
+    },
+    {
+        "loss": 0.0438,
+        "learning_rate": 9.600000000000001e-06,
+        "epoch": 4.04,
+        "step": 10100
+    },
+    {
+        "loss": 0.0236,
+        "learning_rate": 9.2e-06,
+        "epoch": 4.08,
+        "step": 10200
+    },
+    {
+        "loss": 0.0131,
+        "learning_rate": 8.8e-06,
+        "epoch": 4.12,
+        "step": 10300
+    },
+    {
+        "loss": 0.0345,
+        "learning_rate": 8.400000000000001e-06,
+        "epoch": 4.16,
+        "step": 10400
+    },
+    {
+        "loss": 0.0006,
+        "learning_rate": 8.000000000000001e-06,
+        "epoch": 4.2,
+        "step": 10500
+    },
+    {
+        "loss": 0.0349,
+        "learning_rate": 7.6e-06,
+        "epoch": 4.24,
+        "step": 10600
+    },
+    {
+        "loss": 0.0096,
+        "learning_rate": 7.2e-06,
+        "epoch": 4.28,
+        "step": 10700
+    },
+    {
+        "loss": 0.0441,
+        "learning_rate": 6.800000000000001e-06,
+        "epoch": 4.32,
+        "step": 10800
+    },
+    {
+        "loss": 0.0254,
+        "learning_rate": 6.4000000000000006e-06,
+        "epoch": 4.36,
+        "step": 10900
+    },
+    {
+        "loss": 0.0193,
+        "learning_rate": 6e-06,
+        "epoch": 4.4,
+        "step": 11000
+    },
+    {
+        "loss": 0.0073,
+        "learning_rate": 5.600000000000001e-06,
+        "epoch": 4.44,
+        "step": 11100
+    },
+    {
+        "loss": 0.0458,
+        "learning_rate": 5.2e-06,
+        "epoch": 4.48,
+        "step": 11200
+    },
+    {
+        "loss": 0.0419,
+        "learning_rate": 4.800000000000001e-06,
+        "epoch": 4.52,
+        "step": 11300
+    },
+    {
+        "loss": 0.0309,
+        "learning_rate": 4.4e-06,
+        "epoch": 4.56,
+        "step": 11400
+    },
+    {
+        "loss": 0.0299,
+        "learning_rate": 4.000000000000001e-06,
+        "epoch": 4.6,
+        "step": 11500
+    },
+    {
+        "loss": 0.0232,
+        "learning_rate": 3.6e-06,
+        "epoch": 4.64,
+        "step": 11600
+    },
+    {
+        "loss": 0.0367,
+        "learning_rate": 3.2000000000000003e-06,
+        "epoch": 4.68,
+        "step": 11700
+    },
+    {
+        "loss": 0.0325,
+        "learning_rate": 2.8000000000000003e-06,
+        "epoch": 4.72,
+        "step": 11800
+    },
+    {
+        "loss": 0.0193,
+        "learning_rate": 2.4000000000000003e-06,
+        "epoch": 4.76,
+        "step": 11900
+    },
+    {
+        "loss": 0.025,
+        "learning_rate": 2.0000000000000003e-06,
+        "epoch": 4.8,
+        "step": 12000
+    },
+    {
+        "loss": 0.0664,
+        "learning_rate": 1.6000000000000001e-06,
+        "epoch": 4.84,
+        "step": 12100
+    },
+    {
+        "loss": 0.0249,
+        "learning_rate": 1.2000000000000002e-06,
+        "epoch": 4.88,
+        "step": 12200
+    },
+    {
+        "loss": 0.047,
+        "learning_rate": 8.000000000000001e-07,
+        "epoch": 4.92,
+        "step": 12300
+    },
+    {
+        "loss": 0.0116,
+        "learning_rate": 4.0000000000000003e-07,
+        "epoch": 4.96,
+        "step": 12400
+    },
+    {
+        "loss": 0.0263,
+        "learning_rate": 0.0,
+        "epoch": 5.0,
+        "step": 12500
+    },
+    {
+        "eval_loss": 0.7965031266212463,
+        "eval_accuracy": 0.8818,
+        "eval_runtime": 10.8332,
+        "eval_samples_per_second": 461.543,
+        "eval_steps_per_second": 57.693,
+        "epoch": 5.0,
+        "step": 12500
+    },
+    {
+        "train_runtime": 847.216,
+        "train_samples_per_second": 118.034,
+        "train_steps_per_second": 14.754,
+        "total_flos": 6577776384000000.0,
+        "train_loss": 0.19825982205212117,
+        "epoch": 5.0,
+        "step": 12500
+    }
+]

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff