Upload 11 files

Browse files

Files changed (11) hide show

config.json +86 -0
optimizer.pt +3 -0
pytorch_model.bin +3 -0
rng_state.pth +3 -0
scheduler.pt +3 -0
special_tokens_map.json +7 -0
tokenizer.json +0 -0
tokenizer_config.json +13 -0
trainer_state.json +186 -0
training_args.bin +3 -0
vocab.txt +0 -0

config.json ADDED Viewed

	@@ -0,0 +1,86 @@

+{
+  "_name_or_path": "distilbert-base-uncased",
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForMultilabelSequenceClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "hidden_dim": 3072,
+  "id2label": [
+    {
+      "0": "admiration",
+      "1": "amusement",
+      "10": "disapproval",
+      "11": "disgust",
+      "12": "embarrassment",
+      "13": "excitement",
+      "14": "fear",
+      "15": "gratitude",
+      "16": "grief",
+      "17": "joy",
+      "18": "love",
+      "19": "nervousness",
+      "2": "anger",
+      "20": "optimism",
+      "21": "pride",
+      "22": "realization",
+      "23": "relief",
+      "24": "remorse",
+      "25": "sadness",
+      "26": "surprise",
+      "27": "neutral",
+      "3": "annoyance",
+      "4": "approval",
+      "5": "caring",
+      "6": "confusion",
+      "7": "curiosity",
+      "8": "desire",
+      "9": "disappointment"
+    }
+  ],
+  "initializer_range": 0.02,
+  "label2id": {
+    "admiration": 0,
+    "amusement": 1,
+    "anger": 2,
+    "annoyance": 3,
+    "approval": 4,
+    "caring": 5,
+    "confusion": 6,
+    "curiosity": 7,
+    "desire": 8,
+    "disappointment": 9,
+    "disapproval": 10,
+    "disgust": 11,
+    "embarrassment": 12,
+    "excitement": 13,
+    "fear": 14,
+    "gratitude": 15,
+    "grief": 16,
+    "joy": 17,
+    "love": 18,
+    "nervousness": 19,
+    "neutral": 27,
+    "optimism": 20,
+    "pride": 21,
+    "realization": 22,
+    "relief": 23,
+    "remorse": 24,
+    "sadness": 25,
+    "surprise": 26
+  },
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "pad_token_id": 0,
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.28.1",
+  "vocab_size": 30522
+}

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ea3bbe2d8bdd5565454dd7c68ecceb347f4e157ba01389f5f6e5a5eb093c0061
+size 531134981

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2fefe2e4cf610b43c385b84909dafdd6fb41005b1c3e0719f4dd3a28f8c5009e
+size 267935469

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ac1ffb7924c460fb76131293e9e9d7a0be0e93f63374133233bc4d73ecfe1d96
+size 14575

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cee5f0ff00ee32da37f27264092fac385a34bb5a3552401f846f12b729cd05fe
+size 627

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
+  "unk_token": "[UNK]"
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,186 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 10.0,
+  "global_step": 52940,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 1.8000377786173025e-05,
+      "loss": 0.1263,
+      "step": 5293
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy_thresh": 0.9616630673408508,
+      "eval_f1_macro": 0.16946832551734195,
+      "eval_f1_micro": 0.23566588370481772,
+      "eval_loss": 0.11356716603040695,
+      "eval_runtime": 48.6873,
+      "eval_samples_per_second": 859.506,
+      "eval_steps_per_second": 26.865,
+      "step": 5294
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 1.6000755572346052e-05,
+      "loss": 0.1102,
+      "step": 10586
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy_thresh": 0.9620087146759033,
+      "eval_f1_macro": 0.17900886975226568,
+      "eval_f1_micro": 0.2526954290189805,
+      "eval_loss": 0.11111615598201752,
+      "eval_runtime": 47.7242,
+      "eval_samples_per_second": 876.85,
+      "eval_steps_per_second": 27.407,
+      "step": 10588
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 1.400113335851908e-05,
+      "loss": 0.1051,
+      "step": 15879
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy_thresh": 0.9615273475646973,
+      "eval_f1_macro": 0.2072184242961422,
+      "eval_f1_micro": 0.27365762031219637,
+      "eval_loss": 0.1117364689707756,
+      "eval_runtime": 47.6559,
+      "eval_samples_per_second": 878.107,
+      "eval_steps_per_second": 27.447,
+      "step": 15882
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 1.2001511144692106e-05,
+      "loss": 0.1008,
+      "step": 21172
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy_thresh": 0.9611817002296448,
+      "eval_f1_macro": 0.22506513860997251,
+      "eval_f1_micro": 0.2893829659382017,
+      "eval_loss": 0.11295813322067261,
+      "eval_runtime": 48.0019,
+      "eval_samples_per_second": 871.779,
+      "eval_steps_per_second": 27.249,
+      "step": 21176
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 1.0001888930865132e-05,
+      "loss": 0.0969,
+      "step": 26465
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy_thresh": 0.9608395099639893,
+      "eval_f1_macro": 0.2055009373845579,
+      "eval_f1_micro": 0.28528452452579245,
+      "eval_loss": 0.11423922330141068,
+      "eval_runtime": 47.8236,
+      "eval_samples_per_second": 875.029,
+      "eval_steps_per_second": 27.351,
+      "step": 26470
+    },
+    {
+      "epoch": 6.0,
+      "learning_rate": 8.002266717038157e-06,
+      "loss": 0.0935,
+      "step": 31758
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy_thresh": 0.9599553346633911,
+      "eval_f1_macro": 0.24715534791751095,
+      "eval_f1_micro": 0.31626149162404954,
+      "eval_loss": 0.11684752255678177,
+      "eval_runtime": 47.548,
+      "eval_samples_per_second": 880.101,
+      "eval_steps_per_second": 27.509,
+      "step": 31764
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 6.002644503211182e-06,
+      "loss": 0.0905,
+      "step": 37051
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy_thresh": 0.9595038294792175,
+      "eval_f1_macro": 0.2441714312173638,
+      "eval_f1_micro": 0.3219438566376134,
+      "eval_loss": 0.11869944632053375,
+      "eval_runtime": 47.7399,
+      "eval_samples_per_second": 876.562,
+      "eval_steps_per_second": 27.398,
+      "step": 37058
+    },
+    {
+      "epoch": 8.0,
+      "learning_rate": 4.003022289384209e-06,
+      "loss": 0.088,
+      "step": 42344
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy_thresh": 0.9587323069572449,
+      "eval_f1_macro": 0.2548664525024525,
+      "eval_f1_micro": 0.32230417164679476,
+      "eval_loss": 0.12079060822725296,
+      "eval_runtime": 47.4927,
+      "eval_samples_per_second": 881.125,
+      "eval_steps_per_second": 27.541,
+      "step": 42352
+    },
+    {
+      "epoch": 9.0,
+      "learning_rate": 2.0034000755572347e-06,
+      "loss": 0.0858,
+      "step": 47637
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy_thresh": 0.958522379398346,
+      "eval_f1_macro": 0.25593002791116004,
+      "eval_f1_micro": 0.326565974528547,
+      "eval_loss": 0.12228038907051086,
+      "eval_runtime": 47.6614,
+      "eval_samples_per_second": 878.006,
+      "eval_steps_per_second": 27.444,
+      "step": 47646
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 3.777861730260673e-09,
+      "loss": 0.0841,
+      "step": 52930
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy_thresh": 0.9580487012863159,
+      "eval_f1_macro": 0.26093237174433664,
+      "eval_f1_micro": 0.3314736272807492,
+      "eval_loss": 0.12347622960805893,
+      "eval_runtime": 47.9519,
+      "eval_samples_per_second": 872.686,
+      "eval_steps_per_second": 27.277,
+      "step": 52940
+    }
+  ],
+  "max_steps": 52940,
+  "num_train_epochs": 10,
+  "total_flos": 1.603873359628872e+16,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:19ab0059a48620b920f02d2501937385c3d4088206925978e56d5643d06f249b
+size 3579

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff