Upload 7 files

Browse files

Files changed (7) hide show

train_validation_epoc10_late1e-5_/config.json +44 -0
train_validation_epoc10_late1e-5_/model.safetensors +3 -0
train_validation_epoc10_late1e-5_/optimizer.pt +3 -0
train_validation_epoc10_late1e-5_/rng_state.pth +3 -0
train_validation_epoc10_late1e-5_/scheduler.pt +3 -0
train_validation_epoc10_late1e-5_/trainer_state.json +540 -0
train_validation_epoc10_late1e-5_/training_args.bin +3 -0

train_validation_epoc10_late1e-5_/config.json ADDED Viewed

	@@ -0,0 +1,44 @@

+{
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "eos_token_id": 2,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "\uae30\uc068",
+    "1": "\ub2f9\ud669",
+    "2": "\ubd84\ub178",
+    "3": "\ubd88\uc548",
+    "4": "\uc0c1\ucc98",
+    "5": "\uc2ac\ud514"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "\uae30\uc068": 0,
+    "\ub2f9\ud669": 1,
+    "\ubd84\ub178": 2,
+    "\ubd88\uc548": 3,
+    "\uc0c1\ucc98": 4,
+    "\uc2ac\ud514": 5
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "tokenizer_class": "BertTokenizer",
+  "transformers_version": "4.57.1",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 32000
+}

train_validation_epoc10_late1e-5_/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a01f1878186591d161ab202ab802b8c24ae616734040613db0bbf380b34c14a6
+size 442515048

train_validation_epoc10_late1e-5_/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f699c7a5bceaaa90efb4fd0cc43499e80254b0e03a0c8c703877d713dfa40e33
+size 885149946

train_validation_epoc10_late1e-5_/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8f6bb84cf6813f85267f549749f7f4a30acafb0596d05b94015e1ea1106d83a1
+size 14244

train_validation_epoc10_late1e-5_/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c82bbd8f423e6c39232b4b8e249b779575daaf3e47bfcf053024fb61ebcd92ee
+size 1064

train_validation_epoc10_late1e-5_/trainer_state.json ADDED Viewed

	@@ -0,0 +1,540 @@

+{
+  "best_global_step": 14525,
+  "best_metric": 0.7187681580476467,
+  "best_model_checkpoint": "./results\\emotion_model_v2_manual\\checkpoint-14525",
+  "epoch": 10.0,
+  "eval_steps": 500,
+  "global_step": 29050,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.1721170395869191,
+      "grad_norm": 4.724106311798096,
+      "learning_rate": 1.7177280550774528e-06,
+      "loss": 1.6423,
+      "step": 500
+    },
+    {
+      "epoch": 0.3442340791738382,
+      "grad_norm": 9.161306381225586,
+      "learning_rate": 3.438898450946644e-06,
+      "loss": 1.0679,
+      "step": 1000
+    },
+    {
+      "epoch": 0.5163511187607573,
+      "grad_norm": 9.363469123840332,
+      "learning_rate": 5.160068846815836e-06,
+      "loss": 0.8434,
+      "step": 1500
+    },
+    {
+      "epoch": 0.6884681583476764,
+      "grad_norm": 6.987210273742676,
+      "learning_rate": 6.881239242685026e-06,
+      "loss": 0.7415,
+      "step": 2000
+    },
+    {
+      "epoch": 0.8605851979345955,
+      "grad_norm": 7.236252784729004,
+      "learning_rate": 8.602409638554217e-06,
+      "loss": 0.7327,
+      "step": 2500
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.6786751888436955,
+      "eval_f1": 0.6769930163180903,
+      "eval_loss": 0.7002930045127869,
+      "eval_runtime": 23.5126,
+      "eval_samples_per_second": 219.584,
+      "eval_steps_per_second": 3.445,
+      "step": 2905
+    },
+    {
+      "epoch": 1.0327022375215147,
+      "grad_norm": 11.019606590270996,
+      "learning_rate": 9.999681056649855e-06,
+      "loss": 0.6778,
+      "step": 3000
+    },
+    {
+      "epoch": 1.2048192771084336,
+      "grad_norm": 5.872101783752441,
+      "learning_rate": 9.987269338508347e-06,
+      "loss": 0.6805,
+      "step": 3500
+    },
+    {
+      "epoch": 1.3769363166953528,
+      "grad_norm": 13.4342679977417,
+      "learning_rate": 9.956860847149606e-06,
+      "loss": 0.672,
+      "step": 4000
+    },
+    {
+      "epoch": 1.549053356282272,
+      "grad_norm": 6.019625663757324,
+      "learning_rate": 9.908565312906149e-06,
+      "loss": 0.6501,
+      "step": 4500
+    },
+    {
+      "epoch": 1.721170395869191,
+      "grad_norm": 32.90696716308594,
+      "learning_rate": 9.842557012264402e-06,
+      "loss": 0.6514,
+      "step": 5000
+    },
+    {
+      "epoch": 1.8932874354561102,
+      "grad_norm": 9.127164840698242,
+      "learning_rate": 9.759074138980602e-06,
+      "loss": 0.648,
+      "step": 5500
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6751888436955259,
+      "eval_f1": 0.6765777142972994,
+      "eval_loss": 0.6460646390914917,
+      "eval_runtime": 23.4762,
+      "eval_samples_per_second": 219.925,
+      "eval_steps_per_second": 3.45,
+      "step": 5810
+    },
+    {
+      "epoch": 2.0654044750430294,
+      "grad_norm": 3.502110242843628,
+      "learning_rate": 9.658417944548512e-06,
+      "loss": 0.6257,
+      "step": 6000
+    },
+    {
+      "epoch": 2.2375215146299485,
+      "grad_norm": 17.171558380126953,
+      "learning_rate": 9.540951651120605e-06,
+      "loss": 0.5508,
+      "step": 6500
+    },
+    {
+      "epoch": 2.4096385542168672,
+      "grad_norm": 12.519411087036133,
+      "learning_rate": 9.407099140805506e-06,
+      "loss": 0.5642,
+      "step": 7000
+    },
+    {
+      "epoch": 2.581755593803787,
+      "grad_norm": 4.6616106033325195,
+      "learning_rate": 9.2573434260714e-06,
+      "loss": 0.5705,
+      "step": 7500
+    },
+    {
+      "epoch": 2.7538726333907055,
+      "grad_norm": 10.083399772644043,
+      "learning_rate": 9.092224906775031e-06,
+      "loss": 0.5429,
+      "step": 8000
+    },
+    {
+      "epoch": 2.9259896729776247,
+      "grad_norm": 21.949539184570312,
+      "learning_rate": 8.912339420105856e-06,
+      "loss": 0.5706,
+      "step": 8500
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.7090838659693977,
+      "eval_f1": 0.7078776705900655,
+      "eval_loss": 0.652846097946167,
+      "eval_runtime": 23.4941,
+      "eval_samples_per_second": 219.757,
+      "eval_steps_per_second": 3.448,
+      "step": 8715
+    },
+    {
+      "epoch": 3.098106712564544,
+      "grad_norm": 5.069673538208008,
+      "learning_rate": 8.718336090482256e-06,
+      "loss": 0.5018,
+      "step": 9000
+    },
+    {
+      "epoch": 3.270223752151463,
+      "grad_norm": 25.420305252075195,
+      "learning_rate": 8.510914987158492e-06,
+      "loss": 0.4446,
+      "step": 9500
+    },
+    {
+      "epoch": 3.442340791738382,
+      "grad_norm": 9.161646842956543,
+      "learning_rate": 8.29082459799508e-06,
+      "loss": 0.479,
+      "step": 10000
+    },
+    {
+      "epoch": 3.6144578313253013,
+      "grad_norm": 5.734455585479736,
+      "learning_rate": 8.058859128508552e-06,
+      "loss": 0.4664,
+      "step": 10500
+    },
+    {
+      "epoch": 3.7865748709122204,
+      "grad_norm": 8.140594482421875,
+      "learning_rate": 7.815855635947117e-06,
+      "loss": 0.4671,
+      "step": 11000
+    },
+    {
+      "epoch": 3.958691910499139,
+      "grad_norm": 12.30313777923584,
+      "learning_rate": 7.5626910087340345e-06,
+      "loss": 0.4672,
+      "step": 11500
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.6891342242882045,
+      "eval_f1": 0.6904309534188946,
+      "eval_loss": 0.6823111772537231,
+      "eval_runtime": 23.5245,
+      "eval_samples_per_second": 219.473,
+      "eval_steps_per_second": 3.443,
+      "step": 11620
+    },
+    {
+      "epoch": 4.130808950086059,
+      "grad_norm": 6.850505828857422,
+      "learning_rate": 7.300278802178502e-06,
+      "loss": 0.41,
+      "step": 12000
+    },
+    {
+      "epoch": 4.3029259896729775,
+      "grad_norm": 10.596614837646484,
+      "learning_rate": 7.029565941872515e-06,
+      "loss": 0.3749,
+      "step": 12500
+    },
+    {
+      "epoch": 4.475043029259897,
+      "grad_norm": 17.926851272583008,
+      "learning_rate": 6.751529306669657e-06,
+      "loss": 0.3686,
+      "step": 13000
+    },
+    {
+      "epoch": 4.647160068846816,
+      "grad_norm": 9.452420234680176,
+      "learning_rate": 6.467172203576269e-06,
+      "loss": 0.3805,
+      "step": 13500
+    },
+    {
+      "epoch": 4.8192771084337345,
+      "grad_norm": 10.189457893371582,
+      "learning_rate": 6.177520747275505e-06,
+      "loss": 0.3808,
+      "step": 14000
+    },
+    {
+      "epoch": 4.991394148020654,
+      "grad_norm": 9.415667533874512,
+      "learning_rate": 5.883620157348912e-06,
+      "loss": 0.3761,
+      "step": 14500
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.7187681580476467,
+      "eval_f1": 0.7183692977167631,
+      "eval_loss": 0.8157204985618591,
+      "eval_runtime": 23.4773,
+      "eval_samples_per_second": 219.915,
+      "eval_steps_per_second": 3.45,
+      "step": 14525
+    },
+    {
+      "epoch": 5.163511187607573,
+      "grad_norm": 15.120372772216797,
+      "learning_rate": 5.586530986557198e-06,
+      "loss": 0.3165,
+      "step": 15000
+    },
+    {
+      "epoch": 5.335628227194492,
+      "grad_norm": 39.6508674621582,
+      "learning_rate": 5.287325293790533e-06,
+      "loss": 0.2895,
+      "step": 15500
+    },
+    {
+      "epoch": 5.507745266781411,
+      "grad_norm": 13.855805397033691,
+      "learning_rate": 4.9870827754985254e-06,
+      "loss": 0.2962,
+      "step": 16000
+    },
+    {
+      "epoch": 5.679862306368331,
+      "grad_norm": 24.66667366027832,
+      "learning_rate": 4.686886869559725e-06,
+      "loss": 0.297,
+      "step": 16500
+    },
+    {
+      "epoch": 5.851979345955249,
+      "grad_norm": 7.78758430480957,
+      "learning_rate": 4.387820845650027e-06,
+      "loss": 0.3033,
+      "step": 17000
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.7119891535928724,
+      "eval_f1": 0.7124070834016881,
+      "eval_loss": 0.8771335482597351,
+      "eval_runtime": 23.4829,
+      "eval_samples_per_second": 219.862,
+      "eval_steps_per_second": 3.449,
+      "step": 17430
+    },
+    {
+      "epoch": 6.024096385542169,
+      "grad_norm": 10.739643096923828,
+      "learning_rate": 4.090963896218038e-06,
+      "loss": 0.2787,
+      "step": 17500
+    },
+    {
+      "epoch": 6.196213425129088,
+      "grad_norm": 32.562843322753906,
+      "learning_rate": 3.7973872421732906e-06,
+      "loss": 0.2336,
+      "step": 18000
+    },
+    {
+      "epoch": 6.368330464716007,
+      "grad_norm": 24.239948272705078,
+      "learning_rate": 3.5081502673400967e-06,
+      "loss": 0.2229,
+      "step": 18500
+    },
+    {
+      "epoch": 6.540447504302926,
+      "grad_norm": 20.512460708618164,
+      "learning_rate": 3.224296695626036e-06,
+      "loss": 0.2346,
+      "step": 19000
+    },
+    {
+      "epoch": 6.712564543889846,
+      "grad_norm": 50.5634651184082,
+      "learning_rate": 2.9468508246998915e-06,
+      "loss": 0.2213,
+      "step": 19500
+    },
+    {
+      "epoch": 6.884681583476764,
+      "grad_norm": 7.660253047943115,
+      "learning_rate": 2.6768138297700173e-06,
+      "loss": 0.2327,
+      "step": 20000
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.7129575828006973,
+      "eval_f1": 0.7124027051593957,
+      "eval_loss": 1.0587843656539917,
+      "eval_runtime": 23.5153,
+      "eval_samples_per_second": 219.559,
+      "eval_steps_per_second": 3.445,
+      "step": 20335
+    },
+    {
+      "epoch": 7.056798623063683,
+      "grad_norm": 7.952240467071533,
+      "learning_rate": 2.4151601508010914e-06,
+      "loss": 0.2173,
+      "step": 20500
+    },
+    {
+      "epoch": 7.228915662650603,
+      "grad_norm": 37.356449127197266,
+      "learning_rate": 2.162833976206092e-06,
+      "loss": 0.1777,
+      "step": 21000
+    },
+    {
+      "epoch": 7.401032702237521,
+      "grad_norm": 12.354819297790527,
+      "learning_rate": 1.920745835702335e-06,
+      "loss": 0.1909,
+      "step": 21500
+    },
+    {
+      "epoch": 7.573149741824441,
+      "grad_norm": 27.18878936767578,
+      "learning_rate": 1.6897693146263067e-06,
+      "loss": 0.1894,
+      "step": 22000
+    },
+    {
+      "epoch": 7.74526678141136,
+      "grad_norm": 10.569825172424316,
+      "learning_rate": 1.4707379015638784e-06,
+      "loss": 0.1775,
+      "step": 22500
+    },
+    {
+      "epoch": 7.917383820998279,
+      "grad_norm": 15.58621883392334,
+      "learning_rate": 1.264441980671345e-06,
+      "loss": 0.1751,
+      "step": 23000
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.7129575828006973,
+      "eval_f1": 0.7124591956357624,
+      "eval_loss": 1.1589008569717407,
+      "eval_runtime": 23.5306,
+      "eval_samples_per_second": 219.417,
+      "eval_steps_per_second": 3.442,
+      "step": 23240
+    },
+    {
+      "epoch": 8.089500860585199,
+      "grad_norm": 18.19190788269043,
+      "learning_rate": 1.0716259795406304e-06,
+      "loss": 0.17,
+      "step": 23500
+    },
+    {
+      "epoch": 8.261617900172118,
+      "grad_norm": 1.6293628215789795,
+      "learning_rate": 8.929856829007067e-07,
+      "loss": 0.1527,
+      "step": 24000
+    },
+    {
+      "epoch": 8.433734939759036,
+      "grad_norm": 38.503089904785156,
+      "learning_rate": 7.291657218488491e-07,
+      "loss": 0.1506,
+      "step": 24500
+    },
+    {
+      "epoch": 8.605851979345955,
+      "grad_norm": 6.490494728088379,
+      "learning_rate": 5.807572476719431e-07,
+      "loss": 0.1615,
+      "step": 25000
+    },
+    {
+      "epoch": 8.777969018932874,
+      "grad_norm": 15.903548240661621,
+      "learning_rate": 4.4829579865196096e-07,
+      "loss": 0.1439,
+      "step": 25500
+    },
+    {
+      "epoch": 8.950086058519794,
+      "grad_norm": 7.3351569175720215,
+      "learning_rate": 3.32259367553327e-07,
+      "loss": 0.1686,
+      "step": 26000
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.7112144102266125,
+      "eval_f1": 0.7106582757725869,
+      "eval_loss": 1.192394733428955,
+      "eval_runtime": 23.4543,
+      "eval_samples_per_second": 220.13,
+      "eval_steps_per_second": 3.454,
+      "step": 26145
+    },
+    {
+      "epoch": 9.122203098106713,
+      "grad_norm": 25.813560485839844,
+      "learning_rate": 2.3306667676572413e-07,
+      "loss": 0.139,
+      "step": 26500
+    },
+    {
+      "epoch": 9.294320137693632,
+      "grad_norm": 15.110641479492188,
+      "learning_rate": 1.5107566732657176e-07,
+      "loss": 0.1417,
+      "step": 27000
+    },
+    {
+      "epoch": 9.46643717728055,
+      "grad_norm": 4.259241580963135,
+      "learning_rate": 8.65822072755873e-08,
+      "loss": 0.1331,
+      "step": 27500
+    },
+    {
+      "epoch": 9.638554216867469,
+      "grad_norm": 39.04631042480469,
+      "learning_rate": 3.981902400240101e-08,
+      "loss": 0.1353,
+      "step": 28000
+    },
+    {
+      "epoch": 9.81067125645439,
+      "grad_norm": 10.42868709564209,
+      "learning_rate": 1.095486443988547e-08,
+      "loss": 0.141,
+      "step": 28500
+    },
+    {
+      "epoch": 9.982788296041308,
+      "grad_norm": 37.38633346557617,
+      "learning_rate": 9.388613368188637e-11,
+      "loss": 0.1499,
+      "step": 29000
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.7100522951772226,
+      "eval_f1": 0.7096747565777057,
+      "eval_loss": 1.2027859687805176,
+      "eval_runtime": 23.841,
+      "eval_samples_per_second": 216.56,
+      "eval_steps_per_second": 3.398,
+      "step": 29050
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 29050,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 3.05647356425472e+16,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

train_validation_epoc10_late1e-5_/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fd90fb1d0a1e74848481641c01cac1349a36e03c77cd2f84aa53f19c3dabde55
+size 5432