Upload folder using huggingface_hub

Browse files

Files changed (11) hide show

config.json +37 -0
model.safetensors +3 -0
optimizer.pt +3 -0
rng_state.pth +3 -0
scheduler.pt +3 -0
special_tokens_map.json +7 -0
tokenizer.json +0 -0
tokenizer_config.json +58 -0
trainer_state.json +178 -0
training_args.bin +3 -0
vocab.txt +0 -0

config.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "architectures": [
+    "ElectraForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "embedding_size": 768,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Human",
+    "1": "AI"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "AI": 1,
+    "Human": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "electra",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "summary_activation": "gelu",
+  "summary_last_dropout": 0.1,
+  "summary_type": "first",
+  "summary_use_proj": true,
+  "transformers_version": "4.56.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 32000
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b23d43b4ac265397b1a6ba0b269fd737355d35a96465a195290406539501b516
+size 442499672

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9a131dfa53d426e18f6c2beb2d67b7ec074d09918a14af79373aef348f52bd7b
+size 202031435

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d420a716ff13fe6c6cfa712e85147cdd935479d770764b798412ddcf6f7a2068
+size 14645

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8597a0eddb2edf7fb48a2a97659c7edd4875a357f2c4644de9a8f0f1e770a30a
+size 1465

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "4": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": false,
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "model_max_length": 1000000000000000019884624838656,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "ElectraTokenizer",
+  "unk_token": "[UNK]"
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,178 @@

+{
+  "best_global_step": 485,
+  "best_metric": 0.9733218588640276,
+  "best_model_checkpoint": "models/electra-base-discriminator-bahasa-cased-512-seq/checkpoint-485",
+  "epoch": 3.0,
+  "eval_steps": 97,
+  "global_step": 873,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.3333333333333333,
+      "grad_norm": 2.162574291229248,
+      "learning_rate": 0.00019994875242584925,
+      "loss": 0.6418,
+      "step": 97
+    },
+    {
+      "epoch": 0.3333333333333333,
+      "eval_accuracy": 0.6751290877796902,
+      "eval_loss": 0.6097611784934998,
+      "eval_runtime": 14.3421,
+      "eval_samples_per_second": 162.041,
+      "eval_steps_per_second": 5.09,
+      "step": 97
+    },
+    {
+      "epoch": 0.6666666666666666,
+      "grad_norm": 2.945030450820923,
+      "learning_rate": 0.00019130020543448704,
+      "loss": 0.4696,
+      "step": 194
+    },
+    {
+      "epoch": 0.6666666666666666,
+      "eval_accuracy": 0.9453528399311532,
+      "eval_loss": 0.2995855510234833,
+      "eval_runtime": 14.3943,
+      "eval_samples_per_second": 161.453,
+      "eval_steps_per_second": 5.071,
+      "step": 194
+    },
+    {
+      "epoch": 1.0,
+      "grad_norm": 20.851119995117188,
+      "learning_rate": 0.00016906493009392686,
+      "loss": 0.3585,
+      "step": 291
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9668674698795181,
+      "eval_loss": 0.2586265504360199,
+      "eval_runtime": 14.3873,
+      "eval_samples_per_second": 161.532,
+      "eval_steps_per_second": 5.074,
+      "step": 291
+    },
+    {
+      "epoch": 1.3333333333333333,
+      "grad_norm": 9.39693832397461,
+      "learning_rate": 0.00013655184169503949,
+      "loss": 0.2635,
+      "step": 388
+    },
+    {
+      "epoch": 1.3333333333333333,
+      "eval_accuracy": 0.9707401032702238,
+      "eval_loss": 0.26390692591667175,
+      "eval_runtime": 14.3548,
+      "eval_samples_per_second": 161.897,
+      "eval_steps_per_second": 5.085,
+      "step": 388
+    },
+    {
+      "epoch": 1.6666666666666665,
+      "grad_norm": 1.9695847034454346,
+      "learning_rate": 9.85993357021825e-05,
+      "loss": 0.2569,
+      "step": 485
+    },
+    {
+      "epoch": 1.6666666666666665,
+      "eval_accuracy": 0.9733218588640276,
+      "eval_loss": 0.25199127197265625,
+      "eval_runtime": 14.3798,
+      "eval_samples_per_second": 161.615,
+      "eval_steps_per_second": 5.077,
+      "step": 485
+    },
+    {
+      "epoch": 2.0,
+      "grad_norm": 0.28883352875709534,
+      "learning_rate": 6.085526785283575e-05,
+      "loss": 0.2484,
+      "step": 582
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9462134251290878,
+      "eval_loss": 0.31412678956985474,
+      "eval_runtime": 14.3715,
+      "eval_samples_per_second": 161.709,
+      "eval_steps_per_second": 5.079,
+      "step": 582
+    },
+    {
+      "epoch": 2.3333333333333335,
+      "grad_norm": 3.2036261558532715,
+      "learning_rate": 2.8936475417214794e-05,
+      "loss": 0.2213,
+      "step": 679
+    },
+    {
+      "epoch": 2.3333333333333335,
+      "eval_accuracy": 0.9677280550774526,
+      "eval_loss": 0.27302563190460205,
+      "eval_runtime": 14.3894,
+      "eval_samples_per_second": 161.507,
+      "eval_steps_per_second": 5.073,
+      "step": 679
+    },
+    {
+      "epoch": 2.6666666666666665,
+      "grad_norm": 10.041082382202148,
+      "learning_rate": 7.59291443313389e-06,
+      "loss": 0.2173,
+      "step": 776
+    },
+    {
+      "epoch": 2.6666666666666665,
+      "eval_accuracy": 0.9612736660929432,
+      "eval_loss": 0.287920206785202,
+      "eval_runtime": 14.3754,
+      "eval_samples_per_second": 161.665,
+      "eval_steps_per_second": 5.078,
+      "step": 776
+    },
+    {
+      "epoch": 3.0,
+      "grad_norm": 0.965843141078949,
+      "learning_rate": 8.008106802126492e-10,
+      "loss": 0.2196,
+      "step": 873
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9664371772805508,
+      "eval_loss": 0.2767605185508728,
+      "eval_runtime": 14.3762,
+      "eval_samples_per_second": 161.656,
+      "eval_steps_per_second": 5.078,
+      "step": 873
+    }
+  ],
+  "logging_steps": 97,
+  "max_steps": 873,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 97,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 4489644826458240.0,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:61e24b1392f667241644d855919889280be6467f22d0772287e2dae06e59987f
+size 6033

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff