Upload folder using huggingface_hub

Browse files

Files changed (14) hide show

.gitattributes +2 -0
checkpoint-176/config.json +43 -0
checkpoint-176/special_tokens_map.json +51 -0
checkpoint-176/tokenizer.json +3 -0
checkpoint-176/tokenizer_config.json +59 -0
checkpoint-176/trainer_state.json +153 -0
checkpoint-176/training_args.bin +3 -0
checkpoint-220/config.json +43 -0
checkpoint-220/special_tokens_map.json +51 -0
checkpoint-220/tokenizer.json +3 -0
checkpoint-220/tokenizer_config.json +59 -0
checkpoint-220/trainer_state.json +188 -0
checkpoint-220/training_args.bin +3 -0
pytorch_model.bin +1 -1

.gitattributes CHANGED Viewed

@@ -43,3 +43,5 @@ checkpoint-612/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 checkpoint-765/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 checkpoint-76/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 checkpoint-95/tokenizer.json filter=lfs diff=lfs merge=lfs -text

 checkpoint-765/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 checkpoint-76/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 checkpoint-95/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+checkpoint-176/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+checkpoint-220/tokenizer.json filter=lfs diff=lfs merge=lfs -text

checkpoint-176/config.json ADDED Viewed

	@@ -0,0 +1,43 @@

+{
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "\u0e01\u0e32\u0e23\u0e08\u0e49\u0e32\u0e07\u0e23\u0e16\u0e23\u0e31\u0e1a\u0e2a\u0e48\u0e07\u0e2a\u0e34\u0e19\u0e04\u0e49\u0e32",
+    "1": "\u0e44\u0e21\u0e48\u0e43\u0e0a\u0e48\u0e01\u0e32\u0e23\u0e08\u0e49\u0e32\u0e07\u0e23\u0e16\u0e23\u0e31\u0e1a\u0e2a\u0e48\u0e07\u0e2a\u0e34\u0e19\u0e04\u0e49\u0e32"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "entailment": 0,
+    "not_entailment": 1
+  },
+  "layer_norm_eps": 1e-07,
+  "legacy": true,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 768,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.52.4",
+  "type_vocab_size": 0,
+  "vocab_size": 251000
+}

checkpoint-176/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "bos_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "cls_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "[MASK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "[PAD]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

checkpoint-176/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:824e7d82bc5560a30dcf36d84d4598ddcb0ca3c1b3fe38e698105f778bf89d3e
+size 16316224

checkpoint-176/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,59 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "250101": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "[CLS]",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "eos_token": "[SEP]",
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "sp_model_kwargs": {},
+  "split_by_punct": false,
+  "tokenizer_class": "DebertaV2Tokenizer",
+  "unk_token": "[UNK]",
+  "vocab_type": "spm"
+}

checkpoint-176/trainer_state.json ADDED Viewed

	@@ -0,0 +1,153 @@

+{
+  "best_global_step": null,
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 4.0,
+  "eval_steps": 500,
+  "global_step": 176,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.22727272727272727,
+      "grad_norm": 8.667610168457031,
+      "learning_rate": 1.9181818181818183e-05,
+      "loss": 0.5911,
+      "step": 10
+    },
+    {
+      "epoch": 0.45454545454545453,
+      "grad_norm": 6.615207672119141,
+      "learning_rate": 1.8272727272727275e-05,
+      "loss": 0.464,
+      "step": 20
+    },
+    {
+      "epoch": 0.6818181818181818,
+      "grad_norm": 13.182315826416016,
+      "learning_rate": 1.7363636363636363e-05,
+      "loss": 0.3223,
+      "step": 30
+    },
+    {
+      "epoch": 0.9090909090909091,
+      "grad_norm": 8.283531188964844,
+      "learning_rate": 1.6454545454545455e-05,
+      "loss": 0.2932,
+      "step": 40
+    },
+    {
+      "epoch": 1.1363636363636362,
+      "grad_norm": 2.350064277648926,
+      "learning_rate": 1.5545454545454547e-05,
+      "loss": 0.3104,
+      "step": 50
+    },
+    {
+      "epoch": 1.3636363636363638,
+      "grad_norm": 1.3099472522735596,
+      "learning_rate": 1.4636363636363637e-05,
+      "loss": 0.2794,
+      "step": 60
+    },
+    {
+      "epoch": 1.5909090909090908,
+      "grad_norm": 0.701838493347168,
+      "learning_rate": 1.3727272727272729e-05,
+      "loss": 0.1536,
+      "step": 70
+    },
+    {
+      "epoch": 1.8181818181818183,
+      "grad_norm": 0.7129743695259094,
+      "learning_rate": 1.281818181818182e-05,
+      "loss": 0.2083,
+      "step": 80
+    },
+    {
+      "epoch": 2.0454545454545454,
+      "grad_norm": 5.099246025085449,
+      "learning_rate": 1.190909090909091e-05,
+      "loss": 0.1498,
+      "step": 90
+    },
+    {
+      "epoch": 2.2727272727272725,
+      "grad_norm": 25.056194305419922,
+      "learning_rate": 1.1000000000000001e-05,
+      "loss": 0.2337,
+      "step": 100
+    },
+    {
+      "epoch": 2.5,
+      "grad_norm": 27.893611907958984,
+      "learning_rate": 1.0090909090909092e-05,
+      "loss": 0.1566,
+      "step": 110
+    },
+    {
+      "epoch": 2.7272727272727275,
+      "grad_norm": 0.9230498671531677,
+      "learning_rate": 9.181818181818184e-06,
+      "loss": 0.1208,
+      "step": 120
+    },
+    {
+      "epoch": 2.9545454545454546,
+      "grad_norm": 0.20559445023536682,
+      "learning_rate": 8.272727272727274e-06,
+      "loss": 0.2526,
+      "step": 130
+    },
+    {
+      "epoch": 3.1818181818181817,
+      "grad_norm": 8.288787841796875,
+      "learning_rate": 7.363636363636364e-06,
+      "loss": 0.1241,
+      "step": 140
+    },
+    {
+      "epoch": 3.409090909090909,
+      "grad_norm": 0.2578887343406677,
+      "learning_rate": 6.454545454545456e-06,
+      "loss": 0.1863,
+      "step": 150
+    },
+    {
+      "epoch": 3.6363636363636362,
+      "grad_norm": 0.26157981157302856,
+      "learning_rate": 5.545454545454546e-06,
+      "loss": 0.1131,
+      "step": 160
+    },
+    {
+      "epoch": 3.8636363636363638,
+      "grad_norm": 10.041345596313477,
+      "learning_rate": 4.636363636363636e-06,
+      "loss": 0.1458,
+      "step": 170
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 220,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 99723447817788.0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-176/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cc8f550d6d3617db1b6992d1d5c428d1c2201c6e42324b75997f5dd20f4df04e
+size 5649

checkpoint-220/config.json ADDED Viewed

	@@ -0,0 +1,43 @@

+{
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "\u0e01\u0e32\u0e23\u0e08\u0e49\u0e32\u0e07\u0e23\u0e16\u0e23\u0e31\u0e1a\u0e2a\u0e48\u0e07\u0e2a\u0e34\u0e19\u0e04\u0e49\u0e32",
+    "1": "\u0e44\u0e21\u0e48\u0e43\u0e0a\u0e48\u0e01\u0e32\u0e23\u0e08\u0e49\u0e32\u0e07\u0e23\u0e16\u0e23\u0e31\u0e1a\u0e2a\u0e48\u0e07\u0e2a\u0e34\u0e19\u0e04\u0e49\u0e32"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "entailment": 0,
+    "not_entailment": 1
+  },
+  "layer_norm_eps": 1e-07,
+  "legacy": true,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 768,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.52.4",
+  "type_vocab_size": 0,
+  "vocab_size": 251000
+}

checkpoint-220/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "bos_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "cls_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "[MASK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "[PAD]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

checkpoint-220/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:824e7d82bc5560a30dcf36d84d4598ddcb0ca3c1b3fe38e698105f778bf89d3e
+size 16316224

checkpoint-220/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,59 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "250101": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "[CLS]",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "eos_token": "[SEP]",
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "sp_model_kwargs": {},
+  "split_by_punct": false,
+  "tokenizer_class": "DebertaV2Tokenizer",
+  "unk_token": "[UNK]",
+  "vocab_type": "spm"
+}

checkpoint-220/trainer_state.json ADDED Viewed

	@@ -0,0 +1,188 @@

+{
+  "best_global_step": null,
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 5.0,
+  "eval_steps": 500,
+  "global_step": 220,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.22727272727272727,
+      "grad_norm": 8.667610168457031,
+      "learning_rate": 1.9181818181818183e-05,
+      "loss": 0.5911,
+      "step": 10
+    },
+    {
+      "epoch": 0.45454545454545453,
+      "grad_norm": 6.615207672119141,
+      "learning_rate": 1.8272727272727275e-05,
+      "loss": 0.464,
+      "step": 20
+    },
+    {
+      "epoch": 0.6818181818181818,
+      "grad_norm": 13.182315826416016,
+      "learning_rate": 1.7363636363636363e-05,
+      "loss": 0.3223,
+      "step": 30
+    },
+    {
+      "epoch": 0.9090909090909091,
+      "grad_norm": 8.283531188964844,
+      "learning_rate": 1.6454545454545455e-05,
+      "loss": 0.2932,
+      "step": 40
+    },
+    {
+      "epoch": 1.1363636363636362,
+      "grad_norm": 2.350064277648926,
+      "learning_rate": 1.5545454545454547e-05,
+      "loss": 0.3104,
+      "step": 50
+    },
+    {
+      "epoch": 1.3636363636363638,
+      "grad_norm": 1.3099472522735596,
+      "learning_rate": 1.4636363636363637e-05,
+      "loss": 0.2794,
+      "step": 60
+    },
+    {
+      "epoch": 1.5909090909090908,
+      "grad_norm": 0.701838493347168,
+      "learning_rate": 1.3727272727272729e-05,
+      "loss": 0.1536,
+      "step": 70
+    },
+    {
+      "epoch": 1.8181818181818183,
+      "grad_norm": 0.7129743695259094,
+      "learning_rate": 1.281818181818182e-05,
+      "loss": 0.2083,
+      "step": 80
+    },
+    {
+      "epoch": 2.0454545454545454,
+      "grad_norm": 5.099246025085449,
+      "learning_rate": 1.190909090909091e-05,
+      "loss": 0.1498,
+      "step": 90
+    },
+    {
+      "epoch": 2.2727272727272725,
+      "grad_norm": 25.056194305419922,
+      "learning_rate": 1.1000000000000001e-05,
+      "loss": 0.2337,
+      "step": 100
+    },
+    {
+      "epoch": 2.5,
+      "grad_norm": 27.893611907958984,
+      "learning_rate": 1.0090909090909092e-05,
+      "loss": 0.1566,
+      "step": 110
+    },
+    {
+      "epoch": 2.7272727272727275,
+      "grad_norm": 0.9230498671531677,
+      "learning_rate": 9.181818181818184e-06,
+      "loss": 0.1208,
+      "step": 120
+    },
+    {
+      "epoch": 2.9545454545454546,
+      "grad_norm": 0.20559445023536682,
+      "learning_rate": 8.272727272727274e-06,
+      "loss": 0.2526,
+      "step": 130
+    },
+    {
+      "epoch": 3.1818181818181817,
+      "grad_norm": 8.288787841796875,
+      "learning_rate": 7.363636363636364e-06,
+      "loss": 0.1241,
+      "step": 140
+    },
+    {
+      "epoch": 3.409090909090909,
+      "grad_norm": 0.2578887343406677,
+      "learning_rate": 6.454545454545456e-06,
+      "loss": 0.1863,
+      "step": 150
+    },
+    {
+      "epoch": 3.6363636363636362,
+      "grad_norm": 0.26157981157302856,
+      "learning_rate": 5.545454545454546e-06,
+      "loss": 0.1131,
+      "step": 160
+    },
+    {
+      "epoch": 3.8636363636363638,
+      "grad_norm": 10.041345596313477,
+      "learning_rate": 4.636363636363636e-06,
+      "loss": 0.1458,
+      "step": 170
+    },
+    {
+      "epoch": 4.090909090909091,
+      "grad_norm": 0.2509705126285553,
+      "learning_rate": 3.727272727272728e-06,
+      "loss": 0.0781,
+      "step": 180
+    },
+    {
+      "epoch": 4.318181818181818,
+      "grad_norm": 0.141200453042984,
+      "learning_rate": 2.818181818181818e-06,
+      "loss": 0.1208,
+      "step": 190
+    },
+    {
+      "epoch": 4.545454545454545,
+      "grad_norm": 0.3103751242160797,
+      "learning_rate": 1.9090909090909095e-06,
+      "loss": 0.0898,
+      "step": 200
+    },
+    {
+      "epoch": 4.7727272727272725,
+      "grad_norm": 0.1590297371149063,
+      "learning_rate": 1.0000000000000002e-06,
+      "loss": 0.1013,
+      "step": 210
+    },
+    {
+      "epoch": 5.0,
+      "grad_norm": 67.25486755371094,
+      "learning_rate": 9.090909090909091e-08,
+      "loss": 0.2334,
+      "step": 220
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 220,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 124877726925996.0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-220/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cc8f550d6d3617db1b6992d1d5c428d1c2201c6e42324b75997f5dd20f4df04e
+size 5649

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0bb3d53157b1bfdf6a32cdfdf790ed619948436ab4fab0ef97fa026489262246
 size 1115313995

 version https://git-lfs.github.com/spec/v1
+oid sha256:5d47d0cdfb0bc4adbe4210fff08aef1bb071a5283d89101140a598926f7acfda
 size 1115313995