anhtunguyen98 commited on 21 days ago

Commit

176c816

verified ·

1 Parent(s): 382f7eb

Upload folder using huggingface_hub

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +10 -0
joint_model/checkpoint-1116/config.json +27 -0
joint_model/checkpoint-1116/model.safetensors +3 -0
joint_model/checkpoint-1116/optimizer.pt +3 -0
joint_model/checkpoint-1116/rng_state_0.pth +3 -0
joint_model/checkpoint-1116/rng_state_1.pth +3 -0
joint_model/checkpoint-1116/rng_state_2.pth +3 -0
joint_model/checkpoint-1116/rng_state_3.pth +3 -0
joint_model/checkpoint-1116/rng_state_4.pth +3 -0
joint_model/checkpoint-1116/rng_state_5.pth +3 -0
joint_model/checkpoint-1116/rng_state_6.pth +3 -0
joint_model/checkpoint-1116/rng_state_7.pth +3 -0
joint_model/checkpoint-1116/scheduler.pt +3 -0
joint_model/checkpoint-1116/sentencepiece.bpe.model +3 -0
joint_model/checkpoint-1116/special_tokens_map.json +15 -0
joint_model/checkpoint-1116/tokenizer.json +3 -0
joint_model/checkpoint-1116/tokenizer_config.json +55 -0
joint_model/checkpoint-1116/trainer_state.json +96 -0
joint_model/checkpoint-1116/training_args.bin +3 -0
joint_model/checkpoint-1395/config.json +27 -0
joint_model/checkpoint-1395/model.safetensors +3 -0
joint_model/checkpoint-1395/optimizer.pt +3 -0
joint_model/checkpoint-1395/rng_state_0.pth +3 -0
joint_model/checkpoint-1395/rng_state_1.pth +3 -0
joint_model/checkpoint-1395/rng_state_2.pth +3 -0
joint_model/checkpoint-1395/rng_state_3.pth +3 -0
joint_model/checkpoint-1395/rng_state_4.pth +3 -0
joint_model/checkpoint-1395/rng_state_5.pth +3 -0
joint_model/checkpoint-1395/rng_state_6.pth +3 -0
joint_model/checkpoint-1395/rng_state_7.pth +3 -0
joint_model/checkpoint-1395/scheduler.pt +3 -0
joint_model/checkpoint-1395/sentencepiece.bpe.model +3 -0
joint_model/checkpoint-1395/special_tokens_map.json +15 -0
joint_model/checkpoint-1395/tokenizer.json +3 -0
joint_model/checkpoint-1395/tokenizer_config.json +55 -0
joint_model/checkpoint-1395/trainer_state.json +108 -0
joint_model/checkpoint-1395/training_args.bin +3 -0
joint_model/checkpoint-1674/config.json +27 -0
joint_model/checkpoint-1674/model.safetensors +3 -0
joint_model/checkpoint-1674/optimizer.pt +3 -0
joint_model/checkpoint-1674/rng_state_0.pth +3 -0
joint_model/checkpoint-1674/rng_state_1.pth +3 -0
joint_model/checkpoint-1674/rng_state_2.pth +3 -0
joint_model/checkpoint-1674/rng_state_3.pth +3 -0
joint_model/checkpoint-1674/rng_state_4.pth +3 -0
joint_model/checkpoint-1674/rng_state_5.pth +3 -0
joint_model/checkpoint-1674/rng_state_6.pth +3 -0
joint_model/checkpoint-1674/rng_state_7.pth +3 -0
joint_model/checkpoint-1674/scheduler.pt +3 -0
joint_model/checkpoint-1674/sentencepiece.bpe.model +3 -0

.gitattributes CHANGED Viewed

@@ -38,3 +38,13 @@ xlm/hierarchical_xlm_roberta/checkpoint-2688/tokenizer.json filter=lfs diff=lfs
 xlm/hierarchical_xlm_roberta/checkpoint-3584/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 xlm/hierarchical_xlm_roberta/checkpoint-4480/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 xlm/hierarchical_xlm_roberta/checkpoint-896/tokenizer.json filter=lfs diff=lfs merge=lfs -text

 xlm/hierarchical_xlm_roberta/checkpoint-3584/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 xlm/hierarchical_xlm_roberta/checkpoint-4480/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 xlm/hierarchical_xlm_roberta/checkpoint-896/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+joint_model/checkpoint-1116/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+joint_model/checkpoint-1395/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+joint_model/checkpoint-1674/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+joint_model/checkpoint-1953/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+joint_model/checkpoint-2232/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+joint_model/checkpoint-2511/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+joint_model/checkpoint-279/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+joint_model/checkpoint-2790/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+joint_model/checkpoint-558/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+joint_model/checkpoint-837/tokenizer.json filter=lfs diff=lfs merge=lfs -text

joint_model/checkpoint-1116/config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "architectures": [
+    "HierarchicalXLMRoberta"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.56.1",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

joint_model/checkpoint-1116/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6792b2f6f167bf98323526de92da30fc30176242f8e06b2af08a1f76528af6d2
+size 1112408092

joint_model/checkpoint-1116/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:09fab47c4a460fe4a9c21057cf29f5557d19a2d723b628bc0898a267dadaa022
+size 2224937355

joint_model/checkpoint-1116/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8c2ca6cda30f0e67f92af2785341362f9fd75975cfa0e1e3edf170b31356982d
+size 16389

joint_model/checkpoint-1116/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4e19c421d330efe795fe888269f2979bdecc155b8ec1bae695ab646f830eda58
+size 16389

joint_model/checkpoint-1116/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f4bfe1bdb6ffcc11de3dfa36f4f902a025948dd1a9d55f9e2a0c37a0c71d8993
+size 16389

joint_model/checkpoint-1116/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a7db4f6f2db3a4f2891f0c6123c6790aa8182a24731540060e1c5162bdfcf332
+size 16389

joint_model/checkpoint-1116/rng_state_4.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e325614869957231c07b72ed17ee0c0dec786269ff93abf17b16883c45761f74
+size 16389

joint_model/checkpoint-1116/rng_state_5.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f06f2380c4f07e128133b104b687744df3b4064ecc4b332886d237fcca20b844
+size 16389

joint_model/checkpoint-1116/rng_state_6.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6806143edb28cfaf20fbcd82eda60303d3570b7414ff8996f022cf2b33990496
+size 16389

joint_model/checkpoint-1116/rng_state_7.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cd5cdf368ea3798bd2e333443bb2d4214053bef95ce8af4541fba9630a6adda4
+size 16389

joint_model/checkpoint-1116/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7d771b00dd64d2f869efc678cde233c82e3d5d80f32fc0afc37d60c16f5276a7
+size 1465

joint_model/checkpoint-1116/sentencepiece.bpe.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
+size 5069051

joint_model/checkpoint-1116/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

joint_model/checkpoint-1116/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3a56def25aa40facc030ea8b0b87f3688e4b3c39eb8b45d5702b3a1300fe2a20
+size 17082734

joint_model/checkpoint-1116/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "250001": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "extra_special_tokens": {},
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}

joint_model/checkpoint-1116/trainer_state.json ADDED Viewed

	@@ -0,0 +1,96 @@

+{
+  "best_global_step": 1116,
+  "best_metric": 0.3113965690135956,
+  "best_model_checkpoint": "./checkpoints/joint_model_robust/checkpoint-1116",
+  "epoch": 4.0,
+  "eval_steps": 500,
+  "global_step": 1116,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy_level1": 0.943,
+      "eval_accuracy_level2": 0.8282,
+      "eval_f1_level1": 0.9424784900051851,
+      "eval_f1_level2": 0.7894811362618394,
+      "eval_loss": 1.1101479530334473,
+      "eval_runtime": 0.6677,
+      "eval_samples_per_second": 7488.47,
+      "eval_steps_per_second": 14.977,
+      "step": 279
+    },
+    {
+      "epoch": 1.7921146953405018,
+      "grad_norm": 8.197423934936523,
+      "learning_rate": 1.642293906810036e-05,
+      "loss": 2.029,
+      "step": 500
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy_level1": 0.963,
+      "eval_accuracy_level2": 0.9134,
+      "eval_f1_level1": 0.962976281751424,
+      "eval_f1_level2": 0.9010101771001547,
+      "eval_loss": 0.5648184418678284,
+      "eval_runtime": 0.6225,
+      "eval_samples_per_second": 8032.157,
+      "eval_steps_per_second": 16.064,
+      "step": 558
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy_level1": 0.9684,
+      "eval_accuracy_level2": 0.9404,
+      "eval_f1_level1": 0.9683869415305786,
+      "eval_f1_level2": 0.9353991249189201,
+      "eval_loss": 0.3886409401893616,
+      "eval_runtime": 0.7756,
+      "eval_samples_per_second": 6447.003,
+      "eval_steps_per_second": 12.894,
+      "step": 837
+    },
+    {
+      "epoch": 3.5842293906810037,
+      "grad_norm": 9.112466812133789,
+      "learning_rate": 1.2838709677419356e-05,
+      "loss": 0.5009,
+      "step": 1000
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy_level1": 0.976,
+      "eval_accuracy_level2": 0.948,
+      "eval_f1_level1": 0.9759892345948809,
+      "eval_f1_level2": 0.944852130743217,
+      "eval_loss": 0.3113965690135956,
+      "eval_runtime": 0.7752,
+      "eval_samples_per_second": 6449.701,
+      "eval_steps_per_second": 12.899,
+      "step": 1116
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 2790,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 2.9380585063448576e+16,
+  "train_batch_size": 64,
+  "trial_name": null,
+  "trial_params": null
+}

joint_model/checkpoint-1116/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c61cfce4a431b5c6aaf6df7e91cc42eb1031611f44550485e4e6ebe452339c18
+size 5777

joint_model/checkpoint-1395/config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "architectures": [
+    "HierarchicalXLMRoberta"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.56.1",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

joint_model/checkpoint-1395/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c41e0216d9d3862040536a7fd9ba6b254a014777b0d7f1662f492db7a971f406
+size 1112408092

joint_model/checkpoint-1395/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5607b6daf0f0a370ccef9270477c2e9a830246c8af0dd0c7fe8549c739d2e9ac
+size 2224937355

joint_model/checkpoint-1395/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:372eabe9ee1b698bd155ed64252bb52ecd85f363df08d4a6c4512f0e000cb9b7
+size 16389

joint_model/checkpoint-1395/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d00e489391354b35849c16d9fa756e7012f5711d57ab1683f71c55ef187b9dd2
+size 16389

joint_model/checkpoint-1395/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4a0cf5772222d7ef83bf5bfa008bd16ddb5100e0b47d95a97be765c501e4e3cc
+size 16389

joint_model/checkpoint-1395/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:622b3cd66dcaf83e587a5e0c31a6797932cb588d1367575466e0b8eac0b6b732
+size 16389

joint_model/checkpoint-1395/rng_state_4.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9dfb97eabb2e40d9e6d49009ad4b964b2c73fa42fbf32c8b1f59ae56bf87d92e
+size 16389

joint_model/checkpoint-1395/rng_state_5.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4c2e0af24431f9c87afbbee452b8c4cb68e55978cc475aca99862285217c6f8a
+size 16389

joint_model/checkpoint-1395/rng_state_6.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4c209482d19626584d72a324c23675cfbc298544cbd62b33073d59f67aa1d16e
+size 16389

joint_model/checkpoint-1395/rng_state_7.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1547a4b17eaa25162d8c2232659379d5dc26ac63c151280e984e29b60718d591
+size 16389

joint_model/checkpoint-1395/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9f9f1682436aaf9d161d72dc7e582154d9fbe0f817b46fd9cdc83dc2d8f4ef8f
+size 1465

joint_model/checkpoint-1395/sentencepiece.bpe.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
+size 5069051

joint_model/checkpoint-1395/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

joint_model/checkpoint-1395/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3a56def25aa40facc030ea8b0b87f3688e4b3c39eb8b45d5702b3a1300fe2a20
+size 17082734

joint_model/checkpoint-1395/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "250001": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "extra_special_tokens": {},
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}

joint_model/checkpoint-1395/trainer_state.json ADDED Viewed

	@@ -0,0 +1,108 @@

+{
+  "best_global_step": 1395,
+  "best_metric": 0.2682338356971741,
+  "best_model_checkpoint": "./checkpoints/joint_model_robust/checkpoint-1395",
+  "epoch": 5.0,
+  "eval_steps": 500,
+  "global_step": 1395,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy_level1": 0.943,
+      "eval_accuracy_level2": 0.8282,
+      "eval_f1_level1": 0.9424784900051851,
+      "eval_f1_level2": 0.7894811362618394,
+      "eval_loss": 1.1101479530334473,
+      "eval_runtime": 0.6677,
+      "eval_samples_per_second": 7488.47,
+      "eval_steps_per_second": 14.977,
+      "step": 279
+    },
+    {
+      "epoch": 1.7921146953405018,
+      "grad_norm": 8.197423934936523,
+      "learning_rate": 1.642293906810036e-05,
+      "loss": 2.029,
+      "step": 500
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy_level1": 0.963,
+      "eval_accuracy_level2": 0.9134,
+      "eval_f1_level1": 0.962976281751424,
+      "eval_f1_level2": 0.9010101771001547,
+      "eval_loss": 0.5648184418678284,
+      "eval_runtime": 0.6225,
+      "eval_samples_per_second": 8032.157,
+      "eval_steps_per_second": 16.064,
+      "step": 558
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy_level1": 0.9684,
+      "eval_accuracy_level2": 0.9404,
+      "eval_f1_level1": 0.9683869415305786,
+      "eval_f1_level2": 0.9353991249189201,
+      "eval_loss": 0.3886409401893616,
+      "eval_runtime": 0.7756,
+      "eval_samples_per_second": 6447.003,
+      "eval_steps_per_second": 12.894,
+      "step": 837
+    },
+    {
+      "epoch": 3.5842293906810037,
+      "grad_norm": 9.112466812133789,
+      "learning_rate": 1.2838709677419356e-05,
+      "loss": 0.5009,
+      "step": 1000
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy_level1": 0.976,
+      "eval_accuracy_level2": 0.948,
+      "eval_f1_level1": 0.9759892345948809,
+      "eval_f1_level2": 0.944852130743217,
+      "eval_loss": 0.3113965690135956,
+      "eval_runtime": 0.7752,
+      "eval_samples_per_second": 6449.701,
+      "eval_steps_per_second": 12.899,
+      "step": 1116
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy_level1": 0.9786,
+      "eval_accuracy_level2": 0.9574,
+      "eval_f1_level1": 0.9786086703124734,
+      "eval_f1_level2": 0.9558414971682437,
+      "eval_loss": 0.2682338356971741,
+      "eval_runtime": 0.7265,
+      "eval_samples_per_second": 6882.558,
+      "eval_steps_per_second": 13.765,
+      "step": 1395
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 2790,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 3.672573129575629e+16,
+  "train_batch_size": 64,
+  "trial_name": null,
+  "trial_params": null
+}

joint_model/checkpoint-1395/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c61cfce4a431b5c6aaf6df7e91cc42eb1031611f44550485e4e6ebe452339c18
+size 5777

joint_model/checkpoint-1674/config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "architectures": [
+    "HierarchicalXLMRoberta"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.56.1",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

joint_model/checkpoint-1674/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:07732aadf5ff31e4f11ced15e3b3f675dcec364a1c0b188e03180a6719bbc0bc
+size 1112408092

joint_model/checkpoint-1674/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c772fa9b4c710c806b65a2db5c8842dd78cbf61f45a0b88ae50f5bedc42508d0
+size 2224937355

joint_model/checkpoint-1674/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:244fd61bffb73015ca283aaf0b690244b4bf656c6c488f789153206cc5ca419c
+size 16389

joint_model/checkpoint-1674/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a85bf43502cd59c3e7002fdd28d84f2755d1d50b9f8395ece5cce57a33e6a2de
+size 16389

joint_model/checkpoint-1674/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2f36f28619c5d75933e40cf2ed1e4be028945b0f4185cc9e11476f543d2e8d7c
+size 16389

joint_model/checkpoint-1674/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b838f4cf0f902e11d576f4b832468a92c12d05620e73c537a7302c86e09c2752
+size 16389

joint_model/checkpoint-1674/rng_state_4.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5c946fcb7164ab82957cc2fd2229fec1ea962b6eb3608757ad9302a5956a5782
+size 16389

joint_model/checkpoint-1674/rng_state_5.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1498a3eb9fd6a568db26513c62c91ef104aa0da2637df120f18cbd8604a6fefc
+size 16389

joint_model/checkpoint-1674/rng_state_6.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1f449c8299ada96be66c0e08d0603887c01bcef56d3f3c2bf63a0fc8a43664aa
+size 16389

joint_model/checkpoint-1674/rng_state_7.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0a2a661a72b9f31cca93340f54a4c320474844987c784955cd6cf6c6f2d2cd65
+size 16389

joint_model/checkpoint-1674/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1e9460e5ee67dc8bfa729d93fdbc410d0dd92c60badc5c6eac4d11137e2d9011
+size 1465

joint_model/checkpoint-1674/sentencepiece.bpe.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
+size 5069051