uvegesistvan commited on Feb 27, 2025

Commit

40dc61f

verified ·

1 Parent(s): d1f96f0

Upload folder using huggingface_hub

Browse files

Files changed (23) hide show

.gitattributes +1 -0
checkpoint-1024/config.json +28 -0
checkpoint-1024/model.safetensors +3 -0
checkpoint-1024/optimizer.pt +3 -0
checkpoint-1024/rng_state.pth +3 -0
checkpoint-1024/scheduler.pt +3 -0
checkpoint-1024/trainer_state.json +86 -0
checkpoint-1024/training_args.bin +3 -0
checkpoint-2048/config.json +28 -0
checkpoint-2048/model.safetensors +3 -0
checkpoint-2048/optimizer.pt +3 -0
checkpoint-2048/rng_state.pth +3 -0
checkpoint-2048/scheduler.pt +3 -0
checkpoint-2048/trainer_state.json +130 -0
checkpoint-2048/training_args.bin +3 -0
config.json +28 -0
logs/events.out.tfevents.1740652331.686e763fa1a3.6372.0 +3 -0
logs/events.out.tfevents.1740652422.686e763fa1a3.6372.1 +3 -0
model.safetensors +3 -0
special_tokens_map.json +15 -0
tokenizer.json +3 -0
tokenizer_config.json +55 -0
training_args.bin +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text

checkpoint-1024/config.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+  "_name_or_path": "xlm-roberta-large",
+  "architectures": [
+    "XLMRobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.49.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

checkpoint-1024/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a194e4caa903e2cc9a968fcee5892a44a70812c34b5fd6bcb2c94bd873271e26
+size 2239618672

checkpoint-1024/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:04fe8c6a0cdc80052d4edd41173c68a0cb3b00cb06d18603e3dff4fca640c9e9
+size 4479472785

checkpoint-1024/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ecb13755a864f8dee7fddec93c388dd3980f7ce7191684cc8a6907c340c0f7ce
+size 14244

checkpoint-1024/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1207f9ebb51e5a419c3af92c9b5c1dc262ba06ac06c677c8a33f76879c126163
+size 1064

checkpoint-1024/trainer_state.json ADDED Viewed

	@@ -0,0 +1,86 @@

+{
+  "best_metric": 0.9765567765567765,
+  "best_model_checkpoint": "model/checkpoint-1024",
+  "epoch": 2.0,
+  "eval_steps": 500,
+  "global_step": 1024,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "grad_norm": 0.062136758118867874,
+      "learning_rate": 1.9363439581125603e-05,
+      "loss": 0.1384,
+      "step": 512
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.93359375,
+      "eval_f1_macro": 0.9335684083589015,
+      "eval_f1_weighted": 0.9335582717024622,
+      "eval_loss": 0.10384641587734222,
+      "eval_precision_macro": 0.9347320773183263,
+      "eval_precision_weighted": 0.9349217985380474,
+      "eval_recall_macro": 0.9338033327229445,
+      "eval_recall_weighted": 0.93359375,
+      "eval_runtime": 9.4737,
+      "eval_samples_per_second": 27.022,
+      "eval_steps_per_second": 6.756,
+      "step": 512
+    },
+    {
+      "epoch": 2.0,
+      "grad_norm": 5.7770538330078125,
+      "learning_rate": 1.7273933762797558e-05,
+      "loss": 0.0833,
+      "step": 1024
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9765625,
+      "eval_f1_macro": 0.9765567765567765,
+      "eval_f1_weighted": 0.9765596382783882,
+      "eval_loss": 0.05563850328326225,
+      "eval_precision_macro": 0.9767328244274809,
+      "eval_precision_weighted": 0.9766760496183207,
+      "eval_recall_macro": 0.9765000305194409,
+      "eval_recall_weighted": 0.9765625,
+      "eval_runtime": 9.4836,
+      "eval_samples_per_second": 26.994,
+      "eval_steps_per_second": 6.748,
+      "step": 1024
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 4096,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 8,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 2,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 3813463138738176.0,
+  "train_batch_size": 4,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-1024/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:05f014aae6457a5193b7b97676fb49f1f8e5a4d72875fe8b03696e481f3aa324
+size 5240

checkpoint-2048/config.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+  "_name_or_path": "xlm-roberta-large",
+  "architectures": [
+    "XLMRobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.49.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

checkpoint-2048/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f4ec1c925d4ebc0b4487bd2af17fb9d768ad8e08abedb8360d221d6c01b49180
+size 2239618672

checkpoint-2048/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3cc1a8fa968b2a282750e9d7fa97a0638d4cd182deff6ea2b7c0d66e857ac1ad
+size 4479472785

checkpoint-2048/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8dab696f099f9aaba84af3bfd6d5ad35ed46f8eb262669e02ab70c95d26b7a8e
+size 14244

checkpoint-2048/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9230b238c7f6c83c2c2208411aa9c61e3f92b0235be4a40f7921eef6210e28f0
+size 1064

checkpoint-2048/trainer_state.json ADDED Viewed

	@@ -0,0 +1,130 @@

+{
+  "best_metric": 0.9765567765567765,
+  "best_model_checkpoint": "model/checkpoint-1024",
+  "epoch": 4.0,
+  "eval_steps": 500,
+  "global_step": 2048,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "grad_norm": 0.062136758118867874,
+      "learning_rate": 1.9363439581125603e-05,
+      "loss": 0.1384,
+      "step": 512
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.93359375,
+      "eval_f1_macro": 0.9335684083589015,
+      "eval_f1_weighted": 0.9335582717024622,
+      "eval_loss": 0.10384641587734222,
+      "eval_precision_macro": 0.9347320773183263,
+      "eval_precision_weighted": 0.9349217985380474,
+      "eval_recall_macro": 0.9338033327229445,
+      "eval_recall_weighted": 0.93359375,
+      "eval_runtime": 9.4737,
+      "eval_samples_per_second": 27.022,
+      "eval_steps_per_second": 6.756,
+      "step": 512
+    },
+    {
+      "epoch": 2.0,
+      "grad_norm": 5.7770538330078125,
+      "learning_rate": 1.7273933762797558e-05,
+      "loss": 0.0833,
+      "step": 1024
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9765625,
+      "eval_f1_macro": 0.9765567765567765,
+      "eval_f1_weighted": 0.9765596382783882,
+      "eval_loss": 0.05563850328326225,
+      "eval_precision_macro": 0.9767328244274809,
+      "eval_precision_weighted": 0.9766760496183207,
+      "eval_recall_macro": 0.9765000305194409,
+      "eval_recall_weighted": 0.9765625,
+      "eval_runtime": 9.4836,
+      "eval_samples_per_second": 26.994,
+      "eval_steps_per_second": 6.748,
+      "step": 1024
+    },
+    {
+      "epoch": 3.0,
+      "grad_norm": 0.13111276924610138,
+      "learning_rate": 1.4049861939731116e-05,
+      "loss": 0.0723,
+      "step": 1536
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.96875,
+      "eval_f1_macro": 0.9687328244274809,
+      "eval_f1_weighted": 0.9687385496183205,
+      "eval_loss": 0.06124699488282204,
+      "eval_precision_macro": 0.9693135277217434,
+      "eval_precision_weighted": 0.9692008221773947,
+      "eval_recall_macro": 0.9686260147714094,
+      "eval_recall_weighted": 0.96875,
+      "eval_runtime": 9.4427,
+      "eval_samples_per_second": 27.111,
+      "eval_steps_per_second": 6.778,
+      "step": 1536
+    },
+    {
+      "epoch": 4.0,
+      "grad_norm": 0.0075853727757930756,
+      "learning_rate": 1.0194105002318014e-05,
+      "loss": 0.0413,
+      "step": 2048
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.96875,
+      "eval_f1_macro": 0.9687423687423687,
+      "eval_f1_weighted": 0.9687461843711844,
+      "eval_loss": 0.08229334652423859,
+      "eval_precision_macro": 0.9689160305343512,
+      "eval_precision_weighted": 0.9688606870229008,
+      "eval_recall_macro": 0.9686870536531771,
+      "eval_recall_weighted": 0.96875,
+      "eval_runtime": 9.4556,
+      "eval_samples_per_second": 27.074,
+      "eval_steps_per_second": 6.768,
+      "step": 2048
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 4096,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 8,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 2,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 2
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 7626926277476352.0,
+  "train_batch_size": 4,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-2048/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:05f014aae6457a5193b7b97676fb49f1f8e5a4d72875fe8b03696e481f3aa324
+size 5240

config.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+  "_name_or_path": "xlm-roberta-large",
+  "architectures": [
+    "XLMRobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.49.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

logs/events.out.tfevents.1740652331.686e763fa1a3.6372.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3b679ab2ba83443dd64c4ce1ad8fc68431d53c7b4e8729e949e77a6e9887185a
+size 5048

logs/events.out.tfevents.1740652422.686e763fa1a3.6372.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8f61ba655f9b9482c492b3b9d0281386398db0edc9c5bdd8042bffbc72875f99
+size 8912

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a194e4caa903e2cc9a968fcee5892a44a70812c34b5fd6bcb2c94bd873271e26
+size 2239618672

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3ffb37461c391f096759f4a9bbbc329da0f36952f88bab061fcf84940c022e98
+size 17082999

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "250001": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "extra_special_tokens": {},
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:05f014aae6457a5193b7b97676fb49f1f8e5a4d72875fe8b03696e481f3aa324
+size 5240