marmarg2 commited on Aug 31, 2023

Commit

6469636

1 Parent(s): abdc95c

Upload 34 files

Browse files

Files changed (33) hide show

BERT-mULT-t-MMG/README.md +63 -0
BERT-mULT-t-MMG/checkpoint-102/config.json +32 -0
BERT-mULT-t-MMG/checkpoint-102/optimizer.pt +3 -0
BERT-mULT-t-MMG/checkpoint-102/pytorch_model.bin +3 -0
BERT-mULT-t-MMG/checkpoint-102/rng_state.pth +3 -0
BERT-mULT-t-MMG/checkpoint-102/scheduler.pt +3 -0
BERT-mULT-t-MMG/checkpoint-102/trainer_state.json +43 -0
BERT-mULT-t-MMG/checkpoint-102/training_args.bin +3 -0
BERT-mULT-t-MMG/checkpoint-136/config.json +32 -0
BERT-mULT-t-MMG/checkpoint-136/optimizer.pt +3 -0
BERT-mULT-t-MMG/checkpoint-136/pytorch_model.bin +3 -0
BERT-mULT-t-MMG/checkpoint-136/rng_state.pth +3 -0
BERT-mULT-t-MMG/checkpoint-136/scheduler.pt +3 -0
BERT-mULT-t-MMG/checkpoint-136/trainer_state.json +52 -0
BERT-mULT-t-MMG/checkpoint-136/training_args.bin +3 -0
BERT-mULT-t-MMG/checkpoint-34/optimizer.pt +3 -0
BERT-mULT-t-MMG/checkpoint-34/pytorch_model.bin +3 -0
BERT-mULT-t-MMG/checkpoint-34/rng_state.pth +3 -0
BERT-mULT-t-MMG/checkpoint-34/scheduler.pt +3 -0
BERT-mULT-t-MMG/checkpoint-34/trainer_state.json +25 -0
BERT-mULT-t-MMG/checkpoint-34/training_args.bin +3 -0
BERT-mULT-t-MMG/checkpoint-68/config.json +32 -0
BERT-mULT-t-MMG/checkpoint-68/optimizer.pt +3 -0
BERT-mULT-t-MMG/checkpoint-68/pytorch_model.bin +3 -0
BERT-mULT-t-MMG/checkpoint-68/rng_state.pth +3 -0
BERT-mULT-t-MMG/checkpoint-68/scheduler.pt +3 -0
BERT-mULT-t-MMG/checkpoint-68/trainer_state.json +34 -0
BERT-mULT-t-MMG/checkpoint-68/training_args.bin +3 -0
BERT-mULT-t-MMG/config.json +32 -0
BERT-mULT-t-MMG/pytorch_model.bin +3 -0
BERT-mULT-t-MMG/runs/Aug10_14-39-26_practicas/events.out.tfevents.1691671191.practicas.2817540.0 +3 -0
BERT-mULT-t-MMG/runs/Aug10_14-39-26_practicas/events.out.tfevents.1691671338.practicas.2817540.1 +3 -0
BERT-mULT-t-MMG/training_args.bin +3 -0

BERT-mULT-t-MMG/README.md ADDED Viewed

	@@ -0,0 +1,63 @@

+---
+license: apache-2.0
+base_model: bert-base-multilingual-cased
+tags:
+- generated_from_trainer
+metrics:
+- accuracy
+model-index:
+- name: BERT-mULT-t-MMG
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# BERT-mULT-t-MMG
+This model is a fine-tuned version of [bert-base-multilingual-cased](https://huggingface.co/bert-base-multilingual-cased) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.6791
+- Accuracy: 0.6515
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5e-05
+- train_batch_size: 8
+- eval_batch_size: 8
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 10
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Accuracy |
+|:-------------:|:-----:|:----:|:---------------:|:--------:|
+| No log        | 1.0   | 34   | 0.6893          | 0.5303   |
+| No log        | 2.0   | 68   | 0.6791          | 0.6515   |
+| No log        | 3.0   | 102  | 0.7651          | 0.5303   |
+| No log        | 4.0   | 136  | 0.6895          | 0.5758   |
+### Framework versions
+- Transformers 4.31.0
+- Pytorch 2.0.1+cu117
+- Datasets 2.14.0
+- Tokenizers 0.13.3

BERT-mULT-t-MMG/checkpoint-102/config.json ADDED Viewed

	@@ -0,0 +1,32 @@

+{
+  "_name_or_path": "bert-base-multilingual-cased",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.31.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 119547
+}

BERT-mULT-t-MMG/checkpoint-102/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bdee84e6180e08a3d772a6220f38718934fe49a519228fdb1e1f74fec1732ef9
+size 1422957573

BERT-mULT-t-MMG/checkpoint-102/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6ff36a0c4155d1ce58269a8675a2541dbe605b362f4e29ace3c8ed0d96cbc3bb
+size 711488305

BERT-mULT-t-MMG/checkpoint-102/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8166e4672a330b2152739645b7617bc8d816f164b0c753c34fdd50ed3c40b0ce
+size 14575

BERT-mULT-t-MMG/checkpoint-102/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:90fa10e0cfd5b10317e4c2bf4786b790892ca6387b6cf42d60555e376f66d3dd
+size 627

BERT-mULT-t-MMG/checkpoint-102/trainer_state.json ADDED Viewed

	@@ -0,0 +1,43 @@

+{
+  "best_metric": 0.6790980100631714,
+  "best_model_checkpoint": "BERT-mULT-t-MMG/checkpoint-68",
+  "epoch": 3.0,
+  "global_step": 102,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5303030303030303,
+      "eval_loss": 0.6892990469932556,
+      "eval_runtime": 2.4367,
+      "eval_samples_per_second": 27.086,
+      "eval_steps_per_second": 3.693,
+      "step": 34
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6515151515151515,
+      "eval_loss": 0.6790980100631714,
+      "eval_runtime": 2.4536,
+      "eval_samples_per_second": 26.899,
+      "eval_steps_per_second": 3.668,
+      "step": 68
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.5303030303030303,
+      "eval_loss": 0.7650681734085083,
+      "eval_runtime": 2.4451,
+      "eval_samples_per_second": 26.993,
+      "eval_steps_per_second": 3.681,
+      "step": 102
+    }
+  ],
+  "max_steps": 340,
+  "num_train_epochs": 10,
+  "total_flos": 211541288509440.0,
+  "trial_name": null,
+  "trial_params": null
+}

BERT-mULT-t-MMG/checkpoint-102/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fdbe8be9883b673d6afa80be7ca632d77e0b2363bb941b5cb884746b73b819ab
+size 3963

BERT-mULT-t-MMG/checkpoint-136/config.json ADDED Viewed

	@@ -0,0 +1,32 @@

+{
+  "_name_or_path": "bert-base-multilingual-cased",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.31.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 119547
+}

BERT-mULT-t-MMG/checkpoint-136/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9c7dd3230e91cfdc2c455123eb6cacb8703cf4627e717b8b556cc7c12380c6c6
+size 1422957573

BERT-mULT-t-MMG/checkpoint-136/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:930090b0a84280731a09b7ad7a39210f0983f1eff4d0218d6b15cfbb82fa825e
+size 711488305

BERT-mULT-t-MMG/checkpoint-136/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cb7bae29515f25b424d0666ae706849c050fab549ee662c61896e2b6baa81c35
+size 14575

BERT-mULT-t-MMG/checkpoint-136/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8265df91ddb3a8c71b4208b3313c24acdf60ac5ce8681251e2df91b897c72abd
+size 627

BERT-mULT-t-MMG/checkpoint-136/trainer_state.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "best_metric": 0.6790980100631714,
+  "best_model_checkpoint": "BERT-mULT-t-MMG/checkpoint-68",
+  "epoch": 4.0,
+  "global_step": 136,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5303030303030303,
+      "eval_loss": 0.6892990469932556,
+      "eval_runtime": 2.4367,
+      "eval_samples_per_second": 27.086,
+      "eval_steps_per_second": 3.693,
+      "step": 34
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6515151515151515,
+      "eval_loss": 0.6790980100631714,
+      "eval_runtime": 2.4536,
+      "eval_samples_per_second": 26.899,
+      "eval_steps_per_second": 3.668,
+      "step": 68
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.5303030303030303,
+      "eval_loss": 0.7650681734085083,
+      "eval_runtime": 2.4451,
+      "eval_samples_per_second": 26.993,
+      "eval_steps_per_second": 3.681,
+      "step": 102
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.5757575757575758,
+      "eval_loss": 0.6894957423210144,
+      "eval_runtime": 2.4549,
+      "eval_samples_per_second": 26.885,
+      "eval_steps_per_second": 3.666,
+      "step": 136
+    }
+  ],
+  "max_steps": 340,
+  "num_train_epochs": 10,
+  "total_flos": 282055051345920.0,
+  "trial_name": null,
+  "trial_params": null
+}

BERT-mULT-t-MMG/checkpoint-136/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fdbe8be9883b673d6afa80be7ca632d77e0b2363bb941b5cb884746b73b819ab
+size 3963

BERT-mULT-t-MMG/checkpoint-34/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:841f32b80cd263b6b9cee7b10b8e6c251a26117c3cd0c49c1efd6967e198ce3e
+size 1422957573

BERT-mULT-t-MMG/checkpoint-34/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:969572288ab714c4eda857bea8e580b2c3c361edfbe79b3a135b7cb27f7913d2
+size 711488305

BERT-mULT-t-MMG/checkpoint-34/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f6240db54ec5d8e68e422054a7ac15b52594fa55680ba495f5f5e1c7bca4f5d5
+size 14575

BERT-mULT-t-MMG/checkpoint-34/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e1135ccdc6ff911cd34976d2d6f74e50eda157c783d2100d5cfc14ea275faaba
+size 627

BERT-mULT-t-MMG/checkpoint-34/trainer_state.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "best_metric": 0.6892990469932556,
+  "best_model_checkpoint": "BERT-mULT-t-MMG/checkpoint-34",
+  "epoch": 1.0,
+  "global_step": 34,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5303030303030303,
+      "eval_loss": 0.6892990469932556,
+      "eval_runtime": 2.4367,
+      "eval_samples_per_second": 27.086,
+      "eval_steps_per_second": 3.693,
+      "step": 34
+    }
+  ],
+  "max_steps": 340,
+  "num_train_epochs": 10,
+  "total_flos": 70513762836480.0,
+  "trial_name": null,
+  "trial_params": null
+}

BERT-mULT-t-MMG/checkpoint-34/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fdbe8be9883b673d6afa80be7ca632d77e0b2363bb941b5cb884746b73b819ab
+size 3963

BERT-mULT-t-MMG/checkpoint-68/config.json ADDED Viewed

	@@ -0,0 +1,32 @@

+{
+  "_name_or_path": "bert-base-multilingual-cased",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.31.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 119547
+}

BERT-mULT-t-MMG/checkpoint-68/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d9440db5deb8d9d43644cf54164571d7ff79c3c7d1782859a7a30187cf978057
+size 1422957573

BERT-mULT-t-MMG/checkpoint-68/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:717f49c9697c030729d076093434c28ca17baf396836f24f6b4e9cb222ab17d7
+size 711488305

BERT-mULT-t-MMG/checkpoint-68/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b386f92443211ed864a270aa60382c492ac928b9a86f65925534197e53a0fad2
+size 14575

BERT-mULT-t-MMG/checkpoint-68/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4b160d770f4f8d28e5c183009a8b11a7d3b6b0ebd3406b3dc6d0fd9adf77a3b8
+size 627

BERT-mULT-t-MMG/checkpoint-68/trainer_state.json ADDED Viewed

	@@ -0,0 +1,34 @@

+{
+  "best_metric": 0.6790980100631714,
+  "best_model_checkpoint": "BERT-mULT-t-MMG/checkpoint-68",
+  "epoch": 2.0,
+  "global_step": 68,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5303030303030303,
+      "eval_loss": 0.6892990469932556,
+      "eval_runtime": 2.4367,
+      "eval_samples_per_second": 27.086,
+      "eval_steps_per_second": 3.693,
+      "step": 34
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6515151515151515,
+      "eval_loss": 0.6790980100631714,
+      "eval_runtime": 2.4536,
+      "eval_samples_per_second": 26.899,
+      "eval_steps_per_second": 3.668,
+      "step": 68
+    }
+  ],
+  "max_steps": 340,
+  "num_train_epochs": 10,
+  "total_flos": 141027525672960.0,
+  "trial_name": null,
+  "trial_params": null
+}

BERT-mULT-t-MMG/checkpoint-68/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fdbe8be9883b673d6afa80be7ca632d77e0b2363bb941b5cb884746b73b819ab
+size 3963

BERT-mULT-t-MMG/config.json ADDED Viewed

	@@ -0,0 +1,32 @@

+{
+  "_name_or_path": "bert-base-multilingual-cased",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.31.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 119547
+}

BERT-mULT-t-MMG/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:717f49c9697c030729d076093434c28ca17baf396836f24f6b4e9cb222ab17d7
+size 711488305

BERT-mULT-t-MMG/runs/Aug10_14-39-26_practicas/events.out.tfevents.1691671191.practicas.2817540.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7ef0f0cfdf7469dbf2b844b85c35bdc9f56fbd50e135f0a03c8973fbce6ec88f
+size 5829

BERT-mULT-t-MMG/runs/Aug10_14-39-26_practicas/events.out.tfevents.1691671338.practicas.2817540.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:327d91366e16c04304fe0ee52882b7cded2e6214df244c41b09f6626bf74c3f8
+size 411

BERT-mULT-t-MMG/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fdbe8be9883b673d6afa80be7ca632d77e0b2363bb941b5cb884746b73b819ab
+size 3963