End of training

Browse files

Files changed (8) hide show

README.md +80 -0
all_results.json +7 -0
config.json +52 -0
preprocessor_config.json +22 -0
pytorch_model.bin +3 -0
train_results.json +7 -0
trainer_state.json +343 -0
training_args.bin +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,80 @@

+---
+license: apache-2.0
+base_model: google/vit-base-patch16-224-in21k
+tags:
+- generated_from_trainer
+metrics:
+- accuracy
+model-index:
+- name: vit-eGTZANplus
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# vit-eGTZANplus
+This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 1.0164
+- Accuracy: 0.7460
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 0.0002
+- train_batch_size: 16
+- eval_batch_size: 8
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 2
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Accuracy |
+|:-------------:|:-----:|:----:|:---------------:|:--------:|
+| 0.2938        | 0.09  | 10   | 1.1730          | 0.6720   |
+| 0.2996        | 0.19  | 20   | 1.0932          | 0.6984   |
+| 0.3255        | 0.28  | 30   | 1.2589          | 0.6878   |
+| 0.3455        | 0.37  | 40   | 1.4433          | 0.6243   |
+| 0.168         | 0.47  | 50   | 1.0876          | 0.7249   |
+| 0.1967        | 0.56  | 60   | 1.3118          | 0.6772   |
+| 0.3586        | 0.65  | 70   | 1.2526          | 0.6667   |
+| 0.2221        | 0.75  | 80   | 1.0784          | 0.6825   |
+| 0.2013        | 0.84  | 90   | 1.2741          | 0.6772   |
+| 0.0979        | 0.93  | 100  | 1.1675          | 0.7196   |
+| 0.1476        | 1.03  | 110  | 1.0856          | 0.7249   |
+| 0.113         | 1.12  | 120  | 1.1297          | 0.7090   |
+| 0.071         | 1.21  | 130  | 0.9953          | 0.7302   |
+| 0.1015        | 1.31  | 140  | 1.0731          | 0.7407   |
+| 0.0249        | 1.4   | 150  | 1.0643          | 0.7354   |
+| 0.0555        | 1.5   | 160  | 1.0036          | 0.7460   |
+| 0.0419        | 1.59  | 170  | 1.0492          | 0.7407   |
+| 0.0491        | 1.68  | 180  | 0.9937          | 0.7354   |
+| 0.0889        | 1.78  | 190  | 1.0370          | 0.7460   |
+| 0.0676        | 1.87  | 200  | 1.0595          | 0.7302   |
+| 0.0938        | 1.96  | 210  | 1.0164          | 0.7460   |
+### Framework versions
+- Transformers 4.33.3
+- Pytorch 2.1.0+cu121
+- Datasets 2.14.5
+- Tokenizers 0.13.3

all_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 2.0,
+    "train_loss": 0.15774932977195097,
+    "train_runtime": 171.8363,
+    "train_samples_per_second": 19.751,
+    "train_steps_per_second": 1.245
+}

config.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_name_or_path": "google/vit-base-patch16-224-in21k",
+  "architectures": [
+    "ViTForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "afro",
+    "1": "classical",
+    "10": "reggae",
+    "11": "rock",
+    "2": "country",
+    "3": "disco",
+    "4": "electro",
+    "5": "jazz",
+    "6": "latin",
+    "7": "metal",
+    "8": "pop",
+    "9": "rap"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "afro": "0",
+    "classical": "1",
+    "country": "2",
+    "disco": "3",
+    "electro": "4",
+    "jazz": "5",
+    "latin": "6",
+    "metal": "7",
+    "pop": "8",
+    "rap": "9",
+    "reggae": "10",
+    "rock": "11"
+  },
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 12,
+  "num_channels": 3,
+  "num_hidden_layers": 12,
+  "patch_size": 16,
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.33.3"
+}

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "ViTImageProcessor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  }
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ef48d88824b5f30df659ddd55b960db875ce54b94142d1b62d9832f35b2d397d
+size 343299882

train_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 2.0,
+    "train_loss": 0.15774932977195097,
+    "train_runtime": 171.8363,
+    "train_samples_per_second": 19.751,
+    "train_steps_per_second": 1.245
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,343 @@

+{
+  "best_metric": 0.9937486052513123,
+  "best_model_checkpoint": "./vit-eGTZANplus\\checkpoint-180",
+  "epoch": 2.0,
+  "eval_steps": 10,
+  "global_step": 214,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.09,
+      "learning_rate": 0.00019065420560747664,
+      "loss": 0.2938,
+      "step": 10
+    },
+    {
+      "epoch": 0.09,
+      "eval_accuracy": 0.671957671957672,
+      "eval_loss": 1.1729912757873535,
+      "eval_runtime": 3.4907,
+      "eval_samples_per_second": 54.143,
+      "eval_steps_per_second": 6.875,
+      "step": 10
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 0.0001813084112149533,
+      "loss": 0.2996,
+      "step": 20
+    },
+    {
+      "epoch": 0.19,
+      "eval_accuracy": 0.6984126984126984,
+      "eval_loss": 1.093176007270813,
+      "eval_runtime": 3.2942,
+      "eval_samples_per_second": 57.373,
+      "eval_steps_per_second": 7.286,
+      "step": 20
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 0.00017196261682242992,
+      "loss": 0.3255,
+      "step": 30
+    },
+    {
+      "epoch": 0.28,
+      "eval_accuracy": 0.6878306878306878,
+      "eval_loss": 1.2588934898376465,
+      "eval_runtime": 3.3856,
+      "eval_samples_per_second": 55.825,
+      "eval_steps_per_second": 7.089,
+      "step": 30
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 0.00016261682242990654,
+      "loss": 0.3455,
+      "step": 40
+    },
+    {
+      "epoch": 0.37,
+      "eval_accuracy": 0.6243386243386243,
+      "eval_loss": 1.4432997703552246,
+      "eval_runtime": 3.3445,
+      "eval_samples_per_second": 56.51,
+      "eval_steps_per_second": 7.176,
+      "step": 40
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 0.00015327102803738317,
+      "loss": 0.168,
+      "step": 50
+    },
+    {
+      "epoch": 0.47,
+      "eval_accuracy": 0.7248677248677249,
+      "eval_loss": 1.0876396894454956,
+      "eval_runtime": 3.1209,
+      "eval_samples_per_second": 60.56,
+      "eval_steps_per_second": 7.69,
+      "step": 50
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 0.00014392523364485982,
+      "loss": 0.1967,
+      "step": 60
+    },
+    {
+      "epoch": 0.56,
+      "eval_accuracy": 0.6772486772486772,
+      "eval_loss": 1.3117926120758057,
+      "eval_runtime": 3.1799,
+      "eval_samples_per_second": 59.436,
+      "eval_steps_per_second": 7.547,
+      "step": 60
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 0.00013457943925233645,
+      "loss": 0.3586,
+      "step": 70
+    },
+    {
+      "epoch": 0.65,
+      "eval_accuracy": 0.6666666666666666,
+      "eval_loss": 1.252642273902893,
+      "eval_runtime": 3.2198,
+      "eval_samples_per_second": 58.699,
+      "eval_steps_per_second": 7.454,
+      "step": 70
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 0.00012523364485981308,
+      "loss": 0.2221,
+      "step": 80
+    },
+    {
+      "epoch": 0.75,
+      "eval_accuracy": 0.6825396825396826,
+      "eval_loss": 1.0784260034561157,
+      "eval_runtime": 3.045,
+      "eval_samples_per_second": 62.069,
+      "eval_steps_per_second": 7.882,
+      "step": 80
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 0.00011588785046728972,
+      "loss": 0.2013,
+      "step": 90
+    },
+    {
+      "epoch": 0.84,
+      "eval_accuracy": 0.6772486772486772,
+      "eval_loss": 1.274102807044983,
+      "eval_runtime": 3.14,
+      "eval_samples_per_second": 60.19,
+      "eval_steps_per_second": 7.643,
+      "step": 90
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 0.00010654205607476636,
+      "loss": 0.0979,
+      "step": 100
+    },
+    {
+      "epoch": 0.93,
+      "eval_accuracy": 0.7195767195767195,
+      "eval_loss": 1.1675456762313843,
+      "eval_runtime": 3.0991,
+      "eval_samples_per_second": 60.986,
+      "eval_steps_per_second": 7.744,
+      "step": 100
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 9.813084112149533e-05,
+      "loss": 0.1476,
+      "step": 110
+    },
+    {
+      "epoch": 1.03,
+      "eval_accuracy": 0.7248677248677249,
+      "eval_loss": 1.0856043100357056,
+      "eval_runtime": 3.1542,
+      "eval_samples_per_second": 59.919,
+      "eval_steps_per_second": 7.609,
+      "step": 110
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 8.878504672897197e-05,
+      "loss": 0.113,
+      "step": 120
+    },
+    {
+      "epoch": 1.12,
+      "eval_accuracy": 0.708994708994709,
+      "eval_loss": 1.1296759843826294,
+      "eval_runtime": 3.093,
+      "eval_samples_per_second": 61.105,
+      "eval_steps_per_second": 7.759,
+      "step": 120
+    },
+    {
+      "epoch": 1.21,
+      "learning_rate": 7.94392523364486e-05,
+      "loss": 0.071,
+      "step": 130
+    },
+    {
+      "epoch": 1.21,
+      "eval_accuracy": 0.7301587301587301,
+      "eval_loss": 0.9953044652938843,
+      "eval_runtime": 3.1568,
+      "eval_samples_per_second": 59.871,
+      "eval_steps_per_second": 7.603,
+      "step": 130
+    },
+    {
+      "epoch": 1.31,
+      "learning_rate": 7.009345794392523e-05,
+      "loss": 0.1015,
+      "step": 140
+    },
+    {
+      "epoch": 1.31,
+      "eval_accuracy": 0.7407407407407407,
+      "eval_loss": 1.0731220245361328,
+      "eval_runtime": 3.2435,
+      "eval_samples_per_second": 58.27,
+      "eval_steps_per_second": 7.399,
+      "step": 140
+    },
+    {
+      "epoch": 1.4,
+      "learning_rate": 6.074766355140187e-05,
+      "loss": 0.0249,
+      "step": 150
+    },
+    {
+      "epoch": 1.4,
+      "eval_accuracy": 0.7354497354497355,
+      "eval_loss": 1.0643069744110107,
+      "eval_runtime": 3.1959,
+      "eval_samples_per_second": 59.139,
+      "eval_steps_per_second": 7.51,
+      "step": 150
+    },
+    {
+      "epoch": 1.5,
+      "learning_rate": 5.14018691588785e-05,
+      "loss": 0.0555,
+      "step": 160
+    },
+    {
+      "epoch": 1.5,
+      "eval_accuracy": 0.746031746031746,
+      "eval_loss": 1.0035866498947144,
+      "eval_runtime": 3.1827,
+      "eval_samples_per_second": 59.384,
+      "eval_steps_per_second": 7.541,
+      "step": 160
+    },
+    {
+      "epoch": 1.59,
+      "learning_rate": 4.205607476635514e-05,
+      "loss": 0.0419,
+      "step": 170
+    },
+    {
+      "epoch": 1.59,
+      "eval_accuracy": 0.7407407407407407,
+      "eval_loss": 1.0491830110549927,
+      "eval_runtime": 3.1052,
+      "eval_samples_per_second": 60.865,
+      "eval_steps_per_second": 7.729,
+      "step": 170
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 3.2710280373831774e-05,
+      "loss": 0.0491,
+      "step": 180
+    },
+    {
+      "epoch": 1.68,
+      "eval_accuracy": 0.7354497354497355,
+      "eval_loss": 0.9937486052513123,
+      "eval_runtime": 3.1957,
+      "eval_samples_per_second": 59.141,
+      "eval_steps_per_second": 7.51,
+      "step": 180
+    },
+    {
+      "epoch": 1.78,
+      "learning_rate": 2.3364485981308414e-05,
+      "loss": 0.0889,
+      "step": 190
+    },
+    {
+      "epoch": 1.78,
+      "eval_accuracy": 0.746031746031746,
+      "eval_loss": 1.0369799137115479,
+      "eval_runtime": 3.1029,
+      "eval_samples_per_second": 60.911,
+      "eval_steps_per_second": 7.735,
+      "step": 190
+    },
+    {
+      "epoch": 1.87,
+      "learning_rate": 1.4018691588785047e-05,
+      "loss": 0.0676,
+      "step": 200
+    },
+    {
+      "epoch": 1.87,
+      "eval_accuracy": 0.7301587301587301,
+      "eval_loss": 1.0594910383224487,
+      "eval_runtime": 3.1165,
+      "eval_samples_per_second": 60.644,
+      "eval_steps_per_second": 7.701,
+      "step": 200
+    },
+    {
+      "epoch": 1.96,
+      "learning_rate": 4.6728971962616825e-06,
+      "loss": 0.0938,
+      "step": 210
+    },
+    {
+      "epoch": 1.96,
+      "eval_accuracy": 0.746031746031746,
+      "eval_loss": 1.0163832902908325,
+      "eval_runtime": 3.1414,
+      "eval_samples_per_second": 60.164,
+      "eval_steps_per_second": 7.64,
+      "step": 210
+    },
+    {
+      "epoch": 2.0,
+      "step": 214,
+      "total_flos": 2.6303138531028173e+17,
+      "train_loss": 0.15774932977195097,
+      "train_runtime": 171.8363,
+      "train_samples_per_second": 19.751,
+      "train_steps_per_second": 1.245
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 214,
+  "num_train_epochs": 2,
+  "save_steps": 10,
+  "total_flos": 2.6303138531028173e+17,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4d93d4580814b34788969c13590bb700db5d1bd27277cf34b8c1aa31afd7950a
+size 4472