End of training

Browse files

Files changed (11) hide show

README.md +96 -0
all_results.json +12 -0
config.json +56 -0
eval_results.json +8 -0
model.safetensors +3 -0
preprocessor_config.json +22 -0
runs/Dec28_18-44-20_MacBook-Pro-de-Max-2.local/events.out.tfevents.1703785531.MacBook-Pro-de-Max-2.local.34768.0 +3 -0
runs/Dec28_18-44-20_MacBook-Pro-de-Max-2.local/events.out.tfevents.1703786843.MacBook-Pro-de-Max-2.local.34768.1 +3 -0
train_results.json +7 -0
trainer_state.json +333 -0
training_args.bin +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,96 @@

+---
+license: apache-2.0
+base_model: microsoft/swinv2-tiny-patch4-window8-256
+tags:
+- generated_from_trainer
+datasets:
+- imagefolder
+metrics:
+- accuracy
+model-index:
+- name: swinv2-tiny-patch4-window8-256-finetuned-gardner-icm-max
+  results:
+  - task:
+      name: Image Classification
+      type: image-classification
+    dataset:
+      name: imagefolder
+      type: imagefolder
+      config: default
+      split: train
+      args: default
+    metrics:
+    - name: Accuracy
+      type: accuracy
+      value: 0.6428571428571429
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# swinv2-tiny-patch4-window8-256-finetuned-gardner-icm-max
+This model is a fine-tuned version of [microsoft/swinv2-tiny-patch4-window8-256](https://huggingface.co/microsoft/swinv2-tiny-patch4-window8-256) on the imagefolder dataset.
+It achieves the following results on the evaluation set:
+- Loss: 1.0741
+- Accuracy: 0.6429
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5e-05
+- train_batch_size: 32
+- eval_batch_size: 32
+- seed: 42
+- gradient_accumulation_steps: 4
+- total_train_batch_size: 128
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- lr_scheduler_warmup_ratio: 0.1
+- num_epochs: 20
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Accuracy |
+|:-------------:|:-----:|:----:|:---------------:|:--------:|
+| 1.0925        | 0.94  | 11   | 1.0631          | 0.7952   |
+| 0.9552        | 1.96  | 23   | 0.6336          | 0.7952   |
+| 0.6566        | 2.98  | 35   | 0.5356          | 0.7952   |
+| 0.5686        | 4.0   | 47   | 0.5150          | 0.7952   |
+| 0.5703        | 4.94  | 58   | 0.5129          | 0.7952   |
+| 0.5726        | 5.96  | 70   | 0.5154          | 0.7952   |
+| 0.5482        | 6.98  | 82   | 0.5142          | 0.7952   |
+| 0.568         | 8.0   | 94   | 0.5109          | 0.7952   |
+| 0.5245        | 8.94  | 105  | 0.5134          | 0.7952   |
+| 0.5979        | 9.96  | 117  | 0.5238          | 0.7952   |
+| 0.5442        | 10.98 | 129  | 0.5076          | 0.7952   |
+| 0.545         | 12.0  | 141  | 0.5062          | 0.7952   |
+| 0.5514        | 12.94 | 152  | 0.5013          | 0.7952   |
+| 0.5377        | 13.96 | 164  | 0.5045          | 0.7952   |
+| 0.5282        | 14.98 | 176  | 0.5038          | 0.7952   |
+| 0.5389        | 16.0  | 188  | 0.4994          | 0.7952   |
+| 0.5039        | 16.94 | 199  | 0.4996          | 0.7952   |
+| 0.5348        | 17.96 | 211  | 0.4940          | 0.7952   |
+| 0.5426        | 18.72 | 220  | 0.4947          | 0.7952   |
+### Framework versions
+- Transformers 4.36.2
+- Pytorch 2.1.2
+- Datasets 2.16.0
+- Tokenizers 0.15.0

all_results.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+    "epoch": 18.72,
+    "eval_accuracy": 0.6428571428571429,
+    "eval_loss": 1.0741071701049805,
+    "eval_runtime": 4.5667,
+    "eval_samples_per_second": 52.116,
+    "eval_steps_per_second": 1.752,
+    "train_loss": 0.595783019065857,
+    "train_runtime": 1248.9487,
+    "train_samples_per_second": 23.796,
+    "train_steps_per_second": 0.176
+}

config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "_name_or_path": "microsoft/swinv2-tiny-patch4-window8-256",
+  "architectures": [
+    "Swinv2ForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "depths": [
+    2,
+    2,
+    6,
+    2
+  ],
+  "drop_path_rate": 0.1,
+  "embed_dim": 96,
+  "encoder_stride": 32,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "0",
+    "1": "1",
+    "2": "2"
+  },
+  "image_size": 256,
+  "initializer_range": 0.02,
+  "label2id": {
+    "0": 0,
+    "1": 1,
+    "2": 2
+  },
+  "layer_norm_eps": 1e-05,
+  "mlp_ratio": 4.0,
+  "model_type": "swinv2",
+  "num_channels": 3,
+  "num_heads": [
+    3,
+    6,
+    12,
+    24
+  ],
+  "num_layers": 4,
+  "patch_size": 4,
+  "path_norm": true,
+  "pretrained_window_sizes": [
+    0,
+    0,
+    0,
+    0
+  ],
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.36.2",
+  "use_absolute_embeddings": false,
+  "window_size": 8
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 18.72,
+    "eval_accuracy": 0.6428571428571429,
+    "eval_loss": 1.0741071701049805,
+    "eval_runtime": 4.5667,
+    "eval_samples_per_second": 52.116,
+    "eval_steps_per_second": 1.752
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:65be09d36da40c6d8dfe6ffbb404e735f5bb14937d77df09ec924f331ce7c977
+size 110353212

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.485,
+    0.456,
+    0.406
+  ],
+  "image_processor_type": "ViTImageProcessor",
+  "image_std": [
+    0.229,
+    0.224,
+    0.225
+  ],
+  "resample": 3,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 256,
+    "width": 256
+  }
+}

runs/Dec28_18-44-20_MacBook-Pro-de-Max-2.local/events.out.tfevents.1703785531.MacBook-Pro-de-Max-2.local.34768.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0aa379bd3a1e87cf0c81a8e1f4a21b8c1a7218b943676e2bbe60f853d919ec61
+size 14628

runs/Dec28_18-44-20_MacBook-Pro-de-Max-2.local/events.out.tfevents.1703786843.MacBook-Pro-de-Max-2.local.34768.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:90d4c26f538e46a898ce2b0b614a742811d2aa098be294e09a4d8ee16576d145
+size 734

train_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 18.72,
+    "train_loss": 0.595783019065857,
+    "train_runtime": 1248.9487,
+    "train_samples_per_second": 23.796,
+    "train_steps_per_second": 0.176
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,333 @@

+{
+  "best_metric": 0.7951807228915663,
+  "best_model_checkpoint": "swinv2-tiny-patch4-window8-256-finetuned-gardner-icm-max/checkpoint-11",
+  "epoch": 18.72340425531915,
+  "eval_steps": 500,
+  "global_step": 220,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.85,
+      "learning_rate": 2.272727272727273e-05,
+      "loss": 1.0925,
+      "step": 10
+    },
+    {
+      "epoch": 0.94,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 1.0630700588226318,
+      "eval_runtime": 8.4566,
+      "eval_samples_per_second": 19.63,
+      "eval_steps_per_second": 0.71,
+      "step": 11
+    },
+    {
+      "epoch": 1.7,
+      "learning_rate": 4.545454545454546e-05,
+      "loss": 0.9552,
+      "step": 20
+    },
+    {
+      "epoch": 1.96,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.633553683757782,
+      "eval_runtime": 2.9014,
+      "eval_samples_per_second": 57.213,
+      "eval_steps_per_second": 2.068,
+      "step": 23
+    },
+    {
+      "epoch": 2.55,
+      "learning_rate": 4.797979797979798e-05,
+      "loss": 0.6566,
+      "step": 30
+    },
+    {
+      "epoch": 2.98,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.5356065630912781,
+      "eval_runtime": 2.9308,
+      "eval_samples_per_second": 56.639,
+      "eval_steps_per_second": 2.047,
+      "step": 35
+    },
+    {
+      "epoch": 3.4,
+      "learning_rate": 4.545454545454546e-05,
+      "loss": 0.5686,
+      "step": 40
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.5150089263916016,
+      "eval_runtime": 3.1556,
+      "eval_samples_per_second": 52.605,
+      "eval_steps_per_second": 1.901,
+      "step": 47
+    },
+    {
+      "epoch": 4.26,
+      "learning_rate": 4.292929292929293e-05,
+      "loss": 0.5703,
+      "step": 50
+    },
+    {
+      "epoch": 4.94,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.5129297971725464,
+      "eval_runtime": 2.9359,
+      "eval_samples_per_second": 56.542,
+      "eval_steps_per_second": 2.044,
+      "step": 58
+    },
+    {
+      "epoch": 5.11,
+      "learning_rate": 4.0404040404040405e-05,
+      "loss": 0.5361,
+      "step": 60
+    },
+    {
+      "epoch": 5.96,
+      "learning_rate": 3.787878787878788e-05,
+      "loss": 0.5726,
+      "step": 70
+    },
+    {
+      "epoch": 5.96,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.5154421925544739,
+      "eval_runtime": 2.9132,
+      "eval_samples_per_second": 56.982,
+      "eval_steps_per_second": 2.06,
+      "step": 70
+    },
+    {
+      "epoch": 6.81,
+      "learning_rate": 3.535353535353535e-05,
+      "loss": 0.5482,
+      "step": 80
+    },
+    {
+      "epoch": 6.98,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.5141979455947876,
+      "eval_runtime": 2.9168,
+      "eval_samples_per_second": 56.912,
+      "eval_steps_per_second": 2.057,
+      "step": 82
+    },
+    {
+      "epoch": 7.66,
+      "learning_rate": 3.282828282828283e-05,
+      "loss": 0.568,
+      "step": 90
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.5108516812324524,
+      "eval_runtime": 2.9147,
+      "eval_samples_per_second": 56.952,
+      "eval_steps_per_second": 2.059,
+      "step": 94
+    },
+    {
+      "epoch": 8.51,
+      "learning_rate": 3.0303030303030306e-05,
+      "loss": 0.5245,
+      "step": 100
+    },
+    {
+      "epoch": 8.94,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.5134214162826538,
+      "eval_runtime": 2.9007,
+      "eval_samples_per_second": 57.227,
+      "eval_steps_per_second": 2.068,
+      "step": 105
+    },
+    {
+      "epoch": 9.36,
+      "learning_rate": 2.777777777777778e-05,
+      "loss": 0.5979,
+      "step": 110
+    },
+    {
+      "epoch": 9.96,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.5237765908241272,
+      "eval_runtime": 2.9436,
+      "eval_samples_per_second": 56.394,
+      "eval_steps_per_second": 2.038,
+      "step": 117
+    },
+    {
+      "epoch": 10.21,
+      "learning_rate": 2.5252525252525256e-05,
+      "loss": 0.5442,
+      "step": 120
+    },
+    {
+      "epoch": 10.98,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.507612943649292,
+      "eval_runtime": 2.9562,
+      "eval_samples_per_second": 56.154,
+      "eval_steps_per_second": 2.03,
+      "step": 129
+    },
+    {
+      "epoch": 11.06,
+      "learning_rate": 2.272727272727273e-05,
+      "loss": 0.5451,
+      "step": 130
+    },
+    {
+      "epoch": 11.91,
+      "learning_rate": 2.0202020202020203e-05,
+      "loss": 0.545,
+      "step": 140
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.5061953067779541,
+      "eval_runtime": 2.9818,
+      "eval_samples_per_second": 55.671,
+      "eval_steps_per_second": 2.012,
+      "step": 141
+    },
+    {
+      "epoch": 12.77,
+      "learning_rate": 1.7676767676767676e-05,
+      "loss": 0.5514,
+      "step": 150
+    },
+    {
+      "epoch": 12.94,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.5012802481651306,
+      "eval_runtime": 3.0403,
+      "eval_samples_per_second": 54.599,
+      "eval_steps_per_second": 1.973,
+      "step": 152
+    },
+    {
+      "epoch": 13.62,
+      "learning_rate": 1.5151515151515153e-05,
+      "loss": 0.5377,
+      "step": 160
+    },
+    {
+      "epoch": 13.96,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.5044662356376648,
+      "eval_runtime": 3.0226,
+      "eval_samples_per_second": 54.919,
+      "eval_steps_per_second": 1.985,
+      "step": 164
+    },
+    {
+      "epoch": 14.47,
+      "learning_rate": 1.2626262626262628e-05,
+      "loss": 0.5282,
+      "step": 170
+    },
+    {
+      "epoch": 14.98,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.5037835836410522,
+      "eval_runtime": 2.9367,
+      "eval_samples_per_second": 56.525,
+      "eval_steps_per_second": 2.043,
+      "step": 176
+    },
+    {
+      "epoch": 15.32,
+      "learning_rate": 1.0101010101010101e-05,
+      "loss": 0.5389,
+      "step": 180
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.4994117021560669,
+      "eval_runtime": 2.9413,
+      "eval_samples_per_second": 56.437,
+      "eval_steps_per_second": 2.04,
+      "step": 188
+    },
+    {
+      "epoch": 16.17,
+      "learning_rate": 7.5757575757575764e-06,
+      "loss": 0.5039,
+      "step": 190
+    },
+    {
+      "epoch": 16.94,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.49963268637657166,
+      "eval_runtime": 3.0102,
+      "eval_samples_per_second": 55.146,
+      "eval_steps_per_second": 1.993,
+      "step": 199
+    },
+    {
+      "epoch": 17.02,
+      "learning_rate": 5.050505050505051e-06,
+      "loss": 0.5449,
+      "step": 200
+    },
+    {
+      "epoch": 17.87,
+      "learning_rate": 2.5252525252525253e-06,
+      "loss": 0.5348,
+      "step": 210
+    },
+    {
+      "epoch": 17.96,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.493960976600647,
+      "eval_runtime": 2.9022,
+      "eval_samples_per_second": 57.197,
+      "eval_steps_per_second": 2.067,
+      "step": 211
+    },
+    {
+      "epoch": 18.72,
+      "learning_rate": 0.0,
+      "loss": 0.5426,
+      "step": 220
+    },
+    {
+      "epoch": 18.72,
+      "eval_accuracy": 0.7951807228915663,
+      "eval_loss": 0.49473580718040466,
+      "eval_runtime": 2.8726,
+      "eval_samples_per_second": 57.787,
+      "eval_steps_per_second": 2.089,
+      "step": 220
+    },
+    {
+      "epoch": 18.72,
+      "step": 220,
+      "total_flos": 9.056508197685166e+17,
+      "train_loss": 0.595783019065857,
+      "train_runtime": 1248.9487,
+      "train_samples_per_second": 23.796,
+      "train_steps_per_second": 0.176
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 220,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 20,
+  "save_steps": 500,
+  "total_flos": 9.056508197685166e+17,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:81e9c804b177a239e1066ec42d5a893c7bd6e29d0f1ad2294063020d5d452657
+size 4792