End of training

Browse files

Files changed (6) hide show

README.md +1 -1
all_results.json +12 -0
eval_results.json +8 -0
runs/Dec03_15-33-20_DESKTOP-SKBE9FB/events.out.tfevents.1733261868.DESKTOP-SKBE9FB.11464.1 +3 -0
train_results.json +7 -0
trainer_state.json +417 -0

README.md CHANGED Viewed

@@ -32,7 +32,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/swinv2-tiny-patch4-window8-256](https://huggingface.co/microsoft/swinv2-tiny-patch4-window8-256) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
-- Loss: 4.1048
 - Accuracy: 0.1087
 ## Model description

 This model is a fine-tuned version of [microsoft/swinv2-tiny-patch4-window8-256](https://huggingface.co/microsoft/swinv2-tiny-patch4-window8-256) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
+- Loss: 7.9210
 - Accuracy: 0.1087
 ## Model description

all_results.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+    "epoch": 34.29,
+    "eval_accuracy": 0.10869565217391304,
+    "eval_loss": 7.920971870422363,
+    "eval_runtime": 0.9437,
+    "eval_samples_per_second": 48.746,
+    "eval_steps_per_second": 3.179,
+    "train_loss": 5.6989216804504395,
+    "train_runtime": 204.9044,
+    "train_samples_per_second": 41.58,
+    "train_steps_per_second": 0.586
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 34.29,
+    "eval_accuracy": 0.10869565217391304,
+    "eval_loss": 7.920971870422363,
+    "eval_runtime": 0.9437,
+    "eval_samples_per_second": 48.746,
+    "eval_steps_per_second": 3.179
+}

runs/Dec03_15-33-20_DESKTOP-SKBE9FB/events.out.tfevents.1733261868.DESKTOP-SKBE9FB.11464.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f9f6419db49f50b6795fdb567997cb75e136731dde3f8938b85276150014256d
+size 405

train_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 34.29,
+    "train_loss": 5.6989216804504395,
+    "train_runtime": 204.9044,
+    "train_samples_per_second": 41.58,
+    "train_steps_per_second": 0.586
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,417 @@

+{
+  "best_metric": 0.10869565217391304,
+  "best_model_checkpoint": "swinv2-tiny-patch4-window8-256-DMAE-U2\\checkpoint-3",
+  "epoch": 34.285714285714285,
+  "eval_steps": 500,
+  "global_step": 120,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 7.920971870422363,
+      "eval_runtime": 0.7378,
+      "eval_samples_per_second": 62.346,
+      "eval_steps_per_second": 4.066,
+      "step": 3
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 7.862796306610107,
+      "eval_runtime": 0.7695,
+      "eval_samples_per_second": 59.776,
+      "eval_steps_per_second": 3.898,
+      "step": 7
+    },
+    {
+      "epoch": 2.86,
+      "learning_rate": 1.5277777777777777e-05,
+      "loss": 7.9205,
+      "step": 10
+    },
+    {
+      "epoch": 2.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 7.793302536010742,
+      "eval_runtime": 0.7777,
+      "eval_samples_per_second": 59.149,
+      "eval_steps_per_second": 3.858,
+      "step": 10
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 7.6468305587768555,
+      "eval_runtime": 0.7842,
+      "eval_samples_per_second": 58.659,
+      "eval_steps_per_second": 3.826,
+      "step": 14
+    },
+    {
+      "epoch": 4.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 7.514880180358887,
+      "eval_runtime": 0.7707,
+      "eval_samples_per_second": 59.687,
+      "eval_steps_per_second": 3.893,
+      "step": 17
+    },
+    {
+      "epoch": 5.71,
+      "learning_rate": 1.388888888888889e-05,
+      "loss": 7.5974,
+      "step": 20
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 7.315957069396973,
+      "eval_runtime": 0.8015,
+      "eval_samples_per_second": 57.394,
+      "eval_steps_per_second": 3.743,
+      "step": 21
+    },
+    {
+      "epoch": 6.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 7.140155792236328,
+      "eval_runtime": 0.828,
+      "eval_samples_per_second": 55.554,
+      "eval_steps_per_second": 3.623,
+      "step": 24
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 6.8985981941223145,
+      "eval_runtime": 0.8013,
+      "eval_samples_per_second": 57.406,
+      "eval_steps_per_second": 3.744,
+      "step": 28
+    },
+    {
+      "epoch": 8.57,
+      "learning_rate": 1.25e-05,
+      "loss": 6.9785,
+      "step": 30
+    },
+    {
+      "epoch": 8.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 6.716281890869141,
+      "eval_runtime": 0.7645,
+      "eval_samples_per_second": 60.167,
+      "eval_steps_per_second": 3.924,
+      "step": 31
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 6.5023088455200195,
+      "eval_runtime": 0.7766,
+      "eval_samples_per_second": 59.23,
+      "eval_steps_per_second": 3.863,
+      "step": 35
+    },
+    {
+      "epoch": 10.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 6.348923206329346,
+      "eval_runtime": 0.754,
+      "eval_samples_per_second": 61.006,
+      "eval_steps_per_second": 3.979,
+      "step": 38
+    },
+    {
+      "epoch": 11.43,
+      "learning_rate": 1.1111111111111112e-05,
+      "loss": 6.6592,
+      "step": 40
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 6.1221923828125,
+      "eval_runtime": 0.7587,
+      "eval_samples_per_second": 60.627,
+      "eval_steps_per_second": 3.954,
+      "step": 42
+    },
+    {
+      "epoch": 12.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 5.9531145095825195,
+      "eval_runtime": 0.7465,
+      "eval_samples_per_second": 61.621,
+      "eval_steps_per_second": 4.019,
+      "step": 45
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 5.759119510650635,
+      "eval_runtime": 0.7799,
+      "eval_samples_per_second": 58.98,
+      "eval_steps_per_second": 3.847,
+      "step": 49
+    },
+    {
+      "epoch": 14.29,
+      "learning_rate": 9.722222222222223e-06,
+      "loss": 5.989,
+      "step": 50
+    },
+    {
+      "epoch": 14.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 5.624123573303223,
+      "eval_runtime": 0.7767,
+      "eval_samples_per_second": 59.227,
+      "eval_steps_per_second": 3.863,
+      "step": 52
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 5.447250843048096,
+      "eval_runtime": 0.7839,
+      "eval_samples_per_second": 58.681,
+      "eval_steps_per_second": 3.827,
+      "step": 56
+    },
+    {
+      "epoch": 16.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 5.323362827301025,
+      "eval_runtime": 0.7866,
+      "eval_samples_per_second": 58.481,
+      "eval_steps_per_second": 3.814,
+      "step": 59
+    },
+    {
+      "epoch": 17.14,
+      "learning_rate": 8.333333333333334e-06,
+      "loss": 5.542,
+      "step": 60
+    },
+    {
+      "epoch": 18.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 5.169005870819092,
+      "eval_runtime": 0.774,
+      "eval_samples_per_second": 59.431,
+      "eval_steps_per_second": 3.876,
+      "step": 63
+    },
+    {
+      "epoch": 18.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 5.060708522796631,
+      "eval_runtime": 0.9383,
+      "eval_samples_per_second": 49.025,
+      "eval_steps_per_second": 3.197,
+      "step": 66
+    },
+    {
+      "epoch": 20.0,
+      "learning_rate": 6.944444444444445e-06,
+      "loss": 5.2205,
+      "step": 70
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 4.92466402053833,
+      "eval_runtime": 0.9208,
+      "eval_samples_per_second": 49.956,
+      "eval_steps_per_second": 3.258,
+      "step": 70
+    },
+    {
+      "epoch": 20.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 4.8281331062316895,
+      "eval_runtime": 0.7691,
+      "eval_samples_per_second": 59.807,
+      "eval_steps_per_second": 3.9,
+      "step": 73
+    },
+    {
+      "epoch": 22.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 4.709559440612793,
+      "eval_runtime": 0.7765,
+      "eval_samples_per_second": 59.239,
+      "eval_steps_per_second": 3.863,
+      "step": 77
+    },
+    {
+      "epoch": 22.86,
+      "learning_rate": 5.555555555555556e-06,
+      "loss": 4.8962,
+      "step": 80
+    },
+    {
+      "epoch": 22.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 4.628277778625488,
+      "eval_runtime": 0.7694,
+      "eval_samples_per_second": 59.784,
+      "eval_steps_per_second": 3.899,
+      "step": 80
+    },
+    {
+      "epoch": 24.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 4.529789924621582,
+      "eval_runtime": 0.8219,
+      "eval_samples_per_second": 55.966,
+      "eval_steps_per_second": 3.65,
+      "step": 84
+    },
+    {
+      "epoch": 24.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 4.461925506591797,
+      "eval_runtime": 0.7787,
+      "eval_samples_per_second": 59.073,
+      "eval_steps_per_second": 3.853,
+      "step": 87
+    },
+    {
+      "epoch": 25.71,
+      "learning_rate": 4.166666666666667e-06,
+      "loss": 4.6327,
+      "step": 90
+    },
+    {
+      "epoch": 26.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 4.380962371826172,
+      "eval_runtime": 0.7671,
+      "eval_samples_per_second": 59.967,
+      "eval_steps_per_second": 3.911,
+      "step": 91
+    },
+    {
+      "epoch": 26.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 4.327389717102051,
+      "eval_runtime": 0.7592,
+      "eval_samples_per_second": 60.586,
+      "eval_steps_per_second": 3.951,
+      "step": 94
+    },
+    {
+      "epoch": 28.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 4.264850616455078,
+      "eval_runtime": 0.7649,
+      "eval_samples_per_second": 60.14,
+      "eval_steps_per_second": 3.922,
+      "step": 98
+    },
+    {
+      "epoch": 28.57,
+      "learning_rate": 2.777777777777778e-06,
+      "loss": 4.3789,
+      "step": 100
+    },
+    {
+      "epoch": 28.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 4.224890232086182,
+      "eval_runtime": 0.8043,
+      "eval_samples_per_second": 57.191,
+      "eval_steps_per_second": 3.73,
+      "step": 101
+    },
+    {
+      "epoch": 30.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 4.180596828460693,
+      "eval_runtime": 0.7966,
+      "eval_samples_per_second": 57.745,
+      "eval_steps_per_second": 3.766,
+      "step": 105
+    },
+    {
+      "epoch": 30.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 4.1541218757629395,
+      "eval_runtime": 0.7683,
+      "eval_samples_per_second": 59.871,
+      "eval_steps_per_second": 3.905,
+      "step": 108
+    },
+    {
+      "epoch": 31.43,
+      "learning_rate": 1.388888888888889e-06,
+      "loss": 4.3182,
+      "step": 110
+    },
+    {
+      "epoch": 32.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 4.127509593963623,
+      "eval_runtime": 0.7577,
+      "eval_samples_per_second": 60.708,
+      "eval_steps_per_second": 3.959,
+      "step": 112
+    },
+    {
+      "epoch": 32.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 4.114198207855225,
+      "eval_runtime": 0.7935,
+      "eval_samples_per_second": 57.968,
+      "eval_steps_per_second": 3.781,
+      "step": 115
+    },
+    {
+      "epoch": 34.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 4.105391025543213,
+      "eval_runtime": 0.779,
+      "eval_samples_per_second": 59.051,
+      "eval_steps_per_second": 3.851,
+      "step": 119
+    },
+    {
+      "epoch": 34.29,
+      "learning_rate": 0.0,
+      "loss": 4.254,
+      "step": 120
+    },
+    {
+      "epoch": 34.29,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 4.104760646820068,
+      "eval_runtime": 0.7612,
+      "eval_samples_per_second": 60.434,
+      "eval_steps_per_second": 3.941,
+      "step": 120
+    },
+    {
+      "epoch": 34.29,
+      "step": 120,
+      "total_flos": 2.3770905934823424e+17,
+      "train_loss": 5.6989216804504395,
+      "train_runtime": 204.9044,
+      "train_samples_per_second": 41.58,
+      "train_steps_per_second": 0.586
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 120,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 40,
+  "save_steps": 500,
+  "total_flos": 2.3770905934823424e+17,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}