Training in progress, epoch 0

Browse files

Files changed (12) hide show

model.safetensors +1 -1
runs/Apr18_22-23-10_DESKTOP-SKBE9FB/events.out.tfevents.1713500593.DESKTOP-SKBE9FB.6812.0 +2 -2
runs/Apr18_22-30-59_DESKTOP-SKBE9FB/events.out.tfevents.1713501061.DESKTOP-SKBE9FB.5296.0 +3 -0
tmp-checkpoint-209/config.json +58 -0
tmp-checkpoint-209/model.safetensors +3 -0
tmp-checkpoint-209/optimizer.pt +3 -0
tmp-checkpoint-209/preprocessor_config.json +22 -0
tmp-checkpoint-209/rng_state.pth +3 -0
tmp-checkpoint-209/scheduler.pt +3 -0
tmp-checkpoint-209/trainer_state.json +366 -0
tmp-checkpoint-209/training_args.bin +3 -0
training_args.bin +1 -1

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b553c29284076f1a9f636a710eec4456f5de4bef598dca3536591b625439266f
 size 110356296

 version https://git-lfs.github.com/spec/v1
+oid sha256:f154b2bf60acc2741d603539a3908e779c4b19b4e372a92a2833d5ff046ba480
 size 110356296

runs/Apr18_22-23-10_DESKTOP-SKBE9FB/events.out.tfevents.1713500593.DESKTOP-SKBE9FB.6812.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2507ae6c1c59f195359e8c9cebe19b18d247484327ee46db45c1cadbc057d338
-size 15282

 version https://git-lfs.github.com/spec/v1
+oid sha256:a157c08c7e1e358881aa080f03b1eaefca8d38e87a8e83366f625fc7f577a7b7
+size 16085

runs/Apr18_22-30-59_DESKTOP-SKBE9FB/events.out.tfevents.1713501061.DESKTOP-SKBE9FB.5296.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:89c64686bb833a86f5c601eb1940a6b0b93c76b1b9197a353c675dcd68685eb2
+size 5138

tmp-checkpoint-209/config.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "_name_or_path": "microsoft/swinv2-tiny-patch4-window8-256",
+  "architectures": [
+    "Swinv2ForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "depths": [
+    2,
+    2,
+    6,
+    2
+  ],
+  "drop_path_rate": 0.1,
+  "embed_dim": 96,
+  "encoder_stride": 32,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "avanzada",
+    "1": "leve",
+    "2": "moderada",
+    "3": "no dmae"
+  },
+  "image_size": 256,
+  "initializer_range": 0.02,
+  "label2id": {
+    "avanzada": 0,
+    "leve": 1,
+    "moderada": 2,
+    "no dmae": 3
+  },
+  "layer_norm_eps": 1e-05,
+  "mlp_ratio": 4.0,
+  "model_type": "swinv2",
+  "num_channels": 3,
+  "num_heads": [
+    3,
+    6,
+    12,
+    24
+  ],
+  "num_layers": 4,
+  "patch_size": 4,
+  "path_norm": true,
+  "pretrained_window_sizes": [
+    0,
+    0,
+    0,
+    0
+  ],
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.36.2",
+  "use_absolute_embeddings": false,
+  "window_size": 8
+}

tmp-checkpoint-209/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fde20255a6da74070d7432434b4308d059ccec0197773b1e78cf6de80a5d88dd
+size 110356296

tmp-checkpoint-209/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9d9704ff06135e6d0d653ccf8a94ada70e3b8172ddfa24726bb7384a36f70ac2
+size 220853562

tmp-checkpoint-209/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.485,
+    0.456,
+    0.406
+  ],
+  "image_processor_type": "ViTImageProcessor",
+  "image_std": [
+    0.229,
+    0.224,
+    0.225
+  ],
+  "resample": 3,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 256,
+    "width": 256
+  }
+}

tmp-checkpoint-209/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c1ec6abdbb322070af056f450a7f277305a191e5915fd5a627e1cb1b80eec3e3
+size 14244

tmp-checkpoint-209/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c4a475d82a4dac2508f8d8a7a87478ff2901d1f98c2d5e24c6072600492c64de
+size 1064

tmp-checkpoint-209/trainer_state.json ADDED Viewed

	@@ -0,0 +1,366 @@

+{
+  "best_metric": 0.7833333333333333,
+  "best_model_checkpoint": "swinv2-tiny-patch4-window8-256-dmae-va-U5-42B\\checkpoint-155",
+  "epoch": 26.967741935483872,
+  "eval_steps": 500,
+  "global_step": 209,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.9,
+      "eval_accuracy": 0.45,
+      "eval_loss": 1.3843282461166382,
+      "eval_runtime": 0.8985,
+      "eval_samples_per_second": 66.778,
+      "eval_steps_per_second": 2.226,
+      "step": 7
+    },
+    {
+      "epoch": 1.55,
+      "learning_rate": 1.6000000000000003e-05,
+      "loss": 1.3855,
+      "step": 12
+    },
+    {
+      "epoch": 1.94,
+      "eval_accuracy": 0.45,
+      "eval_loss": 1.3692599534988403,
+      "eval_runtime": 0.8682,
+      "eval_samples_per_second": 69.109,
+      "eval_steps_per_second": 2.304,
+      "step": 15
+    },
+    {
+      "epoch": 2.97,
+      "eval_accuracy": 0.45,
+      "eval_loss": 1.3112239837646484,
+      "eval_runtime": 0.8507,
+      "eval_samples_per_second": 70.53,
+      "eval_steps_per_second": 2.351,
+      "step": 23
+    },
+    {
+      "epoch": 3.1,
+      "learning_rate": 3.2000000000000005e-05,
+      "loss": 1.3665,
+      "step": 24
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.5,
+      "eval_loss": 1.182310938835144,
+      "eval_runtime": 0.8795,
+      "eval_samples_per_second": 68.219,
+      "eval_steps_per_second": 2.274,
+      "step": 31
+    },
+    {
+      "epoch": 4.65,
+      "learning_rate": 3.909090909090909e-05,
+      "loss": 1.2656,
+      "step": 36
+    },
+    {
+      "epoch": 4.9,
+      "eval_accuracy": 0.5166666666666667,
+      "eval_loss": 1.0430983304977417,
+      "eval_runtime": 0.8504,
+      "eval_samples_per_second": 70.556,
+      "eval_steps_per_second": 2.352,
+      "step": 38
+    },
+    {
+      "epoch": 5.94,
+      "eval_accuracy": 0.5,
+      "eval_loss": 0.9782969951629639,
+      "eval_runtime": 0.8875,
+      "eval_samples_per_second": 67.607,
+      "eval_steps_per_second": 2.254,
+      "step": 46
+    },
+    {
+      "epoch": 6.19,
+      "learning_rate": 3.7272727272727276e-05,
+      "loss": 1.1097,
+      "step": 48
+    },
+    {
+      "epoch": 6.97,
+      "eval_accuracy": 0.55,
+      "eval_loss": 0.9232853651046753,
+      "eval_runtime": 0.9233,
+      "eval_samples_per_second": 64.981,
+      "eval_steps_per_second": 2.166,
+      "step": 54
+    },
+    {
+      "epoch": 7.74,
+      "learning_rate": 3.545454545454546e-05,
+      "loss": 0.9542,
+      "step": 60
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.6166666666666667,
+      "eval_loss": 0.8490957617759705,
+      "eval_runtime": 0.9001,
+      "eval_samples_per_second": 66.661,
+      "eval_steps_per_second": 2.222,
+      "step": 62
+    },
+    {
+      "epoch": 8.9,
+      "eval_accuracy": 0.6,
+      "eval_loss": 0.8462814092636108,
+      "eval_runtime": 0.8868,
+      "eval_samples_per_second": 67.657,
+      "eval_steps_per_second": 2.255,
+      "step": 69
+    },
+    {
+      "epoch": 9.29,
+      "learning_rate": 3.363636363636364e-05,
+      "loss": 0.8565,
+      "step": 72
+    },
+    {
+      "epoch": 9.94,
+      "eval_accuracy": 0.6,
+      "eval_loss": 0.8351749777793884,
+      "eval_runtime": 1.1225,
+      "eval_samples_per_second": 53.451,
+      "eval_steps_per_second": 1.782,
+      "step": 77
+    },
+    {
+      "epoch": 10.84,
+      "learning_rate": 3.181818181818182e-05,
+      "loss": 0.7473,
+      "step": 84
+    },
+    {
+      "epoch": 10.97,
+      "eval_accuracy": 0.5833333333333334,
+      "eval_loss": 0.8304904699325562,
+      "eval_runtime": 1.0952,
+      "eval_samples_per_second": 54.782,
+      "eval_steps_per_second": 1.826,
+      "step": 85
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.65,
+      "eval_loss": 0.7703030109405518,
+      "eval_runtime": 0.9077,
+      "eval_samples_per_second": 66.103,
+      "eval_steps_per_second": 2.203,
+      "step": 93
+    },
+    {
+      "epoch": 12.39,
+      "learning_rate": 3.0000000000000004e-05,
+      "loss": 0.6981,
+      "step": 96
+    },
+    {
+      "epoch": 12.9,
+      "eval_accuracy": 0.6333333333333333,
+      "eval_loss": 0.8429493308067322,
+      "eval_runtime": 0.9329,
+      "eval_samples_per_second": 64.316,
+      "eval_steps_per_second": 2.144,
+      "step": 100
+    },
+    {
+      "epoch": 13.94,
+      "learning_rate": 2.8181818181818185e-05,
+      "loss": 0.5937,
+      "step": 108
+    },
+    {
+      "epoch": 13.94,
+      "eval_accuracy": 0.7,
+      "eval_loss": 0.7051786780357361,
+      "eval_runtime": 0.9214,
+      "eval_samples_per_second": 65.121,
+      "eval_steps_per_second": 2.171,
+      "step": 108
+    },
+    {
+      "epoch": 14.97,
+      "eval_accuracy": 0.6833333333333333,
+      "eval_loss": 0.6948642134666443,
+      "eval_runtime": 0.9648,
+      "eval_samples_per_second": 62.189,
+      "eval_steps_per_second": 2.073,
+      "step": 116
+    },
+    {
+      "epoch": 15.48,
+      "learning_rate": 2.6363636363636365e-05,
+      "loss": 0.549,
+      "step": 120
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.7,
+      "eval_loss": 0.740279495716095,
+      "eval_runtime": 0.9273,
+      "eval_samples_per_second": 64.707,
+      "eval_steps_per_second": 2.157,
+      "step": 124
+    },
+    {
+      "epoch": 16.9,
+      "eval_accuracy": 0.75,
+      "eval_loss": 0.6784736514091492,
+      "eval_runtime": 0.9242,
+      "eval_samples_per_second": 64.921,
+      "eval_steps_per_second": 2.164,
+      "step": 131
+    },
+    {
+      "epoch": 17.03,
+      "learning_rate": 2.454545454545455e-05,
+      "loss": 0.4983,
+      "step": 132
+    },
+    {
+      "epoch": 17.94,
+      "eval_accuracy": 0.7166666666666667,
+      "eval_loss": 0.6915722489356995,
+      "eval_runtime": 0.941,
+      "eval_samples_per_second": 63.762,
+      "eval_steps_per_second": 2.125,
+      "step": 139
+    },
+    {
+      "epoch": 18.58,
+      "learning_rate": 2.2727272727272733e-05,
+      "loss": 0.4534,
+      "step": 144
+    },
+    {
+      "epoch": 18.97,
+      "eval_accuracy": 0.75,
+      "eval_loss": 0.6501169800758362,
+      "eval_runtime": 0.8838,
+      "eval_samples_per_second": 67.889,
+      "eval_steps_per_second": 2.263,
+      "step": 147
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 0.7833333333333333,
+      "eval_loss": 0.6499305963516235,
+      "eval_runtime": 1.2045,
+      "eval_samples_per_second": 49.812,
+      "eval_steps_per_second": 1.66,
+      "step": 155
+    },
+    {
+      "epoch": 20.13,
+      "learning_rate": 2.090909090909091e-05,
+      "loss": 0.4209,
+      "step": 156
+    },
+    {
+      "epoch": 20.9,
+      "eval_accuracy": 0.7,
+      "eval_loss": 0.8589470386505127,
+      "eval_runtime": 0.995,
+      "eval_samples_per_second": 60.3,
+      "eval_steps_per_second": 2.01,
+      "step": 162
+    },
+    {
+      "epoch": 21.68,
+      "learning_rate": 1.9090909090909094e-05,
+      "loss": 0.4248,
+      "step": 168
+    },
+    {
+      "epoch": 21.94,
+      "eval_accuracy": 0.7166666666666667,
+      "eval_loss": 0.6511362791061401,
+      "eval_runtime": 0.9148,
+      "eval_samples_per_second": 65.586,
+      "eval_steps_per_second": 2.186,
+      "step": 170
+    },
+    {
+      "epoch": 22.97,
+      "eval_accuracy": 0.7333333333333333,
+      "eval_loss": 0.7100386023521423,
+      "eval_runtime": 1.135,
+      "eval_samples_per_second": 52.865,
+      "eval_steps_per_second": 1.762,
+      "step": 178
+    },
+    {
+      "epoch": 23.23,
+      "learning_rate": 1.7272727272727274e-05,
+      "loss": 0.3901,
+      "step": 180
+    },
+    {
+      "epoch": 24.0,
+      "eval_accuracy": 0.75,
+      "eval_loss": 0.6456588506698608,
+      "eval_runtime": 0.9592,
+      "eval_samples_per_second": 62.554,
+      "eval_steps_per_second": 2.085,
+      "step": 186
+    },
+    {
+      "epoch": 24.77,
+      "learning_rate": 1.5454545454545454e-05,
+      "loss": 0.3477,
+      "step": 192
+    },
+    {
+      "epoch": 24.9,
+      "eval_accuracy": 0.75,
+      "eval_loss": 0.6582431197166443,
+      "eval_runtime": 0.8667,
+      "eval_samples_per_second": 69.227,
+      "eval_steps_per_second": 2.308,
+      "step": 193
+    },
+    {
+      "epoch": 25.94,
+      "eval_accuracy": 0.75,
+      "eval_loss": 0.6813774704933167,
+      "eval_runtime": 1.0831,
+      "eval_samples_per_second": 55.399,
+      "eval_steps_per_second": 1.847,
+      "step": 201
+    },
+    {
+      "epoch": 26.32,
+      "learning_rate": 1.3636363636363637e-05,
+      "loss": 0.3236,
+      "step": 204
+    },
+    {
+      "epoch": 26.97,
+      "eval_accuracy": 0.7166666666666667,
+      "eval_loss": 0.712448239326477,
+      "eval_runtime": 0.9632,
+      "eval_samples_per_second": 62.295,
+      "eval_steps_per_second": 2.077,
+      "step": 209
+    }
+  ],
+  "logging_steps": 12,
+  "max_steps": 294,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 42,
+  "save_steps": 500,
+  "total_flos": 8.556354835395379e+17,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": null
+}

tmp-checkpoint-209/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:673b70606ff5c7802955e41eccdbe1fc2a3277196e5ba5a8fbc18800da82c2fc
+size 4792

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:673b70606ff5c7802955e41eccdbe1fc2a3277196e5ba5a8fbc18800da82c2fc
 size 4792

 version https://git-lfs.github.com/spec/v1
+oid sha256:b8228c7083080fdd60bba26c820f7c2f7a48a1e40453c2b0af5292a456d9f611
 size 4792