Training in progress, epoch 1

Browse files

Files changed (5) hide show

all_results.json +8 -0
pytorch_model.bin +1 -1
train_results.json +8 -0
trainer_state.json +346 -0
training_args.bin +1 -1

all_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 10.0,
+    "total_flos": 6.007692537881395e+17,
+    "train_loss": 0.08446450429527383,
+    "train_runtime": 456.2579,
+    "train_samples_per_second": 52.974,
+    "train_steps_per_second": 0.416
+}

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9238eea3d082857940578d581f54b5f5c43b0ddcb2a29674308b73d9a93e7025
 size 110395310

 version https://git-lfs.github.com/spec/v1
+oid sha256:ddb55cab4e923fd21cd501f4bd4fd7abc6429cc70e608a5cd2ac5d23a87064af
 size 110395310

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 10.0,
+    "total_flos": 6.007692537881395e+17,
+    "train_loss": 0.08446450429527383,
+    "train_runtime": 456.2579,
+    "train_samples_per_second": 52.974,
+    "train_steps_per_second": 0.416
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,346 @@

+{
+  "best_metric": 0.9962825278810409,
+  "best_model_checkpoint": "swin-tiny-patch4-window7-224-fraud_number_classification/checkpoint-57",
+  "epoch": 10.0,
+  "eval_steps": 500,
+  "global_step": 190,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.26,
+      "learning_rate": 1.3157894736842106e-05,
+      "loss": 0.7418,
+      "step": 5
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 2.6315789473684212e-05,
+      "loss": 0.6324,
+      "step": 10
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 3.9473684210526316e-05,
+      "loss": 0.4532,
+      "step": 15
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9739776951672863,
+      "eval_loss": 0.1707221418619156,
+      "eval_runtime": 5.6354,
+      "eval_samples_per_second": 47.734,
+      "eval_steps_per_second": 1.597,
+      "step": 19
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 4.970760233918128e-05,
+      "loss": 0.2697,
+      "step": 20
+    },
+    {
+      "epoch": 1.32,
+      "learning_rate": 4.824561403508772e-05,
+      "loss": 0.12,
+      "step": 25
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 4.678362573099415e-05,
+      "loss": 0.1068,
+      "step": 30
+    },
+    {
+      "epoch": 1.84,
+      "learning_rate": 4.5321637426900585e-05,
+      "loss": 0.0796,
+      "step": 35
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9851301115241635,
+      "eval_loss": 0.04716307297348976,
+      "eval_runtime": 2.8574,
+      "eval_samples_per_second": 94.14,
+      "eval_steps_per_second": 3.15,
+      "step": 38
+    },
+    {
+      "epoch": 2.11,
+      "learning_rate": 4.3859649122807014e-05,
+      "loss": 0.061,
+      "step": 40
+    },
+    {
+      "epoch": 2.37,
+      "learning_rate": 4.239766081871345e-05,
+      "loss": 0.056,
+      "step": 45
+    },
+    {
+      "epoch": 2.63,
+      "learning_rate": 4.093567251461988e-05,
+      "loss": 0.0429,
+      "step": 50
+    },
+    {
+      "epoch": 2.89,
+      "learning_rate": 3.9473684210526316e-05,
+      "loss": 0.0487,
+      "step": 55
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9962825278810409,
+      "eval_loss": 0.01890862174332142,
+      "eval_runtime": 2.3569,
+      "eval_samples_per_second": 114.131,
+      "eval_steps_per_second": 3.819,
+      "step": 57
+    },
+    {
+      "epoch": 3.16,
+      "learning_rate": 3.8011695906432746e-05,
+      "loss": 0.0352,
+      "step": 60
+    },
+    {
+      "epoch": 3.42,
+      "learning_rate": 3.654970760233918e-05,
+      "loss": 0.0282,
+      "step": 65
+    },
+    {
+      "epoch": 3.68,
+      "learning_rate": 3.508771929824561e-05,
+      "loss": 0.0471,
+      "step": 70
+    },
+    {
+      "epoch": 3.95,
+      "learning_rate": 3.362573099415205e-05,
+      "loss": 0.0314,
+      "step": 75
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.9925650557620818,
+      "eval_loss": 0.03749678283929825,
+      "eval_runtime": 2.3771,
+      "eval_samples_per_second": 113.161,
+      "eval_steps_per_second": 3.786,
+      "step": 76
+    },
+    {
+      "epoch": 4.21,
+      "learning_rate": 3.216374269005848e-05,
+      "loss": 0.0231,
+      "step": 80
+    },
+    {
+      "epoch": 4.47,
+      "learning_rate": 3.0701754385964913e-05,
+      "loss": 0.0274,
+      "step": 85
+    },
+    {
+      "epoch": 4.74,
+      "learning_rate": 2.9239766081871346e-05,
+      "loss": 0.0407,
+      "step": 90
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 2.777777777777778e-05,
+      "loss": 0.0318,
+      "step": 95
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.9925650557620818,
+      "eval_loss": 0.034306034445762634,
+      "eval_runtime": 2.3276,
+      "eval_samples_per_second": 115.57,
+      "eval_steps_per_second": 3.867,
+      "step": 95
+    },
+    {
+      "epoch": 5.26,
+      "learning_rate": 2.6315789473684212e-05,
+      "loss": 0.0197,
+      "step": 100
+    },
+    {
+      "epoch": 5.53,
+      "learning_rate": 2.485380116959064e-05,
+      "loss": 0.0201,
+      "step": 105
+    },
+    {
+      "epoch": 5.79,
+      "learning_rate": 2.3391812865497074e-05,
+      "loss": 0.0153,
+      "step": 110
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.9776951672862454,
+      "eval_loss": 0.07378215342760086,
+      "eval_runtime": 2.2757,
+      "eval_samples_per_second": 118.205,
+      "eval_steps_per_second": 3.955,
+      "step": 114
+    },
+    {
+      "epoch": 6.05,
+      "learning_rate": 2.1929824561403507e-05,
+      "loss": 0.0304,
+      "step": 115
+    },
+    {
+      "epoch": 6.32,
+      "learning_rate": 2.046783625730994e-05,
+      "loss": 0.0161,
+      "step": 120
+    },
+    {
+      "epoch": 6.58,
+      "learning_rate": 1.9005847953216373e-05,
+      "loss": 0.0182,
+      "step": 125
+    },
+    {
+      "epoch": 6.84,
+      "learning_rate": 1.7543859649122806e-05,
+      "loss": 0.0145,
+      "step": 130
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.9925650557620818,
+      "eval_loss": 0.02636624686419964,
+      "eval_runtime": 2.4304,
+      "eval_samples_per_second": 110.682,
+      "eval_steps_per_second": 3.703,
+      "step": 133
+    },
+    {
+      "epoch": 7.11,
+      "learning_rate": 1.608187134502924e-05,
+      "loss": 0.0347,
+      "step": 135
+    },
+    {
+      "epoch": 7.37,
+      "learning_rate": 1.4619883040935673e-05,
+      "loss": 0.0278,
+      "step": 140
+    },
+    {
+      "epoch": 7.63,
+      "learning_rate": 1.3157894736842106e-05,
+      "loss": 0.0124,
+      "step": 145
+    },
+    {
+      "epoch": 7.89,
+      "learning_rate": 1.1695906432748537e-05,
+      "loss": 0.01,
+      "step": 150
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.9888475836431226,
+      "eval_loss": 0.0280575193464756,
+      "eval_runtime": 2.9148,
+      "eval_samples_per_second": 92.287,
+      "eval_steps_per_second": 3.088,
+      "step": 152
+    },
+    {
+      "epoch": 8.16,
+      "learning_rate": 1.023391812865497e-05,
+      "loss": 0.0136,
+      "step": 155
+    },
+    {
+      "epoch": 8.42,
+      "learning_rate": 8.771929824561403e-06,
+      "loss": 0.0118,
+      "step": 160
+    },
+    {
+      "epoch": 8.68,
+      "learning_rate": 7.3099415204678366e-06,
+      "loss": 0.0158,
+      "step": 165
+    },
+    {
+      "epoch": 8.95,
+      "learning_rate": 5.8479532163742686e-06,
+      "loss": 0.015,
+      "step": 170
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.9888475836431226,
+      "eval_loss": 0.0480315163731575,
+      "eval_runtime": 2.7854,
+      "eval_samples_per_second": 96.574,
+      "eval_steps_per_second": 3.231,
+      "step": 171
+    },
+    {
+      "epoch": 9.21,
+      "learning_rate": 4.3859649122807014e-06,
+      "loss": 0.0076,
+      "step": 175
+    },
+    {
+      "epoch": 9.47,
+      "learning_rate": 2.9239766081871343e-06,
+      "loss": 0.0124,
+      "step": 180
+    },
+    {
+      "epoch": 9.74,
+      "learning_rate": 1.4619883040935671e-06,
+      "loss": 0.0132,
+      "step": 185
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 0.0,
+      "loss": 0.0241,
+      "step": 190
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.9888475836431226,
+      "eval_loss": 0.030204007402062416,
+      "eval_runtime": 2.2938,
+      "eval_samples_per_second": 117.271,
+      "eval_steps_per_second": 3.924,
+      "step": 190
+    },
+    {
+      "epoch": 10.0,
+      "step": 190,
+      "total_flos": 6.007692537881395e+17,
+      "train_loss": 0.08446450429527383,
+      "train_runtime": 456.2579,
+      "train_samples_per_second": 52.974,
+      "train_steps_per_second": 0.416
+    }
+  ],
+  "logging_steps": 5,
+  "max_steps": 190,
+  "num_train_epochs": 10,
+  "save_steps": 500,
+  "total_flos": 6.007692537881395e+17,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8cda48d413d9aa699c8748e1441b7c2f6afa56aa609de6f4deae3b6a9971f699
 size 4600

 version https://git-lfs.github.com/spec/v1
+oid sha256:322de159de53868a66f22620b710025b03178196327a431952cfd5be14b565aa
 size 4600