Upload 8 files

Browse files

Files changed (8) hide show

config.json +50 -0
optimizer.pt +3 -0
preprocessor_config.json +22 -0
pytorch_model.bin +3 -0
rng_state.pth +3 -0
scheduler.pt +3 -0
trainer_state.json +571 -0
training_args.bin +3 -0

config.json ADDED Viewed

	@@ -0,0 +1,50 @@

+{
+  "_name_or_path": "microsoft/resnet-18",
+  "architectures": [
+    "ResNetForImageClassification"
+  ],
+  "depths": [
+    2,
+    2,
+    2,
+    2
+  ],
+  "downsample_in_first_stage": false,
+  "embedding_size": 64,
+  "hidden_act": "relu",
+  "hidden_sizes": [
+    64,
+    128,
+    256,
+    512
+  ],
+  "id2label": {
+    "0": "forum",
+    "1": "general",
+    "2": "marketplace"
+  },
+  "label2id": {
+    "forum": "0",
+    "general": "1",
+    "marketplace": "2"
+  },
+  "layer_type": "basic",
+  "model_type": "resnet",
+  "num_channels": 3,
+  "out_features": [
+    "stage4"
+  ],
+  "out_indices": [
+    4
+  ],
+  "problem_type": "single_label_classification",
+  "stage_names": [
+    "stem",
+    "stage1",
+    "stage2",
+    "stage3",
+    "stage4"
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.29.2"
+}

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3b2a231ff7c6f6c2c9ec3904e67b384be47e20f1733256b888dc3fb39983ece4
+size 89460869

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+  "crop_pct": 0.875,
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.485,
+    0.456,
+    0.406
+  ],
+  "image_processor_type": "ConvNextImageProcessor",
+  "image_std": [
+    0.229,
+    0.224,
+    0.225
+  ],
+  "resample": 3,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "shortest_edge": 224
+  }
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:32c9525a35996799fe135773d47a535c9260963336836cddaef648f9a00ea46d
+size 44793653

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7771edaf10b42494826c221f91314e438076cff6958d5a6e4f4627e3b6ae6d37
+size 14575

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4cf093da31c7733407244481c89a6115a0bdc1e0fc43240dbdf23373234ae61e
+size 627

trainer_state.json ADDED Viewed

	@@ -0,0 +1,571 @@

+{
+  "best_metric": 0.7777777777777778,
+  "best_model_checkpoint": "CIRCL_website_classifier\\checkpoint-658",
+  "epoch": 15.0,
+  "global_step": 705,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.21,
+      "learning_rate": 7.042253521126762e-06,
+      "loss": 0.6238,
+      "step": 10
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 1.4084507042253523e-05,
+      "loss": 0.5542,
+      "step": 20
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 2.112676056338028e-05,
+      "loss": 0.4952,
+      "step": 30
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 2.8169014084507046e-05,
+      "loss": 0.5278,
+      "step": 40
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.7160493827160493,
+      "eval_loss": 0.7332170009613037,
+      "eval_runtime": 3.93,
+      "eval_samples_per_second": 20.611,
+      "eval_steps_per_second": 1.527,
+      "step": 47
+    },
+    {
+      "epoch": 1.06,
+      "learning_rate": 3.5211267605633805e-05,
+      "loss": 0.4947,
+      "step": 50
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 4.225352112676056e-05,
+      "loss": 0.4824,
+      "step": 60
+    },
+    {
+      "epoch": 1.49,
+      "learning_rate": 4.929577464788733e-05,
+      "loss": 0.4869,
+      "step": 70
+    },
+    {
+      "epoch": 1.7,
+      "learning_rate": 4.929022082018927e-05,
+      "loss": 0.5236,
+      "step": 80
+    },
+    {
+      "epoch": 1.91,
+      "learning_rate": 4.850157728706625e-05,
+      "loss": 0.473,
+      "step": 90
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.691358024691358,
+      "eval_loss": 0.7856547832489014,
+      "eval_runtime": 4.0912,
+      "eval_samples_per_second": 19.799,
+      "eval_steps_per_second": 1.467,
+      "step": 94
+    },
+    {
+      "epoch": 2.13,
+      "learning_rate": 4.771293375394322e-05,
+      "loss": 0.4583,
+      "step": 100
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 4.6924290220820195e-05,
+      "loss": 0.5197,
+      "step": 110
+    },
+    {
+      "epoch": 2.55,
+      "learning_rate": 4.6135646687697165e-05,
+      "loss": 0.4843,
+      "step": 120
+    },
+    {
+      "epoch": 2.77,
+      "learning_rate": 4.5347003154574134e-05,
+      "loss": 0.519,
+      "step": 130
+    },
+    {
+      "epoch": 2.98,
+      "learning_rate": 4.4558359621451104e-05,
+      "loss": 0.5199,
+      "step": 140
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.7037037037037037,
+      "eval_loss": 0.6900804042816162,
+      "eval_runtime": 4.0734,
+      "eval_samples_per_second": 19.885,
+      "eval_steps_per_second": 1.473,
+      "step": 141
+    },
+    {
+      "epoch": 3.19,
+      "learning_rate": 4.376971608832808e-05,
+      "loss": 0.489,
+      "step": 150
+    },
+    {
+      "epoch": 3.4,
+      "learning_rate": 4.298107255520505e-05,
+      "loss": 0.481,
+      "step": 160
+    },
+    {
+      "epoch": 3.62,
+      "learning_rate": 4.219242902208202e-05,
+      "loss": 0.5719,
+      "step": 170
+    },
+    {
+      "epoch": 3.83,
+      "learning_rate": 4.140378548895899e-05,
+      "loss": 0.578,
+      "step": 180
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.7160493827160493,
+      "eval_loss": 0.6246393918991089,
+      "eval_runtime": 4.3226,
+      "eval_samples_per_second": 18.739,
+      "eval_steps_per_second": 1.388,
+      "step": 188
+    },
+    {
+      "epoch": 4.04,
+      "learning_rate": 4.0615141955835965e-05,
+      "loss": 0.6731,
+      "step": 190
+    },
+    {
+      "epoch": 4.26,
+      "learning_rate": 3.982649842271294e-05,
+      "loss": 0.6082,
+      "step": 200
+    },
+    {
+      "epoch": 4.47,
+      "learning_rate": 3.903785488958991e-05,
+      "loss": 0.628,
+      "step": 210
+    },
+    {
+      "epoch": 4.68,
+      "learning_rate": 3.824921135646688e-05,
+      "loss": 0.6112,
+      "step": 220
+    },
+    {
+      "epoch": 4.89,
+      "learning_rate": 3.746056782334385e-05,
+      "loss": 0.5931,
+      "step": 230
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.6172839506172839,
+      "eval_loss": 0.7297191619873047,
+      "eval_runtime": 4.3049,
+      "eval_samples_per_second": 18.816,
+      "eval_steps_per_second": 1.394,
+      "step": 235
+    },
+    {
+      "epoch": 5.11,
+      "learning_rate": 3.667192429022082e-05,
+      "loss": 0.5872,
+      "step": 240
+    },
+    {
+      "epoch": 5.32,
+      "learning_rate": 3.5883280757097795e-05,
+      "loss": 0.5647,
+      "step": 250
+    },
+    {
+      "epoch": 5.53,
+      "learning_rate": 3.5094637223974765e-05,
+      "loss": 0.6125,
+      "step": 260
+    },
+    {
+      "epoch": 5.74,
+      "learning_rate": 3.4305993690851734e-05,
+      "loss": 0.6125,
+      "step": 270
+    },
+    {
+      "epoch": 5.96,
+      "learning_rate": 3.351735015772871e-05,
+      "loss": 0.567,
+      "step": 280
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.7037037037037037,
+      "eval_loss": 0.7199741005897522,
+      "eval_runtime": 4.5208,
+      "eval_samples_per_second": 17.917,
+      "eval_steps_per_second": 1.327,
+      "step": 282
+    },
+    {
+      "epoch": 6.17,
+      "learning_rate": 3.272870662460568e-05,
+      "loss": 0.5294,
+      "step": 290
+    },
+    {
+      "epoch": 6.38,
+      "learning_rate": 3.194006309148265e-05,
+      "loss": 0.6032,
+      "step": 300
+    },
+    {
+      "epoch": 6.6,
+      "learning_rate": 3.1151419558359626e-05,
+      "loss": 0.5943,
+      "step": 310
+    },
+    {
+      "epoch": 6.81,
+      "learning_rate": 3.0362776025236596e-05,
+      "loss": 0.5512,
+      "step": 320
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.7283950617283951,
+      "eval_loss": 0.6853248476982117,
+      "eval_runtime": 4.5083,
+      "eval_samples_per_second": 17.967,
+      "eval_steps_per_second": 1.331,
+      "step": 329
+    },
+    {
+      "epoch": 7.02,
+      "learning_rate": 2.9574132492113565e-05,
+      "loss": 0.5808,
+      "step": 330
+    },
+    {
+      "epoch": 7.23,
+      "learning_rate": 2.8785488958990535e-05,
+      "loss": 0.5226,
+      "step": 340
+    },
+    {
+      "epoch": 7.45,
+      "learning_rate": 2.7996845425867508e-05,
+      "loss": 0.5454,
+      "step": 350
+    },
+    {
+      "epoch": 7.66,
+      "learning_rate": 2.7208201892744477e-05,
+      "loss": 0.5752,
+      "step": 360
+    },
+    {
+      "epoch": 7.87,
+      "learning_rate": 2.6419558359621453e-05,
+      "loss": 0.529,
+      "step": 370
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.7037037037037037,
+      "eval_loss": 0.7038930058479309,
+      "eval_runtime": 4.4325,
+      "eval_samples_per_second": 18.274,
+      "eval_steps_per_second": 1.354,
+      "step": 376
+    },
+    {
+      "epoch": 8.09,
+      "learning_rate": 2.5630914826498426e-05,
+      "loss": 0.4872,
+      "step": 380
+    },
+    {
+      "epoch": 8.3,
+      "learning_rate": 2.4842271293375396e-05,
+      "loss": 0.548,
+      "step": 390
+    },
+    {
+      "epoch": 8.51,
+      "learning_rate": 2.405362776025237e-05,
+      "loss": 0.5507,
+      "step": 400
+    },
+    {
+      "epoch": 8.72,
+      "learning_rate": 2.3264984227129338e-05,
+      "loss": 0.5179,
+      "step": 410
+    },
+    {
+      "epoch": 8.94,
+      "learning_rate": 2.2476340694006308e-05,
+      "loss": 0.5467,
+      "step": 420
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.6790123456790124,
+      "eval_loss": 0.8216166496276855,
+      "eval_runtime": 3.9158,
+      "eval_samples_per_second": 20.685,
+      "eval_steps_per_second": 1.532,
+      "step": 423
+    },
+    {
+      "epoch": 9.15,
+      "learning_rate": 2.1687697160883284e-05,
+      "loss": 0.5055,
+      "step": 430
+    },
+    {
+      "epoch": 9.36,
+      "learning_rate": 2.0899053627760254e-05,
+      "loss": 0.5338,
+      "step": 440
+    },
+    {
+      "epoch": 9.57,
+      "learning_rate": 2.0110410094637226e-05,
+      "loss": 0.4838,
+      "step": 450
+    },
+    {
+      "epoch": 9.79,
+      "learning_rate": 1.9321766561514196e-05,
+      "loss": 0.5182,
+      "step": 460
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 1.853312302839117e-05,
+      "loss": 0.5517,
+      "step": 470
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.7407407407407407,
+      "eval_loss": 0.7132633328437805,
+      "eval_runtime": 4.247,
+      "eval_samples_per_second": 19.072,
+      "eval_steps_per_second": 1.413,
+      "step": 470
+    },
+    {
+      "epoch": 10.21,
+      "learning_rate": 1.7744479495268142e-05,
+      "loss": 0.5663,
+      "step": 480
+    },
+    {
+      "epoch": 10.43,
+      "learning_rate": 1.695583596214511e-05,
+      "loss": 0.527,
+      "step": 490
+    },
+    {
+      "epoch": 10.64,
+      "learning_rate": 1.616719242902208e-05,
+      "loss": 0.4708,
+      "step": 500
+    },
+    {
+      "epoch": 10.85,
+      "learning_rate": 1.5378548895899054e-05,
+      "loss": 0.4917,
+      "step": 510
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.7283950617283951,
+      "eval_loss": 0.7398880124092102,
+      "eval_runtime": 5.0919,
+      "eval_samples_per_second": 15.908,
+      "eval_steps_per_second": 1.178,
+      "step": 517
+    },
+    {
+      "epoch": 11.06,
+      "learning_rate": 1.4589905362776027e-05,
+      "loss": 0.5304,
+      "step": 520
+    },
+    {
+      "epoch": 11.28,
+      "learning_rate": 1.3801261829652998e-05,
+      "loss": 0.537,
+      "step": 530
+    },
+    {
+      "epoch": 11.49,
+      "learning_rate": 1.3012618296529969e-05,
+      "loss": 0.4953,
+      "step": 540
+    },
+    {
+      "epoch": 11.7,
+      "learning_rate": 1.222397476340694e-05,
+      "loss": 0.4726,
+      "step": 550
+    },
+    {
+      "epoch": 11.91,
+      "learning_rate": 1.1435331230283911e-05,
+      "loss": 0.4638,
+      "step": 560
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.7283950617283951,
+      "eval_loss": 0.7797142863273621,
+      "eval_runtime": 4.4579,
+      "eval_samples_per_second": 18.17,
+      "eval_steps_per_second": 1.346,
+      "step": 564
+    },
+    {
+      "epoch": 12.13,
+      "learning_rate": 1.0646687697160884e-05,
+      "loss": 0.4413,
+      "step": 570
+    },
+    {
+      "epoch": 12.34,
+      "learning_rate": 9.858044164037856e-06,
+      "loss": 0.5107,
+      "step": 580
+    },
+    {
+      "epoch": 12.55,
+      "learning_rate": 9.069400630914827e-06,
+      "loss": 0.4521,
+      "step": 590
+    },
+    {
+      "epoch": 12.77,
+      "learning_rate": 8.280757097791798e-06,
+      "loss": 0.5601,
+      "step": 600
+    },
+    {
+      "epoch": 12.98,
+      "learning_rate": 7.492113564668771e-06,
+      "loss": 0.5082,
+      "step": 610
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.7160493827160493,
+      "eval_loss": 0.6203879714012146,
+      "eval_runtime": 4.284,
+      "eval_samples_per_second": 18.908,
+      "eval_steps_per_second": 1.401,
+      "step": 611
+    },
+    {
+      "epoch": 13.19,
+      "learning_rate": 6.703470031545741e-06,
+      "loss": 0.5038,
+      "step": 620
+    },
+    {
+      "epoch": 13.4,
+      "learning_rate": 5.914826498422713e-06,
+      "loss": 0.4934,
+      "step": 630
+    },
+    {
+      "epoch": 13.62,
+      "learning_rate": 5.1261829652996846e-06,
+      "loss": 0.4834,
+      "step": 640
+    },
+    {
+      "epoch": 13.83,
+      "learning_rate": 4.337539432176657e-06,
+      "loss": 0.5358,
+      "step": 650
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.7777777777777778,
+      "eval_loss": 0.626596212387085,
+      "eval_runtime": 4.1062,
+      "eval_samples_per_second": 19.726,
+      "eval_steps_per_second": 1.461,
+      "step": 658
+    },
+    {
+      "epoch": 14.04,
+      "learning_rate": 3.5488958990536283e-06,
+      "loss": 0.5051,
+      "step": 660
+    },
+    {
+      "epoch": 14.26,
+      "learning_rate": 2.7602523659305995e-06,
+      "loss": 0.4712,
+      "step": 670
+    },
+    {
+      "epoch": 14.47,
+      "learning_rate": 1.971608832807571e-06,
+      "loss": 0.4649,
+      "step": 680
+    },
+    {
+      "epoch": 14.68,
+      "learning_rate": 1.1829652996845425e-06,
+      "loss": 0.4604,
+      "step": 690
+    },
+    {
+      "epoch": 14.89,
+      "learning_rate": 3.943217665615142e-07,
+      "loss": 0.5267,
+      "step": 700
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 0.6790123456790124,
+      "eval_loss": 0.7902321815490723,
+      "eval_runtime": 4.7108,
+      "eval_samples_per_second": 17.194,
+      "eval_steps_per_second": 1.274,
+      "step": 705
+    }
+  ],
+  "max_steps": 705,
+  "num_train_epochs": 15,
+  "total_flos": 4.550617827979776e+17,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:43ac4a09e13a84f09f0bd63e0fc613fec1a6eadc7232ccb73bb79a1ca64438e1
+size 3963