Upload folder using huggingface_hub

Browse files

Files changed (12) hide show

checkpoint-4900/config.json +38 -0
checkpoint-4900/model.safetensors +3 -0
checkpoint-4900/optimizer.pt +3 -0
checkpoint-4900/preprocessor_config.json +22 -0
checkpoint-4900/rng_state.pth +3 -0
checkpoint-4900/scheduler.pt +3 -0
checkpoint-4900/trainer_state.json +1096 -0
checkpoint-4900/training_args.bin +3 -0
config.json +38 -0
model.safetensors +3 -0
preprocessor_config.json +22 -0
training_args.bin +3 -0

checkpoint-4900/config.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "_name_or_path": "google/vit-base-patch16-224-in21k",
+  "architectures": [
+    "ViTForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "curly",
+    "1": "dreadlocks",
+    "2": "kinky",
+    "3": "straight",
+    "4": "wavy"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "curly": 0,
+    "dreadlocks": 1,
+    "kinky": 2,
+    "straight": 3,
+    "wavy": 4
+  },
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 12,
+  "num_channels": 3,
+  "num_hidden_layers": 12,
+  "patch_size": 16,
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.45.2"
+}

checkpoint-4900/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:880839388dee970fc3c9a41a9ea13295c6093fea1653d77780af5a05743c9cf2
+size 343233204

checkpoint-4900/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a02b69d9cb3517d77d6efff670a7edd44fb0565ba5a9d703e54737429f44a9ff
+size 686587322

checkpoint-4900/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "ViTImageProcessor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  }
+}

checkpoint-4900/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fa6d96f7ee624f7c57ede23ba0321ef010817bd064e65eb4db242f525babee44
+size 14244

checkpoint-4900/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cc8ff882b25de7a093a1ca37813f32aa219aeac50ec93044513164d388e33b66
+size 1064

checkpoint-4900/trainer_state.json ADDED Viewed

	@@ -0,0 +1,1096 @@

+{
+  "best_metric": 0.5298713445663452,
+  "best_model_checkpoint": "hair_type_image_detection/checkpoint-4900",
+  "epoch": 100.0,
+  "eval_steps": 500,
+  "global_step": 4900,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.17704280155642024,
+      "eval_loss": 1.6219326257705688,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.3274,
+      "eval_samples_per_second": 62.962,
+      "eval_steps_per_second": 7.901,
+      "step": 49
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.22568093385214008,
+      "eval_loss": 1.6067438125610352,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.2468,
+      "eval_samples_per_second": 63.274,
+      "eval_steps_per_second": 7.94,
+      "step": 98
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.27529182879377434,
+      "eval_loss": 1.5912580490112305,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.4806,
+      "eval_samples_per_second": 62.377,
+      "eval_steps_per_second": 7.827,
+      "step": 147
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.33073929961089493,
+      "eval_loss": 1.5748045444488525,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.0231,
+      "eval_samples_per_second": 64.157,
+      "eval_steps_per_second": 8.051,
+      "step": 196
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.39299610894941633,
+      "eval_loss": 1.5561603307724,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.3268,
+      "eval_samples_per_second": 62.964,
+      "eval_steps_per_second": 7.901,
+      "step": 245
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.46400778210116733,
+      "eval_loss": 1.5354892015457153,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.3682,
+      "eval_samples_per_second": 62.805,
+      "eval_steps_per_second": 7.881,
+      "step": 294
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.5223735408560312,
+      "eval_loss": 1.5132097005844116,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.1784,
+      "eval_samples_per_second": 63.542,
+      "eval_steps_per_second": 7.974,
+      "step": 343
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.5700389105058365,
+      "eval_loss": 1.4904340505599976,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 15.9362,
+      "eval_samples_per_second": 64.507,
+      "eval_steps_per_second": 8.095,
+      "step": 392
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.6138132295719845,
+      "eval_loss": 1.4679334163665771,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.4082,
+      "eval_samples_per_second": 62.652,
+      "eval_steps_per_second": 7.862,
+      "step": 441
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.6517509727626459,
+      "eval_loss": 1.4443553686141968,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.0563,
+      "eval_samples_per_second": 64.025,
+      "eval_steps_per_second": 8.034,
+      "step": 490
+    },
+    {
+      "epoch": 10.204081632653061,
+      "grad_norm": 1.3639816045761108,
+      "learning_rate": 9.072164948453608e-07,
+      "loss": 1.5205,
+      "step": 500
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.683852140077821,
+      "eval_loss": 1.4206485748291016,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.0088,
+      "eval_samples_per_second": 64.214,
+      "eval_steps_per_second": 8.058,
+      "step": 539
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.7178988326848249,
+      "eval_loss": 1.3944063186645508,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 15.9211,
+      "eval_samples_per_second": 64.568,
+      "eval_steps_per_second": 8.102,
+      "step": 588
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.7441634241245136,
+      "eval_loss": 1.3676106929779053,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.1365,
+      "eval_samples_per_second": 63.706,
+      "eval_steps_per_second": 7.994,
+      "step": 637
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.7684824902723736,
+      "eval_loss": 1.3409146070480347,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.0749,
+      "eval_samples_per_second": 63.95,
+      "eval_steps_per_second": 8.025,
+      "step": 686
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 0.7830739299610895,
+      "eval_loss": 1.312709927558899,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.1852,
+      "eval_samples_per_second": 63.515,
+      "eval_steps_per_second": 7.97,
+      "step": 735
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.7976653696498055,
+      "eval_loss": 1.2852919101715088,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.5033,
+      "eval_samples_per_second": 62.291,
+      "eval_steps_per_second": 7.817,
+      "step": 784
+    },
+    {
+      "epoch": 17.0,
+      "eval_accuracy": 0.8151750972762646,
+      "eval_loss": 1.2579333782196045,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.716,
+      "eval_samples_per_second": 61.498,
+      "eval_steps_per_second": 7.717,
+      "step": 833
+    },
+    {
+      "epoch": 18.0,
+      "eval_accuracy": 0.8258754863813229,
+      "eval_loss": 1.2285292148590088,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.3546,
+      "eval_samples_per_second": 62.857,
+      "eval_steps_per_second": 7.888,
+      "step": 882
+    },
+    {
+      "epoch": 19.0,
+      "eval_accuracy": 0.8317120622568094,
+      "eval_loss": 1.2019933462142944,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.435,
+      "eval_samples_per_second": 62.549,
+      "eval_steps_per_second": 7.849,
+      "step": 931
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 0.8404669260700389,
+      "eval_loss": 1.1748104095458984,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.4968,
+      "eval_samples_per_second": 62.315,
+      "eval_steps_per_second": 7.82,
+      "step": 980
+    },
+    {
+      "epoch": 20.408163265306122,
+      "grad_norm": 1.599041223526001,
+      "learning_rate": 8.041237113402062e-07,
+      "loss": 1.2347,
+      "step": 1000
+    },
+    {
+      "epoch": 21.0,
+      "eval_accuracy": 0.8492217898832685,
+      "eval_loss": 1.1474989652633667,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.0812,
+      "eval_samples_per_second": 63.925,
+      "eval_steps_per_second": 8.022,
+      "step": 1029
+    },
+    {
+      "epoch": 22.0,
+      "eval_accuracy": 0.8521400778210116,
+      "eval_loss": 1.121047019958496,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.0658,
+      "eval_samples_per_second": 63.987,
+      "eval_steps_per_second": 8.03,
+      "step": 1078
+    },
+    {
+      "epoch": 23.0,
+      "eval_accuracy": 0.8628404669260701,
+      "eval_loss": 1.0952664613723755,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.283,
+      "eval_samples_per_second": 63.133,
+      "eval_steps_per_second": 7.922,
+      "step": 1127
+    },
+    {
+      "epoch": 24.0,
+      "eval_accuracy": 0.8638132295719845,
+      "eval_loss": 1.070285439491272,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 15.9544,
+      "eval_samples_per_second": 64.434,
+      "eval_steps_per_second": 8.086,
+      "step": 1176
+    },
+    {
+      "epoch": 25.0,
+      "eval_accuracy": 0.8638132295719845,
+      "eval_loss": 1.046401023864746,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.1019,
+      "eval_samples_per_second": 63.843,
+      "eval_steps_per_second": 8.011,
+      "step": 1225
+    },
+    {
+      "epoch": 26.0,
+      "eval_accuracy": 0.8686770428015564,
+      "eval_loss": 1.0234460830688477,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.0897,
+      "eval_samples_per_second": 63.892,
+      "eval_steps_per_second": 8.018,
+      "step": 1274
+    },
+    {
+      "epoch": 27.0,
+      "eval_accuracy": 0.8696498054474708,
+      "eval_loss": 1.0003376007080078,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.2835,
+      "eval_samples_per_second": 63.131,
+      "eval_steps_per_second": 7.922,
+      "step": 1323
+    },
+    {
+      "epoch": 28.0,
+      "eval_accuracy": 0.8696498054474708,
+      "eval_loss": 0.9786379337310791,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.2428,
+      "eval_samples_per_second": 63.29,
+      "eval_steps_per_second": 7.942,
+      "step": 1372
+    },
+    {
+      "epoch": 29.0,
+      "eval_accuracy": 0.8715953307392996,
+      "eval_loss": 0.9573078751564026,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 15.9987,
+      "eval_samples_per_second": 64.255,
+      "eval_steps_per_second": 8.063,
+      "step": 1421
+    },
+    {
+      "epoch": 30.0,
+      "eval_accuracy": 0.872568093385214,
+      "eval_loss": 0.9362879395484924,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.1691,
+      "eval_samples_per_second": 63.578,
+      "eval_steps_per_second": 7.978,
+      "step": 1470
+    },
+    {
+      "epoch": 30.612244897959183,
+      "grad_norm": 1.5271226167678833,
+      "learning_rate": 7.010309278350515e-07,
+      "loss": 0.9467,
+      "step": 1500
+    },
+    {
+      "epoch": 31.0,
+      "eval_accuracy": 0.8754863813229572,
+      "eval_loss": 0.9171885848045349,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.3696,
+      "eval_samples_per_second": 62.799,
+      "eval_steps_per_second": 7.88,
+      "step": 1519
+    },
+    {
+      "epoch": 32.0,
+      "eval_accuracy": 0.8803501945525292,
+      "eval_loss": 0.8980955481529236,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.4392,
+      "eval_samples_per_second": 62.533,
+      "eval_steps_per_second": 7.847,
+      "step": 1568
+    },
+    {
+      "epoch": 33.0,
+      "eval_accuracy": 0.8861867704280155,
+      "eval_loss": 0.8809771537780762,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.4449,
+      "eval_samples_per_second": 62.512,
+      "eval_steps_per_second": 7.844,
+      "step": 1617
+    },
+    {
+      "epoch": 34.0,
+      "eval_accuracy": 0.8861867704280155,
+      "eval_loss": 0.8635137677192688,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.4485,
+      "eval_samples_per_second": 62.498,
+      "eval_steps_per_second": 7.843,
+      "step": 1666
+    },
+    {
+      "epoch": 35.0,
+      "eval_accuracy": 0.8881322957198443,
+      "eval_loss": 0.8468510508537292,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.2536,
+      "eval_samples_per_second": 63.247,
+      "eval_steps_per_second": 7.937,
+      "step": 1715
+    },
+    {
+      "epoch": 36.0,
+      "eval_accuracy": 0.8881322957198443,
+      "eval_loss": 0.8328165411949158,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.503,
+      "eval_samples_per_second": 62.292,
+      "eval_steps_per_second": 7.817,
+      "step": 1764
+    },
+    {
+      "epoch": 37.0,
+      "eval_accuracy": 0.8881322957198443,
+      "eval_loss": 0.8181366920471191,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.8306,
+      "eval_samples_per_second": 61.079,
+      "eval_steps_per_second": 7.665,
+      "step": 1813
+    },
+    {
+      "epoch": 38.0,
+      "eval_accuracy": 0.8891050583657587,
+      "eval_loss": 0.8040880560874939,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.772,
+      "eval_samples_per_second": 61.293,
+      "eval_steps_per_second": 7.691,
+      "step": 1862
+    },
+    {
+      "epoch": 39.0,
+      "eval_accuracy": 0.8891050583657587,
+      "eval_loss": 0.790228009223938,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.3652,
+      "eval_samples_per_second": 62.816,
+      "eval_steps_per_second": 7.883,
+      "step": 1911
+    },
+    {
+      "epoch": 40.0,
+      "eval_accuracy": 0.8910505836575876,
+      "eval_loss": 0.7775859832763672,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.2631,
+      "eval_samples_per_second": 63.211,
+      "eval_steps_per_second": 7.932,
+      "step": 1960
+    },
+    {
+      "epoch": 40.816326530612244,
+      "grad_norm": 1.7460684776306152,
+      "learning_rate": 5.979381443298969e-07,
+      "loss": 0.7398,
+      "step": 2000
+    },
+    {
+      "epoch": 41.0,
+      "eval_accuracy": 0.892023346303502,
+      "eval_loss": 0.766076922416687,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.3183,
+      "eval_samples_per_second": 62.997,
+      "eval_steps_per_second": 7.905,
+      "step": 2009
+    },
+    {
+      "epoch": 42.0,
+      "eval_accuracy": 0.8949416342412452,
+      "eval_loss": 0.7547051906585693,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.274,
+      "eval_samples_per_second": 63.168,
+      "eval_steps_per_second": 7.927,
+      "step": 2058
+    },
+    {
+      "epoch": 43.0,
+      "eval_accuracy": 0.8998054474708171,
+      "eval_loss": 0.7428992986679077,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.2531,
+      "eval_samples_per_second": 63.25,
+      "eval_steps_per_second": 7.937,
+      "step": 2107
+    },
+    {
+      "epoch": 44.0,
+      "eval_accuracy": 0.9027237354085603,
+      "eval_loss": 0.7334992289543152,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.1775,
+      "eval_samples_per_second": 63.545,
+      "eval_steps_per_second": 7.974,
+      "step": 2156
+    },
+    {
+      "epoch": 45.0,
+      "eval_accuracy": 0.9027237354085603,
+      "eval_loss": 0.7230122089385986,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.4977,
+      "eval_samples_per_second": 62.312,
+      "eval_steps_per_second": 7.819,
+      "step": 2205
+    },
+    {
+      "epoch": 46.0,
+      "eval_accuracy": 0.9056420233463035,
+      "eval_loss": 0.7135947942733765,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.7331,
+      "eval_samples_per_second": 61.435,
+      "eval_steps_per_second": 7.709,
+      "step": 2254
+    },
+    {
+      "epoch": 47.0,
+      "eval_accuracy": 0.9085603112840467,
+      "eval_loss": 0.7030473351478577,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.265,
+      "eval_samples_per_second": 63.203,
+      "eval_steps_per_second": 7.931,
+      "step": 2303
+    },
+    {
+      "epoch": 48.0,
+      "eval_accuracy": 0.9066147859922179,
+      "eval_loss": 0.694833517074585,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.6017,
+      "eval_samples_per_second": 61.921,
+      "eval_steps_per_second": 7.77,
+      "step": 2352
+    },
+    {
+      "epoch": 49.0,
+      "eval_accuracy": 0.9075875486381323,
+      "eval_loss": 0.6868679523468018,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.3769,
+      "eval_samples_per_second": 62.771,
+      "eval_steps_per_second": 7.877,
+      "step": 2401
+    },
+    {
+      "epoch": 50.0,
+      "eval_accuracy": 0.9105058365758755,
+      "eval_loss": 0.6781201958656311,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.5365,
+      "eval_samples_per_second": 62.166,
+      "eval_steps_per_second": 7.801,
+      "step": 2450
+    },
+    {
+      "epoch": 51.0,
+      "eval_accuracy": 0.9114785992217899,
+      "eval_loss": 0.6707582473754883,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.7029,
+      "eval_samples_per_second": 61.546,
+      "eval_steps_per_second": 7.723,
+      "step": 2499
+    },
+    {
+      "epoch": 51.02040816326531,
+      "grad_norm": 1.5139410495758057,
+      "learning_rate": 4.948453608247422e-07,
+      "loss": 0.6135,
+      "step": 2500
+    },
+    {
+      "epoch": 52.0,
+      "eval_accuracy": 0.914396887159533,
+      "eval_loss": 0.6635868549346924,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.7917,
+      "eval_samples_per_second": 61.221,
+      "eval_steps_per_second": 7.682,
+      "step": 2548
+    },
+    {
+      "epoch": 53.0,
+      "eval_accuracy": 0.9134241245136187,
+      "eval_loss": 0.6572186946868896,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.5427,
+      "eval_samples_per_second": 62.142,
+      "eval_steps_per_second": 7.798,
+      "step": 2597
+    },
+    {
+      "epoch": 54.0,
+      "eval_accuracy": 0.9153696498054474,
+      "eval_loss": 0.6508779525756836,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.3209,
+      "eval_samples_per_second": 62.987,
+      "eval_steps_per_second": 7.904,
+      "step": 2646
+    },
+    {
+      "epoch": 55.0,
+      "eval_accuracy": 0.9173151750972762,
+      "eval_loss": 0.6439871191978455,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.5127,
+      "eval_samples_per_second": 62.255,
+      "eval_steps_per_second": 7.812,
+      "step": 2695
+    },
+    {
+      "epoch": 56.0,
+      "eval_accuracy": 0.9153696498054474,
+      "eval_loss": 0.6389443874359131,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.1819,
+      "eval_samples_per_second": 63.528,
+      "eval_steps_per_second": 7.972,
+      "step": 2744
+    },
+    {
+      "epoch": 57.0,
+      "eval_accuracy": 0.919260700389105,
+      "eval_loss": 0.6327943801879883,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.6521,
+      "eval_samples_per_second": 61.734,
+      "eval_steps_per_second": 7.747,
+      "step": 2793
+    },
+    {
+      "epoch": 58.0,
+      "eval_accuracy": 0.9212062256809338,
+      "eval_loss": 0.6252166032791138,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.374,
+      "eval_samples_per_second": 62.782,
+      "eval_steps_per_second": 7.878,
+      "step": 2842
+    },
+    {
+      "epoch": 59.0,
+      "eval_accuracy": 0.9202334630350194,
+      "eval_loss": 0.6206849217414856,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.2753,
+      "eval_samples_per_second": 63.163,
+      "eval_steps_per_second": 7.926,
+      "step": 2891
+    },
+    {
+      "epoch": 60.0,
+      "eval_accuracy": 0.919260700389105,
+      "eval_loss": 0.6157888174057007,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.4343,
+      "eval_samples_per_second": 62.552,
+      "eval_steps_per_second": 7.849,
+      "step": 2940
+    },
+    {
+      "epoch": 61.0,
+      "eval_accuracy": 0.9221789883268483,
+      "eval_loss": 0.6105452179908752,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.3327,
+      "eval_samples_per_second": 62.941,
+      "eval_steps_per_second": 7.898,
+      "step": 2989
+    },
+    {
+      "epoch": 61.224489795918366,
+      "grad_norm": 2.1964964866638184,
+      "learning_rate": 3.917525773195876e-07,
+      "loss": 0.5351,
+      "step": 3000
+    },
+    {
+      "epoch": 62.0,
+      "eval_accuracy": 0.9221789883268483,
+      "eval_loss": 0.6059720516204834,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 15.9025,
+      "eval_samples_per_second": 64.644,
+      "eval_steps_per_second": 8.112,
+      "step": 3038
+    },
+    {
+      "epoch": 63.0,
+      "eval_accuracy": 0.9221789883268483,
+      "eval_loss": 0.6012532114982605,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.1752,
+      "eval_samples_per_second": 63.554,
+      "eval_steps_per_second": 7.975,
+      "step": 3087
+    },
+    {
+      "epoch": 64.0,
+      "eval_accuracy": 0.9241245136186771,
+      "eval_loss": 0.5974491238594055,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.006,
+      "eval_samples_per_second": 64.226,
+      "eval_steps_per_second": 8.059,
+      "step": 3136
+    },
+    {
+      "epoch": 65.0,
+      "eval_accuracy": 0.9250972762645915,
+      "eval_loss": 0.5935858488082886,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 15.9581,
+      "eval_samples_per_second": 64.419,
+      "eval_steps_per_second": 8.084,
+      "step": 3185
+    },
+    {
+      "epoch": 66.0,
+      "eval_accuracy": 0.9260700389105059,
+      "eval_loss": 0.588865339756012,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.1822,
+      "eval_samples_per_second": 63.526,
+      "eval_steps_per_second": 7.972,
+      "step": 3234
+    },
+    {
+      "epoch": 67.0,
+      "eval_accuracy": 0.9260700389105059,
+      "eval_loss": 0.5851794481277466,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.116,
+      "eval_samples_per_second": 63.787,
+      "eval_steps_per_second": 8.004,
+      "step": 3283
+    },
+    {
+      "epoch": 68.0,
+      "eval_accuracy": 0.9221789883268483,
+      "eval_loss": 0.5818396210670471,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.5601,
+      "eval_samples_per_second": 62.077,
+      "eval_steps_per_second": 7.79,
+      "step": 3332
+    },
+    {
+      "epoch": 69.0,
+      "eval_accuracy": 0.9231517509727627,
+      "eval_loss": 0.578502357006073,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.364,
+      "eval_samples_per_second": 62.821,
+      "eval_steps_per_second": 7.883,
+      "step": 3381
+    },
+    {
+      "epoch": 70.0,
+      "eval_accuracy": 0.9241245136186771,
+      "eval_loss": 0.5750812888145447,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.3061,
+      "eval_samples_per_second": 63.044,
+      "eval_steps_per_second": 7.911,
+      "step": 3430
+    },
+    {
+      "epoch": 71.0,
+      "eval_accuracy": 0.9241245136186771,
+      "eval_loss": 0.5718052387237549,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.3828,
+      "eval_samples_per_second": 62.749,
+      "eval_steps_per_second": 7.874,
+      "step": 3479
+    },
+    {
+      "epoch": 71.42857142857143,
+      "grad_norm": 1.5724107027053833,
+      "learning_rate": 2.8865979381443296e-07,
+      "loss": 0.483,
+      "step": 3500
+    },
+    {
+      "epoch": 72.0,
+      "eval_accuracy": 0.9250972762645915,
+      "eval_loss": 0.5689519643783569,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.3228,
+      "eval_samples_per_second": 62.98,
+      "eval_steps_per_second": 7.903,
+      "step": 3528
+    },
+    {
+      "epoch": 73.0,
+      "eval_accuracy": 0.9241245136186771,
+      "eval_loss": 0.565991997718811,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.0251,
+      "eval_samples_per_second": 64.149,
+      "eval_steps_per_second": 8.05,
+      "step": 3577
+    },
+    {
+      "epoch": 74.0,
+      "eval_accuracy": 0.9231517509727627,
+      "eval_loss": 0.5631707906723022,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.0794,
+      "eval_samples_per_second": 63.933,
+      "eval_steps_per_second": 8.023,
+      "step": 3626
+    },
+    {
+      "epoch": 75.0,
+      "eval_accuracy": 0.9250972762645915,
+      "eval_loss": 0.5604016780853271,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.1767,
+      "eval_samples_per_second": 63.548,
+      "eval_steps_per_second": 7.974,
+      "step": 3675
+    },
+    {
+      "epoch": 76.0,
+      "eval_accuracy": 0.9241245136186771,
+      "eval_loss": 0.5577030777931213,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.2849,
+      "eval_samples_per_second": 63.126,
+      "eval_steps_per_second": 7.921,
+      "step": 3724
+    },
+    {
+      "epoch": 77.0,
+      "eval_accuracy": 0.9250972762645915,
+      "eval_loss": 0.5554907917976379,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.1225,
+      "eval_samples_per_second": 63.762,
+      "eval_steps_per_second": 8.001,
+      "step": 3773
+    },
+    {
+      "epoch": 78.0,
+      "eval_accuracy": 0.9260700389105059,
+      "eval_loss": 0.5532063841819763,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.1489,
+      "eval_samples_per_second": 63.658,
+      "eval_steps_per_second": 7.988,
+      "step": 3822
+    },
+    {
+      "epoch": 79.0,
+      "eval_accuracy": 0.9241245136186771,
+      "eval_loss": 0.5517746806144714,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.1776,
+      "eval_samples_per_second": 63.545,
+      "eval_steps_per_second": 7.974,
+      "step": 3871
+    },
+    {
+      "epoch": 80.0,
+      "eval_accuracy": 0.9260700389105059,
+      "eval_loss": 0.5491300821304321,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.4646,
+      "eval_samples_per_second": 62.437,
+      "eval_steps_per_second": 7.835,
+      "step": 3920
+    },
+    {
+      "epoch": 81.0,
+      "eval_accuracy": 0.9260700389105059,
+      "eval_loss": 0.5468857884407043,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.5897,
+      "eval_samples_per_second": 61.966,
+      "eval_steps_per_second": 7.776,
+      "step": 3969
+    },
+    {
+      "epoch": 81.63265306122449,
+      "grad_norm": 1.5352323055267334,
+      "learning_rate": 1.8556701030927835e-07,
+      "loss": 0.4496,
+      "step": 4000
+    },
+    {
+      "epoch": 82.0,
+      "eval_accuracy": 0.9260700389105059,
+      "eval_loss": 0.5453611016273499,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.5158,
+      "eval_samples_per_second": 62.243,
+      "eval_steps_per_second": 7.811,
+      "step": 4018
+    },
+    {
+      "epoch": 83.0,
+      "eval_accuracy": 0.9289883268482491,
+      "eval_loss": 0.5431452989578247,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.2358,
+      "eval_samples_per_second": 63.317,
+      "eval_steps_per_second": 7.945,
+      "step": 4067
+    },
+    {
+      "epoch": 84.0,
+      "eval_accuracy": 0.9270428015564203,
+      "eval_loss": 0.5419163107872009,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.3758,
+      "eval_samples_per_second": 62.776,
+      "eval_steps_per_second": 7.877,
+      "step": 4116
+    },
+    {
+      "epoch": 85.0,
+      "eval_accuracy": 0.9280155642023347,
+      "eval_loss": 0.5407156348228455,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.7946,
+      "eval_samples_per_second": 61.21,
+      "eval_steps_per_second": 7.681,
+      "step": 4165
+    },
+    {
+      "epoch": 86.0,
+      "eval_accuracy": 0.9280155642023347,
+      "eval_loss": 0.5391236543655396,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.961,
+      "eval_samples_per_second": 60.609,
+      "eval_steps_per_second": 7.606,
+      "step": 4214
+    },
+    {
+      "epoch": 87.0,
+      "eval_accuracy": 0.9280155642023347,
+      "eval_loss": 0.5377916693687439,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.9464,
+      "eval_samples_per_second": 60.662,
+      "eval_steps_per_second": 7.612,
+      "step": 4263
+    },
+    {
+      "epoch": 88.0,
+      "eval_accuracy": 0.9280155642023347,
+      "eval_loss": 0.5364987850189209,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.757,
+      "eval_samples_per_second": 61.347,
+      "eval_steps_per_second": 7.698,
+      "step": 4312
+    },
+    {
+      "epoch": 89.0,
+      "eval_accuracy": 0.9280155642023347,
+      "eval_loss": 0.5354925394058228,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.8288,
+      "eval_samples_per_second": 61.086,
+      "eval_steps_per_second": 7.665,
+      "step": 4361
+    },
+    {
+      "epoch": 90.0,
+      "eval_accuracy": 0.9270428015564203,
+      "eval_loss": 0.534569501876831,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.5639,
+      "eval_samples_per_second": 62.063,
+      "eval_steps_per_second": 7.788,
+      "step": 4410
+    },
+    {
+      "epoch": 91.0,
+      "eval_accuracy": 0.9280155642023347,
+      "eval_loss": 0.5335658192634583,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.5932,
+      "eval_samples_per_second": 61.953,
+      "eval_steps_per_second": 7.774,
+      "step": 4459
+    },
+    {
+      "epoch": 91.83673469387755,
+      "grad_norm": 1.4989055395126343,
+      "learning_rate": 8.24742268041237e-08,
+      "loss": 0.4299,
+      "step": 4500
+    },
+    {
+      "epoch": 92.0,
+      "eval_accuracy": 0.9280155642023347,
+      "eval_loss": 0.5327633023262024,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.6218,
+      "eval_samples_per_second": 61.846,
+      "eval_steps_per_second": 7.761,
+      "step": 4508
+    },
+    {
+      "epoch": 93.0,
+      "eval_accuracy": 0.9280155642023347,
+      "eval_loss": 0.5321099758148193,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.4686,
+      "eval_samples_per_second": 62.422,
+      "eval_steps_per_second": 7.833,
+      "step": 4557
+    },
+    {
+      "epoch": 94.0,
+      "eval_accuracy": 0.9280155642023347,
+      "eval_loss": 0.5314825177192688,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.4592,
+      "eval_samples_per_second": 62.458,
+      "eval_steps_per_second": 7.838,
+      "step": 4606
+    },
+    {
+      "epoch": 95.0,
+      "eval_accuracy": 0.9270428015564203,
+      "eval_loss": 0.5310559868812561,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.6737,
+      "eval_samples_per_second": 61.654,
+      "eval_steps_per_second": 7.737,
+      "step": 4655
+    },
+    {
+      "epoch": 96.0,
+      "eval_accuracy": 0.9270428015564203,
+      "eval_loss": 0.5306681990623474,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.4895,
+      "eval_samples_per_second": 62.343,
+      "eval_steps_per_second": 7.823,
+      "step": 4704
+    },
+    {
+      "epoch": 97.0,
+      "eval_accuracy": 0.9280155642023347,
+      "eval_loss": 0.5302944183349609,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.5288,
+      "eval_samples_per_second": 62.194,
+      "eval_steps_per_second": 7.805,
+      "step": 4753
+    },
+    {
+      "epoch": 98.0,
+      "eval_accuracy": 0.9270428015564203,
+      "eval_loss": 0.5300623774528503,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.4477,
+      "eval_samples_per_second": 62.501,
+      "eval_steps_per_second": 7.843,
+      "step": 4802
+    },
+    {
+      "epoch": 99.0,
+      "eval_accuracy": 0.9280155642023347,
+      "eval_loss": 0.5299115180969238,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.5643,
+      "eval_samples_per_second": 62.061,
+      "eval_steps_per_second": 7.788,
+      "step": 4851
+    },
+    {
+      "epoch": 100.0,
+      "eval_accuracy": 0.9280155642023347,
+      "eval_loss": 0.5298713445663452,
+      "eval_model_preparation_time": 0.0053,
+      "eval_runtime": 16.9421,
+      "eval_samples_per_second": 60.677,
+      "eval_steps_per_second": 7.614,
+      "step": 4900
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 4900,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 100,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 1.1949586091012506e+19,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-4900/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:858525d77a2aca146b3415e12c5a888e5f5b65064bb27a757b2697e4eabc4024
+size 5176

config.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "_name_or_path": "google/vit-base-patch16-224-in21k",
+  "architectures": [
+    "ViTForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "curly",
+    "1": "dreadlocks",
+    "2": "kinky",
+    "3": "straight",
+    "4": "wavy"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "curly": 0,
+    "dreadlocks": 1,
+    "kinky": 2,
+    "straight": 3,
+    "wavy": 4
+  },
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 12,
+  "num_channels": 3,
+  "num_hidden_layers": 12,
+  "patch_size": 16,
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.45.2"
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:880839388dee970fc3c9a41a9ea13295c6093fea1653d77780af5a05743c9cf2
+size 343233204

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "ViTImageProcessor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  }
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:858525d77a2aca146b3415e12c5a888e5f5b65064bb27a757b2697e4eabc4024
+size 5176