Upload folder using huggingface_hub

Browse files

Files changed (10) hide show

checkpoint-5640/config.json +129 -0
checkpoint-5640/model.safetensors +3 -0
checkpoint-5640/optimizer.pt +3 -0
checkpoint-5640/preprocessor_config.json +23 -0
checkpoint-5640/rng_state.pth +3 -0
checkpoint-5640/scheduler.pt +3 -0
checkpoint-5640/trainer_state.json +511 -0
checkpoint-5640/training_args.bin +3 -0
model.safetensors +1 -1
training_args.bin +1 -1

checkpoint-5640/config.json ADDED Viewed

	@@ -0,0 +1,129 @@

+{
+  "architectures": [
+    "ViTForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "adidas_forum_high",
+    "1": "adidas_forum_low",
+    "2": "adidas_gazelle",
+    "3": "adidas_nmd_r1",
+    "4": "adidas_samba",
+    "5": "adidas_stan_smith",
+    "6": "adidas_superstar",
+    "7": "adidas_ultraboost",
+    "8": "asics_gel-lyte_iii",
+    "9": "converse_chuck_70_high",
+    "10": "converse_chuck_70_low",
+    "11": "converse_chuck_taylor_all-star_high",
+    "12": "converse_chuck_taylor_all-star_low",
+    "13": "converse_one_star",
+    "14": "new_balance_327",
+    "15": "new_balance_550",
+    "16": "new_balance_574",
+    "17": "new_balance_990",
+    "18": "new_balance_992",
+    "19": "nike_air_force_1_high",
+    "20": "nike_air_force_1_low",
+    "21": "nike_air_force_1_mid",
+    "22": "nike_air_jordan_11",
+    "23": "nike_air_jordan_1_high",
+    "24": "nike_air_jordan_1_low",
+    "25": "nike_air_jordan_3",
+    "26": "nike_air_jordan_4",
+    "27": "nike_air_max_1",
+    "28": "nike_air_max_270",
+    "29": "nike_air_max_90",
+    "30": "nike_air_max_95",
+    "31": "nike_air_max_97",
+    "32": "nike_air_max_plus_(tn)",
+    "33": "nike_air_vapormax_flyknit",
+    "34": "nike_air_vapormax_plus",
+    "35": "nike_blazer_mid_77",
+    "36": "nike_cortez",
+    "37": "nike_dunk_high",
+    "38": "nike_dunk_low",
+    "39": "puma_suede_classic",
+    "40": "reebok_classic_leather",
+    "41": "reebok_club_c_85",
+    "42": "salomon_xt-6",
+    "43": "vans_authentic",
+    "44": "vans_old_skool",
+    "45": "vans_sk8-hi",
+    "46": "vans_slip-on_checkerboard",
+    "47": "yeezy_700_wave_runner",
+    "48": "yeezy_boost_350_v2",
+    "49": "yeezy_slide"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "adidas_forum_high": 0,
+    "adidas_forum_low": 1,
+    "adidas_gazelle": 2,
+    "adidas_nmd_r1": 3,
+    "adidas_samba": 4,
+    "adidas_stan_smith": 5,
+    "adidas_superstar": 6,
+    "adidas_ultraboost": 7,
+    "asics_gel-lyte_iii": 8,
+    "converse_chuck_70_high": 9,
+    "converse_chuck_70_low": 10,
+    "converse_chuck_taylor_all-star_high": 11,
+    "converse_chuck_taylor_all-star_low": 12,
+    "converse_one_star": 13,
+    "new_balance_327": 14,
+    "new_balance_550": 15,
+    "new_balance_574": 16,
+    "new_balance_990": 17,
+    "new_balance_992": 18,
+    "nike_air_force_1_high": 19,
+    "nike_air_force_1_low": 20,
+    "nike_air_force_1_mid": 21,
+    "nike_air_jordan_11": 22,
+    "nike_air_jordan_1_high": 23,
+    "nike_air_jordan_1_low": 24,
+    "nike_air_jordan_3": 25,
+    "nike_air_jordan_4": 26,
+    "nike_air_max_1": 27,
+    "nike_air_max_270": 28,
+    "nike_air_max_90": 29,
+    "nike_air_max_95": 30,
+    "nike_air_max_97": 31,
+    "nike_air_max_plus_(tn)": 32,
+    "nike_air_vapormax_flyknit": 33,
+    "nike_air_vapormax_plus": 34,
+    "nike_blazer_mid_77": 35,
+    "nike_cortez": 36,
+    "nike_dunk_high": 37,
+    "nike_dunk_low": 38,
+    "puma_suede_classic": 39,
+    "reebok_classic_leather": 40,
+    "reebok_club_c_85": 41,
+    "salomon_xt-6": 42,
+    "vans_authentic": 43,
+    "vans_old_skool": 44,
+    "vans_sk8-hi": 45,
+    "vans_slip-on_checkerboard": 46,
+    "yeezy_700_wave_runner": 47,
+    "yeezy_boost_350_v2": 48,
+    "yeezy_slide": 49
+  },
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 12,
+  "num_channels": 3,
+  "num_hidden_layers": 12,
+  "patch_size": 16,
+  "pooler_act": "tanh",
+  "pooler_output_size": 768,
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.51.3"
+}

checkpoint-5640/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0c4745e3fdcd455e985f55ae003c88c87d197975d2307ad5dda833f8c30809d0
+size 343371632

checkpoint-5640/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3310bf09978d639f503bac2f5400e0837b4ed61f1f3db0b2565bafa6ba106db1
+size 686864186

checkpoint-5640/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "do_convert_rgb": null,
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "ViTImageProcessor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  }
+}

checkpoint-5640/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5591368b5e645f6f84c8526df6dfd0c8c2904179c960a8a757d795a3b9c9edef
+size 14244

checkpoint-5640/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:58a6de07b073daad8f68678fd6f5f692094c61f764b1579a3cc1b60ed9aa9687
+size 1064

checkpoint-5640/trainer_state.json ADDED Viewed

	@@ -0,0 +1,511 @@

+{
+  "best_global_step": 5640,
+  "best_metric": 2.5463945865631104,
+  "best_model_checkpoint": "popular_sneakers_detection/checkpoint-5640",
+  "epoch": 40.0,
+  "eval_steps": 500,
+  "global_step": 5640,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.042333333333333334,
+      "eval_loss": 3.8944478034973145,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.4259,
+      "eval_samples_per_second": 109.386,
+      "eval_steps_per_second": 13.673,
+      "step": 141
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.06366666666666666,
+      "eval_loss": 3.8702337741851807,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 26.7233,
+      "eval_samples_per_second": 112.261,
+      "eval_steps_per_second": 14.033,
+      "step": 282
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.094,
+      "eval_loss": 3.8375682830810547,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.5229,
+      "eval_samples_per_second": 109.0,
+      "eval_steps_per_second": 13.625,
+      "step": 423
+    },
+    {
+      "epoch": 3.546099290780142,
+      "grad_norm": 1.5614980459213257,
+      "learning_rate": 4.598389982110913e-06,
+      "loss": 3.8547,
+      "step": 500
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.13733333333333334,
+      "eval_loss": 3.79917573928833,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 28.4527,
+      "eval_samples_per_second": 105.438,
+      "eval_steps_per_second": 13.18,
+      "step": 564
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.19166666666666668,
+      "eval_loss": 3.7531919479370117,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.2395,
+      "eval_samples_per_second": 110.134,
+      "eval_steps_per_second": 13.767,
+      "step": 705
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.25533333333333336,
+      "eval_loss": 3.6991868019104004,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.7403,
+      "eval_samples_per_second": 108.146,
+      "eval_steps_per_second": 13.518,
+      "step": 846
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.32566666666666666,
+      "eval_loss": 3.6358957290649414,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.4022,
+      "eval_samples_per_second": 109.48,
+      "eval_steps_per_second": 13.685,
+      "step": 987
+    },
+    {
+      "epoch": 7.092198581560283,
+      "grad_norm": 1.7323589324951172,
+      "learning_rate": 4.151162790697675e-06,
+      "loss": 3.6677,
+      "step": 1000
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.391,
+      "eval_loss": 3.561831474304199,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 28.1913,
+      "eval_samples_per_second": 106.416,
+      "eval_steps_per_second": 13.302,
+      "step": 1128
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.42866666666666664,
+      "eval_loss": 3.492708444595337,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.5068,
+      "eval_samples_per_second": 109.064,
+      "eval_steps_per_second": 13.633,
+      "step": 1269
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.4796666666666667,
+      "eval_loss": 3.4180657863616943,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.5222,
+      "eval_samples_per_second": 109.003,
+      "eval_steps_per_second": 13.625,
+      "step": 1410
+    },
+    {
+      "epoch": 10.638297872340425,
+      "grad_norm": 1.7677080631256104,
+      "learning_rate": 3.7039355992844365e-06,
+      "loss": 3.4053,
+      "step": 1500
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.49633333333333335,
+      "eval_loss": 3.353686571121216,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.4731,
+      "eval_samples_per_second": 109.198,
+      "eval_steps_per_second": 13.65,
+      "step": 1551
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.5183333333333333,
+      "eval_loss": 3.29174542427063,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.3958,
+      "eval_samples_per_second": 109.506,
+      "eval_steps_per_second": 13.688,
+      "step": 1692
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.5416666666666666,
+      "eval_loss": 3.230329990386963,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.2445,
+      "eval_samples_per_second": 110.114,
+      "eval_steps_per_second": 13.764,
+      "step": 1833
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.5566666666666666,
+      "eval_loss": 3.1734297275543213,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.0335,
+      "eval_samples_per_second": 110.973,
+      "eval_steps_per_second": 13.872,
+      "step": 1974
+    },
+    {
+      "epoch": 14.184397163120567,
+      "grad_norm": 1.914097785949707,
+      "learning_rate": 3.2567084078711986e-06,
+      "loss": 3.1467,
+      "step": 2000
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 0.5753333333333334,
+      "eval_loss": 3.1160686016082764,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 26.9914,
+      "eval_samples_per_second": 111.146,
+      "eval_steps_per_second": 13.893,
+      "step": 2115
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.5836666666666667,
+      "eval_loss": 3.0692453384399414,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.4615,
+      "eval_samples_per_second": 109.244,
+      "eval_steps_per_second": 13.655,
+      "step": 2256
+    },
+    {
+      "epoch": 17.0,
+      "eval_accuracy": 0.602,
+      "eval_loss": 3.0239269733428955,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.511,
+      "eval_samples_per_second": 109.047,
+      "eval_steps_per_second": 13.631,
+      "step": 2397
+    },
+    {
+      "epoch": 17.73049645390071,
+      "grad_norm": 1.9646587371826172,
+      "learning_rate": 2.809481216457961e-06,
+      "loss": 2.9364,
+      "step": 2500
+    },
+    {
+      "epoch": 18.0,
+      "eval_accuracy": 0.604,
+      "eval_loss": 2.983224868774414,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.5742,
+      "eval_samples_per_second": 108.797,
+      "eval_steps_per_second": 13.6,
+      "step": 2538
+    },
+    {
+      "epoch": 19.0,
+      "eval_accuracy": 0.6146666666666667,
+      "eval_loss": 2.9459805488586426,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.3324,
+      "eval_samples_per_second": 109.76,
+      "eval_steps_per_second": 13.72,
+      "step": 2679
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 0.6283333333333333,
+      "eval_loss": 2.9052772521972656,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.2251,
+      "eval_samples_per_second": 110.192,
+      "eval_steps_per_second": 13.774,
+      "step": 2820
+    },
+    {
+      "epoch": 21.0,
+      "eval_accuracy": 0.6386666666666667,
+      "eval_loss": 2.8673319816589355,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.5302,
+      "eval_samples_per_second": 108.971,
+      "eval_steps_per_second": 13.621,
+      "step": 2961
+    },
+    {
+      "epoch": 21.27659574468085,
+      "grad_norm": 2.0768418312072754,
+      "learning_rate": 2.3622540250447227e-06,
+      "loss": 2.7701,
+      "step": 3000
+    },
+    {
+      "epoch": 22.0,
+      "eval_accuracy": 0.642,
+      "eval_loss": 2.8295445442199707,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.3684,
+      "eval_samples_per_second": 109.616,
+      "eval_steps_per_second": 13.702,
+      "step": 3102
+    },
+    {
+      "epoch": 23.0,
+      "eval_accuracy": 0.658,
+      "eval_loss": 2.7955031394958496,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.6846,
+      "eval_samples_per_second": 108.363,
+      "eval_steps_per_second": 13.545,
+      "step": 3243
+    },
+    {
+      "epoch": 24.0,
+      "eval_accuracy": 0.6533333333333333,
+      "eval_loss": 2.7718265056610107,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 28.3048,
+      "eval_samples_per_second": 105.989,
+      "eval_steps_per_second": 13.249,
+      "step": 3384
+    },
+    {
+      "epoch": 24.822695035460992,
+      "grad_norm": 2.5180611610412598,
+      "learning_rate": 1.915026833631485e-06,
+      "loss": 2.6383,
+      "step": 3500
+    },
+    {
+      "epoch": 25.0,
+      "eval_accuracy": 0.6656666666666666,
+      "eval_loss": 2.7361390590667725,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.5955,
+      "eval_samples_per_second": 108.714,
+      "eval_steps_per_second": 13.589,
+      "step": 3525
+    },
+    {
+      "epoch": 26.0,
+      "eval_accuracy": 0.6693333333333333,
+      "eval_loss": 2.712496519088745,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.5376,
+      "eval_samples_per_second": 108.942,
+      "eval_steps_per_second": 13.618,
+      "step": 3666
+    },
+    {
+      "epoch": 27.0,
+      "eval_accuracy": 0.6656666666666666,
+      "eval_loss": 2.695204257965088,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.822,
+      "eval_samples_per_second": 107.828,
+      "eval_steps_per_second": 13.479,
+      "step": 3807
+    },
+    {
+      "epoch": 28.0,
+      "eval_accuracy": 0.6756666666666666,
+      "eval_loss": 2.6688482761383057,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.4009,
+      "eval_samples_per_second": 109.485,
+      "eval_steps_per_second": 13.686,
+      "step": 3948
+    },
+    {
+      "epoch": 28.368794326241133,
+      "grad_norm": 2.0685389041900635,
+      "learning_rate": 1.4677996422182469e-06,
+      "loss": 2.5324,
+      "step": 4000
+    },
+    {
+      "epoch": 29.0,
+      "eval_accuracy": 0.6776666666666666,
+      "eval_loss": 2.651216745376587,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.4184,
+      "eval_samples_per_second": 109.415,
+      "eval_steps_per_second": 13.677,
+      "step": 4089
+    },
+    {
+      "epoch": 30.0,
+      "eval_accuracy": 0.684,
+      "eval_loss": 2.631049633026123,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.4391,
+      "eval_samples_per_second": 109.333,
+      "eval_steps_per_second": 13.667,
+      "step": 4230
+    },
+    {
+      "epoch": 31.0,
+      "eval_accuracy": 0.6876666666666666,
+      "eval_loss": 2.61474347114563,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.3793,
+      "eval_samples_per_second": 109.572,
+      "eval_steps_per_second": 13.697,
+      "step": 4371
+    },
+    {
+      "epoch": 31.914893617021278,
+      "grad_norm": 2.6519553661346436,
+      "learning_rate": 1.020572450805009e-06,
+      "loss": 2.4528,
+      "step": 4500
+    },
+    {
+      "epoch": 32.0,
+      "eval_accuracy": 0.6866666666666666,
+      "eval_loss": 2.5972399711608887,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 26.9694,
+      "eval_samples_per_second": 111.237,
+      "eval_steps_per_second": 13.905,
+      "step": 4512
+    },
+    {
+      "epoch": 33.0,
+      "eval_accuracy": 0.6883333333333334,
+      "eval_loss": 2.586773157119751,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.608,
+      "eval_samples_per_second": 108.664,
+      "eval_steps_per_second": 13.583,
+      "step": 4653
+    },
+    {
+      "epoch": 34.0,
+      "eval_accuracy": 0.6876666666666666,
+      "eval_loss": 2.576591730117798,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.5729,
+      "eval_samples_per_second": 108.802,
+      "eval_steps_per_second": 13.6,
+      "step": 4794
+    },
+    {
+      "epoch": 35.0,
+      "eval_accuracy": 0.6926666666666667,
+      "eval_loss": 2.569082736968994,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.9391,
+      "eval_samples_per_second": 107.376,
+      "eval_steps_per_second": 13.422,
+      "step": 4935
+    },
+    {
+      "epoch": 35.46099290780142,
+      "grad_norm": 2.5418479442596436,
+      "learning_rate": 5.733452593917711e-07,
+      "loss": 2.4022,
+      "step": 5000
+    },
+    {
+      "epoch": 36.0,
+      "eval_accuracy": 0.693,
+      "eval_loss": 2.5580801963806152,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.1847,
+      "eval_samples_per_second": 110.356,
+      "eval_steps_per_second": 13.795,
+      "step": 5076
+    },
+    {
+      "epoch": 37.0,
+      "eval_accuracy": 0.694,
+      "eval_loss": 2.5533597469329834,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.3678,
+      "eval_samples_per_second": 109.618,
+      "eval_steps_per_second": 13.702,
+      "step": 5217
+    },
+    {
+      "epoch": 38.0,
+      "eval_accuracy": 0.695,
+      "eval_loss": 2.5490283966064453,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.0235,
+      "eval_samples_per_second": 111.014,
+      "eval_steps_per_second": 13.877,
+      "step": 5358
+    },
+    {
+      "epoch": 39.0,
+      "eval_accuracy": 0.694,
+      "eval_loss": 2.547304153442383,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.9193,
+      "eval_samples_per_second": 107.453,
+      "eval_steps_per_second": 13.432,
+      "step": 5499
+    },
+    {
+      "epoch": 39.00709219858156,
+      "grad_norm": 2.5994229316711426,
+      "learning_rate": 1.2611806797853311e-07,
+      "loss": 2.3657,
+      "step": 5500
+    },
+    {
+      "epoch": 40.0,
+      "eval_accuracy": 0.6943333333333334,
+      "eval_loss": 2.5463945865631104,
+      "eval_model_preparation_time": 0.0041,
+      "eval_runtime": 27.6641,
+      "eval_samples_per_second": 108.444,
+      "eval_steps_per_second": 13.555,
+      "step": 5640
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 5640,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 40,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 1.395455892332544e+19,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-5640/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a85b11601d829e022858ca77f9c10bbf712a1c51fb1d678c6dc467ebd3fa2edc
+size 5240

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6de4695b0e2563d48d7141b39971a00a648200228a269df5318d12f65ffd7785
 size 343371632

 version https://git-lfs.github.com/spec/v1
+oid sha256:0c4745e3fdcd455e985f55ae003c88c87d197975d2307ad5dda833f8c30809d0
 size 343371632

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:12094f0fa6ae3c859ec5ffdcf98aea4889e656117cbc55d1c2abe137dce288c9
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:a85b11601d829e022858ca77f9c10bbf712a1c51fb1d678c6dc467ebd3fa2edc
 size 5240