Model-J__DINO__model_idx_0742 / trainer_state.json

Upload folder using huggingface_hub

96ff48c verified about 1 year ago

4.48 kB

Invalid JSON: Unexpected token 'I', ..."ad_norm": Infinity, "... is not valid JSON

	{
	"best_metric": 0.9354666666666667,
	"best_model_checkpoint": "./vit_finetuned_models_dataset/CIFAR100/50_from_100/facebook_dino-vitb16/model_idx_0742/checkpoints/checkpoint-2997",
	"epoch": 9.0,
	"eval_steps": 500,
	"global_step": 2997,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 1.0,
	"grad_norm": 6.208075523376465,
	"learning_rate": 4.447781114447781e-05,
	"loss": 0.716,
	"step": 333
	},
	{
	"epoch": 1.0,
	"eval_accuracy": 0.8864,
	"eval_loss": 0.3474268317222595,
	"eval_runtime": 10.919,
	"eval_samples_per_second": 343.438,
	"eval_steps_per_second": 5.403,
	"step": 333
	},
	{
	"epoch": 2.0,
	"grad_norm": 1.435003638267517,
	"learning_rate": 3.892225558892226e-05,
	"loss": 0.1997,
	"step": 666
	},
	{
	"epoch": 2.0,
	"eval_accuracy": 0.8914666666666666,
	"eval_loss": 0.36249658465385437,
	"eval_runtime": 11.2447,
	"eval_samples_per_second": 333.491,
	"eval_steps_per_second": 5.247,
	"step": 666
	},
	{
	"epoch": 3.0,
	"grad_norm": 3.812775135040283,
	"learning_rate": 3.33667000333667e-05,
	"loss": 0.0997,
	"step": 999
	},
	{
	"epoch": 3.0,
	"eval_accuracy": 0.9058666666666667,
	"eval_loss": 0.3331863284111023,
	"eval_runtime": 11.5947,
	"eval_samples_per_second": 323.425,
	"eval_steps_per_second": 5.089,
	"step": 999
	},
	{
	"epoch": 4.0,
	"grad_norm": Infinity,
	"learning_rate": 2.782782782782783e-05,
	"loss": 0.0572,
	"step": 1332
	},
	{
	"epoch": 4.0,
	"eval_accuracy": 0.9026666666666666,
	"eval_loss": 0.39966559410095215,
	"eval_runtime": 10.9877,
	"eval_samples_per_second": 341.29,
	"eval_steps_per_second": 5.37,
	"step": 1332
	},
	{
	"epoch": 5.0,
	"grad_norm": 0.00248286547139287,
	"learning_rate": 2.2272272272272273e-05,
	"loss": 0.0287,
	"step": 1665
	},
	{
	"epoch": 5.0,
	"eval_accuracy": 0.9197333333333333,
	"eval_loss": 0.3105076849460602,
	"eval_runtime": 11.1993,
	"eval_samples_per_second": 334.841,
	"eval_steps_per_second": 5.268,
	"step": 1665
	},
	{
	"epoch": 6.0,
	"grad_norm": 0.21770690381526947,
	"learning_rate": 1.6716716716716717e-05,
	"loss": 0.0103,
	"step": 1998
	},
	{
	"epoch": 6.0,
	"eval_accuracy": 0.9221333333333334,
	"eval_loss": 0.3289019465446472,
	"eval_runtime": 11.236,
	"eval_samples_per_second": 333.748,
	"eval_steps_per_second": 5.251,
	"step": 1998
	},
	{
	"epoch": 7.0,
	"grad_norm": 0.001557586365379393,
	"learning_rate": 1.1161161161161162e-05,
	"loss": 0.0029,
	"step": 2331
	},
	{
	"epoch": 7.0,
	"eval_accuracy": 0.9269333333333334,
	"eval_loss": 0.3126938045024872,
	"eval_runtime": 11.5119,
	"eval_samples_per_second": 325.751,
	"eval_steps_per_second": 5.125,
	"step": 2331
	},
	{
	"epoch": 8.0,
	"grad_norm": 0.4655797779560089,
	"learning_rate": 5.605605605605606e-06,
	"loss": 0.0012,
	"step": 2664
	},
	{
	"epoch": 8.0,
	"eval_accuracy": 0.932,
	"eval_loss": 0.30061355233192444,
	"eval_runtime": 10.9602,
	"eval_samples_per_second": 342.148,
	"eval_steps_per_second": 5.383,
	"step": 2664
	},
	{
	"epoch": 9.0,
	"grad_norm": 0.00048774181050248444,
	"learning_rate": 5.005005005005005e-08,
	"loss": 0.0007,
	"step": 2997
	},
	{
	"epoch": 9.0,
	"eval_accuracy": 0.9354666666666667,
	"eval_loss": 0.2860882878303528,
	"eval_runtime": 10.9385,
	"eval_samples_per_second": 342.825,
	"eval_steps_per_second": 5.394,
	"step": 2997
	}
	],
	"logging_steps": 500,
	"max_steps": 2997,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 9,
	"save_steps": 500,
	"stateful_callbacks": {
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": true
	},
	"attributes": {}
	}
	},
	"total_flos": 1.482671885603328e+19,
	"train_batch_size": 64,
	"trial_name": null,
	"trial_params": null
	}