tzhao3
/

vit-L-CIFAR10

Image Classification

Model card Files Files and versions

vit-L-CIFAR10 / trainer_state.json

tzhao3's picture

Upload 8 files

c5f8bcd over 2 years ago

history blame contribute delete

2.4 kB

	{
	"best_metric": 0.9818,
	"best_model_checkpoint": "fine-tune-vit-L-cifar10\\checkpoint-3520",
	"epoch": 5.0,
	"global_step": 3520,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.71,
	"learning_rate": 0.00017159090909090908,
	"loss": 0.5656,
	"step": 500
	},
	{
	"epoch": 1.0,
	"eval_accuracy": 0.9554,
	"eval_loss": 0.13088831305503845,
	"eval_runtime": 56.4271,
	"eval_samples_per_second": 88.61,
	"eval_steps_per_second": 1.4,
	"step": 704
	},
	{
	"epoch": 1.42,
	"learning_rate": 0.0001431818181818182,
	"loss": 0.4167,
	"step": 1000
	},
	{
	"epoch": 2.0,
	"eval_accuracy": 0.9664,
	"eval_loss": 0.10773425549268723,
	"eval_runtime": 55.2538,
	"eval_samples_per_second": 90.492,
	"eval_steps_per_second": 1.43,
	"step": 1408
	},
	{
	"epoch": 2.13,
	"learning_rate": 0.00011477272727272728,
	"loss": 0.3517,
	"step": 1500
	},
	{
	"epoch": 2.84,
	"learning_rate": 8.636363636363637e-05,
	"loss": 0.2912,
	"step": 2000
	},
	{
	"epoch": 3.0,
	"eval_accuracy": 0.976,
	"eval_loss": 0.07570263743400574,
	"eval_runtime": 55.5205,
	"eval_samples_per_second": 90.057,
	"eval_steps_per_second": 1.423,
	"step": 2112
	},
	{
	"epoch": 3.55,
	"learning_rate": 5.7954545454545464e-05,
	"loss": 0.2422,
	"step": 2500
	},
	{
	"epoch": 4.0,
	"eval_accuracy": 0.9804,
	"eval_loss": 0.06285750865936279,
	"eval_runtime": 55.4687,
	"eval_samples_per_second": 90.141,
	"eval_steps_per_second": 1.424,
	"step": 2816
	},
	{
	"epoch": 4.26,
	"learning_rate": 2.954545454545455e-05,
	"loss": 0.1998,
	"step": 3000
	},
	{
	"epoch": 4.97,
	"learning_rate": 1.1363636363636364e-06,
	"loss": 0.1661,
	"step": 3500
	},
	{
	"epoch": 5.0,
	"eval_accuracy": 0.9818,
	"eval_loss": 0.05650622025132179,
	"eval_runtime": 56.1248,
	"eval_samples_per_second": 89.087,
	"eval_steps_per_second": 1.408,
	"step": 3520
	}
	],
	"max_steps": 3520,
	"num_train_epochs": 5,
	"total_flos": 6.16368568144896e+19,
	"trial_name": null,
	"trial_params": null
	}