TopLength

Sleeping

App Files Files Community

TopLength / trainer_state.json

DumbledoreWiz

Upload 4 files

77c23a1 verified about 1 year ago

raw

history blame contribute delete

5.8 kB

	{
	"best_metric": 0.8563636363636363,
	"best_model_checkpoint": "/content/drive/MyDrive/autoTaggingProject/ViT/General/Features/TopLength/Results/model_2024-10-16_test/checkpoint-1925",
	"epoch": 7.0,
	"eval_steps": 500,
	"global_step": 1925,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.36363636363636365,
	"grad_norm": 1.4969431161880493,
	"learning_rate": 9.81818181818182e-06,
	"loss": 1.6534,
	"step": 100
	},
	{
	"epoch": 0.7272727272727273,
	"grad_norm": 2.2577221393585205,
	"learning_rate": 9.636363636363638e-06,
	"loss": 1.317,
	"step": 200
	},
	{
	"epoch": 1.0,
	"eval_accuracy": 0.7218181818181818,
	"eval_loss": 1.0995656251907349,
	"eval_runtime": 12.6938,
	"eval_samples_per_second": 43.328,
	"eval_steps_per_second": 1.418,
	"step": 275
	},
	{
	"epoch": 1.0909090909090908,
	"grad_norm": 2.7553977966308594,
	"learning_rate": 9.454545454545456e-06,
	"loss": 1.0529,
	"step": 300
	},
	{
	"epoch": 1.4545454545454546,
	"grad_norm": 2.5488719940185547,
	"learning_rate": 9.272727272727273e-06,
	"loss": 0.9003,
	"step": 400
	},
	{
	"epoch": 1.8181818181818183,
	"grad_norm": 2.936871290206909,
	"learning_rate": 9.090909090909091e-06,
	"loss": 0.7955,
	"step": 500
	},
	{
	"epoch": 2.0,
	"eval_accuracy": 0.7890909090909091,
	"eval_loss": 0.8251153826713562,
	"eval_runtime": 11.8903,
	"eval_samples_per_second": 46.256,
	"eval_steps_per_second": 1.514,
	"step": 550
	},
	{
	"epoch": 2.1818181818181817,
	"grad_norm": 3.6827473640441895,
	"learning_rate": 8.90909090909091e-06,
	"loss": 0.7386,
	"step": 600
	},
	{
	"epoch": 2.5454545454545454,
	"grad_norm": 2.6154849529266357,
	"learning_rate": 8.727272727272728e-06,
	"loss": 0.6758,
	"step": 700
	},
	{
	"epoch": 2.909090909090909,
	"grad_norm": 6.043990135192871,
	"learning_rate": 8.545454545454546e-06,
	"loss": 0.6518,
	"step": 800
	},
	{
	"epoch": 3.0,
	"eval_accuracy": 0.82,
	"eval_loss": 0.7125250101089478,
	"eval_runtime": 11.5548,
	"eval_samples_per_second": 47.599,
	"eval_steps_per_second": 1.558,
	"step": 825
	},
	{
	"epoch": 3.2727272727272725,
	"grad_norm": 1.676995873451233,
	"learning_rate": 8.363636363636365e-06,
	"loss": 0.6034,
	"step": 900
	},
	{
	"epoch": 3.6363636363636362,
	"grad_norm": 2.6665966510772705,
	"learning_rate": 8.181818181818183e-06,
	"loss": 0.5865,
	"step": 1000
	},
	{
	"epoch": 4.0,
	"grad_norm": 3.419482469558716,
	"learning_rate": 8.000000000000001e-06,
	"loss": 0.5531,
	"step": 1100
	},
	{
	"epoch": 4.0,
	"eval_accuracy": 0.8218181818181818,
	"eval_loss": 0.5728441476821899,
	"eval_runtime": 11.88,
	"eval_samples_per_second": 46.296,
	"eval_steps_per_second": 1.515,
	"step": 1100
	},
	{
	"epoch": 4.363636363636363,
	"grad_norm": 2.151674747467041,
	"learning_rate": 7.81818181818182e-06,
	"loss": 0.5151,
	"step": 1200
	},
	{
	"epoch": 4.7272727272727275,
	"grad_norm": 4.103756427764893,
	"learning_rate": 7.63818181818182e-06,
	"loss": 0.5118,
	"step": 1300
	},
	{
	"epoch": 5.0,
	"eval_accuracy": 0.84,
	"eval_loss": 0.631469190120697,
	"eval_runtime": 11.4374,
	"eval_samples_per_second": 48.088,
	"eval_steps_per_second": 1.574,
	"step": 1375
	},
	{
	"epoch": 5.090909090909091,
	"grad_norm": 2.0776937007904053,
	"learning_rate": 7.456363636363637e-06,
	"loss": 0.4878,
	"step": 1400
	},
	{
	"epoch": 5.454545454545454,
	"grad_norm": 4.111904621124268,
	"learning_rate": 7.274545454545456e-06,
	"loss": 0.4802,
	"step": 1500
	},
	{
	"epoch": 5.818181818181818,
	"grad_norm": 3.490161657333374,
	"learning_rate": 7.092727272727273e-06,
	"loss": 0.4713,
	"step": 1600
	},
	{
	"epoch": 6.0,
	"eval_accuracy": 0.84,
	"eval_loss": 0.4893127381801605,
	"eval_runtime": 11.1344,
	"eval_samples_per_second": 49.396,
	"eval_steps_per_second": 1.617,
	"step": 1650
	},
	{
	"epoch": 6.181818181818182,
	"grad_norm": 3.1339528560638428,
	"learning_rate": 6.910909090909092e-06,
	"loss": 0.4365,
	"step": 1700
	},
	{
	"epoch": 6.545454545454545,
	"grad_norm": 3.686084032058716,
	"learning_rate": 6.72909090909091e-06,
	"loss": 0.4155,
	"step": 1800
	},
	{
	"epoch": 6.909090909090909,
	"grad_norm": 3.6479032039642334,
	"learning_rate": 6.5472727272727275e-06,
	"loss": 0.4251,
	"step": 1900
	},
	{
	"epoch": 7.0,
	"eval_accuracy": 0.8563636363636363,
	"eval_loss": 0.48278242349624634,
	"eval_runtime": 11.2502,
	"eval_samples_per_second": 48.888,
	"eval_steps_per_second": 1.6,
	"step": 1925
	}
	],
	"logging_steps": 100,
	"max_steps": 5500,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 20,
	"save_steps": 500,
	"stateful_callbacks": {
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": false
	},
	"attributes": {}
	}
	},
	"total_flos": 4.773677693976576e+18,
	"train_batch_size": 32,
	"trial_name": null,
	"trial_params": null
	}