haipradana
/

test-m-e-r-l

Model card Files Files and versions

test-m-e-r-l / trainer_state.json

haipradana's picture

Upload 8 files

0234e9c verified 6 months ago

history blame contribute delete

2.03 kB

	{
	"best_global_step": 372,
	"best_metric": 0.9325184226036072,
	"best_model_checkpoint": "/kaggle/working/timesformer-merl-weighted-loss/checkpoint-372",
	"epoch": 3.0,
	"eval_steps": 500,
	"global_step": 372,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 1.0,
	"grad_norm": 526402.375,
	"learning_rate": 2.922645739910314e-05,
	"loss": 1.4313,
	"step": 124
	},
	{
	"epoch": 1.0,
	"eval_accuracy": 0.6273584905660378,
	"eval_loss": 1.0011987686157227,
	"eval_runtime": 243.2006,
	"eval_samples_per_second": 1.743,
	"eval_steps_per_second": 0.436,
	"step": 124
	},
	{
	"epoch": 2.0,
	"grad_norm": 570557.25,
	"learning_rate": 2.5056053811659195e-05,
	"loss": 0.8042,
	"step": 248
	},
	{
	"epoch": 2.0,
	"eval_accuracy": 0.6367924528301887,
	"eval_loss": 0.9510671496391296,
	"eval_runtime": 245.8818,
	"eval_samples_per_second": 1.724,
	"eval_steps_per_second": 0.431,
	"step": 248
	},
	{
	"epoch": 3.0,
	"grad_norm": 221145.625,
	"learning_rate": 2.0885650224215244e-05,
	"loss": 0.4912,
	"step": 372
	},
	{
	"epoch": 3.0,
	"eval_accuracy": 0.6297169811320755,
	"eval_loss": 0.9325184226036072,
	"eval_runtime": 244.1347,
	"eval_samples_per_second": 1.737,
	"eval_steps_per_second": 0.434,
	"step": 372
	}
	],
	"logging_steps": 500,
	"max_steps": 992,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 8,
	"save_steps": 500,
	"stateful_callbacks": {
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": false
	},
	"attributes": {}
	}
	},
	"total_flos": 1.038786599448635e+19,
	"train_batch_size": 4,
	"trial_name": null,
	"trial_params": null
	}