Upload folder using huggingface_hub

592e96e verified 5 months ago

5.22 kB

	{
	"best_global_step": 110000,
	"best_metric": 0.04869391396641731,
	"best_model_checkpoint": "/home/jovyan/simson_training_bolgov/regression/decoder_checkpoints/checkpoint-110000",
	"epoch": 4.406345136997276,
	"eval_steps": 10000,
	"global_step": 110000,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.400576830636116,
	"grad_norm": 0.37913239002227783,
	"learning_rate": 4.6013064037829606e-05,
	"loss": 0.1577,
	"step": 10000
	},
	{
	"epoch": 0.400576830636116,
	"eval_loss": 0.07184838503599167,
	"eval_runtime": 325.2402,
	"eval_samples_per_second": 1034.153,
	"eval_steps_per_second": 4.04,
	"step": 10000
	},
	{
	"epoch": 0.801153661272232,
	"grad_norm": 0.36734315752983093,
	"learning_rate": 4.200729341989261e-05,
	"loss": 0.0699,
	"step": 20000
	},
	{
	"epoch": 0.801153661272232,
	"eval_loss": 0.06233175843954086,
	"eval_runtime": 326.1302,
	"eval_samples_per_second": 1031.33,
	"eval_steps_per_second": 4.029,
	"step": 20000
	},
	{
	"epoch": 1.201730491908348,
	"grad_norm": 0.43427732586860657,
	"learning_rate": 3.800192353931233e-05,
	"loss": 0.0619,
	"step": 30000
	},
	{
	"epoch": 1.201730491908348,
	"eval_loss": 0.05772605910897255,
	"eval_runtime": 327.0384,
	"eval_samples_per_second": 1028.466,
	"eval_steps_per_second": 4.018,
	"step": 30000
	},
	{
	"epoch": 1.6023073225444642,
	"grad_norm": 0.5037900805473328,
	"learning_rate": 3.3996553658732065e-05,
	"loss": 0.0577,
	"step": 40000
	},
	{
	"epoch": 1.6023073225444642,
	"eval_loss": 0.05496111884713173,
	"eval_runtime": 323.8521,
	"eval_samples_per_second": 1038.585,
	"eval_steps_per_second": 4.057,
	"step": 40000
	},
	{
	"epoch": 2.00288415318058,
	"grad_norm": 0.46178844571113586,
	"learning_rate": 2.99911837781518e-05,
	"loss": 0.0551,
	"step": 50000
	},
	{
	"epoch": 2.00288415318058,
	"eval_loss": 0.05280572175979614,
	"eval_runtime": 322.3602,
	"eval_samples_per_second": 1043.392,
	"eval_steps_per_second": 4.076,
	"step": 50000
	},
	{
	"epoch": 2.403460983816696,
	"grad_norm": 0.5070484280586243,
	"learning_rate": 2.5985413160214794e-05,
	"loss": 0.0532,
	"step": 60000
	},
	{
	"epoch": 2.403460983816696,
	"eval_loss": 0.05358376353979111,
	"eval_runtime": 325.0588,
	"eval_samples_per_second": 1034.73,
	"eval_steps_per_second": 4.042,
	"step": 60000
	},
	{
	"epoch": 2.804037814452812,
	"grad_norm": 0.5176772475242615,
	"learning_rate": 2.1980043279634528e-05,
	"loss": 0.0517,
	"step": 70000
	},
	{
	"epoch": 2.804037814452812,
	"eval_loss": 0.04956068471074104,
	"eval_runtime": 323.6366,
	"eval_samples_per_second": 1039.277,
	"eval_steps_per_second": 4.06,
	"step": 70000
	},
	{
	"epoch": 3.204614645088928,
	"grad_norm": 0.4495079815387726,
	"learning_rate": 1.7974673399054262e-05,
	"loss": 0.0505,
	"step": 80000
	},
	{
	"epoch": 3.204614645088928,
	"eval_loss": 0.05076293647289276,
	"eval_runtime": 325.2387,
	"eval_samples_per_second": 1034.157,
	"eval_steps_per_second": 4.04,
	"step": 80000
	},
	{
	"epoch": 3.605191475725044,
	"grad_norm": 0.49150699377059937,
	"learning_rate": 1.3969303518473992e-05,
	"loss": 0.0496,
	"step": 90000
	},
	{
	"epoch": 3.605191475725044,
	"eval_loss": 0.05038553848862648,
	"eval_runtime": 322.6375,
	"eval_samples_per_second": 1042.495,
	"eval_steps_per_second": 4.073,
	"step": 90000
	},
	{
	"epoch": 4.00576830636116,
	"grad_norm": 0.5493866205215454,
	"learning_rate": 9.963933637893724e-06,
	"loss": 0.0487,
	"step": 100000
	},
	{
	"epoch": 4.00576830636116,
	"eval_loss": 0.04964649677276611,
	"eval_runtime": 326.8677,
	"eval_samples_per_second": 1029.003,
	"eval_steps_per_second": 4.02,
	"step": 100000
	},
	{
	"epoch": 4.406345136997276,
	"grad_norm": 0.409485399723053,
	"learning_rate": 5.958563757313457e-06,
	"loss": 0.0479,
	"step": 110000
	},
	{
	"epoch": 4.406345136997276,
	"eval_loss": 0.04869391396641731,
	"eval_runtime": 320.3265,
	"eval_samples_per_second": 1050.016,
	"eval_steps_per_second": 4.102,
	"step": 110000
	}
	],
	"logging_steps": 10000,
	"max_steps": 124820,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 5,
	"save_steps": 10000,
	"stateful_callbacks": {
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": false
	},
	"attributes": {}
	}
	},
	"total_flos": 0.0,
	"train_batch_size": 256,
	"trial_name": null,
	"trial_params": null
	}