Sefika
/

model_fewrel_1_5

text2text-generation

text-generation-inference

4-bit precision

Model card Files Files and versions

model_fewrel_1_5 / trainer_state_2.json

Sefika's picture

Upload 9 files

e81706f verified 12 months ago

history blame contribute delete

3.96 kB

	{
	"best_metric": 0.0810546875,
	"best_model_checkpoint": "model_fewrel_1_2-task2/checkpoint-6",
	"epoch": 10.0,
	"eval_steps": 500,
	"global_step": 30,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 1.0,
	"eval_loss": 0.10284423828125,
	"eval_rouge1": 95.9465,
	"eval_rouge2": 93.9682,
	"eval_rougeL": 95.3944,
	"eval_rougeLsum": 95.9557,
	"eval_runtime": 29.9579,
	"eval_samples_per_second": 37.386,
	"eval_steps_per_second": 1.168,
	"step": 3
	},
	{
	"epoch": 2.0,
	"eval_loss": 0.0810546875,
	"eval_rouge1": 96.5004,
	"eval_rouge2": 94.78,
	"eval_rougeL": 96.0088,
	"eval_rougeLsum": 96.4773,
	"eval_runtime": 28.554,
	"eval_samples_per_second": 39.224,
	"eval_steps_per_second": 1.226,
	"step": 6
	},
	{
	"epoch": 3.0,
	"eval_loss": 0.0819091796875,
	"eval_rouge1": 96.6176,
	"eval_rouge2": 94.9705,
	"eval_rougeL": 96.1457,
	"eval_rougeLsum": 96.6106,
	"eval_runtime": 28.3985,
	"eval_samples_per_second": 39.439,
	"eval_steps_per_second": 1.232,
	"step": 9
	},
	{
	"epoch": 4.0,
	"eval_loss": 0.095703125,
	"eval_rouge1": 96.1348,
	"eval_rouge2": 94.1813,
	"eval_rougeL": 95.5333,
	"eval_rougeLsum": 96.1226,
	"eval_runtime": 27.8269,
	"eval_samples_per_second": 40.249,
	"eval_steps_per_second": 1.258,
	"step": 12
	},
	{
	"epoch": 5.0,
	"eval_loss": 0.1134033203125,
	"eval_rouge1": 95.4562,
	"eval_rouge2": 93.2875,
	"eval_rougeL": 94.812,
	"eval_rougeLsum": 95.4534,
	"eval_runtime": 27.905,
	"eval_samples_per_second": 40.136,
	"eval_steps_per_second": 1.254,
	"step": 15
	},
	{
	"epoch": 6.0,
	"eval_loss": 0.1260986328125,
	"eval_rouge1": 94.9572,
	"eval_rouge2": 92.576,
	"eval_rougeL": 94.3038,
	"eval_rougeLsum": 94.9406,
	"eval_runtime": 27.7213,
	"eval_samples_per_second": 40.402,
	"eval_steps_per_second": 1.263,
	"step": 18
	},
	{
	"epoch": 7.0,
	"eval_loss": 0.132080078125,
	"eval_rouge1": 94.7046,
	"eval_rouge2": 92.2489,
	"eval_rougeL": 94.0746,
	"eval_rougeLsum": 94.7023,
	"eval_runtime": 27.3971,
	"eval_samples_per_second": 40.88,
	"eval_steps_per_second": 1.278,
	"step": 21
	},
	{
	"epoch": 8.0,
	"eval_loss": 0.1346435546875,
	"eval_rouge1": 94.6117,
	"eval_rouge2": 92.0736,
	"eval_rougeL": 93.9435,
	"eval_rougeLsum": 94.6048,
	"eval_runtime": 27.2256,
	"eval_samples_per_second": 41.138,
	"eval_steps_per_second": 1.286,
	"step": 24
	},
	{
	"epoch": 9.0,
	"eval_loss": 0.1351318359375,
	"eval_rouge1": 94.5465,
	"eval_rouge2": 91.9795,
	"eval_rougeL": 93.8758,
	"eval_rougeLsum": 94.5584,
	"eval_runtime": 27.1737,
	"eval_samples_per_second": 41.216,
	"eval_steps_per_second": 1.288,
	"step": 27
	},
	{
	"epoch": 10.0,
	"eval_loss": 0.1353759765625,
	"eval_rouge1": 94.5465,
	"eval_rouge2": 91.9795,
	"eval_rougeL": 93.8758,
	"eval_rougeLsum": 94.5584,
	"eval_runtime": 27.1504,
	"eval_samples_per_second": 41.252,
	"eval_steps_per_second": 1.289,
	"step": 30
	}
	],
	"logging_steps": 500,
	"max_steps": 30,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 10,
	"save_steps": 500,
	"stateful_callbacks": {
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": true
	},
	"attributes": {}
	}
	},
	"total_flos": 274990104576000.0,
	"train_batch_size": 16,
	"trial_name": null,
	"trial_params": null
	}