Upload folder using huggingface_hub

abf9e49 verified about 1 month ago

12.3 kB

	{
	"best_global_step": 600,
	"best_metric": 0.9695240197651653,
	"best_model_checkpoint": "taskA-codebert-base-focal/checkpoint-600",
	"epoch": 0.14680694886224616,
	"eval_steps": 200,
	"global_step": 600,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.002446782481037436,
	"grad_norm": 1.0,
	"learning_rate": 3.6734693877551025e-07,
	"loss": 1.1949,
	"step": 10
	},
	{
	"epoch": 0.004893564962074872,
	"grad_norm": 0.9999998807907104,
	"learning_rate": 7.755102040816327e-07,
	"loss": 1.1644,
	"step": 20
	},
	{
	"epoch": 0.007340347443112307,
	"grad_norm": 0.9999999403953552,
	"learning_rate": 1.1836734693877552e-06,
	"loss": 0.96,
	"step": 30
	},
	{
	"epoch": 0.009787129924149743,
	"grad_norm": 1.0,
	"learning_rate": 1.5918367346938775e-06,
	"loss": 0.7557,
	"step": 40
	},
	{
	"epoch": 0.012233912405187179,
	"grad_norm": 1.0,
	"learning_rate": 2.0000000000000003e-06,
	"loss": 0.5786,
	"step": 50
	},
	{
	"epoch": 0.014680694886224614,
	"grad_norm": 0.9999999403953552,
	"learning_rate": 2.4081632653061225e-06,
	"loss": 0.4813,
	"step": 60
	},
	{
	"epoch": 0.01712747736726205,
	"grad_norm": 0.9999999403953552,
	"learning_rate": 2.816326530612245e-06,
	"loss": 0.4477,
	"step": 70
	},
	{
	"epoch": 0.019574259848299486,
	"grad_norm": 1.0,
	"learning_rate": 3.2244897959183672e-06,
	"loss": 0.4254,
	"step": 80
	},
	{
	"epoch": 0.022021042329336923,
	"grad_norm": 1.0,
	"learning_rate": 3.6326530612244903e-06,
	"loss": 0.4017,
	"step": 90
	},
	{
	"epoch": 0.024467824810374357,
	"grad_norm": 0.9999999403953552,
	"learning_rate": 4.040816326530612e-06,
	"loss": 0.379,
	"step": 100
	},
	{
	"epoch": 0.026914607291411794,
	"grad_norm": 1.0000001192092896,
	"learning_rate": 4.448979591836735e-06,
	"loss": 0.3749,
	"step": 110
	},
	{
	"epoch": 0.029361389772449228,
	"grad_norm": 1.0,
	"learning_rate": 4.857142857142858e-06,
	"loss": 0.3536,
	"step": 120
	},
	{
	"epoch": 0.031808172253486665,
	"grad_norm": 0.9999999403953552,
	"learning_rate": 5.26530612244898e-06,
	"loss": 0.336,
	"step": 130
	},
	{
	"epoch": 0.0342549547345241,
	"grad_norm": 1.0000001192092896,
	"learning_rate": 5.673469387755103e-06,
	"loss": 0.3261,
	"step": 140
	},
	{
	"epoch": 0.03670173721556154,
	"grad_norm": 0.9999999403953552,
	"learning_rate": 6.0816326530612245e-06,
	"loss": 0.3134,
	"step": 150
	},
	{
	"epoch": 0.03914851969659897,
	"grad_norm": 1.0,
	"learning_rate": 6.489795918367348e-06,
	"loss": 0.308,
	"step": 160
	},
	{
	"epoch": 0.041595302177636406,
	"grad_norm": 1.0,
	"learning_rate": 6.8979591836734705e-06,
	"loss": 0.2961,
	"step": 170
	},
	{
	"epoch": 0.04404208465867385,
	"grad_norm": 1.0,
	"learning_rate": 7.306122448979592e-06,
	"loss": 0.2998,
	"step": 180
	},
	{
	"epoch": 0.04648886713971128,
	"grad_norm": 1.0,
	"learning_rate": 7.714285714285716e-06,
	"loss": 0.2895,
	"step": 190
	},
	{
	"epoch": 0.048935649620748714,
	"grad_norm": 1.0,
	"learning_rate": 8.122448979591837e-06,
	"loss": 0.2773,
	"step": 200
	},
	{
	"epoch": 0.048935649620748714,
	"eval_accuracy": 0.81444,
	"eval_f1_weighted": 0.8120194753530078,
	"eval_loss": 0.10672978311777115,
	"eval_macro_f1": 0.8128217919062601,
	"eval_precision": 0.8426688032270206,
	"eval_recall": 0.81444,
	"eval_runtime": 1609.4299,
	"eval_samples_per_second": 62.134,
	"eval_steps_per_second": 0.243,
	"step": 200
	},
	{
	"epoch": 0.051382432101786155,
	"grad_norm": 1.0,
	"learning_rate": 8.530612244897961e-06,
	"loss": 0.2658,
	"step": 210
	},
	{
	"epoch": 0.05382921458282359,
	"grad_norm": 1.0000001192092896,
	"learning_rate": 8.938775510204082e-06,
	"loss": 0.2574,
	"step": 220
	},
	{
	"epoch": 0.05627599706386102,
	"grad_norm": 1.0,
	"learning_rate": 9.346938775510204e-06,
	"loss": 0.2633,
	"step": 230
	},
	{
	"epoch": 0.058722779544898455,
	"grad_norm": 1.0,
	"learning_rate": 9.755102040816327e-06,
	"loss": 0.2503,
	"step": 240
	},
	{
	"epoch": 0.061169562025935896,
	"grad_norm": 1.0,
	"learning_rate": 1.016326530612245e-05,
	"loss": 0.2359,
	"step": 250
	},
	{
	"epoch": 0.06361634450697333,
	"grad_norm": 0.9999999403953552,
	"learning_rate": 1.0571428571428572e-05,
	"loss": 0.2327,
	"step": 260
	},
	{
	"epoch": 0.06606312698801077,
	"grad_norm": 1.0,
	"learning_rate": 1.0979591836734695e-05,
	"loss": 0.2305,
	"step": 270
	},
	{
	"epoch": 0.0685099094690482,
	"grad_norm": 1.0,
	"learning_rate": 1.1387755102040819e-05,
	"loss": 0.2284,
	"step": 280
	},
	{
	"epoch": 0.07095669195008564,
	"grad_norm": 0.9999999403953552,
	"learning_rate": 1.179591836734694e-05,
	"loss": 0.226,
	"step": 290
	},
	{
	"epoch": 0.07340347443112308,
	"grad_norm": 0.9999999403953552,
	"learning_rate": 1.2204081632653062e-05,
	"loss": 0.2225,
	"step": 300
	},
	{
	"epoch": 0.0758502569121605,
	"grad_norm": 1.0,
	"learning_rate": 1.2612244897959185e-05,
	"loss": 0.2156,
	"step": 310
	},
	{
	"epoch": 0.07829703939319795,
	"grad_norm": 1.0,
	"learning_rate": 1.3020408163265308e-05,
	"loss": 0.2033,
	"step": 320
	},
	{
	"epoch": 0.08074382187423539,
	"grad_norm": 0.9999999403953552,
	"learning_rate": 1.3428571428571429e-05,
	"loss": 0.2021,
	"step": 330
	},
	{
	"epoch": 0.08319060435527281,
	"grad_norm": 1.0,
	"learning_rate": 1.3836734693877551e-05,
	"loss": 0.1902,
	"step": 340
	},
	{
	"epoch": 0.08563738683631025,
	"grad_norm": 1.0,
	"learning_rate": 1.4244897959183674e-05,
	"loss": 0.1975,
	"step": 350
	},
	{
	"epoch": 0.0880841693173477,
	"grad_norm": 1.0,
	"learning_rate": 1.4653061224489798e-05,
	"loss": 0.1921,
	"step": 360
	},
	{
	"epoch": 0.09053095179838512,
	"grad_norm": 0.9999999403953552,
	"learning_rate": 1.506122448979592e-05,
	"loss": 0.2039,
	"step": 370
	},
	{
	"epoch": 0.09297773427942256,
	"grad_norm": 1.0000001192092896,
	"learning_rate": 1.546938775510204e-05,
	"loss": 0.202,
	"step": 380
	},
	{
	"epoch": 0.09542451676046,
	"grad_norm": 0.9999999403953552,
	"learning_rate": 1.5877551020408162e-05,
	"loss": 0.1885,
	"step": 390
	},
	{
	"epoch": 0.09787129924149743,
	"grad_norm": 0.9999998807907104,
	"learning_rate": 1.6285714285714287e-05,
	"loss": 0.1818,
	"step": 400
	},
	{
	"epoch": 0.09787129924149743,
	"eval_accuracy": 0.9495,
	"eval_f1_weighted": 0.9495267406510758,
	"eval_loss": 0.039080820977687836,
	"eval_macro_f1": 0.9494696691689186,
	"eval_precision": 0.9504394545408126,
	"eval_recall": 0.9495,
	"eval_runtime": 1609.6857,
	"eval_samples_per_second": 62.124,
	"eval_steps_per_second": 0.243,
	"step": 400
	},
	{
	"epoch": 0.10031808172253487,
	"grad_norm": 1.0,
	"learning_rate": 1.669387755102041e-05,
	"loss": 0.1813,
	"step": 410
	},
	{
	"epoch": 0.10276486420357231,
	"grad_norm": 0.9999999403953552,
	"learning_rate": 1.7102040816326532e-05,
	"loss": 0.1758,
	"step": 420
	},
	{
	"epoch": 0.10521164668460974,
	"grad_norm": 1.0000001192092896,
	"learning_rate": 1.7510204081632653e-05,
	"loss": 0.1778,
	"step": 430
	},
	{
	"epoch": 0.10765842916564718,
	"grad_norm": 0.9999998807907104,
	"learning_rate": 1.7918367346938777e-05,
	"loss": 0.1681,
	"step": 440
	},
	{
	"epoch": 0.1101052116466846,
	"grad_norm": 0.9999998807907104,
	"learning_rate": 1.8326530612244898e-05,
	"loss": 0.1715,
	"step": 450
	},
	{
	"epoch": 0.11255199412772204,
	"grad_norm": 1.0,
	"learning_rate": 1.8734693877551022e-05,
	"loss": 0.1773,
	"step": 460
	},
	{
	"epoch": 0.11499877660875948,
	"grad_norm": 1.0,
	"learning_rate": 1.9142857142857146e-05,
	"loss": 0.1859,
	"step": 470
	},
	{
	"epoch": 0.11744555908979691,
	"grad_norm": 1.0,
	"learning_rate": 1.9551020408163267e-05,
	"loss": 0.173,
	"step": 480
	},
	{
	"epoch": 0.11989234157083435,
	"grad_norm": 1.0,
	"learning_rate": 1.9959183673469388e-05,
	"loss": 0.1753,
	"step": 490
	},
	{
	"epoch": 0.12233912405187179,
	"grad_norm": 0.9999999403953552,
	"learning_rate": 1.9998764266160687e-05,
	"loss": 0.1712,
	"step": 500
	},
	{
	"epoch": 0.12478590653290922,
	"grad_norm": 1.0,
	"learning_rate": 1.9994492985725524e-05,
	"loss": 0.1644,
	"step": 510
	},
	{
	"epoch": 0.12723268901394666,
	"grad_norm": 0.9999998807907104,
	"learning_rate": 1.9987172205655365e-05,
	"loss": 0.1585,
	"step": 520
	},
	{
	"epoch": 0.1296794714949841,
	"grad_norm": 1.0000001192092896,
	"learning_rate": 1.9976804159651927e-05,
	"loss": 0.1625,
	"step": 530
	},
	{
	"epoch": 0.13212625397602154,
	"grad_norm": 1.0,
	"learning_rate": 1.9963392011192586e-05,
	"loss": 0.1656,
	"step": 540
	},
	{
	"epoch": 0.13457303645705898,
	"grad_norm": 0.9999999403953552,
	"learning_rate": 1.994693985256516e-05,
	"loss": 0.1528,
	"step": 550
	},
	{
	"epoch": 0.1370198189380964,
	"grad_norm": 0.9999999403953552,
	"learning_rate": 1.9927452703619262e-05,
	"loss": 0.1547,
	"step": 560
	},
	{
	"epoch": 0.13946660141913383,
	"grad_norm": 1.0,
	"learning_rate": 1.9904936510234648e-05,
	"loss": 0.1685,
	"step": 570
	},
	{
	"epoch": 0.14191338390017127,
	"grad_norm": 0.9999999403953552,
	"learning_rate": 1.987939814250705e-05,
	"loss": 0.1568,
	"step": 580
	},
	{
	"epoch": 0.14436016638120872,
	"grad_norm": 1.0,
	"learning_rate": 1.985084539265195e-05,
	"loss": 0.1589,
	"step": 590
	},
	{
	"epoch": 0.14680694886224616,
	"grad_norm": 1.0,
	"learning_rate": 1.9819286972627066e-05,
	"loss": 0.1617,
	"step": 600
	},
	{
	"epoch": 0.14680694886224616,
	"eval_accuracy": 0.96956,
	"eval_f1_weighted": 0.9695722935959534,
	"eval_loss": 0.02569369599223137,
	"eval_macro_f1": 0.9695240197651653,
	"eval_precision": 0.9698519718113257,
	"eval_recall": 0.96956,
	"eval_runtime": 1608.5431,
	"eval_samples_per_second": 62.168,
	"eval_steps_per_second": 0.243,
	"step": 600
	}
	],
	"logging_steps": 10,
	"max_steps": 4087,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 1,
	"save_steps": 200,
	"stateful_callbacks": {
	"EarlyStoppingCallback": {
	"args": {
	"early_stopping_patience": 3,
	"early_stopping_threshold": 0.0
	},
	"attributes": {
	"early_stopping_patience_counter": 0
	}
	},
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": false
	},
	"attributes": {}
	}
	},
	"total_flos": 2.0299639947264e+16,
	"train_batch_size": 128,
	"trial_name": null,
	"trial_params": null
	}