chizhik

re-trained model after eliminating annotation errors

2a0b29c about 3 years ago

15 kB

	{
	"best_metric": 0.8249799337347952,
	"best_model_checkpoint": "./CARES/checkpoints/bert-ba-stratified/run-9/checkpoint-3976",
	"epoch": 56.0,
	"global_step": 3976,
	"is_hyper_param_search": true,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 2.0,
	"eval_loss": 0.24943208694458008,
	"eval_macro_f1": 0.08911588063155029,
	"eval_macro_precision": 0.1020147123407993,
	"eval_macro_recall": 0.08017933766090879,
	"eval_micro_f1": 0.27627302275189597,
	"eval_micro_precision": 0.7750759878419453,
	"eval_micro_recall": 0.16809492419248517,
	"eval_runtime": 2.9775,
	"eval_samples_per_second": 324.431,
	"eval_steps_per_second": 20.487,
	"step": 142
	},
	{
	"epoch": 4.0,
	"eval_loss": 0.1698431819677353,
	"eval_macro_f1": 0.30238618603356054,
	"eval_macro_precision": 0.4320649543604988,
	"eval_macro_recall": 0.2644492382273683,
	"eval_micro_f1": 0.6521739130434782,
	"eval_micro_precision": 0.8376421923474664,
	"eval_micro_recall": 0.5339485827290705,
	"eval_runtime": 2.979,
	"eval_samples_per_second": 324.273,
	"eval_steps_per_second": 20.477,
	"step": 284
	},
	{
	"epoch": 6.0,
	"eval_loss": 0.14047418534755707,
	"eval_macro_f1": 0.40223830727079396,
	"eval_macro_precision": 0.4784721691006365,
	"eval_macro_recall": 0.3687052580973402,
	"eval_micro_f1": 0.739880059970015,
	"eval_micro_precision": 0.8575152041702867,
	"eval_micro_recall": 0.6506262359920897,
	"eval_runtime": 2.9805,
	"eval_samples_per_second": 324.11,
	"eval_steps_per_second": 20.467,
	"step": 426
	},
	{
	"epoch": 7.04,
	"learning_rate": 3.279287453609026e-05,
	"loss": 0.2244,
	"step": 500
	},
	{
	"epoch": 8.0,
	"eval_loss": 0.1187577173113823,
	"eval_macro_f1": 0.5347249220382584,
	"eval_macro_precision": 0.7327975628305986,
	"eval_macro_recall": 0.4754068941604508,
	"eval_micro_f1": 0.7880299251870324,
	"eval_micro_precision": 0.8573643410852713,
	"eval_micro_recall": 0.7290705339485827,
	"eval_runtime": 2.9805,
	"eval_samples_per_second": 324.108,
	"eval_steps_per_second": 20.466,
	"step": 568
	},
	{
	"epoch": 10.0,
	"eval_loss": 0.11074026674032211,
	"eval_macro_f1": 0.5991127961103198,
	"eval_macro_precision": 0.6991665233729463,
	"eval_macro_recall": 0.5596673950826421,
	"eval_micro_f1": 0.8128196385952949,
	"eval_micro_precision": 0.8418079096045198,
	"eval_micro_recall": 0.7857613711272248,
	"eval_runtime": 2.9796,
	"eval_samples_per_second": 324.206,
	"eval_steps_per_second": 20.473,
	"step": 710
	},
	{
	"epoch": 12.0,
	"eval_loss": 0.10078531503677368,
	"eval_macro_f1": 0.6568773778388772,
	"eval_macro_precision": 0.700413763066982,
	"eval_macro_recall": 0.6283428000904666,
	"eval_micro_f1": 0.8347529812606473,
	"eval_micro_precision": 0.8638928067700987,
	"eval_micro_recall": 0.8075148319050758,
	"eval_runtime": 2.979,
	"eval_samples_per_second": 324.274,
	"eval_steps_per_second": 20.477,
	"step": 852
	},
	{
	"epoch": 14.0,
	"eval_loss": 0.10221733897924423,
	"eval_macro_f1": 0.6758575377881516,
	"eval_macro_precision": 0.838910780569426,
	"eval_macro_recall": 0.6238243641780066,
	"eval_micro_f1": 0.8337912087912088,
	"eval_micro_precision": 0.8702508960573476,
	"eval_micro_recall": 0.8002636783124588,
	"eval_runtime": 2.9795,
	"eval_samples_per_second": 324.21,
	"eval_steps_per_second": 20.473,
	"step": 994
	},
	{
	"epoch": 14.08,
	"learning_rate": 3.0308565859113728e-05,
	"loss": 0.0513,
	"step": 1000
	},
	{
	"epoch": 16.0,
	"eval_loss": 0.10313227772712708,
	"eval_macro_f1": 0.7298003500123689,
	"eval_macro_precision": 0.8118751777216693,
	"eval_macro_recall": 0.6944187826598622,
	"eval_micro_f1": 0.8354006034193765,
	"eval_micro_precision": 0.849931787175989,
	"eval_micro_recall": 0.8213579433091628,
	"eval_runtime": 2.9811,
	"eval_samples_per_second": 324.042,
	"eval_steps_per_second": 20.462,
	"step": 1136
	},
	{
	"epoch": 18.0,
	"eval_loss": 0.10032625496387482,
	"eval_macro_f1": 0.7681297243773157,
	"eval_macro_precision": 0.8958394795684446,
	"eval_macro_recall": 0.7124194145895655,
	"eval_micro_f1": 0.8443093549476527,
	"eval_micro_precision": 0.8656509695290858,
	"eval_micro_recall": 0.8239947264337508,
	"eval_runtime": 2.9813,
	"eval_samples_per_second": 324.018,
	"eval_steps_per_second": 20.461,
	"step": 1278
	},
	{
	"epoch": 20.0,
	"eval_loss": 0.1044757142663002,
	"eval_macro_f1": 0.7829375079467304,
	"eval_macro_precision": 0.8858384241353942,
	"eval_macro_recall": 0.7367403001149204,
	"eval_micro_f1": 0.8420698924731183,
	"eval_micro_precision": 0.8588074023303632,
	"eval_micro_recall": 0.8259723137771918,
	"eval_runtime": 2.9861,
	"eval_samples_per_second": 323.499,
	"eval_steps_per_second": 20.428,
	"step": 1420
	},
	{
	"epoch": 21.13,
	"learning_rate": 2.7824257182137193e-05,
	"loss": 0.0183,
	"step": 1500
	},
	{
	"epoch": 22.0,
	"eval_loss": 0.1039622500538826,
	"eval_macro_f1": 0.7902798824417182,
	"eval_macro_precision": 0.89276275853935,
	"eval_macro_recall": 0.7403232660636272,
	"eval_micro_f1": 0.8479512360311547,
	"eval_micro_precision": 0.871866295264624,
	"eval_micro_recall": 0.8253131179960448,
	"eval_runtime": 2.977,
	"eval_samples_per_second": 324.483,
	"eval_steps_per_second": 20.49,
	"step": 1562
	},
	{
	"epoch": 24.0,
	"eval_loss": 0.10449391603469849,
	"eval_macro_f1": 0.7973957256263516,
	"eval_macro_precision": 0.8897797609904068,
	"eval_macro_recall": 0.7482788788828134,
	"eval_micro_f1": 0.8530297957817209,
	"eval_micro_precision": 0.8666666666666667,
	"eval_micro_recall": 0.8398154251812788,
	"eval_runtime": 2.982,
	"eval_samples_per_second": 323.947,
	"eval_steps_per_second": 20.456,
	"step": 1704
	},
	{
	"epoch": 26.0,
	"eval_loss": 0.10751193016767502,
	"eval_macro_f1": 0.815099576727704,
	"eval_macro_precision": 0.8596170620799346,
	"eval_macro_recall": 0.7893940744657464,
	"eval_micro_f1": 0.8517287234042553,
	"eval_micro_precision": 0.8591549295774648,
	"eval_micro_recall": 0.8444297956493079,
	"eval_runtime": 2.9874,
	"eval_samples_per_second": 323.362,
	"eval_steps_per_second": 20.419,
	"step": 1846
	},
	{
	"epoch": 28.0,
	"eval_loss": 0.10826986283063889,
	"eval_macro_f1": 0.8122978188941863,
	"eval_macro_precision": 0.8818206343623207,
	"eval_macro_recall": 0.7768327155632533,
	"eval_micro_f1": 0.8507362784471219,
	"eval_micro_precision": 0.8640380693405847,
	"eval_micro_recall": 0.8378378378378378,
	"eval_runtime": 2.9805,
	"eval_samples_per_second": 324.106,
	"eval_steps_per_second": 20.466,
	"step": 1988
	},
	{
	"epoch": 28.17,
	"learning_rate": 2.5339948505160657e-05,
	"loss": 0.0094,
	"step": 2000
	},
	{
	"epoch": 30.0,
	"eval_loss": 0.11172767728567123,
	"eval_macro_f1": 0.7952069303877679,
	"eval_macro_precision": 0.8834731091800803,
	"eval_macro_recall": 0.7589521997225694,
	"eval_micro_f1": 0.8510210913960494,
	"eval_micro_precision": 0.8646258503401361,
	"eval_micro_recall": 0.8378378378378378,
	"eval_runtime": 2.9811,
	"eval_samples_per_second": 324.039,
	"eval_steps_per_second": 20.462,
	"step": 2130
	},
	{
	"epoch": 32.0,
	"eval_loss": 0.12214264273643494,
	"eval_macro_f1": 0.784963786280585,
	"eval_macro_precision": 0.8399655989881138,
	"eval_macro_recall": 0.7539663033116887,
	"eval_micro_f1": 0.8395881766854865,
	"eval_micro_precision": 0.8460508701472557,
	"eval_micro_recall": 0.8332234673698088,
	"eval_runtime": 2.9802,
	"eval_samples_per_second": 324.138,
	"eval_steps_per_second": 20.468,
	"step": 2272
	},
	{
	"epoch": 34.0,
	"eval_loss": 0.10992709547281265,
	"eval_macro_f1": 0.818123937895116,
	"eval_macro_precision": 0.846307748666965,
	"eval_macro_recall": 0.7959472696549352,
	"eval_micro_f1": 0.8540829986613119,
	"eval_micro_precision": 0.86743711760707,
	"eval_micro_recall": 0.8411338167435728,
	"eval_runtime": 2.9817,
	"eval_samples_per_second": 323.976,
	"eval_steps_per_second": 20.458,
	"step": 2414
	},
	{
	"epoch": 35.21,
	"learning_rate": 2.2855639828184125e-05,
	"loss": 0.0088,
	"step": 2500
	},
	{
	"epoch": 36.0,
	"eval_loss": 0.11282340437173843,
	"eval_macro_f1": 0.810588172484549,
	"eval_macro_precision": 0.8881718400115531,
	"eval_macro_recall": 0.7660828954423657,
	"eval_micro_f1": 0.8533783783783784,
	"eval_micro_precision": 0.8752598752598753,
	"eval_micro_recall": 0.8325642715886619,
	"eval_runtime": 2.9823,
	"eval_samples_per_second": 323.913,
	"eval_steps_per_second": 20.454,
	"step": 2556
	},
	{
	"epoch": 38.0,
	"eval_loss": 0.11364943534135818,
	"eval_macro_f1": 0.8086979072156089,
	"eval_macro_precision": 0.874192444614366,
	"eval_macro_recall": 0.7687841160082525,
	"eval_micro_f1": 0.855510752688172,
	"eval_micro_precision": 0.8725154215215901,
	"eval_micro_recall": 0.8391562294001318,
	"eval_runtime": 2.9856,
	"eval_samples_per_second": 323.552,
	"eval_steps_per_second": 20.431,
	"step": 2698
	},
	{
	"epoch": 40.0,
	"eval_loss": 0.11377756297588348,
	"eval_macro_f1": 0.8074550758048753,
	"eval_macro_precision": 0.8601506214626871,
	"eval_macro_recall": 0.7772364003410493,
	"eval_micro_f1": 0.8550483172275909,
	"eval_micro_precision": 0.8645552560646901,
	"eval_micro_recall": 0.8457481872116018,
	"eval_runtime": 2.987,
	"eval_samples_per_second": 323.399,
	"eval_steps_per_second": 20.422,
	"step": 2840
	},
	{
	"epoch": 42.0,
	"eval_loss": 0.11456111818552017,
	"eval_macro_f1": 0.8197602680311404,
	"eval_macro_precision": 0.8652772327919502,
	"eval_macro_recall": 0.7923572373451824,
	"eval_micro_f1": 0.8584748584748586,
	"eval_micro_precision": 0.8674293405114402,
	"eval_micro_recall": 0.8497033618984838,
	"eval_runtime": 2.9793,
	"eval_samples_per_second": 324.237,
	"eval_steps_per_second": 20.475,
	"step": 2982
	},
	{
	"epoch": 42.25,
	"learning_rate": 2.0371331151207586e-05,
	"loss": 0.0049,
	"step": 3000
	},
	{
	"epoch": 44.0,
	"eval_loss": 0.11773423105478287,
	"eval_macro_f1": 0.8086306686692242,
	"eval_macro_precision": 0.8642281309223148,
	"eval_macro_recall": 0.7764573931394076,
	"eval_micro_f1": 0.8553291012362179,
	"eval_micro_precision": 0.8672086720867209,
	"eval_micro_recall": 0.8437705998681608,
	"eval_runtime": 2.9813,
	"eval_samples_per_second": 324.023,
	"eval_steps_per_second": 20.461,
	"step": 3124
	},
	{
	"epoch": 46.0,
	"eval_loss": 0.11780666559934616,
	"eval_macro_f1": 0.8101599105843645,
	"eval_macro_precision": 0.8691080726361069,
	"eval_macro_recall": 0.7762766074908475,
	"eval_micro_f1": 0.8565723793677205,
	"eval_micro_precision": 0.8649193548387096,
	"eval_micro_recall": 0.8483849703361899,
	"eval_runtime": 2.9804,
	"eval_samples_per_second": 324.123,
	"eval_steps_per_second": 20.467,
	"step": 3266
	},
	{
	"epoch": 48.0,
	"eval_loss": 0.11932362616062164,
	"eval_macro_f1": 0.8165194442314286,
	"eval_macro_precision": 0.8648115942931565,
	"eval_macro_recall": 0.7864788866212832,
	"eval_micro_f1": 0.8535201868535202,
	"eval_micro_precision": 0.8641891891891892,
	"eval_micro_recall": 0.8431114040870138,
	"eval_runtime": 2.985,
	"eval_samples_per_second": 323.616,
	"eval_steps_per_second": 20.435,
	"step": 3408
	},
	{
	"epoch": 49.3,
	"learning_rate": 1.7887022474231054e-05,
	"loss": 0.0034,
	"step": 3500
	},
	{
	"epoch": 50.0,
	"eval_loss": 0.12221735715866089,
	"eval_macro_f1": 0.8141089592504215,
	"eval_macro_precision": 0.8615361853719665,
	"eval_macro_recall": 0.7844581807191786,
	"eval_micro_f1": 0.8523714094856378,
	"eval_micro_precision": 0.8639133378469871,
	"eval_micro_recall": 0.8411338167435728,
	"eval_runtime": 2.9803,
	"eval_samples_per_second": 324.125,
	"eval_steps_per_second": 20.468,
	"step": 3550
	},
	{
	"epoch": 52.0,
	"eval_loss": 0.12201466411352158,
	"eval_macro_f1": 0.8215839258353351,
	"eval_macro_precision": 0.8618774470352207,
	"eval_macro_recall": 0.795741448912531,
	"eval_micro_f1": 0.8534223706176962,
	"eval_micro_precision": 0.86468200270636,
	"eval_micro_recall": 0.8424522083058669,
	"eval_runtime": 2.9796,
	"eval_samples_per_second": 324.208,
	"eval_steps_per_second": 20.473,
	"step": 3692
	},
	{
	"epoch": 54.0,
	"eval_loss": 0.12538054585456848,
	"eval_macro_f1": 0.8134875725433206,
	"eval_macro_precision": 0.8710944940417797,
	"eval_macro_recall": 0.7763605326378977,
	"eval_micro_f1": 0.85425782564793,
	"eval_micro_precision": 0.8727647867950481,
	"eval_micro_recall": 0.8365194462755439,
	"eval_runtime": 2.9841,
	"eval_samples_per_second": 323.717,
	"eval_steps_per_second": 20.442,
	"step": 3834
	},
	{
	"epoch": 56.0,
	"eval_loss": 0.12492760270833969,
	"eval_macro_f1": 0.8249799337347952,
	"eval_macro_precision": 0.8672879358583392,
	"eval_macro_recall": 0.7974535529440212,
	"eval_micro_f1": 0.8574290484140235,
	"eval_micro_precision": 0.8687415426251691,
	"eval_micro_recall": 0.8464073829927489,
	"eval_runtime": 2.9821,
	"eval_samples_per_second": 323.938,
	"eval_steps_per_second": 20.456,
	"step": 3976
	}
	],
	"max_steps": 7100,
	"num_train_epochs": 100,
	"total_flos": 3.752304368656253e+16,
	"trial_name": null,
	"trial_params": {
	"adam_epsilon": 2.4799103776060603e-09,
	"learning_rate": 3.4268553890214325e-05,
	"per_device_eval_batch_size": 16,
	"per_device_train_batch_size": 32,
	"seed": 326,
	"warmup_steps": 203,
	"weight_decay": 2.8436289860950645e-08
	}
	}