Model save

f43f095 verified about 1 year ago

4.32 kB

library_name: transformers
tags:
  - generated_from_trainer
model-index:
  - name: WhartonDS_RegressionModel
    results: []

WhartonDS_RegressionModel

This model is a fine-tuned version of on an unknown dataset. It achieves the following results on the evaluation set:

Model description

More information needed

More information needed

More information needed

The following hyperparameters were used during training:

learning_rate: 1e-05
train_batch_size: 256
eval_batch_size: 64
seed: 42
optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
lr_scheduler_type: cosine
num_epochs: 60

Training Loss	Epoch	Step	Validation Loss
0.0638	1.0	24	0.0642
0.0511	2.0	48	0.0480
0.0409	3.0	72	0.0417
0.0329	4.0	96	0.0360
0.0267	5.0	120	0.0268
0.0214	6.0	144	0.0178
0.0184	7.0	168	0.0156
0.0164	8.0	192	0.0145
0.0154	9.0	216	0.0145
0.0145	10.0	240	0.0138
0.0139	11.0	264	0.0125
0.0134	12.0	288	0.0126
0.0129	13.0	312	0.0120
0.0126	14.0	336	0.0116
0.0124	15.0	360	0.0120
0.0121	16.0	384	0.0116
0.0118	17.0	408	0.0109
0.0115	18.0	432	0.0109
0.0115	19.0	456	0.0108
0.0112	20.0	480	0.0106
0.0112	21.0	504	0.0106
0.0111	22.0	528	0.0103
0.0109	23.0	552	0.0103
0.0108	24.0	576	0.0102
0.0107	25.0	600	0.0100
0.0108	26.0	624	0.0101
0.0106	27.0	648	0.0100
0.0105	28.0	672	0.0101
0.0104	29.0	696	0.0098
0.0103	30.0	720	0.0098
0.0103	31.0	744	0.0097
0.0103	32.0	768	0.0098
0.0101	33.0	792	0.0096
0.0102	34.0	816	0.0096
0.0103	35.0	840	0.0097
0.0102	36.0	864	0.0097
0.0101	37.0	888	0.0095
0.01	38.0	912	0.0095
0.0099	39.0	936	0.0095
0.0101	40.0	960	0.0094
0.01	41.0	984	0.0094
0.0099	42.0	1008	0.0095
0.0101	43.0	1032	0.0094
0.0099	44.0	1056	0.0094
0.01	45.0	1080	0.0094
0.0099	46.0	1104	0.0094
0.0099	47.0	1128	0.0094
0.01	48.0	1152	0.0096
0.0099	49.0	1176	0.0094
0.0099	50.0	1200	0.0094
0.0098	51.0	1224	0.0093
0.0098	52.0	1248	0.0093
0.0099	53.0	1272	0.0093
0.0099	54.0	1296	0.0093
0.01	55.0	1320	0.0093
0.0098	56.0	1344	0.0093
0.01	57.0	1368	0.0095
0.0098	58.0	1392	0.0093
0.0099	59.0	1416	0.0093
0.0099	60.0	1440	0.0093