vschem-sol102

This model is a fine-tuned version of ibm-research/GP-MoLFormer-Uniq on an unknown dataset. It achieves the following results on the evaluation set:

Model description

More information needed

More information needed

More information needed

The following hyperparameters were used during training:

learning_rate: 0.0005
train_batch_size: 384
eval_batch_size: 1024
seed: 42
optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
lr_scheduler_type: constant
lr_scheduler_warmup_ratio: 0.05
num_epochs: 5

Training Loss	Epoch	Step	Validation Loss	Rmse	Mae	R2
0.2471	1.0	211	0.2720	0.9807	0.7292	0.4177
0.2855	2.0	422	0.2667	0.9668	0.7204	0.4341
0.2567	3.0	633	0.2736	0.9718	0.7360	0.4282
0.2071	4.0	844	0.2735	0.9591	0.7474	0.4431
0.2042	5.0	1055	0.2986	0.9993	0.7911	0.3954

Safetensors

Model size

49M params

Tensor type

F32

BF16

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Base model

Finetuned

(2)

this model