classification

This model is a fine-tuned version of google/flan-t5-base on the None dataset. It achieves the following results on the evaluation set:

Model description

More information needed

More information needed

More information needed

The following hyperparameters were used during training:

learning_rate: 5e-05
train_batch_size: 8
eval_batch_size: 8
seed: 42
optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
lr_scheduler_type: linear
num_epochs: 5

Training Loss	Epoch	Step	Validation Loss	Rouge1	Rouge2	Rougel	Rougelsum	Gen Len
No log	1.0	315	0.2980	84.2857	59.8413	84.2857	84.3651	2.7635
0.405	2.0	630	0.2399	86.2698	63.1746	86.2698	86.2698	2.7540
0.405	3.0	945	0.3172	85.7143	65.7143	85.7143	85.7143	2.8111
0.1669	4.0	1260	0.3197	86.5079	64.6032	86.5079	86.5873	2.7762
0.1291	5.0	1575	0.3394	85.3968	65.2381	85.3175	85.4762	2.8

Safetensors

Model size

0.2B params

Tensor type

F32

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Base model

Finetuned

(895)

this model