SolaceAI

This model is a fine-tuned version of google/gemma-2b on the None dataset. It achieves the following results on the evaluation set:

Model description

More information needed

More information needed

More information needed

The following hyperparameters were used during training:

learning_rate: 0.0002
train_batch_size: 4
eval_batch_size: 4
seed: 42
gradient_accumulation_steps: 4
total_train_batch_size: 16
optimizer: Use adamw_bnb_8bit with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
lr_scheduler_type: linear
lr_scheduler_warmup_steps: 2
training_steps: 3000
mixed_precision_training: Native AMP

Training Loss	Epoch	Step	Validation Loss
12.5314	0.1692	1000	3.1412
12.3003	0.3385	2000	3.0979
12.4202	0.5077	3000	3.0826

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Base model

Adapter

this model