Model save

Files changed (3) hide show

README.md CHANGED Viewed

@@ -37,12 +37,13 @@ The following hyperparameters were used during training:
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
-- gradient_accumulation_steps: 8
-- total_train_batch_size: 64
 - optimizer: Use adamw_bnb_8bit with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 2
-- num_epochs: 1
 ### Framework versions

 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
+- gradient_accumulation_steps: 2
+- total_train_batch_size: 16
 - optimizer: Use adamw_bnb_8bit with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 2
+- training_steps: 2000
+- mixed_precision_training: Native AMP
 ### Framework versions

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5e253062cbe7fb0a2aa8d21f0391a65316932ca7a2e940109b28e775ff7da632
 size 3695848

 version https://git-lfs.github.com/spec/v1
+oid sha256:6caf99525843c9fe6a4758bc49f08b2f91fcca5563982410c022ab63a75e9232
 size 3695848

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4247018c415f9b458dac64f481475a4b2d6a05ff2fcb5ab330af6f372afc6512
 size 5304

 version https://git-lfs.github.com/spec/v1
+oid sha256:93a9995b87332cfec0266f2b9b5d6616fbdeb74079aedc744c8db1d0fca16a05
 size 5304