Model save

Files changed (4) hide show

README.md CHANGED Viewed

@@ -39,8 +39,8 @@ The following hyperparameters were used during training:
 - gradient_accumulation_steps: 2
 - total_train_batch_size: 16
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
-- lr_scheduler_type: cosine
-- lr_scheduler_warmup_ratio: 0.05
 - num_epochs: 15
 - mixed_precision_training: Native AMP

 - gradient_accumulation_steps: 2
 - total_train_batch_size: 16
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- lr_scheduler_warmup_ratio: 0.2
 - num_epochs: 15
 - mixed_precision_training: Native AMP

model-00001-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:69b450ed68277c1450c62bf75a3b3432761f706127d048008a015171c7b7af57
 size 4992706480

 version https://git-lfs.github.com/spec/v1
+oid sha256:ef0d762180e7626fab9fc23381c7d56eb8ff93cbce72e6fe7755e4d11722a0c2
 size 4992706480

model-00002-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:50495652d41d82584900ebc8b8ce0cc7b7e5648f1bdf63e5a68dedaba3cd8ab4
 size 1180663192

 version https://git-lfs.github.com/spec/v1
+oid sha256:5ccfea5a2e9f2a3ada90942bf14b863befdf4b375d1606e4f47b322949710226
 size 1180663192

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:80236a5400903c1272642bdd66f887a6ca42ea66786033202c9ca6fb67377ffe
 size 5048

 version https://git-lfs.github.com/spec/v1
+oid sha256:80860f7e875f932ebd8c7f7b1bfb9cac42648f1fdb5c451620cab073a47ec884
 size 5048