Model save

Files changed (4) hide show

README.md CHANGED Viewed

@@ -33,7 +33,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 5e-05
 - train_batch_size: 2
 - eval_batch_size: 8
 - seed: 42
@@ -41,8 +41,8 @@ The following hyperparameters were used during training:
 - total_train_batch_size: 4
 - optimizer: Use OptimizerNames.ADAMW_TORCH_FUSED with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- lr_scheduler_warmup_steps: 50
-- num_epochs: 3
 ### Training results

 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 4e-05
 - train_batch_size: 2
 - eval_batch_size: 8
 - seed: 42
 - total_train_batch_size: 4
 - optimizer: Use OptimizerNames.ADAMW_TORCH_FUSED with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- lr_scheduler_warmup_steps: 100
+- num_epochs: 4
 ### Training results

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f29dedf94efc9e7ab17fd2a805a68573840e89c374384fc9ad5f56c707e1f8c5
 size 497792640

 version https://git-lfs.github.com/spec/v1
+oid sha256:b23a429b453670fa7a0fe8ed6a56326f8712292f368c8d63aacecda28b5c0c2b
 size 497792640

tokenizer.json CHANGED Viewed

@@ -2,13 +2,13 @@
   "version": "1.0",
   "truncation": {
     "direction": "Right",
-    "max_length": 384,
     "strategy": "LongestFirst",
     "stride": 0
   },
   "padding": {
     "strategy": {
-      "Fixed": 384
     },
     "direction": "Right",
     "pad_to_multiple_of": null,

   "version": "1.0",
   "truncation": {
     "direction": "Right",
+    "max_length": 512,
     "strategy": "LongestFirst",
     "stride": 0
   },
   "padding": {
     "strategy": {
+      "Fixed": 512
     },
     "direction": "Right",
     "pad_to_multiple_of": null,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:00a763333e4ad43c05ce07fa287f6aecdc4d3722c374273b16857328f8ee0b86
 size 5841

 version https://git-lfs.github.com/spec/v1
+oid sha256:cefb9c0b6d33998ef0ce0239ff21697d82ff565f08a8254e64d8a6227b8c2b4d
 size 5841