ayaat
/

mpnet-base-all-mqp-binary

@@ -211,9 +211,10 @@ You can finetune this model on your own dataset.
 - `eval_strategy`: steps
 - `per_device_train_batch_size`: 16
 - `per_device_eval_batch_size`: 16
-- `num_train_epochs`: 10
 - `warmup_ratio`: 0.1
 - `fp16`: True
 - `batch_sampler`: no_duplicates
 #### All Hyperparameters
@@ -236,7 +237,7 @@ You can finetune this model on your own dataset.
 - `adam_beta2`: 0.999
 - `adam_epsilon`: 1e-08
 - `max_grad_norm`: 1.0
-- `num_train_epochs`: 10
 - `max_steps`: -1
 - `lr_scheduler_type`: linear
 - `lr_scheduler_kwargs`: {}
@@ -297,7 +298,7 @@ You can finetune this model on your own dataset.
 - `dataloader_persistent_workers`: False
 - `skip_memory_metrics`: True
 - `use_legacy_prediction_loop`: False
-- `push_to_hub`: False
 - `resume_from_checkpoint`: None
 - `hub_model_id`: None
 - `hub_strategy`: every_save
@@ -340,21 +341,7 @@ You can finetune this model on your own dataset.
 ### Training Logs
 | Epoch  | Step | Training Loss | Validation Loss |
 |:------:|:----:|:-------------:|:---------------:|
-| 0.6536 | 100  | 2.8785        | 2.6264          |
-| 1.3072 | 200  | 2.4602        | 2.8035          |
-| 1.9608 | 300  | 0.9681        | 3.4420          |
-| 2.6144 | 400  | 0.4578        | 4.1960          |
-| 3.2680 | 500  | 0.1123        | 4.3254          |
-| 3.9216 | 600  | 0.0155        | 4.8884          |
-| 4.5752 | 700  | 0.0026        | 5.0455          |
-| 5.2288 | 800  | 0.0022        | 5.0907          |
-| 5.8824 | 900  | 0.0003        | 5.0952          |
-| 6.5359 | 1000 | 0.0001        | 5.1793          |
-| 7.1895 | 1100 | 0.0001        | 5.2393          |
-| 7.8431 | 1200 | 0.0001        | 5.2619          |
-| 8.4967 | 1300 | 0.0001        | 5.2712          |
-| 9.1503 | 1400 | 0.0001        | 5.2953          |
-| 9.8039 | 1500 | 0.0001        | 5.3024          |
 ### Framework Versions

 - `eval_strategy`: steps
 - `per_device_train_batch_size`: 16
 - `per_device_eval_batch_size`: 16
+- `num_train_epochs`: 1
 - `warmup_ratio`: 0.1
 - `fp16`: True
+- `push_to_hub`: True
 - `batch_sampler`: no_duplicates
 #### All Hyperparameters
 - `adam_beta2`: 0.999
 - `adam_epsilon`: 1e-08
 - `max_grad_norm`: 1.0
+- `num_train_epochs`: 1
 - `max_steps`: -1
 - `lr_scheduler_type`: linear
 - `lr_scheduler_kwargs`: {}
 - `dataloader_persistent_workers`: False
 - `skip_memory_metrics`: True
 - `use_legacy_prediction_loop`: False
+- `push_to_hub`: True
 - `resume_from_checkpoint`: None
 - `hub_model_id`: None
 - `hub_strategy`: every_save
 ### Training Logs
 | Epoch  | Step | Training Loss | Validation Loss |
 |:------:|:----:|:-------------:|:---------------:|
+| 0.6536 | 100  | 2.7722        | 2.8215          |
 ### Framework Versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7888909407f694ab3c0d4efb1465cf62ba154a1affa20d5b77c78d47e142bf19
 size 437967672

 version https://git-lfs.github.com/spec/v1
+oid sha256:06c9fc017185df78269a8c8628dd77893dca26eed157fbe3923e5e455085ecd2
 size 437967672

runs/Feb06_08-23-57_90c6fdffb148/events.out.tfevents.1738830343.90c6fdffb148.17069.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e17ecf5c3071b3a71d7c5067c2cea4884db3d5fabb5ea7cc10be0cea8374c1c5
-size 4900

 version https://git-lfs.github.com/spec/v1
+oid sha256:5ab46833711dbb594ff00deef2d2cbfd942305b4f6d6d553c7c6aa7fd94971de
+size 5254