theCuiCoders
/

bert-base-uncased-FinedTuned

@@ -22,7 +22,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [bert-base-uncased](https://huggingface.co/bert-base-uncased) on the stsb_multi_mt dataset.
 It achieves the following results on the evaluation set:
-- Loss: 2.6888
 - Accuracy: 0.1762
 ## Model description
@@ -42,7 +42,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 1e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
@@ -51,28 +51,23 @@ The following hyperparameters were used during training:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 1000
-- training_steps: 15000
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch   | Step  | Validation Loss | Accuracy |
 |:-------------:|:-------:|:-----:|:---------------:|:--------:|
-| 0.1203        | 5.5556  | 1000  | 2.7894          | 0.1762   |
-| 0.089         | 11.1111 | 2000  | 2.7816          | 0.1762   |
-| 0.095         | 16.6667 | 3000  | 2.7732          | 0.1762   |
-| 0.0818        | 22.2222 | 4000  | 2.7201          | 0.1762   |
-| 0.0786        | 27.7778 | 5000  | 2.6378          | 0.1762   |
-| 0.0816        | 33.3333 | 6000  | 2.7167          | 0.1762   |
-| 0.0795        | 38.8889 | 7000  | 2.6429          | 0.1762   |
-| 0.0978        | 44.4444 | 8000  | 2.6964          | 0.1762   |
-| 0.1006        | 50.0    | 9000  | 2.7168          | 0.1762   |
-| 0.171         | 55.5556 | 10000 | 2.7183          | 0.1762   |
-| 0.1185        | 61.1111 | 11000 | 2.6737          | 0.1762   |
-| 0.1648        | 66.6667 | 12000 | 2.6573          | 0.1762   |
-| 0.1365        | 72.2222 | 13000 | 2.6944          | 0.1762   |
-| 0.1298        | 77.7778 | 14000 | 2.6950          | 0.1762   |
-| 0.1832        | 83.3333 | 15000 | 2.6888          | 0.1762   |
 ### Framework versions

 This model is a fine-tuned version of [bert-base-uncased](https://huggingface.co/bert-base-uncased) on the stsb_multi_mt dataset.
 It achieves the following results on the evaluation set:
+- Loss: 2.7821
 - Accuracy: 0.1762
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 5e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 1000
+- training_steps: 10000
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch   | Step  | Validation Loss | Accuracy |
 |:-------------:|:-------:|:-----:|:---------------:|:--------:|
+| 0.2457        | 5.5556  | 1000  | 2.4913          | 0.1762   |
+| 0.1759        | 11.1111 | 2000  | 2.8424          | 0.1762   |
+| 0.1458        | 16.6667 | 3000  | 2.9765          | 0.1762   |
+| 0.1132        | 22.2222 | 4000  | 2.7163          | 0.1762   |
+| 0.1118        | 27.7778 | 5000  | 2.7272          | 0.1762   |
+| 0.1272        | 33.3333 | 6000  | 2.8354          | 0.1762   |
+| 0.1233        | 38.8889 | 7000  | 2.6948          | 0.1762   |
+| 0.1161        | 44.4444 | 8000  | 2.7358          | 0.1762   |
+| 0.0736        | 50.0    | 9000  | 2.7748          | 0.1762   |
+| 0.0924        | 55.5556 | 10000 | 2.7821          | 0.1762   |
 ### Framework versions

events.out.tfevents.1718104401.0a87a89624da.2515.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:040da921e2ca2260db51358d1ec43a6c79237919b9066943ad922e3234b7353b
-size 92617

 version https://git-lfs.github.com/spec/v1
+oid sha256:23856aed84dcb208cdcac1fccee8bd458bae55bdeb6793d8d225716e1db93d96
+size 92971

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6c963a77d94b148090ee34cb2f024f770d3ff0d0f22267b9bd09bd6c79963e97
 size 437955572

 version https://git-lfs.github.com/spec/v1
+oid sha256:a3f253a019837f44ba24ab10ac80ec76f2c7a67ef97f0a4d09399b1402c4965f
 size 437955572