davidgaofc
/

training

@@ -20,11 +20,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [distilbert-base-uncased](https://huggingface.co/distilbert-base-uncased) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.5309
-- Accuracy: 0.8626
-- F1: 0.8041
-- Precision: 0.7530
-- Recall: 0.8626
 ## Model description
@@ -44,37 +44,42 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
-- train_batch_size: 104
-- eval_batch_size: 104
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 15
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy | F1     | Precision | Recall |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|:------:|:---------:|:------:|
-| No log        | 1.0   | 7    | 0.4054          | 0.8681   | 0.8069 | 0.7537    | 0.8681 |
-| No log        | 2.0   | 14   | 0.4137          | 0.8681   | 0.8069 | 0.7537    | 0.8681 |
-| No log        | 3.0   | 21   | 0.4167          | 0.8681   | 0.8069 | 0.7537    | 0.8681 |
-| No log        | 4.0   | 28   | 0.4263          | 0.8681   | 0.8069 | 0.7537    | 0.8681 |
-| No log        | 5.0   | 35   | 0.4274          | 0.8681   | 0.8069 | 0.7537    | 0.8681 |
-| No log        | 6.0   | 42   | 0.4414          | 0.8681   | 0.8069 | 0.7537    | 0.8681 |
-| No log        | 7.0   | 49   | 0.4516          | 0.8681   | 0.8069 | 0.7537    | 0.8681 |
-| No log        | 8.0   | 56   | 0.4598          | 0.8681   | 0.8069 | 0.7537    | 0.8681 |
-| No log        | 9.0   | 63   | 0.4786          | 0.8681   | 0.8069 | 0.7537    | 0.8681 |
-| No log        | 10.0  | 70   | 0.4823          | 0.8626   | 0.8041 | 0.7530    | 0.8626 |
-| No log        | 11.0  | 77   | 0.4963          | 0.8626   | 0.8041 | 0.7530    | 0.8626 |
-| No log        | 12.0  | 84   | 0.5107          | 0.8626   | 0.8041 | 0.7530    | 0.8626 |
-| No log        | 13.0  | 91   | 0.5220          | 0.8626   | 0.8041 | 0.7530    | 0.8626 |
-| No log        | 14.0  | 98   | 0.5294          | 0.8626   | 0.8041 | 0.7530    | 0.8626 |
-| No log        | 15.0  | 105  | 0.5309          | 0.8626   | 0.8041 | 0.7530    | 0.8626 |
 ### Framework versions
 - Transformers 4.36.2
 - Pytorch 2.1.2+cu121
-- Datasets 2.15.0
 - Tokenizers 0.15.0

 This model is a fine-tuned version of [distilbert-base-uncased](https://huggingface.co/distilbert-base-uncased) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.7420
+- Accuracy: 0.7607
+- F1: 0.7608
+- Precision: 0.7611
+- Recall: 0.7607
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
+- train_batch_size: 20
+- eval_batch_size: 20
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 20
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy | F1     | Precision | Recall |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|:------:|:---------:|:------:|
+| No log        | 1.0   | 132  | 0.6953          | 0.4817   | 0.3630 | 0.5023    | 0.4817 |
+| No log        | 2.0   | 264  | 0.6493          | 0.6067   | 0.6069 | 0.6072    | 0.6067 |
+| No log        | 3.0   | 396  | 0.6383          | 0.6662   | 0.6662 | 0.6685    | 0.6662 |
+| 0.5695        | 4.0   | 528  | 0.6615          | 0.6905   | 0.6907 | 0.6916    | 0.6905 |
+| 0.5695        | 5.0   | 660  | 0.7464          | 0.7317   | 0.7314 | 0.7316    | 0.7317 |
+| 0.5695        | 6.0   | 792  | 0.9271          | 0.7073   | 0.7048 | 0.7100    | 0.7073 |
+| 0.5695        | 7.0   | 924  | 1.1392          | 0.7210   | 0.7204 | 0.7212    | 0.7210 |
+| 0.1578        | 8.0   | 1056 | 1.2788          | 0.7149   | 0.7141 | 0.7226    | 0.7149 |
+| 0.1578        | 9.0   | 1188 | 1.2960          | 0.75     | 0.7501 | 0.7504    | 0.75   |
+| 0.1578        | 10.0  | 1320 | 1.4280          | 0.7287   | 0.7278 | 0.7292    | 0.7287 |
+| 0.1578        | 11.0  | 1452 | 1.4865          | 0.7424   | 0.7424 | 0.7446    | 0.7424 |
+| 0.0414        | 12.0  | 1584 | 1.5945          | 0.7302   | 0.7290 | 0.7312    | 0.7302 |
+| 0.0414        | 13.0  | 1716 | 1.6329          | 0.7363   | 0.7364 | 0.7369    | 0.7363 |
+| 0.0414        | 14.0  | 1848 | 1.6514          | 0.7454   | 0.7455 | 0.7462    | 0.7454 |
+| 0.0414        | 15.0  | 1980 | 1.6811          | 0.7409   | 0.7409 | 0.7411    | 0.7409 |
+| 0.0111        | 16.0  | 2112 | 1.6935          | 0.7470   | 0.7471 | 0.7481    | 0.7470 |
+| 0.0111        | 17.0  | 2244 | 1.7232          | 0.7515   | 0.7515 | 0.7541    | 0.7515 |
+| 0.0111        | 18.0  | 2376 | 1.7319          | 0.7546   | 0.7546 | 0.7546    | 0.7546 |
+| 0.0018        | 19.0  | 2508 | 1.7385          | 0.7530   | 0.7532 | 0.7540    | 0.7530 |
+| 0.0018        | 20.0  | 2640 | 1.7420          | 0.7607   | 0.7608 | 0.7611    | 0.7607 |
 ### Framework versions
 - Transformers 4.36.2
 - Pytorch 2.1.2+cu121
+- Datasets 2.16.0
 - Tokenizers 0.15.0

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7bf4bdf7f45ebdfdd0a2e3b5ca8e8521769d1f21436bb7b32b7e60ea00730909
 size 267832560

 version https://git-lfs.github.com/spec/v1
+oid sha256:525914ec507f90a21b4c9f56ccb2201aa285ff84cab4ce1b2fdb19f17d69daf0
 size 267832560

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cfd65a6f7a6651cc79b5b6e2fc1d25668a95c9e222683095fbf6a9c5999d1bd2
 size 4664

 version https://git-lfs.github.com/spec/v1
+oid sha256:15357dde7dea232315818fd70f8e699efc66104510f7ae9c3678b36c1dda604c
 size 4664