hung200504
/

bert-31

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [hung200504/bert-21](https://huggingface.co/hung200504/bert-21) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 11.6562
 ## Model description
@@ -34,9 +34,9 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 3e-07
-- train_batch_size: 4
-- eval_batch_size: 4
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
@@ -46,49 +46,17 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 9.9408        | 0.02  | 5    | 11.9244         |
-| 10.9745       | 0.05  | 10   | 11.9123         |
-| 11.7105       | 0.07  | 15   | 11.8995         |
-| 10.574        | 0.09  | 20   | 11.8876         |
-| 11.2567       | 0.11  | 25   | 11.8761         |
-| 10.1985       | 0.14  | 30   | 11.8651         |
-| 11.1306       | 0.16  | 35   | 11.8543         |
-| 11.0848       | 0.18  | 40   | 11.8435         |
-| 10.9051       | 0.21  | 45   | 11.8331         |
-| 11.2139       | 0.23  | 50   | 11.8228         |
-| 9.4434        | 0.25  | 55   | 11.8132         |
-| 10.6242       | 0.28  | 60   | 11.8038         |
-| 10.2756       | 0.3   | 65   | 11.7948         |
-| 11.1823       | 0.32  | 70   | 11.7861         |
-| 11.3154       | 0.34  | 75   | 11.7776         |
-| 10.4026       | 0.37  | 80   | 11.7694         |
-| 11.4274       | 0.39  | 85   | 11.7615         |
-| 10.1923       | 0.41  | 90   | 11.7535         |
-| 10.8907       | 0.44  | 95   | 11.7463         |
-| 10.5215       | 0.46  | 100  | 11.7395         |
-| 11.2088       | 0.48  | 105  | 11.7323         |
-| 10.3167       | 0.5   | 110  | 11.7258         |
-| 10.6535       | 0.53  | 115  | 11.7197         |
-| 10.8819       | 0.55  | 120  | 11.7137         |
-| 10.0389       | 0.57  | 125  | 11.7080         |
-| 10.0161       | 0.6   | 130  | 11.7025         |
-| 10.4476       | 0.62  | 135  | 11.6975         |
-| 10.3089       | 0.64  | 140  | 11.6930         |
-| 10.6388       | 0.67  | 145  | 11.6885         |
-| 11.1704       | 0.69  | 150  | 11.6842         |
-| 10.6095       | 0.71  | 155  | 11.6804         |
-| 10.8112       | 0.73  | 160  | 11.6766         |
-| 10.0912       | 0.76  | 165  | 11.6734         |
-| 10.8292       | 0.78  | 170  | 11.6704         |
-| 10.3543       | 0.8   | 175  | 11.6676         |
-| 9.7421        | 0.83  | 180  | 11.6649         |
-| 11.3465       | 0.85  | 185  | 11.6626         |
-| 9.4446        | 0.87  | 190  | 11.6609         |
-| 10.4486       | 0.89  | 195  | 11.6593         |
-| 10.2593       | 0.92  | 200  | 11.6579         |
-| 10.379        | 0.94  | 205  | 11.6571         |
-| 9.7728        | 0.96  | 210  | 11.6567         |
-| 9.7654        | 0.99  | 215  | 11.6562         |
 ### Framework versions

 This model is a fine-tuned version of [hung200504/bert-21](https://huggingface.co/hung200504/bert-21) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 9.6564
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 3e-06
+- train_batch_size: 16
+- eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 10.8389       | 0.09  | 5    | 11.6872         |
+| 10.6506       | 0.18  | 10   | 11.3129         |
+| 9.9367        | 0.27  | 15   | 10.9748         |
+| 9.7504        | 0.36  | 20   | 10.6767         |
+| 9.4789        | 0.45  | 25   | 10.4164         |
+| 9.3145        | 0.55  | 30   | 10.1941         |
+| 8.4653        | 0.64  | 35   | 10.0120         |
+| 8.9579        | 0.73  | 40   | 9.8679          |
+| 8.3746        | 0.82  | 45   | 9.7613          |
+| 8.3205        | 0.91  | 50   | 9.6904          |
+| 8.0754        | 1.0   | 55   | 9.6564          |
 ### Framework versions

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ebbb68b88b8ab428f75c82ef3ec0e86a2f1773f1c6c91c79be4efe5b1083273f
 size 430953062

 version https://git-lfs.github.com/spec/v1
+oid sha256:392790dbbdd452af0a3c3f0ad733d9535783cac96e6cfd3056939b7e6f596d60
 size 430953062

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:00da6c47f2c88e65093029c1d97ed5c3d3676aa2f00f2c2e6e6cfa916f4058e7
 size 4472

 version https://git-lfs.github.com/spec/v1
+oid sha256:c87cdfed3eed151819fb28ba4e7d5b7ebad76c579d36146f3cc2aa4151720fa6
 size 4472