bencyc1129
/

art-bert-base-cased

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [bert-base-cased](https://huggingface.co/bert-base-cased) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 3.4617
 ## Model description
@@ -35,41 +35,48 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
-- train_batch_size: 2
-- eval_batch_size: 2
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 50
 ### Training results
-| Training Loss | Epoch | Step  | Validation Loss |
-|:-------------:|:-----:|:-----:|:---------------:|
-| 6.5124        | 2.07  | 1000  | 5.8786          |
-| 5.6578        | 4.15  | 2000  | 5.5302          |
-| 5.0097        | 6.22  | 3000  | 5.0396          |
-| 4.473         | 8.3   | 4000  | 5.0136          |
-| 4.0785        | 10.37 | 5000  | 4.5140          |
-| 3.6384        | 12.45 | 6000  | 4.5004          |
-| 3.2741        | 14.52 | 7000  | 4.2313          |
-| 3.0113        | 16.6  | 8000  | 4.1205          |
-| 2.664         | 18.67 | 9000  | 4.0860          |
-| 2.4579        | 20.75 | 10000 | 3.8640          |
-| 2.2772        | 22.82 | 11000 | 3.9510          |
-| 2.002         | 24.9  | 12000 | 4.0128          |
-| 1.8977        | 26.97 | 13000 | 3.8890          |
-| 1.6887        | 29.05 | 14000 | 3.8136          |
-| 1.5517        | 31.12 | 15000 | 4.1348          |
-| 1.4453        | 33.2  | 16000 | 3.8690          |
-| 1.3135        | 35.27 | 17000 | 3.6274          |
-| 1.2159        | 37.34 | 18000 | 3.5454          |
-| 1.1385        | 39.42 | 19000 | 3.5276          |
-| 1.0836        | 41.49 | 20000 | 3.5840          |
-| 1.025         | 43.57 | 21000 | 3.4585          |
-| 0.9184        | 45.64 | 22000 | 3.6106          |
-| 0.9576        | 47.72 | 23000 | nan             |
-| 0.8963        | 49.79 | 24000 | 3.4617          |
 ### Framework versions

 This model is a fine-tuned version of [bert-base-cased](https://huggingface.co/bert-base-cased) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 3.5202
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
+- train_batch_size: 32
+- eval_batch_size: 32
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 100
 ### Training results
+| Training Loss | Epoch | Step | Validation Loss |
+|:-------------:|:-----:|:----:|:---------------:|
+| 6.6432        | 3.23  | 100  | 5.8478          |
+| 5.651         | 6.45  | 200  | 5.5368          |
+| 5.1511        | 9.68  | 300  | 5.2206          |
+| 4.77          | 12.9  | 400  | 4.9162          |
+| 4.449         | 16.13 | 500  | 4.8133          |
+| 4.18          | 19.35 | 600  | 4.5716          |
+| 3.9485        | 22.58 | 700  | 4.3972          |
+| 3.6496        | 25.81 | 800  | 4.2725          |
+| 3.4384        | 29.03 | 900  | 4.1514          |
+| 3.2557        | 32.26 | 1000 | 4.1532          |
+| 3.0924        | 35.48 | 1100 | 3.9699          |
+| 2.8789        | 38.71 | 1200 | 3.8153          |
+| 2.7001        | 41.94 | 1300 | 3.8936          |
+| 2.5654        | 45.16 | 1400 | 3.8185          |
+| 2.4543        | 48.39 | 1500 | 3.9040          |
+| 2.2817        | 51.61 | 1600 | 3.7283          |
+| 2.2239        | 54.84 | 1700 | 3.6337          |
+| 2.1119        | 58.06 | 1800 | 3.7746          |
+| 1.9952        | 61.29 | 1900 | 3.5909          |
+| 1.9466        | 64.52 | 2000 | 3.5679          |
+| 1.8244        | 67.74 | 2100 | 3.6370          |
+| 1.7837        | 70.97 | 2200 | 3.6295          |
+| 1.6972        | 74.19 | 2300 | 3.6373          |
+| 1.6845        | 77.42 | 2400 | 3.4213          |
+| 1.6453        | 80.65 | 2500 | 3.5497          |
+| 1.5759        | 83.87 | 2600 | 3.5886          |
+| 1.5506        | 87.1  | 2700 | 3.4016          |
+| 1.5294        | 90.32 | 2800 | 3.3665          |
+| 1.4915        | 93.55 | 2900 | 3.3038          |
+| 1.5035        | 96.77 | 3000 | 3.3139          |
+| 1.4601        | 100.0 | 3100 | 3.5202          |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84103890cf77da69cd920356b8fa6cdf1cfb51a1a921cf15e54a96a63966a49c
 size 370513400

 version https://git-lfs.github.com/spec/v1
+oid sha256:79e350e6c03e20b0dc1aa79481ef385561fc742e4fea1f074e1a18edb5d72117
 size 370513400