Model save

Browse files

Files changed (3) hide show

README.md +25 -19
model.safetensors +1 -1
runs/Apr21_11-02-40_36f62ca2a075/events.out.tfevents.1713697362.36f62ca2a075.2070.0 +2 -2

README.md CHANGED Viewed

@@ -1,8 +1,8 @@
 ---
 license: apache-2.0
 tags:
 - generated_from_trainer
-base_model: bert-large-cased
 model-index:
 - name: art-des-bert-large-cased
   results: []
@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [bert-large-cased](https://huggingface.co/bert-large-cased) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.7025
 ## Model description
@@ -38,29 +38,35 @@ The following hyperparameters were used during training:
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 100
 ### Training results
-| Training Loss | Epoch | Step  | Validation Loss |
-|:-------------:|:-----:|:-----:|:---------------:|
-| 1.6755        | 6.49  | 1000  | 1.6113          |
-| 1.1162        | 12.99 | 2000  | 1.5335          |
-| 0.8664        | 19.48 | 3000  | 1.4363          |
-| 0.6844        | 25.97 | 4000  | 1.5348          |
-| 0.5577        | 32.47 | 5000  | 1.4426          |
-| 0.4742        | 38.96 | 6000  | 1.6470          |
-| 0.3975        | 45.45 | 7000  | 1.4066          |
-| 0.34          | 51.95 | 8000  | 1.4474          |
-| 0.2929        | 58.44 | 9000  | 1.6889          |
-| 0.2661        | 64.94 | 10000 | 1.6851          |
-| 0.2292        | 71.43 | 11000 | 1.5536          |
-| 0.2058        | 77.92 | 12000 | 1.6485          |
-| 0.1989        | 84.42 | 13000 | 1.7446          |
-| 0.1619        | 90.91 | 14000 | 1.6084          |
-| 0.1588        | 97.4  | 15000 | 1.7025          |
 ### Framework versions

 ---
 license: apache-2.0
+base_model: bert-large-cased
 tags:
 - generated_from_trainer
 model-index:
 - name: art-des-bert-large-cased
   results: []
 This model is a fine-tuned version of [bert-large-cased](https://huggingface.co/bert-large-cased) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.2776
 ## Model description
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
+- gradient_accumulation_steps: 8
+- total_train_batch_size: 64
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 100
 ### Training results
+| Training Loss | Epoch | Step | Validation Loss |
+|:-------------:|:-----:|:----:|:---------------:|
+| 1.8053        | 5.19  | 100  | 1.4663          |
+| 1.3212        | 10.39 | 200  | 1.3795          |
+| 1.0223        | 15.58 | 300  | 1.3545          |
+| 0.8991        | 20.78 | 400  | 1.3239          |
+| 0.7579        | 25.97 | 500  | 1.3276          |
+| 0.6554        | 31.17 | 600  | 1.3435          |
+| 0.5786        | 36.36 | 700  | 1.2276          |
+| 0.5386        | 41.56 | 800  | 1.1930          |
+| 0.479         | 46.75 | 900  | 1.2091          |
+| 0.4336        | 51.95 | 1000 | 1.0554          |
+| 0.3776        | 57.14 | 1100 | 1.4044          |
+| 0.3582        | 62.34 | 1200 | 1.1651          |
+| 0.3343        | 67.53 | 1300 | 1.2394          |
+| 0.3093        | 72.73 | 1400 | 1.1313          |
+| 0.2952        | 77.92 | 1500 | 1.2107          |
+| 0.2845        | 83.12 | 1600 | 1.2804          |
+| 0.2585        | 88.31 | 1700 | 1.1700          |
+| 0.2548        | 93.51 | 1800 | 1.2391          |
+| 0.2581        | 98.7  | 1900 | 1.2776          |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d97d1b52404fbf295d0973a32d13d0db2420612972f6ca43c0104a41ed5e8aab
 size 1334488416

 version https://git-lfs.github.com/spec/v1
+oid sha256:74ae0550418023c2aff0e69be9c12051ba04e4189ec1154d0da2906a844ef969
 size 1334488416

runs/Apr21_11-02-40_36f62ca2a075/events.out.tfevents.1713697362.36f62ca2a075.2070.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2f93a2ccf47b3d0dab4b2a0497c7bb614cce8167efe0f91def7758fadd1ecf37
-size 13424

 version https://git-lfs.github.com/spec/v1
+oid sha256:670a5e04da1da9ab9a4be4844e304ef54f2aa8a7457c1dfadd017144d01c488c
+size 14260