End of training

Browse files

Files changed (7) hide show

README.md +30 -31
config.json +1 -1
label_encoder.joblib +1 -1
model.safetensors +2 -2
runs/Nov19_17-56-46_credentek-desktop/events.out.tfevents.1732019207.credentek-desktop.4407.0 +3 -0
runs/Nov19_17-56-46_credentek-desktop/events.out.tfevents.1732029422.credentek-desktop.4407.1 +3 -0
training_args.bin +2 -2

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [bert-base-uncased](https://huggingface.co/bert-base-uncased) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.6836
 ## Model description
@@ -39,7 +39,7 @@ The following hyperparameters were used during training:
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
-- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 25
@@ -47,36 +47,35 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step  | Validation Loss |
 |:-------------:|:-----:|:-----:|:---------------:|
-| 1.8063        | 1.0   | 2163  | 1.4250          |
-| 0.9374        | 2.0   | 4326  | 0.8589          |
-| 0.743         | 3.0   | 6489  | 0.7322          |
-| 0.6568        | 4.0   | 8652  | 0.7122          |
-| 0.5919        | 5.0   | 10815 | 0.7026          |
-| 0.5826        | 6.0   | 12978 | 0.6974          |
-| 0.5772        | 7.0   | 15141 | 0.6856          |
-| 0.5479        | 8.0   | 17304 | 0.6836          |
-| 0.5541        | 9.0   | 19467 | 0.7033          |
-| 0.5025        | 10.0  | 21630 | 0.6976          |
-| 0.5322        | 11.0  | 23793 | 0.7045          |
-| 0.5438        | 12.0  | 25956 | 0.7032          |
-| 0.531         | 13.0  | 28119 | 0.7244          |
-| 0.5139        | 14.0  | 30282 | 0.7449          |
-| 0.5157        | 15.0  | 32445 | 0.7325          |
-| 0.5027        | 16.0  | 34608 | 0.7330          |
-| 0.5104        | 17.0  | 36771 | 0.7469          |
-| 0.4872        | 18.0  | 38934 | 0.7384          |
-| 0.4824        | 19.0  | 41097 | 0.7281          |
-| 0.4987        | 20.0  | 43260 | 0.7474          |
-| 0.5055        | 21.0  | 45423 | 0.7670          |
-| 0.501         | 22.0  | 47586 | 0.7483          |
-| 0.493         | 23.0  | 49749 | 0.7518          |
-| 0.4986        | 24.0  | 51912 | 0.7529          |
-| 0.4696        | 25.0  | 54075 | 0.7587          |
 ### Framework versions
-- Transformers 4.44.2
-- Pytorch 2.4.1+cu121
-- Datasets 2.21.0
-- Tokenizers 0.19.1

 This model is a fine-tuned version of [bert-base-uncased](https://huggingface.co/bert-base-uncased) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.6760
 ## Model description
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
+- optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - num_epochs: 25
 | Training Loss | Epoch | Step  | Validation Loss |
 |:-------------:|:-----:|:-----:|:---------------:|
+| 1.7046        | 1.0   | 2163  | 1.3254          |
+| 0.9319        | 2.0   | 4326  | 0.8316          |
+| 0.748         | 3.0   | 6489  | 0.7299          |
+| 0.6583        | 4.0   | 8652  | 0.6946          |
+| 0.6182        | 5.0   | 10815 | 0.6901          |
+| 0.5848        | 6.0   | 12978 | 0.6760          |
+| 0.5789        | 7.0   | 15141 | 0.6797          |
+| 0.543         | 8.0   | 17304 | 0.6948          |
+| 0.5364        | 9.0   | 19467 | 0.7041          |
+| 0.5203        | 10.0  | 21630 | 0.7032          |
+| 0.4974        | 11.0  | 23793 | 0.7076          |
+| 0.519         | 12.0  | 25956 | 0.7232          |
+| 0.5235        | 13.0  | 28119 | 0.7073          |
+| 0.5332        | 14.0  | 30282 | 0.7254          |
+| 0.5109        | 15.0  | 32445 | 0.7158          |
+| 0.5031        | 16.0  | 34608 | 0.7207          |
+| 0.5169        | 17.0  | 36771 | 0.7369          |
+| 0.4915        | 18.0  | 38934 | 0.7322          |
+| 0.4975        | 19.0  | 41097 | 0.7422          |
+| 0.4961        | 20.0  | 43260 | 0.7533          |
+| 0.4692        | 21.0  | 45423 | 0.7670          |
+| 0.5122        | 22.0  | 47586 | 0.7420          |
+| 0.5024        | 23.0  | 49749 | 0.7388          |
+| 0.4867        | 24.0  | 51912 | 0.7470          |
+| 0.4884        | 25.0  | 54075 | 0.7474          |
 ### Framework versions
+- Transformers 4.46.2
+- Pytorch 2.5.1+cu124
+- Tokenizers 0.20.3

config.json CHANGED Viewed

@@ -360,7 +360,7 @@
   "position_embedding_type": "absolute",
   "problem_type": "single_label_classification",
   "torch_dtype": "float32",
-  "transformers_version": "4.44.2",
   "type_vocab_size": 2,
   "use_cache": true,
   "vocab_size": 30522

   "position_embedding_type": "absolute",
   "problem_type": "single_label_classification",
   "torch_dtype": "float32",
+  "transformers_version": "4.46.2",
   "type_vocab_size": 2,
   "use_cache": true,
   "vocab_size": 30522

label_encoder.joblib CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c6c8b9d31a3847bd1b68b12505ffe4c3041de30a4cdc249180c2f94c4da0ed16
 size 19815

 version https://git-lfs.github.com/spec/v1
+oid sha256:9ca8601805eca2d956a713605f0af78cd550827649415539151611fe9974e121
 size 19815

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2788ca413f68085b0049a72f1004e91590300c2043f687055f8ec81341267933
-size 438546164

 version https://git-lfs.github.com/spec/v1
+oid sha256:7fd8c1e6b69dd453ef6517645ef9ae8dee8c9b07d2341a7130c54fba5e84dd59
+size 438469264

runs/Nov19_17-56-46_credentek-desktop/events.out.tfevents.1732019207.credentek-desktop.4407.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ab6f73f19afc39a9a493f16f50ce66c83c93b744d2b0fa42ae1fc7ea22c77e73
+size 45685

runs/Nov19_17-56-46_credentek-desktop/events.out.tfevents.1732029422.credentek-desktop.4407.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:71f3a015ce9f2c4c25a9c8ee2410f3a87e9b5e01437f1b6680696e013588c130
+size 364

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fe5cce021d090bbd2fb8a0c8804420b2b5d72fa8ea557a4522518a24cc043922
-size 5304

 version https://git-lfs.github.com/spec/v1
+oid sha256:6964a011fa1856707121d6210c9e7842841fb41f6bb057dd9fc442eb4bf31501
+size 5368