Training in progress, epoch 1

Browse files

Files changed (5) hide show

README.md +23 -19
config.json +1 -1
model.safetensors +1 -1
runs/May16_18-59-34_tardis/events.out.tfevents.1715882775.tardis.5553.0 +3 -0
training_args.bin +2 -2

README.md CHANGED Viewed

@@ -18,14 +18,15 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google-bert/bert-base-cased](https://huggingface.co/google-bert/bert-base-cased) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.4624
-- F1 Macro: 0.9016
-- F1: 0.9343
-- F1 Neg: 0.8689
-- Acc: 0.9125
-- Prec: 0.9432
-- Recall: 0.9257
-- Mcc: 0.8036
 ## Model description
@@ -48,25 +49,28 @@ The following hyperparameters were used during training:
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 5
 - mixed_precision_training: Native AMP
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss | F1 Macro | F1     | F1 Neg | Acc    | Prec   | Recall | Mcc    |
-|:-------------:|:-----:|:----:|:---------------:|:--------:|:------:|:------:|:------:|:------:|:------:|:------:|
-| No log        | 1.0   | 474  | 0.3773          | 0.8286   | 0.8676 | 0.7896 | 0.8375 | 0.9064 | 0.8320 | 0.6623 |
-| 0.4662        | 2.0   | 948  | 0.4197          | 0.8638   | 0.9070 | 0.8205 | 0.8775 | 0.8819 | 0.9336 | 0.7305 |
-| 0.3045        | 3.0   | 1422 | 0.4950          | 0.8808   | 0.9219 | 0.8397 | 0.895  | 0.8794 | 0.9688 | 0.7711 |
-| 0.2105        | 4.0   | 1896 | 0.4999          | 0.8817   | 0.9175 | 0.8459 | 0.8925 | 0.9019 | 0.9336 | 0.7644 |
-| 0.1246        | 5.0   | 2370 | 0.5317          | 0.8889   | 0.9198 | 0.8581 | 0.8975 | 0.9216 | 0.9180 | 0.7779 |
 ### Framework versions
-- Transformers 4.40.1
-- Pytorch 2.3.0+cu121
 - Datasets 2.18.0
-- Tokenizers 0.19.1

 This model is a fine-tuned version of [google-bert/bert-base-cased](https://huggingface.co/google-bert/bert-base-cased) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.8345
+- F1 Macro: 0.9216
+- F1: 0.9508
+- F1 Neg: 0.8924
+- Acc: 0.9325
+- Prec: 0.9321
+- Recall: 0.9703
+- Mcc: 0.8451
+- Millor Epoca: 5
 ## Model description
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
+- distributed_type: multi-GPU
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 7
 - mixed_precision_training: Native AMP
 ### Training results
+| Training Loss | Epoch | Step  | Validation Loss | F1 Macro | F1     | F1 Neg | Acc    | Prec   | Recall | Mcc    | Millor Epoca |
+|:-------------:|:-----:|:-----:|:---------------:|:--------:|:------:|:------:|:------:|:------:|:------:|:------:|:------------:|
+| 0.2657        | 1.0   | 1698  | 0.3480          | 0.9031   | 0.9370 | 0.8692 | 0.915  | 0.9336 | 0.9405 | 0.8063 | 1            |
+| 0.0983        | 2.0   | 3396  | 0.5281          | 0.9039   | 0.9366 | 0.8712 | 0.915  | 0.9401 | 0.9331 | 0.8078 | 2            |
+| 0.043         | 3.0   | 5094  | 0.5741          | 0.9016   | 0.9343 | 0.8689 | 0.9125 | 0.9432 | 0.9257 | 0.8036 | 2            |
+| 0.0239        | 4.0   | 6792  | 0.8465          | 0.9115   | 0.9460 | 0.8770 | 0.925  | 0.9164 | 0.9777 | 0.8282 | 4            |
+| 0.0134        | 5.0   | 8490  | 0.8345          | 0.9216   | 0.9508 | 0.8924 | 0.9325 | 0.9321 | 0.9703 | 0.8451 | 5            |
+| 0.0104        | 6.0   | 10188 | 0.9451          | 0.9108   | 0.9431 | 0.8784 | 0.9225 | 0.9312 | 0.9554 | 0.8223 | 5            |
+| 0.0           | 7.0   | 11886 | 0.9742          | 0.9081   | 0.9412 | 0.875  | 0.92   | 0.9309 | 0.9517 | 0.8167 | 5            |
 ### Framework versions
+- Transformers 4.38.2
+- Pytorch 2.2.1+cu121
 - Datasets 2.18.0
+- Tokenizers 0.15.2

config.json CHANGED Viewed

@@ -28,7 +28,7 @@
   "position_embedding_type": "absolute",
   "problem_type": "single_label_classification",
   "torch_dtype": "float32",
-  "transformers_version": "4.40.1",
   "type_vocab_size": 2,
   "use_cache": true,
   "vocab_size": 28996

   "position_embedding_type": "absolute",
   "problem_type": "single_label_classification",
   "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
   "type_vocab_size": 2,
   "use_cache": true,
   "vocab_size": 28996

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:52ef99193379bb66736f9fcde55f4e1c9cd90617c97c3cfb5253840e95230067
 size 433270768

 version https://git-lfs.github.com/spec/v1
+oid sha256:3e0b9d9421b6a0b14b0c068edbaabceffff3b3bcd750771ff210bf3cedf82f9f
 size 433270768

runs/May16_18-59-34_tardis/events.out.tfevents.1715882775.tardis.5553.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f0034ae88429085d79aaff3933cebb963e5ce47c3f1fc0df3b0cd55f06f067b0
+size 6416

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a1d1296427c77341cc74b24d166737e59dfaf8a0d16b9a420f916fc6aea03841
-size 5176

 version https://git-lfs.github.com/spec/v1
+oid sha256:f3a427e58d86f0dfca403b8841b461deb6177fc29e874c66654c576085c23201
+size 5112