End of training

Files changed (4) hide show

README.md CHANGED Viewed

@@ -4,6 +4,8 @@ license: apache-2.0
 base_model: t5-small
 tags:
 - generated_from_trainer
 model-index:
 - name: t5-small-finetuned-news
   results: []
@@ -15,6 +17,13 @@ should probably proofread and complete it, then remove this comment. -->
 # t5-small-finetuned-news
 This model is a fine-tuned version of [t5-small](https://huggingface.co/t5-small) on an unknown dataset.
 ## Model description
@@ -37,21 +46,22 @@ The following hyperparameters were used during training:
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
-- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 1
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:-------:|:-------:|:-------:|:---------:|:-------:|
-| No log        | 1.0   | 332  | 1.3274          | 54.9613 | 35.0144 | 52.1856 | 52.1436   | 16.152  |
 ### Framework versions
-- Transformers 4.44.2
-- Pytorch 2.4.1+cu121
-- Datasets 3.0.1
-- Tokenizers 0.19.1

 base_model: t5-small
 tags:
 - generated_from_trainer
+metrics:
+- rouge
 model-index:
 - name: t5-small-finetuned-news
   results: []
 # t5-small-finetuned-news
 This model is a fine-tuned version of [t5-small](https://huggingface.co/t5-small) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 1.5749
+- Rouge1: 43.7874
+- Rouge2: 24.2639
+- Rougel: 40.5888
+- Rougelsum: 40.5008
+- Gen Len: 18.6475
 ## Model description
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
+- optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- num_epochs: 2
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:-------:|:-------:|:-------:|:---------:|:-------:|
+| No log        | 1.0   | 175  | 1.5966          | 42.795  | 23.6707 | 39.6859 | 39.6641   | 18.6115 |
+| No log        | 2.0   | 350  | 1.5749          | 43.7874 | 24.2639 | 40.5888 | 40.5008   | 18.6475 |
 ### Framework versions
+- Transformers 4.46.2
+- Pytorch 2.5.1+cu121
+- Datasets 3.1.0
+- Tokenizers 0.20.3

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
-  "transformers_version": "4.44.2"
 }

   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
+  "transformers_version": "4.46.2"
 }

runs/Nov18_13-24-15_2318ff6358b5/events.out.tfevents.1731936273.2318ff6358b5.481.1 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2891c1aceea00d1e4e5ed45c2bb00c08bb841e20c509ec1f136148d5a05522e1
-size 12533

 version https://git-lfs.github.com/spec/v1
+oid sha256:010ab9003c7df38aa42f0a10964c00c39d0bcdf60ec303c56485ed8857f1dacc
+size 13412

tokenizer.json CHANGED Viewed

@@ -2,11 +2,18 @@
   "version": "1.0",
   "truncation": {
     "direction": "Right",
-    "max_length": 128,
     "strategy": "LongestFirst",
     "stride": 0
   },
-  "padding": null,
   "added_tokens": [
     {
       "id": 0,

   "version": "1.0",
   "truncation": {
     "direction": "Right",
+    "max_length": 512,
     "strategy": "LongestFirst",
     "stride": 0
   },
+  "padding": {
+    "strategy": "BatchLongest",
+    "direction": "Right",
+    "pad_to_multiple_of": null,
+    "pad_id": 0,
+    "pad_type_id": 0,
+    "pad_token": "<pad>"
+  },
   "added_tokens": [
     {
       "id": 0,