Training on SAMSum complete!

Files changed (10) hide show

README.md CHANGED Viewed

@@ -2,7 +2,10 @@
 license: mit
 base_model: facebook/bart-large-cnn
 tags:
 - generated_from_trainer
 model-index:
 - name: bart-large-samsum
   results: []
@@ -15,7 +18,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [facebook/bart-large-cnn](https://huggingface.co/facebook/bart-large-cnn) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.3576
 ## Model description
@@ -46,17 +53,14 @@ The following hyperparameters were used during training:
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss |
-|:-------------:|:-----:|:----:|:---------------:|
-| No log        | 0.22  | 200  | 1.5108          |
-| No log        | 0.43  | 400  | 1.4143          |
-| 1.3989        | 0.65  | 600  | 1.4067          |
-| 1.3989        | 0.87  | 800  | 1.3576          |
 ### Framework versions
-- Transformers 4.35.2
 - Pytorch 2.1.0+cu121
-- Datasets 2.17.0
 - Tokenizers 0.15.2

 license: mit
 base_model: facebook/bart-large-cnn
 tags:
+- summarization
 - generated_from_trainer
+metrics:
+- rouge
 model-index:
 - name: bart-large-samsum
   results: []
 This model is a fine-tuned version of [facebook/bart-large-cnn](https://huggingface.co/facebook/bart-large-cnn) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.3770
+- Rouge1: 0.3912
+- Rouge2: 0.1962
+- Rougel: 0.2988
+- Rougelsum: 0.2989
 ## Model description
 ### Training results
+| Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum |
+|:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|
+| 1.3353        | 0.54  | 500  | 1.4306          | 0.3925 | 0.1959 | 0.3017 | 0.3012    |
 ### Framework versions
+- Transformers 4.38.2
 - Pytorch 2.1.0+cu121
+- Datasets 2.18.0
 - Tokenizers 0.15.2

config.json CHANGED Viewed

@@ -64,7 +64,7 @@
     }
   },
   "torch_dtype": "float32",
-  "transformers_version": "4.35.2",
   "use_cache": true,
   "vocab_size": 50264
 }

     }
   },
   "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
   "use_cache": true,
   "vocab_size": 50264
 }

generation_config.json CHANGED Viewed

@@ -1,5 +1,4 @@
 {
-  "_from_model_config": true,
   "bos_token_id": 0,
   "decoder_start_token_id": 2,
   "early_stopping": true,
@@ -12,5 +11,5 @@
   "no_repeat_ngram_size": 3,
   "num_beams": 4,
   "pad_token_id": 1,
-  "transformers_version": "4.35.2"
 }

 {
   "bos_token_id": 0,
   "decoder_start_token_id": 2,
   "early_stopping": true,
   "no_repeat_ngram_size": 3,
   "num_beams": 4,
   "pad_token_id": 1,
+  "transformers_version": "4.38.2"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f90884b9f26fbacd10a16efa74ba9c99a5e1c100dcecc254dc5d132aa247ff8c
 size 1625422896

 version https://git-lfs.github.com/spec/v1
+oid sha256:dcbf5bbf77eff9ce3295c883d4023d244c28a0f36a91467e63d4c8bd3e5d2169
 size 1625422896

runs/Mar10_13-59-42_5b0bd46df8c8/events.out.tfevents.1710080014.5b0bd46df8c8.160.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:2cffa519316b11d5084283274d15ca9ae40d759d0beb7b12fd13a876848215d8
+size 6097

runs/Mar10_14-15-05_5b0bd46df8c8/events.out.tfevents.1710080109.5b0bd46df8c8.160.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:1fa5a521692d37688067ca3dd68e73496740821649ed436c0c5afdc91769d64b
+size 6371

runs/Mar10_14-34-28_5b0bd46df8c8/events.out.tfevents.1710081275.5b0bd46df8c8.160.2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:04e0d47ad4211afd8a35159eef30f20abed546c50aed468aff6db27c8e94c0f2
+size 8422

runs/Mar10_14-34-28_5b0bd46df8c8/events.out.tfevents.1710085463.5b0bd46df8c8.160.3 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:cc61b98be62c86473effb913ecc7ea3424dcd889e91b675a57a162a294cb6021
+size 562

tokenizer.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "version": "1.0",
   "truncation": {
     "direction": "Right",
-    "max_length": 1024,
     "strategy": "LongestFirst",
     "stride": 0
   },

   "version": "1.0",
   "truncation": {
     "direction": "Right",
+    "max_length": 128,
     "strategy": "LongestFirst",
     "stride": 0
   },

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cf4e43fc370f522ca0c4def80371444d19824f149183f529799ef896bdea7b5b
-size 4536

 version https://git-lfs.github.com/spec/v1
+oid sha256:7dcc13853312b158aabbb2c79d0dff71aa98ca9e0fef4e82a30d7e03a3e3c1ad
+size 5048