Model save

Files changed (3) hide show

README.md CHANGED Viewed

@@ -1,5 +1,4 @@
 ---
-library_name: transformers
 license: apache-2.0
 base_model: google/flan-t5-base
 tags:
@@ -51,7 +50,7 @@ The following hyperparameters were used during training:
 - train_batch_size: 4
 - eval_batch_size: 4
 - seed: 42
-- optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - num_epochs: 2
@@ -59,13 +58,13 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Rouge                                                   | Bleu1 | Bleu2 | Bleu3 | Bleu4 | Meteor | Bertscore Precision | Bertscore Recall | Bertscore F1 | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:-------------------------------------------------------:|:-----:|:-----:|:-----:|:-----:|:------:|:-------------------:|:----------------:|:------------:|:-------:|
-| 1.83          | 1.0   | 378  | nan             | {'rouge1': 0, 'rouge2': 0, 'rougeL': 0, 'rougeLsum': 0} | 0     | 0     | 0     | 0     | 0      | 0                   | 0                | 0            | 0       |
 | 0.0           | 2.0   | 756  | nan             | {'rouge1': 0, 'rouge2': 0, 'rougeL': 0, 'rougeLsum': 0} | 0     | 0     | 0     | 0     | 0      | 0                   | 0                | 0            | 0       |
 ### Framework versions
-- Transformers 4.46.3
-- Pytorch 2.4.1+cu121
-- Datasets 2.20.0
-- Tokenizers 0.20.3

 ---
 license: apache-2.0
 base_model: google/flan-t5-base
 tags:
 - train_batch_size: 4
 - eval_batch_size: 4
 - seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 2
 | Training Loss | Epoch | Step | Validation Loss | Rouge                                                   | Bleu1 | Bleu2 | Bleu3 | Bleu4 | Meteor | Bertscore Precision | Bertscore Recall | Bertscore F1 | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:-------------------------------------------------------:|:-----:|:-----:|:-----:|:-----:|:------:|:-------------------:|:----------------:|:------------:|:-------:|
+| 1.9328        | 1.0   | 378  | nan             | {'rouge1': 0, 'rouge2': 0, 'rougeL': 0, 'rougeLsum': 0} | 0     | 0     | 0     | 0     | 0      | 0                   | 0                | 0            | 0       |
 | 0.0           | 2.0   | 756  | nan             | {'rouge1': 0, 'rouge2': 0, 'rougeL': 0, 'rougeLsum': 0} | 0     | 0     | 0     | 0     | 0      | 0                   | 0                | 0            | 0       |
 ### Framework versions
+- Transformers 4.40.0
+- Pytorch 2.2.0+cu118
+- Datasets 3.0.0
+- Tokenizers 0.19.1

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
-  "transformers_version": "4.46.3"
 }

   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
+  "transformers_version": "4.40.0"
 }

runs/Dec11_00-23-57_dgx01/events.out.tfevents.1733851440.dgx01.1240243.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d6b8ed9eb137432eb3fbc68c91501ba94ee698872a4be6a4726df07ef4bc9f03
-size 6687

 version https://git-lfs.github.com/spec/v1
+oid sha256:0c2991dc08a1901b10ae51d6acad050bad0cb3d19c13541c331aac9e05b13f52
+size 7999