ahmed792002/Finetuning_T55_Paraphrase_Generation

Files changed (6) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [t5-base](https://huggingface.co/t5-base) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.5638
 ## Model description
@@ -36,24 +36,23 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
-- train_batch_size: 8
-- eval_batch_size: 8
 - seed: 42
-- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 2
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 0.6362        | 1.0   | 2729 | 0.5774          |
-| 0.5905        | 2.0   | 5458 | 0.5638          |
 ### Framework versions
-- Transformers 4.45.1
-- Pytorch 2.4.0
-- Datasets 3.0.1
-- Tokenizers 0.20.0

 This model is a fine-tuned version of [t5-base](https://huggingface.co/t5-base) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.1935
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
+- train_batch_size: 16
+- eval_batch_size: 16
 - seed: 42
+- optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- num_epochs: 1
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 0.2254        | 1.0   | 1365 | 0.1935          |
 ### Framework versions
+- Transformers 4.46.2
+- Pytorch 2.5.1+cu121
+- Datasets 3.1.0
+- Tokenizers 0.20.3

config.json CHANGED Viewed

@@ -55,7 +55,7 @@
     }
   },
   "torch_dtype": "float32",
-  "transformers_version": "4.45.1",
   "use_cache": true,
   "vocab_size": 32128
 }

     }
   },
   "torch_dtype": "float32",
+  "transformers_version": "4.46.2",
   "use_cache": true,
   "vocab_size": 32128
 }

generation_config.json CHANGED Viewed

@@ -3,5 +3,5 @@
   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
-  "transformers_version": "4.45.1"
 }

   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
+  "transformers_version": "4.46.2"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1e87e57d648d6cb40c09222ff6fd947cc8bd7e6d0f2b797577fc129f9c777780
 size 891644712

 version https://git-lfs.github.com/spec/v1
+oid sha256:fe99e4808da8e840ab96dd5f60f7b805db5dedc1ab386995e6995f64fb23c79f
 size 891644712

runs/Dec03_19-35-36_b7a3d3c0f34b/events.out.tfevents.1733254537.b7a3d3c0f34b.213.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:48ecb87991b37076bf41e9ccaf0f24d4757299709d3cbd8b8be8f6b0e21fa46f
+size 7004

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3e4a8f1fe49185d8111e38d9bbbd000731bf4277da59baaec3088ac3f43329c3
-size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:3a8f9d69ee7b3d72d94d6acc1fd176c735b895b5a44b95ccab6461be3e9f39e6
+size 5304