BienKieu
/

codeT5Plus_new

text2text-generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

BienKieu commited on Oct 20, 2025

Commit

ab18d02

·

verified ·

1 Parent(s): f99a288

Model save

Files changed (2) hide show

README.md +5 -6
generation_config.json +4 -2

README.md CHANGED Viewed

@@ -34,13 +34,12 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
-- train_batch_size: 16
 - eval_batch_size: 4
 - seed: 42
-- optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - num_epochs: 8
-- mixed_precision_training: Native AMP
 ### Training results
@@ -48,7 +47,7 @@ The following hyperparameters were used during training:
 ### Framework versions
-- Transformers 4.51.3
-- Pytorch 2.6.0+cu124
 - Datasets 3.6.0
-- Tokenizers 0.21.2

 The following hyperparameters were used during training:
 - learning_rate: 5e-05
+- train_batch_size: 8
 - eval_batch_size: 4
 - seed: 42
+- optimizer: Use adamw_torch_fused with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - num_epochs: 8
 ### Training results
 ### Framework versions
+- Transformers 4.56.1
+- Pytorch 2.8.0+cu128
 - Datasets 3.6.0
+- Tokenizers 0.22.0

generation_config.json CHANGED Viewed

@@ -2,7 +2,9 @@
   "_from_model_config": true,
   "bos_token_id": 1,
   "decoder_start_token_id": 0,
-  "eos_token_id": 2,
   "pad_token_id": 0,
-  "transformers_version": "4.51.3"
 }

   "_from_model_config": true,
   "bos_token_id": 1,
   "decoder_start_token_id": 0,
+  "eos_token_id": [
+    2
+  ],
   "pad_token_id": 0,
+  "transformers_version": "4.56.1"
 }