nellaep
/

SoulTypeModel

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

nellaep commited on Jul 7, 2025

Commit

e252e29

·

verified ·

1 Parent(s): b5f78f8

End of training

Files changed (2) hide show

README.md +4 -3
generation_config.json +1 -1

README.md CHANGED Viewed

@@ -34,12 +34,13 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
-- train_batch_size: 2
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- num_epochs: 3
 ### Training results
@@ -47,7 +48,7 @@ The following hyperparameters were used during training:
 ### Framework versions
-- Transformers 4.52.4
 - Pytorch 2.6.0+cu124
 - Datasets 2.14.4
 - Tokenizers 0.21.2

 The following hyperparameters were used during training:
 - learning_rate: 5e-05
+- train_batch_size: 4
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- num_epochs: 4
+- mixed_precision_training: Native AMP
 ### Training results
 ### Framework versions
+- Transformers 4.53.0
 - Pytorch 2.6.0+cu124
 - Datasets 2.14.4
 - Tokenizers 0.21.2

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "_from_model_config": true,
   "bos_token_id": 50256,
   "eos_token_id": 50256,
-  "transformers_version": "4.52.4"
 }

   "_from_model_config": true,
   "bos_token_id": 50256,
   "eos_token_id": 50256,
+  "transformers_version": "4.53.0"
 }