Danik51002
/

finetuned

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

Danik51002 commited on Mar 21, 2022

Commit

849f94c

·

1 Parent(s): ce1c33c

update model card README.md

Files changed (1) hide show

README.md +5 -5

README.md CHANGED Viewed

@@ -31,15 +31,15 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
-- train_batch_size: 32
-- eval_batch_size: 32
 - seed: 42
-- gradient_accumulation_steps: 16
-- total_train_batch_size: 512
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 15
-- num_epochs: 100
 ### Training results

 The following hyperparameters were used during training:
 - learning_rate: 5e-05
+- train_batch_size: 42
+- eval_batch_size: 42
 - seed: 42
+- gradient_accumulation_steps: 20
+- total_train_batch_size: 840
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 15
+- num_epochs: 300
 ### Training results