jda
/

opt

@@ -1,6 +1,5 @@
 ---
 license: other
-base_model: facebook/opt-350m
 tags:
 - generated_from_trainer
 model-index:
@@ -33,18 +32,17 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0005
-- train_batch_size: 4
-- eval_batch_size: 32
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_steps: 1000
 - num_epochs: 1
-- mixed_precision_training: Native AMP
 ### Framework versions
-- Transformers 4.38.2
-- Pytorch 2.2.1+cu121
-- Datasets 2.18.0
-- Tokenizers 0.15.2

 ---
 license: other
 tags:
 - generated_from_trainer
 model-index:
 The following hyperparameters were used during training:
 - learning_rate: 0.0005
+- train_batch_size: 8
+- eval_batch_size: 64
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_steps: 1000
 - num_epochs: 1
 ### Framework versions
+- Transformers 4.30.2
+- Pytorch 1.12.1
+- Datasets 2.13.2
+- Tokenizers 0.13.3