| { |
| "best_global_step": 1500, |
| "best_metric": 0.7726759314537048, |
| "best_model_checkpoint": "/scratch/cej2vh/tuning_run_3/checkpoint-1500", |
| "epoch": 2.0, |
| "eval_steps": 250, |
| "global_step": 1500, |
| "is_hyper_param_search": false, |
| "is_local_process_zero": true, |
| "is_world_process_zero": true, |
| "log_history": [ |
| { |
| "epoch": 0.3333333333333333, |
| "grad_norm": 28.25, |
| "learning_rate": 1.668e-06, |
| "loss": 1.3161, |
| "step": 250 |
| }, |
| { |
| "epoch": 0.3333333333333333, |
| "eval_loss": 1.0246225595474243, |
| "eval_runtime": 992.9312, |
| "eval_samples_per_second": 135.412, |
| "eval_steps_per_second": 16.927, |
| "step": 250 |
| }, |
| { |
| "epoch": 0.6666666666666666, |
| "grad_norm": 22.5, |
| "learning_rate": 1.3346666666666667e-06, |
| "loss": 0.917, |
| "step": 500 |
| }, |
| { |
| "epoch": 0.6666666666666666, |
| "eval_loss": 0.8675954341888428, |
| "eval_runtime": 991.1245, |
| "eval_samples_per_second": 135.659, |
| "eval_steps_per_second": 16.958, |
| "step": 500 |
| }, |
| { |
| "epoch": 1.0, |
| "grad_norm": 23.5, |
| "learning_rate": 1.0013333333333335e-06, |
| "loss": 0.838, |
| "step": 750 |
| }, |
| { |
| "epoch": 1.0, |
| "eval_loss": 0.8041071891784668, |
| "eval_runtime": 990.0454, |
| "eval_samples_per_second": 135.807, |
| "eval_steps_per_second": 16.976, |
| "step": 750 |
| }, |
| { |
| "epoch": 1.3333333333333333, |
| "grad_norm": 20.375, |
| "learning_rate": 6.68e-07, |
| "loss": 0.7618, |
| "step": 1000 |
| }, |
| { |
| "epoch": 1.3333333333333333, |
| "eval_loss": 0.7806967496871948, |
| "eval_runtime": 991.3471, |
| "eval_samples_per_second": 135.629, |
| "eval_steps_per_second": 16.954, |
| "step": 1000 |
| }, |
| { |
| "epoch": 1.6666666666666665, |
| "grad_norm": 32.25, |
| "learning_rate": 3.3466666666666665e-07, |
| "loss": 0.7689, |
| "step": 1250 |
| }, |
| { |
| "epoch": 1.6666666666666665, |
| "eval_loss": 0.7735164761543274, |
| "eval_runtime": 993.4679, |
| "eval_samples_per_second": 135.339, |
| "eval_steps_per_second": 16.918, |
| "step": 1250 |
| }, |
| { |
| "epoch": 2.0, |
| "grad_norm": 32.5, |
| "learning_rate": 1.3333333333333333e-09, |
| "loss": 0.7553, |
| "step": 1500 |
| }, |
| { |
| "epoch": 2.0, |
| "eval_loss": 0.7726759314537048, |
| "eval_runtime": 992.1791, |
| "eval_samples_per_second": 135.515, |
| "eval_steps_per_second": 16.939, |
| "step": 1500 |
| } |
| ], |
| "logging_steps": 250, |
| "max_steps": 1500, |
| "num_input_tokens_seen": 0, |
| "num_train_epochs": 2, |
| "save_steps": 250, |
| "stateful_callbacks": { |
| "TrainerControl": { |
| "args": { |
| "should_epoch_stop": false, |
| "should_evaluate": false, |
| "should_log": false, |
| "should_save": true, |
| "should_training_stop": true |
| }, |
| "attributes": {} |
| } |
| }, |
| "total_flos": 9300214077751296.0, |
| "train_batch_size": 8, |
| "trial_name": null, |
| "trial_params": null |
| } |
|
|