File size: 2,924 Bytes

d265c32
 
 
 
 
 
 
 
 
 
 
 
5b7eee6
d265c32
5b7eee6
d265c32
 
 
 
5b7eee6
d265c32
5b7eee6
d265c32
 
 
 
5b7eee6
d265c32
5b7eee6
d265c32
 
 
 
5b7eee6
 
 
 
d265c32
 
 
 
5b7eee6
d265c32
5b7eee6
d265c32
 
 
 
5b7eee6
d265c32
5b7eee6
d265c32
 
 
 
5b7eee6
d265c32
5b7eee6
d265c32
 
 
 
5b7eee6
 
 
 
d265c32
 
 
 
5b7eee6
d265c32
5b7eee6
d265c32
 
 
 
5b7eee6
d265c32
5b7eee6
d265c32
 
 
 
5b7eee6
d265c32
5b7eee6
d265c32
 
 
 
5b7eee6
 
 
 
d265c32
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
5b7eee6
d265c32

{
  "best_metric": null,
  "best_model_checkpoint": null,
  "epoch": 0.005580530150364285,
  "eval_steps": 3,
  "global_step": 9,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.0006200589055960316,
      "grad_norm": 0.5875879526138306,
      "learning_rate": 4.000000000000001e-06,
      "loss": 1.179,
      "step": 1
    },
    {
      "epoch": 0.0012401178111920632,
      "grad_norm": 0.2559925317764282,
      "learning_rate": 8.000000000000001e-06,
      "loss": 0.9296,
      "step": 2
    },
    {
      "epoch": 0.0018601767167880949,
      "grad_norm": 0.27975356578826904,
      "learning_rate": 1.2e-05,
      "loss": 0.8212,
      "step": 3
    },
    {
      "epoch": 0.0018601767167880949,
      "eval_loss": 1.0227885246276855,
      "eval_runtime": 47.9985,
      "eval_samples_per_second": 2.083,
      "eval_steps_per_second": 2.083,
      "step": 3
    },
    {
      "epoch": 0.0024802356223841263,
      "grad_norm": 0.4077853858470917,
      "learning_rate": 1.6000000000000003e-05,
      "loss": 0.9553,
      "step": 4
    },
    {
      "epoch": 0.0031002945279801583,
      "grad_norm": 0.3481099307537079,
      "learning_rate": 2e-05,
      "loss": 0.8071,
      "step": 5
    },
    {
      "epoch": 0.0037203534335761897,
      "grad_norm": 0.33538541197776794,
      "learning_rate": 1.9200000000000003e-05,
      "loss": 0.9046,
      "step": 6
    },
    {
      "epoch": 0.0037203534335761897,
      "eval_loss": 1.0122885704040527,
      "eval_runtime": 48.1202,
      "eval_samples_per_second": 2.078,
      "eval_steps_per_second": 2.078,
      "step": 6
    },
    {
      "epoch": 0.004340412339172222,
      "grad_norm": 0.2848486602306366,
      "learning_rate": 1.8400000000000003e-05,
      "loss": 0.8963,
      "step": 7
    },
    {
      "epoch": 0.004960471244768253,
      "grad_norm": 0.29836800694465637,
      "learning_rate": 1.76e-05,
      "loss": 0.9869,
      "step": 8
    },
    {
      "epoch": 0.005580530150364285,
      "grad_norm": 0.22438423335552216,
      "learning_rate": 1.6800000000000002e-05,
      "loss": 0.8704,
      "step": 9
    },
    {
      "epoch": 0.005580530150364285,
      "eval_loss": 0.996995210647583,
      "eval_runtime": 48.1511,
      "eval_samples_per_second": 2.077,
      "eval_steps_per_second": 2.077,
      "step": 9
    }
  ],
  "logging_steps": 1,
  "max_steps": 30,
  "num_input_tokens_seen": 0,
  "num_train_epochs": 1,
  "save_steps": 3,
  "stateful_callbacks": {
    "TrainerControl": {
      "args": {
        "should_epoch_stop": false,
        "should_evaluate": false,
        "should_log": false,
        "should_save": true,
        "should_training_stop": false
      },
      "attributes": {}
    }
  },
  "total_flos": 2.059258727153664e+16,
  "train_batch_size": 2,
  "trial_name": null,
  "trial_params": null
}