{
  "best_metric": 0.18770882487297058,
  "best_model_checkpoint": "./models/results_one_liners_453/checkpoint-225",
  "epoch": 0.6489994591671173,
  "global_step": 225,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.02,
      "learning_rate": 4.000000000000001e-06,
      "loss": 0.6902,
      "step": 8
    },
    {
      "epoch": 0.05,
      "learning_rate": 8.000000000000001e-06,
      "loss": 0.6955,
      "step": 16
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.2e-05,
      "loss": 0.6911,
      "step": 24
    },
    {
      "epoch": 0.07,
      "eval_accuracy": 0.49842271293375395,
      "eval_f1": 0.6618460229689495,
      "eval_loss": 0.6824508309364319,
      "eval_precision": 0.494596312778131,
      "eval_recall": 1.0,
      "eval_runtime": 18.4237,
      "eval_samples_per_second": 172.061,
      "eval_steps_per_second": 21.548,
      "step": 25
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.6000000000000003e-05,
      "loss": 0.674,
      "step": 32
    },
    {
      "epoch": 0.12,
      "learning_rate": 2e-05,
      "loss": 0.611,
      "step": 40
    },
    {
      "epoch": 0.14,
      "learning_rate": 2.4e-05,
      "loss": 0.4327,
      "step": 48
    },
    {
      "epoch": 0.14,
      "eval_accuracy": 0.8712933753943217,
      "eval_f1": 0.8696485623003196,
      "eval_loss": 0.31961607933044434,
      "eval_precision": 0.8646759847522236,
      "eval_recall": 0.8746786632390745,
      "eval_runtime": 18.2327,
      "eval_samples_per_second": 173.864,
      "eval_steps_per_second": 21.774,
      "step": 50
    },
    {
      "epoch": 0.16,
      "learning_rate": 2.8000000000000003e-05,
      "loss": 0.3598,
      "step": 56
    },
    {
      "epoch": 0.18,
      "learning_rate": 3.2000000000000005e-05,
      "loss": 0.392,
      "step": 64
    },
    {
      "epoch": 0.21,
      "learning_rate": 3.6e-05,
      "loss": 0.3812,
      "step": 72
    },
    {
      "epoch": 0.22,
      "eval_accuracy": 0.8914826498422713,
      "eval_f1": 0.8940234134319162,
      "eval_loss": 0.2683391869068146,
      "eval_precision": 0.8585798816568048,
      "eval_recall": 0.9325192802056556,
      "eval_runtime": 18.1749,
      "eval_samples_per_second": 174.416,
      "eval_steps_per_second": 21.843,
      "step": 75
    },
    {
      "epoch": 0.23,
      "learning_rate": 4e-05,
      "loss": 0.3055,
      "step": 80
    },
    {
      "epoch": 0.25,
      "learning_rate": 4.4000000000000006e-05,
      "loss": 0.3159,
      "step": 88
    },
    {
      "epoch": 0.28,
      "learning_rate": 4.8e-05,
      "loss": 0.3093,
      "step": 96
    },
    {
      "epoch": 0.29,
      "eval_accuracy": 0.9025236593059937,
      "eval_f1": 0.896551724137931,
      "eval_loss": 0.26234087347984314,
      "eval_precision": 0.9357092941998603,
      "eval_recall": 0.8605398457583547,
      "eval_runtime": 18.2515,
      "eval_samples_per_second": 173.684,
      "eval_steps_per_second": 21.752,
      "step": 100
    },
    {
      "epoch": 0.3,
      "learning_rate": 4.9186991869918704e-05,
      "loss": 0.3469,
      "step": 104
    },
    {
      "epoch": 0.32,
      "learning_rate": 4.75609756097561e-05,
      "loss": 0.3545,
      "step": 112
    },
    {
      "epoch": 0.35,
      "learning_rate": 4.613821138211382e-05,
      "loss": 0.3241,
      "step": 120
    },
    {
      "epoch": 0.36,
      "eval_accuracy": 0.8858044164037855,
      "eval_f1": 0.8927725118483413,
      "eval_loss": 0.30523255467414856,
      "eval_precision": 0.828021978021978,
      "eval_recall": 0.968508997429306,
      "eval_runtime": 18.1682,
      "eval_samples_per_second": 174.481,
      "eval_steps_per_second": 21.851,
      "step": 125
    },
    {
      "epoch": 0.37,
      "learning_rate": 4.451219512195122e-05,
      "loss": 0.2721,
      "step": 128
    },
    {
      "epoch": 0.39,
      "learning_rate": 4.2886178861788616e-05,
      "loss": 0.3343,
      "step": 136
    },
    {
      "epoch": 0.42,
      "learning_rate": 4.126016260162602e-05,
      "loss": 0.3455,
      "step": 144
    },
    {
      "epoch": 0.43,
      "eval_accuracy": 0.9141955835962146,
      "eval_f1": 0.9128205128205129,
      "eval_loss": 0.22679537534713745,
      "eval_precision": 0.9104859335038363,
      "eval_recall": 0.9151670951156813,
      "eval_runtime": 18.2508,
      "eval_samples_per_second": 173.691,
      "eval_steps_per_second": 21.752,
      "step": 150
    },
    {
      "epoch": 0.44,
      "learning_rate": 3.9634146341463416e-05,
      "loss": 0.2462,
      "step": 152
    },
    {
      "epoch": 0.46,
      "learning_rate": 3.800813008130081e-05,
      "loss": 0.2843,
      "step": 160
    },
    {
      "epoch": 0.48,
      "learning_rate": 3.6382113821138216e-05,
      "loss": 0.1991,
      "step": 168
    },
    {
      "epoch": 0.5,
      "eval_accuracy": 0.9170347003154574,
      "eval_f1": 0.9147487844408428,
      "eval_loss": 0.20860691368579865,
      "eval_precision": 0.9228253760627861,
      "eval_recall": 0.9068123393316195,
      "eval_runtime": 18.2871,
      "eval_samples_per_second": 173.346,
      "eval_steps_per_second": 21.709,
      "step": 175
    },
    {
      "epoch": 0.51,
      "learning_rate": 3.475609756097561e-05,
      "loss": 0.276,
      "step": 176
    },
    {
      "epoch": 0.53,
      "learning_rate": 3.313008130081301e-05,
      "loss": 0.2483,
      "step": 184
    },
    {
      "epoch": 0.55,
      "learning_rate": 3.150406504065041e-05,
      "loss": 0.2568,
      "step": 192
    },
    {
      "epoch": 0.58,
      "learning_rate": 2.9878048780487805e-05,
      "loss": 0.227,
      "step": 200
    },
    {
      "epoch": 0.58,
      "eval_accuracy": 0.9198738170347003,
      "eval_f1": 0.9166666666666666,
      "eval_loss": 0.20122328400611877,
      "eval_precision": 0.9363270777479893,
      "eval_recall": 0.8978149100257069,
      "eval_runtime": 18.2795,
      "eval_samples_per_second": 173.418,
      "eval_steps_per_second": 21.718,
      "step": 200
    },
    {
      "epoch": 0.6,
      "learning_rate": 2.8252032520325205e-05,
      "loss": 0.2167,
      "step": 208
    },
    {
      "epoch": 0.62,
      "learning_rate": 2.66260162601626e-05,
      "loss": 0.2033,
      "step": 216
    },
    {
      "epoch": 0.65,
      "learning_rate": 2.5e-05,
      "loss": 0.2357,
      "step": 224
    },
    {
      "epoch": 0.65,
      "eval_accuracy": 0.9261829652996846,
      "eval_f1": 0.9254302103250478,
      "eval_loss": 0.18770882487297058,
      "eval_precision": 0.9178255372945638,
      "eval_recall": 0.9331619537275064,
      "eval_runtime": 18.2243,
      "eval_samples_per_second": 173.943,
      "eval_steps_per_second": 21.784,
      "step": 225
    }
  ],
  "max_steps": 346,
  "num_train_epochs": 1,
  "total_flos": 429199909056000.0,
  "trial_name": null,
  "trial_params": null
}