{
  "best_global_step": null,
  "best_metric": null,
  "best_model_checkpoint": null,
  "epoch": 5.0,
  "eval_steps": 500,
  "global_step": 1560,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.016025641025641024,
      "grad_norm": 8.270559284395055,
      "learning_rate": 1.0256410256410257e-06,
      "loss": 0.8831,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.5231465101242065,
      "step": 5,
      "valid_targets_mean": 2855.3,
      "valid_targets_min": 310
    },
    {
      "epoch": 0.03205128205128205,
      "grad_norm": 6.156057008347062,
      "learning_rate": 2.307692307692308e-06,
      "loss": 0.8578,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.3894450068473816,
      "step": 10,
      "valid_targets_mean": 2836.0,
      "valid_targets_min": 343
    },
    {
      "epoch": 0.04807692307692308,
      "grad_norm": 4.055588313810187,
      "learning_rate": 3.58974358974359e-06,
      "loss": 0.8181,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.34461548924446106,
      "step": 15,
      "valid_targets_mean": 2279.3,
      "valid_targets_min": 397
    },
    {
      "epoch": 0.0641025641025641,
      "grad_norm": 2.9358204191090445,
      "learning_rate": 4.871794871794872e-06,
      "loss": 0.7542,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.37403905391693115,
      "step": 20,
      "valid_targets_mean": 2386.4,
      "valid_targets_min": 501
    },
    {
      "epoch": 0.08012820512820513,
      "grad_norm": 1.3469933311632771,
      "learning_rate": 6.153846153846155e-06,
      "loss": 0.7428,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.3458966016769409,
      "step": 25,
      "valid_targets_mean": 2740.5,
      "valid_targets_min": 447
    },
    {
      "epoch": 0.09615384615384616,
      "grad_norm": 1.1608353294901592,
      "learning_rate": 7.435897435897437e-06,
      "loss": 0.7218,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.31971484422683716,
      "step": 30,
      "valid_targets_mean": 1962.6,
      "valid_targets_min": 279
    },
    {
      "epoch": 0.11217948717948718,
      "grad_norm": 1.067171533736777,
      "learning_rate": 8.717948717948719e-06,
      "loss": 0.6814,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.4454614520072937,
      "step": 35,
      "valid_targets_mean": 2451.4,
      "valid_targets_min": 416
    },
    {
      "epoch": 0.1282051282051282,
      "grad_norm": 0.9774891251489538,
      "learning_rate": 1e-05,
      "loss": 0.7264,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.3378103971481323,
      "step": 40,
      "valid_targets_mean": 1912.1,
      "valid_targets_min": 609
    },
    {
      "epoch": 0.14423076923076922,
      "grad_norm": 0.8317361111005913,
      "learning_rate": 1.1282051282051283e-05,
      "loss": 0.6642,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.37407323718070984,
      "step": 45,
      "valid_targets_mean": 1732.8,
      "valid_targets_min": 474
    },
    {
      "epoch": 0.16025641025641027,
      "grad_norm": 0.70420941452197,
      "learning_rate": 1.2564102564102565e-05,
      "loss": 0.6433,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.3607226610183716,
      "step": 50,
      "valid_targets_mean": 2446.6,
      "valid_targets_min": 396
    },
    {
      "epoch": 0.1762820512820513,
      "grad_norm": 0.640275050687205,
      "learning_rate": 1.3846153846153847e-05,
      "loss": 0.6505,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2584564685821533,
      "step": 55,
      "valid_targets_mean": 1938.5,
      "valid_targets_min": 350
    },
    {
      "epoch": 0.19230769230769232,
      "grad_norm": 0.6130742352183888,
      "learning_rate": 1.5128205128205129e-05,
      "loss": 0.5794,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.29696235060691833,
      "step": 60,
      "valid_targets_mean": 1760.7,
      "valid_targets_min": 705
    },
    {
      "epoch": 0.20833333333333334,
      "grad_norm": 0.49753658846261495,
      "learning_rate": 1.641025641025641e-05,
      "loss": 0.5949,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.23245546221733093,
      "step": 65,
      "valid_targets_mean": 2182.3,
      "valid_targets_min": 495
    },
    {
      "epoch": 0.22435897435897437,
      "grad_norm": 0.5248371244445572,
      "learning_rate": 1.7692307692307694e-05,
      "loss": 0.5511,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.27561211585998535,
      "step": 70,
      "valid_targets_mean": 2518.8,
      "valid_targets_min": 537
    },
    {
      "epoch": 0.2403846153846154,
      "grad_norm": 0.5696118966316656,
      "learning_rate": 1.8974358974358975e-05,
      "loss": 0.6166,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.27792054414749146,
      "step": 75,
      "valid_targets_mean": 2193.9,
      "valid_targets_min": 320
    },
    {
      "epoch": 0.2564102564102564,
      "grad_norm": 0.6067800362816257,
      "learning_rate": 2.025641025641026e-05,
      "loss": 0.5518,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.3141236901283264,
      "step": 80,
      "valid_targets_mean": 1968.6,
      "valid_targets_min": 524
    },
    {
      "epoch": 0.2724358974358974,
      "grad_norm": 0.5486307014154258,
      "learning_rate": 2.153846153846154e-05,
      "loss": 0.5859,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.39914655685424805,
      "step": 85,
      "valid_targets_mean": 2844.7,
      "valid_targets_min": 652
    },
    {
      "epoch": 0.28846153846153844,
      "grad_norm": 0.5467022186742057,
      "learning_rate": 2.2820512820512822e-05,
      "loss": 0.5494,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.30601420998573303,
      "step": 90,
      "valid_targets_mean": 2242.3,
      "valid_targets_min": 287
    },
    {
      "epoch": 0.30448717948717946,
      "grad_norm": 0.5073453583636481,
      "learning_rate": 2.4102564102564103e-05,
      "loss": 0.5672,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.27047592401504517,
      "step": 95,
      "valid_targets_mean": 2702.0,
      "valid_targets_min": 623
    },
    {
      "epoch": 0.32051282051282054,
      "grad_norm": 0.6374453094826855,
      "learning_rate": 2.5384615384615386e-05,
      "loss": 0.5258,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.34897756576538086,
      "step": 100,
      "valid_targets_mean": 2111.6,
      "valid_targets_min": 632
    },
    {
      "epoch": 0.33653846153846156,
      "grad_norm": 0.4904714398710548,
      "learning_rate": 2.6666666666666667e-05,
      "loss": 0.5275,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2545839548110962,
      "step": 105,
      "valid_targets_mean": 2280.2,
      "valid_targets_min": 528
    },
    {
      "epoch": 0.3525641025641026,
      "grad_norm": 0.5374741002067597,
      "learning_rate": 2.794871794871795e-05,
      "loss": 0.5159,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.27961328625679016,
      "step": 110,
      "valid_targets_mean": 1705.3,
      "valid_targets_min": 483
    },
    {
      "epoch": 0.3685897435897436,
      "grad_norm": 0.5401678923394666,
      "learning_rate": 2.923076923076923e-05,
      "loss": 0.5378,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.28303176164627075,
      "step": 115,
      "valid_targets_mean": 2115.9,
      "valid_targets_min": 460
    },
    {
      "epoch": 0.38461538461538464,
      "grad_norm": 0.5697964720982368,
      "learning_rate": 3.0512820512820514e-05,
      "loss": 0.5136,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2926599979400635,
      "step": 120,
      "valid_targets_mean": 2276.1,
      "valid_targets_min": 491
    },
    {
      "epoch": 0.40064102564102566,
      "grad_norm": 0.5080731305686881,
      "learning_rate": 3.1794871794871795e-05,
      "loss": 0.5455,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21579426527023315,
      "step": 125,
      "valid_targets_mean": 1966.7,
      "valid_targets_min": 455
    },
    {
      "epoch": 0.4166666666666667,
      "grad_norm": 0.5193806958702459,
      "learning_rate": 3.307692307692308e-05,
      "loss": 0.5503,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.23866981267929077,
      "step": 130,
      "valid_targets_mean": 1884.6,
      "valid_targets_min": 653
    },
    {
      "epoch": 0.4326923076923077,
      "grad_norm": 0.5215890997634938,
      "learning_rate": 3.435897435897436e-05,
      "loss": 0.5113,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.22024506330490112,
      "step": 135,
      "valid_targets_mean": 2176.9,
      "valid_targets_min": 551
    },
    {
      "epoch": 0.44871794871794873,
      "grad_norm": 0.5428844999735067,
      "learning_rate": 3.5641025641025646e-05,
      "loss": 0.5327,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2842090129852295,
      "step": 140,
      "valid_targets_mean": 2108.4,
      "valid_targets_min": 395
    },
    {
      "epoch": 0.46474358974358976,
      "grad_norm": 0.5658357256109985,
      "learning_rate": 3.692307692307693e-05,
      "loss": 0.5012,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.23009580373764038,
      "step": 145,
      "valid_targets_mean": 1416.6,
      "valid_targets_min": 319
    },
    {
      "epoch": 0.4807692307692308,
      "grad_norm": 0.5287699494547455,
      "learning_rate": 3.820512820512821e-05,
      "loss": 0.5442,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.25618451833724976,
      "step": 150,
      "valid_targets_mean": 2366.4,
      "valid_targets_min": 555
    },
    {
      "epoch": 0.4967948717948718,
      "grad_norm": 0.5510710484739612,
      "learning_rate": 3.948717948717949e-05,
      "loss": 0.5202,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.261417031288147,
      "step": 155,
      "valid_targets_mean": 1912.0,
      "valid_targets_min": 427
    },
    {
      "epoch": 0.5128205128205128,
      "grad_norm": 0.5223782503607328,
      "learning_rate": 3.999954938420724e-05,
      "loss": 0.538,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2376648485660553,
      "step": 160,
      "valid_targets_mean": 2203.6,
      "valid_targets_min": 520
    },
    {
      "epoch": 0.5288461538461539,
      "grad_norm": 0.5639669943753522,
      "learning_rate": 3.9996795694563096e-05,
      "loss": 0.5519,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.26910513639450073,
      "step": 165,
      "valid_targets_mean": 1978.4,
      "valid_targets_min": 452
    },
    {
      "epoch": 0.5448717948717948,
      "grad_norm": 0.5934805718745008,
      "learning_rate": 3.9991539001644015e-05,
      "loss": 0.4864,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21558544039726257,
      "step": 170,
      "valid_targets_mean": 1433.1,
      "valid_targets_min": 291
    },
    {
      "epoch": 0.5608974358974359,
      "grad_norm": 0.5444507017809859,
      "learning_rate": 3.998377996343139e-05,
      "loss": 0.5402,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.22888971865177155,
      "step": 175,
      "valid_targets_mean": 2303.6,
      "valid_targets_min": 665
    },
    {
      "epoch": 0.5769230769230769,
      "grad_norm": 0.5993323841226175,
      "learning_rate": 3.9973519551125746e-05,
      "loss": 0.5472,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2046593725681305,
      "step": 180,
      "valid_targets_mean": 1417.7,
      "valid_targets_min": 614
    },
    {
      "epoch": 0.592948717948718,
      "grad_norm": 0.552244150619254,
      "learning_rate": 3.99607590490251e-05,
      "loss": 0.5254,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.240033358335495,
      "step": 185,
      "valid_targets_mean": 1792.0,
      "valid_targets_min": 356
    },
    {
      "epoch": 0.6089743589743589,
      "grad_norm": 0.5676943862267904,
      "learning_rate": 3.994550005436431e-05,
      "loss": 0.5232,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2360553741455078,
      "step": 190,
      "valid_targets_mean": 1990.2,
      "valid_targets_min": 571
    },
    {
      "epoch": 0.625,
      "grad_norm": 0.5686816790686919,
      "learning_rate": 3.992774447711503e-05,
      "loss": 0.5712,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.3569658696651459,
      "step": 195,
      "valid_targets_mean": 2023.1,
      "valid_targets_min": 425
    },
    {
      "epoch": 0.6410256410256411,
      "grad_norm": 0.593578700387874,
      "learning_rate": 3.990749453974676e-05,
      "loss": 0.5151,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2537527084350586,
      "step": 200,
      "valid_targets_mean": 1794.6,
      "valid_targets_min": 397
    },
    {
      "epoch": 0.657051282051282,
      "grad_norm": 0.626123448487498,
      "learning_rate": 3.9884752776948564e-05,
      "loss": 0.5111,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20010629296302795,
      "step": 205,
      "valid_targets_mean": 1342.0,
      "valid_targets_min": 328
    },
    {
      "epoch": 0.6730769230769231,
      "grad_norm": 0.5180554845628587,
      "learning_rate": 3.985952203531184e-05,
      "loss": 0.5206,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.31396254897117615,
      "step": 210,
      "valid_targets_mean": 2744.9,
      "valid_targets_min": 1089
    },
    {
      "epoch": 0.6891025641025641,
      "grad_norm": 0.6345163141192973,
      "learning_rate": 3.983180547297404e-05,
      "loss": 0.5026,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24182447791099548,
      "step": 215,
      "valid_targets_mean": 1557.4,
      "valid_targets_min": 461
    },
    {
      "epoch": 0.7051282051282052,
      "grad_norm": 0.6054353969461813,
      "learning_rate": 3.9801606559223286e-05,
      "loss": 0.5125,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2920263409614563,
      "step": 220,
      "valid_targets_mean": 2164.1,
      "valid_targets_min": 542
    },
    {
      "epoch": 0.7211538461538461,
      "grad_norm": 0.5253840091115919,
      "learning_rate": 3.9768929074064206e-05,
      "loss": 0.5073,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.26178407669067383,
      "step": 225,
      "valid_targets_mean": 2276.9,
      "valid_targets_min": 508
    },
    {
      "epoch": 0.7371794871794872,
      "grad_norm": 0.6036771997042879,
      "learning_rate": 3.973377710774474e-05,
      "loss": 0.5416,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.30116069316864014,
      "step": 230,
      "valid_targets_mean": 1931.5,
      "valid_targets_min": 465
    },
    {
      "epoch": 0.7532051282051282,
      "grad_norm": 0.5341073955982537,
      "learning_rate": 3.9696155060244166e-05,
      "loss": 0.4925,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2869190275669098,
      "step": 235,
      "valid_targets_mean": 2469.9,
      "valid_targets_min": 390
    },
    {
      "epoch": 0.7692307692307693,
      "grad_norm": 0.5391946249539421,
      "learning_rate": 3.965606764072237e-05,
      "loss": 0.5149,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.23443245887756348,
      "step": 240,
      "valid_targets_mean": 2517.3,
      "valid_targets_min": 458
    },
    {
      "epoch": 0.7852564102564102,
      "grad_norm": 0.48726365599779214,
      "learning_rate": 3.96135198669304e-05,
      "loss": 0.5111,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2194036841392517,
      "step": 245,
      "valid_targets_mean": 2148.2,
      "valid_targets_min": 284
    },
    {
      "epoch": 0.8012820512820513,
      "grad_norm": 0.4546312777762876,
      "learning_rate": 3.956851706458236e-05,
      "loss": 0.4951,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2413400411605835,
      "step": 250,
      "valid_targets_mean": 3277.6,
      "valid_targets_min": 401
    },
    {
      "epoch": 0.8173076923076923,
      "grad_norm": 0.43195116515643417,
      "learning_rate": 3.952106486668884e-05,
      "loss": 0.4941,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24353349208831787,
      "step": 255,
      "valid_targets_mean": 2430.8,
      "valid_targets_min": 354
    },
    {
      "epoch": 0.8333333333333334,
      "grad_norm": 0.5431449210079052,
      "learning_rate": 3.9471169212851774e-05,
      "loss": 0.4859,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.3241618275642395,
      "step": 260,
      "valid_targets_mean": 2396.5,
      "valid_targets_min": 559
    },
    {
      "epoch": 0.8493589743589743,
      "grad_norm": 0.4983128230175159,
      "learning_rate": 3.9418836348521045e-05,
      "loss": 0.507,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.28434205055236816,
      "step": 265,
      "valid_targets_mean": 2714.4,
      "valid_targets_min": 589
    },
    {
      "epoch": 0.8653846153846154,
      "grad_norm": 0.4433055547977104,
      "learning_rate": 3.936407282421267e-05,
      "loss": 0.489,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2021905481815338,
      "step": 270,
      "valid_targets_mean": 2192.3,
      "valid_targets_min": 420
    },
    {
      "epoch": 0.8814102564102564,
      "grad_norm": 0.5372540899641901,
      "learning_rate": 3.930688549468894e-05,
      "loss": 0.4962,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.3100685477256775,
      "step": 275,
      "valid_targets_mean": 2431.0,
      "valid_targets_min": 523
    },
    {
      "epoch": 0.8974358974358975,
      "grad_norm": 0.48553038032931456,
      "learning_rate": 3.924728151810034e-05,
      "loss": 0.5118,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.27802667021751404,
      "step": 280,
      "valid_targets_mean": 2424.8,
      "valid_targets_min": 596
    },
    {
      "epoch": 0.9134615384615384,
      "grad_norm": 0.5494166379111899,
      "learning_rate": 3.9185268355089606e-05,
      "loss": 0.4939,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2717832922935486,
      "step": 285,
      "valid_targets_mean": 1919.1,
      "valid_targets_min": 500
    },
    {
      "epoch": 0.9294871794871795,
      "grad_norm": 0.4690629180894029,
      "learning_rate": 3.912085376785788e-05,
      "loss": 0.4929,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20420989394187927,
      "step": 290,
      "valid_targets_mean": 1990.7,
      "valid_targets_min": 498
    },
    {
      "epoch": 0.9455128205128205,
      "grad_norm": 0.47364731395403387,
      "learning_rate": 3.9054045819193074e-05,
      "loss": 0.4596,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.283137708902359,
      "step": 295,
      "valid_targets_mean": 3114.4,
      "valid_targets_min": 389
    },
    {
      "epoch": 0.9615384615384616,
      "grad_norm": 0.43834286352294405,
      "learning_rate": 3.898485287146068e-05,
      "loss": 0.4846,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.22700203955173492,
      "step": 300,
      "valid_targets_mean": 3102.8,
      "valid_targets_min": 674
    },
    {
      "epoch": 0.9775641025641025,
      "grad_norm": 0.544832909701008,
      "learning_rate": 3.8913283585557054e-05,
      "loss": 0.488,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24065542221069336,
      "step": 305,
      "valid_targets_mean": 2371.9,
      "valid_targets_min": 342
    },
    {
      "epoch": 0.9935897435897436,
      "grad_norm": 0.6034996255357719,
      "learning_rate": 3.8839346919825304e-05,
      "loss": 0.5011,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.252093642950058,
      "step": 310,
      "valid_targets_mean": 1962.2,
      "valid_targets_min": 339
    },
    {
      "epoch": 1.0096153846153846,
      "grad_norm": 0.48322361076674575,
      "learning_rate": 3.876305212893399e-05,
      "loss": 0.4662,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.25063151121139526,
      "step": 315,
      "valid_targets_mean": 2658.9,
      "valid_targets_min": 507
    },
    {
      "epoch": 1.0256410256410255,
      "grad_norm": 0.6133158850042538,
      "learning_rate": 3.868440876271871e-05,
      "loss": 0.4777,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.29740214347839355,
      "step": 320,
      "valid_targets_mean": 1867.5,
      "valid_targets_min": 392
    },
    {
      "epoch": 1.0416666666666667,
      "grad_norm": 0.541900985104166,
      "learning_rate": 3.860342666498677e-05,
      "loss": 0.4866,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21024353802204132,
      "step": 325,
      "valid_targets_mean": 1411.2,
      "valid_targets_min": 322
    },
    {
      "epoch": 1.0576923076923077,
      "grad_norm": 0.6020609614604076,
      "learning_rate": 3.8520115972284975e-05,
      "loss": 0.4639,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24874147772789001,
      "step": 330,
      "valid_targets_mean": 1505.4,
      "valid_targets_min": 372
    },
    {
      "epoch": 1.0737179487179487,
      "grad_norm": 0.5637623048449515,
      "learning_rate": 3.843448711263089e-05,
      "loss": 0.5009,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.3167960047721863,
      "step": 335,
      "valid_targets_mean": 2400.1,
      "valid_targets_min": 471
    },
    {
      "epoch": 1.0897435897435896,
      "grad_norm": 0.482423724630125,
      "learning_rate": 3.8346550804207544e-05,
      "loss": 0.453,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2796696722507477,
      "step": 340,
      "valid_targets_mean": 2607.9,
      "valid_targets_min": 358
    },
    {
      "epoch": 1.1057692307692308,
      "grad_norm": 0.42709049123064025,
      "learning_rate": 3.825631805402182e-05,
      "loss": 0.4675,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.18846507370471954,
      "step": 345,
      "valid_targets_mean": 3064.7,
      "valid_targets_min": 484
    },
    {
      "epoch": 1.1217948717948718,
      "grad_norm": 0.45654149738060995,
      "learning_rate": 3.816380015652672e-05,
      "loss": 0.4711,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.22047562897205353,
      "step": 350,
      "valid_targets_mean": 2670.4,
      "valid_targets_min": 497
    },
    {
      "epoch": 1.1378205128205128,
      "grad_norm": 0.46259303685534825,
      "learning_rate": 3.806900869220765e-05,
      "loss": 0.4289,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21656641364097595,
      "step": 355,
      "valid_targets_mean": 2637.6,
      "valid_targets_min": 371
    },
    {
      "epoch": 1.1538461538461537,
      "grad_norm": 0.4795462410657758,
      "learning_rate": 3.797195552613284e-05,
      "loss": 0.4347,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.28732848167419434,
      "step": 360,
      "valid_targets_mean": 2804.9,
      "valid_targets_min": 972
    },
    {
      "epoch": 1.169871794871795,
      "grad_norm": 0.544805070309915,
      "learning_rate": 3.787265280646825e-05,
      "loss": 0.4612,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20876461267471313,
      "step": 365,
      "valid_targets_mean": 1629.6,
      "valid_targets_min": 470
    },
    {
      "epoch": 1.185897435897436,
      "grad_norm": 0.6219497217509353,
      "learning_rate": 3.7771112962956936e-05,
      "loss": 0.4925,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24284450709819794,
      "step": 370,
      "valid_targets_mean": 1362.9,
      "valid_targets_min": 362
    },
    {
      "epoch": 1.2019230769230769,
      "grad_norm": 0.6219562430857214,
      "learning_rate": 3.7667348705363227e-05,
      "loss": 0.4846,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.26131337881088257,
      "step": 375,
      "valid_targets_mean": 2042.5,
      "valid_targets_min": 538
    },
    {
      "epoch": 1.217948717948718,
      "grad_norm": 0.5273423780621191,
      "learning_rate": 3.7561373021881885e-05,
      "loss": 0.4764,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20557957887649536,
      "step": 380,
      "valid_targets_mean": 2154.4,
      "valid_targets_min": 482
    },
    {
      "epoch": 1.233974358974359,
      "grad_norm": 0.5940055633638739,
      "learning_rate": 3.745319917751229e-05,
      "loss": 0.458,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.19809526205062866,
      "step": 385,
      "valid_targets_mean": 1356.8,
      "valid_targets_min": 496
    },
    {
      "epoch": 1.25,
      "grad_norm": 0.604986566337123,
      "learning_rate": 3.734284071239811e-05,
      "loss": 0.4753,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.3080754280090332,
      "step": 390,
      "valid_targets_mean": 2211.4,
      "valid_targets_min": 405
    },
    {
      "epoch": 1.266025641025641,
      "grad_norm": 0.6686876845094236,
      "learning_rate": 3.7230311440132494e-05,
      "loss": 0.4605,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2461152821779251,
      "step": 395,
      "valid_targets_mean": 1261.0,
      "valid_targets_min": 384
    },
    {
      "epoch": 1.282051282051282,
      "grad_norm": 0.5383774605862381,
      "learning_rate": 3.711562544602895e-05,
      "loss": 0.47,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2216894030570984,
      "step": 400,
      "valid_targets_mean": 1972.8,
      "valid_targets_min": 572
    },
    {
      "epoch": 1.2980769230769231,
      "grad_norm": 0.6237423049196263,
      "learning_rate": 3.699879708535838e-05,
      "loss": 0.4964,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.3525855839252472,
      "step": 405,
      "valid_targets_mean": 2608.8,
      "valid_targets_min": 553
    },
    {
      "epoch": 1.314102564102564,
      "grad_norm": 0.47346493238221604,
      "learning_rate": 3.687984098155212e-05,
      "loss": 0.4721,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.23883157968521118,
      "step": 410,
      "valid_targets_mean": 2648.7,
      "valid_targets_min": 559
    },
    {
      "epoch": 1.330128205128205,
      "grad_norm": 0.6009852407301991,
      "learning_rate": 3.6758772024371626e-05,
      "loss": 0.4985,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.31522154808044434,
      "step": 415,
      "valid_targets_mean": 1891.1,
      "valid_targets_min": 369
    },
    {
      "epoch": 1.3461538461538463,
      "grad_norm": 0.5221802033027123,
      "learning_rate": 3.663560536804465e-05,
      "loss": 0.4619,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2520959973335266,
      "step": 420,
      "valid_targets_mean": 2271.7,
      "valid_targets_min": 479
    },
    {
      "epoch": 1.3621794871794872,
      "grad_norm": 0.5462328875847934,
      "learning_rate": 3.65103564293684e-05,
      "loss": 0.4923,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.28057146072387695,
      "step": 425,
      "valid_targets_mean": 1829.6,
      "valid_targets_min": 349
    },
    {
      "epoch": 1.3782051282051282,
      "grad_norm": 0.5230511743019115,
      "learning_rate": 3.638304088577984e-05,
      "loss": 0.4479,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20385369658470154,
      "step": 430,
      "valid_targets_mean": 2099.4,
      "valid_targets_min": 450
    },
    {
      "epoch": 1.3942307692307692,
      "grad_norm": 0.5260439150355632,
      "learning_rate": 3.625367467339329e-05,
      "loss": 0.4409,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.25196361541748047,
      "step": 435,
      "valid_targets_mean": 1848.4,
      "valid_targets_min": 374
    },
    {
      "epoch": 1.4102564102564101,
      "grad_norm": 0.542530019050112,
      "learning_rate": 3.612227398500575e-05,
      "loss": 0.4625,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2730902433395386,
      "step": 440,
      "valid_targets_mean": 1855.6,
      "valid_targets_min": 539
    },
    {
      "epoch": 1.4262820512820513,
      "grad_norm": 0.5362598043278441,
      "learning_rate": 3.598885526807003e-05,
      "loss": 0.4645,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20158651471138,
      "step": 445,
      "valid_targets_mean": 1960.3,
      "valid_targets_min": 330
    },
    {
      "epoch": 1.4423076923076923,
      "grad_norm": 0.5038481547905878,
      "learning_rate": 3.585343522263599e-05,
      "loss": 0.4576,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.23150920867919922,
      "step": 450,
      "valid_targets_mean": 2077.7,
      "valid_targets_min": 685
    },
    {
      "epoch": 1.4583333333333333,
      "grad_norm": 0.6465319041135404,
      "learning_rate": 3.571603079926024e-05,
      "loss": 0.4734,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2389899045228958,
      "step": 455,
      "valid_targets_mean": 1801.0,
      "valid_targets_min": 435
    },
    {
      "epoch": 1.4743589743589745,
      "grad_norm": 0.5472386327122035,
      "learning_rate": 3.5576659196884395e-05,
      "loss": 0.5179,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24516533315181732,
      "step": 460,
      "valid_targets_mean": 1980.1,
      "valid_targets_min": 436
    },
    {
      "epoch": 1.4903846153846154,
      "grad_norm": 0.5414486709041462,
      "learning_rate": 3.5435337860682304e-05,
      "loss": 0.464,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2550250291824341,
      "step": 465,
      "valid_targets_mean": 1814.8,
      "valid_targets_min": 343
    },
    {
      "epoch": 1.5064102564102564,
      "grad_norm": 0.4560866540685229,
      "learning_rate": 3.529208447987641e-05,
      "loss": 0.4928,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1900494247674942,
      "step": 470,
      "valid_targets_mean": 2029.3,
      "valid_targets_min": 353
    },
    {
      "epoch": 1.5224358974358974,
      "grad_norm": 0.5257829172034205,
      "learning_rate": 3.5146916985523604e-05,
      "loss": 0.5122,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.25625720620155334,
      "step": 475,
      "valid_targets_mean": 2358.8,
      "valid_targets_min": 708
    },
    {
      "epoch": 1.5384615384615383,
      "grad_norm": 0.5000203832116034,
      "learning_rate": 3.499985354827079e-05,
      "loss": 0.4661,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.19569867849349976,
      "step": 480,
      "valid_targets_mean": 1793.0,
      "valid_targets_min": 407
    },
    {
      "epoch": 1.5544871794871795,
      "grad_norm": 0.5311956681183098,
      "learning_rate": 3.485091257608047e-05,
      "loss": 0.4946,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2879672348499298,
      "step": 485,
      "valid_targets_mean": 2306.1,
      "valid_targets_min": 383
    },
    {
      "epoch": 1.5705128205128205,
      "grad_norm": 0.48828567970956843,
      "learning_rate": 3.4700112711926574e-05,
      "loss": 0.4632,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24961577355861664,
      "step": 490,
      "valid_targets_mean": 2378.9,
      "valid_targets_min": 494
    },
    {
      "epoch": 1.5865384615384617,
      "grad_norm": 0.6003720701146319,
      "learning_rate": 3.4547472831460976e-05,
      "loss": 0.4662,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2577670216560364,
      "step": 495,
      "valid_targets_mean": 1839.1,
      "valid_targets_min": 463
    },
    {
      "epoch": 1.6025641025641026,
      "grad_norm": 0.556322591943896,
      "learning_rate": 3.439301204065077e-05,
      "loss": 0.468,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20165708661079407,
      "step": 500,
      "valid_targets_mean": 1302.6,
      "valid_targets_min": 365
    },
    {
      "epoch": 1.6185897435897436,
      "grad_norm": 0.4863359326950338,
      "learning_rate": 3.423674967338681e-05,
      "loss": 0.496,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24409791827201843,
      "step": 505,
      "valid_targets_mean": 2180.1,
      "valid_targets_min": 564
    },
    {
      "epoch": 1.6346153846153846,
      "grad_norm": 0.5132971252924721,
      "learning_rate": 3.407870528906366e-05,
      "loss": 0.4911,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2089085876941681,
      "step": 510,
      "valid_targets_mean": 1815.9,
      "valid_targets_min": 376
    },
    {
      "epoch": 1.6506410256410255,
      "grad_norm": 0.44374872733889337,
      "learning_rate": 3.391889867013134e-05,
      "loss": 0.4728,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.25746238231658936,
      "step": 515,
      "valid_targets_mean": 3330.2,
      "valid_targets_min": 535
    },
    {
      "epoch": 1.6666666666666665,
      "grad_norm": 0.41541671583956447,
      "learning_rate": 3.375734981961918e-05,
      "loss": 0.4579,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.19313707947731018,
      "step": 520,
      "valid_targets_mean": 2933.1,
      "valid_targets_min": 641
    },
    {
      "epoch": 1.6826923076923077,
      "grad_norm": 0.5025527033239986,
      "learning_rate": 3.359407895863199e-05,
      "loss": 0.4777,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2544252574443817,
      "step": 525,
      "valid_targets_mean": 2657.9,
      "valid_targets_min": 634
    },
    {
      "epoch": 1.6987179487179487,
      "grad_norm": 0.5010762849646863,
      "learning_rate": 3.342910652381902e-05,
      "loss": 0.4582,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.253082811832428,
      "step": 530,
      "valid_targets_mean": 2349.6,
      "valid_targets_min": 444
    },
    {
      "epoch": 1.7147435897435899,
      "grad_norm": 0.5050510280029894,
      "learning_rate": 3.326245316481591e-05,
      "loss": 0.4707,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2477722316980362,
      "step": 535,
      "valid_targets_mean": 1996.2,
      "valid_targets_min": 477
    },
    {
      "epoch": 1.7307692307692308,
      "grad_norm": 0.5765193223693661,
      "learning_rate": 3.30941397416599e-05,
      "loss": 0.4785,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.23156100511550903,
      "step": 540,
      "valid_targets_mean": 1675.4,
      "valid_targets_min": 481
    },
    {
      "epoch": 1.7467948717948718,
      "grad_norm": 0.4560642161468493,
      "learning_rate": 3.2924187322178865e-05,
      "loss": 0.4794,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.23049210011959076,
      "step": 545,
      "valid_targets_mean": 2340.4,
      "valid_targets_min": 392
    },
    {
      "epoch": 1.7628205128205128,
      "grad_norm": 0.4922377750065325,
      "learning_rate": 3.275261717935417e-05,
      "loss": 0.4764,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24752816557884216,
      "step": 550,
      "valid_targets_mean": 2367.2,
      "valid_targets_min": 476
    },
    {
      "epoch": 1.7788461538461537,
      "grad_norm": 0.4426230788977972,
      "learning_rate": 3.2579450788657997e-05,
      "loss": 0.4677,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21346285939216614,
      "step": 555,
      "valid_targets_mean": 2292.7,
      "valid_targets_min": 432
    },
    {
      "epoch": 1.7948717948717947,
      "grad_norm": 0.624429526299482,
      "learning_rate": 3.2404709825365204e-05,
      "loss": 0.4717,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.22740063071250916,
      "step": 560,
      "valid_targets_mean": 1412.7,
      "valid_targets_min": 517
    },
    {
      "epoch": 1.810897435897436,
      "grad_norm": 0.555277859130487,
      "learning_rate": 3.222841616184025e-05,
      "loss": 0.4877,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.32376670837402344,
      "step": 565,
      "valid_targets_mean": 2239.8,
      "valid_targets_min": 373
    },
    {
      "epoch": 1.8269230769230769,
      "grad_norm": 0.6868507053050372,
      "learning_rate": 3.2050591864799406e-05,
      "loss": 0.454,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2284863293170929,
      "step": 570,
      "valid_targets_mean": 2318.9,
      "valid_targets_min": 465
    },
    {
      "epoch": 1.842948717948718,
      "grad_norm": 0.5636785309744979,
      "learning_rate": 3.187125919254869e-05,
      "loss": 0.5021,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20378993451595306,
      "step": 575,
      "valid_targets_mean": 1406.4,
      "valid_targets_min": 382
    },
    {
      "epoch": 1.858974358974359,
      "grad_norm": 0.5138362567576862,
      "learning_rate": 3.169044059219778e-05,
      "loss": 0.472,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24885600805282593,
      "step": 580,
      "valid_targets_mean": 2108.1,
      "valid_targets_min": 297
    },
    {
      "epoch": 1.875,
      "grad_norm": 0.4788276150250492,
      "learning_rate": 3.1508158696850275e-05,
      "loss": 0.4439,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2000913918018341,
      "step": 585,
      "valid_targets_mean": 1723.1,
      "valid_targets_min": 532
    },
    {
      "epoch": 1.891025641025641,
      "grad_norm": 0.5199878797975349,
      "learning_rate": 3.132443632277075e-05,
      "loss": 0.4341,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1967633068561554,
      "step": 590,
      "valid_targets_mean": 1640.8,
      "valid_targets_min": 336
    },
    {
      "epoch": 1.907051282051282,
      "grad_norm": 0.5120839295430387,
      "learning_rate": 3.113929646652879e-05,
      "loss": 0.4752,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.25105994939804077,
      "step": 595,
      "valid_targets_mean": 2039.7,
      "valid_targets_min": 647
    },
    {
      "epoch": 1.9230769230769231,
      "grad_norm": 0.4639112950762158,
      "learning_rate": 3.095276230212056e-05,
      "loss": 0.4696,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2098376452922821,
      "step": 600,
      "valid_targets_mean": 2136.6,
      "valid_targets_min": 495
    },
    {
      "epoch": 1.939102564102564,
      "grad_norm": 0.5166631970577467,
      "learning_rate": 3.076485717806808e-05,
      "loss": 0.4703,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.18611370027065277,
      "step": 605,
      "valid_targets_mean": 1350.6,
      "valid_targets_min": 575
    },
    {
      "epoch": 1.9551282051282053,
      "grad_norm": 0.4745285139732179,
      "learning_rate": 3.057560461449665e-05,
      "loss": 0.457,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.252684623003006,
      "step": 610,
      "valid_targets_mean": 2834.0,
      "valid_targets_min": 460
    },
    {
      "epoch": 1.9711538461538463,
      "grad_norm": 0.48419329402472827,
      "learning_rate": 3.038502830019092e-05,
      "loss": 0.4735,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.25076764822006226,
      "step": 615,
      "valid_targets_mean": 2311.8,
      "valid_targets_min": 535
    },
    {
      "epoch": 1.9871794871794872,
      "grad_norm": 0.4856357542202215,
      "learning_rate": 3.019315208962968e-05,
      "loss": 0.4564,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.22748295962810516,
      "step": 620,
      "valid_targets_mean": 1729.2,
      "valid_targets_min": 404
    },
    {
      "epoch": 2.003205128205128,
      "grad_norm": 0.5415603488319026,
      "learning_rate": 3.0000000000000004e-05,
      "loss": 0.4663,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.25027239322662354,
      "step": 625,
      "valid_targets_mean": 2599.8,
      "valid_targets_min": 446
    },
    {
      "epoch": 2.019230769230769,
      "grad_norm": 0.5616447815364394,
      "learning_rate": 2.9805596208191056e-05,
      "loss": 0.4626,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.31486913561820984,
      "step": 630,
      "valid_targets_mean": 2342.2,
      "valid_targets_min": 481
    },
    {
      "epoch": 2.03525641025641,
      "grad_norm": 0.4616279441242081,
      "learning_rate": 2.960996504776783e-05,
      "loss": 0.4494,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2557230293750763,
      "step": 635,
      "valid_targets_mean": 3251.1,
      "valid_targets_min": 374
    },
    {
      "epoch": 2.051282051282051,
      "grad_norm": 0.5503041087281749,
      "learning_rate": 2.9413131005925296e-05,
      "loss": 0.4178,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.18771244585514069,
      "step": 640,
      "valid_targets_mean": 1542.1,
      "valid_targets_min": 405
    },
    {
      "epoch": 2.0673076923076925,
      "grad_norm": 0.5145185224875077,
      "learning_rate": 2.9215118720423375e-05,
      "loss": 0.4356,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20002877712249756,
      "step": 645,
      "valid_targets_mean": 2503.4,
      "valid_targets_min": 679
    },
    {
      "epoch": 2.0833333333333335,
      "grad_norm": 0.5259222795664407,
      "learning_rate": 2.9015952976502994e-05,
      "loss": 0.4819,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.22057735919952393,
      "step": 650,
      "valid_targets_mean": 2547.9,
      "valid_targets_min": 329
    },
    {
      "epoch": 2.0993589743589745,
      "grad_norm": 0.49973317567273595,
      "learning_rate": 2.8815658703783715e-05,
      "loss": 0.4179,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20730602741241455,
      "step": 655,
      "valid_targets_mean": 2237.2,
      "valid_targets_min": 603
    },
    {
      "epoch": 2.1153846153846154,
      "grad_norm": 0.468034186388587,
      "learning_rate": 2.8614260973143318e-05,
      "loss": 0.4579,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2634885311126709,
      "step": 660,
      "valid_targets_mean": 2994.0,
      "valid_targets_min": 613
    },
    {
      "epoch": 2.1314102564102564,
      "grad_norm": 0.5188728303293624,
      "learning_rate": 2.8411784993579633e-05,
      "loss": 0.4465,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.32055070996284485,
      "step": 665,
      "valid_targets_mean": 2799.9,
      "valid_targets_min": 464
    },
    {
      "epoch": 2.1474358974358974,
      "grad_norm": 0.5727755387928921,
      "learning_rate": 2.820825610905514e-05,
      "loss": 0.4517,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21268504858016968,
      "step": 670,
      "valid_targets_mean": 1740.4,
      "valid_targets_min": 376
    },
    {
      "epoch": 2.1634615384615383,
      "grad_norm": 0.5102342820268265,
      "learning_rate": 2.8003699795324674e-05,
      "loss": 0.4343,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1873595267534256,
      "step": 675,
      "valid_targets_mean": 1921.6,
      "valid_targets_min": 393
    },
    {
      "epoch": 2.1794871794871793,
      "grad_norm": 0.5212794879302061,
      "learning_rate": 2.7798141656746606e-05,
      "loss": 0.447,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2737618684768677,
      "step": 680,
      "valid_targets_mean": 2370.6,
      "valid_targets_min": 346
    },
    {
      "epoch": 2.1955128205128207,
      "grad_norm": 0.4882810001947318,
      "learning_rate": 2.7591607423077932e-05,
      "loss": 0.481,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.13172554969787598,
      "step": 685,
      "valid_targets_mean": 1362.9,
      "valid_targets_min": 382
    },
    {
      "epoch": 2.2115384615384617,
      "grad_norm": 0.6207677882628246,
      "learning_rate": 2.738412294625369e-05,
      "loss": 0.4491,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.23348423838615417,
      "step": 690,
      "valid_targets_mean": 2125.4,
      "valid_targets_min": 544
    },
    {
      "epoch": 2.2275641025641026,
      "grad_norm": 0.5134803204787327,
      "learning_rate": 2.717571419715107e-05,
      "loss": 0.4205,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21478433907032013,
      "step": 695,
      "valid_targets_mean": 1724.8,
      "valid_targets_min": 372
    },
    {
      "epoch": 2.2435897435897436,
      "grad_norm": 0.49066453024135814,
      "learning_rate": 2.69664072623386e-05,
      "loss": 0.4644,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.23817721009254456,
      "step": 700,
      "valid_targets_mean": 2259.7,
      "valid_targets_min": 408
    },
    {
      "epoch": 2.2596153846153846,
      "grad_norm": 0.5896960527239582,
      "learning_rate": 2.6756228340810946e-05,
      "loss": 0.4499,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2211766242980957,
      "step": 705,
      "valid_targets_mean": 1644.1,
      "valid_targets_min": 303
    },
    {
      "epoch": 2.2756410256410255,
      "grad_norm": 0.47096626497110644,
      "learning_rate": 2.6545203740709502e-05,
      "loss": 0.444,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24633574485778809,
      "step": 710,
      "valid_targets_mean": 2245.6,
      "valid_targets_min": 496
    },
    {
      "epoch": 2.2916666666666665,
      "grad_norm": 0.4898735632976753,
      "learning_rate": 2.6333359876029455e-05,
      "loss": 0.4469,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2112981081008911,
      "step": 715,
      "valid_targets_mean": 1969.1,
      "valid_targets_min": 414
    },
    {
      "epoch": 2.3076923076923075,
      "grad_norm": 0.501391834341433,
      "learning_rate": 2.612072326331351e-05,
      "loss": 0.4178,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2247483730316162,
      "step": 720,
      "valid_targets_mean": 2423.8,
      "valid_targets_min": 393
    },
    {
      "epoch": 2.323717948717949,
      "grad_norm": 0.4217215747925792,
      "learning_rate": 2.5907320518332827e-05,
      "loss": 0.4313,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.19624283909797668,
      "step": 725,
      "valid_targets_mean": 2825.5,
      "valid_targets_min": 544
    },
    {
      "epoch": 2.33974358974359,
      "grad_norm": 0.49601599026984694,
      "learning_rate": 2.5693178352755497e-05,
      "loss": 0.4074,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.202076256275177,
      "step": 730,
      "valid_targets_mean": 2533.4,
      "valid_targets_min": 617
    },
    {
      "epoch": 2.355769230769231,
      "grad_norm": 0.5353940844579022,
      "learning_rate": 2.547832357080305e-05,
      "loss": 0.4227,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2339232861995697,
      "step": 735,
      "valid_targets_mean": 1994.9,
      "valid_targets_min": 524
    },
    {
      "epoch": 2.371794871794872,
      "grad_norm": 0.5722824667248534,
      "learning_rate": 2.5262783065895377e-05,
      "loss": 0.4452,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2249128520488739,
      "step": 740,
      "valid_targets_mean": 1781.4,
      "valid_targets_min": 326
    },
    {
      "epoch": 2.3878205128205128,
      "grad_norm": 0.5007302300195212,
      "learning_rate": 2.5046583817284437e-05,
      "loss": 0.4542,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.17838139832019806,
      "step": 745,
      "valid_targets_mean": 1831.7,
      "valid_targets_min": 347
    },
    {
      "epoch": 2.4038461538461537,
      "grad_norm": 0.4472396981588018,
      "learning_rate": 2.48297528866773e-05,
      "loss": 0.4087,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1966041922569275,
      "step": 750,
      "valid_targets_mean": 2101.4,
      "valid_targets_min": 507
    },
    {
      "epoch": 2.4198717948717947,
      "grad_norm": 0.5475486438741652,
      "learning_rate": 2.4612317414848804e-05,
      "loss": 0.4367,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2544914484024048,
      "step": 755,
      "valid_targets_mean": 2436.7,
      "valid_targets_min": 548
    },
    {
      "epoch": 2.435897435897436,
      "grad_norm": 0.47978909370549155,
      "learning_rate": 2.4394304618244346e-05,
      "loss": 0.4467,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2271379828453064,
      "step": 760,
      "valid_targets_mean": 2447.1,
      "valid_targets_min": 399
    },
    {
      "epoch": 2.451923076923077,
      "grad_norm": 0.6270651047991183,
      "learning_rate": 2.4175741785573177e-05,
      "loss": 0.4528,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2507140636444092,
      "step": 765,
      "valid_targets_mean": 1775.8,
      "valid_targets_min": 287
    },
    {
      "epoch": 2.467948717948718,
      "grad_norm": 0.3929435528764122,
      "learning_rate": 2.39566562743927e-05,
      "loss": 0.4189,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.19187305867671967,
      "step": 770,
      "valid_targets_mean": 3374.7,
      "valid_targets_min": 597
    },
    {
      "epoch": 2.483974358974359,
      "grad_norm": 0.527375808149042,
      "learning_rate": 2.3737075507684103e-05,
      "loss": 0.4494,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.22173798084259033,
      "step": 775,
      "valid_targets_mean": 1856.5,
      "valid_targets_min": 414
    },
    {
      "epoch": 2.5,
      "grad_norm": 0.5997723972038063,
      "learning_rate": 2.3517026970419786e-05,
      "loss": 0.4365,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24415044486522675,
      "step": 780,
      "valid_targets_mean": 1901.2,
      "valid_targets_min": 779
    },
    {
      "epoch": 2.516025641025641,
      "grad_norm": 0.48377772022532683,
      "learning_rate": 2.3296538206123134e-05,
      "loss": 0.4155,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21287669241428375,
      "step": 785,
      "valid_targets_mean": 2185.6,
      "valid_targets_min": 399
    },
    {
      "epoch": 2.532051282051282,
      "grad_norm": 0.5468759021698991,
      "learning_rate": 2.307563681342081e-05,
      "loss": 0.4634,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2165958732366562,
      "step": 790,
      "valid_targets_mean": 2127.9,
      "valid_targets_min": 592
    },
    {
      "epoch": 2.5480769230769234,
      "grad_norm": 0.47406985778934707,
      "learning_rate": 2.285435044258829e-05,
      "loss": 0.4235,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20566615462303162,
      "step": 795,
      "valid_targets_mean": 2176.4,
      "valid_targets_min": 353
    },
    {
      "epoch": 2.564102564102564,
      "grad_norm": 0.5531693361265784,
      "learning_rate": 2.263270679208883e-05,
      "loss": 0.4375,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20676007866859436,
      "step": 800,
      "valid_targets_mean": 1450.8,
      "valid_targets_min": 343
    },
    {
      "epoch": 2.5801282051282053,
      "grad_norm": 0.5471762527126571,
      "learning_rate": 2.2410733605106462e-05,
      "loss": 0.4427,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2094150185585022,
      "step": 805,
      "valid_targets_mean": 1916.5,
      "valid_targets_min": 657
    },
    {
      "epoch": 2.5961538461538463,
      "grad_norm": 0.457621920491644,
      "learning_rate": 2.2188458666073382e-05,
      "loss": 0.4447,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21128109097480774,
      "step": 810,
      "valid_targets_mean": 2713.3,
      "valid_targets_min": 336
    },
    {
      "epoch": 2.6121794871794872,
      "grad_norm": 0.5354268147970072,
      "learning_rate": 2.1965909797192143e-05,
      "loss": 0.4372,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.18181543052196503,
      "step": 815,
      "valid_targets_mean": 1601.1,
      "valid_targets_min": 422
    },
    {
      "epoch": 2.628205128205128,
      "grad_norm": 0.5148256202815014,
      "learning_rate": 2.174311485495317e-05,
      "loss": 0.4303,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20850974321365356,
      "step": 820,
      "valid_targets_mean": 2054.1,
      "valid_targets_min": 358
    },
    {
      "epoch": 2.644230769230769,
      "grad_norm": 0.5117934823979483,
      "learning_rate": 2.1520101726647922e-05,
      "loss": 0.4482,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24301588535308838,
      "step": 825,
      "valid_targets_mean": 2009.7,
      "valid_targets_min": 548
    },
    {
      "epoch": 2.66025641025641,
      "grad_norm": 0.5932725780271455,
      "learning_rate": 2.1296898326878282e-05,
      "loss": 0.4368,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20315149426460266,
      "step": 830,
      "valid_targets_mean": 1422.9,
      "valid_targets_min": 382
    },
    {
      "epoch": 2.676282051282051,
      "grad_norm": 0.5511240954228953,
      "learning_rate": 2.1073532594062432e-05,
      "loss": 0.4287,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20835387706756592,
      "step": 835,
      "valid_targets_mean": 1824.1,
      "valid_targets_min": 406
    },
    {
      "epoch": 2.6923076923076925,
      "grad_norm": 0.48108009842119964,
      "learning_rate": 2.0850032486937838e-05,
      "loss": 0.413,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.23764106631278992,
      "step": 840,
      "valid_targets_mean": 2332.3,
      "valid_targets_min": 311
    },
    {
      "epoch": 2.7083333333333335,
      "grad_norm": 0.45578124236246004,
      "learning_rate": 2.0626425981061608e-05,
      "loss": 0.4221,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.16820326447486877,
      "step": 845,
      "valid_targets_mean": 1958.2,
      "valid_targets_min": 427
    },
    {
      "epoch": 2.7243589743589745,
      "grad_norm": 0.527649928455185,
      "learning_rate": 2.0402741065308808e-05,
      "loss": 0.4325,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2456822693347931,
      "step": 850,
      "valid_targets_mean": 1982.1,
      "valid_targets_min": 447
    },
    {
      "epoch": 2.7403846153846154,
      "grad_norm": 0.545838162469139,
      "learning_rate": 2.0179005738369098e-05,
      "loss": 0.4479,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.19371215999126434,
      "step": 855,
      "valid_targets_mean": 1953.6,
      "valid_targets_min": 404
    },
    {
      "epoch": 2.7564102564102564,
      "grad_norm": 0.5137794607606895,
      "learning_rate": 1.995524800524211e-05,
      "loss": 0.4463,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.17609572410583496,
      "step": 860,
      "valid_targets_mean": 1501.8,
      "valid_targets_min": 397
    },
    {
      "epoch": 2.7724358974358974,
      "grad_norm": 0.5022662147440222,
      "learning_rate": 1.9731495873732055e-05,
      "loss": 0.4475,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.26271939277648926,
      "step": 865,
      "valid_targets_mean": 2227.0,
      "valid_targets_min": 380
    },
    {
      "epoch": 2.7884615384615383,
      "grad_norm": 0.44907950593239604,
      "learning_rate": 1.9507777350941996e-05,
      "loss": 0.417,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20136427879333496,
      "step": 870,
      "valid_targets_mean": 3125.4,
      "valid_targets_min": 477
    },
    {
      "epoch": 2.8044871794871797,
      "grad_norm": 0.48568732874510356,
      "learning_rate": 1.9284120439768192e-05,
      "loss": 0.4371,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1716795265674591,
      "step": 875,
      "valid_targets_mean": 1739.9,
      "valid_targets_min": 556
    },
    {
      "epoch": 2.8205128205128203,
      "grad_norm": 0.560681495754532,
      "learning_rate": 1.9060553135394957e-05,
      "loss": 0.4403,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.25348377227783203,
      "step": 880,
      "valid_targets_mean": 2066.1,
      "valid_targets_min": 481
    },
    {
      "epoch": 2.8365384615384617,
      "grad_norm": 0.5208153414018862,
      "learning_rate": 1.8837103421790486e-05,
      "loss": 0.4099,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.18841373920440674,
      "step": 885,
      "valid_targets_mean": 2157.9,
      "valid_targets_min": 500
    },
    {
      "epoch": 2.8525641025641026,
      "grad_norm": 0.532992574302052,
      "learning_rate": 1.861379926820414e-05,
      "loss": 0.4324,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2288801670074463,
      "step": 890,
      "valid_targets_mean": 1894.5,
      "valid_targets_min": 394
    },
    {
      "epoch": 2.8685897435897436,
      "grad_norm": 0.49754798570296427,
      "learning_rate": 1.8390668625665483e-05,
      "loss": 0.4173,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.25023743510246277,
      "step": 895,
      "valid_targets_mean": 2521.0,
      "valid_targets_min": 615
    },
    {
      "epoch": 2.8846153846153846,
      "grad_norm": 0.5090535372637991,
      "learning_rate": 1.8167739423485668e-05,
      "loss": 0.4547,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20940105617046356,
      "step": 900,
      "valid_targets_mean": 2438.8,
      "valid_targets_min": 464
    },
    {
      "epoch": 2.9006410256410255,
      "grad_norm": 0.4245436673848715,
      "learning_rate": 1.794503956576152e-05,
      "loss": 0.4422,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21880042552947998,
      "step": 905,
      "valid_targets_mean": 3292.9,
      "valid_targets_min": 483
    },
    {
      "epoch": 2.9166666666666665,
      "grad_norm": 0.512498398614729,
      "learning_rate": 1.7722596927882758e-05,
      "loss": 0.456,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1915343850851059,
      "step": 910,
      "valid_targets_mean": 2097.7,
      "valid_targets_min": 423
    },
    {
      "epoch": 2.9326923076923075,
      "grad_norm": 0.5002179520743993,
      "learning_rate": 1.7500439353042834e-05,
      "loss": 0.428,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.19558550417423248,
      "step": 915,
      "valid_targets_mean": 1932.4,
      "valid_targets_min": 352
    },
    {
      "epoch": 2.948717948717949,
      "grad_norm": 0.5271342144848477,
      "learning_rate": 1.727859464875381e-05,
      "loss": 0.4672,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.23308855295181274,
      "step": 920,
      "valid_targets_mean": 2075.1,
      "valid_targets_min": 458
    },
    {
      "epoch": 2.96474358974359,
      "grad_norm": 0.9339459055765652,
      "learning_rate": 1.7057090583365678e-05,
      "loss": 0.4491,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20995834469795227,
      "step": 925,
      "valid_targets_mean": 1836.2,
      "valid_targets_min": 369
    },
    {
      "epoch": 2.980769230769231,
      "grad_norm": 0.4858744121036798,
      "learning_rate": 1.6835954882590567e-05,
      "loss": 0.4596,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21504682302474976,
      "step": 930,
      "valid_targets_mean": 2529.9,
      "valid_targets_min": 390
    },
    {
      "epoch": 2.996794871794872,
      "grad_norm": 0.5223177985055565,
      "learning_rate": 1.6615215226032332e-05,
      "loss": 0.3969,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2861439883708954,
      "step": 935,
      "valid_targets_mean": 2334.1,
      "valid_targets_min": 556
    },
    {
      "epoch": 3.0128205128205128,
      "grad_norm": 0.5081953568971541,
      "learning_rate": 1.6394899243721887e-05,
      "loss": 0.4444,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.18385818600654602,
      "step": 940,
      "valid_targets_mean": 1744.4,
      "valid_targets_min": 456
    },
    {
      "epoch": 3.0288461538461537,
      "grad_norm": 0.41196760326087184,
      "learning_rate": 1.6175034512658753e-05,
      "loss": 0.41,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1653943955898285,
      "step": 945,
      "valid_targets_mean": 2961.9,
      "valid_targets_min": 464
    },
    {
      "epoch": 3.0448717948717947,
      "grad_norm": 0.46276766410726833,
      "learning_rate": 1.5955648553359247e-05,
      "loss": 0.4061,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1766689419746399,
      "step": 950,
      "valid_targets_mean": 2314.1,
      "valid_targets_min": 519
    },
    {
      "epoch": 3.0608974358974357,
      "grad_norm": 0.56466145662721,
      "learning_rate": 1.5736768826411683e-05,
      "loss": 0.3975,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.17233410477638245,
      "step": 955,
      "valid_targets_mean": 1736.1,
      "valid_targets_min": 368
    },
    {
      "epoch": 3.076923076923077,
      "grad_norm": 0.6184183203209048,
      "learning_rate": 1.5518422729039188e-05,
      "loss": 0.4366,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2544904947280884,
      "step": 960,
      "valid_targets_mean": 1785.6,
      "valid_targets_min": 453
    },
    {
      "epoch": 3.092948717948718,
      "grad_norm": 0.46138818996251113,
      "learning_rate": 1.5300637591670357e-05,
      "loss": 0.3877,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2141857147216797,
      "step": 965,
      "valid_targets_mean": 3189.5,
      "valid_targets_min": 635
    },
    {
      "epoch": 3.108974358974359,
      "grad_norm": 0.5024028000700136,
      "learning_rate": 1.5083440674518302e-05,
      "loss": 0.4141,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20946665108203888,
      "step": 970,
      "valid_targets_mean": 2281.5,
      "valid_targets_min": 477
    },
    {
      "epoch": 3.125,
      "grad_norm": 0.6617512350367286,
      "learning_rate": 1.4866859164168466e-05,
      "loss": 0.4462,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.27546098828315735,
      "step": 975,
      "valid_targets_mean": 1994.2,
      "valid_targets_min": 291
    },
    {
      "epoch": 3.141025641025641,
      "grad_norm": 0.5778578694843474,
      "learning_rate": 1.4650920170175704e-05,
      "loss": 0.431,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.19753442704677582,
      "step": 980,
      "valid_targets_mean": 1745.9,
      "valid_targets_min": 326
    },
    {
      "epoch": 3.157051282051282,
      "grad_norm": 0.4876046302233207,
      "learning_rate": 1.443565072167095e-05,
      "loss": 0.4193,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1774245798587799,
      "step": 985,
      "valid_targets_mean": 1624.2,
      "valid_targets_min": 572
    },
    {
      "epoch": 3.173076923076923,
      "grad_norm": 0.5738704159928016,
      "learning_rate": 1.4221077763977984e-05,
      "loss": 0.4254,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2392444908618927,
      "step": 990,
      "valid_targets_mean": 1980.4,
      "valid_targets_min": 784
    },
    {
      "epoch": 3.189102564102564,
      "grad_norm": 0.4850487138995122,
      "learning_rate": 1.4007228155240696e-05,
      "loss": 0.4209,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2174842357635498,
      "step": 995,
      "valid_targets_mean": 2492.1,
      "valid_targets_min": 459
    },
    {
      "epoch": 3.2051282051282053,
      "grad_norm": 0.529762108647159,
      "learning_rate": 1.37941286630612e-05,
      "loss": 0.4147,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.22387659549713135,
      "step": 1000,
      "valid_targets_mean": 1882.1,
      "valid_targets_min": 355
    },
    {
      "epoch": 3.2211538461538463,
      "grad_norm": 0.4709252470917212,
      "learning_rate": 1.3581805961149371e-05,
      "loss": 0.4275,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.17616716027259827,
      "step": 1005,
      "valid_targets_mean": 2260.7,
      "valid_targets_min": 481
    },
    {
      "epoch": 3.2371794871794872,
      "grad_norm": 0.4920991562633389,
      "learning_rate": 1.3370286625984089e-05,
      "loss": 0.4291,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1874414086341858,
      "step": 1010,
      "valid_targets_mean": 1999.1,
      "valid_targets_min": 389
    },
    {
      "epoch": 3.253205128205128,
      "grad_norm": 0.4366015680605223,
      "learning_rate": 1.3159597133486628e-05,
      "loss": 0.4132,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1775241196155548,
      "step": 1015,
      "valid_targets_mean": 2691.2,
      "valid_targets_min": 492
    },
    {
      "epoch": 3.269230769230769,
      "grad_norm": 0.5159579418833546,
      "learning_rate": 1.2949763855706678e-05,
      "loss": 0.3984,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20066994428634644,
      "step": 1020,
      "valid_targets_mean": 2245.2,
      "valid_targets_min": 414
    },
    {
      "epoch": 3.28525641025641,
      "grad_norm": 0.5876671407131282,
      "learning_rate": 1.274081305752135e-05,
      "loss": 0.4516,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1973981410264969,
      "step": 1025,
      "valid_targets_mean": 1791.3,
      "valid_targets_min": 398
    },
    {
      "epoch": 3.301282051282051,
      "grad_norm": 0.6456536801741808,
      "learning_rate": 1.2532770893347582e-05,
      "loss": 0.427,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.3110905885696411,
      "step": 1030,
      "valid_targets_mean": 1891.8,
      "valid_targets_min": 324
    },
    {
      "epoch": 3.3173076923076925,
      "grad_norm": 0.5293106844776568,
      "learning_rate": 1.2325663403868406e-05,
      "loss": 0.4164,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.230901837348938,
      "step": 1035,
      "valid_targets_mean": 2292.3,
      "valid_targets_min": 355
    },
    {
      "epoch": 3.3333333333333335,
      "grad_norm": 0.5522757760846092,
      "learning_rate": 1.2119516512773424e-05,
      "loss": 0.3895,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24217258393764496,
      "step": 1040,
      "valid_targets_mean": 2009.1,
      "valid_targets_min": 408
    },
    {
      "epoch": 3.3493589743589745,
      "grad_norm": 0.5560321667957103,
      "learning_rate": 1.1914356023513904e-05,
      "loss": 0.4459,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.23398807644844055,
      "step": 1045,
      "valid_targets_mean": 2263.5,
      "valid_targets_min": 539
    },
    {
      "epoch": 3.3653846153846154,
      "grad_norm": 0.4825967281763318,
      "learning_rate": 1.1710207616073001e-05,
      "loss": 0.3927,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21472863852977753,
      "step": 1050,
      "valid_targets_mean": 2439.7,
      "valid_targets_min": 286
    },
    {
      "epoch": 3.3814102564102564,
      "grad_norm": 0.5322770350466977,
      "learning_rate": 1.1507096843751372e-05,
      "loss": 0.4218,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.17266938090324402,
      "step": 1055,
      "valid_targets_mean": 1598.1,
      "valid_targets_min": 387
    },
    {
      "epoch": 3.3974358974358974,
      "grad_norm": 0.7827125593311665,
      "learning_rate": 1.1305049129968637e-05,
      "loss": 0.4349,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1991385519504547,
      "step": 1060,
      "valid_targets_mean": 2439.3,
      "valid_targets_min": 608
    },
    {
      "epoch": 3.4134615384615383,
      "grad_norm": 0.44528916459778456,
      "learning_rate": 1.110408976508118e-05,
      "loss": 0.3907,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1545448899269104,
      "step": 1065,
      "valid_targets_mean": 2074.4,
      "valid_targets_min": 396
    },
    {
      "epoch": 3.4294871794871793,
      "grad_norm": 0.48384890001970277,
      "learning_rate": 1.090424390321648e-05,
      "loss": 0.4352,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.18344886600971222,
      "step": 1070,
      "valid_targets_mean": 2136.0,
      "valid_targets_min": 406
    },
    {
      "epoch": 3.4455128205128207,
      "grad_norm": 0.46732111222809075,
      "learning_rate": 1.070553655912463e-05,
      "loss": 0.3894,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.13502533733844757,
      "step": 1075,
      "valid_targets_mean": 1907.0,
      "valid_targets_min": 400
    },
    {
      "epoch": 3.4615384615384617,
      "grad_norm": 0.46066416755356465,
      "learning_rate": 1.0507992605047193e-05,
      "loss": 0.4055,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1755571961402893,
      "step": 1080,
      "valid_targets_mean": 2637.7,
      "valid_targets_min": 457
    },
    {
      "epoch": 3.4775641025641026,
      "grad_norm": 0.3719838719731155,
      "learning_rate": 1.0311636767603952e-05,
      "loss": 0.3946,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.14000138640403748,
      "step": 1085,
      "valid_targets_mean": 2861.4,
      "valid_targets_min": 495
    },
    {
      "epoch": 3.4935897435897436,
      "grad_norm": 0.5828556028812071,
      "learning_rate": 1.0116493624697862e-05,
      "loss": 0.4203,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.3252260684967041,
      "step": 1090,
      "valid_targets_mean": 2756.8,
      "valid_targets_min": 533
    },
    {
      "epoch": 3.5096153846153846,
      "grad_norm": 0.43638255215532396,
      "learning_rate": 9.922587602438657e-06,
      "loss": 0.3941,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.18718764185905457,
      "step": 1095,
      "valid_targets_mean": 2623.4,
      "valid_targets_min": 420
    },
    {
      "epoch": 3.5256410256410255,
      "grad_norm": 0.5594326378178172,
      "learning_rate": 9.729942972085401e-06,
      "loss": 0.4182,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20950523018836975,
      "step": 1100,
      "valid_targets_mean": 1888.2,
      "valid_targets_min": 398
    },
    {
      "epoch": 3.5416666666666665,
      "grad_norm": 0.6153082072669694,
      "learning_rate": 9.538583847008452e-06,
      "loss": 0.4508,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24810105562210083,
      "step": 1105,
      "valid_targets_mean": 1652.6,
      "valid_targets_min": 487
    },
    {
      "epoch": 3.5576923076923075,
      "grad_norm": 0.7347949249771237,
      "learning_rate": 9.348534179671202e-06,
      "loss": 0.4446,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1828898787498474,
      "step": 1110,
      "valid_targets_mean": 1291.9,
      "valid_targets_min": 384
    },
    {
      "epoch": 3.573717948717949,
      "grad_norm": 0.4885273908189287,
      "learning_rate": 9.159817758631923e-06,
      "loss": 0.4148,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21009644865989685,
      "step": 1115,
      "valid_targets_mean": 2135.0,
      "valid_targets_min": 345
    },
    {
      "epoch": 3.58974358974359,
      "grad_norm": 0.4973124736202378,
      "learning_rate": 8.972458205566168e-06,
      "loss": 0.4288,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.15964004397392273,
      "step": 1120,
      "valid_targets_mean": 1893.4,
      "valid_targets_min": 460
    },
    {
      "epoch": 3.605769230769231,
      "grad_norm": 0.5441599943681932,
      "learning_rate": 8.786478972310023e-06,
      "loss": 0.4375,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2124439775943756,
      "step": 1125,
      "valid_targets_mean": 2145.6,
      "valid_targets_min": 336
    },
    {
      "epoch": 3.621794871794872,
      "grad_norm": 0.5226367162201916,
      "learning_rate": 8.601903337924646e-06,
      "loss": 0.3906,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.19349414110183716,
      "step": 1130,
      "valid_targets_mean": 2012.8,
      "valid_targets_min": 509
    },
    {
      "epoch": 3.6378205128205128,
      "grad_norm": 0.5145848515018033,
      "learning_rate": 8.418754405782423e-06,
      "loss": 0.4056,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2273569405078888,
      "step": 1135,
      "valid_targets_mean": 2077.1,
      "valid_targets_min": 426
    },
    {
      "epoch": 3.6538461538461537,
      "grad_norm": 0.5175398660560526,
      "learning_rate": 8.237055100675092e-06,
      "loss": 0.4016,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.22114655375480652,
      "step": 1140,
      "valid_targets_mean": 2420.2,
      "valid_targets_min": 386
    },
    {
      "epoch": 3.6698717948717947,
      "grad_norm": 0.6277817059082492,
      "learning_rate": 8.056828165944282e-06,
      "loss": 0.4462,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.26035845279693604,
      "step": 1145,
      "valid_targets_mean": 1739.6,
      "valid_targets_min": 324
    },
    {
      "epoch": 3.685897435897436,
      "grad_norm": 0.5854299128793944,
      "learning_rate": 7.878096160634675e-06,
      "loss": 0.4342,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.22393161058425903,
      "step": 1150,
      "valid_targets_mean": 1604.9,
      "valid_targets_min": 517
    },
    {
      "epoch": 3.7019230769230766,
      "grad_norm": 0.6521482846929779,
      "learning_rate": 7.700881456670342e-06,
      "loss": 0.4199,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21592406928539276,
      "step": 1155,
      "valid_targets_mean": 1704.6,
      "valid_targets_min": 372
    },
    {
      "epoch": 3.717948717948718,
      "grad_norm": 0.5205545018221379,
      "learning_rate": 7.525206236054385e-06,
      "loss": 0.4159,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.19648584723472595,
      "step": 1160,
      "valid_targets_mean": 1921.7,
      "valid_targets_min": 393
    },
    {
      "epoch": 3.733974358974359,
      "grad_norm": 0.5195989305298412,
      "learning_rate": 7.3510924880924575e-06,
      "loss": 0.4233,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.17861494421958923,
      "step": 1165,
      "valid_targets_mean": 1717.1,
      "valid_targets_min": 479
    },
    {
      "epoch": 3.75,
      "grad_norm": 0.6033763727537506,
      "learning_rate": 7.178562006640337e-06,
      "loss": 0.4242,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20282906293869019,
      "step": 1170,
      "valid_targets_mean": 1704.9,
      "valid_targets_min": 409
    },
    {
      "epoch": 3.766025641025641,
      "grad_norm": 0.8520137624165722,
      "learning_rate": 7.0076363873759865e-06,
      "loss": 0.3928,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21843525767326355,
      "step": 1175,
      "valid_targets_mean": 2615.6,
      "valid_targets_min": 500
    },
    {
      "epoch": 3.782051282051282,
      "grad_norm": 0.5354434243394129,
      "learning_rate": 6.838337025096424e-06,
      "loss": 0.3922,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2174426019191742,
      "step": 1180,
      "valid_targets_mean": 2017.8,
      "valid_targets_min": 482
    },
    {
      "epoch": 3.7980769230769234,
      "grad_norm": 0.5105220829406444,
      "learning_rate": 6.67068511103971e-06,
      "loss": 0.4288,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.18573346734046936,
      "step": 1185,
      "valid_targets_mean": 2131.7,
      "valid_targets_min": 499
    },
    {
      "epoch": 3.814102564102564,
      "grad_norm": 0.46857007935338224,
      "learning_rate": 6.504701630232475e-06,
      "loss": 0.4107,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.17006590962409973,
      "step": 1190,
      "valid_targets_mean": 1914.7,
      "valid_targets_min": 476
    },
    {
      "epoch": 3.8301282051282053,
      "grad_norm": 0.5407396992987427,
      "learning_rate": 6.340407358863167e-06,
      "loss": 0.3835,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.16990578174591064,
      "step": 1195,
      "valid_targets_mean": 1394.6,
      "valid_targets_min": 363
    },
    {
      "epoch": 3.8461538461538463,
      "grad_norm": 0.47292976742071363,
      "learning_rate": 6.177822861681557e-06,
      "loss": 0.4242,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1876613199710846,
      "step": 1200,
      "valid_targets_mean": 2349.9,
      "valid_targets_min": 393
    },
    {
      "epoch": 3.8621794871794872,
      "grad_norm": 0.4841137938946458,
      "learning_rate": 6.016968489424572e-06,
      "loss": 0.4346,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.14386187493801117,
      "step": 1205,
      "valid_targets_mean": 1697.8,
      "valid_targets_min": 220
    },
    {
      "epoch": 3.878205128205128,
      "grad_norm": 0.5708595597284355,
      "learning_rate": 5.857864376269051e-06,
      "loss": 0.4374,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.23375602066516876,
      "step": 1210,
      "valid_targets_mean": 1680.6,
      "valid_targets_min": 381
    },
    {
      "epoch": 3.894230769230769,
      "grad_norm": 0.5084621641793788,
      "learning_rate": 5.700530437311509e-06,
      "loss": 0.4229,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.18736353516578674,
      "step": 1215,
      "valid_targets_mean": 1901.4,
      "valid_targets_min": 381
    },
    {
      "epoch": 3.91025641025641,
      "grad_norm": 0.5301004661796407,
      "learning_rate": 5.544986366075371e-06,
      "loss": 0.4391,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1670445203781128,
      "step": 1220,
      "valid_targets_mean": 1648.1,
      "valid_targets_min": 401
    },
    {
      "epoch": 3.926282051282051,
      "grad_norm": 0.6134172232948031,
      "learning_rate": 5.39125163204594e-06,
      "loss": 0.4133,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21446377038955688,
      "step": 1225,
      "valid_targets_mean": 1942.4,
      "valid_targets_min": 483
    },
    {
      "epoch": 3.9423076923076925,
      "grad_norm": 0.5974202428194099,
      "learning_rate": 5.239345478233364e-06,
      "loss": 0.4258,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.17354455590248108,
      "step": 1230,
      "valid_targets_mean": 1358.0,
      "valid_targets_min": 369
    },
    {
      "epoch": 3.9583333333333335,
      "grad_norm": 0.4483178567987285,
      "learning_rate": 5.089286918764031e-06,
      "loss": 0.3961,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.19412055611610413,
      "step": 1235,
      "valid_targets_mean": 2878.3,
      "valid_targets_min": 803
    },
    {
      "epoch": 3.9743589743589745,
      "grad_norm": 0.4507178360947217,
      "learning_rate": 4.941094736500522e-06,
      "loss": 0.4006,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.16912227869033813,
      "step": 1240,
      "valid_targets_mean": 2105.1,
      "valid_targets_min": 357
    },
    {
      "epoch": 3.9903846153846154,
      "grad_norm": 0.5411117764458047,
      "learning_rate": 4.794787480690597e-06,
      "loss": 0.4147,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.18049368262290955,
      "step": 1245,
      "valid_targets_mean": 1542.9,
      "valid_targets_min": 366
    },
    {
      "epoch": 4.006410256410256,
      "grad_norm": 0.5020314686782774,
      "learning_rate": 4.650383464645338e-06,
      "loss": 0.4072,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.17812328040599823,
      "step": 1250,
      "valid_targets_mean": 2127.0,
      "valid_targets_min": 558
    },
    {
      "epoch": 4.022435897435898,
      "grad_norm": 0.8897516856466173,
      "learning_rate": 4.507900763446911e-06,
      "loss": 0.4323,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.17299619317054749,
      "step": 1255,
      "valid_targets_mean": 1772.4,
      "valid_targets_min": 401
    },
    {
      "epoch": 4.038461538461538,
      "grad_norm": 0.5155047635305318,
      "learning_rate": 4.367357211686072e-06,
      "loss": 0.4405,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2016928344964981,
      "step": 1260,
      "valid_targets_mean": 1984.0,
      "valid_targets_min": 314
    },
    {
      "epoch": 4.05448717948718,
      "grad_norm": 0.5575252186312881,
      "learning_rate": 4.228770401229824e-06,
      "loss": 0.4146,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1600431501865387,
      "step": 1265,
      "valid_targets_mean": 1631.5,
      "valid_targets_min": 422
    },
    {
      "epoch": 4.07051282051282,
      "grad_norm": 0.4739201323516146,
      "learning_rate": 4.092157679019442e-06,
      "loss": 0.4126,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2213498055934906,
      "step": 1270,
      "valid_targets_mean": 2722.4,
      "valid_targets_min": 596
    },
    {
      "epoch": 4.086538461538462,
      "grad_norm": 0.5093029435546993,
      "learning_rate": 3.957536144899123e-06,
      "loss": 0.4053,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.16781838238239288,
      "step": 1275,
      "valid_targets_mean": 2022.2,
      "valid_targets_min": 454
    },
    {
      "epoch": 4.102564102564102,
      "grad_norm": 0.46573698307127626,
      "learning_rate": 3.8249226494756445e-06,
      "loss": 0.3686,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1653728187084198,
      "step": 1280,
      "valid_targets_mean": 2144.4,
      "valid_targets_min": 370
    },
    {
      "epoch": 4.118589743589744,
      "grad_norm": 0.49547650926816716,
      "learning_rate": 3.694333792009115e-06,
      "loss": 0.4204,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.16737449169158936,
      "step": 1285,
      "valid_targets_mean": 2180.3,
      "valid_targets_min": 390
    },
    {
      "epoch": 4.134615384615385,
      "grad_norm": 0.4959235045064883,
      "learning_rate": 3.565785918335292e-06,
      "loss": 0.4121,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.17612406611442566,
      "step": 1290,
      "valid_targets_mean": 2229.8,
      "valid_targets_min": 415
    },
    {
      "epoch": 4.1506410256410255,
      "grad_norm": 0.5497305685489215,
      "learning_rate": 3.43929511881953e-06,
      "loss": 0.4143,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21826569736003876,
      "step": 1295,
      "valid_targets_mean": 2172.8,
      "valid_targets_min": 378
    },
    {
      "epoch": 4.166666666666667,
      "grad_norm": 0.49016495730669646,
      "learning_rate": 3.3148772263427743e-06,
      "loss": 0.3962,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2120068520307541,
      "step": 1300,
      "valid_targets_mean": 2636.4,
      "valid_targets_min": 502
    },
    {
      "epoch": 4.1826923076923075,
      "grad_norm": 0.5410817941449617,
      "learning_rate": 3.1925478143197418e-06,
      "loss": 0.4026,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1488579511642456,
      "step": 1305,
      "valid_targets_mean": 1622.9,
      "valid_targets_min": 408
    },
    {
      "epoch": 4.198717948717949,
      "grad_norm": 0.5167531330373021,
      "learning_rate": 3.0723221947495907e-06,
      "loss": 0.4189,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.16238239407539368,
      "step": 1310,
      "valid_targets_mean": 2115.7,
      "valid_targets_min": 470
    },
    {
      "epoch": 4.214743589743589,
      "grad_norm": 0.5065500271116625,
      "learning_rate": 2.954215416299331e-06,
      "loss": 0.4129,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.18277542293071747,
      "step": 1315,
      "valid_targets_mean": 2185.4,
      "valid_targets_min": 358
    },
    {
      "epoch": 4.230769230769231,
      "grad_norm": 0.5004798136718417,
      "learning_rate": 2.838242262420148e-06,
      "loss": 0.4176,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.22836771607398987,
      "step": 1320,
      "valid_targets_mean": 2597.8,
      "valid_targets_min": 331
    },
    {
      "epoch": 4.246794871794872,
      "grad_norm": 0.5184618845461352,
      "learning_rate": 2.7244172494969978e-06,
      "loss": 0.4176,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.18959830701351166,
      "step": 1325,
      "valid_targets_mean": 2182.0,
      "valid_targets_min": 523
    },
    {
      "epoch": 4.262820512820513,
      "grad_norm": 0.4544775548224198,
      "learning_rate": 2.6127546250315438e-06,
      "loss": 0.3865,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.16856324672698975,
      "step": 1330,
      "valid_targets_mean": 2052.1,
      "valid_targets_min": 363
    },
    {
      "epoch": 4.278846153846154,
      "grad_norm": 0.6718829730259701,
      "learning_rate": 2.503268365858831e-06,
      "loss": 0.4097,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2597959339618683,
      "step": 1335,
      "valid_targets_mean": 1643.8,
      "valid_targets_min": 521
    },
    {
      "epoch": 4.294871794871795,
      "grad_norm": 0.6447551224819277,
      "learning_rate": 2.3959721763977805e-06,
      "loss": 0.431,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.22334489226341248,
      "step": 1340,
      "valid_targets_mean": 1838.8,
      "valid_targets_min": 447
    },
    {
      "epoch": 4.310897435897436,
      "grad_norm": 0.47106359697416067,
      "learning_rate": 2.2908794869358044e-06,
      "loss": 0.4107,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1753031313419342,
      "step": 1345,
      "valid_targets_mean": 2324.8,
      "valid_targets_min": 382
    },
    {
      "epoch": 4.326923076923077,
      "grad_norm": 0.4797964740997395,
      "learning_rate": 2.188003451947747e-06,
      "loss": 0.3904,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.13902968168258667,
      "step": 1350,
      "valid_targets_mean": 1571.4,
      "valid_targets_min": 365
    },
    {
      "epoch": 4.342948717948718,
      "grad_norm": 0.4974988695652104,
      "learning_rate": 2.0873569484493305e-06,
      "loss": 0.3924,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20952798426151276,
      "step": 1355,
      "valid_targets_mean": 2615.0,
      "valid_targets_min": 499
    },
    {
      "epoch": 4.358974358974359,
      "grad_norm": 0.5841534150892278,
      "learning_rate": 1.9889525743853323e-06,
      "loss": 0.3984,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21221312880516052,
      "step": 1360,
      "valid_targets_mean": 1916.5,
      "valid_targets_min": 199
    },
    {
      "epoch": 4.375,
      "grad_norm": 0.5200681440214403,
      "learning_rate": 1.8928026470526917e-06,
      "loss": 0.4282,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21217067539691925,
      "step": 1365,
      "valid_targets_mean": 1990.6,
      "valid_targets_min": 398
    },
    {
      "epoch": 4.391025641025641,
      "grad_norm": 0.5225656986310022,
      "learning_rate": 1.7989192015587776e-06,
      "loss": 0.4046,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21198615431785583,
      "step": 1370,
      "valid_targets_mean": 2139.8,
      "valid_targets_min": 495
    },
    {
      "epoch": 4.407051282051282,
      "grad_norm": 0.5718894420905976,
      "learning_rate": 1.7073139893149092e-06,
      "loss": 0.4265,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2715427577495575,
      "step": 1375,
      "valid_targets_mean": 2201.8,
      "valid_targets_min": 620
    },
    {
      "epoch": 4.423076923076923,
      "grad_norm": 0.4832349361730212,
      "learning_rate": 1.6179984765654743e-06,
      "loss": 0.3997,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.18295009434223175,
      "step": 1380,
      "valid_targets_mean": 2338.6,
      "valid_targets_min": 333
    },
    {
      "epoch": 4.439102564102564,
      "grad_norm": 0.5009262761860173,
      "learning_rate": 1.5309838429526714e-06,
      "loss": 0.4229,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.19573353230953217,
      "step": 1385,
      "valid_targets_mean": 2377.6,
      "valid_targets_min": 359
    },
    {
      "epoch": 4.455128205128205,
      "grad_norm": 0.4626576145917675,
      "learning_rate": 1.4462809801171428e-06,
      "loss": 0.4182,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.16738732159137726,
      "step": 1390,
      "valid_targets_mean": 2413.1,
      "valid_targets_min": 632
    },
    {
      "epoch": 4.471153846153846,
      "grad_norm": 0.5619638360015893,
      "learning_rate": 1.3639004903346954e-06,
      "loss": 0.4131,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.17360472679138184,
      "step": 1395,
      "valid_targets_mean": 1610.5,
      "valid_targets_min": 454
    },
    {
      "epoch": 4.487179487179487,
      "grad_norm": 0.5089087979706497,
      "learning_rate": 1.2838526851891864e-06,
      "loss": 0.4082,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.23789802193641663,
      "step": 1400,
      "valid_targets_mean": 2443.3,
      "valid_targets_min": 541
    },
    {
      "epoch": 4.503205128205128,
      "grad_norm": 0.5942691756087387,
      "learning_rate": 1.2061475842818337e-06,
      "loss": 0.4333,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21138739585876465,
      "step": 1405,
      "valid_targets_mean": 1548.1,
      "valid_targets_min": 474
    },
    {
      "epoch": 4.519230769230769,
      "grad_norm": 0.5181839449829251,
      "learning_rate": 1.1307949139770446e-06,
      "loss": 0.3959,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.18168583512306213,
      "step": 1410,
      "valid_targets_mean": 1700.7,
      "valid_targets_min": 316
    },
    {
      "epoch": 4.535256410256411,
      "grad_norm": 0.5691599181706188,
      "learning_rate": 1.057804106184992e-06,
      "loss": 0.4124,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20509378612041473,
      "step": 1415,
      "valid_targets_mean": 2220.6,
      "valid_targets_min": 390
    },
    {
      "epoch": 4.551282051282051,
      "grad_norm": 0.5362388152801542,
      "learning_rate": 9.871842971809853e-07,
      "loss": 0.3719,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.18971163034439087,
      "step": 1420,
      "valid_targets_mean": 2453.0,
      "valid_targets_min": 438
    },
    {
      "epoch": 4.5673076923076925,
      "grad_norm": 0.4217117551642382,
      "learning_rate": 9.189443264619102e-07,
      "loss": 0.3898,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.19224503636360168,
      "step": 1425,
      "valid_targets_mean": 3036.1,
      "valid_targets_min": 491
    },
    {
      "epoch": 4.583333333333333,
      "grad_norm": 0.50137069774833,
      "learning_rate": 8.530927356397778e-07,
      "loss": 0.4182,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.17977871000766754,
      "step": 1430,
      "valid_targets_mean": 1959.3,
      "valid_targets_min": 462
    },
    {
      "epoch": 4.5993589743589745,
      "grad_norm": 0.5147630870730896,
      "learning_rate": 7.896377673725553e-07,
      "loss": 0.4009,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.190871000289917,
      "step": 1435,
      "valid_targets_mean": 1864.3,
      "valid_targets_min": 436
    },
    {
      "epoch": 4.615384615384615,
      "grad_norm": 0.48363223511421033,
      "learning_rate": 7.285873643324514e-07,
      "loss": 0.4017,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21705955266952515,
      "step": 1440,
      "valid_targets_mean": 2462.3,
      "valid_targets_min": 621
    },
    {
      "epoch": 4.631410256410256,
      "grad_norm": 0.547275826405447,
      "learning_rate": 6.69949168211721e-07,
      "loss": 0.395,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2083073854446411,
      "step": 1445,
      "valid_targets_mean": 1937.9,
      "valid_targets_min": 472
    },
    {
      "epoch": 4.647435897435898,
      "grad_norm": 0.5515440239397343,
      "learning_rate": 6.137305187661513e-07,
      "loss": 0.4123,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.19437691569328308,
      "step": 1450,
      "valid_targets_mean": 1709.7,
      "valid_targets_min": 496
    },
    {
      "epoch": 4.663461538461538,
      "grad_norm": 0.5541400713883889,
      "learning_rate": 5.599384528963425e-07,
      "loss": 0.4069,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.17162460088729858,
      "step": 1455,
      "valid_targets_mean": 1923.9,
      "valid_targets_min": 338
    },
    {
      "epoch": 4.67948717948718,
      "grad_norm": 0.46459204192014386,
      "learning_rate": 5.085797037669072e-07,
      "loss": 0.3773,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.19353806972503662,
      "step": 1460,
      "valid_targets_mean": 2262.0,
      "valid_targets_min": 368
    },
    {
      "epoch": 4.69551282051282,
      "grad_norm": 0.5043482862484802,
      "learning_rate": 4.5966069996365993e-07,
      "loss": 0.3826,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.18038004636764526,
      "step": 1465,
      "valid_targets_mean": 2006.8,
      "valid_targets_min": 401
    },
    {
      "epoch": 4.711538461538462,
      "grad_norm": 0.47468830861646916,
      "learning_rate": 4.1318756468897047e-07,
      "loss": 0.4266,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21844631433486938,
      "step": 1470,
      "valid_targets_mean": 2434.2,
      "valid_targets_min": 499
    },
    {
      "epoch": 4.727564102564102,
      "grad_norm": 0.5712016674577056,
      "learning_rate": 3.691661149953096e-07,
      "loss": 0.4055,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2230275571346283,
      "step": 1475,
      "valid_targets_mean": 2119.4,
      "valid_targets_min": 454
    },
    {
      "epoch": 4.743589743589744,
      "grad_norm": 0.5286171152229552,
      "learning_rate": 3.2760186105712964e-07,
      "loss": 0.3816,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.19953539967536926,
      "step": 1480,
      "valid_targets_mean": 2190.5,
      "valid_targets_min": 390
    },
    {
      "epoch": 4.759615384615385,
      "grad_norm": 0.5355340610321968,
      "learning_rate": 2.8850000548115155e-07,
      "loss": 0.4263,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24080535769462585,
      "step": 1485,
      "valid_targets_mean": 1879.4,
      "valid_targets_min": 488
    },
    {
      "epoch": 4.7756410256410255,
      "grad_norm": 0.5704120262786105,
      "learning_rate": 2.518654426551592e-07,
      "loss": 0.4061,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2327512800693512,
      "step": 1490,
      "valid_targets_mean": 1950.7,
      "valid_targets_min": 424
    },
    {
      "epoch": 4.791666666666667,
      "grad_norm": 0.5892101716728328,
      "learning_rate": 2.1770275813536746e-07,
      "loss": 0.3985,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.19074735045433044,
      "step": 1495,
      "valid_targets_mean": 1708.5,
      "valid_targets_min": 530
    },
    {
      "epoch": 4.8076923076923075,
      "grad_norm": 0.5211300578683025,
      "learning_rate": 1.8601622807244312e-07,
      "loss": 0.4217,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21352173388004303,
      "step": 1500,
      "valid_targets_mean": 2224.9,
      "valid_targets_min": 466
    },
    {
      "epoch": 4.823717948717949,
      "grad_norm": 0.5950739817226455,
      "learning_rate": 1.5680981867625566e-07,
      "loss": 0.4065,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21843212842941284,
      "step": 1505,
      "valid_targets_mean": 1907.6,
      "valid_targets_min": 477
    },
    {
      "epoch": 4.839743589743589,
      "grad_norm": 0.4982907259604603,
      "learning_rate": 1.3008718571943636e-07,
      "loss": 0.4145,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.2082642912864685,
      "step": 1510,
      "valid_targets_mean": 2288.1,
      "valid_targets_min": 494
    },
    {
      "epoch": 4.855769230769231,
      "grad_norm": 0.7118715744452784,
      "learning_rate": 1.058516740797777e-07,
      "loss": 0.3914,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20714955031871796,
      "step": 1515,
      "valid_targets_mean": 1673.6,
      "valid_targets_min": 453
    },
    {
      "epoch": 4.871794871794872,
      "grad_norm": 0.636093382876181,
      "learning_rate": 8.410631732155062e-08,
      "loss": 0.4275,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24439842998981476,
      "step": 1520,
      "valid_targets_mean": 1889.8,
      "valid_targets_min": 369
    },
    {
      "epoch": 4.887820512820513,
      "grad_norm": 0.4919592475036989,
      "learning_rate": 6.485383731580142e-08,
      "loss": 0.3889,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.14140692353248596,
      "step": 1525,
      "valid_targets_mean": 1333.6,
      "valid_targets_min": 329
    },
    {
      "epoch": 4.903846153846154,
      "grad_norm": 0.46488274884652137,
      "learning_rate": 4.809664389964441e-08,
      "loss": 0.4254,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21400034427642822,
      "step": 1530,
      "valid_targets_mean": 2693.9,
      "valid_targets_min": 523
    },
    {
      "epoch": 4.919871794871795,
      "grad_norm": 0.5040958449228231,
      "learning_rate": 3.383683457463649e-08,
      "loss": 0.3597,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.1598944067955017,
      "step": 1535,
      "valid_targets_mean": 1648.6,
      "valid_targets_min": 371
    },
    {
      "epoch": 4.935897435897436,
      "grad_norm": 0.525773314679964,
      "learning_rate": 2.207619424421381e-08,
      "loss": 0.4026,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20952820777893066,
      "step": 1540,
      "valid_targets_mean": 2557.2,
      "valid_targets_min": 543
    },
    {
      "epoch": 4.951923076923077,
      "grad_norm": 0.5186226211951818,
      "learning_rate": 1.281619499029274e-08,
      "loss": 0.4238,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.23216500878334045,
      "step": 1545,
      "valid_targets_mean": 2368.4,
      "valid_targets_min": 554
    },
    {
      "epoch": 4.967948717948718,
      "grad_norm": 0.5881562216015847,
      "learning_rate": 6.057995888997248e-09,
      "loss": 0.384,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.20564129948616028,
      "step": 1550,
      "valid_targets_mean": 1534.4,
      "valid_targets_min": 530
    },
    {
      "epoch": 4.983974358974359,
      "grad_norm": 0.5078947883853017,
      "learning_rate": 1.8024428655794012e-09,
      "loss": 0.3829,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.21099376678466797,
      "step": 1555,
      "valid_targets_mean": 2262.2,
      "valid_targets_min": 342
    },
    {
      "epoch": 5.0,
      "grad_norm": 0.5570674341743406,
      "learning_rate": 5.00685885418406e-11,
      "loss": 0.4035,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24144230782985687,
      "step": 1560,
      "valid_targets_mean": 2344.4,
      "valid_targets_min": 827
    },
    {
      "epoch": 5.0,
      "loss_nan_ranks": 0,
      "loss_rank_avg": 0.24144230782985687,
      "step": 1560,
      "total_flos": 4.577212452957061e+17,
      "train_loss": 0.45931496092906365,
      "train_runtime": 11477.9832,
      "train_samples_per_second": 4.348,
      "train_steps_per_second": 0.136,
      "valid_targets_mean": 2344.4,
      "valid_targets_min": 827
    }
  ],
  "logging_steps": 5,
  "max_steps": 1560,
  "num_input_tokens_seen": 0,
  "num_train_epochs": 5,
  "save_steps": 500,
  "stateful_callbacks": {
    "TrainerControl": {
      "args": {
        "should_epoch_stop": false,
        "should_evaluate": false,
        "should_log": false,
        "should_save": false,
        "should_training_stop": false
      },
      "attributes": {}
    }
  },
  "total_flos": 4.577212452957061e+17,
  "train_batch_size": 1,
  "trial_name": null,
  "trial_params": null
}