clejordan
/

MNLP_M3_quantized_model

@@ -1,119 +0,0 @@
-{
-  "best_global_step": null,
-  "best_metric": null,
-  "best_model_checkpoint": null,
-  "epoch": 1.0,
-  "eval_steps": 500,
-  "global_step": 5751,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.0869414014953921,
-      "grad_norm": NaN,
-      "learning_rate": 0.00019421549875383993,
-      "loss": 4.2823,
-      "step": 500
-    },
-    {
-      "epoch": 0.1738828029907842,
-      "grad_norm": NaN,
-      "learning_rate": 0.0001884194053208138,
-      "loss": 0.0,
-      "step": 1000
-    },
-    {
-      "epoch": 0.2608242044861763,
-      "grad_norm": NaN,
-      "learning_rate": 0.00018262331188778763,
-      "loss": 0.0,
-      "step": 1500
-    },
-    {
-      "epoch": 0.3477656059815684,
-      "grad_norm": NaN,
-      "learning_rate": 0.0001768272184547615,
-      "loss": 0.0,
-      "step": 2000
-    },
-    {
-      "epoch": 0.4347070074769605,
-      "grad_norm": NaN,
-      "learning_rate": 0.00017103112502173535,
-      "loss": 0.0,
-      "step": 2500
-    },
-    {
-      "epoch": 0.5216484089723527,
-      "grad_norm": NaN,
-      "learning_rate": 0.0001652350315887092,
-      "loss": 0.0,
-      "step": 3000
-    },
-    {
-      "epoch": 0.6085898104677447,
-      "grad_norm": NaN,
-      "learning_rate": 0.00015943893815568308,
-      "loss": 0.0,
-      "step": 3500
-    },
-    {
-      "epoch": 0.6955312119631368,
-      "grad_norm": NaN,
-      "learning_rate": 0.00015364284472265693,
-      "loss": 0.0,
-      "step": 4000
-    },
-    {
-      "epoch": 0.7824726134585289,
-      "grad_norm": NaN,
-      "learning_rate": 0.0001478467512896308,
-      "loss": 0.0,
-      "step": 4500
-    },
-    {
-      "epoch": 0.869414014953921,
-      "grad_norm": NaN,
-      "learning_rate": 0.00014205065785660465,
-      "loss": 0.0,
-      "step": 5000
-    },
-    {
-      "epoch": 0.9563554164493132,
-      "grad_norm": NaN,
-      "learning_rate": 0.0001362545644235785,
-      "loss": 0.0,
-      "step": 5500
-    },
-    {
-      "epoch": 1.0,
-      "eval_loss": NaN,
-      "eval_runtime": 152.5081,
-      "eval_samples_per_second": 16.76,
-      "eval_steps_per_second": 4.19,
-      "step": 5751
-    }
-  ],
-  "logging_steps": 500,
-  "max_steps": 17253,
-  "num_input_tokens_seen": 0,
-  "num_train_epochs": 3,
-  "save_steps": 500,
-  "stateful_callbacks": {
-    "TrainerControl": {
-      "args": {
-        "should_epoch_stop": false,
-        "should_evaluate": false,
-        "should_log": false,
-        "should_save": true,
-        "should_training_stop": false
-      },
-      "attributes": {}
-    }
-  },
-  "total_flos": 3.115004127608832e+16,
-  "train_batch_size": 4,
-  "trial_name": null,
-  "trial_params": null
-}