Humor-Research
/

humor-detection-the-naughtyformer-977

+{
+  "best_metric": 0.00041871442226693034,
+  "best_model_checkpoint": "./models/results_the_naughtyformer_977/checkpoint-225",
+  "epoch": 0.20821283979178715,
+  "global_step": 225,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.000000000000001e-06,
+      "loss": 0.6624,
+      "step": 8
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 8.000000000000001e-06,
+      "loss": 0.604,
+      "step": 16
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 1.2e-05,
+      "loss": 0.4918,
+      "step": 24
+    },
+    {
+      "epoch": 0.02,
+      "eval_accuracy": 0.8941295546558704,
+      "eval_f1": 0.9441060168857539,
+      "eval_loss": 0.3381046652793884,
+      "eval_precision": 0.8941295546558704,
+      "eval_recall": 1.0,
+      "eval_runtime": 63.6445,
+      "eval_samples_per_second": 155.237,
+      "eval_steps_per_second": 19.405,
+      "step": 25
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 1.6000000000000003e-05,
+      "loss": 0.2579,
+      "step": 32
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 2e-05,
+      "loss": 0.1325,
+      "step": 40
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 2.4e-05,
+      "loss": 0.0186,
+      "step": 48
+    },
+    {
+      "epoch": 0.05,
+      "eval_accuracy": 0.9995951417004049,
+      "eval_f1": 0.9997736532367587,
+      "eval_loss": 0.002655914518982172,
+      "eval_precision": 0.9995474089160443,
+      "eval_recall": 1.0,
+      "eval_runtime": 64.7489,
+      "eval_samples_per_second": 152.589,
+      "eval_steps_per_second": 19.074,
+      "step": 50
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 2.8000000000000003e-05,
+      "loss": 0.0126,
+      "step": 56
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 3.2000000000000005e-05,
+      "loss": 0.0008,
+      "step": 64
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 3.6e-05,
+      "loss": 0.0015,
+      "step": 72
+    },
+    {
+      "epoch": 0.07,
+      "eval_accuracy": 0.9997975708502024,
+      "eval_f1": 0.9998868138087154,
+      "eval_loss": 0.0015935683622956276,
+      "eval_precision": 0.9997736532367587,
+      "eval_recall": 1.0,
+      "eval_runtime": 63.6605,
+      "eval_samples_per_second": 155.198,
+      "eval_steps_per_second": 19.4,
+      "step": 75
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4e-05,
+      "loss": 0.0156,
+      "step": 80
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 4.4000000000000006e-05,
+      "loss": 0.0155,
+      "step": 88
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.8e-05,
+      "loss": 0.0004,
+      "step": 96
+    },
+    {
+      "epoch": 0.09,
+      "eval_accuracy": 0.9997975708502024,
+      "eval_f1": 0.9998868138087154,
+      "eval_loss": 0.0007984100375324488,
+      "eval_precision": 0.9997736532367587,
+      "eval_recall": 1.0,
+      "eval_runtime": 63.3854,
+      "eval_samples_per_second": 155.872,
+      "eval_steps_per_second": 19.484,
+      "step": 100
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.979591836734694e-05,
+      "loss": 0.0004,
+      "step": 104
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.938775510204082e-05,
+      "loss": 0.0004,
+      "step": 112
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 4.903061224489796e-05,
+      "loss": 0.0118,
+      "step": 120
+    },
+    {
+      "epoch": 0.12,
+      "eval_accuracy": 0.9996963562753036,
+      "eval_f1": 0.9998302303208647,
+      "eval_loss": 0.0019073737785220146,
+      "eval_precision": 0.9996605182754328,
+      "eval_recall": 1.0,
+      "eval_runtime": 63.5966,
+      "eval_samples_per_second": 155.354,
+      "eval_steps_per_second": 19.419,
+      "step": 125
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.862244897959184e-05,
+      "loss": 0.0002,
+      "step": 128
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.8214285714285716e-05,
+      "loss": 0.001,
+      "step": 136
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.7806122448979595e-05,
+      "loss": 0.0113,
+      "step": 144
+    },
+    {
+      "epoch": 0.14,
+      "eval_accuracy": 0.9998987854251012,
+      "eval_f1": 0.9999434037013979,
+      "eval_loss": 0.0006314449128694832,
+      "eval_precision": 0.9998868138087154,
+      "eval_recall": 1.0,
+      "eval_runtime": 63.6772,
+      "eval_samples_per_second": 155.158,
+      "eval_steps_per_second": 19.395,
+      "step": 150
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 4.7397959183673474e-05,
+      "loss": 0.0001,
+      "step": 152
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.698979591836735e-05,
+      "loss": 0.0001,
+      "step": 160
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 4.6581632653061226e-05,
+      "loss": 0.0149,
+      "step": 168
+    },
+    {
+      "epoch": 0.16,
+      "eval_accuracy": 0.9998987854251012,
+      "eval_f1": 0.9999433972943906,
+      "eval_loss": 0.0006301466492004693,
+      "eval_precision": 1.0,
+      "eval_recall": 0.9998868009961512,
+      "eval_runtime": 63.7491,
+      "eval_samples_per_second": 154.982,
+      "eval_steps_per_second": 19.373,
+      "step": 175
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 4.6173469387755105e-05,
+      "loss": 0.0017,
+      "step": 176
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.5765306122448984e-05,
+      "loss": 0.0137,
+      "step": 184
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 4.5357142857142856e-05,
+      "loss": 0.0001,
+      "step": 192
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.4948979591836735e-05,
+      "loss": 0.0003,
+      "step": 200
+    },
+    {
+      "epoch": 0.19,
+      "eval_accuracy": 0.9997975708502024,
+      "eval_f1": 0.9998867881806861,
+      "eval_loss": 0.0011095332447439432,
+      "eval_precision": 1.0,
+      "eval_recall": 0.9997736019923025,
+      "eval_runtime": 63.9897,
+      "eval_samples_per_second": 154.4,
+      "eval_steps_per_second": 19.3,
+      "step": 200
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.4540816326530614e-05,
+      "loss": 0.0001,
+      "step": 208
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.4132653061224493e-05,
+      "loss": 0.0001,
+      "step": 216
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.372448979591837e-05,
+      "loss": 0.0001,
+      "step": 224
+    },
+    {
+      "epoch": 0.21,
+      "eval_accuracy": 0.9998987854251012,
+      "eval_f1": 0.9999434037013979,
+      "eval_loss": 0.00041871442226693034,
+      "eval_precision": 0.9998868138087154,
+      "eval_recall": 1.0,
+      "eval_runtime": 63.1331,
+      "eval_samples_per_second": 156.495,
+      "eval_steps_per_second": 19.562,
+      "step": 225
+    }
+  ],
+  "max_steps": 1080,
+  "num_train_epochs": 1,
+  "total_flos": 3788799197184000.0,
+  "trial_name": null,
+  "trial_params": null
+}