visolex
/

phobert-v1-hsd

+{
+  "best_global_step": 6433,
+  "best_metric": 0.869164826258844,
+  "best_model_checkpoint": "outputs/hate-speech-detection/phobert-v1/checkpoint-6433",
+  "epoch": 7.0,
+  "eval_steps": 500,
+  "global_step": 6433,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.998911860718172,
+      "grad_norm": 3.996723175048828,
+      "learning_rate": 1.9996091589167148e-05,
+      "loss": 0.4454,
+      "step": 918
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8648837209302326,
+      "eval_f1": 0.8541055666665719,
+      "eval_loss": 0.36985549330711365,
+      "eval_precision": 0.8482981349301894,
+      "eval_recall": 0.8648837209302326,
+      "eval_runtime": 18.8079,
+      "eval_samples_per_second": 228.627,
+      "eval_steps_per_second": 7.178,
+      "step": 919
+    },
+    {
+      "epoch": 1.997823721436344,
+      "grad_norm": 5.397847652435303,
+      "learning_rate": 1.9982377977480694e-05,
+      "loss": 0.3302,
+      "step": 1836
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.8790697674418605,
+      "eval_f1": 0.8639193560209791,
+      "eval_loss": 0.3517931401729584,
+      "eval_precision": 0.8613674120453191,
+      "eval_recall": 0.8790697674418605,
+      "eval_runtime": 18.812,
+      "eval_samples_per_second": 228.577,
+      "eval_steps_per_second": 7.176,
+      "step": 1838
+    },
+    {
+      "epoch": 2.996735582154516,
+      "grad_norm": 4.222469329833984,
+      "learning_rate": 1.9958812963917564e-05,
+      "loss": 0.2643,
+      "step": 2754
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.8790697674418605,
+      "eval_f1": 0.8643239770760321,
+      "eval_loss": 0.34931325912475586,
+      "eval_precision": 0.8637571927551355,
+      "eval_recall": 0.8790697674418605,
+      "eval_runtime": 18.8951,
+      "eval_samples_per_second": 227.573,
+      "eval_steps_per_second": 7.145,
+      "step": 2757
+    },
+    {
+      "epoch": 3.995647442872688,
+      "grad_norm": 21.62336540222168,
+      "learning_rate": 1.992541980430111e-05,
+      "loss": 0.2096,
+      "step": 3672
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.868139534883721,
+      "eval_f1": 0.8680505813983537,
+      "eval_loss": 0.4169940650463104,
+      "eval_precision": 0.8679632185986601,
+      "eval_recall": 0.868139534883721,
+      "eval_runtime": 18.8275,
+      "eval_samples_per_second": 228.389,
+      "eval_steps_per_second": 7.17,
+      "step": 3676
+    },
+    {
+      "epoch": 4.99455930359086,
+      "grad_norm": 19.167633056640625,
+      "learning_rate": 1.9882231453648264e-05,
+      "loss": 0.166,
+      "step": 4590
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.8748837209302326,
+      "eval_f1": 0.8683907897636799,
+      "eval_loss": 0.45102834701538086,
+      "eval_precision": 0.8642072805764893,
+      "eval_recall": 0.8748837209302326,
+      "eval_runtime": 18.8141,
+      "eval_samples_per_second": 228.552,
+      "eval_steps_per_second": 7.175,
+      "step": 4595
+    },
+    {
+      "epoch": 5.993471164309032,
+      "grad_norm": 14.512689590454102,
+      "learning_rate": 1.982929053364693e-05,
+      "loss": 0.1268,
+      "step": 5508
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.8767441860465116,
+      "eval_f1": 0.8584101867027553,
+      "eval_loss": 0.5603283047676086,
+      "eval_precision": 0.8576597180464702,
+      "eval_recall": 0.8767441860465116,
+      "eval_runtime": 18.8828,
+      "eval_samples_per_second": 227.72,
+      "eval_steps_per_second": 7.149,
+      "step": 5514
+    },
+    {
+      "epoch": 6.992383025027204,
+      "grad_norm": 0.22124843299388885,
+      "learning_rate": 1.9766649290593513e-05,
+      "loss": 0.1009,
+      "step": 6426
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.88,
+      "eval_f1": 0.869164826258844,
+      "eval_loss": 0.6517873406410217,
+      "eval_precision": 0.8655995996061706,
+      "eval_recall": 0.88,
+      "eval_runtime": 18.8384,
+      "eval_samples_per_second": 228.257,
+      "eval_steps_per_second": 7.166,
+      "step": 6433
+    }
+  ],
+  "logging_steps": 918,
+  "max_steps": 91900,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 100,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 5,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 0.0,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": null
+}