Lexemo
/

roberta_large_legal_act_extraction

@@ -1,130 +0,0 @@
-{
-  "best_metric": 0.03976977616548538,
-  "best_model_checkpoint": "/media/nataly/DATA/AITalentsData/models/roberta_for_portfolio_with_service_token_5/checkpoint-1270",
-  "epoch": 5.0,
-  "global_step": 1270,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.54,
-      "learning_rate": 1.865157480314961e-05,
-      "loss": 0.0044,
-      "step": 137
-    },
-    {
-      "epoch": 1.0,
-      "eval_accuracy": 0.998181188290317,
-      "eval_f1": 0.9746853753797193,
-      "eval_loss": 0.05073648318648338,
-      "eval_precision": 0.97398091934085,
-      "eval_recall": 0.9753908511870295,
-      "eval_runtime": 612.4408,
-      "eval_samples_per_second": 0.955,
-      "eval_steps_per_second": 0.24,
-      "step": 254
-    },
-    {
-      "epoch": 1.08,
-      "learning_rate": 1.7303149606299215e-05,
-      "loss": 0.0119,
-      "step": 274
-    },
-    {
-      "epoch": 1.62,
-      "learning_rate": 1.5954724409448822e-05,
-      "loss": 0.0109,
-      "step": 411
-    },
-    {
-      "epoch": 2.0,
-      "eval_accuracy": 0.998428645665784,
-      "eval_f1": 0.9759768451519536,
-      "eval_loss": 0.043852031230926514,
-      "eval_precision": 0.9756944444444444,
-      "eval_recall": 0.9762594093804284,
-      "eval_runtime": 611.3841,
-      "eval_samples_per_second": 0.957,
-      "eval_steps_per_second": 0.24,
-      "step": 508
-    },
-    {
-      "epoch": 2.16,
-      "learning_rate": 1.4606299212598427e-05,
-      "loss": 0.0034,
-      "step": 548
-    },
-    {
-      "epoch": 2.7,
-      "learning_rate": 1.3257874015748034e-05,
-      "loss": 0.0054,
-      "step": 685
-    },
-    {
-      "epoch": 3.0,
-      "eval_accuracy": 0.9983791541906907,
-      "eval_f1": 0.9765489287782282,
-      "eval_loss": 0.045107804238796234,
-      "eval_precision": 0.9765489287782282,
-      "eval_recall": 0.9765489287782282,
-      "eval_runtime": 610.6063,
-      "eval_samples_per_second": 0.958,
-      "eval_steps_per_second": 0.241,
-      "step": 762
-    },
-    {
-      "epoch": 3.24,
-      "learning_rate": 1.190944881889764e-05,
-      "loss": 0.005,
-      "step": 822
-    },
-    {
-      "epoch": 3.78,
-      "learning_rate": 1.0561023622047245e-05,
-      "loss": 0.0048,
-      "step": 959
-    },
-    {
-      "epoch": 4.0,
-      "eval_accuracy": 0.998218306896637,
-      "eval_f1": 0.9754050925925924,
-      "eval_loss": 0.043688565492630005,
-      "eval_precision": 0.974840948525159,
-      "eval_recall": 0.9759698899826288,
-      "eval_runtime": 611.4949,
-      "eval_samples_per_second": 0.957,
-      "eval_steps_per_second": 0.24,
-      "step": 1016
-    },
-    {
-      "epoch": 4.31,
-      "learning_rate": 9.212598425196852e-06,
-      "loss": 0.0013,
-      "step": 1096
-    },
-    {
-      "epoch": 4.85,
-      "learning_rate": 7.864173228346458e-06,
-      "loss": 0.0008,
-      "step": 1233
-    },
-    {
-      "epoch": 5.0,
-      "eval_accuracy": 0.9982801712405038,
-      "eval_f1": 0.9778741865509761,
-      "eval_loss": 0.03976977616548538,
-      "eval_precision": 0.9768852932678417,
-      "eval_recall": 0.9788650839606253,
-      "eval_runtime": 611.217,
-      "eval_samples_per_second": 0.957,
-      "eval_steps_per_second": 0.241,
-      "step": 1270
-    }
-  ],
-  "max_steps": 2032,
-  "num_train_epochs": 8,
-  "total_flos": 2514252317873886.0,
-  "trial_name": null,
-  "trial_params": null
-}