DunnBC22
/

mpnet-base-apple_iphone_se_reviews

+{
+    "epoch": 5.0,
+    "train_loss": 0.29725947360523414,
+    "train_runtime": 45565.3514,
+    "train_samples_per_second": 0.853,
+    "train_steps_per_second": 0.013
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 5.0,
+    "train_loss": 0.29725947360523414,
+    "train_runtime": 45565.3514,
+    "train_samples_per_second": 0.853,
+    "train_steps_per_second": 0.013
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,265 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 5.0,
+  "global_step": 610,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.01,
+      "learning_rate": 1.99672131147541e-05,
+      "loss": 1.602,
+      "step": 1
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 1.918032786885246e-05,
+      "loss": 1.1275,
+      "step": 25
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 1.836065573770492e-05,
+      "loss": 0.8491,
+      "step": 50
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 1.7540983606557377e-05,
+      "loss": 0.6927,
+      "step": 75
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 1.6721311475409837e-05,
+      "loss": 0.5194,
+      "step": 100
+    },
+    {
+      "epoch": 1.0,
+      "eval_Macro F1": 0.32887477005548477,
+      "eval_Macro Precision": 0.30312399537255397,
+      "eval_Macro Recall": 0.3855245821114833,
+      "eval_Micro F1": 0.8327328872876993,
+      "eval_Micro Precision": 0.8327328872876995,
+      "eval_Micro Recall": 0.8327328872876995,
+      "eval_Weighted F1": 0.7993487616471537,
+      "eval_Weighted Precision": 0.7948115677222908,
+      "eval_Weighted Recall": 0.8327328872876995,
+      "eval_accuracy": 0.8327328872876995,
+      "eval_loss": 0.40684521198272705,
+      "eval_runtime": 611.8394,
+      "eval_samples_per_second": 3.176,
+      "eval_steps_per_second": 0.051,
+      "step": 122
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 1.5901639344262295e-05,
+      "loss": 0.4588,
+      "step": 125
+    },
+    {
+      "epoch": 1.23,
+      "learning_rate": 1.5081967213114754e-05,
+      "loss": 0.3681,
+      "step": 150
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 1.4262295081967214e-05,
+      "loss": 0.3334,
+      "step": 175
+    },
+    {
+      "epoch": 1.64,
+      "learning_rate": 1.3442622950819673e-05,
+      "loss": 0.2953,
+      "step": 200
+    },
+    {
+      "epoch": 1.84,
+      "learning_rate": 1.2622950819672132e-05,
+      "loss": 0.264,
+      "step": 225
+    },
+    {
+      "epoch": 2.0,
+      "eval_Macro F1": 0.45598935385523764,
+      "eval_Macro Precision": 0.4341074208614427,
+      "eval_Macro Recall": 0.5088583722111778,
+      "eval_Micro F1": 0.8836850231600618,
+      "eval_Micro Precision": 0.8836850231600618,
+      "eval_Micro Recall": 0.8836850231600618,
+      "eval_Weighted F1": 0.8644885072415942,
+      "eval_Weighted Precision": 0.8529605097109872,
+      "eval_Weighted Recall": 0.8836850231600618,
+      "eval_accuracy": 0.8836850231600618,
+      "eval_loss": 0.2356589287519455,
+      "eval_runtime": 610.0352,
+      "eval_samples_per_second": 3.185,
+      "eval_steps_per_second": 0.051,
+      "step": 244
+    },
+    {
+      "epoch": 2.05,
+      "learning_rate": 1.1803278688524591e-05,
+      "loss": 0.2659,
+      "step": 250
+    },
+    {
+      "epoch": 2.25,
+      "learning_rate": 1.0983606557377052e-05,
+      "loss": 0.2027,
+      "step": 275
+    },
+    {
+      "epoch": 2.46,
+      "learning_rate": 1.0163934426229509e-05,
+      "loss": 0.1936,
+      "step": 300
+    },
+    {
+      "epoch": 2.66,
+      "learning_rate": 9.344262295081968e-06,
+      "loss": 0.1722,
+      "step": 325
+    },
+    {
+      "epoch": 2.87,
+      "learning_rate": 8.524590163934427e-06,
+      "loss": 0.1601,
+      "step": 350
+    },
+    {
+      "epoch": 3.0,
+      "eval_Macro F1": 0.48630501934265596,
+      "eval_Macro Precision": 0.461020549786962,
+      "eval_Macro Recall": 0.5614892316744751,
+      "eval_Micro F1": 0.8975810602161606,
+      "eval_Micro Precision": 0.8975810602161606,
+      "eval_Micro Recall": 0.8975810602161606,
+      "eval_Weighted F1": 0.8774363233455805,
+      "eval_Weighted Precision": 0.8696699634040972,
+      "eval_Weighted Recall": 0.8975810602161606,
+      "eval_accuracy": 0.8975810602161606,
+      "eval_loss": 0.16468031704425812,
+      "eval_runtime": 610.8239,
+      "eval_samples_per_second": 3.181,
+      "eval_steps_per_second": 0.051,
+      "step": 366
+    },
+    {
+      "epoch": 3.07,
+      "learning_rate": 7.704918032786886e-06,
+      "loss": 0.1671,
+      "step": 375
+    },
+    {
+      "epoch": 3.28,
+      "learning_rate": 6.885245901639345e-06,
+      "loss": 0.1406,
+      "step": 400
+    },
+    {
+      "epoch": 3.48,
+      "learning_rate": 6.065573770491804e-06,
+      "loss": 0.1475,
+      "step": 425
+    },
+    {
+      "epoch": 3.69,
+      "learning_rate": 5.245901639344263e-06,
+      "loss": 0.1234,
+      "step": 450
+    },
+    {
+      "epoch": 3.89,
+      "learning_rate": 4.426229508196722e-06,
+      "loss": 0.1281,
+      "step": 475
+    },
+    {
+      "epoch": 4.0,
+      "eval_Macro F1": 0.7092696023153502,
+      "eval_Macro Precision": 0.6805589698473045,
+      "eval_Macro Recall": 0.7464438781750541,
+      "eval_Micro F1": 0.9423571796191457,
+      "eval_Micro Precision": 0.9423571796191457,
+      "eval_Micro Recall": 0.9423571796191457,
+      "eval_Weighted F1": 0.9322920914691559,
+      "eval_Weighted Precision": 0.924443268867862,
+      "eval_Weighted Recall": 0.9423571796191457,
+      "eval_accuracy": 0.9423571796191457,
+      "eval_loss": 0.13984337449073792,
+      "eval_runtime": 612.0896,
+      "eval_samples_per_second": 3.174,
+      "eval_steps_per_second": 0.051,
+      "step": 488
+    },
+    {
+      "epoch": 4.1,
+      "learning_rate": 3.6065573770491806e-06,
+      "loss": 0.1277,
+      "step": 500
+    },
+    {
+      "epoch": 4.3,
+      "learning_rate": 2.786885245901639e-06,
+      "loss": 0.123,
+      "step": 525
+    },
+    {
+      "epoch": 4.51,
+      "learning_rate": 1.9672131147540985e-06,
+      "loss": 0.1049,
+      "step": 550
+    },
+    {
+      "epoch": 4.71,
+      "learning_rate": 1.1475409836065575e-06,
+      "loss": 0.1091,
+      "step": 575
+    },
+    {
+      "epoch": 4.92,
+      "learning_rate": 3.278688524590164e-07,
+      "loss": 0.1175,
+      "step": 600
+    },
+    {
+      "epoch": 5.0,
+      "eval_Macro F1": 0.7242136777661108,
+      "eval_Macro Precision": 0.7007419659301912,
+      "eval_Macro Recall": 0.7593500405849569,
+      "eval_Micro F1": 0.9459598558929491,
+      "eval_Micro Precision": 0.9459598558929491,
+      "eval_Micro Recall": 0.9459598558929491,
+      "eval_Weighted F1": 0.9359769237564278,
+      "eval_Weighted Precision": 0.929023836280776,
+      "eval_Weighted Recall": 0.9459598558929491,
+      "eval_accuracy": 0.9459598558929491,
+      "eval_loss": 0.12987616658210754,
+      "eval_runtime": 610.6404,
+      "eval_samples_per_second": 3.182,
+      "eval_steps_per_second": 0.051,
+      "step": 610
+    },
+    {
+      "epoch": 5.0,
+      "step": 610,
+      "total_flos": 5490407137792500.0,
+      "train_loss": 0.29725947360523414,
+      "train_runtime": 45565.3514,
+      "train_samples_per_second": 0.853,
+      "train_steps_per_second": 0.013
+    }
+  ],
+  "max_steps": 610,
+  "num_train_epochs": 5,
+  "total_flos": 5490407137792500.0,
+  "trial_name": null,
+  "trial_params": null
+}