Update multitask INDRA statement classifier

Browse files

Files changed (8) hide show

all_results.json +17 -17
config.json +1 -1
eval_results.json +17 -17
indra_label2id.json +23 -8
model.safetensors +2 -2
test_results.json +17 -17
trainer_state.json +267 -267
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -1,22 +1,22 @@
 {
     "epoch": 10.0,
-    "eval_gate1_accuracy": 0.9248312351760628,
-    "eval_gate1_f1": 0.9223014364537471,
-    "eval_gate1_precision": 0.9233799376462881,
-    "eval_gate1_recall": 0.9213102653636653,
     "eval_gate1_support": 5481,
-    "eval_gate2_accuracy": 0.8673599708082467,
-    "eval_gate2_f1": 0.8048074187473976,
-    "eval_gate2_precision": 0.7981399002237517,
-    "eval_gate2_recall": 0.818477325235324,
     "eval_gate2_support": 5481,
-    "eval_gate3_accuracy": 0.8764174514703056,
-    "eval_gate3_f1": 0.8057131317523325,
-    "eval_gate3_precision": 0.8091461396544178,
-    "eval_gate3_recall": 0.8052237388041866,
-    "eval_gate3_support": 5203,
-    "eval_loss": 0.9472318887710571,
-    "eval_runtime": 8.2407,
-    "eval_samples_per_second": 1296.485,
-    "eval_steps_per_second": 40.53
 }

 {
     "epoch": 10.0,
+    "eval_gate1_accuracy": 0.9204524721766101,
+    "eval_gate1_f1": 0.9175696677724912,
+    "eval_gate1_precision": 0.9198718411071631,
+    "eval_gate1_recall": 0.9156173695177233,
     "eval_gate1_support": 5481,
+    "eval_gate2_accuracy": 0.8573253056011677,
+    "eval_gate2_f1": 0.7662196765345953,
+    "eval_gate2_precision": 0.7540255243234163,
+    "eval_gate2_recall": 0.7899899686908007,
     "eval_gate2_support": 5481,
+    "eval_gate3_accuracy": 0.8761520737327189,
+    "eval_gate3_f1": 0.7204269422018509,
+    "eval_gate3_precision": 0.7065840948237819,
+    "eval_gate3_recall": 0.7411799394675562,
+    "eval_gate3_support": 6944,
+    "eval_loss": 0.7167699933052063,
+    "eval_runtime": 9.951,
+    "eval_samples_per_second": 1248.614,
+    "eval_steps_per_second": 39.091
 }

config.json CHANGED Viewed

@@ -9,7 +9,7 @@
   "gate2_loss_weight": 0.5,
   "gate2_num_labels": 20,
   "gate3_loss_weight": 0.25,
-  "gate3_num_labels": 11,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,

   "gate2_loss_weight": 0.5,
   "gate2_num_labels": 20,
   "gate3_loss_weight": 0.25,
+  "gate3_num_labels": 26,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,

eval_results.json CHANGED Viewed

@@ -1,22 +1,22 @@
 {
     "epoch": 10.0,
-    "eval_gate1_accuracy": 0.9240875912408759,
-    "eval_gate1_f1": 0.9198787159000936,
-    "eval_gate1_precision": 0.9214987753300372,
-    "eval_gate1_recall": 0.9183842728638181,
     "eval_gate1_support": 5480,
-    "eval_gate2_accuracy": 0.8687956204379562,
-    "eval_gate2_f1": 0.7862569245385519,
-    "eval_gate2_precision": 0.7958171660250828,
-    "eval_gate2_recall": 0.7833180915653772,
     "eval_gate2_support": 5480,
-    "eval_gate3_accuracy": 0.8846597462514417,
-    "eval_gate3_f1": 0.8122850869616633,
-    "eval_gate3_precision": 0.8109060527302346,
-    "eval_gate3_recall": 0.8171325515426088,
-    "eval_gate3_support": 5202,
-    "eval_loss": 0.9491556882858276,
-    "eval_runtime": 8.3758,
-    "eval_samples_per_second": 1275.348,
-    "eval_steps_per_second": 39.877
 }

 {
     "epoch": 10.0,
+    "eval_gate1_accuracy": 0.9231751824817518,
+    "eval_gate1_f1": 0.91874922234221,
+    "eval_gate1_precision": 0.9213536363863121,
+    "eval_gate1_recall": 0.916446997689221,
     "eval_gate1_support": 5480,
+    "eval_gate2_accuracy": 0.8593065693430657,
+    "eval_gate2_f1": 0.7763067392280264,
+    "eval_gate2_precision": 0.7921477517391428,
+    "eval_gate2_recall": 0.775442797363134,
     "eval_gate2_support": 5480,
+    "eval_gate3_accuracy": 0.8810483870967742,
+    "eval_gate3_f1": 0.778218086166726,
+    "eval_gate3_precision": 0.75635112362015,
+    "eval_gate3_recall": 0.8147429373450497,
+    "eval_gate3_support": 6944,
+    "eval_loss": 0.7152989506721497,
+    "eval_runtime": 9.7809,
+    "eval_samples_per_second": 1270.237,
+    "eval_steps_per_second": 39.772
 }

indra_label2id.json CHANGED Viewed

@@ -2,12 +2,27 @@
   "Acetylation": 0,
   "Activation": 1,
   "Complex": 2,
-  "DecreaseAmount": 3,
-  "Dephosphorylation": 4,
-  "IncreaseAmount": 5,
-  "Inhibition": 6,
-  "No_Relation": 7,
-  "Phosphorylation": 8,
-  "Translocation": 9,
-  "Ubiquitination": 10
 }

   "Acetylation": 0,
   "Activation": 1,
   "Complex": 2,
+  "Deacetylation": 3,
+  "DecreaseAmount": 4,
+  "Deglycosylation": 5,
+  "Dehydroxylation": 6,
+  "Demethylation": 7,
+  "Dephosphorylation": 8,
+  "Deribosylation": 9,
+  "Desumoylation": 10,
+  "Deubiquitination": 11,
+  "Farnesylation": 12,
+  "Geranylgeranylation": 13,
+  "Glycosylation": 14,
+  "Hydroxylation": 15,
+  "IncreaseAmount": 16,
+  "Inhibition": 17,
+  "Methylation": 18,
+  "No_Relation": 19,
+  "Palmitoylation": 20,
+  "Phosphorylation": 21,
+  "Ribosylation": 22,
+  "Sumoylation": 23,
+  "Translocation": 24,
+  "Ubiquitination": 25
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8a021a34f88584036cbf7749736dcb36ea13b6be1c495e55cd5bc1fb991affbf
-size 433062372

 version https://git-lfs.github.com/spec/v1
+oid sha256:a3764aec317c8d33aa9d03c8e6c81eab6a79d179058f2c5d3b285e08b28f74e6
+size 433108512

test_results.json CHANGED Viewed

@@ -1,22 +1,22 @@
 {
     "epoch": 10.0,
-    "eval_gate1_accuracy": 0.9248312351760628,
-    "eval_gate1_f1": 0.9223014364537471,
-    "eval_gate1_precision": 0.9233799376462881,
-    "eval_gate1_recall": 0.9213102653636653,
     "eval_gate1_support": 5481,
-    "eval_gate2_accuracy": 0.8673599708082467,
-    "eval_gate2_f1": 0.8048074187473976,
-    "eval_gate2_precision": 0.7981399002237517,
-    "eval_gate2_recall": 0.818477325235324,
     "eval_gate2_support": 5481,
-    "eval_gate3_accuracy": 0.8764174514703056,
-    "eval_gate3_f1": 0.8057131317523325,
-    "eval_gate3_precision": 0.8091461396544178,
-    "eval_gate3_recall": 0.8052237388041866,
-    "eval_gate3_support": 5203,
-    "eval_loss": 0.9472318887710571,
-    "eval_runtime": 8.2407,
-    "eval_samples_per_second": 1296.485,
-    "eval_steps_per_second": 40.53
 }

 {
     "epoch": 10.0,
+    "eval_gate1_accuracy": 0.9204524721766101,
+    "eval_gate1_f1": 0.9175696677724912,
+    "eval_gate1_precision": 0.9198718411071631,
+    "eval_gate1_recall": 0.9156173695177233,
     "eval_gate1_support": 5481,
+    "eval_gate2_accuracy": 0.8573253056011677,
+    "eval_gate2_f1": 0.7662196765345953,
+    "eval_gate2_precision": 0.7540255243234163,
+    "eval_gate2_recall": 0.7899899686908007,
     "eval_gate2_support": 5481,
+    "eval_gate3_accuracy": 0.8761520737327189,
+    "eval_gate3_f1": 0.7204269422018509,
+    "eval_gate3_precision": 0.7065840948237819,
+    "eval_gate3_recall": 0.7411799394675562,
+    "eval_gate3_support": 6944,
+    "eval_loss": 0.7167699933052063,
+    "eval_runtime": 9.951,
+    "eval_samples_per_second": 1248.614,
+    "eval_steps_per_second": 39.091
 }

trainer_state.json CHANGED Viewed

@@ -1,372 +1,372 @@
 {
-  "best_global_step": 24039,
-  "best_metric": 0.9198787159000936,
-  "best_model_checkpoint": "output/indra_stmt_classifier/checkpoint-24039",
   "epoch": 10.0,
   "eval_steps": 500,
-  "global_step": 26710,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
-      "grad_norm": 47.85763931274414,
-      "learning_rate": 2.7001123174840886e-05,
-      "loss": 1.096,
-      "step": 2671
     },
     {
       "epoch": 1.0,
-      "eval_gate1_accuracy": 0.8760948905109489,
-      "eval_gate1_f1": 0.8689092717452258,
-      "eval_gate1_precision": 0.8713719523264891,
-      "eval_gate1_recall": 0.8667668606533185,
       "eval_gate1_support": 5480,
-      "eval_gate2_accuracy": 0.7824817518248175,
-      "eval_gate2_f1": 0.5621839936527114,
-      "eval_gate2_precision": 0.5645465119560173,
-      "eval_gate2_recall": 0.5736060548580606,
       "eval_gate2_support": 5480,
-      "eval_gate3_accuracy": 0.8492887351018839,
-      "eval_gate3_f1": 0.7602413926113012,
-      "eval_gate3_precision": 0.7693172953195895,
-      "eval_gate3_recall": 0.7578355849403795,
-      "eval_gate3_support": 5202,
-      "eval_loss": 0.7759597301483154,
-      "eval_runtime": 8.4166,
-      "eval_samples_per_second": 1269.164,
       "eval_steps_per_second": 39.684,
-      "step": 2671
     },
     {
       "epoch": 2.0,
-      "grad_norm": 23.181921005249023,
-      "learning_rate": 2.4001123174840884e-05,
-      "loss": 0.6261,
-      "step": 5342
     },
     {
       "epoch": 2.0,
-      "eval_gate1_accuracy": 0.8967153284671533,
-      "eval_gate1_f1": 0.8892135436021471,
-      "eval_gate1_precision": 0.8992800620286656,
-      "eval_gate1_recall": 0.8823722876851883,
       "eval_gate1_support": 5480,
-      "eval_gate2_accuracy": 0.8087591240875912,
-      "eval_gate2_f1": 0.6336830760464771,
-      "eval_gate2_precision": 0.648374818296507,
-      "eval_gate2_recall": 0.6429898577936985,
       "eval_gate2_support": 5480,
-      "eval_gate3_accuracy": 0.856401384083045,
-      "eval_gate3_f1": 0.7796712690058606,
-      "eval_gate3_precision": 0.7733791231232439,
-      "eval_gate3_recall": 0.7949296041903785,
-      "eval_gate3_support": 5202,
-      "eval_loss": 0.7020143270492554,
-      "eval_runtime": 8.2978,
-      "eval_samples_per_second": 1287.322,
-      "eval_steps_per_second": 40.251,
-      "step": 5342
     },
     {
       "epoch": 3.0,
-      "grad_norm": 27.699832916259766,
-      "learning_rate": 2.1001123174840883e-05,
-      "loss": 0.4319,
-      "step": 8013
     },
     {
       "epoch": 3.0,
-      "eval_gate1_accuracy": 0.9136861313868613,
-      "eval_gate1_f1": 0.9090361599898706,
-      "eval_gate1_precision": 0.9099473620236753,
-      "eval_gate1_recall": 0.9081687024129339,
       "eval_gate1_support": 5480,
-      "eval_gate2_accuracy": 0.8375912408759124,
-      "eval_gate2_f1": 0.716570976615394,
-      "eval_gate2_precision": 0.7672632620550218,
-      "eval_gate2_recall": 0.7053523131003135,
       "eval_gate2_support": 5480,
-      "eval_gate3_accuracy": 0.8612072279892349,
-      "eval_gate3_f1": 0.7652294432661969,
-      "eval_gate3_precision": 0.81933757284518,
-      "eval_gate3_recall": 0.7376765450537605,
-      "eval_gate3_support": 5202,
-      "eval_loss": 0.6838930249214172,
-      "eval_runtime": 8.3142,
-      "eval_samples_per_second": 1284.784,
-      "eval_steps_per_second": 40.172,
-      "step": 8013
     },
     {
       "epoch": 4.0,
-      "grad_norm": 8.99526309967041,
-      "learning_rate": 1.8001123174840884e-05,
-      "loss": 0.319,
-      "step": 10684
     },
     {
       "epoch": 4.0,
-      "eval_gate1_accuracy": 0.9113138686131387,
-      "eval_gate1_f1": 0.9066571186319019,
-      "eval_gate1_precision": 0.9070095024338034,
-      "eval_gate1_recall": 0.9063116888828937,
       "eval_gate1_support": 5480,
-      "eval_gate2_accuracy": 0.8434306569343065,
-      "eval_gate2_f1": 0.7453256510027118,
-      "eval_gate2_precision": 0.783574110030759,
-      "eval_gate2_recall": 0.7407995323997061,
       "eval_gate2_support": 5480,
-      "eval_gate3_accuracy": 0.87120338331411,
-      "eval_gate3_f1": 0.7836320711248788,
-      "eval_gate3_precision": 0.823566591748077,
-      "eval_gate3_recall": 0.7547062062356837,
-      "eval_gate3_support": 5202,
-      "eval_loss": 0.7108728885650635,
-      "eval_runtime": 8.3006,
-      "eval_samples_per_second": 1286.889,
-      "eval_steps_per_second": 40.238,
-      "step": 10684
     },
     {
       "epoch": 5.0,
-      "grad_norm": 5.843006610870361,
-      "learning_rate": 1.5001123174840884e-05,
-      "loss": 0.2375,
-      "step": 13355
     },
     {
       "epoch": 5.0,
-      "eval_gate1_accuracy": 0.9191605839416058,
-      "eval_gate1_f1": 0.9147161084936839,
-      "eval_gate1_precision": 0.9161134345731146,
-      "eval_gate1_recall": 0.9134155447895695,
       "eval_gate1_support": 5480,
-      "eval_gate2_accuracy": 0.8563868613138687,
-      "eval_gate2_f1": 0.7598792736508855,
-      "eval_gate2_precision": 0.7518271395861019,
-      "eval_gate2_recall": 0.772553107812257,
       "eval_gate2_support": 5480,
-      "eval_gate3_accuracy": 0.8796616685890042,
-      "eval_gate3_f1": 0.8103507915834345,
-      "eval_gate3_precision": 0.795275163060746,
-      "eval_gate3_recall": 0.8286988441198276,
-      "eval_gate3_support": 5202,
-      "eval_loss": 0.7357046604156494,
-      "eval_runtime": 8.2987,
-      "eval_samples_per_second": 1287.188,
-      "eval_steps_per_second": 40.247,
-      "step": 13355
     },
     {
       "epoch": 6.0,
-      "grad_norm": 0.8739603757858276,
-      "learning_rate": 1.2001123174840884e-05,
-      "loss": 0.1823,
-      "step": 16026
     },
     {
       "epoch": 6.0,
-      "eval_gate1_accuracy": 0.9202554744525547,
-      "eval_gate1_f1": 0.9158266975335383,
-      "eval_gate1_precision": 0.9174725833086337,
-      "eval_gate1_recall": 0.9143118698567939,
       "eval_gate1_support": 5480,
-      "eval_gate2_accuracy": 0.8625912408759124,
-      "eval_gate2_f1": 0.7834573094835664,
-      "eval_gate2_precision": 0.7833879179077755,
-      "eval_gate2_recall": 0.7941424379945043,
       "eval_gate2_support": 5480,
-      "eval_gate3_accuracy": 0.8788927335640139,
-      "eval_gate3_f1": 0.8107447964013891,
-      "eval_gate3_precision": 0.7977529473487692,
-      "eval_gate3_recall": 0.8263627573376545,
-      "eval_gate3_support": 5202,
-      "eval_loss": 0.7493559718132019,
-      "eval_runtime": 8.2869,
-      "eval_samples_per_second": 1289.017,
-      "eval_steps_per_second": 40.304,
-      "step": 16026
     },
     {
       "epoch": 7.0,
-      "grad_norm": 6.645991802215576,
-      "learning_rate": 9.001123174840884e-06,
-      "loss": 0.1393,
-      "step": 18697
     },
     {
       "epoch": 7.0,
-      "eval_gate1_accuracy": 0.9208029197080292,
-      "eval_gate1_f1": 0.916658712113726,
-      "eval_gate1_precision": 0.9169464363987025,
-      "eval_gate1_recall": 0.916375490587046,
       "eval_gate1_support": 5480,
-      "eval_gate2_accuracy": 0.8624087591240875,
-      "eval_gate2_f1": 0.7853563687427353,
-      "eval_gate2_precision": 0.8070903645887496,
-      "eval_gate2_recall": 0.7701247313578428,
       "eval_gate2_support": 5480,
-      "eval_gate3_accuracy": 0.8819684736639753,
-      "eval_gate3_f1": 0.8023548675258322,
-      "eval_gate3_precision": 0.8218130097693663,
-      "eval_gate3_recall": 0.7905833163517992,
-      "eval_gate3_support": 5202,
-      "eval_loss": 0.8566591739654541,
-      "eval_runtime": 8.3576,
-      "eval_samples_per_second": 1278.113,
-      "eval_steps_per_second": 39.963,
-      "step": 18697
     },
     {
       "epoch": 8.0,
-      "grad_norm": 23.729028701782227,
-      "learning_rate": 6.001123174840884e-06,
-      "loss": 0.1053,
-      "step": 21368
     },
     {
       "epoch": 8.0,
-      "eval_gate1_accuracy": 0.9204379562043795,
-      "eval_gate1_f1": 0.9158315272170139,
-      "eval_gate1_precision": 0.9185518950364968,
-      "eval_gate1_recall": 0.9134409679806464,
       "eval_gate1_support": 5480,
-      "eval_gate2_accuracy": 0.8647810218978103,
-      "eval_gate2_f1": 0.7930689269607176,
-      "eval_gate2_precision": 0.7965862889095636,
-      "eval_gate2_recall": 0.793312720903019,
       "eval_gate2_support": 5480,
-      "eval_gate3_accuracy": 0.8813917723952326,
-      "eval_gate3_f1": 0.8117269824014105,
-      "eval_gate3_precision": 0.8009879534677691,
-      "eval_gate3_recall": 0.826162604748559,
-      "eval_gate3_support": 5202,
-      "eval_loss": 0.9113713502883911,
-      "eval_runtime": 8.2775,
-      "eval_samples_per_second": 1290.488,
-      "eval_steps_per_second": 40.35,
-      "step": 21368
     },
     {
       "epoch": 9.0,
-      "grad_norm": 5.157261371612549,
-      "learning_rate": 3.001123174840884e-06,
-      "loss": 0.0846,
-      "step": 24039
     },
     {
       "epoch": 9.0,
-      "eval_gate1_accuracy": 0.9240875912408759,
-      "eval_gate1_f1": 0.9198787159000936,
-      "eval_gate1_precision": 0.9214987753300372,
-      "eval_gate1_recall": 0.9183842728638181,
       "eval_gate1_support": 5480,
-      "eval_gate2_accuracy": 0.8687956204379562,
-      "eval_gate2_f1": 0.7862569245385519,
-      "eval_gate2_precision": 0.7958171660250828,
-      "eval_gate2_recall": 0.7833180915653772,
       "eval_gate2_support": 5480,
-      "eval_gate3_accuracy": 0.8846597462514417,
-      "eval_gate3_f1": 0.8122850869616633,
-      "eval_gate3_precision": 0.8109060527302346,
-      "eval_gate3_recall": 0.8171325515426088,
-      "eval_gate3_support": 5202,
-      "eval_loss": 0.9491556882858276,
-      "eval_runtime": 8.2789,
-      "eval_samples_per_second": 1290.275,
-      "eval_steps_per_second": 40.344,
-      "step": 24039
     },
     {
       "epoch": 10.0,
-      "grad_norm": 16.858612060546875,
-      "learning_rate": 1.1231748408835642e-09,
-      "loss": 0.0657,
-      "step": 26710
     },
     {
       "epoch": 10.0,
-      "eval_gate1_accuracy": 0.9235401459854015,
-      "eval_gate1_f1": 0.9193364547603917,
-      "eval_gate1_precision": 0.920749079638352,
-      "eval_gate1_recall": 0.9180211344458186,
       "eval_gate1_support": 5480,
-      "eval_gate2_accuracy": 0.8656934306569343,
-      "eval_gate2_f1": 0.7883336539086067,
-      "eval_gate2_precision": 0.7971566464425738,
-      "eval_gate2_recall": 0.7826535186693984,
       "eval_gate2_support": 5480,
-      "eval_gate3_accuracy": 0.8869665513264129,
-      "eval_gate3_f1": 0.8169346166824163,
-      "eval_gate3_precision": 0.8125578804865948,
-      "eval_gate3_recall": 0.8232165240906076,
-      "eval_gate3_support": 5202,
-      "eval_loss": 1.0004887580871582,
-      "eval_runtime": 8.2766,
-      "eval_samples_per_second": 1290.62,
-      "eval_steps_per_second": 40.355,
-      "step": 26710
     },
     {
       "epoch": 10.0,
-      "step": 26710,
-      "total_flos": 5.5743437807290584e+16,
-      "train_loss": 0.32878632540115477,
-      "train_runtime": 1939.8816,
-      "train_samples_per_second": 440.547,
-      "train_steps_per_second": 13.769
     },
     {
       "epoch": 10.0,
-      "eval_gate1_accuracy": 0.9240875912408759,
-      "eval_gate1_f1": 0.9198787159000936,
-      "eval_gate1_precision": 0.9214987753300372,
-      "eval_gate1_recall": 0.9183842728638181,
       "eval_gate1_support": 5480,
-      "eval_gate2_accuracy": 0.8687956204379562,
-      "eval_gate2_f1": 0.7862569245385519,
-      "eval_gate2_precision": 0.7958171660250828,
-      "eval_gate2_recall": 0.7833180915653772,
       "eval_gate2_support": 5480,
-      "eval_gate3_accuracy": 0.8846597462514417,
-      "eval_gate3_f1": 0.8122850869616633,
-      "eval_gate3_precision": 0.8109060527302346,
-      "eval_gate3_recall": 0.8171325515426088,
-      "eval_gate3_support": 5202,
-      "eval_loss": 0.9491556882858276,
-      "eval_runtime": 8.3758,
-      "eval_samples_per_second": 1275.348,
-      "eval_steps_per_second": 39.877,
-      "step": 26710
     },
     {
       "epoch": 10.0,
-      "eval_gate1_accuracy": 0.9248312351760628,
-      "eval_gate1_f1": 0.9223014364537471,
-      "eval_gate1_precision": 0.9233799376462881,
-      "eval_gate1_recall": 0.9213102653636653,
       "eval_gate1_support": 5481,
-      "eval_gate2_accuracy": 0.8673599708082467,
-      "eval_gate2_f1": 0.8048074187473976,
-      "eval_gate2_precision": 0.7981399002237517,
-      "eval_gate2_recall": 0.818477325235324,
       "eval_gate2_support": 5481,
-      "eval_gate3_accuracy": 0.8764174514703056,
-      "eval_gate3_f1": 0.8057131317523325,
-      "eval_gate3_precision": 0.8091461396544178,
-      "eval_gate3_recall": 0.8052237388041866,
-      "eval_gate3_support": 5203,
-      "eval_loss": 0.9472318887710571,
-      "eval_runtime": 8.2407,
-      "eval_samples_per_second": 1296.485,
-      "eval_steps_per_second": 40.53,
-      "step": 26710
     }
   ],
   "logging_steps": 500,
-  "max_steps": 26710,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 10,
   "save_steps": 500,
@@ -382,7 +382,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 5.5743437807290584e+16,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null

 {
+  "best_global_step": 15535,
+  "best_metric": 0.91874922234221,
+  "best_model_checkpoint": "output/indra_stmt_classifier/checkpoint-15535",
   "epoch": 10.0,
   "eval_steps": 500,
+  "global_step": 31070,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
+      "grad_norm": 2.75587797164917,
+      "learning_rate": 2.7000965561635017e-05,
+      "loss": 1.1186,
+      "step": 3107
     },
     {
       "epoch": 1.0,
+      "eval_gate1_accuracy": 0.8848540145985402,
+      "eval_gate1_f1": 0.8785447299140416,
+      "eval_gate1_precision": 0.879748756806488,
+      "eval_gate1_recall": 0.8774234499312313,
       "eval_gate1_support": 5480,
+      "eval_gate2_accuracy": 0.7870437956204379,
+      "eval_gate2_f1": 0.5722188113150324,
+      "eval_gate2_precision": 0.5654852652404123,
+      "eval_gate2_recall": 0.5860432299031674,
       "eval_gate2_support": 5480,
+      "eval_gate3_accuracy": 0.8329493087557603,
+      "eval_gate3_f1": 0.639519347317039,
+      "eval_gate3_precision": 0.677673907531002,
+      "eval_gate3_recall": 0.6297629647896671,
+      "eval_gate3_support": 6944,
+      "eval_loss": 0.7573269009590149,
+      "eval_runtime": 9.8025,
+      "eval_samples_per_second": 1267.429,
       "eval_steps_per_second": 39.684,
+      "step": 3107
     },
     {
       "epoch": 2.0,
+      "grad_norm": 9.97591781616211,
+      "learning_rate": 2.4000965561635018e-05,
+      "loss": 0.6341,
+      "step": 6214
     },
     {
       "epoch": 2.0,
+      "eval_gate1_accuracy": 0.8994525547445256,
+      "eval_gate1_f1": 0.8920945233221212,
+      "eval_gate1_precision": 0.9025475703450652,
+      "eval_gate1_recall": 0.8850382209313125,
       "eval_gate1_support": 5480,
+      "eval_gate2_accuracy": 0.8173357664233577,
+      "eval_gate2_f1": 0.6503078056225045,
+      "eval_gate2_precision": 0.6679383283455959,
+      "eval_gate2_recall": 0.6597425206224358,
       "eval_gate2_support": 5480,
+      "eval_gate3_accuracy": 0.8425979262672811,
+      "eval_gate3_f1": 0.7516576653132845,
+      "eval_gate3_precision": 0.7289310992313269,
+      "eval_gate3_recall": 0.7877551283882368,
+      "eval_gate3_support": 6944,
+      "eval_loss": 0.681019127368927,
+      "eval_runtime": 9.815,
+      "eval_samples_per_second": 1265.816,
+      "eval_steps_per_second": 39.633,
+      "step": 6214
     },
     {
       "epoch": 3.0,
+      "grad_norm": 6.9430036544799805,
+      "learning_rate": 2.100096556163502e-05,
+      "loss": 0.4397,
+      "step": 9321
     },
     {
       "epoch": 3.0,
+      "eval_gate1_accuracy": 0.9094890510948905,
+      "eval_gate1_f1": 0.9044200252650033,
+      "eval_gate1_precision": 0.9062240634591001,
+      "eval_gate1_recall": 0.90277723499615,
       "eval_gate1_support": 5480,
+      "eval_gate2_accuracy": 0.839051094890511,
+      "eval_gate2_f1": 0.7263650484208171,
+      "eval_gate2_precision": 0.7759514146848825,
+      "eval_gate2_recall": 0.7203927286117487,
       "eval_gate2_support": 5480,
+      "eval_gate3_accuracy": 0.8652073732718893,
+      "eval_gate3_f1": 0.7603754676303877,
+      "eval_gate3_precision": 0.733971679937432,
+      "eval_gate3_recall": 0.8035307301942258,
+      "eval_gate3_support": 6944,
+      "eval_loss": 0.6797090172767639,
+      "eval_runtime": 9.843,
+      "eval_samples_per_second": 1262.211,
+      "eval_steps_per_second": 39.52,
+      "step": 9321
     },
     {
       "epoch": 4.0,
+      "grad_norm": 2.871424913406372,
+      "learning_rate": 1.8000965561635018e-05,
+      "loss": 0.3263,
+      "step": 12428
     },
     {
       "epoch": 4.0,
+      "eval_gate1_accuracy": 0.9138686131386862,
+      "eval_gate1_f1": 0.9095152677593289,
+      "eval_gate1_precision": 0.9091069849690538,
+      "eval_gate1_recall": 0.909933548120778,
       "eval_gate1_support": 5480,
+      "eval_gate2_accuracy": 0.8523722627737226,
+      "eval_gate2_f1": 0.7611458139063093,
+      "eval_gate2_precision": 0.8024369787744103,
+      "eval_gate2_recall": 0.7429072801122445,
       "eval_gate2_support": 5480,
+      "eval_gate3_accuracy": 0.8620391705069125,
+      "eval_gate3_f1": 0.7744302908340429,
+      "eval_gate3_precision": 0.7519119769092221,
+      "eval_gate3_recall": 0.811903740069826,
+      "eval_gate3_support": 6944,
+      "eval_loss": 0.6769687533378601,
+      "eval_runtime": 9.7569,
+      "eval_samples_per_second": 1273.351,
+      "eval_steps_per_second": 39.869,
+      "step": 12428
     },
     {
       "epoch": 5.0,
+      "grad_norm": 5.60059928894043,
+      "learning_rate": 1.5000965561635018e-05,
+      "loss": 0.2441,
+      "step": 15535
     },
     {
       "epoch": 5.0,
+      "eval_gate1_accuracy": 0.9231751824817518,
+      "eval_gate1_f1": 0.91874922234221,
+      "eval_gate1_precision": 0.9213536363863121,
+      "eval_gate1_recall": 0.916446997689221,
       "eval_gate1_support": 5480,
+      "eval_gate2_accuracy": 0.8593065693430657,
+      "eval_gate2_f1": 0.7763067392280264,
+      "eval_gate2_precision": 0.7921477517391428,
+      "eval_gate2_recall": 0.775442797363134,
       "eval_gate2_support": 5480,
+      "eval_gate3_accuracy": 0.8810483870967742,
+      "eval_gate3_f1": 0.778218086166726,
+      "eval_gate3_precision": 0.75635112362015,
+      "eval_gate3_recall": 0.8147429373450497,
+      "eval_gate3_support": 6944,
+      "eval_loss": 0.7152989506721497,
+      "eval_runtime": 9.6947,
+      "eval_samples_per_second": 1281.524,
+      "eval_steps_per_second": 40.125,
+      "step": 15535
     },
     {
       "epoch": 6.0,
+      "grad_norm": 16.034574508666992,
+      "learning_rate": 1.2000965561635018e-05,
+      "loss": 0.1855,
+      "step": 18642
     },
     {
       "epoch": 6.0,
+      "eval_gate1_accuracy": 0.920985401459854,
+      "eval_gate1_f1": 0.9165971625446729,
+      "eval_gate1_precision": 0.9182460374588926,
+      "eval_gate1_recall": 0.9150794681328354,
       "eval_gate1_support": 5480,
+      "eval_gate2_accuracy": 0.862956204379562,
+      "eval_gate2_f1": 0.7924841981022327,
+      "eval_gate2_precision": 0.8068279196629584,
+      "eval_gate2_recall": 0.7874456055649913,
       "eval_gate2_support": 5480,
+      "eval_gate3_accuracy": 0.8882488479262672,
+      "eval_gate3_f1": 0.7926910665874005,
+      "eval_gate3_precision": 0.7755825529327147,
+      "eval_gate3_recall": 0.8216291424595251,
+      "eval_gate3_support": 6944,
+      "eval_loss": 0.8007788062095642,
+      "eval_runtime": 9.803,
+      "eval_samples_per_second": 1267.368,
+      "eval_steps_per_second": 39.682,
+      "step": 18642
     },
     {
       "epoch": 7.0,
+      "grad_norm": 11.89713191986084,
+      "learning_rate": 9.000965561635018e-06,
+      "loss": 0.1454,
+      "step": 21749
     },
     {
       "epoch": 7.0,
+      "eval_gate1_accuracy": 0.9193430656934306,
+      "eval_gate1_f1": 0.9147193543716858,
+      "eval_gate1_precision": 0.9171674547406892,
+      "eval_gate1_recall": 0.9125446429134221,
       "eval_gate1_support": 5480,
+      "eval_gate2_accuracy": 0.8640510948905109,
+      "eval_gate2_f1": 0.7946506784893311,
+      "eval_gate2_precision": 0.8100667075746566,
+      "eval_gate2_recall": 0.7852244900603023,
       "eval_gate2_support": 5480,
+      "eval_gate3_accuracy": 0.8895449308755761,
+      "eval_gate3_f1": 0.7920894399575168,
+      "eval_gate3_precision": 0.7849169985769698,
+      "eval_gate3_recall": 0.8118891174634335,
+      "eval_gate3_support": 6944,
+      "eval_loss": 0.8615767955780029,
+      "eval_runtime": 9.8147,
+      "eval_samples_per_second": 1265.852,
+      "eval_steps_per_second": 39.634,
+      "step": 21749
     },
     {
       "epoch": 8.0,
+      "grad_norm": 0.0030767242424190044,
+      "learning_rate": 6.000965561635018e-06,
+      "loss": 0.1081,
+      "step": 24856
     },
     {
       "epoch": 8.0,
+      "eval_gate1_accuracy": 0.9198905109489051,
+      "eval_gate1_f1": 0.9149957554765835,
+      "eval_gate1_precision": 0.9192622220801286,
+      "eval_gate1_recall": 0.9114623713660069,
       "eval_gate1_support": 5480,
+      "eval_gate2_accuracy": 0.8638686131386861,
+      "eval_gate2_f1": 0.7968208804038338,
+      "eval_gate2_precision": 0.7930637027689245,
+      "eval_gate2_recall": 0.8065230155153877,
       "eval_gate2_support": 5480,
+      "eval_gate3_accuracy": 0.8922811059907834,
+      "eval_gate3_f1": 0.8026929577988032,
+      "eval_gate3_precision": 0.7897651226837507,
+      "eval_gate3_recall": 0.8257808045726754,
+      "eval_gate3_support": 6944,
+      "eval_loss": 0.9336212873458862,
+      "eval_runtime": 9.7984,
+      "eval_samples_per_second": 1267.963,
+      "eval_steps_per_second": 39.7,
+      "step": 24856
     },
     {
       "epoch": 9.0,
+      "grad_norm": 116.7902603149414,
+      "learning_rate": 3.0009655616350177e-06,
+      "loss": 0.0842,
+      "step": 27963
     },
     {
       "epoch": 9.0,
+      "eval_gate1_accuracy": 0.9215328467153284,
+      "eval_gate1_f1": 0.9169295960347313,
+      "eval_gate1_precision": 0.9200202922521744,
+      "eval_gate1_recall": 0.9142522689322582,
       "eval_gate1_support": 5480,
+      "eval_gate2_accuracy": 0.8656934306569343,
+      "eval_gate2_f1": 0.7916047345282854,
+      "eval_gate2_precision": 0.7975761529206665,
+      "eval_gate2_recall": 0.7905660788693317,
       "eval_gate2_support": 5480,
+      "eval_gate3_accuracy": 0.8908410138248848,
+      "eval_gate3_f1": 0.7962561702350882,
+      "eval_gate3_precision": 0.7845233050024135,
+      "eval_gate3_recall": 0.8178146646821465,
+      "eval_gate3_support": 6944,
+      "eval_loss": 0.9843125939369202,
+      "eval_runtime": 9.6312,
+      "eval_samples_per_second": 1289.977,
+      "eval_steps_per_second": 40.39,
+      "step": 27963
     },
     {
       "epoch": 10.0,
+      "grad_norm": 0.09423983097076416,
+      "learning_rate": 9.655616350177021e-10,
+      "loss": 0.068,
+      "step": 31070
     },
     {
       "epoch": 10.0,
+      "eval_gate1_accuracy": 0.920985401459854,
+      "eval_gate1_f1": 0.916357639651535,
+      "eval_gate1_precision": 0.9193983763664938,
+      "eval_gate1_recall": 0.9137190822830333,
       "eval_gate1_support": 5480,
+      "eval_gate2_accuracy": 0.8633211678832117,
+      "eval_gate2_f1": 0.7921038946740504,
+      "eval_gate2_precision": 0.802926749773104,
+      "eval_gate2_recall": 0.7855851424596473,
       "eval_gate2_support": 5480,
+      "eval_gate3_accuracy": 0.8915610599078341,
+      "eval_gate3_f1": 0.8022192601674913,
+      "eval_gate3_precision": 0.7867252072690095,
+      "eval_gate3_recall": 0.8274418766924675,
+      "eval_gate3_support": 6944,
+      "eval_loss": 1.0077552795410156,
+      "eval_runtime": 9.7597,
+      "eval_samples_per_second": 1272.994,
+      "eval_steps_per_second": 39.858,
+      "step": 31070
     },
     {
       "epoch": 10.0,
+      "step": 31070,
+      "total_flos": 6.336727068480365e+16,
+      "train_loss": 0.3354094574986296,
+      "train_runtime": 2265.1995,
+      "train_samples_per_second": 438.787,
+      "train_steps_per_second": 13.716
     },
     {
       "epoch": 10.0,
+      "eval_gate1_accuracy": 0.9231751824817518,
+      "eval_gate1_f1": 0.91874922234221,
+      "eval_gate1_precision": 0.9213536363863121,
+      "eval_gate1_recall": 0.916446997689221,
       "eval_gate1_support": 5480,
+      "eval_gate2_accuracy": 0.8593065693430657,
+      "eval_gate2_f1": 0.7763067392280264,
+      "eval_gate2_precision": 0.7921477517391428,
+      "eval_gate2_recall": 0.775442797363134,
       "eval_gate2_support": 5480,
+      "eval_gate3_accuracy": 0.8810483870967742,
+      "eval_gate3_f1": 0.778218086166726,
+      "eval_gate3_precision": 0.75635112362015,
+      "eval_gate3_recall": 0.8147429373450497,
+      "eval_gate3_support": 6944,
+      "eval_loss": 0.7152989506721497,
+      "eval_runtime": 9.7809,
+      "eval_samples_per_second": 1270.237,
+      "eval_steps_per_second": 39.772,
+      "step": 31070
     },
     {
       "epoch": 10.0,
+      "eval_gate1_accuracy": 0.9204524721766101,
+      "eval_gate1_f1": 0.9175696677724912,
+      "eval_gate1_precision": 0.9198718411071631,
+      "eval_gate1_recall": 0.9156173695177233,
       "eval_gate1_support": 5481,
+      "eval_gate2_accuracy": 0.8573253056011677,
+      "eval_gate2_f1": 0.7662196765345953,
+      "eval_gate2_precision": 0.7540255243234163,
+      "eval_gate2_recall": 0.7899899686908007,
       "eval_gate2_support": 5481,
+      "eval_gate3_accuracy": 0.8761520737327189,
+      "eval_gate3_f1": 0.7204269422018509,
+      "eval_gate3_precision": 0.7065840948237819,
+      "eval_gate3_recall": 0.7411799394675562,
+      "eval_gate3_support": 6944,
+      "eval_loss": 0.7167699933052063,
+      "eval_runtime": 9.951,
+      "eval_samples_per_second": 1248.614,
+      "eval_steps_per_second": 39.091,
+      "step": 31070
     }
   ],
   "logging_steps": 500,
+  "max_steps": 31070,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 10,
   "save_steps": 500,
       "attributes": {}
     }
   },
+  "total_flos": 6.336727068480365e+16,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:19f9a33b1fbad43324e38078c41a59a870c901b0e80b2e1191720bcab0f09c79
 size 5841

 version https://git-lfs.github.com/spec/v1
+oid sha256:2f7fd5367a51397aa9e61e2f6c06b3f993347adf643ea400b270a4147e24f944
 size 5841