Training in progress, step 5000, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +68 -222
last-checkpoint/training_args.bin +1 -1

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8fb45637fb65c35af8768a36b33d1c9681556a3e01da28c8ecc31868a401b89d
 size 409608164

 version https://git-lfs.github.com/spec/v1
+oid sha256:6797e1eb60e4b137cee36647982a7e4c89062a1298c710a82454382fa145da49
 size 409608164

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a192a262b1834f01bca9dad7258fe2d1c4eb780ccbcc5369777aed8e3c2fe542
 size 814647162

 version https://git-lfs.github.com/spec/v1
+oid sha256:483217b0f8f112574f35a774a46a057701c83ccd530b2a792d290e2fee3a5845
 size 814647162

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:38fea94f5a2552b54264ba37d51c5e23e8f780a43c0b6021815a435ce42bab4c
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:f9b6e15e2bcd7f68e44a74250dacde4ebb4f0bab2be2b424002fa6be2410d600
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3fda06869ae896845cef697d74c9284a49d9f0497862670a0e60cb59f13c3372
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:655073625197a7e4274d7f9548f06c1fcefb405e98bb15971106f0841041af52
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,278 +1,124 @@
 {
-  "best_metric": 0.5652673442333186,
-  "best_model_checkpoint": "/mimer/NOBACKUP/groups/naiss2023-6-290/stefano/models//PROTAC-Splitter-EncoderDecoder-lr_cosine-opt25-rand-smiles/trial-number=15-learning_rate=2.3e-04-warmup_ratio=0.070-num_cycles=8.500/checkpoint-10000",
-  "epoch": 0.9863878477017163,
   "eval_steps": 2500,
-  "global_step": 10000,
   "is_hyper_param_search": true,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 0.049319392385085814,
-      "grad_norm": 0.5060771107673645,
-      "learning_rate": 0.00016371366993372984,
-      "loss": 1.4637,
       "step": 500
     },
     {
       "epoch": 0.09863878477017163,
-      "grad_norm": 0.24109773337841034,
-      "learning_rate": 9.64787889193764e-05,
-      "loss": 0.0921,
       "step": 1000
     },
     {
       "epoch": 0.14795817715525744,
-      "grad_norm": 0.19558703899383545,
-      "learning_rate": 0.00010153394284957266,
-      "loss": 0.0268,
       "step": 1500
     },
     {
       "epoch": 0.19727756954034326,
-      "grad_norm": 0.16484782099723816,
-      "learning_rate": 0.00015725808546261587,
-      "loss": 0.0318,
       "step": 2000
     },
     {
       "epoch": 0.24659696192542907,
-      "grad_norm": 0.09161640703678131,
-      "learning_rate": 4.4808780348991996e-05,
-      "loss": 0.0122,
       "step": 2500
     },
     {
       "epoch": 0.2959163543105149,
-      "grad_norm": 0.1636224240064621,
-      "learning_rate": 0.00020580215204037155,
-      "loss": 0.0172,
       "step": 3000
     },
     {
       "epoch": 0.3452357466956007,
-      "grad_norm": 0.08105295896530151,
-      "learning_rate": 7.977567091364175e-06,
-      "loss": 0.0106,
       "step": 3500
     },
     {
       "epoch": 0.3945551390806865,
-      "grad_norm": 0.16828566789627075,
-      "learning_rate": 0.00022824090725901466,
-      "loss": 0.0105,
       "step": 4000
     },
     {
       "epoch": 0.4438745314657723,
-      "grad_norm": 0.09502086788415909,
-      "learning_rate": 1.5637709631532583e-06,
-      "loss": 0.0126,
       "step": 4500
     },
     {
       "epoch": 0.49319392385085814,
-      "grad_norm": 0.11923135817050934,
-      "learning_rate": 0.00021816311730162138,
-      "loss": 0.0064,
       "step": 5000
     },
     {
       "epoch": 0.49319392385085814,
-      "eval_all_ligands_equal": 0.4258948298718515,
-      "eval_e3_equal": 0.7824127264692885,
       "eval_e3_graph_edit_distance": 9.999999999999999e+63,
       "eval_e3_graph_edit_distance_norm": 1.0,
-      "eval_e3_has_attachment_point(s)": 0.980468404772426,
-      "eval_e3_heavy_atoms_difference": 0.708882015024304,
-      "eval_e3_heavy_atoms_difference_norm": 0.016544401021047882,
       "eval_e3_tanimoto_similarity": 0.0,
-      "eval_e3_valid": 0.980468404772426,
-      "eval_has_all_attachment_points": 0.9753424657534246,
-      "eval_has_three_substructures": 0.9970835174547061,
-      "eval_heavy_atoms_difference": 10.783650022094564,
-      "eval_heavy_atoms_difference_norm": 0.13659586306670762,
-      "eval_linker_equal": 0.6577993813521874,
       "eval_linker_graph_edit_distance": 9.999999999999999e+63,
       "eval_linker_graph_edit_distance_norm": 1.0,
-      "eval_linker_has_attachment_point(s)": 0.9863013698630136,
-      "eval_linker_heavy_atoms_difference": 1.0914714980114892,
-      "eval_linker_heavy_atoms_difference_norm": 0.03141332229163428,
       "eval_linker_tanimoto_similarity": 0.0,
-      "eval_linker_valid": 0.9863013698630136,
-      "eval_loss": 0.2912170886993408,
-      "eval_num_fragments": 2.9969951391957577,
-      "eval_poi_equal": 0.6909412284577994,
       "eval_poi_graph_edit_distance": 9.999999999999999e+63,
       "eval_poi_graph_edit_distance_norm": 1.0,
-      "eval_poi_has_attachment_point(s)": 0.9070260715863897,
-      "eval_poi_heavy_atoms_difference": 3.5014582412726467,
-      "eval_poi_heavy_atoms_difference_norm": 0.10861899508588566,
       "eval_poi_tanimoto_similarity": 0.0,
-      "eval_poi_valid": 0.9070260715863897,
-      "eval_reassembly": 0.43561643835616437,
-      "eval_reassembly_nostereo": 0.4608926204153778,
-      "eval_runtime": 1655.7017,
-      "eval_samples_per_second": 6.834,
-      "eval_steps_per_second": 0.107,
       "eval_tanimoto_similarity": 0.0,
-      "eval_valid": 0.8826336721166593,
       "step": 5000
-    },
-    {
-      "epoch": 0.542513316235944,
-      "grad_norm": 0.0855363979935646,
-      "learning_rate": 2.739995113403538e-05,
-      "loss": 0.0135,
-      "step": 5500
-    },
-    {
-      "epoch": 0.5918327086210298,
-      "grad_norm": 0.07733646780252457,
-      "learning_rate": 0.00017844822299033737,
-      "loss": 0.0045,
-      "step": 6000
-    },
-    {
-      "epoch": 0.6411521010061156,
-      "grad_norm": 0.08803705126047134,
-      "learning_rate": 7.810415658232181e-05,
-      "loss": 0.011,
-      "step": 6500
-    },
-    {
-      "epoch": 0.6904714933912014,
-      "grad_norm": 0.07920731604099274,
-      "learning_rate": 0.00012044362176156312,
-      "loss": 0.0037,
-      "step": 7000
-    },
-    {
-      "epoch": 0.7397908857762873,
-      "grad_norm": 0.09854772686958313,
-      "learning_rate": 0.00013983023944795432,
-      "loss": 0.0175,
-      "step": 7500
-    },
-    {
-      "epoch": 0.7397908857762873,
-      "eval_all_ligands_equal": 0.5083517454706142,
-      "eval_e3_equal": 0.8068935041979673,
-      "eval_e3_graph_edit_distance": 9.999999999999999e+63,
-      "eval_e3_graph_edit_distance_norm": 1.0,
-      "eval_e3_has_attachment_point(s)": 0.9902783915156872,
-      "eval_e3_heavy_atoms_difference": 0.5395492708793637,
-      "eval_e3_heavy_atoms_difference_norm": 0.01319573072161701,
-      "eval_e3_tanimoto_similarity": 0.0,
-      "eval_e3_valid": 0.9902783915156872,
-      "eval_has_all_attachment_points": 0.9885992045956694,
-      "eval_has_three_substructures": 0.9993813521873619,
-      "eval_heavy_atoms_difference": 8.121785240830755,
-      "eval_heavy_atoms_difference_norm": 0.10144213714960434,
-      "eval_linker_equal": 0.7551038444542643,
-      "eval_linker_graph_edit_distance": 9.999999999999999e+63,
-      "eval_linker_graph_edit_distance_norm": 1.0,
-      "eval_linker_has_attachment_point(s)": 0.9975254087494476,
-      "eval_linker_heavy_atoms_difference": 0.45152452496685813,
-      "eval_linker_heavy_atoms_difference_norm": 0.007385939888565608,
-      "eval_linker_tanimoto_similarity": 0.0,
-      "eval_linker_valid": 0.9975254087494476,
-      "eval_loss": 0.28004351258277893,
-      "eval_num_fragments": 2.999381352187362,
-      "eval_poi_equal": 0.7333627927529828,
-      "eval_poi_graph_edit_distance": 9.999999999999999e+63,
-      "eval_poi_graph_edit_distance_norm": 1.0,
-      "eval_poi_has_attachment_point(s)": 0.9210782147591693,
-      "eval_poi_heavy_atoms_difference": 3.063985859478568,
-      "eval_poi_heavy_atoms_difference_norm": 0.08532202235757833,
-      "eval_poi_tanimoto_similarity": 0.0,
-      "eval_poi_valid": 0.9210782147591693,
-      "eval_reassembly": 0.5161290322580645,
-      "eval_reassembly_nostereo": 0.544675209898365,
-      "eval_runtime": 1640.7276,
-      "eval_samples_per_second": 6.896,
-      "eval_steps_per_second": 0.108,
-      "eval_tanimoto_similarity": 0.0,
-      "eval_valid": 0.9114449845338047,
-      "step": 7500
-    },
-    {
-      "epoch": 0.789110278161373,
-      "grad_norm": 0.06846427172422409,
-      "learning_rate": 6.014314326583964e-05,
-      "loss": 0.0043,
-      "step": 8000
-    },
-    {
-      "epoch": 0.8384296705464589,
-      "grad_norm": 0.12191401422023773,
-      "learning_rate": 0.0001936769028943003,
-      "loss": 0.0067,
-      "step": 8500
-    },
-    {
-      "epoch": 0.8877490629315447,
-      "grad_norm": 0.043216489255428314,
-      "learning_rate": 1.601154649200009e-05,
-      "loss": 0.0044,
-      "step": 9000
-    },
-    {
-      "epoch": 0.9370684553166305,
-      "grad_norm": 0.17743472754955292,
-      "learning_rate": 0.00022488269882462762,
-      "loss": 0.0057,
-      "step": 9500
-    },
-    {
-      "epoch": 0.9863878477017163,
-      "grad_norm": 0.05701812356710434,
-      "learning_rate": 1.8865539543912193e-09,
-      "loss": 0.008,
-      "step": 10000
-    },
-    {
-      "epoch": 0.9863878477017163,
-      "eval_all_ligands_equal": 0.5652673442333186,
-      "eval_e3_equal": 0.8191780821917808,
-      "eval_e3_graph_edit_distance": 9.999999999999999e+63,
-      "eval_e3_graph_edit_distance_norm": 1.0,
-      "eval_e3_has_attachment_point(s)": 0.9943437914273089,
-      "eval_e3_heavy_atoms_difference": 0.23968183826778613,
-      "eval_e3_heavy_atoms_difference_norm": 0.0009516451755027366,
-      "eval_e3_tanimoto_similarity": 0.0,
-      "eval_e3_valid": 0.9943437914273089,
-      "eval_has_all_attachment_points": 0.9915156871409633,
-      "eval_has_three_substructures": 0.9999116217410517,
-      "eval_heavy_atoms_difference": 4.139372514361467,
-      "eval_heavy_atoms_difference_norm": 0.0527094987954026,
-      "eval_linker_equal": 0.8091029606716748,
-      "eval_linker_graph_edit_distance": 9.999999999999999e+63,
-      "eval_linker_graph_edit_distance_norm": 1.0,
-      "eval_linker_has_attachment_point(s)": 0.9978789217852408,
-      "eval_linker_heavy_atoms_difference": 0.29960229783473263,
-      "eval_linker_heavy_atoms_difference_norm": -7.111423721457522e-05,
-      "eval_linker_tanimoto_similarity": 0.0,
-      "eval_linker_valid": 0.9978789217852408,
-      "eval_loss": 0.2858957052230835,
-      "eval_num_fragments": 2.9999116217410515,
-      "eval_poi_equal": 0.7730446310207689,
-      "eval_poi_graph_edit_distance": 9.999999999999999e+63,
-      "eval_poi_graph_edit_distance_norm": 1.0,
-      "eval_poi_has_attachment_point(s)": 0.9616438356164384,
-      "eval_poi_heavy_atoms_difference": 1.3501546619531595,
-      "eval_poi_heavy_atoms_difference_norm": 0.03637356926643038,
-      "eval_poi_tanimoto_similarity": 0.0,
-      "eval_poi_valid": 0.9616438356164384,
-      "eval_reassembly": 0.5741935483870968,
-      "eval_reassembly_nostereo": 0.6089262041537782,
-      "eval_runtime": 1532.3845,
-      "eval_samples_per_second": 7.384,
-      "eval_steps_per_second": 0.116,
-      "eval_tanimoto_similarity": 0.0,
-      "eval_valid": 0.955015466195316,
-      "step": 10000
     }
   ],
   "logging_steps": 500,
@@ -287,17 +133,17 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": true
       },
       "attributes": {}
     }
   },
-  "total_flos": 8.729673191023411e+16,
   "train_batch_size": 128,
-  "trial_name": "trial-number=15-learning_rate=2.3e-04-warmup_ratio=0.070-num_cycles=8.500",
   "trial_params": {
-    "learning_rate": 0.00022887171056735432,
-    "num_cycles": 8.5,
-    "warmup_ratio": 0.06999999999999999
   }
 }

 {
+  "best_metric": 0.1099425541316836,
+  "best_model_checkpoint": "/mimer/NOBACKUP/groups/naiss2023-6-290/stefano/models//PROTAC-Splitter-EncoderDecoder-lr_cosine-opt25-rand-smiles/trial-number=16-learning_rate=2.7e-05-warmup_ratio=0.020-num_cycles=4.000/checkpoint-5000",
+  "epoch": 0.49319392385085814,
   "eval_steps": 2500,
+  "global_step": 5000,
   "is_hyper_param_search": true,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 0.049319392385085814,
+      "grad_norm": 1.1054000854492188,
+      "learning_rate": 1.9049167867746203e-05,
+      "loss": 2.8834,
       "step": 500
     },
     {
       "epoch": 0.09863878477017163,
+      "grad_norm": 0.7741394639015198,
+      "learning_rate": 2.246394835598448e-05,
+      "loss": 0.5274,
       "step": 1000
     },
     {
       "epoch": 0.14795817715525744,
+      "grad_norm": 0.5777184963226318,
+      "learning_rate": 5.867106147706695e-06,
+      "loss": 0.2525,
       "step": 1500
     },
     {
       "epoch": 0.19727756954034326,
+      "grad_norm": 0.4335942268371582,
+      "learning_rate": 9.20011203733316e-07,
+      "loss": 0.2033,
       "step": 2000
     },
     {
       "epoch": 0.24659696192542907,
+      "grad_norm": 0.5831762552261353,
+      "learning_rate": 1.536036183614666e-05,
+      "loss": 0.1915,
       "step": 2500
     },
     {
       "epoch": 0.2959163543105149,
+      "grad_norm": 0.619367778301239,
+      "learning_rate": 2.660216000372886e-05,
+      "loss": 0.1481,
       "step": 3000
     },
     {
       "epoch": 0.3452357466956007,
+      "grad_norm": 0.34985899925231934,
+      "learning_rate": 1.7062229379525045e-05,
+      "loss": 0.0992,
       "step": 3500
     },
     {
       "epoch": 0.3945551390806865,
+      "grad_norm": 0.31610220670700073,
+      "learning_rate": 1.6618734606935415e-06,
+      "loss": 0.0741,
       "step": 4000
     },
     {
       "epoch": 0.4438745314657723,
+      "grad_norm": 0.3805707097053528,
+      "learning_rate": 4.48862429344581e-06,
+      "loss": 0.0681,
       "step": 4500
     },
     {
       "epoch": 0.49319392385085814,
+      "grad_norm": 0.36338239908218384,
+      "learning_rate": 2.1121191121292532e-05,
+      "loss": 0.0655,
       "step": 5000
     },
     {
       "epoch": 0.49319392385085814,
+      "eval_all_ligands_equal": 0.1099425541316836,
+      "eval_e3_equal": 0.6121078214759169,
       "eval_e3_graph_edit_distance": 9.999999999999999e+63,
       "eval_e3_graph_edit_distance_norm": 1.0,
+      "eval_e3_has_attachment_point(s)": 0.9981440565620857,
+      "eval_e3_heavy_atoms_difference": -0.3069376933274415,
+      "eval_e3_heavy_atoms_difference_norm": -0.028563232874342336,
       "eval_e3_tanimoto_similarity": 0.0,
+      "eval_e3_valid": 0.9981440565620857,
+      "eval_has_all_attachment_points": 0.9797613787008396,
+      "eval_has_three_substructures": 0.9988510826336722,
+      "eval_heavy_atoms_difference": 8.80265134776845,
+      "eval_heavy_atoms_difference_norm": 0.11233622664224628,
+      "eval_linker_equal": 0.20963323022536456,
       "eval_linker_graph_edit_distance": 9.999999999999999e+63,
       "eval_linker_graph_edit_distance_norm": 1.0,
+      "eval_linker_has_attachment_point(s)": 0.9968183826778613,
+      "eval_linker_heavy_atoms_difference": 2.637560760053027,
+      "eval_linker_heavy_atoms_difference_norm": 0.11394244974114735,
       "eval_linker_tanimoto_similarity": 0.0,
+      "eval_linker_valid": 0.9968183826778613,
+      "eval_loss": 0.30683231353759766,
+      "eval_num_fragments": 2.999734865223155,
+      "eval_poi_equal": 0.5805567830313743,
       "eval_poi_graph_edit_distance": 9.999999999999999e+63,
       "eval_poi_graph_edit_distance_norm": 1.0,
+      "eval_poi_has_attachment_point(s)": 0.9226690234202386,
+      "eval_poi_heavy_atoms_difference": 2.777993813521874,
+      "eval_poi_heavy_atoms_difference_norm": 0.07922463145059772,
       "eval_poi_tanimoto_similarity": 0.0,
+      "eval_poi_valid": 0.9226690234202386,
+      "eval_reassembly": 0.11250552364118427,
+      "eval_reassembly_nostereo": 0.13150684931506848,
+      "eval_runtime": 1553.4476,
+      "eval_samples_per_second": 7.284,
+      "eval_steps_per_second": 0.114,
       "eval_tanimoto_similarity": 0.0,
+      "eval_valid": 0.9201944321696862,
       "step": 5000
     }
   ],
   "logging_steps": 500,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": false
       },
       "attributes": {}
     }
   },
+  "total_flos": 4.364959997072179e+16,
   "train_batch_size": 128,
+  "trial_name": "trial-number=16-learning_rate=2.7e-05-warmup_ratio=0.020-num_cycles=4.000",
   "trial_params": {
+    "learning_rate": 2.663073667910919e-05,
+    "num_cycles": 4.0,
+    "warmup_ratio": 0.02
   }
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c237fa51888ce37a469ee9e97557e0a1d393718be5fe0f88b8c05c6d36e99081
 size 7480

 version https://git-lfs.github.com/spec/v1
+oid sha256:1a07c4a78fbc6bfb65df1ec975d1b917a9a109b01a66c8abd5deca208f2da4c6
 size 7480