Training in progress, step 5000, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +68 -222
last-checkpoint/training_args.bin +1 -1

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:41c4339e53b84207e6b4b334dae734e119d6d84d144e6730eb85a3b38a06d571
 size 409608164

 version https://git-lfs.github.com/spec/v1
+oid sha256:1640348e6c42dfdff0604b7152c85724b4e3aabdfd7a2d4619857d1f14da6b0f
 size 409608164

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:176cb39217b3c8969ce99b9e7f7e4970e5c5a022d6e506f43b423c882ed80d86
 size 814647162

 version https://git-lfs.github.com/spec/v1
+oid sha256:ec14179005c8f6f1429e17ec00d6fa532b964f1bba08e7051e3cae65c3c65b0a
 size 814647162

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:775001505531f2ceb68f27a1316732450644b6eb11f3edd07407866f7ae005a9
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:2e85f985368f357e6671ab2415c4c76e6da5df01cdab4357c1c3e3df5aea6241
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7c8036a0d2d386cb6b32ab93f67cfea9d25b9f22dfed89381daf4e334561e8a1
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:9423d0070c8da6799e8d89d62ce89dd7f4abcaf63d2610d6f37195c9b19148a3
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,278 +1,124 @@
 {
-  "best_metric": 0.0,
-  "best_model_checkpoint": "/mimer/NOBACKUP/groups/naiss2023-6-290/stefano/models//PROTAC-Splitter-EncoderDecoder-lr_cosine_restarts-opt25-rand-smiles/trial-number=12-learning_rate=2.2e-06-warmup_ratio=0.050-num_cycles=10/checkpoint-5000",
-  "epoch": 0.9863878477017163,
   "eval_steps": 2500,
-  "global_step": 10000,
   "is_hyper_param_search": true,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 0.049319392385085814,
-      "grad_norm": 2.377506732940674,
-      "learning_rate": 1.4154648142539406e-06,
-      "loss": 3.9722,
       "step": 500
     },
     {
       "epoch": 0.09863878477017163,
-      "grad_norm": 2.192603588104248,
-      "learning_rate": 4.420955339237543e-08,
-      "loss": 1.6435,
       "step": 1000
     },
     {
       "epoch": 0.14795817715525744,
-      "grad_norm": 1.4143450260162354,
-      "learning_rate": 1.3822352979831102e-06,
-      "loss": 1.4094,
       "step": 1500
     },
     {
       "epoch": 0.19727756954034326,
-      "grad_norm": 1.5114798545837402,
-      "learning_rate": 3.498093351576883e-08,
-      "loss": 1.1766,
       "step": 2000
     },
     {
       "epoch": 0.24659696192542907,
-      "grad_norm": 1.2862557172775269,
-      "learning_rate": 1.348712939813865e-06,
-      "loss": 1.0714,
       "step": 2500
     },
     {
       "epoch": 0.2959163543105149,
-      "grad_norm": 1.3415638208389282,
-      "learning_rate": 2.681604268390353e-08,
-      "loss": 0.9457,
       "step": 3000
     },
     {
       "epoch": 0.3452357466956007,
-      "grad_norm": 1.2667008638381958,
-      "learning_rate": 1.3149314939193131e-06,
-      "loss": 0.8748,
       "step": 3500
     },
     {
       "epoch": 0.3945551390806865,
-      "grad_norm": 1.3995180130004883,
-      "learning_rate": 1.97231022497391e-08,
-      "loss": 0.7894,
       "step": 4000
     },
     {
       "epoch": 0.4438745314657723,
-      "grad_norm": 1.4177407026290894,
-      "learning_rate": 1.2809249753519381e-06,
-      "loss": 0.7366,
       "step": 4500
     },
     {
       "epoch": 0.49319392385085814,
-      "grad_norm": 1.3485033512115479,
-      "learning_rate": 1.3709254203049984e-08,
-      "loss": 0.6756,
       "step": 5000
     },
     {
       "epoch": 0.49319392385085814,
-      "eval_all_ligands_equal": 0.0,
-      "eval_e3_equal": 0.03844454264250994,
       "eval_e3_graph_edit_distance": 9.999999999999999e+63,
       "eval_e3_graph_edit_distance_norm": 1.0,
-      "eval_e3_has_attachment_point(s)": 0.9485638532920901,
-      "eval_e3_heavy_atoms_difference": 1.6929739284136103,
-      "eval_e3_heavy_atoms_difference_norm": 0.0038030353868209665,
       "eval_e3_tanimoto_similarity": 0.0,
-      "eval_e3_valid": 0.9485638532920901,
-      "eval_has_all_attachment_points": 0.6585064074237738,
-      "eval_has_three_substructures": 0.951480335837384,
-      "eval_heavy_atoms_difference": 65.374370304905,
-      "eval_heavy_atoms_difference_norm": 0.8488282091588889,
-      "eval_linker_equal": 0.0009721608484312859,
       "eval_linker_graph_edit_distance": 9.999999999999999e+63,
       "eval_linker_graph_edit_distance_norm": 1.0,
-      "eval_linker_has_attachment_point(s)": 0.9119752540874945,
-      "eval_linker_heavy_atoms_difference": 8.96367653557225,
-      "eval_linker_heavy_atoms_difference_norm": 0.4479338554218642,
       "eval_linker_tanimoto_similarity": 0.0,
-      "eval_linker_valid": 0.9119752540874945,
-      "eval_loss": 0.7331597208976746,
-      "eval_num_fragments": 3.036588599204596,
-      "eval_poi_equal": 8.837825894829872e-05,
       "eval_poi_graph_edit_distance": 9.999999999999999e+63,
       "eval_poi_graph_edit_distance_norm": 1.0,
-      "eval_poi_has_attachment_point(s)": 0.2832523199292974,
-      "eval_poi_heavy_atoms_difference": 26.11268228015908,
-      "eval_poi_heavy_atoms_difference_norm": 0.8021571436510379,
       "eval_poi_tanimoto_similarity": 0.0,
-      "eval_poi_valid": 0.2832523199292974,
-      "eval_reassembly": 0.0,
-      "eval_reassembly_nostereo": 0.0,
-      "eval_runtime": 1503.4392,
-      "eval_samples_per_second": 7.526,
-      "eval_steps_per_second": 0.118,
       "eval_tanimoto_similarity": 0.0,
-      "eval_valid": 0.26672558550596553,
       "step": 5000
-    },
-    {
-      "epoch": 0.542513316235944,
-      "grad_norm": 1.2659064531326294,
-      "learning_rate": 1.2467276257933323e-06,
-      "loss": 0.6362,
-      "step": 5500
-    },
-    {
-      "epoch": 0.5918327086210298,
-      "grad_norm": 1.2290265560150146,
-      "learning_rate": 8.78055397904762e-09,
-      "loss": 0.5897,
-      "step": 6000
-    },
-    {
-      "epoch": 0.6411521010061156,
-      "grad_norm": 1.137576699256897,
-      "learning_rate": 1.2123738790757074e-06,
-      "loss": 0.5586,
-      "step": 6500
-    },
-    {
-      "epoch": 0.6904714933912014,
-      "grad_norm": 1.2583026885986328,
-      "learning_rate": 4.941964361068419e-09,
-      "loss": 0.5224,
-      "step": 7000
-    },
-    {
-      "epoch": 0.7397908857762873,
-      "grad_norm": 1.1442275047302246,
-      "learning_rate": 1.1778983265099774e-06,
-      "loss": 0.4958,
-      "step": 7500
-    },
-    {
-      "epoch": 0.7397908857762873,
-      "eval_all_ligands_equal": 8.837825894829872e-05,
-      "eval_e3_equal": 0.08351745470614229,
-      "eval_e3_graph_edit_distance": 9.999999999999999e+63,
-      "eval_e3_graph_edit_distance_norm": 1.0,
-      "eval_e3_has_attachment_point(s)": 0.9827662395050818,
-      "eval_e3_heavy_atoms_difference": -0.5610251878038003,
-      "eval_e3_heavy_atoms_difference_norm": -0.061074965156396106,
-      "eval_e3_tanimoto_similarity": 0.0,
-      "eval_e3_valid": 0.9827662395050818,
-      "eval_has_all_attachment_points": 0.8335837384003535,
-      "eval_has_three_substructures": 0.984003535130358,
-      "eval_heavy_atoms_difference": 53.042863455589924,
-      "eval_heavy_atoms_difference_norm": 0.6809498122995832,
-      "eval_linker_equal": 0.0014140521431727795,
-      "eval_linker_graph_edit_distance": 9.999999999999999e+63,
-      "eval_linker_graph_edit_distance_norm": 1.0,
-      "eval_linker_has_attachment_point(s)": 0.9684489615554573,
-      "eval_linker_heavy_atoms_difference": 6.937163057887759,
-      "eval_linker_heavy_atoms_difference_norm": 0.3018380856424576,
-      "eval_linker_tanimoto_similarity": 0.0,
-      "eval_linker_valid": 0.9684489615554573,
-      "eval_loss": 0.5725921988487244,
-      "eval_num_fragments": 3.0022094564737074,
-      "eval_poi_equal": 0.009456473707467963,
-      "eval_poi_graph_edit_distance": 9.999999999999999e+63,
-      "eval_poi_graph_edit_distance_norm": 1.0,
-      "eval_poi_has_attachment_point(s)": 0.40362350861688023,
-      "eval_poi_heavy_atoms_difference": 22.278479893946088,
-      "eval_poi_heavy_atoms_difference_norm": 0.6629700079093479,
-      "eval_poi_tanimoto_similarity": 0.0,
-      "eval_poi_valid": 0.40362350861688023,
-      "eval_reassembly": 8.837825894829872e-05,
-      "eval_reassembly_nostereo": 8.837825894829872e-05,
-      "eval_runtime": 1403.9946,
-      "eval_samples_per_second": 8.059,
-      "eval_steps_per_second": 0.126,
-      "eval_tanimoto_similarity": 0.0,
-      "eval_valid": 0.39770216526734425,
-      "step": 7500
-    },
-    {
-      "epoch": 0.789110278161373,
-      "grad_norm": 1.1507314443588257,
-      "learning_rate": 2.1973504834757866e-09,
-      "loss": 0.4678,
-      "step": 8000
-    },
-    {
-      "epoch": 0.8384296705464589,
-      "grad_norm": 1.209816813468933,
-      "learning_rate": 1.1433356820552028e-06,
-      "loss": 0.4448,
-      "step": 8500
-    },
-    {
-      "epoch": 0.8877490629315447,
-      "grad_norm": 1.0316253900527954,
-      "learning_rate": 5.494759397925871e-10,
-      "loss": 0.4219,
-      "step": 9000
-    },
-    {
-      "epoch": 0.9370684553166305,
-      "grad_norm": 1.1292330026626587,
-      "learning_rate": 1.108720747364596e-06,
-      "loss": 0.4027,
-      "step": 9500
-    },
-    {
-      "epoch": 0.9863878477017163,
-      "grad_norm": 0.8182277679443359,
-      "learning_rate": 0.0,
-      "loss": 0.3826,
-      "step": 10000
-    },
-    {
-      "epoch": 0.9863878477017163,
-      "eval_all_ligands_equal": 0.0,
-      "eval_e3_equal": 0.1095890410958904,
-      "eval_e3_graph_edit_distance": 9.999999999999999e+63,
-      "eval_e3_graph_edit_distance_norm": 1.0,
-      "eval_e3_has_attachment_point(s)": 0.9916924436588599,
-      "eval_e3_heavy_atoms_difference": -1.6922669023420238,
-      "eval_e3_heavy_atoms_difference_norm": -0.09654363784216151,
-      "eval_e3_tanimoto_similarity": 0.0,
-      "eval_e3_valid": 0.9916924436588599,
-      "eval_has_all_attachment_points": 0.8662836942112241,
-      "eval_has_three_substructures": 0.9924878479893946,
-      "eval_heavy_atoms_difference": 42.364471939902785,
-      "eval_heavy_atoms_difference_norm": 0.5404104663047343,
-      "eval_linker_equal": 0.0019443216968625717,
-      "eval_linker_graph_edit_distance": 9.999999999999999e+63,
-      "eval_linker_graph_edit_distance_norm": 1.0,
-      "eval_linker_has_attachment_point(s)": 0.9830313742819267,
-      "eval_linker_heavy_atoms_difference": 6.72364118426867,
-      "eval_linker_heavy_atoms_difference_norm": 0.29550622383485403,
-      "eval_linker_tanimoto_similarity": 0.0,
-      "eval_linker_valid": 0.9830313742819267,
-      "eval_loss": 0.4959617555141449,
-      "eval_num_fragments": 2.999734865223155,
-      "eval_poi_equal": 0.029871851524524966,
-      "eval_poi_graph_edit_distance": 9.999999999999999e+63,
-      "eval_poi_graph_edit_distance_norm": 1.0,
-      "eval_poi_has_attachment_point(s)": 0.5390190013256739,
-      "eval_poi_heavy_atoms_difference": 17.53928413610252,
-      "eval_poi_heavy_atoms_difference_norm": 0.5091190832342901,
-      "eval_poi_tanimoto_similarity": 0.0,
-      "eval_poi_valid": 0.5390190013256739,
-      "eval_reassembly": 0.0,
-      "eval_reassembly_nostereo": 0.0,
-      "eval_runtime": 1484.6604,
-      "eval_samples_per_second": 7.621,
-      "eval_steps_per_second": 0.119,
-      "eval_tanimoto_similarity": 0.0,
-      "eval_valid": 0.5350419796730005,
-      "step": 10000
     }
   ],
   "logging_steps": 500,
@@ -287,17 +133,17 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": true
       },
       "attributes": {}
     }
   },
-  "total_flos": 8.729673191023411e+16,
   "train_batch_size": 128,
-  "trial_name": "trial-number=12-learning_rate=2.2e-06-warmup_ratio=0.050-num_cycles=10",
   "trial_params": {
-    "learning_rate": 2.182809124107808e-06,
-    "num_cycles": 10,
-    "warmup_ratio": 0.05
   }
 }

 {
+  "best_metric": 0.00017675651789659743,
+  "best_model_checkpoint": "/mimer/NOBACKUP/groups/naiss2023-6-290/stefano/models//PROTAC-Splitter-EncoderDecoder-lr_cosine_restarts-opt25-rand-smiles/trial-number=13-learning_rate=4.2e-06-warmup_ratio=0.100-num_cycles=7/checkpoint-5000",
+  "epoch": 0.49319392385085814,
   "eval_steps": 2500,
+  "global_step": 5000,
   "is_hyper_param_search": true,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 0.049319392385085814,
+      "grad_norm": 1.324150562286377,
+      "learning_rate": 3.407080255399213e-06,
+      "loss": 3.1412,
       "step": 500
     },
     {
       "epoch": 0.09863878477017163,
+      "grad_norm": 1.3872032165527344,
+      "learning_rate": 1.2215048351460788e-06,
+      "loss": 1.137,
       "step": 1000
     },
     {
       "epoch": 0.14795817715525744,
+      "grad_norm": 1.4091087579727173,
+      "learning_rate": 1.051987182203377e-09,
+      "loss": 0.9858,
       "step": 1500
     },
     {
       "epoch": 0.19727756954034326,
+      "grad_norm": 1.3121250867843628,
+      "learning_rate": 3.0763469409561644e-06,
+      "loss": 0.8521,
       "step": 2000
     },
     {
       "epoch": 0.24659696192542907,
+      "grad_norm": 1.307373046875,
+      "learning_rate": 8.77481507144185e-07,
+      "loss": 0.686,
       "step": 2500
     },
     {
       "epoch": 0.2959163543105149,
+      "grad_norm": 1.4561212062835693,
+      "learning_rate": 4.152802870531806e-06,
+      "loss": 0.6403,
       "step": 3000
     },
     {
       "epoch": 0.3452357466956007,
+      "grad_norm": 1.1296412944793701,
+      "learning_rate": 2.7099473036382773e-06,
+      "loss": 0.5594,
       "step": 3500
     },
     {
       "epoch": 0.3945551390806865,
+      "grad_norm": 1.3068326711654663,
+      "learning_rate": 5.772645821334253e-07,
+      "loss": 0.4877,
       "step": 4000
     },
     {
       "epoch": 0.4438745314657723,
+      "grad_norm": 1.3561311960220337,
+      "learning_rate": 4.05303585908682e-06,
+      "loss": 0.4634,
       "step": 4500
     },
     {
       "epoch": 0.49319392385085814,
+      "grad_norm": 0.9951079487800598,
+      "learning_rate": 2.3211239809831595e-06,
+      "loss": 0.41,
       "step": 5000
     },
     {
       "epoch": 0.49319392385085814,
+      "eval_all_ligands_equal": 0.00017675651789659743,
+      "eval_e3_equal": 0.11365444100751215,
       "eval_e3_graph_edit_distance": 9.999999999999999e+63,
       "eval_e3_graph_edit_distance_norm": 1.0,
+      "eval_e3_has_attachment_point(s)": 0.9889527176314626,
+      "eval_e3_heavy_atoms_difference": -0.9003977021652674,
+      "eval_e3_heavy_atoms_difference_norm": -0.0656363049999436,
       "eval_e3_tanimoto_similarity": 0.0,
+      "eval_e3_valid": 0.9889527176314626,
+      "eval_has_all_attachment_points": 0.8737958462218294,
+      "eval_has_three_substructures": 0.9905435262925321,
+      "eval_heavy_atoms_difference": 42.72938577110031,
+      "eval_heavy_atoms_difference_norm": 0.5453996415795184,
+      "eval_linker_equal": 0.0021210782147591694,
       "eval_linker_graph_edit_distance": 9.999999999999999e+63,
       "eval_linker_graph_edit_distance_norm": 1.0,
+      "eval_linker_has_attachment_point(s)": 0.9819708351745471,
+      "eval_linker_heavy_atoms_difference": 7.290499337163058,
+      "eval_linker_heavy_atoms_difference_norm": 0.33431202983606667,
       "eval_linker_tanimoto_similarity": 0.0,
+      "eval_linker_valid": 0.9819708351745471,
+      "eval_loss": 0.5055142045021057,
+      "eval_num_fragments": 2.996199734865223,
+      "eval_poi_equal": 0.02978347326557667,
       "eval_poi_graph_edit_distance": 9.999999999999999e+63,
       "eval_poi_graph_edit_distance_norm": 1.0,
+      "eval_poi_has_attachment_point(s)": 0.5520106053910738,
+      "eval_poi_heavy_atoms_difference": 17.786301369863015,
+      "eval_poi_heavy_atoms_difference_norm": 0.5150516150743234,
       "eval_poi_tanimoto_similarity": 0.0,
+      "eval_poi_valid": 0.5520106053910738,
+      "eval_reassembly": 0.00017675651789659743,
+      "eval_reassembly_nostereo": 0.00017675651789659743,
+      "eval_runtime": 1452.1821,
+      "eval_samples_per_second": 7.792,
+      "eval_steps_per_second": 0.122,
       "eval_tanimoto_similarity": 0.0,
+      "eval_valid": 0.5474149359257623,
       "step": 5000
     }
   ],
   "logging_steps": 500,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": false
       },
       "attributes": {}
     }
   },
+  "total_flos": 4.364959997072179e+16,
   "train_batch_size": 128,
+  "trial_name": "trial-number=13-learning_rate=4.2e-06-warmup_ratio=0.100-num_cycles=7",
   "trial_params": {
+    "learning_rate": 4.179049624310726e-06,
+    "num_cycles": 7,
+    "warmup_ratio": 0.09999999999999999
   }
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ee4f6953085a197c592295c8471ecc0a10b6a44a2b095461a3142d52fb167be3
 size 7544

 version https://git-lfs.github.com/spec/v1
+oid sha256:76bff59a2070cd43243e2d27434d38aba6c83afc6262f5b96a61177bbacae76b
 size 7544