Upload folder using huggingface_hub

Browse files

Files changed (5) hide show

adapter_model.safetensors +1 -1
optimizer.pt +1 -1
rng_state.pth +1 -1
scheduler.pt +1 -1
trainer_state.json +7 -307

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3161508c0505b1add3d5708f8dcbe8451ca9f16d9c4da4eb15f72f0213ea5ab3
 size 369133600

 version https://git-lfs.github.com/spec/v1
+oid sha256:213b096de341a50e0a4985859c6ea12250ce2d41200faa95746f3833d77778ba
 size 369133600

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f2de0050503da4c1dfedc106d96c40be2c5e711da4076acf99032873e9af7004
 size 738413771

 version https://git-lfs.github.com/spec/v1
+oid sha256:96b2ad4cb92f0741196486f703f3eac971910ec2af67ea8dced1c39144ae41bd
 size 738413771

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e961bd000aad0805f4df299e9e54c009416c83b5abff201439df38b2efb708fc
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:a98db1d36dba143442348323cec201512ec884401e693908cf5136c8d261220e
 size 14645

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3ba3ad0939c5c784a2980c55ea2ede819b84a24d205e18f93e06504838daa120
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:62f9a2cf5827a9b18dca293c2a36bb613a8624ee231ceb47fae6e66a15cfcac4
 size 1465

trainer_state.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-  "best_global_step": 59,
-  "best_metric": 0.6262253522872925,
-  "best_model_checkpoint": "/content/drive/MyDrive/lora_model/outputs/task15_microsoft/Phi-4-mini-instruct/checkpoint-50",
-  "epoch": 3.1578947368421053,
   "eval_steps": 1,
-  "global_step": 60,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -608,306 +608,6 @@
       "eval_samples_per_second": 8.91,
       "eval_steps_per_second": 1.188,
       "step": 40
-    },
-    {
-      "epoch": 2.1578947368421053,
-      "grad_norm": 0.4683343768119812,
-      "learning_rate": 0.00020658795558326743,
-      "loss": 0.7401,
-      "step": 41
-    },
-    {
-      "epoch": 2.1578947368421053,
-      "eval_loss": 0.7358477711677551,
-      "eval_runtime": 3.3619,
-      "eval_samples_per_second": 8.924,
-      "eval_steps_per_second": 1.19,
-      "step": 41
-    },
-    {
-      "epoch": 2.2105263157894735,
-      "grad_norm": 0.6029678583145142,
-      "learning_rate": 0.0001895195261000831,
-      "loss": 0.6829,
-      "step": 42
-    },
-    {
-      "epoch": 2.2105263157894735,
-      "eval_loss": 0.7268175482749939,
-      "eval_runtime": 3.3732,
-      "eval_samples_per_second": 8.894,
-      "eval_steps_per_second": 1.186,
-      "step": 42
-    },
-    {
-      "epoch": 2.263157894736842,
-      "grad_norm": 0.6847506761550903,
-      "learning_rate": 0.00017274575140626317,
-      "loss": 0.7923,
-      "step": 43
-    },
-    {
-      "epoch": 2.263157894736842,
-      "eval_loss": 0.7140093445777893,
-      "eval_runtime": 3.3766,
-      "eval_samples_per_second": 8.885,
-      "eval_steps_per_second": 1.185,
-      "step": 43
-    },
-    {
-      "epoch": 2.3157894736842106,
-      "grad_norm": 0.6127113699913025,
-      "learning_rate": 0.00015634835164602198,
-      "loss": 0.7396,
-      "step": 44
-    },
-    {
-      "epoch": 2.3157894736842106,
-      "eval_loss": 0.6983242034912109,
-      "eval_runtime": 3.3684,
-      "eval_samples_per_second": 8.906,
-      "eval_steps_per_second": 1.188,
-      "step": 44
-    },
-    {
-      "epoch": 2.3684210526315788,
-      "grad_norm": 0.538176953792572,
-      "learning_rate": 0.00014040721330273062,
-      "loss": 0.6553,
-      "step": 45
-    },
-    {
-      "epoch": 2.3684210526315788,
-      "eval_loss": 0.6850975155830383,
-      "eval_runtime": 3.3723,
-      "eval_samples_per_second": 8.896,
-      "eval_steps_per_second": 1.186,
-      "step": 45
-    },
-    {
-      "epoch": 2.4210526315789473,
-      "grad_norm": 0.6419486999511719,
-      "learning_rate": 0.00012500000000000006,
-      "loss": 0.7364,
-      "step": 46
-    },
-    {
-      "epoch": 2.4210526315789473,
-      "eval_loss": 0.6766163110733032,
-      "eval_runtime": 3.3706,
-      "eval_samples_per_second": 8.9,
-      "eval_steps_per_second": 1.187,
-      "step": 46
-    },
-    {
-      "epoch": 2.473684210526316,
-      "grad_norm": 0.5997453331947327,
-      "learning_rate": 0.00011020177413231333,
-      "loss": 0.6901,
-      "step": 47
-    },
-    {
-      "epoch": 2.473684210526316,
-      "eval_loss": 0.667664110660553,
-      "eval_runtime": 3.3701,
-      "eval_samples_per_second": 8.902,
-      "eval_steps_per_second": 1.187,
-      "step": 47
-    },
-    {
-      "epoch": 2.526315789473684,
-      "grad_norm": 0.5617692470550537,
-      "learning_rate": 9.608463116858542e-05,
-      "loss": 0.6299,
-      "step": 48
-    },
-    {
-      "epoch": 2.526315789473684,
-      "eval_loss": 0.658656895160675,
-      "eval_runtime": 3.3698,
-      "eval_samples_per_second": 8.903,
-      "eval_steps_per_second": 1.187,
-      "step": 48
-    },
-    {
-      "epoch": 2.5789473684210527,
-      "grad_norm": 0.5850865840911865,
-      "learning_rate": 8.271734841028553e-05,
-      "loss": 0.717,
-      "step": 49
-    },
-    {
-      "epoch": 2.5789473684210527,
-      "eval_loss": 0.6522302627563477,
-      "eval_runtime": 3.3689,
-      "eval_samples_per_second": 8.905,
-      "eval_steps_per_second": 1.187,
-      "step": 49
-    },
-    {
-      "epoch": 2.6315789473684212,
-      "grad_norm": 0.5645343661308289,
-      "learning_rate": 7.016504991533726e-05,
-      "loss": 0.6396,
-      "step": 50
-    },
-    {
-      "epoch": 2.6315789473684212,
-      "eval_loss": 0.6460065841674805,
-      "eval_runtime": 3.3689,
-      "eval_samples_per_second": 8.905,
-      "eval_steps_per_second": 1.187,
-      "step": 50
-    },
-    {
-      "epoch": 2.6842105263157894,
-      "grad_norm": 0.6689581871032715,
-      "learning_rate": 5.848888922025553e-05,
-      "loss": 0.6803,
-      "step": 51
-    },
-    {
-      "epoch": 2.6842105263157894,
-      "eval_loss": 0.6413608193397522,
-      "eval_runtime": 3.3668,
-      "eval_samples_per_second": 8.911,
-      "eval_steps_per_second": 1.188,
-      "step": 51
-    },
-    {
-      "epoch": 2.736842105263158,
-      "grad_norm": 0.5473130941390991,
-      "learning_rate": 4.7745751406263163e-05,
-      "loss": 0.6535,
-      "step": 52
-    },
-    {
-      "epoch": 2.736842105263158,
-      "eval_loss": 0.6371581554412842,
-      "eval_runtime": 3.371,
-      "eval_samples_per_second": 8.9,
-      "eval_steps_per_second": 1.187,
-      "step": 52
-    },
-    {
-      "epoch": 2.7894736842105265,
-      "grad_norm": 0.6696008443832397,
-      "learning_rate": 3.798797596089351e-05,
-      "loss": 0.744,
-      "step": 53
-    },
-    {
-      "epoch": 2.7894736842105265,
-      "eval_loss": 0.6349052786827087,
-      "eval_runtime": 3.3769,
-      "eval_samples_per_second": 8.884,
-      "eval_steps_per_second": 1.185,
-      "step": 53
-    },
-    {
-      "epoch": 2.8421052631578947,
-      "grad_norm": 0.5501115918159485,
-      "learning_rate": 2.9263101785268254e-05,
-      "loss": 0.6701,
-      "step": 54
-    },
-    {
-      "epoch": 2.8421052631578947,
-      "eval_loss": 0.6328269839286804,
-      "eval_runtime": 3.3789,
-      "eval_samples_per_second": 8.879,
-      "eval_steps_per_second": 1.184,
-      "step": 54
-    },
-    {
-      "epoch": 2.8947368421052633,
-      "grad_norm": 0.4939638078212738,
-      "learning_rate": 2.1613635589349755e-05,
-      "loss": 0.6646,
-      "step": 55
-    },
-    {
-      "epoch": 2.8947368421052633,
-      "eval_loss": 0.6300433278083801,
-      "eval_runtime": 3.3726,
-      "eval_samples_per_second": 8.895,
-      "eval_steps_per_second": 1.186,
-      "step": 55
-    },
-    {
-      "epoch": 2.9473684210526314,
-      "grad_norm": 0.61789470911026,
-      "learning_rate": 1.5076844803522921e-05,
-      "loss": 0.7293,
-      "step": 56
-    },
-    {
-      "epoch": 2.9473684210526314,
-      "eval_loss": 0.6280367374420166,
-      "eval_runtime": 3.3765,
-      "eval_samples_per_second": 8.885,
-      "eval_steps_per_second": 1.185,
-      "step": 56
-    },
-    {
-      "epoch": 3.0,
-      "grad_norm": 0.5384323000907898,
-      "learning_rate": 9.684576015420277e-06,
-      "loss": 0.6898,
-      "step": 57
-    },
-    {
-      "epoch": 3.0,
-      "eval_loss": 0.6272571086883545,
-      "eval_runtime": 3.3704,
-      "eval_samples_per_second": 8.901,
-      "eval_steps_per_second": 1.187,
-      "step": 57
-    },
-    {
-      "epoch": 3.0526315789473686,
-      "grad_norm": 0.5376719236373901,
-      "learning_rate": 5.463099816548578e-06,
-      "loss": 0.6448,
-      "step": 58
-    },
-    {
-      "epoch": 3.0526315789473686,
-      "eval_loss": 0.6269372701644897,
-      "eval_runtime": 3.3667,
-      "eval_samples_per_second": 8.911,
-      "eval_steps_per_second": 1.188,
-      "step": 58
-    },
-    {
-      "epoch": 3.1052631578947367,
-      "grad_norm": 0.515751838684082,
-      "learning_rate": 2.4329828146074094e-06,
-      "loss": 0.7027,
-      "step": 59
-    },
-    {
-      "epoch": 3.1052631578947367,
-      "eval_loss": 0.6262253522872925,
-      "eval_runtime": 3.3654,
-      "eval_samples_per_second": 8.914,
-      "eval_steps_per_second": 1.189,
-      "step": 59
-    },
-    {
-      "epoch": 3.1578947368421053,
-      "grad_norm": 0.5370931029319763,
-      "learning_rate": 6.089874350439506e-07,
-      "loss": 0.6594,
-      "step": 60
-    },
-    {
-      "epoch": 3.1578947368421053,
-      "eval_loss": 0.6268424391746521,
-      "eval_runtime": 3.3618,
-      "eval_samples_per_second": 8.924,
-      "eval_steps_per_second": 1.19,
-      "step": 60
     }
   ],
   "logging_steps": 1,
@@ -922,12 +622,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": true
       },
       "attributes": {}
     }
   },
-  "total_flos": 2488197563258880.0,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null

 {
+  "best_global_step": 40,
+  "best_metric": 0.7394412159919739,
+  "best_model_checkpoint": "/content/drive/MyDrive/lora_model/outputs/task15_microsoft/Phi-4-mini-instruct/checkpoint-40",
+  "epoch": 2.1052631578947367,
   "eval_steps": 1,
+  "global_step": 40,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 8.91,
       "eval_steps_per_second": 1.188,
       "step": 40
     }
   ],
   "logging_steps": 1,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": false
       },
       "attributes": {}
     }
   },
+  "total_flos": 1661495727175680.0,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null