Training in progress, step 100, checkpoint

Browse files

Files changed (5) hide show

checkpoint-100/README.md +1 -2
checkpoint-100/adapter_model.safetensors +1 -1
checkpoint-100/optimizer.pt +1 -1
checkpoint-100/trainer_state.json +18 -18
checkpoint-100/training_args.bin +1 -1

checkpoint-100/README.md CHANGED Viewed

@@ -202,5 +202,4 @@ Carbon emissions can be estimated using the [Machine Learning Impact calculator]
 ### Framework versions
 - PEFT 0.9.0
-- PEFT 0.8.2
-- PEFT 0.7.1

 ### Framework versions
 - PEFT 0.9.0
+- PEFT 0.8.2

checkpoint-100/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:723d245e9ca9bf2cf103f4c7cbcc64b245ae77c89fe73a88a7d0665207cbc743
 size 9443384

 version https://git-lfs.github.com/spec/v1
+oid sha256:274d63560e28ff9071de84560968bf675cbef8e9fd1c92a42018142d4c84bf60
 size 9443384

checkpoint-100/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:24e0b23d4bf5faab5873c91c421fc565e50df58dc82d2f05d6243453c1a2f3ee
 size 18914450

 version https://git-lfs.github.com/spec/v1
+oid sha256:6477c1f6b7f8c73eeb14d7c4314be2a685cfe187dcdaaa3ae5408f640288400b
 size 18914450

checkpoint-100/trainer_state.json CHANGED Viewed

@@ -10,70 +10,70 @@
   "log_history": [
     {
       "epoch": 0.42,
-      "grad_norm": 0.18151910603046417,
       "learning_rate": 2.9999999999999997e-05,
-      "loss": 3.8655,
       "step": 10
     },
     {
       "epoch": 0.84,
-      "grad_norm": 0.23640306293964386,
       "learning_rate": 5.9999999999999995e-05,
       "loss": 3.8223,
       "step": 20
     },
     {
       "epoch": 1.25,
-      "grad_norm": 0.3272729814052582,
       "learning_rate": 8.999999999999999e-05,
-      "loss": 3.7256,
       "step": 30
     },
     {
       "epoch": 1.67,
-      "grad_norm": 0.3942272365093231,
       "learning_rate": 0.00011999999999999999,
-      "loss": 3.4944,
       "step": 40
     },
     {
       "epoch": 2.09,
-      "grad_norm": 0.5312587022781372,
       "learning_rate": 0.00015,
-      "loss": 3.0931,
       "step": 50
     },
     {
       "epoch": 2.51,
-      "grad_norm": 0.6111555695533752,
       "learning_rate": 0.00017999999999999998,
-      "loss": 2.5215,
       "step": 60
     },
     {
       "epoch": 2.92,
-      "grad_norm": 0.4672750234603882,
       "learning_rate": 0.00020999999999999998,
-      "loss": 1.8905,
       "step": 70
     },
     {
       "epoch": 3.34,
-      "grad_norm": 0.16217181086540222,
       "learning_rate": 0.00023999999999999998,
-      "loss": 1.5992,
       "step": 80
     },
     {
       "epoch": 3.76,
-      "grad_norm": 0.11098425090312958,
       "learning_rate": 0.00027,
-      "loss": 1.4717,
       "step": 90
     },
     {
       "epoch": 4.18,
-      "grad_norm": 0.08228754252195358,
       "learning_rate": 0.0003,
       "loss": 1.4336,
       "step": 100

   "log_history": [
     {
       "epoch": 0.42,
+      "grad_norm": 0.1815568506717682,
       "learning_rate": 2.9999999999999997e-05,
+      "loss": 3.8657,
       "step": 10
     },
     {
       "epoch": 0.84,
+      "grad_norm": 0.23455914855003357,
       "learning_rate": 5.9999999999999995e-05,
       "loss": 3.8223,
       "step": 20
     },
     {
       "epoch": 1.25,
+      "grad_norm": 0.32260793447494507,
       "learning_rate": 8.999999999999999e-05,
+      "loss": 3.7255,
       "step": 30
     },
     {
       "epoch": 1.67,
+      "grad_norm": 0.38705918192863464,
       "learning_rate": 0.00011999999999999999,
+      "loss": 3.4952,
       "step": 40
     },
     {
       "epoch": 2.09,
+      "grad_norm": 0.5273059606552124,
       "learning_rate": 0.00015,
+      "loss": 3.098,
       "step": 50
     },
     {
       "epoch": 2.51,
+      "grad_norm": 0.6030514240264893,
       "learning_rate": 0.00017999999999999998,
+      "loss": 2.5299,
       "step": 60
     },
     {
       "epoch": 2.92,
+      "grad_norm": 0.459722101688385,
       "learning_rate": 0.00020999999999999998,
+      "loss": 1.899,
       "step": 70
     },
     {
       "epoch": 3.34,
+      "grad_norm": 0.1655016839504242,
       "learning_rate": 0.00023999999999999998,
+      "loss": 1.6018,
       "step": 80
     },
     {
       "epoch": 3.76,
+      "grad_norm": 0.10938003659248352,
       "learning_rate": 0.00027,
+      "loss": 1.4726,
       "step": 90
     },
     {
       "epoch": 4.18,
+      "grad_norm": 0.09813433140516281,
       "learning_rate": 0.0003,
       "loss": 1.4336,
       "step": 100

checkpoint-100/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e8b7fad922cb586b3f4c9d21e8952021ac611c19938a5281fabb27589d026b64
 size 4960

 version https://git-lfs.github.com/spec/v1
+oid sha256:e101655a2c30ed323838269a1b44a8d1f49e703e9180438d91b23c9fd7ee9379
 size 4960