Upload checkpoint checkpoint-50

Files changed (3) hide show

checkpoint-50/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b84dffa4f79bec060fcb8dd5f305478965ff574aaaa9dd339e749bfcd8b8d383
 size 614801160

 version https://git-lfs.github.com/spec/v1
+oid sha256:ebca23c43e2da93412879287d3ecb22ba143e75a2600955a24c9739b83be1507
 size 614801160

checkpoint-50/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:409682af3c024d58e5d006b75e3f34fa18bc169d0018977e97bab189b743732d
 size 312742204

 version https://git-lfs.github.com/spec/v1
+oid sha256:bfa314ed8ffe2040322876ac873f864979ab880ac758867620937ebd26730858
 size 312742204

checkpoint-50/trainer_state.json CHANGED Viewed

@@ -13,35 +13,35 @@
       "epoch": 0.05235602094240838,
       "grad_norm": NaN,
       "learning_rate": 0.0,
-      "loss": 9.7678,
       "step": 10
     },
     {
       "epoch": 0.10471204188481675,
-      "grad_norm": 204575.09375,
       "learning_rate": 3.1413612565445024e-08,
-      "loss": 9.1803,
       "step": 20
     },
     {
       "epoch": 0.15706806282722513,
-      "grad_norm": 26470.66015625,
       "learning_rate": 1.3612565445026178e-07,
-      "loss": 3.8501,
       "step": 30
     },
     {
       "epoch": 0.2094240837696335,
-      "grad_norm": 10531.1064453125,
       "learning_rate": 2.4083769633507854e-07,
-      "loss": 3.2742,
       "step": 40
     },
     {
       "epoch": 0.2617801047120419,
-      "grad_norm": 8319.623046875,
       "learning_rate": 3.4554973821989523e-07,
-      "loss": 3.096,
       "step": 50
     }
   ],

       "epoch": 0.05235602094240838,
       "grad_norm": NaN,
       "learning_rate": 0.0,
+      "loss": 9.7408,
       "step": 10
     },
     {
       "epoch": 0.10471204188481675,
+      "grad_norm": 202209.765625,
       "learning_rate": 3.1413612565445024e-08,
+      "loss": 9.1548,
       "step": 20
     },
     {
       "epoch": 0.15706806282722513,
+      "grad_norm": 27189.787109375,
       "learning_rate": 1.3612565445026178e-07,
+      "loss": 3.8451,
       "step": 30
     },
     {
       "epoch": 0.2094240837696335,
+      "grad_norm": 10457.34765625,
       "learning_rate": 2.4083769633507854e-07,
+      "loss": 3.267,
       "step": 40
     },
     {
       "epoch": 0.2617801047120419,
+      "grad_norm": 8087.2939453125,
       "learning_rate": 3.4554973821989523e-07,
+      "loss": 3.0939,
       "step": 50
     }
   ],