Upload folder using huggingface_hub

Browse files

Files changed (6) hide show

model-00001-of-00002.safetensors +1 -1
model-00002-of-00002.safetensors +1 -1
optimizer.pt +1 -1
rng_state.pth +1 -1
scheduler.pt +1 -1
trainer_state.json +84 -6

model-00001-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6a0fb435857da39fb3ac4a6250cba4532cdfeca14f1ceb94ac4c0859ff87c986
 size 4991037968

 version https://git-lfs.github.com/spec/v1
+oid sha256:532b785101e9a0144716c91a267717e1bf9c98f2026889ca401be8536ab800af
 size 4991037968

model-00002-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6a3ebf4fcc9f98c653aafde81046f3489c2c8df911dcf954681a07bda8f5ad06
 size 1610725592

 version https://git-lfs.github.com/spec/v1
+oid sha256:6e9f0e287277c4c9b13e7806196ccadd02de3ceda54b649e85019dabf8193091
 size 1610725592

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6ab574ed84635fe62ae45a58e5af8787fc4f025fd04fcdc4fcf32df00d050037
 size 13203690391

 version https://git-lfs.github.com/spec/v1
+oid sha256:076eba10f086da4576d3906878882df2c7186b2daa7ce0f6a7f0437b019a6acc
 size 13203690391

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ea11996454b5587fcf33ae0ab5cf14b2031bf5f53f8c2ed5a48e87de31e29c84
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:20ea3a198ff666cb4ace1c684b598fe43fc7c3c276b83efc553a1b787e12a304
 size 14645

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c085c9e30c4332cb31b5d70b86d33eec0e6be6c0ce92c99e20a2795c064a4205
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:355a4437a5f06b625275e18af63d950b8d65ee72e9119d148de55df74a553f3b
 size 1465

trainer_state.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-  "best_global_step": 1500,
-  "best_metric": 1.2759937047958374,
-  "best_model_checkpoint": "./orpheus-turkish-emotion-finetune/checkpoint-1500",
-  "epoch": 7.463551401869159,
   "eval_steps": 500,
-  "global_step": 1500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -242,6 +242,84 @@
       "eval_samples_per_second": 11.542,
       "eval_steps_per_second": 1.483,
       "step": 1500
     }
   ],
   "logging_steps": 50,
@@ -261,7 +339,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 4.149138433077412e+17,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null

 {
+  "best_global_step": 2000,
+  "best_metric": 1.2739386558532715,
+  "best_model_checkpoint": "./orpheus-turkish-emotion-finetune/checkpoint-2000",
+  "epoch": 9.95202492211838,
   "eval_steps": 500,
+  "global_step": 2000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 11.542,
       "eval_steps_per_second": 1.483,
       "step": 1500
+    },
+    {
+      "epoch": 7.712772585669782,
+      "grad_norm": 0.9921875,
+      "learning_rate": 7.718459900893254e-06,
+      "loss": 1.2148,
+      "step": 1550
+    },
+    {
+      "epoch": 7.961993769470405,
+      "grad_norm": 1.46875,
+      "learning_rate": 7.533762855355126e-06,
+      "loss": 1.2196,
+      "step": 1600
+    },
+    {
+      "epoch": 8.209345794392524,
+      "grad_norm": 1.6328125,
+      "learning_rate": 7.344290512967664e-06,
+      "loss": 1.1935,
+      "step": 1650
+    },
+    {
+      "epoch": 8.458566978193147,
+      "grad_norm": 1.3203125,
+      "learning_rate": 7.150399965823252e-06,
+      "loss": 1.208,
+      "step": 1700
+    },
+    {
+      "epoch": 8.70778816199377,
+      "grad_norm": 1.484375,
+      "learning_rate": 6.952456632854821e-06,
+      "loss": 1.1997,
+      "step": 1750
+    },
+    {
+      "epoch": 8.957009345794393,
+      "grad_norm": 1.171875,
+      "learning_rate": 6.750833571143174e-06,
+      "loss": 1.1962,
+      "step": 1800
+    },
+    {
+      "epoch": 9.20436137071651,
+      "grad_norm": 1.015625,
+      "learning_rate": 6.5459107728289784e-06,
+      "loss": 1.216,
+      "step": 1850
+    },
+    {
+      "epoch": 9.453582554517133,
+      "grad_norm": 1.2109375,
+      "learning_rate": 6.338074448954472e-06,
+      "loss": 1.1888,
+      "step": 1900
+    },
+    {
+      "epoch": 9.702803738317757,
+      "grad_norm": 1.140625,
+      "learning_rate": 6.127716301584618e-06,
+      "loss": 1.1998,
+      "step": 1950
+    },
+    {
+      "epoch": 9.95202492211838,
+      "grad_norm": 1.25,
+      "learning_rate": 5.915232785579527e-06,
+      "loss": 1.2089,
+      "step": 2000
+    },
+    {
+      "epoch": 9.95202492211838,
+      "eval_loss": 1.2739386558532715,
+      "eval_runtime": 15.5272,
+      "eval_samples_per_second": 11.528,
+      "eval_steps_per_second": 1.481,
+      "step": 2000
     }
   ],
   "logging_steps": 50,
       "attributes": {}
     }
   },
+  "total_flos": 5.532530945116078e+17,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null