Upload folder using huggingface_hub

Files changed (7) hide show

all_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
     "epoch": 1.0,
-    "eval_loss": 1.2132670879364014,
-    "eval_runtime": 0.4489,
-    "eval_samples_per_second": 1381.058,
-    "eval_steps_per_second": 11.138,
     "total_flos": 3.742438758599885e+16,
-    "train_loss": 1.3028676406196926,
-    "train_runtime": 44.8785,
-    "train_samples_per_second": 262.13,
-    "train_steps_per_second": 0.512
 }

 {
     "epoch": 1.0,
+    "eval_loss": 1.2132965326309204,
+    "eval_runtime": 0.4369,
+    "eval_samples_per_second": 1419.149,
+    "eval_steps_per_second": 11.445,
     "total_flos": 3.742438758599885e+16,
+    "train_loss": 1.3028600319572117,
+    "train_runtime": 47.4803,
+    "train_samples_per_second": 247.766,
+    "train_steps_per_second": 0.484
 }

eval_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
     "epoch": 1.0,
-    "eval_loss": 1.2132670879364014,
-    "eval_runtime": 0.4489,
-    "eval_samples_per_second": 1381.058,
-    "eval_steps_per_second": 11.138
 }

 {
     "epoch": 1.0,
+    "eval_loss": 1.2132965326309204,
+    "eval_runtime": 0.4369,
+    "eval_samples_per_second": 1419.149,
+    "eval_steps_per_second": 11.445
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:530fa995def746d56bfcdd02bf27ad60b458bc046fc2abe6fc4601d8e7505796
 size 2200119864

 version https://git-lfs.github.com/spec/v1
+oid sha256:09c7b3d225500aceefc7ab2ac4711a0aaffc704916f903bc84e6fe46866c6a55
 size 2200119864

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
     "total_flos": 3.742438758599885e+16,
-    "train_loss": 1.3028676406196926,
-    "train_runtime": 44.8785,
-    "train_samples_per_second": 262.13,
-    "train_steps_per_second": 0.512
 }

 {
     "epoch": 1.0,
     "total_flos": 3.742438758599885e+16,
+    "train_loss": 1.3028600319572117,
+    "train_runtime": 47.4803,
+    "train_samples_per_second": 247.766,
+    "train_steps_per_second": 0.484
 }

trainer_log.jsonl CHANGED Viewed

@@ -1,4 +1,4 @@
-{"current_steps": 10, "total_steps": 23, "loss": 1.3742, "learning_rate": 1.4539904997395468e-05, "epoch": 0.43478260869565216, "percentage": 43.48, "elapsed_time": "0:00:16", "remaining_time": "0:00:20"}
 {"current_steps": 20, "total_steps": 23, "loss": 1.2457, "learning_rate": 1.0899347581163222e-06, "epoch": 0.8695652173913043, "percentage": 86.96, "elapsed_time": "0:00:29", "remaining_time": "0:00:04"}
-{"current_steps": 23, "total_steps": 23, "eval_loss": 1.2132670879364014, "epoch": 1.0, "percentage": 100.0, "elapsed_time": "0:00:38", "remaining_time": "0:00:00"}
-{"current_steps": 23, "total_steps": 23, "epoch": 1.0, "percentage": 100.0, "elapsed_time": "0:00:41", "remaining_time": "0:00:00"}

+{"current_steps": 10, "total_steps": 23, "loss": 1.3741, "learning_rate": 1.4539904997395468e-05, "epoch": 0.43478260869565216, "percentage": 43.48, "elapsed_time": "0:00:16", "remaining_time": "0:00:21"}
 {"current_steps": 20, "total_steps": 23, "loss": 1.2457, "learning_rate": 1.0899347581163222e-06, "epoch": 0.8695652173913043, "percentage": 86.96, "elapsed_time": "0:00:29", "remaining_time": "0:00:04"}
+{"current_steps": 23, "total_steps": 23, "eval_loss": 1.2132965326309204, "epoch": 1.0, "percentage": 100.0, "elapsed_time": "0:00:40", "remaining_time": "0:00:00"}
+{"current_steps": 23, "total_steps": 23, "epoch": 1.0, "percentage": 100.0, "elapsed_time": "0:00:46", "remaining_time": "0:00:00"}

trainer_state.json CHANGED Viewed

@@ -10,34 +10,34 @@
   "log_history": [
     {
       "epoch": 0.43478260869565216,
-      "grad_norm": 0.8424881100654602,
       "learning_rate": 1.4539904997395468e-05,
-      "loss": 1.3742,
       "step": 10
     },
     {
       "epoch": 0.8695652173913043,
-      "grad_norm": 0.5980207324028015,
       "learning_rate": 1.0899347581163222e-06,
       "loss": 1.2457,
       "step": 20
     },
     {
       "epoch": 1.0,
-      "eval_loss": 1.2132670879364014,
-      "eval_runtime": 0.5126,
-      "eval_samples_per_second": 1209.62,
-      "eval_steps_per_second": 9.755,
       "step": 23
     },
     {
       "epoch": 1.0,
       "step": 23,
       "total_flos": 3.742438758599885e+16,
-      "train_loss": 1.3028676406196926,
-      "train_runtime": 44.8785,
-      "train_samples_per_second": 262.13,
-      "train_steps_per_second": 0.512
     }
   ],
   "logging_steps": 10,

   "log_history": [
     {
       "epoch": 0.43478260869565216,
+      "grad_norm": 0.8429296612739563,
       "learning_rate": 1.4539904997395468e-05,
+      "loss": 1.3741,
       "step": 10
     },
     {
       "epoch": 0.8695652173913043,
+      "grad_norm": 0.5978645086288452,
       "learning_rate": 1.0899347581163222e-06,
       "loss": 1.2457,
       "step": 20
     },
     {
       "epoch": 1.0,
+      "eval_loss": 1.2132965326309204,
+      "eval_runtime": 0.5878,
+      "eval_samples_per_second": 1054.768,
+      "eval_steps_per_second": 8.506,
       "step": 23
     },
     {
       "epoch": 1.0,
       "step": 23,
       "total_flos": 3.742438758599885e+16,
+      "train_loss": 1.3028600319572117,
+      "train_runtime": 47.4803,
+      "train_samples_per_second": 247.766,
+      "train_steps_per_second": 0.484
     }
   ],
   "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3264d490cd0375748e1d7e3a6741b66700101ec5d171854643e9d302f3c7b66e
 size 6712

 version https://git-lfs.github.com/spec/v1
+oid sha256:143a0712bbd5de3cacbf2c90bf42bd432f6eafad3ec0090dd9646d6743f09936
 size 6712