Model save

Files changed (5) hide show

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 4.982278481012658,
     "total_flos": 2.512601771310121e+18,
-    "train_loss": 0.37841837799888317,
-    "train_runtime": 39311.6395,
-    "train_samples_per_second": 4.018,
-    "train_steps_per_second": 0.031
 }

 {
     "epoch": 4.982278481012658,
     "total_flos": 2.512601771310121e+18,
+    "train_loss": 0.0,
+    "train_runtime": 1.5658,
+    "train_samples_per_second": 100903.723,
+    "train_steps_per_second": 785.516
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 4.982278481012658,
     "total_flos": 2.512601771310121e+18,
-    "train_loss": 0.37841837799888317,
-    "train_runtime": 39311.6395,
-    "train_samples_per_second": 4.018,
-    "train_steps_per_second": 0.031
 }

 {
     "epoch": 4.982278481012658,
     "total_flos": 2.512601771310121e+18,
+    "train_loss": 0.0,
+    "train_runtime": 1.5658,
+    "train_samples_per_second": 100903.723,
+    "train_steps_per_second": 785.516
 }

trainer_log.jsonl CHANGED Viewed

@@ -1230,3 +1230,4 @@
 {"current_steps": 1230, "total_steps": 1230, "loss": 0.1621, "lr": 0.0, "epoch": 4.982278481012658, "percentage": 100.0, "elapsed_time": "10:51:50", "remaining_time": "0:00:00"}
 {"current_steps": 1230, "total_steps": 1230, "epoch": 4.982278481012658, "percentage": 100.0, "elapsed_time": "10:55:09", "remaining_time": "0:00:00"}
 {"current_steps": 1230, "total_steps": 1230, "epoch": 4.982278481012658, "percentage": 100.0, "elapsed_time": "0:00:00", "remaining_time": "0:00:00"}

 {"current_steps": 1230, "total_steps": 1230, "loss": 0.1621, "lr": 0.0, "epoch": 4.982278481012658, "percentage": 100.0, "elapsed_time": "10:51:50", "remaining_time": "0:00:00"}
 {"current_steps": 1230, "total_steps": 1230, "epoch": 4.982278481012658, "percentage": 100.0, "elapsed_time": "10:55:09", "remaining_time": "0:00:00"}
 {"current_steps": 1230, "total_steps": 1230, "epoch": 4.982278481012658, "percentage": 100.0, "elapsed_time": "0:00:00", "remaining_time": "0:00:00"}
+{"current_steps": 1230, "total_steps": 1230, "epoch": 4.982278481012658, "percentage": 100.0, "elapsed_time": "0:00:00", "remaining_time": "0:00:00"}

trainer_state.json CHANGED Viewed

@@ -8622,10 +8622,10 @@
       "epoch": 4.982278481012658,
       "step": 1230,
       "total_flos": 2.512601771310121e+18,
-      "train_loss": 0.37841837799888317,
-      "train_runtime": 39311.6395,
-      "train_samples_per_second": 4.018,
-      "train_steps_per_second": 0.031
     }
   ],
   "logging_steps": 1,

       "epoch": 4.982278481012658,
       "step": 1230,
       "total_flos": 2.512601771310121e+18,
+      "train_loss": 0.0,
+      "train_runtime": 1.5658,
+      "train_samples_per_second": 100903.723,
+      "train_steps_per_second": 785.516
     }
   ],
   "logging_steps": 1,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ed3962dd196a8889d069af265c5548a1b22814cf84ffce9795b907ea93c6cbbe
 size 7352

 version https://git-lfs.github.com/spec/v1
+oid sha256:ab3c8bad7d11fa66d01778fdb767187bfe6f7183443d9d8c39070b9bc65e81c4
 size 7352