Training in progress, step 2260

Browse files

Files changed (2) hide show

adapter_model.safetensors +1 -1
trainer_log.jsonl +22 -0

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4e0ff3c58a6a9759af4a2f5681e250da52541707063d8ea5220059508c89b13e
 size 8388736

 version https://git-lfs.github.com/spec/v1
+oid sha256:b5ea5db2daa30f6da9ae98286423c530298ed124208b15ba62ccfcd268da25f5
 size 8388736

trainer_log.jsonl CHANGED Viewed

@@ -449,3 +449,25 @@
 {"current_steps": 2150, "total_steps": 2260, "loss": 0.0001, "lr": 3.665133433253809e-07, "epoch": 19.02654867256637, "percentage": 95.13, "elapsed_time": "0:03:59", "remaining_time": "0:00:12", "throughput": 2470.12, "total_tokens": 591376}
 {"current_steps": 2155, "total_steps": 2260, "loss": 0.0, "lr": 3.34309935365093e-07, "epoch": 19.07079646017699, "percentage": 95.35, "elapsed_time": "0:03:59", "remaining_time": "0:00:11", "throughput": 2471.92, "total_tokens": 592944}
 {"current_steps": 2160, "total_steps": 2260, "loss": 0.0, "lr": 3.03577582601422e-07, "epoch": 19.115044247787612, "percentage": 95.58, "elapsed_time": "0:04:00", "remaining_time": "0:00:11", "throughput": 2472.8, "total_tokens": 594240}

 {"current_steps": 2150, "total_steps": 2260, "loss": 0.0001, "lr": 3.665133433253809e-07, "epoch": 19.02654867256637, "percentage": 95.13, "elapsed_time": "0:03:59", "remaining_time": "0:00:12", "throughput": 2470.12, "total_tokens": 591376}
 {"current_steps": 2155, "total_steps": 2260, "loss": 0.0, "lr": 3.34309935365093e-07, "epoch": 19.07079646017699, "percentage": 95.35, "elapsed_time": "0:03:59", "remaining_time": "0:00:11", "throughput": 2471.92, "total_tokens": 592944}
 {"current_steps": 2160, "total_steps": 2260, "loss": 0.0, "lr": 3.03577582601422e-07, "epoch": 19.115044247787612, "percentage": 95.58, "elapsed_time": "0:04:00", "remaining_time": "0:00:11", "throughput": 2472.8, "total_tokens": 594240}
+{"current_steps": 2165, "total_steps": 2260, "loss": 0.0, "lr": 2.743181179037047e-07, "epoch": 19.15929203539823, "percentage": 95.8, "elapsed_time": "0:04:00", "remaining_time": "0:00:10", "throughput": 2473.69, "total_tokens": 595536}
+{"current_steps": 2170, "total_steps": 2260, "loss": 0.0, "lr": 2.465332862986447e-07, "epoch": 19.20353982300885, "percentage": 96.02, "elapsed_time": "0:04:01", "remaining_time": "0:00:10", "throughput": 2474.72, "total_tokens": 596944}
+{"current_steps": 2175, "total_steps": 2260, "loss": 0.0, "lr": 2.2022474486620427e-07, "epoch": 19.24778761061947, "percentage": 96.24, "elapsed_time": "0:04:01", "remaining_time": "0:00:09", "throughput": 2474.9, "total_tokens": 598032}
+{"current_steps": 2180, "total_steps": 2260, "loss": 0.0, "lr": 1.953940626408024e-07, "epoch": 19.292035398230087, "percentage": 96.46, "elapsed_time": "0:04:02", "remaining_time": "0:00:08", "throughput": 2475.39, "total_tokens": 599200}
+{"current_steps": 2185, "total_steps": 2260, "loss": 0.0001, "lr": 1.720427205177233e-07, "epoch": 19.336283185840706, "percentage": 96.68, "elapsed_time": "0:04:02", "remaining_time": "0:00:08", "throughput": 2476.9, "total_tokens": 600752}
+{"current_steps": 2190, "total_steps": 2260, "loss": 0.0, "lr": 1.5017211116479802e-07, "epoch": 19.38053097345133, "percentage": 96.9, "elapsed_time": "0:04:03", "remaining_time": "0:00:07", "throughput": 2478.68, "total_tokens": 602448}
+{"current_steps": 2195, "total_steps": 2260, "loss": 0.0, "lr": 1.297835389393598e-07, "epoch": 19.424778761061948, "percentage": 97.12, "elapsed_time": "0:04:03", "remaining_time": "0:00:07", "throughput": 2480.0, "total_tokens": 603936}
+{"current_steps": 2200, "total_steps": 2260, "loss": 0.0, "lr": 1.1087821981042856e-07, "epoch": 19.469026548672566, "percentage": 97.35, "elapsed_time": "0:04:03", "remaining_time": "0:00:06", "throughput": 2481.69, "total_tokens": 605520}
+{"current_steps": 2205, "total_steps": 2260, "loss": 0.0001, "lr": 9.345728128621611e-08, "epoch": 19.513274336283185, "percentage": 97.57, "elapsed_time": "0:04:04", "remaining_time": "0:00:06", "throughput": 2482.78, "total_tokens": 606880}
+{"current_steps": 2210, "total_steps": 2260, "loss": 0.0, "lr": 7.752176234685771e-08, "epoch": 19.557522123893804, "percentage": 97.79, "elapsed_time": "0:04:04", "remaining_time": "0:00:05", "throughput": 2484.16, "total_tokens": 608304}
+{"current_steps": 2215, "total_steps": 2260, "loss": 0.0, "lr": 6.307261338246718e-08, "epoch": 19.601769911504427, "percentage": 98.01, "elapsed_time": "0:04:05", "remaining_time": "0:00:04", "throughput": 2484.54, "total_tokens": 609456}
+{"current_steps": 2220, "total_steps": 2260, "loss": 0.0, "lr": 5.011069613644892e-08, "epoch": 19.646017699115045, "percentage": 98.23, "elapsed_time": "0:04:05", "remaining_time": "0:00:04", "throughput": 2486.37, "total_tokens": 611120}
+{"current_steps": 2225, "total_steps": 2260, "loss": 0.0, "lr": 3.8636783654100174e-08, "epoch": 19.690265486725664, "percentage": 98.45, "elapsed_time": "0:04:06", "remaining_time": "0:00:03", "throughput": 2487.86, "total_tokens": 612672}
+{"current_steps": 2230, "total_steps": 2260, "loss": 0.0, "lr": 2.865156023650617e-08, "epoch": 19.734513274336283, "percentage": 98.67, "elapsed_time": "0:04:06", "remaining_time": "0:00:03", "throughput": 2488.32, "total_tokens": 613840}
+{"current_steps": 2235, "total_steps": 2260, "loss": 0.0, "lr": 2.0155621399742254e-08, "epoch": 19.778761061946902, "percentage": 98.89, "elapsed_time": "0:04:07", "remaining_time": "0:00:02", "throughput": 2489.14, "total_tokens": 615184}
+{"current_steps": 2240, "total_steps": 2260, "loss": 0.0001, "lr": 1.31494738393384e-08, "epoch": 19.82300884955752, "percentage": 99.12, "elapsed_time": "0:04:07", "remaining_time": "0:00:02", "throughput": 2489.88, "total_tokens": 616432}
+{"current_steps": 2245, "total_steps": 2260, "loss": 0.0, "lr": 7.633535400070057e-09, "epoch": 19.86725663716814, "percentage": 99.34, "elapsed_time": "0:04:08", "remaining_time": "0:00:01", "throughput": 2491.12, "total_tokens": 617904}
+{"current_steps": 2250, "total_steps": 2260, "loss": 0.0, "lr": 3.6081350510447365e-09, "epoch": 19.911504424778762, "percentage": 99.56, "elapsed_time": "0:04:08", "remaining_time": "0:00:01", "throughput": 2492.12, "total_tokens": 619296}
+{"current_steps": 2255, "total_steps": 2260, "loss": 0.0, "lr": 1.0735128660649406e-09, "epoch": 19.95575221238938, "percentage": 99.78, "elapsed_time": "0:04:08", "remaining_time": "0:00:00", "throughput": 2492.87, "total_tokens": 620560}
+{"current_steps": 2260, "total_steps": 2260, "loss": 0.0, "lr": 2.982000932294504e-11, "epoch": 20.0, "percentage": 100.0, "elapsed_time": "0:04:09", "remaining_time": "0:00:00", "throughput": 2492.27, "total_tokens": 621640}
+{"current_steps": 2260, "total_steps": 2260, "eval_loss": 0.3967692255973816, "epoch": 20.0, "percentage": 100.0, "elapsed_time": "0:04:10", "remaining_time": "0:00:00", "throughput": 2485.23, "total_tokens": 621640}
+{"current_steps": 2260, "total_steps": 2260, "epoch": 20.0, "percentage": 100.0, "elapsed_time": "0:04:11", "remaining_time": "0:00:00", "throughput": 2472.55, "total_tokens": 621640}