Training in progress, step 221

Browse files

Files changed (2) hide show

adapter_model.safetensors +1 -1
trainer_log.jsonl +7 -0

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:003f24b14a4371ebaafe2cf845ac82ec48f6741cb34e8fbac4e2cf36035c597a
 size 335717200

 version https://git-lfs.github.com/spec/v1
+oid sha256:a3f6b695df7da74e7a0d30703dad843bcfa08c5cfbd6fa46042bece5b84d4d54
 size 335717200

trainer_log.jsonl CHANGED Viewed

@@ -58,3 +58,10 @@
 {"current_steps": 210, "total_steps": 249, "loss": 0.3717, "lr": 3.831895019292897e-06, "epoch": 0.8433734939759037, "percentage": 84.34, "elapsed_time": "0:01:02", "remaining_time": "0:00:11", "throughput": 586.88, "total_tokens": 36848}
 {"current_steps": 215, "total_steps": 249, "loss": 0.3723, "lr": 2.9519683912911266e-06, "epoch": 0.8634538152610441, "percentage": 86.35, "elapsed_time": "0:01:03", "remaining_time": "0:00:09", "throughput": 600.27, "total_tokens": 37888}
 {"current_steps": 220, "total_steps": 249, "loss": 0.3634, "lr": 2.1804183734670277e-06, "epoch": 0.8835341365461847, "percentage": 88.35, "elapsed_time": "0:01:03", "remaining_time": "0:00:08", "throughput": 610.98, "total_tokens": 38768}

 {"current_steps": 210, "total_steps": 249, "loss": 0.3717, "lr": 3.831895019292897e-06, "epoch": 0.8433734939759037, "percentage": 84.34, "elapsed_time": "0:01:02", "remaining_time": "0:00:11", "throughput": 586.88, "total_tokens": 36848}
 {"current_steps": 215, "total_steps": 249, "loss": 0.3723, "lr": 2.9519683912911266e-06, "epoch": 0.8634538152610441, "percentage": 86.35, "elapsed_time": "0:01:03", "remaining_time": "0:00:09", "throughput": 600.27, "total_tokens": 37888}
 {"current_steps": 220, "total_steps": 249, "loss": 0.3634, "lr": 2.1804183734670277e-06, "epoch": 0.8835341365461847, "percentage": 88.35, "elapsed_time": "0:01:03", "remaining_time": "0:00:08", "throughput": 610.98, "total_tokens": 38768}
+{"current_steps": 221, "total_steps": 249, "eval_loss": 0.3546585738658905, "epoch": 0.8875502008032129, "percentage": 88.76, "elapsed_time": "0:01:04", "remaining_time": "0:00:08", "throughput": 606.77, "total_tokens": 38912}
+{"current_steps": 225, "total_steps": 249, "loss": 0.3656, "lr": 1.5210375028143097e-06, "epoch": 0.9036144578313253, "percentage": 90.36, "elapsed_time": "0:01:07", "remaining_time": "0:00:07", "throughput": 583.99, "total_tokens": 39488}
+{"current_steps": 230, "total_steps": 249, "loss": 0.3446, "lr": 9.770669513725128e-07, "epoch": 0.9236947791164659, "percentage": 92.37, "elapsed_time": "0:01:07", "remaining_time": "0:00:05", "throughput": 593.53, "total_tokens": 40336}
+{"current_steps": 234, "total_steps": 249, "eval_loss": 0.35187554359436035, "epoch": 0.9397590361445783, "percentage": 93.98, "elapsed_time": "0:01:08", "remaining_time": "0:00:04", "throughput": 597.4, "total_tokens": 41120}
+{"current_steps": 235, "total_steps": 249, "loss": 0.3724, "lr": 5.5118059431781e-07, "epoch": 0.9437751004016064, "percentage": 94.38, "elapsed_time": "0:01:10", "remaining_time": "0:00:04", "throughput": 588.5, "total_tokens": 41328}
+{"current_steps": 240, "total_steps": 249, "loss": 0.3493, "lr": 2.454718665888589e-07, "epoch": 0.963855421686747, "percentage": 96.39, "elapsed_time": "0:01:10", "remaining_time": "0:00:02", "throughput": 597.74, "total_tokens": 42176}
+{"current_steps": 245, "total_steps": 249, "loss": 0.3364, "lr": 6.14434726538493e-08, "epoch": 0.9839357429718876, "percentage": 98.39, "elapsed_time": "0:01:10", "remaining_time": "0:00:01", "throughput": 610.97, "total_tokens": 43312}