rbelanec
/

train_copa_789_1760637875

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d9ddd8b66b6440cb5e617f5d36079f2bc74f1d258ecc0218adcf759e79287336
 size 58745928

 version https://git-lfs.github.com/spec/v1
+oid sha256:c20cadd180b60a15cb58a36dcc6f1a1bb56ef56ce95067574a346a66429d5e1f
 size 58745928

trainer_log.jsonl CHANGED Viewed

@@ -368,3 +368,14 @@
 {"current_steps": 1745, "total_steps": 1800, "loss": 0.0, "lr": 1.472749613259661e-07, "epoch": 19.38888888888889, "percentage": 96.94, "elapsed_time": "0:05:59", "remaining_time": "0:00:11", "throughput": 1518.56, "total_tokens": 546560}
 {"current_steps": 1750, "total_steps": 1800, "loss": 0.0, "lr": 1.22170413724923e-07, "epoch": 19.444444444444443, "percentage": 97.22, "elapsed_time": "0:06:00", "remaining_time": "0:00:10", "throughput": 1518.93, "total_tokens": 548096}
 {"current_steps": 1755, "total_steps": 1800, "loss": 0.0, "lr": 9.940480466855417e-08, "epoch": 19.5, "percentage": 97.5, "elapsed_time": "0:06:01", "remaining_time": "0:00:09", "throughput": 1519.42, "total_tokens": 549664}

 {"current_steps": 1745, "total_steps": 1800, "loss": 0.0, "lr": 1.472749613259661e-07, "epoch": 19.38888888888889, "percentage": 96.94, "elapsed_time": "0:05:59", "remaining_time": "0:00:11", "throughput": 1518.56, "total_tokens": 546560}
 {"current_steps": 1750, "total_steps": 1800, "loss": 0.0, "lr": 1.22170413724923e-07, "epoch": 19.444444444444443, "percentage": 97.22, "elapsed_time": "0:06:00", "remaining_time": "0:00:10", "throughput": 1518.93, "total_tokens": 548096}
 {"current_steps": 1755, "total_steps": 1800, "loss": 0.0, "lr": 9.940480466855417e-08, "epoch": 19.5, "percentage": 97.5, "elapsed_time": "0:06:01", "remaining_time": "0:00:09", "throughput": 1519.42, "total_tokens": 549664}
+{"current_steps": 1760, "total_steps": 1800, "loss": 0.0, "lr": 7.898027451078982e-08, "epoch": 19.555555555555557, "percentage": 97.78, "elapsed_time": "0:06:02", "remaining_time": "0:00:08", "throughput": 1519.98, "total_tokens": 551264}
+{"current_steps": 1765, "total_steps": 1800, "loss": 0.0, "lr": 6.089874350439506e-08, "epoch": 19.61111111111111, "percentage": 98.06, "elapsed_time": "0:06:03", "remaining_time": "0:00:07", "throughput": 1520.41, "total_tokens": 552800}
+{"current_steps": 1770, "total_steps": 1800, "loss": 0.0, "lr": 4.516191162040051e-08, "epoch": 19.666666666666668, "percentage": 98.33, "elapsed_time": "0:06:04", "remaining_time": "0:00:06", "throughput": 1520.82, "total_tokens": 554336}
+{"current_steps": 1775, "total_steps": 1800, "loss": 0.0, "lr": 3.177125838830786e-08, "epoch": 19.72222222222222, "percentage": 98.61, "elapsed_time": "0:06:05", "remaining_time": "0:00:05", "throughput": 1521.23, "total_tokens": 555872}
+{"current_steps": 1780, "total_steps": 1800, "loss": 0.0, "lr": 2.0728042756967824e-08, "epoch": 19.77777777777778, "percentage": 98.89, "elapsed_time": "0:06:06", "remaining_time": "0:00:04", "throughput": 1521.91, "total_tokens": 557504}
+{"current_steps": 1785, "total_steps": 1800, "loss": 0.0, "lr": 1.2033302976222071e-08, "epoch": 19.833333333333332, "percentage": 99.17, "elapsed_time": "0:06:07", "remaining_time": "0:00:03", "throughput": 1522.31, "total_tokens": 559040}
+{"current_steps": 1790, "total_steps": 1800, "loss": 0.0, "lr": 5.687856499297928e-09, "epoch": 19.88888888888889, "percentage": 99.44, "elapsed_time": "0:06:08", "remaining_time": "0:00:02", "throughput": 1522.87, "total_tokens": 560640}
+{"current_steps": 1795, "total_steps": 1800, "loss": 0.0, "lr": 1.692299905944883e-09, "epoch": 19.944444444444443, "percentage": 99.72, "elapsed_time": "0:06:09", "remaining_time": "0:00:01", "throughput": 1523.27, "total_tokens": 562176}
+{"current_steps": 1800, "total_steps": 1800, "loss": 0.0, "lr": 4.700884634611935e-11, "epoch": 20.0, "percentage": 100.0, "elapsed_time": "0:06:10", "remaining_time": "0:00:00", "throughput": 1523.57, "total_tokens": 563744}
+{"current_steps": 1800, "total_steps": 1800, "eval_loss": 0.05404474586248398, "epoch": 20.0, "percentage": 100.0, "elapsed_time": "0:06:10", "remaining_time": "0:00:00", "throughput": 1521.25, "total_tokens": 563744}
+{"current_steps": 1800, "total_steps": 1800, "epoch": 20.0, "percentage": 100.0, "elapsed_time": "0:06:12", "remaining_time": "0:00:00", "throughput": 1514.87, "total_tokens": 563744}