chchen
/

Llama3-OpenBioLLM-8B-PsyCourse-info-fold3

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2f672f4f19e78300a21c7e0e409b37760e8dd53ba14f6d53beb5f7035cbe09ff
 size 83945296

 version https://git-lfs.github.com/spec/v1
+oid sha256:66532640f6514b761f067eba5a845f5bb43f8a8a8a3b05ac4d58a65ac5c34d03
 size 83945296

trainer_log.jsonl CHANGED Viewed

@@ -9,3 +9,14 @@
 {"current_steps": 9, "total_steps": 125, "loss": 0.6502, "lr": 6.923076923076924e-05, "epoch": 0.35555555555555557, "percentage": 7.2, "elapsed_time": "0:03:55", "remaining_time": "0:50:28"}
 {"current_steps": 10, "total_steps": 125, "loss": 0.5151, "lr": 7.692307692307693e-05, "epoch": 0.3950617283950617, "percentage": 8.0, "elapsed_time": "0:04:17", "remaining_time": "0:49:26"}
 {"current_steps": 10, "total_steps": 125, "eval_loss": 0.45077192783355713, "epoch": 0.3950617283950617, "percentage": 8.0, "elapsed_time": "0:04:37", "remaining_time": "0:53:10"}

 {"current_steps": 9, "total_steps": 125, "loss": 0.6502, "lr": 6.923076923076924e-05, "epoch": 0.35555555555555557, "percentage": 7.2, "elapsed_time": "0:03:55", "remaining_time": "0:50:28"}
 {"current_steps": 10, "total_steps": 125, "loss": 0.5151, "lr": 7.692307692307693e-05, "epoch": 0.3950617283950617, "percentage": 8.0, "elapsed_time": "0:04:17", "remaining_time": "0:49:26"}
 {"current_steps": 10, "total_steps": 125, "eval_loss": 0.45077192783355713, "epoch": 0.3950617283950617, "percentage": 8.0, "elapsed_time": "0:04:37", "remaining_time": "0:53:10"}
+{"current_steps": 11, "total_steps": 125, "loss": 0.4612, "lr": 8.461538461538461e-05, "epoch": 0.4345679012345679, "percentage": 8.8, "elapsed_time": "0:05:05", "remaining_time": "0:52:47"}
+{"current_steps": 12, "total_steps": 125, "loss": 0.4512, "lr": 9.230769230769232e-05, "epoch": 0.4740740740740741, "percentage": 9.6, "elapsed_time": "0:05:28", "remaining_time": "0:51:29"}
+{"current_steps": 13, "total_steps": 125, "loss": 0.3338, "lr": 0.0001, "epoch": 0.5135802469135803, "percentage": 10.4, "elapsed_time": "0:05:50", "remaining_time": "0:50:22"}
+{"current_steps": 14, "total_steps": 125, "loss": 0.3453, "lr": 9.998033131915266e-05, "epoch": 0.5530864197530864, "percentage": 11.2, "elapsed_time": "0:06:20", "remaining_time": "0:50:13"}
+{"current_steps": 15, "total_steps": 125, "loss": 0.2943, "lr": 9.992134075089084e-05, "epoch": 0.5925925925925926, "percentage": 12.0, "elapsed_time": "0:06:43", "remaining_time": "0:49:16"}
+{"current_steps": 16, "total_steps": 125, "loss": 0.3191, "lr": 9.982307470588098e-05, "epoch": 0.6320987654320988, "percentage": 12.8, "elapsed_time": "0:07:06", "remaining_time": "0:48:28"}
+{"current_steps": 17, "total_steps": 125, "loss": 0.2663, "lr": 9.968561049466214e-05, "epoch": 0.671604938271605, "percentage": 13.6, "elapsed_time": "0:07:32", "remaining_time": "0:47:53"}
+{"current_steps": 18, "total_steps": 125, "loss": 0.2384, "lr": 9.950905626682228e-05, "epoch": 0.7111111111111111, "percentage": 14.4, "elapsed_time": "0:07:55", "remaining_time": "0:47:09"}
+{"current_steps": 19, "total_steps": 125, "loss": 0.2395, "lr": 9.92935509259118e-05, "epoch": 0.7506172839506173, "percentage": 15.2, "elapsed_time": "0:08:21", "remaining_time": "0:46:37"}
+{"current_steps": 20, "total_steps": 125, "loss": 0.221, "lr": 9.903926402016153e-05, "epoch": 0.7901234567901234, "percentage": 16.0, "elapsed_time": "0:08:44", "remaining_time": "0:45:54"}
+{"current_steps": 20, "total_steps": 125, "eval_loss": 0.24420633912086487, "epoch": 0.7901234567901234, "percentage": 16.0, "elapsed_time": "0:09:04", "remaining_time": "0:47:36"}