mlfoundations-dev
/

llama3-1_8b_star_coder_instruct

Model card Files Files and versions

llama3-1_8b_star_coder_instruct / trainer_log.jsonl

gsmyrnis's picture

Training in progress, epoch 1

26d8b67 verified about 1 year ago

history blame contribute delete

1.86 kB

	{"current_steps": 10, "total_steps": 78, "loss": 0.6856, "lr": 5e-06, "epoch": 0.38461538461538464, "percentage": 12.82, "elapsed_time": "0:01:00", "remaining_time": "0:06:48"}
	{"current_steps": 20, "total_steps": 78, "loss": 0.5534, "lr": 5e-06, "epoch": 0.7692307692307693, "percentage": 25.64, "elapsed_time": "0:02:00", "remaining_time": "0:05:48"}
	{"current_steps": 26, "total_steps": 78, "eval_loss": 0.5087668299674988, "epoch": 1.0, "percentage": 33.33, "elapsed_time": "0:02:39", "remaining_time": "0:05:18"}
	{"current_steps": 30, "total_steps": 78, "loss": 0.5052, "lr": 5e-06, "epoch": 1.1538461538461537, "percentage": 38.46, "elapsed_time": "0:04:29", "remaining_time": "0:07:11"}
	{"current_steps": 40, "total_steps": 78, "loss": 0.4784, "lr": 5e-06, "epoch": 1.5384615384615383, "percentage": 51.28, "elapsed_time": "0:05:29", "remaining_time": "0:05:13"}
	{"current_steps": 50, "total_steps": 78, "loss": 0.4634, "lr": 5e-06, "epoch": 1.9230769230769231, "percentage": 64.1, "elapsed_time": "0:06:30", "remaining_time": "0:03:38"}
	{"current_steps": 52, "total_steps": 78, "eval_loss": 0.4695299565792084, "epoch": 2.0, "percentage": 66.67, "elapsed_time": "0:06:45", "remaining_time": "0:03:22"}
	{"current_steps": 60, "total_steps": 78, "loss": 0.4387, "lr": 5e-06, "epoch": 2.3076923076923075, "percentage": 76.92, "elapsed_time": "0:08:58", "remaining_time": "0:02:41"}
	{"current_steps": 70, "total_steps": 78, "loss": 0.4262, "lr": 5e-06, "epoch": 2.6923076923076925, "percentage": 89.74, "elapsed_time": "0:09:59", "remaining_time": "0:01:08"}
	{"current_steps": 78, "total_steps": 78, "eval_loss": 0.45314475893974304, "epoch": 3.0, "percentage": 100.0, "elapsed_time": "0:12:18", "remaining_time": "0:00:00"}
	{"current_steps": 78, "total_steps": 78, "epoch": 3.0, "percentage": 100.0, "elapsed_time": "0:13:42", "remaining_time": "0:00:00"}