chchen
/

Falcon-7B-Instruct-ORPO-SALT-HALF

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a538ef300caa75293e5388886b3f0146f5fa2c6f420b663cf3b1931c5cc05f5f
 size 65309632

 version https://git-lfs.github.com/spec/v1
+oid sha256:48022570d812624f802c97d6342ea39098e5a3a123ff0bc6282c47d222a5b25a
 size 65309632

trainer_log.jsonl CHANGED Viewed

@@ -49,3 +49,54 @@
 {"current_steps": 490, "total_steps": 1770, "loss": 1.5245, "accuracy": 0.4937500059604645, "learning_rate": 4.11287244177176e-06, "epoch": 0.8298052497883149, "percentage": 27.68, "elapsed_time": "1:17:31", "remaining_time": "3:22:31"}
 {"current_steps": 500, "total_steps": 1770, "loss": 1.5988, "accuracy": 0.512499988079071, "learning_rate": 4.078714909616215e-06, "epoch": 0.8467400508044031, "percentage": 28.25, "elapsed_time": "1:19:04", "remaining_time": "3:20:50"}
 {"current_steps": 500, "total_steps": 1770, "eval_loss": 1.5655477046966553, "epoch": 0.8467400508044031, "percentage": 28.25, "elapsed_time": "1:22:32", "remaining_time": "3:29:38"}

 {"current_steps": 490, "total_steps": 1770, "loss": 1.5245, "accuracy": 0.4937500059604645, "learning_rate": 4.11287244177176e-06, "epoch": 0.8298052497883149, "percentage": 27.68, "elapsed_time": "1:17:31", "remaining_time": "3:22:31"}
 {"current_steps": 500, "total_steps": 1770, "loss": 1.5988, "accuracy": 0.512499988079071, "learning_rate": 4.078714909616215e-06, "epoch": 0.8467400508044031, "percentage": 28.25, "elapsed_time": "1:19:04", "remaining_time": "3:20:50"}
 {"current_steps": 500, "total_steps": 1770, "eval_loss": 1.5655477046966553, "epoch": 0.8467400508044031, "percentage": 28.25, "elapsed_time": "1:22:32", "remaining_time": "3:29:38"}
+{"current_steps": 510, "total_steps": 1770, "loss": 1.6018, "accuracy": 0.5625, "learning_rate": 4.044059990272125e-06, "epoch": 0.8636748518204911, "percentage": 28.81, "elapsed_time": "1:24:11", "remaining_time": "3:28:01"}
+{"current_steps": 520, "total_steps": 1770, "loss": 1.6364, "accuracy": 0.5249999761581421, "learning_rate": 4.0089186020584345e-06, "epoch": 0.8806096528365792, "percentage": 29.38, "elapsed_time": "1:25:47", "remaining_time": "3:26:14"}
+{"current_steps": 530, "total_steps": 1770, "loss": 1.4866, "accuracy": 0.53125, "learning_rate": 3.973301816560124e-06, "epoch": 0.8975444538526672, "percentage": 29.94, "elapsed_time": "1:27:20", "remaining_time": "3:24:20"}
+{"current_steps": 540, "total_steps": 1770, "loss": 1.5204, "accuracy": 0.4937500059604645, "learning_rate": 3.937220855140021e-06, "epoch": 0.9144792548687553, "percentage": 30.51, "elapsed_time": "1:28:52", "remaining_time": "3:22:26"}
+{"current_steps": 550, "total_steps": 1770, "loss": 1.4644, "accuracy": 0.44999998807907104, "learning_rate": 3.900687085403418e-06, "epoch": 0.9314140558848434, "percentage": 31.07, "elapsed_time": "1:30:25", "remaining_time": "3:20:34"}
+{"current_steps": 560, "total_steps": 1770, "loss": 1.5324, "accuracy": 0.518750011920929, "learning_rate": 3.863712017616614e-06, "epoch": 0.9483488569009314, "percentage": 31.64, "elapsed_time": "1:32:05", "remaining_time": "3:18:59"}
+{"current_steps": 570, "total_steps": 1770, "loss": 1.5501, "accuracy": 0.44999998807907104, "learning_rate": 3.826307301080504e-06, "epoch": 0.9652836579170194, "percentage": 32.2, "elapsed_time": "1:33:34", "remaining_time": "3:17:00"}
+{"current_steps": 580, "total_steps": 1770, "loss": 1.5989, "accuracy": 0.39375001192092896, "learning_rate": 3.7884847204603775e-06, "epoch": 0.9822184589331076, "percentage": 32.77, "elapsed_time": "1:35:16", "remaining_time": "3:15:28"}
+{"current_steps": 590, "total_steps": 1770, "loss": 1.6929, "accuracy": 0.5249999761581421, "learning_rate": 3.750256192073058e-06, "epoch": 0.9991532599491956, "percentage": 33.33, "elapsed_time": "1:36:58", "remaining_time": "3:13:57"}
+{"current_steps": 600, "total_steps": 1770, "loss": 1.4826, "accuracy": 0.4625000059604645, "learning_rate": 3.7116337601325715e-06, "epoch": 1.0160880609652836, "percentage": 33.9, "elapsed_time": "1:38:35", "remaining_time": "3:12:14"}
+{"current_steps": 610, "total_steps": 1770, "loss": 1.4074, "accuracy": 0.4625000059604645, "learning_rate": 3.6726295929555154e-06, "epoch": 1.0330228619813717, "percentage": 34.46, "elapsed_time": "1:40:08", "remaining_time": "3:10:26"}
+{"current_steps": 620, "total_steps": 1770, "loss": 1.4376, "accuracy": 0.512499988079071, "learning_rate": 3.6332559791273307e-06, "epoch": 1.0499576629974599, "percentage": 35.03, "elapsed_time": "1:41:45", "remaining_time": "3:08:43"}
+{"current_steps": 630, "total_steps": 1770, "loss": 1.5346, "accuracy": 0.48750001192092896, "learning_rate": 3.593525323630681e-06, "epoch": 1.0668924640135478, "percentage": 35.59, "elapsed_time": "1:43:23", "remaining_time": "3:07:05"}
+{"current_steps": 640, "total_steps": 1770, "loss": 1.5053, "accuracy": 0.5062500238418579, "learning_rate": 3.5534501439371615e-06, "epoch": 1.083827265029636, "percentage": 36.16, "elapsed_time": "1:45:00", "remaining_time": "3:05:24"}
+{"current_steps": 650, "total_steps": 1770, "loss": 1.4902, "accuracy": 0.518750011920929, "learning_rate": 3.5130430660635633e-06, "epoch": 1.100762066045724, "percentage": 36.72, "elapsed_time": "1:46:36", "remaining_time": "3:03:42"}
+{"current_steps": 660, "total_steps": 1770, "loss": 1.5198, "accuracy": 0.45625001192092896, "learning_rate": 3.4723168205939444e-06, "epoch": 1.117696867061812, "percentage": 37.29, "elapsed_time": "1:48:08", "remaining_time": "3:01:51"}
+{"current_steps": 670, "total_steps": 1770, "loss": 1.6222, "accuracy": 0.4625000059604645, "learning_rate": 3.431284238668754e-06, "epoch": 1.1346316680779, "percentage": 37.85, "elapsed_time": "1:49:52", "remaining_time": "3:00:23"}
+{"current_steps": 680, "total_steps": 1770, "loss": 1.5859, "accuracy": 0.4937500059604645, "learning_rate": 3.389958247942274e-06, "epoch": 1.1515664690939882, "percentage": 38.42, "elapsed_time": "1:51:25", "remaining_time": "2:58:37"}
+{"current_steps": 690, "total_steps": 1770, "loss": 1.5243, "accuracy": 0.5062500238418579, "learning_rate": 3.3483518685096588e-06, "epoch": 1.168501270110076, "percentage": 38.98, "elapsed_time": "1:53:02", "remaining_time": "2:56:55"}
+{"current_steps": 700, "total_steps": 1770, "loss": 1.4736, "accuracy": 0.4749999940395355, "learning_rate": 3.306478208804839e-06, "epoch": 1.1854360711261642, "percentage": 39.55, "elapsed_time": "1:54:30", "remaining_time": "2:55:02"}
+{"current_steps": 710, "total_steps": 1770, "loss": 1.4872, "accuracy": 0.53125, "learning_rate": 3.264350461470608e-06, "epoch": 1.2023708721422524, "percentage": 40.11, "elapsed_time": "1:56:00", "remaining_time": "2:53:12"}
+{"current_steps": 720, "total_steps": 1770, "loss": 1.4058, "accuracy": 0.5249999761581421, "learning_rate": 3.2219818992021685e-06, "epoch": 1.2193056731583405, "percentage": 40.68, "elapsed_time": "1:57:40", "remaining_time": "2:51:37"}
+{"current_steps": 730, "total_steps": 1770, "loss": 1.5098, "accuracy": 0.46875, "learning_rate": 3.1793858705654595e-06, "epoch": 1.2362404741744284, "percentage": 41.24, "elapsed_time": "1:59:18", "remaining_time": "2:49:58"}
+{"current_steps": 740, "total_steps": 1770, "loss": 1.5488, "accuracy": 0.4749999940395355, "learning_rate": 3.1365757957915787e-06, "epoch": 1.2531752751905165, "percentage": 41.81, "elapsed_time": "2:00:52", "remaining_time": "2:48:15"}
+{"current_steps": 750, "total_steps": 1770, "loss": 1.5741, "accuracy": 0.45625001192092896, "learning_rate": 3.093565162548633e-06, "epoch": 1.2701100762066047, "percentage": 42.37, "elapsed_time": "2:02:26", "remaining_time": "2:46:31"}
+{"current_steps": 760, "total_steps": 1770, "loss": 1.3741, "accuracy": 0.5062500238418579, "learning_rate": 3.0503675216923294e-06, "epoch": 1.2870448772226926, "percentage": 42.94, "elapsed_time": "2:04:03", "remaining_time": "2:44:51"}
+{"current_steps": 770, "total_steps": 1770, "loss": 1.4523, "accuracy": 0.4749999940395355, "learning_rate": 3.0069964829966748e-06, "epoch": 1.3039796782387807, "percentage": 43.5, "elapsed_time": "2:05:40", "remaining_time": "2:43:13"}
+{"current_steps": 780, "total_steps": 1770, "loss": 1.5065, "accuracy": 0.518750011920929, "learning_rate": 2.963465710866094e-06, "epoch": 1.3209144792548688, "percentage": 44.07, "elapsed_time": "2:07:20", "remaining_time": "2:41:37"}
+{"current_steps": 790, "total_steps": 1770, "loss": 1.5749, "accuracy": 0.4937500059604645, "learning_rate": 2.919788920030357e-06, "epoch": 1.337849280270957, "percentage": 44.63, "elapsed_time": "2:09:02", "remaining_time": "2:40:04"}
+{"current_steps": 800, "total_steps": 1770, "loss": 1.4391, "accuracy": 0.512499988079071, "learning_rate": 2.8759798712236303e-06, "epoch": 1.3547840812870449, "percentage": 45.2, "elapsed_time": "2:10:50", "remaining_time": "2:38:38"}
+{"current_steps": 810, "total_steps": 1770, "loss": 1.516, "accuracy": 0.46875, "learning_rate": 2.8320523668490507e-06, "epoch": 1.371718882303133, "percentage": 45.76, "elapsed_time": "2:12:22", "remaining_time": "2:36:53"}
+{"current_steps": 820, "total_steps": 1770, "loss": 1.4949, "accuracy": 0.4312500059604645, "learning_rate": 2.7880202466301597e-06, "epoch": 1.388653683319221, "percentage": 46.33, "elapsed_time": "2:14:11", "remaining_time": "2:35:27"}
+{"current_steps": 830, "total_steps": 1770, "loss": 1.4703, "accuracy": 0.4625000059604645, "learning_rate": 2.7438973832505854e-06, "epoch": 1.405588484335309, "percentage": 46.89, "elapsed_time": "2:16:44", "remaining_time": "2:34:51"}
+{"current_steps": 840, "total_steps": 1770, "loss": 1.4577, "accuracy": 0.40625, "learning_rate": 2.699697677983341e-06, "epoch": 1.4225232853513972, "percentage": 47.46, "elapsed_time": "2:19:58", "remaining_time": "2:34:57"}
+{"current_steps": 850, "total_steps": 1770, "loss": 1.5147, "accuracy": 0.4000000059604645, "learning_rate": 2.6554350563111115e-06, "epoch": 1.4394580863674853, "percentage": 48.02, "elapsed_time": "2:23:19", "remaining_time": "2:35:07"}
+{"current_steps": 860, "total_steps": 1770, "loss": 1.4284, "accuracy": 0.46875, "learning_rate": 2.611123463538913e-06, "epoch": 1.4563928873835732, "percentage": 48.59, "elapsed_time": "2:26:40", "remaining_time": "2:35:12"}
+{"current_steps": 870, "total_steps": 1770, "loss": 1.5387, "accuracy": 0.48750001192092896, "learning_rate": 2.566776860400514e-06, "epoch": 1.4733276883996613, "percentage": 49.15, "elapsed_time": "2:30:02", "remaining_time": "2:35:12"}
+{"current_steps": 880, "total_steps": 1770, "loss": 1.5903, "accuracy": 0.4625000059604645, "learning_rate": 2.522409218659989e-06, "epoch": 1.4902624894157492, "percentage": 49.72, "elapsed_time": "2:33:20", "remaining_time": "2:35:05"}
+{"current_steps": 890, "total_steps": 1770, "loss": 1.4925, "accuracy": 0.53125, "learning_rate": 2.4780345167097976e-06, "epoch": 1.5071972904318374, "percentage": 50.28, "elapsed_time": "2:36:46", "remaining_time": "2:35:00"}
+{"current_steps": 900, "total_steps": 1770, "loss": 1.6407, "accuracy": 0.53125, "learning_rate": 2.4336667351667747e-06, "epoch": 1.5241320914479255, "percentage": 50.85, "elapsed_time": "2:40:00", "remaining_time": "2:34:40"}
+{"current_steps": 910, "total_steps": 1770, "loss": 1.4593, "accuracy": 0.5, "learning_rate": 2.3893198524674264e-06, "epoch": 1.5410668924640136, "percentage": 51.41, "elapsed_time": "2:43:24", "remaining_time": "2:34:25"}
+{"current_steps": 920, "total_steps": 1770, "loss": 1.5022, "accuracy": 0.45625001192092896, "learning_rate": 2.345007840463904e-06, "epoch": 1.5580016934801018, "percentage": 51.98, "elapsed_time": "2:46:53", "remaining_time": "2:34:11"}
+{"current_steps": 930, "total_steps": 1770, "loss": 1.4351, "accuracy": 0.48750001192092896, "learning_rate": 2.3007446600220572e-06, "epoch": 1.5749364944961897, "percentage": 52.54, "elapsed_time": "2:50:18", "remaining_time": "2:33:49"}
+{"current_steps": 940, "total_steps": 1770, "loss": 1.5392, "accuracy": 0.3812499940395355, "learning_rate": 2.2565442566229507e-06, "epoch": 1.5918712955122776, "percentage": 53.11, "elapsed_time": "2:53:41", "remaining_time": "2:33:21"}
+{"current_steps": 950, "total_steps": 1770, "loss": 1.4919, "accuracy": 0.5625, "learning_rate": 2.2124205559692195e-06, "epoch": 1.6088060965283657, "percentage": 53.67, "elapsed_time": "2:57:01", "remaining_time": "2:32:48"}
+{"current_steps": 960, "total_steps": 1770, "loss": 1.5813, "accuracy": 0.5687500238418579, "learning_rate": 2.168387459597666e-06, "epoch": 1.6257408975444538, "percentage": 54.24, "elapsed_time": "3:00:30", "remaining_time": "2:32:18"}
+{"current_steps": 970, "total_steps": 1770, "loss": 1.453, "accuracy": 0.4749999940395355, "learning_rate": 2.1244588404994648e-06, "epoch": 1.642675698560542, "percentage": 54.8, "elapsed_time": "3:03:46", "remaining_time": "2:31:33"}
+{"current_steps": 980, "total_steps": 1770, "loss": 1.4788, "accuracy": 0.48124998807907104, "learning_rate": 2.08064853874936e-06, "epoch": 1.65961049957663, "percentage": 55.37, "elapsed_time": "3:07:08", "remaining_time": "2:30:51"}
+{"current_steps": 990, "total_steps": 1770, "loss": 1.3763, "accuracy": 0.5625, "learning_rate": 2.0369703571452387e-06, "epoch": 1.676545300592718, "percentage": 55.93, "elapsed_time": "3:10:33", "remaining_time": "2:30:07"}
+{"current_steps": 1000, "total_steps": 1770, "loss": 1.4213, "accuracy": 0.4749999940395355, "learning_rate": 1.993438056859441e-06, "epoch": 1.6934801016088061, "percentage": 56.5, "elapsed_time": "3:13:51", "remaining_time": "2:29:16"}
+{"current_steps": 1000, "total_steps": 1770, "eval_loss": 1.509663701057434, "epoch": 1.6934801016088061, "percentage": 56.5, "elapsed_time": "3:21:17", "remaining_time": "2:34:59"}