Training in progress, epoch 1

Browse files

Files changed (5) hide show

model-00001-of-00004.safetensors +1 -1
model-00002-of-00004.safetensors +1 -1
model-00003-of-00004.safetensors +1 -1
model-00004-of-00004.safetensors +1 -1
trainer_log.jsonl +45 -0

model-00001-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f815f1b37c9df64ddb15ca678fa6daa9fbafecf980d429a1c7606af5ed0434be
 size 4903351912

 version https://git-lfs.github.com/spec/v1
+oid sha256:b921ae986d40c57377351ab0759cd728f44691d226e2beffd2ea996055ff3af0
 size 4903351912

model-00002-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8937331a2e86d20eeb33352c3f7a5e6ba1d317f649ff008160e673e8041bd3e8
 size 4947570872

 version https://git-lfs.github.com/spec/v1
+oid sha256:e25ac706ebd7934760853351d456ed3f9ba96ff18515c244e7daff06204d40e5
 size 4947570872

model-00003-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bf882095df62c0e0d93a08bd6116bb5533f7159f419616012ded3411d51b82ac
 size 4962221464

 version https://git-lfs.github.com/spec/v1
+oid sha256:e2f83ee63677e5e544bd1c60faba7df6c87eaea3bab6f9e93daebfe1c0d68dfb
 size 4962221464

model-00004-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:78e06ca3e36c7fe1e2c47a55cd9899ec9e0d2d618f20c9391582c1393109e490
 size 3670322200

 version https://git-lfs.github.com/spec/v1
+oid sha256:443e48154fadd0f4740f7db341cb8993d9835db9f6c54a8fde3f9ac271c2abc2
 size 3670322200

trainer_log.jsonl CHANGED Viewed

@@ -43,3 +43,48 @@
 {"current_steps": 430, "total_steps": 1329, "loss": 0.5886, "learning_rate": 5e-06, "epoch": 0.9703808180535967, "percentage": 32.36, "elapsed_time": "10:33:39", "remaining_time": "22:04:47"}
 {"current_steps": 440, "total_steps": 1329, "loss": 0.5934, "learning_rate": 5e-06, "epoch": 0.9929478138222849, "percentage": 33.11, "elapsed_time": "10:48:21", "remaining_time": "21:49:58"}
 {"current_steps": 443, "total_steps": 1329, "eval_loss": 0.5912777781486511, "epoch": 0.9997179125528914, "percentage": 33.33, "elapsed_time": "11:04:20", "remaining_time": "22:08:41"}

 {"current_steps": 430, "total_steps": 1329, "loss": 0.5886, "learning_rate": 5e-06, "epoch": 0.9703808180535967, "percentage": 32.36, "elapsed_time": "10:33:39", "remaining_time": "22:04:47"}
 {"current_steps": 440, "total_steps": 1329, "loss": 0.5934, "learning_rate": 5e-06, "epoch": 0.9929478138222849, "percentage": 33.11, "elapsed_time": "10:48:21", "remaining_time": "21:49:58"}
 {"current_steps": 443, "total_steps": 1329, "eval_loss": 0.5912777781486511, "epoch": 0.9997179125528914, "percentage": 33.33, "elapsed_time": "11:04:20", "remaining_time": "22:08:41"}
+{"current_steps": 450, "total_steps": 1329, "loss": 0.6008, "learning_rate": 5e-06, "epoch": 1.0155148095909732, "percentage": 33.86, "elapsed_time": "11:15:44", "remaining_time": "21:59:57"}
+{"current_steps": 460, "total_steps": 1329, "loss": 0.528, "learning_rate": 5e-06, "epoch": 1.0380818053596614, "percentage": 34.61, "elapsed_time": "11:30:28", "remaining_time": "21:44:24"}
+{"current_steps": 470, "total_steps": 1329, "loss": 0.5429, "learning_rate": 5e-06, "epoch": 1.0606488011283497, "percentage": 35.36, "elapsed_time": "11:45:11", "remaining_time": "21:28:50"}
+{"current_steps": 480, "total_steps": 1329, "loss": 0.5308, "learning_rate": 5e-06, "epoch": 1.0832157968970382, "percentage": 36.12, "elapsed_time": "11:59:53", "remaining_time": "21:13:19"}
+{"current_steps": 490, "total_steps": 1329, "loss": 0.5408, "learning_rate": 5e-06, "epoch": 1.1057827926657264, "percentage": 36.87, "elapsed_time": "12:14:38", "remaining_time": "20:57:53"}
+{"current_steps": 500, "total_steps": 1329, "loss": 0.5396, "learning_rate": 5e-06, "epoch": 1.1283497884344147, "percentage": 37.62, "elapsed_time": "12:29:23", "remaining_time": "20:42:28"}
+{"current_steps": 510, "total_steps": 1329, "loss": 0.5407, "learning_rate": 5e-06, "epoch": 1.150916784203103, "percentage": 38.37, "elapsed_time": "12:44:06", "remaining_time": "20:27:04"}
+{"current_steps": 520, "total_steps": 1329, "loss": 0.5333, "learning_rate": 5e-06, "epoch": 1.1734837799717912, "percentage": 39.13, "elapsed_time": "12:58:48", "remaining_time": "20:11:38"}
+{"current_steps": 530, "total_steps": 1329, "loss": 0.5395, "learning_rate": 5e-06, "epoch": 1.1960507757404795, "percentage": 39.88, "elapsed_time": "13:13:31", "remaining_time": "19:56:17"}
+{"current_steps": 540, "total_steps": 1329, "loss": 0.5371, "learning_rate": 5e-06, "epoch": 1.2186177715091677, "percentage": 40.63, "elapsed_time": "13:28:15", "remaining_time": "19:40:57"}
+{"current_steps": 550, "total_steps": 1329, "loss": 0.5419, "learning_rate": 5e-06, "epoch": 1.2411847672778562, "percentage": 41.38, "elapsed_time": "13:42:58", "remaining_time": "19:25:37"}
+{"current_steps": 560, "total_steps": 1329, "loss": 0.5438, "learning_rate": 5e-06, "epoch": 1.2637517630465445, "percentage": 42.14, "elapsed_time": "13:57:41", "remaining_time": "19:10:20"}
+{"current_steps": 570, "total_steps": 1329, "loss": 0.541, "learning_rate": 5e-06, "epoch": 1.2863187588152327, "percentage": 42.89, "elapsed_time": "14:12:26", "remaining_time": "18:55:05"}
+{"current_steps": 580, "total_steps": 1329, "loss": 0.5409, "learning_rate": 5e-06, "epoch": 1.308885754583921, "percentage": 43.64, "elapsed_time": "14:27:08", "remaining_time": "18:39:49"}
+{"current_steps": 590, "total_steps": 1329, "loss": 0.5411, "learning_rate": 5e-06, "epoch": 1.3314527503526092, "percentage": 44.39, "elapsed_time": "14:41:53", "remaining_time": "18:24:36"}
+{"current_steps": 600, "total_steps": 1329, "loss": 0.5463, "learning_rate": 5e-06, "epoch": 1.3540197461212977, "percentage": 45.15, "elapsed_time": "14:56:37", "remaining_time": "18:09:23"}
+{"current_steps": 610, "total_steps": 1329, "loss": 0.5391, "learning_rate": 5e-06, "epoch": 1.376586741889986, "percentage": 45.9, "elapsed_time": "15:11:20", "remaining_time": "17:54:11"}
+{"current_steps": 620, "total_steps": 1329, "loss": 0.5433, "learning_rate": 5e-06, "epoch": 1.3991537376586742, "percentage": 46.65, "elapsed_time": "15:26:04", "remaining_time": "17:39:00"}
+{"current_steps": 630, "total_steps": 1329, "loss": 0.5413, "learning_rate": 5e-06, "epoch": 1.4217207334273625, "percentage": 47.4, "elapsed_time": "15:40:48", "remaining_time": "17:23:51"}
+{"current_steps": 640, "total_steps": 1329, "loss": 0.5409, "learning_rate": 5e-06, "epoch": 1.4442877291960508, "percentage": 48.16, "elapsed_time": "15:55:32", "remaining_time": "17:08:42"}
+{"current_steps": 650, "total_steps": 1329, "loss": 0.5418, "learning_rate": 5e-06, "epoch": 1.466854724964739, "percentage": 48.91, "elapsed_time": "16:10:15", "remaining_time": "16:53:32"}
+{"current_steps": 660, "total_steps": 1329, "loss": 0.5456, "learning_rate": 5e-06, "epoch": 1.4894217207334273, "percentage": 49.66, "elapsed_time": "16:24:59", "remaining_time": "16:38:25"}
+{"current_steps": 670, "total_steps": 1329, "loss": 0.5403, "learning_rate": 5e-06, "epoch": 1.5119887165021155, "percentage": 50.41, "elapsed_time": "16:39:43", "remaining_time": "16:23:19"}
+{"current_steps": 680, "total_steps": 1329, "loss": 0.5344, "learning_rate": 5e-06, "epoch": 1.5345557122708038, "percentage": 51.17, "elapsed_time": "16:54:27", "remaining_time": "16:08:12"}
+{"current_steps": 690, "total_steps": 1329, "loss": 0.5366, "learning_rate": 5e-06, "epoch": 1.5571227080394923, "percentage": 51.92, "elapsed_time": "17:09:11", "remaining_time": "15:53:06"}
+{"current_steps": 700, "total_steps": 1329, "loss": 0.5408, "learning_rate": 5e-06, "epoch": 1.5796897038081805, "percentage": 52.67, "elapsed_time": "17:23:55", "remaining_time": "15:38:02"}
+{"current_steps": 710, "total_steps": 1329, "loss": 0.5435, "learning_rate": 5e-06, "epoch": 1.6022566995768688, "percentage": 53.42, "elapsed_time": "17:38:39", "remaining_time": "15:22:58"}
+{"current_steps": 720, "total_steps": 1329, "loss": 0.5518, "learning_rate": 5e-06, "epoch": 1.6248236953455573, "percentage": 54.18, "elapsed_time": "17:53:23", "remaining_time": "15:07:54"}
+{"current_steps": 730, "total_steps": 1329, "loss": 0.535, "learning_rate": 5e-06, "epoch": 1.6473906911142455, "percentage": 54.93, "elapsed_time": "18:08:06", "remaining_time": "14:52:50"}
+{"current_steps": 740, "total_steps": 1329, "loss": 0.5508, "learning_rate": 5e-06, "epoch": 1.6699576868829338, "percentage": 55.68, "elapsed_time": "18:22:50", "remaining_time": "14:37:47"}
+{"current_steps": 750, "total_steps": 1329, "loss": 0.5422, "learning_rate": 5e-06, "epoch": 1.692524682651622, "percentage": 56.43, "elapsed_time": "18:37:33", "remaining_time": "14:22:45"}
+{"current_steps": 760, "total_steps": 1329, "loss": 0.541, "learning_rate": 5e-06, "epoch": 1.7150916784203103, "percentage": 57.19, "elapsed_time": "18:52:18", "remaining_time": "14:07:44"}
+{"current_steps": 770, "total_steps": 1329, "loss": 0.5417, "learning_rate": 5e-06, "epoch": 1.7376586741889986, "percentage": 57.94, "elapsed_time": "19:07:02", "remaining_time": "13:52:43"}
+{"current_steps": 780, "total_steps": 1329, "loss": 0.5375, "learning_rate": 5e-06, "epoch": 1.7602256699576868, "percentage": 58.69, "elapsed_time": "19:21:45", "remaining_time": "13:37:42"}
+{"current_steps": 790, "total_steps": 1329, "loss": 0.541, "learning_rate": 5e-06, "epoch": 1.782792665726375, "percentage": 59.44, "elapsed_time": "19:36:30", "remaining_time": "13:22:42"}
+{"current_steps": 800, "total_steps": 1329, "loss": 0.536, "learning_rate": 5e-06, "epoch": 1.8053596614950633, "percentage": 60.2, "elapsed_time": "19:51:14", "remaining_time": "13:07:42"}
+{"current_steps": 810, "total_steps": 1329, "loss": 0.5468, "learning_rate": 5e-06, "epoch": 1.8279266572637518, "percentage": 60.95, "elapsed_time": "20:05:57", "remaining_time": "12:52:42"}
+{"current_steps": 820, "total_steps": 1329, "loss": 0.5341, "learning_rate": 5e-06, "epoch": 1.85049365303244, "percentage": 61.7, "elapsed_time": "20:20:41", "remaining_time": "12:37:43"}
+{"current_steps": 830, "total_steps": 1329, "loss": 0.5462, "learning_rate": 5e-06, "epoch": 1.8730606488011283, "percentage": 62.45, "elapsed_time": "20:35:24", "remaining_time": "12:22:43"}
+{"current_steps": 840, "total_steps": 1329, "loss": 0.5461, "learning_rate": 5e-06, "epoch": 1.8956276445698168, "percentage": 63.21, "elapsed_time": "20:50:07", "remaining_time": "12:07:44"}
+{"current_steps": 850, "total_steps": 1329, "loss": 0.534, "learning_rate": 5e-06, "epoch": 1.918194640338505, "percentage": 63.96, "elapsed_time": "21:04:50", "remaining_time": "11:52:46"}
+{"current_steps": 860, "total_steps": 1329, "loss": 0.539, "learning_rate": 5e-06, "epoch": 1.9407616361071933, "percentage": 64.71, "elapsed_time": "21:19:33", "remaining_time": "11:37:48"}
+{"current_steps": 870, "total_steps": 1329, "loss": 0.5456, "learning_rate": 5e-06, "epoch": 1.9633286318758816, "percentage": 65.46, "elapsed_time": "21:34:17", "remaining_time": "11:22:51"}
+{"current_steps": 880, "total_steps": 1329, "loss": 0.5439, "learning_rate": 5e-06, "epoch": 1.9858956276445698, "percentage": 66.22, "elapsed_time": "21:49:02", "remaining_time": "11:07:54"}
+{"current_steps": 886, "total_steps": 1329, "eval_loss": 0.5872690677642822, "epoch": 1.9994358251057829, "percentage": 66.67, "elapsed_time": "22:09:31", "remaining_time": "11:04:45"}