Training in progress, step 500

Browse files

Files changed (8) hide show

model.safetensors +1 -1
run-2/checkpoint-500/model.safetensors +1 -1
run-2/checkpoint-500/optimizer.pt +1 -1
run-2/checkpoint-500/scheduler.pt +1 -1
run-2/checkpoint-500/trainer_state.json +26 -26
run-2/checkpoint-500/training_args.bin +1 -1
runs/Sep28_10-21-38_bb2384aee55a/events.out.tfevents.1759057654.bb2384aee55a.76.3 +3 -0
training_args.bin +1 -1

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c8f0c5a6bb485f27a2d2623282cf4635be2d472e4216c79e1992c40ecf6827ae
 size 598898116

 version https://git-lfs.github.com/spec/v1
+oid sha256:6d893b21e0d58af9c49b992482b58823b77e2465854de5572d3a1cd1f3927dc6
 size 598898116

run-2/checkpoint-500/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:207c30c8b747194e9a6d03e089dc13c984ce6dfb5686e9f365182fa6d3a9dcbf
 size 598898116

 version https://git-lfs.github.com/spec/v1
+oid sha256:6d893b21e0d58af9c49b992482b58823b77e2465854de5572d3a1cd1f3927dc6
 size 598898116

run-2/checkpoint-500/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f259294e4fff728135f977b74709f0e79c1c1d1bedce909dc9f6c7148485b590
 size 1197884026

 version https://git-lfs.github.com/spec/v1
+oid sha256:5eaf700b2792c8bb32ee0c45b4c5b8f38c85b461a608721efa29d46c040fca3e
 size 1197884026

run-2/checkpoint-500/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:036b590a6639189ef8931808f698edb538b6f4e0b64d7349f2ab831e4a003a21
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:306c6af96669ed13365a61a72a74a28f181e5e20ceb2078a041489ebbb847646
 size 1064

run-2/checkpoint-500/trainer_state.json CHANGED Viewed

@@ -11,50 +11,50 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.7674193548387097,
-      "eval_loss": 3.5887417793273926,
-      "eval_runtime": 20.1099,
-      "eval_samples_per_second": 154.153,
-      "eval_steps_per_second": 1.641,
       "step": 159
     },
     {
       "epoch": 1.2578616352201257,
-      "grad_norm": 7.158421993255615,
-      "learning_rate": 1.6424079065588502e-05,
-      "loss": 5.9747,
       "step": 200
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.9238709677419354,
-      "eval_loss": 1.755516767501831,
-      "eval_runtime": 20.2577,
-      "eval_samples_per_second": 153.028,
-      "eval_steps_per_second": 1.629,
       "step": 318
     },
     {
       "epoch": 2.5157232704402515,
-      "grad_norm": 4.927733898162842,
-      "learning_rate": 1.2830188679245283e-05,
-      "loss": 1.9965,
       "step": 400
     },
     {
       "epoch": 3.0,
-      "eval_accuracy": 0.947741935483871,
-      "eval_loss": 1.2168198823928833,
-      "eval_runtime": 20.1766,
-      "eval_samples_per_second": 153.643,
-      "eval_steps_per_second": 1.636,
       "step": 477
     }
   ],
   "logging_steps": 200,
-  "max_steps": 1113,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 7,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
@@ -72,8 +72,8 @@
   "train_batch_size": 96,
   "trial_name": null,
   "trial_params": {
-    "alpha": 0.19053512605657696,
-    "num_train_epochs": 7,
-    "temperature": 8
   }
 }

   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.7964516129032259,
+      "eval_loss": 6.4024338722229,
+      "eval_runtime": 22.8904,
+      "eval_samples_per_second": 135.428,
+      "eval_steps_per_second": 1.442,
       "step": 159
     },
     {
       "epoch": 1.2578616352201257,
+      "grad_norm": 20.56516456604004,
+      "learning_rate": 1.5828092243186584e-05,
+      "loss": 14.3499,
       "step": 200
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.9280645161290323,
+      "eval_loss": 2.3401365280151367,
+      "eval_runtime": 22.8836,
+      "eval_samples_per_second": 135.468,
+      "eval_steps_per_second": 1.442,
       "step": 318
     },
     {
       "epoch": 2.5157232704402515,
+      "grad_norm": 9.793017387390137,
+      "learning_rate": 1.1635220125786164e-05,
+      "loss": 2.7392,
       "step": 400
     },
     {
       "epoch": 3.0,
+      "eval_accuracy": 0.954516129032258,
+      "eval_loss": 1.683219313621521,
+      "eval_runtime": 22.7915,
+      "eval_samples_per_second": 136.016,
+      "eval_steps_per_second": 1.448,
       "step": 477
     }
   ],
   "logging_steps": 200,
+  "max_steps": 954,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 6,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
   "train_batch_size": 96,
   "trial_name": null,
   "trial_params": {
+    "alpha": 0.8393294687667213,
+    "num_train_epochs": 6,
+    "temperature": 4
   }
 }

run-2/checkpoint-500/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a56d8b1ad389a3c658a9c44fe59a9d8d4421ac34a0e985324cdb64ca878ca72f
 size 5368

 version https://git-lfs.github.com/spec/v1
+oid sha256:59adeb0d3a55bdc7384874777e892e5d0cc98df3d3789609437ba56985f062cb
 size 5368

runs/Sep28_10-21-38_bb2384aee55a/events.out.tfevents.1759057654.bb2384aee55a.76.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9950303484b305802a098459cf1fce855e8c2bf7dffcae41b3a334b30df26204
+size 14501

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0f2a6043dcb359bf6e5c547e39efa179f167939f5b2be51fd4993780a524ca74
 size 5368

 version https://git-lfs.github.com/spec/v1
+oid sha256:59adeb0d3a55bdc7384874777e892e5d0cc98df3d3789609437ba56985f062cb
 size 5368