Outer Step 4. Inner Step 6. Batch Size 64

Files changed (3) hide show

config.json CHANGED Viewed

@@ -106,7 +106,7 @@
     "19": "NON_PARTICIPATING",
     "190": "NON_PARTICIPATING",
     "191": "NON_PARTICIPATING",
-    "192": "NON_PARTICIPATING",
     "193": "NON_PARTICIPATING",
     "194": "NON_PARTICIPATING",
     "195": "NON_PARTICIPATING",
@@ -170,7 +170,7 @@
     "247": "NON_PARTICIPATING",
     "248": "NON_PARTICIPATING",
     "249": "SUCCESS",
-    "25": "NON_PARTICIPATING",
     "250": "NON_PARTICIPATING",
     "251": "NON_PARTICIPATING",
     "252": "NON_PARTICIPATING",
@@ -187,7 +187,7 @@
     "32": "NON_PARTICIPATING",
     "33": "NON_PARTICIPATING",
     "34": "NON_PARTICIPATING",
-    "35": "SUCCESS",
     "36": "NON_PARTICIPATING",
     "37": "NON_PARTICIPATING",
     "38": "NON_PARTICIPATING",
@@ -268,25 +268,25 @@
     "AutoModelForCausalLM": "distributed/optimized-gpt2-500m--modeling_gpt_optimized.GPTOptim"
   },
   "block_list": [
-    5227796,
-    5227801,
-    5227805,
-    5227809,
-    5227814,
-    5227818,
-    5227822,
-    5227826,
-    5227831,
-    5227835
   ],
   "block_size": 1024,
   "bos_token_id": 50256,
   "embd_pdrop": 0.1,
   "eos_token_id": 50256,
   "initializer_range": 0.02,
-  "inner_step": 170,
   "inner_steps": 0,
-  "last_allreduce_block": 5226437,
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt_optimized",
   "n_embd": 1280,

     "19": "NON_PARTICIPATING",
     "190": "NON_PARTICIPATING",
     "191": "NON_PARTICIPATING",
+    "192": "SUCCESS",
     "193": "NON_PARTICIPATING",
     "194": "NON_PARTICIPATING",
     "195": "NON_PARTICIPATING",
     "247": "NON_PARTICIPATING",
     "248": "NON_PARTICIPATING",
     "249": "SUCCESS",
+    "25": "SUCCESS",
     "250": "NON_PARTICIPATING",
     "251": "NON_PARTICIPATING",
     "252": "NON_PARTICIPATING",
     "32": "NON_PARTICIPATING",
     "33": "NON_PARTICIPATING",
     "34": "NON_PARTICIPATING",
+    "35": "NON_PARTICIPATING",
     "36": "NON_PARTICIPATING",
     "37": "NON_PARTICIPATING",
     "38": "NON_PARTICIPATING",
     "AutoModelForCausalLM": "distributed/optimized-gpt2-500m--modeling_gpt_optimized.GPTOptim"
   },
   "block_list": [
+    5227907,
+    5227912,
+    5227916,
+    5227921,
+    5227925,
+    5227929,
+    5227934,
+    5227938,
+    5227942,
+    5227946
   ],
   "block_size": 1024,
   "bos_token_id": 50256,
   "embd_pdrop": 0.1,
   "eos_token_id": 50256,
   "initializer_range": 0.02,
+  "inner_step": 6,
   "inner_steps": 0,
+  "last_allreduce_block": 5227728,
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt_optimized",
   "n_embd": 1280,

inner_optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8c85fe30a46b9f0ebbccc520447ca05e004301307221790063569277ba1fbbb4
 size 8081781770

 version https://git-lfs.github.com/spec/v1
+oid sha256:086b0ddffbc1b294fc42d62038933696b23758036d7368d7427210407346eb36
 size 8081781770

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2c3dd3c700c43ff49c22c836024ae69e8503b92e34e4758a3f35e134019363bd
 size 4040701744

 version https://git-lfs.github.com/spec/v1
+oid sha256:638b8fa13b11faa5452cc3b61a7afda7376443c02e76fadd6232d54f0bf248e9
 size 4040701744