Run 2. Outer Step 0. Inner Step 3.

Browse files

Files changed (3) hide show

config.json +12 -18
inner_optimizer.pt +1 -1
model.safetensors +1 -1

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "crypt0trading/c66-h8",
   "activation_function": "gelu_new",
   "all_reduce_scores": {
     "0": "NON_PARTICIPATING",
@@ -148,19 +148,19 @@
     "227": "NON_PARTICIPATING",
     "228": "NON_PARTICIPATING",
     "229": "NON_PARTICIPATING",
-    "23": "NON_PARTICIPATING",
     "230": "NON_PARTICIPATING",
     "231": "NON_PARTICIPATING",
     "232": "NON_PARTICIPATING",
     "233": "NON_PARTICIPATING",
     "234": "NON_PARTICIPATING",
-    "235": "SUCCESS",
     "236": "NON_PARTICIPATING",
     "237": "NON_PARTICIPATING",
     "238": "NON_PARTICIPATING",
     "239": "NON_PARTICIPATING",
     "24": "NON_PARTICIPATING",
-    "240": "SUCCESS",
     "241": "NON_PARTICIPATING",
     "242": "NON_PARTICIPATING",
     "243": "NON_PARTICIPATING",
@@ -169,7 +169,7 @@
     "246": "NON_PARTICIPATING",
     "247": "NON_PARTICIPATING",
     "248": "NON_PARTICIPATING",
-    "249": "NON_PARTICIPATING",
     "25": "SUCCESS",
     "250": "NON_PARTICIPATING",
     "251": "NON_PARTICIPATING",
@@ -268,26 +268,20 @@
     "AutoModelForCausalLM": "distributed/optimized-gpt2-500m--modeling_gpt_optimized.GPTOptim"
   },
   "block_list": [
-    5321401,
-    5321405,
-    5321409,
-    5321413,
-    5321417,
-    5321421,
-    5321425,
-    5321430,
-    5321433,
-    5321437,
-    5321444
   ],
   "block_size": 1024,
   "bos_token_id": 50256,
   "embd_pdrop": 0.1,
   "eos_token_id": 50256,
   "initializer_range": 0.02,
-  "inner_step": 260,
   "inner_steps": 0,
-  "last_allreduce_block": 5265017,
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt_optimized",
   "n_embd": 1280,

 {
+  "_name_or_path": "distributed/optimized-gpt2-1b",
   "activation_function": "gelu_new",
   "all_reduce_scores": {
     "0": "NON_PARTICIPATING",
     "227": "NON_PARTICIPATING",
     "228": "NON_PARTICIPATING",
     "229": "NON_PARTICIPATING",
+    "23": "FAIL",
     "230": "NON_PARTICIPATING",
     "231": "NON_PARTICIPATING",
     "232": "NON_PARTICIPATING",
     "233": "NON_PARTICIPATING",
     "234": "NON_PARTICIPATING",
+    "235": "NON_PARTICIPATING",
     "236": "NON_PARTICIPATING",
     "237": "NON_PARTICIPATING",
     "238": "NON_PARTICIPATING",
     "239": "NON_PARTICIPATING",
     "24": "NON_PARTICIPATING",
+    "240": "NON_PARTICIPATING",
     "241": "NON_PARTICIPATING",
     "242": "NON_PARTICIPATING",
     "243": "NON_PARTICIPATING",
     "246": "NON_PARTICIPATING",
     "247": "NON_PARTICIPATING",
     "248": "NON_PARTICIPATING",
+    "249": "SUCCESS",
     "25": "SUCCESS",
     "250": "NON_PARTICIPATING",
     "251": "NON_PARTICIPATING",
     "AutoModelForCausalLM": "distributed/optimized-gpt2-500m--modeling_gpt_optimized.GPTOptim"
   },
   "block_list": [
+    5321587,
+    5321591,
+    5321595,
+    5321599,
+    5321604
   ],
   "block_size": 1024,
   "bos_token_id": 50256,
   "embd_pdrop": 0.1,
   "eos_token_id": 50256,
   "initializer_range": 0.02,
+  "inner_step": 3,
   "inner_steps": 0,
+  "last_allreduce_block": 5321471,
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt_optimized",
   "n_embd": 1280,

inner_optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9f58b27bb9ed5fd8a856b83587694186a0f15ec4a91c44d7ae7803efd0ae9c5f
 size 8081782026

 version https://git-lfs.github.com/spec/v1
+oid sha256:6751c85e3ee82502fba0cea2b0ce60c38339d1f9cd32183ecbb5d6db3c4f3e56
 size 8081782026

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c589527005b38651d7e92afe907a9cb376d18f044458374c66e595f965f3b277
 size 4040701744

 version https://git-lfs.github.com/spec/v1
+oid sha256:3bc49239f3d5efe40c7d6130a86ed354e9356e8502899ff28a0bc66522edd02f
 size 4040701744