Outer Step 4. Inner Step 0. Batch Size 0

Browse files

Files changed (3) hide show

config.json +7 -23
inner_optimizer.pt +2 -2
model.safetensors +1 -1

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "crypt0trading/c66-h13",
   "activation_function": "gelu_new",
   "all_reduce_scores": {
     "0": "NON_PARTICIPATING",
@@ -106,7 +106,7 @@
     "19": "NON_PARTICIPATING",
     "190": "NON_PARTICIPATING",
     "191": "NON_PARTICIPATING",
-    "192": "NON_PARTICIPATING",
     "193": "NON_PARTICIPATING",
     "194": "NON_PARTICIPATING",
     "195": "NON_PARTICIPATING",
@@ -170,7 +170,7 @@
     "247": "NON_PARTICIPATING",
     "248": "NON_PARTICIPATING",
     "249": "SUCCESS",
-    "25": "NON_PARTICIPATING",
     "250": "NON_PARTICIPATING",
     "251": "NON_PARTICIPATING",
     "252": "NON_PARTICIPATING",
@@ -187,7 +187,7 @@
     "32": "NON_PARTICIPATING",
     "33": "NON_PARTICIPATING",
     "34": "NON_PARTICIPATING",
-    "35": "SUCCESS",
     "36": "NON_PARTICIPATING",
     "37": "NON_PARTICIPATING",
     "38": "NON_PARTICIPATING",
@@ -267,31 +267,15 @@
     "AutoConfig": "distributed/optimized-gpt2-500m--configuration_gpt_optimized.GPTOptimConfig",
     "AutoModelForCausalLM": "distributed/optimized-gpt2-500m--modeling_gpt_optimized.GPTOptim"
   },
-  "block_list": [
-    5227552,
-    5227557,
-    5227561,
-    5227565,
-    5227570,
-    5227574,
-    5227578,
-    5227582,
-    5227586,
-    5227590,
-    5227598,
-    5227609,
-    5227620,
-    5227630,
-    5227641
-  ],
   "block_size": 1024,
   "bos_token_id": 50256,
   "embd_pdrop": 0.1,
   "eos_token_id": 50256,
   "initializer_range": 0.02,
-  "inner_step": 132,
   "inner_steps": 0,
-  "last_allreduce_block": 5226437,
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt_optimized",
   "n_embd": 1280,

 {
+  "_name_or_path": "distributed/optimized-gpt2-1b",
   "activation_function": "gelu_new",
   "all_reduce_scores": {
     "0": "NON_PARTICIPATING",
     "19": "NON_PARTICIPATING",
     "190": "NON_PARTICIPATING",
     "191": "NON_PARTICIPATING",
+    "192": "SUCCESS",
     "193": "NON_PARTICIPATING",
     "194": "NON_PARTICIPATING",
     "195": "NON_PARTICIPATING",
     "247": "NON_PARTICIPATING",
     "248": "NON_PARTICIPATING",
     "249": "SUCCESS",
+    "25": "SUCCESS",
     "250": "NON_PARTICIPATING",
     "251": "NON_PARTICIPATING",
     "252": "NON_PARTICIPATING",
     "32": "NON_PARTICIPATING",
     "33": "NON_PARTICIPATING",
     "34": "NON_PARTICIPATING",
+    "35": "NON_PARTICIPATING",
     "36": "NON_PARTICIPATING",
     "37": "NON_PARTICIPATING",
     "38": "NON_PARTICIPATING",
     "AutoConfig": "distributed/optimized-gpt2-500m--configuration_gpt_optimized.GPTOptimConfig",
     "AutoModelForCausalLM": "distributed/optimized-gpt2-500m--modeling_gpt_optimized.GPTOptim"
   },
+  "block_list": [],
   "block_size": 1024,
   "bos_token_id": 50256,
   "embd_pdrop": 0.1,
   "eos_token_id": 50256,
   "initializer_range": 0.02,
+  "inner_step": 0,
   "inner_steps": 0,
+  "last_allreduce_block": 5227728,
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt_optimized",
   "n_embd": 1280,

inner_optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0a15fdd4605333479978e1728c76a845d4f52109ce14a19e0333e446bfed6c13
-size 8081781770

 version https://git-lfs.github.com/spec/v1
+oid sha256:b4cbaa53e58e44c7721a2bbb748a09d64dd416d5abb1c596a9bca2f5085b65c1
+size 2752

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f55e78fb16bf253edd69adf0271706f2597ba5b5dbad821891e626a061fd8673
 size 4040701744

 version https://git-lfs.github.com/spec/v1
+oid sha256:dbacd9c5aa5c72199f4b0f44e26f8da971b38e44f9497137ecd97afcb379f0fd
 size 4040701744