Epoch 8. Batch Size 0. Peers 10.

Files changed (4) hide show

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "distributed/optimized-gpt2-1b",
   "activation_function": "gelu_new",
   "all_reduce_scores": {
     "0": "NON_PARTICIPATING",
@@ -89,7 +89,7 @@
     "174": "NON_PARTICIPATING",
     "175": "NON_PARTICIPATING",
     "176": "NON_PARTICIPATING",
-    "177": "SUCCESS",
     "178": "NON_PARTICIPATING",
     "179": "NON_PARTICIPATING",
     "18": "NON_PARTICIPATING",
@@ -148,7 +148,7 @@
     "227": "NON_PARTICIPATING",
     "228": "NON_PARTICIPATING",
     "229": "NON_PARTICIPATING",
-    "23": "SUCCESS",
     "230": "NON_PARTICIPATING",
     "231": "NON_PARTICIPATING",
     "232": "NON_PARTICIPATING",
@@ -267,7 +267,18 @@
     "AutoConfig": "distributed/optimized-gpt2-500m--configuration_gpt_optimized.GPTOptimConfig",
     "AutoModelForCausalLM": "distributed/optimized-gpt2-500m--modeling_gpt_optimized.GPTOptim"
   },
-  "block_list": [],
   "block_size": 1024,
   "bos_token_id": 50256,
   "embd_pdrop": 0.1,
@@ -275,7 +286,7 @@
   "initializer_range": 0.02,
   "inner_step": 0,
   "inner_steps": 0,
-  "last_allreduce_block": 5280079,
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt_optimized",
   "n_embd": 1280,

 {
+  "_name_or_path": "kmfoda/gpt2-1b-miner-3",
   "activation_function": "gelu_new",
   "all_reduce_scores": {
     "0": "NON_PARTICIPATING",
     "174": "NON_PARTICIPATING",
     "175": "NON_PARTICIPATING",
     "176": "NON_PARTICIPATING",
+    "177": "NON_PARTICIPATING",
     "178": "NON_PARTICIPATING",
     "179": "NON_PARTICIPATING",
     "18": "NON_PARTICIPATING",
     "227": "NON_PARTICIPATING",
     "228": "NON_PARTICIPATING",
     "229": "NON_PARTICIPATING",
+    "23": "NON_PARTICIPATING",
     "230": "NON_PARTICIPATING",
     "231": "NON_PARTICIPATING",
     "232": "NON_PARTICIPATING",
     "AutoConfig": "distributed/optimized-gpt2-500m--configuration_gpt_optimized.GPTOptimConfig",
     "AutoModelForCausalLM": "distributed/optimized-gpt2-500m--modeling_gpt_optimized.GPTOptim"
   },
+  "block_list": [
+    5283473,
+    5283477,
+    5283481,
+    5283486,
+    5283490,
+    5283494,
+    5283499,
+    5283503,
+    5283508,
+    5283512
+  ],
   "block_size": 1024,
   "bos_token_id": 50256,
   "embd_pdrop": 0.1,
   "initializer_range": 0.02,
   "inner_step": 0,
   "inner_steps": 0,
+  "last_allreduce_block": 5283755,
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt_optimized",
   "n_embd": 1280,

inner_optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3700f4f60d5bc7c79e918e090c495d8f89c50b66653c53ab618096ee5526655b
 size 2752

 version https://git-lfs.github.com/spec/v1
+oid sha256:12806c5436a164b1e90e09a1518f6a88b15add872d3c4f6abf840225a7ecb68a
 size 2752

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9492c624d46c98848d6e0d48211fc8b066c6d771ed2455de556351e461dc142a
 size 4040701744

 version https://git-lfs.github.com/spec/v1
+oid sha256:c933a9ed1f5f7c6efadfcb8d1009c01cfbc8fb83615528124ae7a9849a72cf46
 size 4040701744

outer_optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5931f7e02fbd96baf36eea017539274a74ea726cb88905a2d8c89f901c2254e3
 size 4040805354

 version https://git-lfs.github.com/spec/v1
+oid sha256:acccf246a3b110692024e06f5a90c3a584dcf61fbc1167125b6943a2a1aa3f8d
 size 4040805354