vikp
/

cleaner

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "cleaner_model.pth",
   "architectures": [
     "GPTNeoXForCausalLM"
   ],
@@ -15,11 +15,11 @@
   "layer_norm_eps": 1e-05,
   "max_position_embeddings": 2048,
   "model_type": "gpt_neox",
-  "num_attention_heads": 16,
-  "num_hidden_layers": 24,
   "pad_token_id": 1,
   "rope_scaling": {
-    "factor": 2.0,
     "type": "dynamic"
   },
   "rotary_emb_base": 10000,

 {
+  "_name_or_path": "cleaner_model_v3.pth",
   "architectures": [
     "GPTNeoXForCausalLM"
   ],
   "layer_norm_eps": 1e-05,
   "max_position_embeddings": 2048,
   "model_type": "gpt_neox",
+  "num_attention_heads": 8,
+  "num_hidden_layers": 16,
   "pad_token_id": 1,
   "rope_scaling": {
+    "factor": 4.0,
     "type": "dynamic"
   },
   "rotary_emb_base": 10000,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:739f4b5d2c9a76744ea3e36b65a456d6842b67596f22f920ba870080d5c5f896
-size 5658696201

 version https://git-lfs.github.com/spec/v1
+oid sha256:aa6982df9809cd158332088ff1630a64b071a7d98daf6da1d4aa909ab2ec0ff9
+size 4047197149