Upload 4 files

Files changed (4) hide show

config.json CHANGED Viewed

@@ -1,5 +1,4 @@
 {
-  "_name_or_path": "EleutherAI/pythia-19m",
   "architectures": [
     "GPTNeoXForCausalLM"
   ],
@@ -10,7 +9,6 @@
   "initializer_range": 0.02,
   "intermediate_size": 2048,
   "layer_norm_eps": 1e-05,
-  "line_by_line": true,
   "max_position_embeddings": 2048,
   "model_type": "gpt_neox",
   "num_attention_heads": 8,
@@ -18,9 +16,8 @@
   "rotary_emb_base": 10000,
   "rotary_pct": 0.25,
   "tie_word_embeddings": false,
-  "torch_dtype": "float32",
-  "transformers_version": "4.25.1",
   "use_cache": true,
-  "use_parallel_residual": true,
   "vocab_size": 50304
 }

 {
   "architectures": [
     "GPTNeoXForCausalLM"
   ],
   "initializer_range": 0.02,
   "intermediate_size": 2048,
   "layer_norm_eps": 1e-05,
   "max_position_embeddings": 2048,
   "model_type": "gpt_neox",
   "num_attention_heads": 8,
   "rotary_emb_base": 10000,
   "rotary_pct": 0.25,
   "tie_word_embeddings": false,
+  "torch_dtype": "float16",
+  "transformers_version": "4.22.2",
   "use_cache": true,
   "vocab_size": 50304
 }

special_tokens_map.json CHANGED Viewed

@@ -1,11 +1,5 @@
 {
-  "additional_special_tokens": [
-    "<|endoftext|>",
-    "<|sep|>",
-    "<|acc|>",
-    "<|tel|>",
-    "<|rrn|>"
-  ],
   "eos_token": "<|endoftext|>",
-  "pad_token": "<|endoftext|>"
 }

 {
+  "bos_token": "<|endoftext|>",
   "eos_token": "<|endoftext|>",
+  "unk_token": "<|endoftext|>"
 }

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -1,6 +1,9 @@
 {
-  "name_or_path": "EleutherAI/polyglot-ko-1.3b",
   "eos_token": "<|endoftext|>",
-  "pad_token": "<|endoftext|>",
-  "tokenizer_class": "PreTrainedTokenizerFast"
 }

 {
+  "add_prefix_space": false,
+  "bos_token": "<|endoftext|>",
   "eos_token": "<|endoftext|>",
+  "name_or_path": "EleutherAI/gpt-neox-20b",
+  "special_tokens_map_file": "/fsx/home-hailey/.cache/huggingface/hub/models--EleutherAI--gpt-neox-20b/snapshots/3523781c8df75f7741687a4284f6f70e1afa12f4/special_tokens_map.json",
+  "tokenizer_class": "GPTNeoXTokenizer",
+  "unk_token": "<|endoftext|>"
 }