Upload 16 files

Browse files

Files changed (11) hide show

_gitattributes +35 -0
config.json +2 -5
generation_config.json +1 -1
pytorch_model-00001-of-00006.bin +3 -0
pytorch_model-00002-of-00006.bin +3 -0
pytorch_model-00003-of-00006.bin +3 -0
pytorch_model-00004-of-00006.bin +3 -0
pytorch_model-00005-of-00006.bin +3 -0
pytorch_model-00006-of-00006.bin +3 -0
pytorch_model.bin.index.json +2 -2
tokenizer_config.json +2 -0

_gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "/home/keyan/gpt/llm_model/WizardLM-13B-v1.0-hf",
   "architectures": [
     "LlamaForCausalLM"
   ],
@@ -13,14 +13,11 @@
   "model_type": "llama",
   "num_attention_heads": 40,
   "num_hidden_layers": 40,
-  "num_key_value_heads": 40,
   "pad_token_id": 0,
-  "pretraining_tp": 1,
   "rms_norm_eps": 1e-06,
-  "rope_scaling": null,
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
-  "transformers_version": "4.31.0",
   "use_cache": false,
   "vocab_size": 32001
 }

 {
+  "_name_or_path": "../../WizardLM-13B-V1.0",
   "architectures": [
     "LlamaForCausalLM"
   ],
   "model_type": "llama",
   "num_attention_heads": 40,
   "num_hidden_layers": 40,
   "pad_token_id": 0,
   "rms_norm_eps": 1e-06,
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
+  "transformers_version": "4.29.2",
   "use_cache": false,
   "vocab_size": 32001
 }

generation_config.json CHANGED Viewed

@@ -3,5 +3,5 @@
   "bos_token_id": 1,
   "eos_token_id": 2,
   "pad_token_id": 0,
-  "transformers_version": "4.31.0"
 }

   "bos_token_id": 1,
   "eos_token_id": 2,
   "pad_token_id": 0,
+  "transformers_version": "4.29.2"
 }

pytorch_model-00001-of-00006.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:733b4bb53be931f8883118557aea5915e2833df25688946858a5bda94a435149
+size 9956564363

pytorch_model-00002-of-00006.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:66fe1d8f9d6ea1e74f499a4eb9b1d696987c1aa346205e7d8845217a0fafbd1e
+size 9940856385

pytorch_model-00003-of-00006.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0d63e2ed09e6768995483c2398eec832b3d35e2003158c9901f2ff2da910d1ff
+size 9940856943

pytorch_model-00004-of-00006.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:71dac6c7301d83b20a4ca1e1f8a8e07074ebf79d1121721804da642f8616a2da
+size 9867415289

pytorch_model-00005-of-00006.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:07981bf71e77bb2c62dc6b6bd4cd0fb65f8d4f7484adeb3bd1c75885a6ca3072
+size 9867456961

pytorch_model-00006-of-00006.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c9e7618baebd080fc7188c5b47a7d9286a04a60cdb33ee4626523f2bf998b8c7
+size 2490496687

pytorch_model.bin.index.json CHANGED Viewed

@@ -246,9 +246,9 @@
     "model.layers.3.self_attn.rotary_emb.inv_freq": "pytorch_model-00001-of-00006.bin",
     "model.layers.3.self_attn.v_proj.weight": "pytorch_model-00001-of-00006.bin",
     "model.layers.30.input_layernorm.weight": "pytorch_model-00005-of-00006.bin",
-    "model.layers.30.mlp.down_proj.weight": "pytorch_model-00005-of-00006.bin",
     "model.layers.30.mlp.gate_proj.weight": "pytorch_model-00004-of-00006.bin",
-    "model.layers.30.mlp.up_proj.weight": "pytorch_model-00004-of-00006.bin",
     "model.layers.30.post_attention_layernorm.weight": "pytorch_model-00005-of-00006.bin",
     "model.layers.30.self_attn.k_proj.weight": "pytorch_model-00004-of-00006.bin",
     "model.layers.30.self_attn.o_proj.weight": "pytorch_model-00004-of-00006.bin",

     "model.layers.3.self_attn.rotary_emb.inv_freq": "pytorch_model-00001-of-00006.bin",
     "model.layers.3.self_attn.v_proj.weight": "pytorch_model-00001-of-00006.bin",
     "model.layers.30.input_layernorm.weight": "pytorch_model-00005-of-00006.bin",
+    "model.layers.30.mlp.down_proj.weight": "pytorch_model-00004-of-00006.bin",
     "model.layers.30.mlp.gate_proj.weight": "pytorch_model-00004-of-00006.bin",
+    "model.layers.30.mlp.up_proj.weight": "pytorch_model-00005-of-00006.bin",
     "model.layers.30.post_attention_layernorm.weight": "pytorch_model-00005-of-00006.bin",
     "model.layers.30.self_attn.k_proj.weight": "pytorch_model-00004-of-00006.bin",
     "model.layers.30.self_attn.o_proj.weight": "pytorch_model-00004-of-00006.bin",

tokenizer_config.json CHANGED Viewed

@@ -1,4 +1,6 @@
 {
   "bos_token": {
     "__type": "AddedToken",
     "content": "<s>",

 {
+  "add_bos_token": true,
+  "add_eos_token": false,
   "bos_token": {
     "__type": "AddedToken",
     "content": "<s>",