Add files using upload-large-folder tool

Files changed (9) hide show

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "./model-weights-10",
   "architectures": [
     "LlamaForCausalLM"
   ],
@@ -22,6 +22,7 @@
   "num_attention_heads": 32,
   "num_hidden_layers": 32,
   "num_key_value_heads": 8,
   "pretraining_tp": 1,
   "rms_norm_eps": 1e-05,
   "rope_scaling": {
@@ -34,7 +35,7 @@
   "rope_theta": 500000.0,
   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
-  "transformers_version": "4.47.1",
-  "use_cache": true,
   "vocab_size": 128257
 }

 {
+  "_name_or_path": "meta-llama/Llama-3.1-8B-Instruct",
   "architectures": [
     "LlamaForCausalLM"
   ],
   "num_attention_heads": 32,
   "num_hidden_layers": 32,
   "num_key_value_heads": 8,
+  "pad_token_id": 128256,
   "pretraining_tp": 1,
   "rms_norm_eps": 1e-05,
   "rope_scaling": {
   "rope_theta": 500000.0,
   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
+  "transformers_version": "4.48.0",
+  "use_cache": false,
   "vocab_size": 128257
 }

generation_config.json CHANGED Viewed

@@ -8,5 +8,5 @@
   ],
   "temperature": 0.6,
   "top_p": 0.9,
-  "transformers_version": "4.47.1"
 }

   ],
   "temperature": 0.6,
   "top_p": 0.9,
+  "transformers_version": "4.48.0"
 }

model-00001-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a316cb8ec49e8d42de67ffaa5dadb9cbc1a8d380f16991eb0ca4a57a67cbafba
 size 4976706864

 version https://git-lfs.github.com/spec/v1
+oid sha256:7784df4a8c13f5813c4dfcc993157d8495f431564af417d92742de4a76890d5b
 size 4976706864

model-00002-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:94248bd438d83ca7f3033f4080373f44a7839e749443134441fea84b3281db48
 size 4999802720

 version https://git-lfs.github.com/spec/v1
+oid sha256:e6cb748ba3699a707eb27acc8ab85a1ae91df16b440308bc4ab8e6b98fd637fb
 size 4999802720

model-00003-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e33989c3547fa2575429ca0b2578c518c67433808f2a4cc9ab1bc659450da425
 size 4915916176

 version https://git-lfs.github.com/spec/v1
+oid sha256:af706cd206454f677b2d453759a00b86f2f6ab5f862b1e9579877f694d0eabac
 size 4915916176

model-00004-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2fef7b40c49a3d3521d4d29a111323ee6954a057183bf05a17618dc110c528ec
 size 1168147000

 version https://git-lfs.github.com/spec/v1
+oid sha256:6ea47ac39f025bf3373986be7d7e0195836ae266f079bde44bc2941b24308721
 size 1168147000

special_tokens_map.json CHANGED Viewed

@@ -14,7 +14,7 @@
     "single_word": false
   },
   "pad_token": {
-    "content": "[PAD]",
     "lstrip": false,
     "normalized": false,
     "rstrip": false,

     "single_word": false
   },
   "pad_token": {
+    "content": "<|pad|>",
     "lstrip": false,
     "normalized": false,
     "rstrip": false,

tokenizer.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e9d7cacaa40afe2956f08737f84e63925c473cf6675d90dfc8caeae75768f9b7
-size 17210372

 version https://git-lfs.github.com/spec/v1
+oid sha256:dc5fe1965e6af7516a0d52cadb47bc6bd7789e6cf6d305a300d2129281e5cbd0
+size 17210376

tokenizer_config.json CHANGED Viewed

@@ -2049,7 +2049,7 @@
       "special": true
     },
     "128256": {
-      "content": "[PAD]",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -2067,6 +2067,6 @@
     "attention_mask"
   ],
   "model_max_length": 131072,
-  "pad_token": "[PAD]",
   "tokenizer_class": "PreTrainedTokenizerFast"
 }

       "special": true
     },
     "128256": {
+      "content": "<|pad|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
     "attention_mask"
   ],
   "model_max_length": 131072,
+  "pad_token": "<|pad|>",
   "tokenizer_class": "PreTrainedTokenizerFast"
 }