vprovorg
/

tiny-random-Meta-Llama-3-8B

Update tiny models for Meta-Llama-3-8B

by vprov - opened Dec 17, 2024

←

Files changed (2) hide show

config.json CHANGED Viewed

@@ -15,7 +15,7 @@
   "max_position_embeddings": 256,
   "mlp_bias": false,
   "model_type": "llama",
-  "num_attention_heads": 4,
   "num_hidden_layers": 2,
   "num_key_value_heads": 8,
   "pretraining_tp": 1,

   "max_position_embeddings": 256,
   "mlp_bias": false,
   "model_type": "llama",
+  "num_attention_heads": 16,
   "num_hidden_layers": 2,
   "num_key_value_heads": 8,
   "pretraining_tp": 1,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:72127eb2449185249ceb4408125a1601c8e359d7c15226f8f20e7ca2e84a3678
-size 14108992

 version https://git-lfs.github.com/spec/v1
+oid sha256:df921e5f26cd540bcd023ca67da18286acefa397586e2c9fe1e48d64136a0bca
+size 14502208