Andrefty
/

Unpacked-Llama3-Bitnet

Andrefty commited on Dec 5, 2024

Commit

90a6727

1 Parent(s): 76ee14f

Modify quantization_config to include modules_to_not_convert

Files changed (1) hide show

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "/home/andreif/Documents/nanotron/models/Llama3-8B-1.58-100B-tokens",
   "architectures": [
     "LlamaForCausalLM"
   ],
@@ -21,7 +21,15 @@
   "num_key_value_heads": 8,
   "pretraining_tp": 1,
   "quantization_config": {
-    "modules_to_not_convert": null,
     "quant_method": "bitnet"
   },
   "rms_norm_eps": 1e-05,

 {
+  "_name_or_path": "/home/user/Documents/nanotron/models/Llama3-8B-1.58-100B-tokens",
   "architectures": [
     "LlamaForCausalLM"
   ],
   "num_key_value_heads": 8,
   "pretraining_tp": 1,
   "quantization_config": {
+    "modules_to_not_convert": [
+      "self_attn.q_proj",
+      "self_attn.k_proj",
+      "self_attn.v_proj",
+      "self_attn.o_proj",
+      "mlp.gate_proj",
+      "mlp.up_proj",
+      "mlp.down_proj"
+    ],
     "quant_method": "bitnet"
   },
   "rms_norm_eps": 1e-05,