Add files using upload-large-folder tool

Files changed (4) hide show

config.json CHANGED Viewed

@@ -87,4 +87,4 @@
   "use_cache": true,
   "use_qk_norm": true,
   "vocab_size": 151552
-}

   "use_cache": true,
   "use_qk_norm": true,
   "vocab_size": 151552
+}

model-00072-of-00072.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bf4cb8265754dfb34c5a74c1d2c4b9d25e8b71f6f88d0f8b343684ed4737b5d5
-size 4210924568

 version https://git-lfs.github.com/spec/v1
+oid sha256:696c035ae5eafddf7f688b04a41af9a14b35f22aee6396a61179e0715820d744
+size 4210893856

model.safetensors.index.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "metadata": {
     "total_parameters": 356906484992,
-    "total_size": 358812410624
   },
   "weight_map": {
     "lm_head.weight": "model-00072-of-00072.safetensors",

 {
   "metadata": {
     "total_parameters": 356906484992,
+    "total_size": 358812379904
   },
   "weight_map": {
     "lm_head.weight": "model-00072-of-00072.safetensors",

recipe.yaml CHANGED Viewed

@@ -3,5 +3,5 @@ default_stage:
     QuantizationModifier:
       targets: [Linear]
       ignore: [lm_head, 're:.*mlp.gate$', 're:.*mlp.shared_expert_gate$', 're:.*linear_attn.*',
-        're:.*shared_head.*', 're:.*eh_proj.*', 're:.*enorm.*', 're:.*hnorm.*']
       scheme: FP8_DYNAMIC

     QuantizationModifier:
       targets: [Linear]
       ignore: [lm_head, 're:.*mlp.gate$', 're:.*mlp.shared_expert_gate$', 're:.*linear_attn.*',
+        're:.*layers.92.shared_head.*', 're:.*layers.92.eh_proj.*']
       scheme: FP8_DYNAMIC