mlx-community
/

LFM2-8B-A1B-4bit

@@ -54,12 +54,188 @@
     "quantization": {
         "group_size": 64,
         "bits": 4,
-        "mode": "affine"
     },
     "quantization_config": {
         "group_size": 64,
         "bits": 4,
-        "mode": "affine"
     },
     "rope_theta": 1000000.0,
     "routed_scaling_factor": 1.0,

     "quantization": {
         "group_size": 64,
         "bits": 4,
+        "mode": "affine",
+        "model.layers.2.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.3.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.4.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.5.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.6.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.7.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.8.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.9.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.10.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.11.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.12.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.13.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.14.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.15.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.16.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.17.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.18.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.19.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.20.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.21.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.22.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.23.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        }
     },
     "quantization_config": {
         "group_size": 64,
         "bits": 4,
+        "mode": "affine",
+        "model.layers.2.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.3.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.4.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.5.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.6.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.7.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.8.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.9.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.10.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.11.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.12.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.13.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.14.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.15.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.16.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.17.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.18.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.19.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.20.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.21.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.22.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        },
+        "model.layers.23.feed_forward.gate": {
+            "group_size": 64,
+            "bits": 8
+        }
     },
     "rope_theta": 1000000.0,
     "routed_scaling_factor": 1.0,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:91f3231a7888bbd0dcdffea3a4b359c1a164ef351ee3c59f7da62647ccbd3090
-size 5213241181

 version https://git-lfs.github.com/spec/v1
+oid sha256:35c1c163805083e4e928b11cadea01a0859ab6224c812e7d31cdcdbffb300ae4
+size 5213962077

model.safetensors.index.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
     "metadata": {
-        "total_size": 5213173504,
         "total_parameters": 8339929856
     },
     "weight_map": {

 {
     "metadata": {
+        "total_size": 5213894400,
         "total_parameters": 8339929856
     },
     "weight_map": {