Qunatized - Executorch Compiled Custom model

1st Version of quantization & compilation for Fahad bhai testing

Files changed (3) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+qwen3_0_6b_8da4w.pte filter=lfs diff=lfs merge=lfs -text

config.json ADDED Viewed

+{
+  "dim": 1024,
+  "ffn_dim_multiplier": 1,
+  "hidden_dim": 3072,
+  "n_heads": 16,
+  "head_dim": 128,
+  "n_kv_heads": 8,
+  "n_layers": 28,
+  "norm_eps": 1e-06,
+  "rope_theta": 1000000.0,
+  "use_scaled_rope": false,
+  "vocab_size": 151936,
+  "use_hf_rope": true,
+  "attention_qkv_bias": false,
+  "use_qk_norm": true
+}

qwen3_0_6b_8da4w.pte ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:d416bcc4bd14d6a084c8c2491f047cb0a20cbea0c89b74506c7328d8dc3a203c
+size 944034688