mtecnic
/

research-test-Qwen3-Coder-Next-REAP-AWQ

Text Generation

Mixture of Experts

Model card Files Files and versions

mtecnic commited on 30 days ago

Commit

4c938b1

·

verified ·

1 Parent(s): 51603d0

Upload README.md with huggingface_hub

Files changed (1) hide show

README.md +17 -0

README.md CHANGED Viewed

@@ -1,3 +1,20 @@
 # Research Test: Qwen3-Coder-Next-REAP-AWQ
 > Expert-pruned and AWQ-quantized Qwen3-Coder-Next using the REAP (Robust Efficient Architecture Pruning) pipeline. 20% of MoE experts removed via diverse-calibration saliency analysis, then quantized to W4A16 for efficient inference on consumer GPUs.

+---
+language:
+  - en
+license: other
+tags:
+  - moe
+  - pruning
+  - awq
+  - quantized
+  - qwen3
+  - reap
+  - expert-pruning
+base_model: Qwen/Qwen3-Coder-Next
+pipeline_tag: text-generation
+library_name: transformers
+---
 # Research Test: Qwen3-Coder-Next-REAP-AWQ
 > Expert-pruned and AWQ-quantized Qwen3-Coder-Next using the REAP (Robust Efficient Architecture Pruning) pipeline. 20% of MoE experts removed via diverse-calibration saliency analysis, then quantized to W4A16 for efficient inference on consumer GPUs.