majentik
/

Leanstral-RotorQuant-MLX-8bit

Text Generation

kv-cache-quantization

weight-quantization

theorem-proving

Mixture of Experts

8-bit precision

Model card Files Files and versions

Leanstral-RotorQuant-MLX-8bit

Commit History

docs: upstream-first KV-cache guidance (q8_0/q4_0, mainline Hadamard rotation); fork demoted to experimental

76d45b9
verified

majentik commited on 2 days ago

docs: Tier 2 polish — variant matrix + quant trade-off

4811291
verified

majentik commited on May 6

chore(card): enrich YAML frontmatter (pipeline_tag, language, library_name, inference)

fa36152
verified

majentik commited on Apr 17

Add MLX 8-bit quantized model with KV cache compression

cfb84ae
verified

majentik commited on Apr 13

initial commit

1f0f7ce
verified

majentik commited on Apr 13