majentik
/

Leanstral-TurboQuant-MLX-8bit

Text Generation

kv-cache-quantization

weight-quantization

theorem-proving

Mixture of Experts

8-bit precision

Model card Files Files and versions

Leanstral-TurboQuant-MLX-8bit

Commit History

docs: upstream-first KV-cache guidance (q8_0/q4_0, mainline Hadamard rotation); fork demoted to experimental

c149d5d
verified

majentik commited on 1 day ago

docs: Tier 2 polish — variant matrix + quant trade-off

bec0494
verified

majentik commited on May 6

chore(card): enrich YAML frontmatter (pipeline_tag, language, library_name, inference)

25ddf13
verified

majentik commited on Apr 17

Add MLX 8-bit quantized model with KV cache compression

24a37dc
verified

majentik commited on Apr 13

initial commit

273f150
verified

majentik commited on Apr 13