Models
Datasets
Spaces
Buckets new
Docs
Enterprise
Pricing
Log In
Sign Up

majentik
/

Mistral-Small-4-119B-RotorQuant-MLX-8bit

Text Generation

kv-cache-quantization

Mixture of Experts

8-bit precision

Model card Files Files and versions

Mistral-Small-4-119B-RotorQuant-MLX-8bit / tokenizer_config.json

Commit History

Add MLX 8-bit quantized model with KV cache compression

21d6a54
verified

majentik commited on 3 days ago