Upload README.md with huggingface_hub

b401d5b verified 6 months ago

9.97 kB

base_model: MiniMaxAI/MiniMax-M2
base_model_relation: quantized
quantized_by: ArtusDev

ArtusDev/MiniMaxAI_MiniMax-M2-EXL3

EXL3 quants of MiniMaxAI/MiniMax-M2 using exllamav3 for quantization.

Quants

Quant	BPW	Head Bits	Size (GB)
2.5_H6	2.5	6	73.40
2.76_H7	2.76	7	80.27
3.0_H6	3.0	6	87.63
3.22_H6	3.22	6	93.48
3.5_H6	3.5	6	101.83
3.68_H7	3.68	7	106.54
4.0_H6	4.0	6	116.06
8.0_H8	8.0	8	229.92

You can download quants by targeting specific size using the Hugging Face CLI.

Click for download commands

1. Install huggingface-cli:

pip install -U "huggingface_hub[cli]"

2. Download a specific quant:

huggingface-cli download ArtusDev/MiniMaxAI_MiniMax-M2-EXL3 --revision "5.0bpw_H6" --local-dir ./

EXL3 quants can be run with any inference client that supports EXL3, such as TabbyAPI. Refer to documentation for set up instructions.

See EXL community hub for request guidelines.