inference-optimization
/

Llama-3.2-3B-Instruct-7-bits-mode-heuristic-per-tensor

compressed-tensors

Model card Files Files and versions

Llama-3.2-3B-Instruct-7-bits-mode-heuristic-per-tensor

4.06 GB

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

krishnateja95's picture

Upload HIGGS per-tensor quantized model

2b53621 verified 25 days ago