lsm0729
/

Meta-Llama-3.1-8B-Instruct-quantized.w8a8

Text Generation

text-generation-inference

8-bit precision

compressed-tensors

Model card Files Files and versions

Meta-Llama-3.1-8B-Instruct-quantized.w8a8 / tokenizer.json

Commit History

Upload W8A8 quantized Llama 3.1 8B Instruct model

e5a9602
verified

lsm0729 commited on Jan 21