inference-optimization
/

Meta-Llama-3-8B-Instruct-NVFP4-GPTQ-Quant

8-bit precision

compressed-tensors

Model card Files Files and versions

Meta-Llama-3-8B-Instruct-NVFP4-GPTQ-Quant / tokenizer.json

Commit History

Upload folder using huggingface_hub

d274493
verified

dsikka commited on Jan 29