tokenlabsdotrun
/

Llama-3.1-8B-ModelOpt-NVFP4

nvidia-modeloptimizer

8-bit precision

Model card Files Files and versions

Llama-3.1-8B-ModelOpt-NVFP4 / hf_quant_config.json

Commit History

Upload Llama-3.1-8B quantized with ModelOpt NVFP4

813cbb5
verified

genai2eliza commited on 7 days ago