tokenlabsdotrun
/

Llama-3.1-8B-ModelOpt-NVFP4-QAT

nvidia-modeloptimizer

8-bit precision

Model card Files Files and versions

Llama-3.1-8B-ModelOpt-NVFP4-QAT

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

genai2eliza's picture

Upload Llama-3.1-8B quantized with ModelOpt NVFP4-QAT

50b3294 verified 6 months ago

checkpoint-450
Upload Llama-3.1-8B quantized with ModelOpt NVFP4-QAT 6 months ago
.gitattributes

1.64 kB
Upload Llama-3.1-8B quantized with ModelOpt NVFP4-QAT 6 months ago
README.md

1.41 kB
Upload Llama-3.1-8B quantized with ModelOpt NVFP4-QAT 6 months ago
chat_template.jinja

4.61 kB
Upload Llama-3.1-8B quantized with ModelOpt NVFP4-QAT 6 months ago
config.json

875 Bytes
Upload Llama-3.1-8B quantized with ModelOpt NVFP4-QAT 6 months ago
generation_config.json

184 Bytes
Upload Llama-3.1-8B quantized with ModelOpt NVFP4-QAT 6 months ago
hf_quant_config.json

267 Bytes
Upload Llama-3.1-8B quantized with ModelOpt NVFP4-QAT 6 months ago
model-00001-of-00002.safetensors

4.98 GB
xet

Upload Llama-3.1-8B quantized with ModelOpt NVFP4-QAT 6 months ago
model-00002-of-00002.safetensors

1.05 GB
xet

Upload Llama-3.1-8B quantized with ModelOpt NVFP4-QAT 6 months ago
model.safetensors.index.json

82.8 kB
Upload Llama-3.1-8B quantized with ModelOpt NVFP4-QAT 6 months ago
special_tokens_map.json

296 Bytes
Upload Llama-3.1-8B quantized with ModelOpt NVFP4-QAT 6 months ago
tokenizer.json

17.2 MB
xet

Upload Llama-3.1-8B quantized with ModelOpt NVFP4-QAT 6 months ago
tokenizer_config.json

50.5 kB
Upload Llama-3.1-8B quantized with ModelOpt NVFP4-QAT 6 months ago