inference-optimization
/

Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_5.0-bits

8-bit precision

compressed-tensors

Model card Files Files and versions

Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_5.0-bits / tokenizer.json

Commit History

Upload folder using huggingface_hub

40354fd
verified

krishnateja95 commited on 10 days ago