inference-optimization
/

Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_5.75-bits

compressed-tensors

Model card Files Files and versions

Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_5.75-bits

7.12 GB

1 contributor

History: 2 commits

krishnateja95's picture

Upload folder using huggingface_hub

6532086 verified 7 days ago