inference-optimization
/

Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_5.75-bits

compressed-tensors

Model card Files Files and versions

Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_5.75-bits / tokenizer.json

Commit History

Upload folder using huggingface_hub

6532086
verified

krishnateja95 commited on 9 days ago