inference-optimization
/

Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_5.75-bits

compressed-tensors

Model card Files Files and versions

Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_5.75-bits

Commit History

Upload folder using huggingface_hub

6532086
verified

krishnateja95 commited on 8 days ago

initial commit

7db3e30
verified

krishnateja95 commited on 8 days ago