inference-optimization
/

Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_6.5-bits

compressed-tensors

Model card Files Files and versions

Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_6.5-bits

Commit History

Upload folder using huggingface_hub

8e7bd39
verified

krishnateja95 commited on 11 days ago

initial commit

420e5a4
verified

krishnateja95 commited on 11 days ago