inference-optimization
/

Llama-3.1-8B-Instruct-FP8-dynamic-QKV-Cache-FP8-Per-Tensor

compressed-tensors

Model card Files Files and versions

Llama-3.1-8B-Instruct-FP8-dynamic-QKV-Cache-FP8-Per-Tensor

9.1 GB

1 contributor

History: 2 commits

krishnateja95's picture

Upload folder using huggingface_hub

d318a7c verified 2 months ago