inference-optimization
/

Llama-3.1-8B-Instruct-QKV-Cache-FP8-Per-Head

compressed-tensors

Model card Files Files and versions

Llama-3.1-8B-Instruct-QKV-Cache-FP8-Per-Head

Commit History

Update README.md

a75de39
verified

krishnateja95 commited on Dec 10, 2025

Update README.md

193e4d3
verified

krishnateja95 commited on Dec 10, 2025

Update README.md

a5ead57
verified

krishnateja95 commited on Dec 5, 2025

Update README.md

281a2cc
verified

krishnateja95 commited on Dec 5, 2025

Update README.md

4b13fac
verified

krishnateja95 commited on Dec 5, 2025

Update README.md

ca74a77
verified

krishnateja95 commited on Dec 5, 2025

Upload folder using huggingface_hub

584824a
verified

krishnateja95 commited on Dec 4, 2025

initial commit

84b4463
verified

krishnateja95 commited on Dec 4, 2025