fraQtl
/

Llama-3.2-3B-optimized

kv-cache-optimized

Model card Files Files and versions

Llama-3.2-3B-optimized / tokenizer.json

Commit History

fraQtl compressed: k=16 INT3, delta=+0.7151

667ffd6
verified

Zenalyze commited on 6 days ago